Master RMM : Transport Quantique L’effet Aharonov-Bohm et le transport adiabatique David Viennot 21 octobre 2011 2 Table des matières 1 Théorie de jauge en électromagnétisme et cohomologie 1.1 Épistémologie de l’électromagnétisme . . . . . . . . . . . . . 1.2 Rappels sur les équations de Maxwell . . . . . . . . . . . . . 1.2.1 Parité, pseudovecteurs et pseudoscalaires . . . . . . 1.2.2 Formulation locale/différentielle vs globale/intégrale 1.2.3 Champs et excitations . . . . . . . . . . . . . . . . . 1.2.4 Les équations de Maxwell . . . . . . . . . . . . . . . 1.2.5 Invariance de jauge . . . . . . . . . . . . . . . . . . . 1.3 Formalisme de la géométrie différentielle . . . . . . . . . . . 1.3.1 Les formes différentielles . . . . . . . . . . . . . . . . 1.3.2 La différentielle extérieure . . . . . . . . . . . . . . . 1.4 Les différentes théories de jauge . . . . . . . . . . . . . . . . 1.4.1 Théorie de jauge de degré 1 . . . . . . . . . . . . . . 1.4.2 Théorie de jauge de degré 2 . . . . . . . . . . . . . . 1.4.3 Le cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 6 8 9 10 10 11 11 12 15 15 17 18 2 L’effet Aharonov-Bohm et homotopie 2.1 Transport d’une particule dans un champ électromagnétique 2.1.1 Principe d’invariance de jauge de Weyl . . . . . . . . 2.1.2 Transport d’une particule . . . . . . . . . . . . . . . 2.2 L’effet Aharonov-Bohm . . . . . . . . . . . . . . . . . . . . 2.2.1 L’effet Aharonov-Bohm . . . . . . . . . . . . . . . . 2.2.2 Retour sur l’épistémologie du magnétisme . . . . . . 2.3 La notion d’homotopie . . . . . . . . . . . . . . . . . . . . . 2.3.1 Le groupe d’homotopie et l’effet Aharonov-Bohm . . 2.3.2 Sur les groupes d’homotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 21 22 23 23 24 25 25 27 3 Le transport adiabatique et holonomie 3.1 Contrôle quantique . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Problèmes de contrôle quantique . . . . . . . . . . 3.1.2 L’approximation adiabatique . . . . . . . . . . . . 3.2 Le transport adiabatique et la phase géométrique . . . . . 3.2.1 Fonction d’onde dans l’approximation adiabatique 3.2.2 La phase géométrique . . . . . . . . . . . . . . . . 3.3 La théorie de jauge adiabatique . . . . . . . . . . . . . . . 3.3.1 L’exemple du spin dans un champ magnétique . . 3.3.2 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 29 29 30 30 31 31 31 32 3 . . . . . . . . . 4 TABLE DES MATIÈRES Chapitre 1 Théorie de jauge en électromagnétisme et cohomologie 1.1 Épistémologie de l’électromagnétisme La notion de force a mis longtemps à être conceptualisée en physique. Elle était utilisée implicitement dès l’antiquité (avec par exemple la notion de poids chez Archimède), mais sans être clairement définie. Cette notion doit sa définition à Isaac Newton, dans PhilosophiæNaturalis Principia Mathematica (Principes mathématiques de la philosophie naturelle) : la force est une action mécanique capable de créer une accélération. Ainsi les forces sont l’origine de la mise 1 en mouvement. Cette notion ne pose pas de problèmes majeurs pour les forces de contact (réaction de support solide, force de frottement, ...). Deux corps en contact agissent et réagissent l’un sur l’autre par l’intermédiaire de forces. Mais dans le même ouvrage, Newton introduisit la loi de gravitation universelle faisant intervenir la force : Gm1 m2 F~1→2 = − ~u1→2 r2 Suivant cette loi, les corps semblent agir "à distance" l’un sur l’autre. Ainsi, la théorie de la gravitation de Newton semble non-locale : un objet non-présent en un lieu géographique donné a une influence sur ce qui se passe en ce lieu. Cette non-localité de l’interprétation de la théorie de la gravitation était un problème majeur dans la compréhension physique du phénomène. Elle fut même à l’origine d’un profond rejet de sa théorie à l’époque de la publication des Principia, en particulier de la part de Christian Huygens. La physique de l’époque était en effet encore influencée par les théories aristotéliciennes considérant l’origine de mouvement comme un état transitoire permettant aux choses de revenir vers leur “état naturel”, mais surtout par la philosophie de Renée Descartes et sa conception mécaniste de la nature. Dans cette conception, la matière est inerte et le mouvement est régi par les lois simples (et locales) des chocs et de la pression. Beaucoup ont alors considéré la loi de l’attraction universelle comme une résurgence de l’occultisme, ce qui n’est pas tout à fait faux. En effet, Newton pratiquait en secret l’alchimie, et son concept d’interaction à distance n’est pas sans rappeler la notion “d’affinité” que l’on trouve en alchimie. Par la suite, l’étude de l’électricité et du magnétisme, introduisit les autres forces agissant à distance que sont la force de Lorentz (électrique) et la force de Laplace (magnétique). Une interprétation moins problématique fût proposée par Michael Faraday, qui introduisit les "lignes de force". L’idée est que les objets chargés électriquement, sont "reliés" par des "lignes invisibles" qui transmettent la force. On pourrait faire l’analogie avec la tension d’un fil. Lorsqu’on tire sur un fil attaché à une masse, on agit directement sur le bout du fil (par une force de contact), le bout du fil agit sur le "petit morceau" de fil qui lui est contigu, ce petit morceau agit sur le petit morceau à côté, et ainsi de proche en proche, la force est transmise localement jusqu’à la masse. Les lignes de forces sont sensées agir de façon analogues, en transmettant de proche en proche l’interaction. Cette idée fût bien sûr renforcée par la visualisation expérimentale de ces lignes (en utilisant de la limaille de fer et un aimant, par exemple). Les lignes de force donnent une interprétation locale des forces "agissant à distance" mais par l’intermédiaire d’objets non-locaux (une ligne n’est pas un objet local car n’est pas déterminée en un point par ce seul point). La solution est de revenir "au découpage" de la ligne en "petits morceaux infiniment petits" agissant les uns sur les autres de proche en proche. Mathématiquement formulé, ceci introduit de 1. et non directement du mouvement, cf. principe d’inertie de Galilée 5 6 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE nouvelles entités, les champs de vecteurs (champs électrique, magnétique, gravitationnel,...). Le champ, qui peut être naïvement défini en un point comme la force que resentirait un objet de "charge unité" placé en ce point, est en fait une entité physique non-matérielle, emplissant l’espace, et qui transmet de proche en proche les interactions. Le concept de champ donne ainsi une interprétation locale, par un objet local (déterminé en chaque point), des interactions "à distance". Champs et lignes de force (lignes de champ) sont des concepts duaux, les champs sont l’ensemble des vecteurs tangents aux lignes de forces et réciproquement. A cette dualité, il en existe une seconde avec l’intervention de la notion de potentiel. Le potentiel est à l’énergie ce qu’est le champ à la force. C’est l’entité qui permet d’interpréter localement les échanges d’énergie (via les forces agissant à distance) entre objets distants, c’est à dire le travail des forces, les échanges allant dans “le sens” des différences de potentiels. Les potentiels peuvent être analysés à travers les objets géométriques étendus que sont les surfaces équipotentielles. Pour résumer, les interactions à distance sont caractérisées par la double dualité force/énergie + ponctuel/étendu : champs l potentiels ↔ ↔ lignes de champs l surfaces équipotentielles L’analyse mathématique montre que les potentiels ne sont pas univoquement définis, ainsi ces entités ne sont pas considérées comme physiques mais comme de simples intermédiaires de calcul (on verra que l’on peut discuter ce point). La substance physique (l’essence) - au sens d’Aristote - est décrite par le champ, parfaitement défini, et pas par le potentiel qui peut être changé (en suivant une certaine règle mathématique) sans changer les effets expérimentaux attendus. Cette invariance des propriétés physiques sous ces changements - appelée invariance de jauge - était considérée comme un "accident" en électromagnétisme. Mais la recherche d’une description des interactions nucléaires, a montrée qu’en réalité, il s’agit du concept fondamental de la théorie. 1.2 1.2.1 Rappels sur les équations de Maxwell Parité, pseudovecteurs et pseudoscalaires Les vecteurs peuvent être utilisés pour indiquer le sens d’une rotation (par la règle de la main droite). ~ en vecteur B ~ par rotation, le vecteur C ~ =A ~ ∧B ~ va Ainsi si dans le plan (x, y) on transforme un vecteur A ~ indiquer le sens de celle-ci, droite (directe, sens inverse des aiguilles d’une montre) si C est dans le même sens ~ est dans le sens de −~ez (la base cartésienne que ~ez , gauche (indirect, sens des aiguilles d’une montre) si C (~ex , ~ey , ~ez ) étant supposée directe). Ceci définit également une orientation sur une surface. Étant donnée une surface S, un vecteur normal à la surface va orienter celle-ci (c’est à dire définir le sens naturel de la rotation ~ B ~ définit une orientation (l’autre sur la surface). On se donne deux vecteurs tangents non-colinéaires à S, A∧ ~ ~ étant définie par B ∧ A). On appelle parité, l’opération P qui consiste à renverser les axes du système de coordonnées (~ex , ~ey , ~ez ) → ~ = −A. ~ Or (−~ex , −~ey , −~ez ). Par définition P A ~ ∧ P(B) ~ = −A ~ ∧ (−B) ~ =A ~ ∧B ~ 6= −C ~ P(A) on a donc ~∧B ~ = A ~ ~ P(A) ∧ P(B) 6= ~ C ~ P(C) Les opérations ∧ et P ne commutent donc pas (le résultat dépend de l’ordre dans lequel elles sont ~ → P(B) ~ est une rotation avec le même axe orienté que A ~ → B. ~ Si on effectuées). Le problème est que P(A) veut que les vecteurs de rotation et d’orientation soient bien définis indépendamment de la parité, on doit introduire un nouveau type de vecteurs qui ne changent pas de signe sous P. Définition 1 (Pseudovecteurs). On appelle pseudovecteur (ou bivecteur) un vecteur géométrique rendu invariant sous parité. 7 1.2. RAPPELS SUR LES ÉQUATIONS DE MAXWELL x Bien que désuète, on utilisera par souci de clarté la notation A pour les pseudovecteurs (sachant que hormis leur comportement sous parité, un pseudovecteur se comporte comme un vecteur). On notera donc que le produit vectoriel, n’est plus à proprement parlé une loi de composition interne car il associe à deux vecteurs, un pseudovecteur : ~∧B ~ =C A x ~ transforme un champ de vecteurs, Pour la même raison, le rotationnel (qui est un produit vectoriel avec ∇) en un champ de pseudovecteurs : ~=D rotA x x On rappelle que le produit mixte associe à trois vecteurs, le scalaire : ~ B, ~ C| ~ = (A ~ ∧ B) ~ ·C ~ |A, On remarque donc que ~ P(B), ~ P(C)| ~ = −|A, ~ B, ~ C| ~ |P(A), Ainsi le produit mixte est un scalaire qui change de signe sous parité, on introduit alors le nouvelle définition Définition 2 (Pseudoscalaires). On appelle pseudoscalaire une quantité scalaire qui change de signe sous parité. Ainsi le produit mixte de trois champs de vecteurs est un champ pseudoscalaire. Remarque : le “produit scalaire” entre un pseudovecteur et un vecteur est un pseudoscalaire, or comme tout pseudovecteur peut s’écrire comme une somme de produits vectorielles, un produit scalaire d’un vecteur et d’un pseudovecteur est toujours une somme de produit mixte. En réalité, il s’agit là de la bonne définition du produit mixte, à savoir une loi qui associe à un pseudovecteur et à un vecteur un pseudoscalaire. Pour résumer : – Produit scalaire : V×V → S ~ B) ~ ~·B ~ (A, 7→ A PV × PV → S x x – Produit vectoriel : V×V ~ B) ~ (A, A·B → PV ~∧B ~ =C 7→ A x – Produit mixte : x x ( A , B ) 7→ PV × V → PS ~ ~ ( A , B) 7→ A · B x x Pour des raisons qui deviendront plus claires par la suite, la divergence est restreinte aux pseudovecteurs, ~ et d’un pseudovecteur, ce qui en fait donc un pseudoscalaire. Pour résumer, c’est donc le produit mixte de ∇ on a la chaîne suivante : (les champs sont supposés de classe C 2 ) x −−→ grad rot div 0 → S −−−→ V −−→ PV −−→ PS → 0 avec la propriété que l’action de deux opérateurs successifs est nulle : −−→ rotgradf = 0 x x ~=0 divrotA x Les pseudovecteurs étant des vecteurs que l’on considère “artificiellement” comme invariants sous parité, ~ un pseudovecteur de mêmes composantes mais supposé il peut être utile de pouvoir associer à un vecteur A, ~ et de même ~ ≡ A . Réciproquement, on notera ∗ A ≡ A, invariant sous P. On notera ce pseudovecteur ∗A ~ pour les scalaires et les pseudoscalaires. ∗ est appelé star-opérateur de Hodge, ∗A est appelé dual de Hodge ~ de A. x x 8 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE 1.2.2 Formulation locale/différentielle vs globale/intégrale Les différents objets introduits dans le paragraphe précèdent, champs de (pseudo)scalaires/(pseudo)vecteurs, sont associés à des objets géométriques et à des quantités physiques différentes. – En un point (x, y, z), un champ scalaire f définit un scalaire (un nombre) f (x, y, z) (invariant sous parité). Les champs scalaires sont donc associés aux points (dimension géométrique 0), et on s’attend à ce qu’un champ scalaire physique soit dimensionné en L0 . ~ Sa circulation sur un chemin orienté C – Considérons un champ de vecteurs A. Z ~ · d~ℓ A C ~ · d~ℓ est invariant par parité. Par contre le donne une quantité physique correctement définie, car A flux d’un champ de vecteurs ne donne pas une quantité physique. Les champs de vecteurs sont donc associés aux courbes orientées (dimension géométrique 1), et on s’attend à ce qu’un champ de vecteurs physique soit dimensionné en L−1 pour compenser la dimension du vecteur de longueur infinitésimal d~ℓ. – Soit un champ de pseudovecteurs A . Sa circulation n’est pas bien définie, par contre son flux à travers une surface orientée S, l’est parfaitement ZZ A ·dS x x x S Les champs de pseudovecteurs sont associés aux surfaces (dimension géométriques 2), et on s’attend à ce qu’un champ de pseudovecteurs physique soit dimensionné en L−2 pour compenser la dimension du x pseudovecteur de surface infinitésimale d S . – Enfin, un champ pseudoscalaire f ne définit pas en point une quantité invariante par parité. Par contre, l’intégration de f sur un volume orienté V est invariant : ZZZ f dτ V en effet, l’élément de volume infinitésimal dτ est défini (en coordonnées cartésiennes) comme le volume d’un cube élémentaire dont les côtés sont infinitésimaux, soit dτ = |d~x, d~y , d~z| = (d~x ∧ d~y ) · d~z dτ est donc un pseudoscalaire. Les champs pseudoscalaires sont donc associés aux volumes (dimension géométrique 3), et s’attend à ce qu’un champ de pseudoscalaires physique soit dimensionné en L−3 . Théorème 1 (Théorèmes de Stokes). • Soit un champ scalaire f de classe C 1 et un chemin orienté C, d’extrémité initiale (x0 , y0 , z0 ) et d’extrémité finale (x1 , y1 , z1 ). Alors Z −−→ gradf · d~ℓ = f (x1 , y1 , z1 ) − f (x0 , y0 , z0 ) C ~ de classe C 1 et une surface orientée S ayant pour bord la courbe fermée • Soit un champ de vecteurs A orientée C. Alors I ZZ ~ ·dS = ~ · d~ℓ rotA A x x C S x • Soit un champ de pseudovecteurs A de classe C 1 et un volume orienté V ayant pour bord la surface fermée orientée S. Alors ZZZ ZZ div A dτ = A · d S x x x V S C’est donc le passage des formes locales (différentielles) aux formes globales (intégrales) qui relie les différents champs aux objets géométriques : −−→ grad rot ∂ ∂ x div 0 −−−−→ scalaires −−−−→ vecteurs −−−−→ pseudovecteurs −−−−→ pseudoscalaires −−−−→ 0 x x x x R RR RRR 0 ←−−−− points ←−−−− chemins ←−−−− le symbole ∂ signifiant ici “bord”. surfaces ∂ ←−−−− volumes ←−−−− 0 9 1.2. RAPPELS SUR LES ÉQUATIONS DE MAXWELL 1.2.3 Champs et excitations Les propriétés électromagnétiques sont décrites par une série de champs qui ont déjà été rencontrés dans les cours antérieurs : – La densité de charge électrique ρ : champ pseudoscalaire décrivant la densité volumique de charges électriques (C.m−3 ). x – La densité de courant électrique j : champ de pseudovecteurs décrivant la densité surfacique d’intensité électrique (A.m−2 ). – Le potentiel scalaire électrique V : champ scalaire décrivant le potentiel de l’interaction électrique (V ). ~ : champ de vecteurs décrivant le potentiel de l’interaction – Le potentiel vecteur magnétique A −1 magnétique (W b.m ). ~ : champ de vecteurs décrivant l’interaction électrique (V.m−1 ). – Le champ électrique E x – Le champ magnétique B : champ de pseudovecteurs décrivant l’interaction magnétique (W b.m−2 ). ~ (C.m−2 ). – L’excitation électrique D : champ de pseudovecteurs dual de E ~ ~ – L’excitation magnétique H : champ de vecteurs dual de B (A.m−1 ). x Petit rappel sur les unités électromagnétiques : – le Coulomb (C) est l’unité de charge électrique, la charge électrique étant la mesure du couplage de la ~ matière avec le champ électrique, cf. force électrostatique F~e = q E. – l’Ampère (A) est l’unité d’intensité du courant électrique, c’est la quantité de charges transportées par unité de temps. La charge transportée par unité de temps par la distance parcourue (A.m) mesure le couplage de la matière avec le champ magnétique, cf. force magnétique F~m = q~v ∧ B . – le Volt (V ) est l’unité de tension électrique et de force électromotrice. La force électromotrice d’un générateur mesure la propension de celui-ci à mettre en mouvement des électrons. La tension appliquée aux bornes d’une branche de circuit, induit un courant dans la branche dont l’intensité est limité par la résistance de la branche suivant la loi d’Ohm U = Ri. – le Weber (W b) est l’unité de flux magnétique et d’induction magnétique. L’induction magnétique mesure la propension d’un aimant en mouvement à créer du courant électrique dans un circuit, la force électromotrice de création du courant étant reliée au flux par e = − dφ dt . Le flux magnétique à travers une maille de circuit électrique, induit un courant dans la maille dont l’intensité est limité par le coefficient d’auto-induction suivant la loi φ = Li. x Électrique magnétique ρ V ~ E x champ j ~ A x densité potentiel B ~ H x excitation D Champs et excitations sont reliés par les équations consitutives : x x ~+P D = ǫ0 ∗ E ~ = 1 ∗ B −M ~ H µ0 où ǫ0 et µ0 sont respectivement la permittivité électrique et la perméabilité magnétiques du vide. x x – Le champ de polarisation P : champ pseudovectoriel décrivant la réponse électrique du milieu à un champ électrique externe (C.m−2 ). ~ : champ vectoriel décrivant la réponse magnétique du milieu à un – Le champ d’aimantation M champ magnétique externe (A.m−1 ). ~ et M ~ = κH ~ où χ et κ sont appelés Dans les matériaux linéaires, homogènes et isotropes on a P = ǫ0 χ ∗ E susceptibilités électrique et magnétique du milieu. Dans ce cas les équations consitutives prennent la forme : x x ~ D =ǫ∗E 10 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE ~ = 1 ∗B H µ x avec ǫ = (1 + χ)ǫ0 et µ = (1 + κ)µ0 la permittivité électrique et la perméabilité magnétique du milieu. 1.2.4 Les équations de Maxwell Les champs et les excitations sont solutions des équations fondamentales de l’électromagnétisme, dites équations de Maxwell : Principe 1 (Équations de Maxwell). • Équations topologiques : ◦ équation de Faraday : x x ~ =− rotE ◦ conservativité du champ magnétique : ∂B ∂t x div B = 0 • Équations métriques : ◦ équation de Gauss : x div D = ρ x x ~ = j + rotH x ◦ équation de Maxwell-Ampère : ∂D ∂t Les champs dérivent des potentiels par les équations structurelles : ~ −→ ∂A ~ = −− E gradV − ∂t x x ~ B = rotA 1.2.5 Invariance de jauge Soit χ : R4 → R un champ scalaire de l’espace-temps. Soient les transformations suivantes : ∂χ ∂t −→ ~′ = A ~+− A gradχ V′ =V − On a alors ~′ −→ −−→ −−→ −−→ −→ ∂A ~=E ~ ~ − ∂t − ~ ′ = −− gradχ = −gradV − ∂t A = −gradV + grad∂t χ − ∂t A E gradV ′ − ∂t ′ −→ ~ ′ = rotA ~ + rot− ~=B B = rotA gradχ = rotA x x x x x x x ~ B ) est donc invariant sous cette transformation de jauge sur les potentiels Le champ électromagnétique (E, ~ Les deux postulats fondamentaux de l’électromagnétisme sont d’une part la symétrie de jauge (qui (V, A). est structurellement plus fondamentale que les équations de Maxwell topologiques), d’autre part les loi de Gauss et de Maxwell-Ampère. ) ( ) ( −→ ~ ~ = −− gradV − ∂∂tA E V ≍ V − ∂χ ~ = −∂ B ∂t rotE =⇒ =⇒ ∂t −−→ ~ ~ ~ A ≍ A + gradχ divB = 0 B = rotA ( divD = ρ x x x x x x ~ = j + rotH ∂D ∂t x 11 1.3. FORMALISME DE LA GÉOMÉTRIE DIFFÉRENTIELLE Le fait que les potentiels soient définis à un changement de jauge près, conduit à penser que dans la dualité de description potentiels/champs, ce sont les champs qui sont porteurs du sens physique (de l’essence de l’électromagnétisme), les potentiels n’étant que des intermédiaires de calcul. Cette posture, adoptée d’ailleurs par la très grande majorité des physiciens, se tient puisque épistémologiquement parlant, il est plus satisfaisant que les entités physiques à caractère ontologique soient parfaitement et univoquement définies. Une entité qui dépend d’un choix arbitraire du physicien ne semble pas pouvoir donner une description objective et réaliste 2 de la nature. Mais comme on l’a vu, ce choix arbitraire est structurellement plus fondamental que les équations des champs. Vu que les transformations de jauge ne sont pas à proprement parlé des objets 3 , on peut adopter la posture consistant à considérer que les objets sur lesquels ils portent, les potentiels, sont les porteurs du sens physique. On verra que l’effet Aharonov-Bohm apporte des arguments en faveur de cette posture 4 . ~ des quantités qui sont définies Remarquons qu’il est possible de construire à partir de V (en statique) et A de manière univoque. La différence de potentiel entre deux points ou tension (mesurée en V ) : U ((x1 , y1 , z1 ); (x2 , y2 , z2 )) = V (x2 , y2 , z2 ) − V (x1 , y1 , z1 ) et la circulation du potentiel sur un chemin fermé ou boucle de Wilson (mesurée en W b) : I ~ · d~ℓ w(C; t) = A C Ces deux entités sont invariantes sous changement de jauge : U ′ ((x1 , y1 , z1 ); (x2 , y2 , z2 ); t) = (V (x2 , y2 , z2 ) + k) − (V (x1 , y1 , z1 ) + k) = U ((x1 , y1 , z1 ); (x2 , y2 , z2 )) I I −→ ~ · d~ℓ + − gradχ · d~ℓ = w(C; t) A w′ (C; t) = C C mais ces quantités sont non-locales (car définies sur plusieurs points). Remarque : pour des raisons qui apparaîtront plus claires dans la suite, on définit généralement la boucle de Wilson par W (C; t) = e−ı~ −1 e H C ~ ~ A·d ℓ (~ étant la constante de Planck et e la charge électrique élémentaire). 1.3 1.3.1 Formalisme de la géométrie différentielle Les formes différentielles Puisque un champ de vecteurs ~ ω attend naturellement son intégration dans une circulation, on peut le représenter par une 1-forme différentielle : ω=ω ~ · d~ℓ = ωx dx + ωy dy + ωz dz x De la même façon, on souhaiterait représenter les champs de pseudovecteurs ω , qui attendent leur intégration dans un flux, par un objet de la forme x x ω · d S = ωx d~y ∧ d~z + ωy d~z ∧ d~x + ωz d~x ∧ d~y où d~x = dx~ex . Les éléments de la forme d~x ∧ d~y = dxdy ∗ ~ez constituent une base de l’espace vectoriel des éléments infinitésimaux de surface orientée. On les note simplement dx ∧ dy (avec la propriété dy ∧ dx = 2. ces deux termes étant utilisés ici dans leur sens philosophique, le réalisme objectiviste consistant en la croyance en l’existence d’une réalité en soi, accessible et composée d’objets 3. dans le cadre du réalisme pythagoricien, la réalité en soi n’est pas constituée d’objets, seules les structures sont réelles. Une interprétation physique faite dans ce cadre induirait immédiatement que la symétrie de jauge est en elle-même la seule réalité physique. Ce point de vu est peu populaire, la grande majorité des physiciens sont des réalistes objectivistes. 4. remarque : l’argument naïf souvent invoqué pour justifier que les champs sont physiques et pas les potentiels, à savoir qu’ils seraient mesurables expérimentalement, est faux. Aucun dispositif expérimental ne mesure directement un champ, la seule et unique quantité qui soit directement mesurable est la force. Les dispositifs mesurant le champ électrique mesurent en réalité la force électrique s’appliquant à une charge connue. À partir de cette mesure primaire, on obtient le champ par une ~ =F ~ /q, on peut faire de même pour le potentiel même si la reconstruction est plus compliquée reconstruction mathématique E 12 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE −dx ∧ dy). Par abstraction, le lien avec la géométrie vectorielle peut être oublié, et l’opération ∧ entre 1formes différentielles peut être définie par ses propriétés algébriques (elle porte le nom de produit extérieur). Les pseudovecteurs peuvent donc être représenter par ce que l’on appelle des 2-formes différentielles : ω = ωxy dx ∧ dy + ωyz dy ∧ dz + ωzx dz ∧ dx avec ωxy ≡ ωz (et permutations circulaires de (xyz)). De la même façon, les champs pseudoscalaires qui attendent d’être intégrés dans un volume, ωdτ = ω(d~x ∧ d~y ) · d~z = ω|d~x, d~y , d~z| peuvent être représentés par des 3-formes différentielles : ω = ωxyz dx ∧ dy ∧ dz où dx ∧ dy ∧ dz est une abstraction de |d~x, d~y , d~z| dans laquelle on considère simplement les propriétés algébriques du produit extérieur (linéaire, anticommutatif et associatif). Le produit extérieur et les formes différentielles peuvent être définis dans n’importe quel espace Rn et même sur n’importe quelle variété (objet géométrique) M . On note Ωn M l’ensemble des n-formes différentielles de M : Ωn M = {ωµ1 ...µn dxµ1 ∧ ... ∧ dxµn } où les ωµ1 ...µn sont des fonctions de M (antisymétrique par échange des indices) et où {x1 , ..., xn } constituent un système de coordonnées de M (on adopte la convention d’Einstein sur la répétition des indices). On a donc pour les entités électromagnétiques, les formes différentielles de l’espace (dépendantes du temps) : ρ j V A E B D H 1.3.2 ∈ Ω3 R3 ∈ Ω2 R3 ∈ Ω0 R3 ∈ Ω1 R3 ∈ Ω1 R3 ∈ Ω2 R3 ∈ Ω2 R3 ∈ Ω1 R3 La différentielle extérieure Soit d la différentielle de l’espace : pour toute fonction f ∈ Ω0 R3 on a df = ∂f i dx ∂xi On étend sa définition à l’ensemble des formes différentielles : ∀ω ∈ Ωn M : dω = ∂ωµ1 ...µn µ0 dx ∧ dxµ1 ∧ ... ∧ dxµn ∈ Ωn+1 M ∂xµ0 Cette extension est alors appelée différentielle extérieure. On notera que du fait des propriétés d’antisymétrie du produit extérieur, on a la règle de Leibniz (graduée) – ω ~ champ vectoriel / ω ∈ Ω1 R3 −−→ gradf · d~ℓ = df x On a dans R3 les équivalences suivantes : – f champ scalaire (0-forme) d(ω ∧ η) = dω ∧ η + (−1)n ω ∧ dη x ∀ω ∈ Ωn M, ∀η ∈ Ωp M, rotω · d S = dω 1.3. FORMALISME DE LA GÉOMÉTRIE DIFFÉRENTIELLE 13 x – ω champ pseudovectoriel / ω ∈ Ω2 R3 divωdτ = dω La différentielle extérieure remplace donc tous les opérateurs vectoriels. Les équations de Maxwell prennent donc la forme suivante : • Équations topologiques : ◦ équation de Faraday : ∂B dE = − ∂t ◦ conservativité du champ magnétique : dB = 0 • Équations métriques : ◦ équation de Gauss : dD = ρ ◦ équation de Maxwell-Ampère : dH = j + ∂D ∂t avec les équations structurelles : E = −dV − ∂A ∂t B = dA D On notera que d2 = 0, et que l’invariance de jauge s’écrit : V′ =V − ∂χ ∂t A′ = A + dχ avec χ ∈ Ω0 R4 . Le théorème de Stokes s’écrit alors d’une manière générale : Théorème 2 (Théorème de Stokes). Soit ω ∈ Ωn M une n-forme différentielle et V une sous-variété de M (un objet géométrique dans M ) de dimension n + 1. Z I dω = ω V ∂V où ∂V est la sous-variété de dimension n bord de V. Preuve : Démontrons le théorème dans le cas où n = 1 et donc où V est une surface. Supposons dans un premier temps qu’il existe un paramètrage de V (un système de coordonnées sur V) tel que les coordonnées forment un pavé de R2 : [u1 , u2 ] × [v1 , v2 ] ∋ (u, v) 7→ x(u, v) ∈ V. ZZ dω = V = = = ZZ ∂ωµ ν dx ∧ dxµ ν V ∂x « ZZ „ ∂ωµ 1 ∂ων dxν ∧ dxµ − 2 ∂xν ∂xµ V « Z u2 Z v2 „ ∂ωµ ∂ων ∂xν ∂xµ − dudv ∂xν ∂xµ ∂u ∂v u1 v1 « Z u2 Z v2 „ ∂ων ∂xν ∂ωµ ∂xµ − dudv ∂u ∂v ∂v ∂u u1 v1 Par intégration par parties, on a Z u2 u1 » –u Z u2 ∂xµ 2 ∂ωµ ∂xµ ∂ 2 xµ du = ωµ du − ωµ ∂u ∂v ∂v u1 ∂u∂v u1 14 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE d’où Z u2 u1 Z v2 v1 „ ∂ωµ ∂xµ ∂ων ∂xν − ∂u ∂v ∂v ∂u « dudv = = » –u Z v2 Z u2 ∂xµ 2 ∂ 2 xµ ωµ dudv dv − ωµ ∂v u1 ∂u∂v v1 v1 u1 – Z u2 » Z Z v u2 v2 ∂xµ 2 ∂ 2 xµ dvdu − ωµ du + ωµ ∂u v1 ∂v∂u u1 u1 v1 – – » Z Z v2 » u v u2 ∂xµ 2 ∂xµ 2 dv − du ωµ ωµ ∂v u1 ∂u v1 u1 v1 Z v2 L’intégration de ω sur le bord de V est donnée par I I ω = ωµ dxµ ← − ↓ ↑ → − ∂V = Z = Z → − u2 u1 Z Z Z ∂xµ ∂xµ ∂xµ ∂xµ du + dv + ← du + dv ω ωµ ωµ µ − ∂u ∂v ∂u ∂v ↑ ↓ – – – – Z v2 Z u2 Z v2 ∂xµ ∂xµ ∂xµ ∂xµ du + dv − du − dv ωµ ωµ ωµ ωµ ∂u v1 ∂v u2 ∂u v2 ∂v u2 v1 u1 v1 ωµ où = [u1 , u2 ] × [v1 , v2 ]. En comparant les deux expressions, on a bien ZZ I dω = ω ∂V V Si V ne peut être munie d’un système coordonnées engendrant un pavé, on décompose V en morceaux qui peuvent chancun être indépendamment paramétrés par un pavé. Le théorème de Stokes s’applique sur chaque morceau, et les contributions des bords des morceaux ne se trouvant pas sur ∂V s’annulent ← − ← − ← −← − deux à deux : ↓ ↑↓ ↑=↓ ↑. Seules subistent donc les contributions de ∂V , ce qui démontre le → − → − → −→ − théorème pour toute surface V. La démonstration du théorème est essentiellement la même en dimension quelconque (avec quelques subtilités techniques supplémentaires), on l’admettra pour n > 1. Dans R3 on a donc d 0 −−−−→ Ω0 R3 −−−−→ x ∂ Ω1 R3 x R d −−−−→ ∂ Ω2 R3 x RR d −−−−→ ∂ Ω3 R3 x RRR −−−−→ 0 0 ←−−−− points ←−−−− chemins ←−−−− surfaces ←−−−− volumes ←−−−− 0 avec d2 = 0 et ∂ 2 = 0. Compte-tenu de la dualité entre la différentielle extérieure d et l’opérateur de bord ∂, d est aussi quelque fois appelée opérateur de cobord. La ligne du bas du diagramme est appelée un complexe d’homologie, et celle du haut un complexe de cohomologie. La dualité engendre également que les formes différentielles exactes : B n M = {dω; ω ∈ Ωn−1 M } ⊂ Ωn M (ce que l’on appelle en thermodynamique dans un langage quelque peu archaïque, les différentielles totales exactes) sont aussi appelées des cobords. De plus les objets géométriques fermés n’ayant pas de bord, on dira qu’une forme différentielle ω est fermée si dω = 0. Les formes différentielles fermées Z n M = {ω ∈ Ωn M |dω = 0} ⊂ Ωn M porte également le nom de cocycles. On notra que puisque d2 = 0, on a B n M ⊂ Z n M . Considérons le champ magnétique B ∈ Ω2 R3 et le potentiel magnétique A ∈ Ω1 R3 . Du fait de l’équation structurelle B = dA, le champ magnétique est un cobord B ∈ B 2 R3 . On sait qu’il est difficile de considérer A comme le porteur du sens physique du magnétisme car celui-ci est défini à un cobord près : A′ = A + dχ ⇒ dA′ = dA = B Il dépend H donc d’un choix arbitraire, et ne peut pas être considéré comme une essence. La boucle de Wilson w(C) = C A est définie de façon univoque, mais c’est une entité non-locale (c’est une fonction sur l’ensemble 1.4. LES DIFFÉRENTES THÉORIES DE JAUGE 15 des boucles). B semble donc être la seule entité satisfaisante pour être l’essence du magnétisme. Mais il en existe en fait une autre. On ne considère pas A mais la classe d’équivalence représentée par A : [A]d = {A + dχ, χ ∈ Ω0 R3 } [A]d est l’ensemble de tous les potentiels magnétiques possibles. Cet ensemble est défini de façon univoque (on considère dans la même entité tous les choix de jauge), et il est local (il ne dépend que du point considéré). Le prix a payer est que l’entité n’est plus une forme différentielle mais un ensemble de formes différentielles. Dans la même idée, si on considère un cocycle ω ∈ Z n M , on peut redéfinir celui-ci par l’ajout d’un cobord, ω ′ = ω + dη (η ∈ Ωn−1 M ) avec toujours dω ′ = 0. On peut considérer la classe [ω]d = {ω + dη, η ∈ Ωn−1 M }. L’ensemble de ces classes : H n M = Z n M/B n M = {[ω]d , ω ∈ Z n M } porte le nom de groupe de cohomologie. Son rôle en électromagnétisme sera abordé plus tard. Les complexes de (co)homologie vus dans cette section sont dit de (co)homologie de de Rham. H n M porte donc le nom de groupe de cohomologie de de Rham de degré n. Le concept de théorie de cohomologie n’est donc qu’une formalisation algébrique de principe physique d’invariance de jauge. 1.4 1.4.1 Les différentes théories de jauge Théorie de jauge de degré 1 Le champ électrostatique Considérons un physicien qui fait une expérience d’électrostatique. Comme le potentiel est défini à une constante près, il fait dans son laboratoire un choix de jauge arbitraire. Notons U α le voisinage de son laboratoire. Supposons qu’un autre physicien, fasse une autre expérience d’électrostatique, il fixe donc un choix de jauge dans son propre laboratoire. Notons U β la voisinage de ce second laboratoire. Il n’y a pas de raison que les deux choix arbitraires soient les mêmes, on doit donc considérer, V α le choix de potentiel du premier physicien et V β celui du second. Supposons que les deux voisinages aient une petite région commune U α ∩ U β . Alors ∀x ∈ U α ∩ U β on a E = −dV α = −dV β V β − V α = καβ où καβ est une constante. Ces dernières équations sont un point important des théories de jauge (on dit qu’elles caractérisent une théorie de jauge de degré 1). Le potentiel électrostatique n’est défini que localement (pour des voisinages, encore appelés cartes locales de R3 ) alors que le champ électrostatique est bien défini globalement. Si on considère trois cartes, on voit que l’on doit avoir κβγ − καγ + καβ = 0 dite condition de cocycle. On peut étendre une des définitions locales du potentiel aux deux autres cartes (grâce à la relation précédente). Finalement, en regroupant les cartes, il est possible de s’accorder sur la choix de jauge dans tout R3 (et ainsi définir un potentiel global). On dit que la théorie de jauge est triviale. C’est pour cela qu’en général, on oublie toute référence aux cartes locales. Notons que dE = 0 et comme il existe un potentiel global tel que E = −dV , on a [E]d = {dV + dχ, χ ∈ Ω0 R3 } = [0]d ∈ H 1 R3 . Le fait que la classe de cohomologie de de Rham du champ soit la classe nulle et une autre manifestation de la trivialité de la théorie. L’électromagnétisme porte néanmoins une théorie de jauge de degré 1 non triviale. L’excitation magnétique On considère une boucle C fixe dans l’espace parcourue par un courant I. On ne peut pas définir simplement un potentiel scalaire magnétique Υ tel que H = −dΥ, car alors dH = −d2 Υ 6= j (j = IδC (x) ∗ ds où δC est la distribution de Dirac associée à C et s est une coordonnée curviligne de C). Néanmoins, de par la loi de Biot et Savart, on a Z ~′ dℓ ∧ (~r − ~r′ ) I ~ H(~r) = 4π C k~r − ~r′ k3 16 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE Avec un peu de calculs on montre que C d~ℓ′ ∧ (~r − ~r′ ) k~r − ~r′ k3 −−→ = −grad ZZ S −−→ = −gradΩ(~r) x Z ′ d S · (~r − ~r′ ) k~r − ~r′ k3 où Ω(~r) est l’angle solide sous lequel on voit la boucle de courant depuis le point ~r (C = ∂S). On peut donc écrire que I H = − dΩ 4π Mais il faut noter que Ω est une fonction multivaluée. Pour simplifier prenons l’exemple de l’angle β sous lequel on voit un segment dans le plan, en changeant le point de vue suivant deux chemins menant au même point. Entre les deux chemins, on a un écart de 2π sur la valeur de l’angle β. Avec un angle solide dans l’espace, on aurait un écart de 4π. Pour introduire un potentiel scalaire magnétique, il faut donc considérer au moins quatre cartes locales autour de la boucle C. U α comme un pseudocylindre au dessus de C, U β comme le pseudocylindre en dessous de C et U γ , U δ comme des zones entourant le cylindre. On dédinit alors Υα = I α 4π Ω|U (restreint à une carte, l’angle solide est une fonction monovaluée), avec H = −dΥα et aux intersections Υβ − Υα = καβ = I Υγ − Υα = καγ = 0 Υγ − Υβ = κβγ = 0 Cette fois on ne peut pas faire un choix de jauge qui annule les κ car κβγ − καγ + καβ = I 6= 0 Néanmoins, la condition de cocycle est toujours vérifiée car U α ∩ U β ∩ U γ = ∅ (il n’y a pas de point commun à ces trois cartes). La relation précédente n’a donc pas de sens géométrique et n’exprime que le fait que l’on ne peut pas étendre le choix de jauge à tout l’espace. On a une théorie de jauge de degré 1 non triviale. La constante I est alors l’indice de non-trivialité de la théorie. On notera que [H]d = {H + dχ, χ ∈ Ω0 R} ∈ H 1 (R3 \ C) n’est pas la classe nulle, car H n’est pas globalement exacte (mais seulement localement, il n’y pas de fonction Υ définie sur tout R3 \ C telle que H = −dΥ). On notera que dH = j au sens des distributions, mais qu’au sens des dérivées naturelles dH = 0 et donc H est une forme fermée. La classe de cohomologie [H]d est aussi un indice de non-trivialité. En fait [H]d et I sont des informations redondantes (de par le théorème de de Rham que l’on ne discutera pas ici). 17 1.4. LES DIFFÉRENTES THÉORIES DE JAUGE 1.4.2 Théorie de jauge de degré 2 Le champ magnétique La discussion sur les cartes locales peut être reprise ici. On aura donc B = dAα et à l’intersection de deux cartes Aβ − Aα = dχαβ où χαβ ∈ Ω0 (U α ∩ U β ). La condition de cohérence entre trois cartes impose seulement que χβγ − χαγ + χαβ = z αβγ avec z αβγ une constante sur U α ∩ U β ∩ U γ (dz αβγ = 0). Comme dans le cas du champ électrostatique, on peut choisir les conventions de jauge telles que z αβγ = 0, et faire en sorte d’étendre l’une des conventions aux trois cartes, puis à tout l’espace. On a une théorie de jauge de degré 2 triviale. La classe de cohomogie de de Rham est à nouveau nulle, [B]d = [0]d ∈ H 2 R3 , en accord avec la trivialité de la théorie de jauge. L’excitation électrique On considère une charge électrique q ponctuelle dans l’espace. On cherche un potentiel vecteur électrique dont dérive l’excitation électrique. Comme pour le cas de l’excitation magnétique, le potentiel ne sera pas defini globalement. Soit un système de coordonnées sphériques centrées sur la charge. On considère U N une carte locale essentiellement dans la partie nord du système de coordonnées, et U S une carte locale essentiellement dans la partie sud (les cartes s’intersectent dans un voisinage du plan équatorial). On introduit alors le potentiel vecteur électrique : q (1 − cos θ)dϕ CN = 4π q C S = − (1 + cos θ)dϕ 4π où θ est la colatitude et ϕ la longitude. On a alors q D = dC N = dC S = sin θdθ ∧ dϕ 4π En utilisant le fait que d~ℓ = dr~er + rdθ~eθ + r sin θdϕ~eϕ , on retrouve bien x D= q ∗~r 4π r3 à l’intersection q dϕ = dχN S 2π q ϕ, mais cette fonction est multivaluée, en effet les points xgw se trouvant dans On aurait donc χN S = − 2π le plan équatorial et dans le plan du méridien fondamental, ont deux longitudes ϕ = 0 ou ϕ = 2π. Ainsi on peut avoir χN S (xgw ) = 0 ou χN S (xgw ) = −q. Pour résoudre ce problème, il est nécessaire de scinder les cartes. On considère U α la carte locale essentiellement dans le quart nord est, U β dans la quart nord ouest (U α ∪ U β = U N ), U γ dans le quart sud est et U δ dans le quart sud ouest (U γ ∪ U δ = U S ). On a alors q χαγ = − 2π ϕ|U α ∩U γ et χαβ = 0 avec D = dC α CS − CN = − et aux intersections C β − C α = dχαβ et C γ − C α = dχαγ χβγ − χαγ + χαβ = −q On notera que compte-tenu de la quantification des charges électriques, −q = z αβγ e avec e charge élémentaire et z αβγ ∈ Z. L’entier z αβγ est l’indice de non-trivialité de la théorie de jauge de degré 2. Remarque : pour une raison que l’on ne développera pas ici, les théories de jauge de degré 2 (et plus) ont toujours un indice de non-trivialité quantifié. dD = qδ(x, y, z) au sens des distributions, mais au sens des dérivées naturelles D est une forme fermée dD = 0. Sa classe de cohomologie de de Rham [D]d ∈ H 2 (R3 \ {(0, 0, 0)}) est une information redondante avec q (théorème de de Rham). 18 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE 1.4.3 Le cas général Théorie de jauge de degré 1 καβ ∈ Z V α 0 ∈Ω U κβγ − καγ + καβ = 0 α E ∈ Ω1 M V β − V α ∝ καβ E = −dV α dE = 0 Théorie de jauge de degré 2 z αβγ ∈ Z z βγδ − z αγδ + z αβδ − z αβγ = 0 χαβ ∈ Ω0 (U α ∩ U β ) χβγ − χαγ + χαβ ∝ z αβγ F ∈ Ω2 M F = dAα Aα ∈ Ω1 U α Aβ − Aα = dχαβ dF = 0 Théorie de jauge de degré 3 Par généralisation, on peut définir une théorie de jauge de degré 3 wαβγδ ∈ Z wβγδζ −wαγδζ +wαβδζ −wαβγζ +wαβγδ = 0 ξ αβγ ∈ Ω0 (U α ∩ U β ∩ U γ ) ξ βγδ −ξ αγδ +ξ αβδ −ξ αβγ ∝ wαβγδ B α ∈ Ω2 U α B β − B α = dAαβ Aαβ ∈ Ω1 (U α ∩ U β ) Aβγ − Aαγ + Aαβ = −dξ αβγ H ∈ Ω3 M H = dB α dH = 0 Les théories de jauge de degré 3 se rencontrent en théorie (classique) des cordes pour décrire une cordre chargée dans un champ électromagnétique. On peut encore généraliser est définir une théorie de jauge de degré quelconque. La cohomologie de Deligne L’invariance de jauge peut être exprimée comme suit : – dans une théorie de jauge de degré 1, V α et Ṽ α = V α + k (avec k ∈ R) définissent le même champ E et le même indice de non trivialité associé à καβ . – dans une théorie de jauge de degré 2, les couples (χαβ , Aα ) et (χ̃αβ , Ãα ) = (χαβ + ζ β − ζ α , Aα + dζ α ) (avec ζ α ∈ Ω0 U α ) définissent les mêmes F et z αβγ . – dans une théorie de jauge de degré 3, les triplets (ξ αβγ , Aαβ , B α ) et (ξ˜αβγ , Ãαβ , B̃ α ) = (ξ αβγ + ζ βγ − ζ αγ + ζ αβ , Aαβ − dζ αβ + k β − k α , B α + dk α ) (avec ζ αβ ∈ Ω0 (U α ∩ U β ) et k α ∈ Ω1 U α ) définissent les mêmes H et wαβγδ . Les classes d’équivalence [V α ]D [χαβ , Aα ]D [ξ αβγ , Aαβ , B α ]D = {V α + k, k ∈ R} = {(χαβ + ζ β − ζ α , Aα + dζ α ); ζ α ∈ Ω0 U α } = {(ξ αβγ + ζ βγ − ζ αγ + ζ αβ , Aαβ − dζ αβ + k β − k α , B α + dk α ); ζ αβ ∈ Ω0 (U α ∩ U β ), k α ∈ Ω1 U α } sont dites classes de cohomologie de Deligne. On peut donc généraliser la discussion sur les essences de l’électromagnétisme, on a des entités définies de manière univoque, locales et intégrant tous les choix de jauge en considérant les classes de Deligne. Pour l’électrostatique : 1 3 2 [V ]D ∈ HD R [χαβ , C α ]D ∈ HD (R3 \ {~0}) 19 1.4. LES DIFFÉRENTES THÉORIES DE JAUGE et pour le magnétisme 2 3 [0, A]D ∈ HD R 1 [Υα ]D ∈ HD (R3 \ C) On remarquera que [A]d = [0, A]D n’est pas un élément du groupe de cohomologie de de Rham (A n’est pas fermé) mais est en fait un élément du groupe de cohomogie de Deligne. C’est donc la théorie de cohomologie de Deligne qui est le formalisme complet de l’invariance de jauge. D’un point de vue algébrique, l’opérateur de cobord de Deligne D est donné en théorie de jauge de dégré n par ( δω + (−1)deg(ω) dω si deg(ω) ≤ n Dω = δω mod Z si deg(ω) = n où δ est l’opérateur “de dérivation discrète par rapport aux indices de cartes” : (δω)αβ = ω β − ω α , (δω)αβγ = ω βγ − ω αγ + ω αβ ,... Il y a une troisième théorie de cohomologie en électromagnétisme, la cohomologie de Čech qui est associée à la combinatoire des cartes locales, et que l’on n’abordera pas ici. On dira simplement que les indices de non-trivialités que l’on a trouvés dans les sections précédentes sont en fait les classes de cohomologie de Čech. Le théorème de de Rham que l’on a évoqué énonce que les groupes de cohomologies de de Rham et de Čech sont isomorphes (à la limite où les cartes locales deviennent infinitésimales). 20 CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE Chapitre 2 L’effet Aharonov-Bohm et homotopie 2.1 2.1.1 Transport d’une particule dans un champ électromagnétique Principe d’invariance de jauge de Weyl Soit une particule de charge q et de masse m soumise à un champ électrique et magnétique. L’équation de Schrödinger de cette particule est (sans considérer le spin) ı~ 2 ∂ψ 1 ~ − qA ~ ψ + qV ψ −ı~∇ = ∂t 2m où ψ(x, y, z, t) est l’amplitude de probabilité de présence de la particule, c’est à dire que la probabilité de trouver la particule dans un portion Ω ⊂ R3 de l’espace est ZZZ |ψ(x, y, z, t)|2 dxdydz PΩ (t) = Ω Si la source du champ est une particule chargée fixe, avec l’absence du champ magnétique, on retrouve l’équation de Schrödinger de l’atome d’hydrogène : ı~ −~2 ∂ψ = ∆ψ + qV ψ ∂t 2m Le problème est que l’équation de Schrödinger n’est pas invariante sous changement de jauge électromagnétique −→ ∂χ ~′ = A ~+− V′ =V − A gradχ ∂t ı~ ∂ψ ∂t = = 2 1 ~ − qA ~ ′ ψ + qV ′ ψ −ı~∇ 2m −→ 2 ∂χ 1 ~ − qA ~ − q− −ı~∇ gradχ ψ + qV ψ − q ψ 2m ∂t La probabilité de présence de la particule semble donc dépendre du choix de jauge, or ce choix est arbitraire. Pour résoudre le problème, il faut remarquer qu’il y aussi un degré de liberté dans le choix de la fonction d’onde. En effet, considérons la fonction d’onde ψ ′ (x, y, z, t) = eıϕ(x,y,z,t)ψ(x, y, z, t) où ϕ : R4 → R est une fonction arbitraire. Sous cette transformation, dite de changement local de phase, la probabilité de présence est invariante : ZZZ ZZZ |eıϕ(x,y,z,t)ψ(x, y, z, t)|2 dxdydz = |ψ(x, y, z, t)|2 dxdydz = PΩ (t) PΩ′ (t) = Ω Ω Afin de rendre compatible l’équation de Schrödinger avec l’invariance de jauge électromagnétique, il faut, lorsqu’on procède à un changement de jauge, faire un changement local de phase qui le compense. 21 22 CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE Théorème 3 (Principe d’invariance de jauge de Weyl). L’équation de Schrödinger est invariante sous le changement de jauge et le changement local de phase : ∂ χ(x, y, z, t) ∂t −→ ~ ′ (x, y, z, t) = A(x, ~ y, z, t) + − A gradχ(x, y, z, t) V ′ (x, y, z, t) = V (x, y, z, t) − ψ ′ (x, y, z, t) = eı~ −1 qχ(x,y,z,t) ψ(x, y, z, t) où χ : R4 → R. x 2.1.2 ψ =e ı~−1 qχ x Quantique ′ ~ = −∂ B rotE ∂t x Magnétique V ′ = V − ∂χ ∂t −→ ~′ = A ~+− A gradχ équations invariantes x Electrique quantités invariantes −→ ~ ~ = −− E gradV − ∂∂tA ~ B = rotA div B = 0 2 dP = |ψ| dxdydz ψ x changement de jauge ı~∂t ψ = ~ ~ 2ψ (−ı~∇−q A) 2m + qV ψ Transport d’une particule Propriété 1. Soit une particule de charge électrique q, de fonction d’onde ψ(x, y, z), supposée être un paquet ~ règne dans l’espace. d’ondes localisé autour d’un point (x0 , y0 , z0 ) de l’espace. Un potentiel magnétique A On astreint la particule (ou plutôt le paquet d’ondes) à se déplacer suivant un chemin fermé C partant de (x0 , y0 , z0 ). Alors après avoir déplacé la particule, sa fonction d’onde est : ψ ′ (x, y, z) = eı~ −1 q H C A ψ(x, y, z) ~ · d~ℓ ∈ Ω1 R3 . avec A = A Preuve : On suppose dans un premier temps que l’on translate le paquet d’ondes suivant un vecteur infinitésimal d~ ℓ. Le paquet d’ondes n’étant pas déformé par l’opération, la fonction d’onde translatée s’identifie à la fonction d’onde initiale à une phase près que l’on peut supposer proportionnelle à d~ ℓ: ψ(x + dx, y + dy, z + dz) = eı~ −1 q ϕ·d ~ ~ ℓ d’où ψ(x + dx, y + dy, z + dz) − ψ(x, y, z) = (eı~ par un développement limité ψ(x, y, z) −1 q ϕ·d ~ ~ ℓ − 1)ψ(x, y, z) −−→ gradψ · d~ ℓ = ı~−1 q ϕ ~ · d~ ℓψ −−→ ı~gradψ = −q ϕ ~ψ On procède à un changement de jauge ψ ′ = eı~ −1 qχ ψ, on a alors −−→ ~ ′ ψ′ ı~gradψ ′ = −q ϕ −−→ −−→ ⇐⇒ ı~gradψ − q gradχψ = −q ϕ ~ ′ψ −−→ − − → ⇐⇒ ı~gradψ = −q(~ ϕ′ − gradχ)ψ On en déduit que −−→ ϕ ~′ = ϕ ~ + gradχ ~ On a donc On peut donc identifier ϕ ~ à A. −−→ ~ · d~ gradψ · d~ ℓ = ı~−1 q A ℓψ On note (x(s), y(s), z(s) la paramétrisation de la courbe C. Le long de cette courbe l’équation précédente s’écrit ~ dψ ~ · dℓ ψ(s) = ı~−1 q A ds ds d’où −1 R s ~ d~ ℓ ψ(s) = eı~ q 0 A· ds ds ψ(0) 23 2.2. L’EFFET AHARONOV-BOHM Cette propriété peut également être démontrée en utilisant l’expression semi-classique de la fonction d’onde −1 ψ(x, y, z) = |ψ(x, y, z)|e−ı~ S(x,y,z) où S est l’action classique qui est ici ~ ~ · dℓ L + qA dt Z S= ! dt avec L le Lagrangien en l’absence de champ magnétique. Enfin si on introduit l’opérateur impulsion généralisé : ~ − qA ~ ~π = −ı~∇ On peut définir l’opérateur de translation magnétique : T (w) ~ = eı~ avec T (w)ψ(x, ~ y, z) = e−ı~ −1 −1 qw i Ai (x,y,z) w i πi ψ(x + w1 , y + x2 , z + w3 ) L’algèbre des translations magnétiques satisfait à [xi , πj ] = ı~δji [πi , πj ] = −ı~Bij 1 [πi , [πj , πk ]]dxi ∧ dxj ∧ dxk = −~2 dB = 0 2 avec B = dA le champ magnétique. 2.2 2.2.1 L’effet Aharonov-Bohm L’effet Aharonov-Bohm Supposons qu’une particule chargée se trouve dans un solide infini percé d’un tube infini de rayon a dans lequel on a installé un solénoïde infini parcouru par un courant I et comportant ν spires par unité de longueur. Le cylindre est ainsi une portion de l’espace interdite à la particule. On note z l’axe du cylindre et (x, y) les coordonnées dans le plan perpendiculaire au cylindre. Le problème étant symétrique par translation suivant z, les champs ne vont pas dépendrepde z. De plus le problème étant invariant par rotation autour de z, les champs ne dépendent que de r = x2 + y 2 . Les plans (x, y) étant plan de symétrie, et le champ magnétique étant orthogonal à tous plan de symétrie, on a B = B(r)dx ∧ dy Par application du théorème d’Ampère : ( µ0 νIdx ∧ dy B= 0 et A= ( µ0 νIr 2 dθ 2 µ0 νIa2 dθ 2 si r < a si r > a si r < a si r > a (dr ∧ rdθ = dx ∧ dy). Supposons que l’on astreint la particule à suivre un cercle C dans le plan (x, y) de rayon R > a centré sur l’axe du tube. Alors après le déplacement, la fonction d’onde de la particule devient ψ ′ (x, y, z) = = eı~ −1 eı~ −1 q H C A ψ(x, y, z) qµ0 νIπa2 ψ(x, y, z) 24 CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE La phase acquise par la fonction d’onde au cours du déplacement est mesurable, il suffit de faire interférer le paquet d’ondes déplacé avec un paquet d’ondes resté inchangé : ψtot (x, y, z) = ψ(x, y, z) + ψ ′ (x, y, z) √ 2 2 21 |ψtot (x, y, z)| = |ψ(x, y, z)| + cos ~−1 q 2 H C A La particule voit tout au long du chemin un champ magnétique nul, et pourtant elle subit un effet magnétique visible dans sa phase, c’est l’effet Aharonov-Bohm. 2.2.2 Retour sur l’épistémologie du magnétisme L’effet Aharonov-Bohm induit un questionnement difficile sur l’interprétation ontologique de l’électromagnétisme, c’est à dire sur la recherche de l’entité porteuse du sens physique, de l’objet fondamentale de l’électromagnétisme, de l’essence de la théorie physique. Comme on l’a déjà évoqué la champ magnétique est généralement considéré comme la bonne entité physique, car contrairement au potentiel, il est défini de manière univoque. Le problème de cette interprétation est que l’électron ne voie jamais qu’un champ magnétique nul. Si le champ magnétique B est porteur du sens physique, la logique serait qu’aucun effet magnétique ne serait mesurable sur une particule qui ne rencontre que des champs nuls. Or ce n’est pas le cas. Si on admet que le potentiel A est le porteur du sens physique, alors l’interprétation est cohérente avec l’effet Aharonov-Bohm, sauf que la définition de l’objet fondamental est soumise à un choix arbitraire, ce qui n’est H −1 pas très satisfaisant. Une autre possibilité est de considérer la boucle de Wilson W (C) = eı~ q C A comme la bonne entité physique. Ce serait cohérent avec l’effet Aharonov-Bohm (c’est d’ailleurs l’entité qui apparaît explicitement dans l’effet), et cela nous donne un objet défini de manière univoque. Le défaut majeur de ce point de vue est que cet objet est non-local (car définie sur un chemin et non en un point). Or comme la théorie des champs avait été précisément introduite pour donner une interprétation locale des interactions à distance, on a là un retour en arrière – il faut néanmoins noter, qu’avec l’émergence de la mécanique quantique, la notion de physique non-locale n’est plus aussi choquante pour les physiciens d’aujourd’hui que pour ceux des siècles antérieurs au XXème –. Une possibilité serait de considérer la classe de cohomologie de Deligne [0, A]D = [A]d comme la bonne entité physique. Elle permet d’interpréter l’effet Aharonov-Bohm, est locale et est définie de manière univoque. Le seul problème est que ce n’est pas à proprement parlé un champ, et donc une entité concrète. En tant que classe, c’est une entité quelque peu abstraite. On pourrait presque la considérer comme n’étant pas une interprétation réaliste objectiviste, mais comme une interprétation réaliste pythagoricienne tant [0, A]D est lié à la symétrie de jauge. On notera néanmoins que l’on a déjà l’habitude de considérer des classes d’équivalence comme des objets physiques en mécanique quantique. L’état d’un système est en effet la classe [ψ] = {eıφ ψ, φ ∈ R} puisque la phase n’a pas de sens physique (seule la différence de phase à un sens). Plus encore, lorsque l’on dit que ψ est une fonction de carré sommable, on oublie que l’on considère en fait non pas ψ comme état quantique mais la classe des fonctions presque partout égales à ψ (si on change la valeur ψ en des points isolés 1 on ne change pas les probabilités de présence). Il en est de même pour les densités de probabilité en général. Ces exemples supposent tout de même que l’on attribue à la fonction d’onde en mécanique quantique ou aux densités de probabilité en général, un caractère ontologique ; ce qui ne va pas de soi. Il n’y a pas de réponse tranchée quant à la question du choix de l’entité porteuse du sens physique, celui-ci doit être considéré comme une posture philosophique sur ce qu’est la nature de l’électromagnétisme et pas comme un fait établi. Le choix d’une des quatre postures (ou d’un total agnosticisme) est tout à fait respectable, il faut juste connaître ce que l’on gagne en le faisant et surtout ce à quoi l’on renonce. Pour finir, on donne un tableau résumant les différentes postures et ce qu’elles apportent en terme d’interprétation : 1. en fait sur un ensemble de mesure de Lebesgues nulle 25 2.3. LA NOTION D’HOMOTOPIE Le champ magnétique B est la quantité physique fondamentale Le potentiel magnétique A est la quantité physique fondamentale La boucle de Wilson W (C) est la quantité physique fondamentale La classe de cohomologie de Deligne [0, A]D est la quantité physique fondamentale Il n’y a pas d’objets fondamentaux en physique, seule la symétrie de jauge est porteuse du sens physique (interprétation réaliste pythagoricienne) La physique n’a avoir qu’avec les résultats expérimentaux, la recherche de la nature d’une “réalité” est en dehors du champ de la physique qui ne s’intéresse qu’au pouvoir prédictif d’une théorie (interprétation instrumentaliste) La chose en soi étant par nature essentiellement inconnaissable (ou si c’est le cas elle ne peut être que de nature mentale), l’électromagnétisme n’est qu’une représentation de la nature et n’a aucune valeur ontologique (interprétation idéaliste, positiviste, Kantienne) Fournit une interprétation locale des phénomènes magnétiques Fournit un objet porteur du sens physique défini de manière univoque Permet d’interpréter l’effet Aharonov-Bohm oui oui non oui non oui non oui oui oui oui oui oui ∅ oui ∅ ∅ ∅ agnostique ∅ agnostique Le symbole ∅ signifie que la question n’a pas sens dans l’interprétation considérée. 2.3 2.3.1 La notion d’homotopie Le groupe d’homotopie et l’effet Aharonov-Bohm Considérons un chemin Ca qui n’entoure pas le tube. Alors par le théorème de Stokes : ZZ I B=0 A= w(Ca ) = Ca S où ∂S = C. Comme on l’a déjà vu, si on transporte l’électron le long d’un cercle Cb du plan (Oxy), de centre O et de rayon rb et orienté dans le sens direct on a w(Cb ) = µ0 νIπa2 Si on le transporte en sens suivant le même chemin mais en sens inverse, la boucle de Wilson est w(Cb−1 ) = −µ0 νIπa2 26 CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE Si on le transporte en lui faisant suivre deux fois le cercle : w((Cb )2 ) = 2µ0 νIπa2 Soit Cc un chemin quelconque du plan (Oxy) entourant une fois le solénoïde comme sur la figure ci-dessous. Soit Cd un cercle de centre O à l’intérieur de Cc (et entourant le solénoïde) et soit Sc la surface (grisée sur la figure) délimitée par Cc et Cd (les orientations de Cc , Cd et Sc indiquées sur la figure sont cohérentes entre elles). Par le théorème de Stokes, on a ZZ B = w(Cc ) + w(Cd ) Sc or B = 0 à l’extérieur du solénéoïde, donc w(Cc ) = −w(Cd ) = µ0 νIπa2 Soient Ce et Cf deux chemins quelconques du plan (Oxy) entourant chacun une fois le solénoïde et ayant un point M en commun (comme sur la figure ci-dessous). On note Ce ◦ Cf le chemin consistant à transporter l’électron le long de Ce depuis M , puis une fois revenu en M , à le transporter le long Cf . La boucle de Wilson est alors w(Ce ◦ Cf ) = 2µ0 νIπa2 On voit donc avec ces différents exemples que d’une manière générale, pour un chemin C, la boucle de Wilson est w(C) = nC µ0 νIπa2 où nC ∈ Z est le nombre de tours orientés que fait C autour du solénoïde. Soit LM l’ensemble des chemins orientés fermés (les boucles) du plan (Oxy) passant par le point M et ne passant pas par le solénoïde. ∀Cα , Cβ ∈ LM , ∀n ∈ N∗ , on note : – Cα ◦ Cβ le chemin consistant à parcourir depuis M , Cα puis Cβ . – (Cα )−1 le même chemin que Cα mais parcouru en sens inverse. – (Cα )n le chemin Cα parcouru n fois ((Cα )n = Cα ◦ ... ◦ Cα ). – (Cα )−n = ((Cα )n )−1 le chemin Cα parcouru n fois en sens inverse. – 1M le chemin consistant à rester sur le point M (1M ◦ Cα = Cα , Cα ◦ (Cα )−1 = 1M ). L’application π : LM → Z telle que π(C) = nC est un homomophisme de groupe, i.e. π((Cα )p ◦ (Cβ )q ) = pπ(Cα ) + qπ(Cβ ) π1 (R2 \ DS ) ≡ π(LM ) = Z est appelé groupe d’homotopie de la région accessible à l’électron R2 \ DS (DS est le disque section du solénoïde). Pour un chemin donné C, π(C) est dite classe d’homotopie de C. L’effet Aharonov-Bohm est donc une mesure directe de la classe d’homotopie du chemin sur lequel on transporte l’électron. 2.3. LA NOTION D’HOMOTOPIE 2.3.2 27 Sur les groupes d’homotopie Définition 3 (Chemins homotopes). Deux chemins fermés (deux boucles) sur une variété M sont dits homotopes (appartenant à la même classe d’homotopie) si on peut déformer continuement l’un en l’autre. Définition 4 (Groupe d’homotopie). Soit M une variété connexe (d’un seul tenant). Le groupe d’homotopie de M , π1 (M ), est l’ensemble des classes de boucles homotopes sur M . Dans une variété “sans trou”, comme R2 , toutes les boucles sont homotopes à la boucle identité (on peut toujours contracter continuement une boucle en un point). Par conséquent ces variétés ont un groupe d’homotopie trivial. π1 (R2 ) = {0}. On dit que ces variétés sont simplement connexes. Si on considère une variété avec un trou, comme R2 \ D (où D est un domaine simplement connexe, le passage d’un tube de flux magnétique – un solénoïde – dans l’effet Aharonov-Bohm, la région interdite à l’électron), alors on a π1 (R2 \ D) = Z. On dit que ces variétés sont infiniment connexes. On remarquera que π1 (R3 \ (D × R)) = Z (où D × R est un cylindre infini – le solénoïde –). Par contre π1 (R3 \ B 2 ) = {0} (où B 2 est une boule), car on peut toujours déformer un chemin autour d’une sphère pour le contracter en un point (d’ailleurs il n’existe pas de flux magnétique ayant la géométrie d’une sphère !). Avec deux tubes de flux magnétique (deux trous), on a π1 (R2 \ (D1 ∪ D2 )) = Z ⊕ Z (les régions D1 et D2 sont supposées disjointes). Dans ce cas, π1 (C) = (n1C , n2C ) où n1C est le nombre de tours orientés que fait C autour de D1 et où n2C est le nombre de tours orientés que fait C autour de D2 . À la place d’un solénoïde infini, on considère maintenant un bobine toroïdale. Pour simplifier, considérons seulement des boucles sur une enveloppe en forme de tore, notée T 2 , entourant la bobine toroïdale. La variété T 2 a un genus (un “trou de donut”). On a alors π1 (T 2 ) = Z ⊕ Z. Dans ce cas, π1 (C) = (n1C , n2C ) où n1C est le nombre de tours orientés que fait C autour de la section du tore et où n2C est le nombre de tours orientés que fait C autour de l’âme du tore (le cercle générateur au centre du tore). Le tore T 2 peut être vu comme un rectangle dont a identifié les côtés deux à deux (avec la même orientation). Sur ces graphes, on a dessiné un chemin de classe d’homotopie (1, 2). On peut considérer un objet plus exotique, le plan projectif réel RP 2 . Celui-ci est obtenu comme le tore par identification des côtés d’un rectangle deux à deux, mais en renversant ceux-ci. Sur ce graphe du plan projectif réel RP 2 on a dessinées deux boucles, une contractible en un point (de classe d’homotopie nulle) en trait plein ; et une qui ne l’est pas en pointillés. Lorsqu’elles font une fois le tour de RP 2 les boucles ne sont pas contractibles. Par contre, une boucle qui fait deux fois le tour de RP 2 est contractible en un point. 28 CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE Ce graphe représente la déformation d’une boucle qui fait deux fois le tour de RP 2 : trait plein → pointillés serrés → pointillés moyens → pointillés lâches → réduit au point M . On a donc π1 (RP 2 ) = Z/2Z = {0, 1}. Pour une boucle C, π(C) = 0 si elle fait un nombre pair de tours autour de RP 2 , et π(C) = 1 si elle fait un nombre impair de tours autour de RP 2 . On dit que RP 2 est doublement connexe. Le groupe d’homotopie π1 (M ) n’est en général pas abélien (sur certaines variétés bizarres π(C1 ) ∗ π(C2 ) 6= π(C2 ) ∗ π(C1 ) où ∗ est la loi de groupe notée “+” quand π1 (M ) était construit à partir de Z). On note H1 (M ) l’abélianisation de π1 (M ) (les éléments de H1 (M ) sont les classes d’équivalence de pi1 (M ) pour la relation π(C1 )∗ π(C2 ) ∼ π(C2 )∗ π(C1 )). Dans les cas les plus courants π1 (M ) = H1 (M ) (lorsque le groupe d’homotopie est au départ abélien). H1 (M ) est appelé groupe d’homologie de de Rham de M (de degré 1), il s’agit du groupe dual du groupe de cohomologie de de Rham H 1 (M ) (dualité induite par l’intégration et le théorème de Stokes). On pourrait définir π2 (M ) et H2 (M ) en considérant les déformations continues des surfaces et ainsi de suite... Chapitre 3 Le transport adiabatique et holonomie 3.1 3.1.1 Contrôle quantique Problèmes de contrôle quantique On parle de contrôle quantique lorsqu’on peut agir sur un système quantique par un appareillage pour ~ par essayer de contrôler l’état quantique du système. Par exemple, le contrôle de l’orientation d’un spin S ~ un champ magnétique B est associé à l’Hamiltonien : ~ =S ~ ·B ~ H(B) ~ En faisant varier dans le temps le champ magnétique t 7→ B(t), on a une dynamique engendrée par t 7→ ~ H(B(t)). D’une manière générale, un problème de contrôle se présentera comme décrit par un Hamiltonien autoadjoint dépendant de paramètres classiques x = (x1 , ..., xn ), les paramètres que l’on peut faire varier à notre guise pour contrôler le système. L’ensemble des paramètres accessibles forment la variété de contrôle M . Dans notre exemple, si l’intensité du champ magnétique est gardée constante, alors M est une sphère ~ décrivant les différentes directions de polarisation de B. Les problèmatiques de contrôle se présentent alors sous la forme suivante : sachant que l’état initial du système est ψin , quelle doit être le chemin C à suivre dans M et à quelle vitesse, pour que la solution de l’équation de Schrödinger ψ(t) : ı~ dψ = H(x(t))ψ(t) dt ψ(0) = ψin (avec t 7→ x(t) formant C dans M ), soit telle que ψ(T ) = ψtarget (T durée du contrôle). L’état cible ψtarget étant un objectif prédéfini. 3.1.2 L’approximation adiabatique Les paramètres de contrôle étant classiques, ceux-ci vont varier lentement par rapport au temps propre quantique (temps caractéristique de transition d’un état propre vers un autre). Dans ces conditions, on peut appliquer un théorème adiabatique. Un tel théorème stipule le résultat suivant : Soient {λb (x)}b et {φb (x)}b les valeurs et vecteurs propres de H(x). H(x)φb (x) = λb (x)φb (x) Soit λa (x) une valeur propre non-dégénérée ∀x ∈ M (on ne traitera pas ici le cas des valeurs propres dégénérées). On suppose que ψin = φa (x(0)). Alors si les variations de x(t) sont suffisamment lentes, ψ(t) solution de l’équation de Schrödinger reste toujours projetée sur φa (x) : ∀t, ψ(t) = eıϕ(t) φa (x(t)) Il existe de nombreux théorèmes adiabatiques dans la littérature. On ne donnera ici aucun de ceux-ci, mais un raisonnement heuristique. 29 30 CHAPITRE 3. LE TRANSPORT ADIABATIQUE ET HOLONOMIE Les vecteurs propres formant une base de l’espace de Hilbert, on peut décomposer la fonction d’onde sur celle-ci à chaque instant : X ψ(t) = cb (t)φb (x(t)) b avec cb (t) = hφb (x(t))|ψ(t)i. On injecte cette expression dans l’équation de Schrödinger. ı~ dψ = Hψ dt ⇐⇒ ⇐⇒ X ċb φb + b X b X b cb φ̇b = −ı~−1 ċb φb = −ı~−1 X b X cb Hφb b cb λb φb − X cb φ̇b b On projette cette dernière équation sur φd (d 6= a) (les vecteurs propres étant orthonormés hφd |φb i = δdb ) : X ċd = −ı~−1 cd λd − cb hφd |φ̇b i b En dérivant Hφa = λa φa on a Ḣφa + H φ̇a = λ̇a φa + λa φ̇a et en projetant sur φd par conséquent hφd |Ḣ|φa i + λd hφd |φ̇a i = λa hφd |φ̇a i hφd |φ̇a i = = hφd |Ḣ|φa i λa − λd ∂H ẋµ hφd | µ |φa i ∂x λa − λd d| = τab est le temps caractéristique de transition de l’état φa vers l’état φd . Ainsi |λa −λ = τ1ab = ωab ~ est la pulsation de la transition que l’on peut assimiler à la vitesse de transition de l’état φa vers l’état φd . ẋµ est la vitesse de variation du paramètre de contrôle xµ . L’hypothèse adiabatique consiste à poser que la vitesse de variation des paramètres de contrôle est lente devant la vitesse de transition quantique, i.e. ωab ≪ ẋµ et donc hφd |φ̇a i ≃ 0 ~ |λa −λd | Il faut noter que cette hypothèse implique qu’il doit rester un gap non-nul entre λa et les autres valeurs propres (ce qui suppose qu’aucun croisement de valeur propre n’est rencontré durant l’évolution, i.e. λa reste tout au long de l’évolution non-dégénérée). On a donc au final X ċd = −ı~−1 cd λd − hφd |φ̇b icb b6=a donc cd (t) = X Udb (t)cb (0) b6=a où U est la “matrice” solution de l’équation U̇ = −(ı~−1 Λ − Φ)U , avec U (0) = 1 et Λdb = λb δdb et Φdb = hφd |φ̇b i. Or ∀b 6= a, cb (0) = 0, donc ∀d 6= a, cd (t) = 0. 3.2 3.2.1 Le transport adiabatique et la phase géométrique Fonction d’onde dans l’approximation adiabatique Comme vu précédemment, dans les conditions de l’approximation adiabatique on a ψ(t) = eıϕ(t) φa (x(t)) En injectant cette expression dans l’équation de Schrödinger on trouve ıϕ̇eıϕ φa + eıϕ φ̇a = −ı~−1 eıϕ λa φa 31 3.3. LA THÉORIE DE JAUGE ADIABATIQUE En projetant cette équation sur φa , on trouve ıϕ̇ = −ı~−1 λa − hφa |φ̇a i et donc ψ(t) = e−ı~ 3.2.2 −1 Rt 0 λa (x(t′ ))dt′ − Rt 0 hφa |φ̇a idt′ φa (x(t)) La phase géométrique On pose A ∈ Ω1 M la 1-forme définie par A(x) = ıhφa (x)|d|φa (x)i = ıhφa (x)| On a donc Z R T 0 hφa |φ̇a idt = −ı Z ∂ |φa (x)idxµ ∂xµ A C La phase eı C A ne dépend donc pas de T le temps écoulé lors Rdu contrôle, mais seulement de la forme du −1 T chemin C dans M . On l’appelle donc phase géométrique (e−ı~ 0 λa (t)dt porte le nom de phase dynamique). Pour un chemin fermé x(T ) = x(0), on a donc ψ(0) = φa (x(0)) ψ(T ) = e−ı~ −1 RT 0 λa (x(t))dt ı e H C A φa (x(0)) La forme de cette équation est similaire à celle du transport d’une particule dans un champ magnétique. A qui est appelé potentiel de Berry, joue le rôle du potentiel magnétique. On parle alors de transport adiabatique. On ne transporte pas ici une particule dans l’espace physique, mais l’état quantique du système dans la variété de contrôle M . 3.3 3.3.1 La théorie de jauge adiabatique L’exemple du spin dans un champ magnétique ~ = (x1 , x2 , x3 ) et donc décrit par l’hamiltonien On considère un spin contrôlé par un champ magnétique B ~ i ~ x3 x1 − ıx2 ~ ~ H(x) = B · S = x σi = x2 + ıx2 −x3 2 2 Le spectre instantané de H(x) est p λ± (x) = ± (x1 )2 + (x2 )2 + (x3 )2 = ±r Le point r = 0 est interdit pour le transport adiabatique car il correspond à des valeurs propres dégénérées. On introduit les angles p (x1 )2 + (x2 )2 x2 θ = arctan ϕ = arctan x3 x1 r est l’intensité du champ magnétique de contrôle, et (θ, ϕ) sont les angles (en coordonnées sphériques) de la direction de polarisation du champ magnétique de contrôle. On considère le transport adiabatique de l’état d’énergie λ+ (x). Un vecteur propre possible est 1 r + x3 cos θ2 N p = φ+ (x) = x1 + ıx2 eıϕ sin θ2 2r(r + x3 ) On remarque que ce choix de convention de phase (qui est arbitraire), induit un facteur de normalisation qui est singulier au pôle sud (x1 = 0, x2 = 0, x3 < 0) On choisit donc de n’utiliser ce choix que sur une carte locale U N restreinte à l’hémisphère nord (et dépassant un petit peu de l’équateur). L’autre convention possible est 1 −ıϕ 1 x − ıx2 e cos θ2 = φS− (x) = p r − x3 sin θ2 2r(r − x3 ) 32 CHAPITRE 3. LE TRANSPORT ADIABATIQUE ET HOLONOMIE La convention induit maintenant un facteur de normalisation singulier au pôle nord (x1 = 0, x2 = 0, x3 > 0), on ne l’applique donc que sur une carte locale U S restreinte à l’hémisphère sud (et dépassant légèrement de l’équateur). Ce problème montre qu’en général, avec un hamiltonien dépendant de paramètres, on ne peut pas fixer le même choix de convention des vecteurs propres sur la totalité de l’espace des paramètres de contrôle. Il est nécessaire d’utiliser un système de cartes locales. À l’intersection des deux cartes, on a un changement de phase S −ıϕ g N S (θ, ϕ) = hφN + |φ+ i = e Le générateur de la phase géométrique est alors sur U N : 1 x2 dx1 − x1 dx2 1 = − (1 − cos θ)dϕ 3 2 r(r + x ) 2 N AN (x) = ıhφN + |d|φ+ i = et sur U S AS (x) = ıhφS+ |d|φS+ i = − À l’intersection des deux cartes, on a alors 1 x2 dx1 − x1 dx2 1 = (1 + cos θ)dϕ 2 r(r − x3 ) 2 AN − AS = dχN S = −dϕ Comme pour les exemples de l’électromagnétisme, la fonction χN S = −ϕ est multivaluée car ϕ = 0 et ϕ = 2π correspondent au même point physique. Il faut donc scinder les cartes, avec U α dans le quart nord est, U β dans le quart nord ouest, U γ dans le quart sud est et U δ dans le quart sud ouest. On a alors χαγ = −ϕ|U α ∩U γ et χβγ − χαγ + χαβ = −2π On a donc une théorie de jauge de dégré 2 non triviale, avec un champ F = dAN = dAS = − 1 1 x1 dx2 ∧ dx3 + x2 dx3 ∧ dx1 + x3 dx1 ∧ dx2 = − sin θdθ ∧ dϕ 3 2 r 2 appelé courbure adiabatique. Pour une courbe fermée C complètement inscrite dans l’hémisphère nord, la phase géométrique du transport adiabatique est donc H RR N eı C A = eı S F en utilisant le théorème de Stokes et avec ∂S = C. De plus eı RR S F ı = e− 2 RR S sin θdθ∧dϕ ı = e− 2 ΩC où ΩC est l’angle solide sous lequel on voit C depuis le point r = 0. Le transport adiabatique est semblable au transport d’une particule dans un champ magnétique, mais n’est pas tout à fait similaire à l’effet Aharonov-Bohm. La phase associée à une chemin C ne dépend pas seulement de la classe d’homotopie du chemin mais de toute sa géométrie (si on déforme le chemin, on change l’angle solide sous lequel il est vu). 3.3.2 Cas général La théorie de jauge du transport adiabatique est dans le cas général liée au fait que l’on ne peut pas avoir une convention de phase continue sur tout l’espace des paramètres de contrôle M . On doit donc introduire un système de cartes locales, avec ∀x ∈ U α , α H(x)φα a (x) = λa (x)φa (x) et à l’intersection entre deux cartes, un changement local de phase ∀x ∈ U α ∩ U β , αβ hφα (x)|φβ (x)i = eıχ ce qui induit une théorie de jauge de degré 2 non-triviale, avec α Aα = ıhφα a |d|φa i (x) 33 3.3. LA THÉORIE DE JAUGE ADIABATIQUE Aβ − Aα = dχαβ F = dAα H La phase géométrique sur un chemin fermé eı C A (la boucle de Wilson) est appelée en mathématique holonomie du potentiel de Berry. L’ensemble des classes de boucles qui ont la même holonomie forme le groupe d’homotopie fine π11 (M ) de M . Théorème 4 (Théorème de Wu-Yang-Alvarez). La circulation d’un potentiel d’une théorie de jauge de degré 2, compatible avec le théorème de Stokes en exponentielle, est telle que : Soit C : xi → xf un chemin traversant deux cartes U α et U β , et Aα/β le potentiel de la théorie de jauge. Alors Z xf Z Z xαβ Aβ Aα + χαβ (xαβ ) + A= xαβ C xi R où xαβ ∈ U α ∩ U β ∩ C est un point arbitraire de C à l’intersection des deux cartes. C A ne depend pas de ce choix arbitraire. Preuve : On considère une surface orientée S de bord C. La définition de la circulation de A le long de C doit pour être compatible avec le théorème de Stokes vérifier eı RR S B = eı H CA S On décompose S en une multitude de petites surfaces {σ α }α telles que σ α ⊂ U α , α σα = S et telles que pour deux surfaces contiguës σ α ∩ σ β = eαβ soit un chemin morceau des bords de σ α et σ β . Pour une surface σ α à la limite de S, on note eα la partie de son bord qui se confond avec C. Pour trois surfaces contiguës, on note xαβγ = σ α ∩ σ β ∩ σ γ = eαβ ∩ eβγ ∩ eαγ le point de rencontre des bords des trois surfaces. Pour deux surfaces contigües à la limite de S, on note xαβ = σ α ∩ σ β = eα ∩ eβ le de C entre les deux surfaces. Par le théorème de Stokes, on a ZZ X ZZ X I B= B= Aα S σα σ α ⊂S σ α ⊂S ∂σ α Pour deux surfaces contiguës σ α et σ β , on a eαβ = (∂σ α ) ∩ (∂σ β ), mais eαβ est parcouru en sens inverse ← − ← − ← −← − d’une surface à l’autre : ↓ ↑↓ ↑=↓ ↑. Ainsi la contribution de eαβ est → − → − → −→ − Z Z (Aβ − Aα ) = dχαβ = χαβ (xαβγ ) − χαβ (xαβδ ) eαβ α eαβ β où on a supposé que σ et σ étaient contiguës à σ γ à une extrémité de eαβ et à σ δ à l’autre. Pour trois surfaces contiguës, σ α , σ β et σ γ , on voit donc que la contribution du point xαβγ est χβγ (xαβγ ) − χαγ (xαβγ ) + χαβ (xαβγ ) = 2πz αβγ avec z αβγ ∈ Z (un indice de non-trivialité). Au final, ne reste que les contributions des points de rencontre entre surfaces, des bords des surfaces se confondant avec C et des points entre ces bords : eı RR S B = eı P α eα A eı P xαβ χαβ (xαβ ) P αβγ 2πı z |e {z } =1 Ce qui prouve la première partie du théorème. Il reste à prouver que cette expression en dépend du choix arbitraire de la décomposition. Soit xαβ , y αβ ∈ U α ∩ U β ∩ C. On utilise la relation de Chasles : Z Z y αβ Z xαβ Z Z y αβ Z xαβ Aα + χαβ (y αβ ) + Aα + Aα + χαβ (y αβ ) + Aβ + Aβ = Aβ xαβ y αβ = = = = Z xαβ Z xαβ Z xαβ Z xαβ Aα + χαβ (y αβ ) + Aα + χαβ (y αβ ) + y αβ Z Z xαβ (Aβ − Aα ) + y αβ xαβ dχαβ + y αβ Z xαβ Z Aβ xαβ Aβ xαβ Aα + χαβ (y αβ ) + χαβ (xαβ ) − χαβ (y αβ ) + Aα + χαβ (xαβ ) + Z Aβ xαβ Z Aβ xαβ