notes de cours

publicité
Master RMM : Transport Quantique
L’effet Aharonov-Bohm et le transport adiabatique
David Viennot
21 octobre 2011
2
Table des matières
1 Théorie de jauge en électromagnétisme et cohomologie
1.1 Épistémologie de l’électromagnétisme . . . . . . . . . . . . .
1.2 Rappels sur les équations de Maxwell . . . . . . . . . . . . .
1.2.1 Parité, pseudovecteurs et pseudoscalaires . . . . . .
1.2.2 Formulation locale/différentielle vs globale/intégrale
1.2.3 Champs et excitations . . . . . . . . . . . . . . . . .
1.2.4 Les équations de Maxwell . . . . . . . . . . . . . . .
1.2.5 Invariance de jauge . . . . . . . . . . . . . . . . . . .
1.3 Formalisme de la géométrie différentielle . . . . . . . . . . .
1.3.1 Les formes différentielles . . . . . . . . . . . . . . . .
1.3.2 La différentielle extérieure . . . . . . . . . . . . . . .
1.4 Les différentes théories de jauge . . . . . . . . . . . . . . . .
1.4.1 Théorie de jauge de degré 1 . . . . . . . . . . . . . .
1.4.2 Théorie de jauge de degré 2 . . . . . . . . . . . . . .
1.4.3 Le cas général . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
6
6
8
9
10
10
11
11
12
15
15
17
18
2 L’effet Aharonov-Bohm et homotopie
2.1 Transport d’une particule dans un champ électromagnétique
2.1.1 Principe d’invariance de jauge de Weyl . . . . . . . .
2.1.2 Transport d’une particule . . . . . . . . . . . . . . .
2.2 L’effet Aharonov-Bohm . . . . . . . . . . . . . . . . . . . .
2.2.1 L’effet Aharonov-Bohm . . . . . . . . . . . . . . . .
2.2.2 Retour sur l’épistémologie du magnétisme . . . . . .
2.3 La notion d’homotopie . . . . . . . . . . . . . . . . . . . . .
2.3.1 Le groupe d’homotopie et l’effet Aharonov-Bohm . .
2.3.2 Sur les groupes d’homotopie . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
21
22
23
23
24
25
25
27
3 Le transport adiabatique et holonomie
3.1 Contrôle quantique . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Problèmes de contrôle quantique . . . . . . . . . .
3.1.2 L’approximation adiabatique . . . . . . . . . . . .
3.2 Le transport adiabatique et la phase géométrique . . . . .
3.2.1 Fonction d’onde dans l’approximation adiabatique
3.2.2 La phase géométrique . . . . . . . . . . . . . . . .
3.3 La théorie de jauge adiabatique . . . . . . . . . . . . . . .
3.3.1 L’exemple du spin dans un champ magnétique . .
3.3.2 Cas général . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
29
29
30
30
31
31
31
32
3
.
.
.
.
.
.
.
.
.
4
TABLE DES MATIÈRES
Chapitre 1
Théorie de jauge en électromagnétisme
et cohomologie
1.1
Épistémologie de l’électromagnétisme
La notion de force a mis longtemps à être conceptualisée en physique. Elle était utilisée implicitement dès
l’antiquité (avec par exemple la notion de poids chez Archimède), mais sans être clairement définie. Cette
notion doit sa définition à Isaac Newton, dans PhilosophiæNaturalis Principia Mathematica (Principes mathématiques de la philosophie naturelle) : la force est une action mécanique capable de créer une accélération.
Ainsi les forces sont l’origine de la mise 1 en mouvement. Cette notion ne pose pas de problèmes majeurs
pour les forces de contact (réaction de support solide, force de frottement, ...). Deux corps en contact agissent
et réagissent l’un sur l’autre par l’intermédiaire de forces. Mais dans le même ouvrage, Newton introduisit
la loi de gravitation universelle faisant intervenir la force :
Gm1 m2
F~1→2 = −
~u1→2
r2
Suivant cette loi, les corps semblent agir "à distance" l’un sur l’autre. Ainsi, la théorie de la gravitation de
Newton semble non-locale : un objet non-présent en un lieu géographique donné a une influence sur ce qui se
passe en ce lieu. Cette non-localité de l’interprétation de la théorie de la gravitation était un problème majeur
dans la compréhension physique du phénomène. Elle fut même à l’origine d’un profond rejet de sa théorie
à l’époque de la publication des Principia, en particulier de la part de Christian Huygens. La physique de
l’époque était en effet encore influencée par les théories aristotéliciennes considérant l’origine de mouvement
comme un état transitoire permettant aux choses de revenir vers leur “état naturel”, mais surtout par la
philosophie de Renée Descartes et sa conception mécaniste de la nature. Dans cette conception, la matière
est inerte et le mouvement est régi par les lois simples (et locales) des chocs et de la pression. Beaucoup ont
alors considéré la loi de l’attraction universelle comme une résurgence de l’occultisme, ce qui n’est pas tout
à fait faux. En effet, Newton pratiquait en secret l’alchimie, et son concept d’interaction à distance n’est
pas sans rappeler la notion “d’affinité” que l’on trouve en alchimie. Par la suite, l’étude de l’électricité et du
magnétisme, introduisit les autres forces agissant à distance que sont la force de Lorentz (électrique) et la
force de Laplace (magnétique). Une interprétation moins problématique fût proposée par Michael Faraday,
qui introduisit les "lignes de force". L’idée est que les objets chargés électriquement, sont "reliés" par des
"lignes invisibles" qui transmettent la force. On pourrait faire l’analogie avec la tension d’un fil. Lorsqu’on
tire sur un fil attaché à une masse, on agit directement sur le bout du fil (par une force de contact), le bout
du fil agit sur le "petit morceau" de fil qui lui est contigu, ce petit morceau agit sur le petit morceau à côté,
et ainsi de proche en proche, la force est transmise localement jusqu’à la masse. Les lignes de forces sont
sensées agir de façon analogues, en transmettant de proche en proche l’interaction. Cette idée fût bien sûr
renforcée par la visualisation expérimentale de ces lignes (en utilisant de la limaille de fer et un aimant, par
exemple). Les lignes de force donnent une interprétation locale des forces "agissant à distance" mais par
l’intermédiaire d’objets non-locaux (une ligne n’est pas un objet local car n’est pas déterminée en un point
par ce seul point). La solution est de revenir "au découpage" de la ligne en "petits morceaux infiniment
petits" agissant les uns sur les autres de proche en proche. Mathématiquement formulé, ceci introduit de
1. et non directement du mouvement, cf. principe d’inertie de Galilée
5
6
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
nouvelles entités, les champs de vecteurs (champs électrique, magnétique, gravitationnel,...). Le champ, qui
peut être naïvement défini en un point comme la force que resentirait un objet de "charge unité" placé en ce
point, est en fait une entité physique non-matérielle, emplissant l’espace, et qui transmet de proche en proche
les interactions. Le concept de champ donne ainsi une interprétation locale, par un objet local (déterminé en
chaque point), des interactions "à distance". Champs et lignes de force (lignes de champ) sont des concepts
duaux, les champs sont l’ensemble des vecteurs tangents aux lignes de forces et réciproquement. A cette
dualité, il en existe une seconde avec l’intervention de la notion de potentiel. Le potentiel est à l’énergie ce
qu’est le champ à la force. C’est l’entité qui permet d’interpréter localement les échanges d’énergie (via les
forces agissant à distance) entre objets distants, c’est à dire le travail des forces, les échanges allant dans
“le sens” des différences de potentiels. Les potentiels peuvent être analysés à travers les objets géométriques
étendus que sont les surfaces équipotentielles. Pour résumer, les interactions à distance sont caractérisées
par la double dualité force/énergie + ponctuel/étendu :
champs
l
potentiels
↔
↔
lignes de champs
l
surfaces équipotentielles
L’analyse mathématique montre que les potentiels ne sont pas univoquement définis, ainsi ces entités ne
sont pas considérées comme physiques mais comme de simples intermédiaires de calcul (on verra que l’on
peut discuter ce point). La substance physique (l’essence) - au sens d’Aristote - est décrite par le champ,
parfaitement défini, et pas par le potentiel qui peut être changé (en suivant une certaine règle mathématique) sans changer les effets expérimentaux attendus. Cette invariance des propriétés physiques sous ces
changements - appelée invariance de jauge - était considérée comme un "accident" en électromagnétisme.
Mais la recherche d’une description des interactions nucléaires, a montrée qu’en réalité, il s’agit du concept
fondamental de la théorie.
1.2
1.2.1
Rappels sur les équations de Maxwell
Parité, pseudovecteurs et pseudoscalaires
Les vecteurs peuvent être utilisés pour indiquer le sens d’une rotation (par la règle de la main droite).
~ en vecteur B
~ par rotation, le vecteur C
~ =A
~ ∧B
~ va
Ainsi si dans le plan (x, y) on transforme un vecteur A
~
indiquer le sens de celle-ci, droite (directe, sens inverse des aiguilles d’une montre) si C est dans le même sens
~ est dans le sens de −~ez (la base cartésienne
que ~ez , gauche (indirect, sens des aiguilles d’une montre) si C
(~ex , ~ey , ~ez ) étant supposée directe). Ceci définit également une orientation sur une surface. Étant donnée une
surface S, un vecteur normal à la surface va orienter celle-ci (c’est à dire définir le sens naturel de la rotation
~ B
~ définit une orientation (l’autre
sur la surface). On se donne deux vecteurs tangents non-colinéaires à S, A∧
~
~
étant définie par B ∧ A).
On appelle parité, l’opération P qui
consiste à renverser les axes du système de coordonnées (~ex , ~ey , ~ez ) →
~ = −A.
~ Or
(−~ex , −~ey , −~ez ). Par définition P A
~ ∧ P(B)
~ = −A
~ ∧ (−B)
~ =A
~ ∧B
~ 6= −C
~
P(A)
on a donc
~∧B
~ =
A
~
~
P(A) ∧ P(B) 6=
~
C
~
P(C)
Les opérations ∧ et P ne commutent donc pas (le résultat dépend de l’ordre dans lequel elles sont
~ → P(B)
~ est une rotation avec le même axe orienté que A
~ → B.
~ Si on
effectuées). Le problème est que P(A)
veut que les vecteurs de rotation et d’orientation soient bien définis indépendamment de la parité, on doit
introduire un nouveau type de vecteurs qui ne changent pas de signe sous P.
Définition 1 (Pseudovecteurs). On appelle pseudovecteur (ou bivecteur) un vecteur géométrique rendu
invariant sous parité.
7
1.2. RAPPELS SUR LES ÉQUATIONS DE MAXWELL
x
Bien que désuète, on utilisera par souci de clarté la notation A pour les pseudovecteurs (sachant que
hormis leur comportement sous parité, un pseudovecteur se comporte comme un vecteur). On notera donc
que le produit vectoriel, n’est plus à proprement parlé une loi de composition interne car il associe à deux
vecteurs, un pseudovecteur :
~∧B
~ =C
A
x
~ transforme un champ de vecteurs,
Pour la même raison, le rotationnel (qui est un produit vectoriel avec ∇)
en un champ de pseudovecteurs :
~=D
rotA
x
x
On rappelle que le produit mixte associe à trois vecteurs, le scalaire :
~ B,
~ C|
~ = (A
~ ∧ B)
~ ·C
~
|A,
On remarque donc que
~ P(B),
~ P(C)|
~ = −|A,
~ B,
~ C|
~
|P(A),
Ainsi le produit mixte est un scalaire qui change de signe sous parité, on introduit alors le nouvelle définition
Définition 2 (Pseudoscalaires). On appelle pseudoscalaire une quantité scalaire qui change de signe sous
parité.
Ainsi le produit mixte de trois champs de vecteurs est un champ pseudoscalaire.
Remarque : le “produit scalaire” entre un pseudovecteur et un vecteur est un pseudoscalaire, or comme tout
pseudovecteur peut s’écrire comme une somme de produits vectorielles, un produit scalaire d’un vecteur et
d’un pseudovecteur est toujours une somme de produit mixte. En réalité, il s’agit là de la bonne définition
du produit mixte, à savoir une loi qui associe à un pseudovecteur et à un vecteur un pseudoscalaire. Pour
résumer :
– Produit scalaire :
V×V → S
~ B)
~
~·B
~
(A,
7→ A
PV × PV → S
x x
– Produit vectoriel :
V×V
~ B)
~
(A,
A·B
→ PV
~∧B
~ =C
7→ A
x
– Produit mixte :
x x
( A , B ) 7→
PV × V → PS
~
~
( A , B)
7→ A · B
x
x
Pour des raisons qui deviendront plus claires par la suite, la divergence est restreinte aux pseudovecteurs,
~ et d’un pseudovecteur, ce qui en fait donc un pseudoscalaire. Pour résumer,
c’est donc le produit mixte de ∇
on a la chaîne suivante : (les champs sont supposés de classe C 2 )
x
−−→
grad
rot
div
0 → S −−−→ V −−→ PV −−→ PS → 0
avec la propriété que l’action de deux opérateurs successifs est nulle :
−−→
rotgradf = 0
x
x
~=0
divrotA
x
Les pseudovecteurs étant des vecteurs que l’on considère “artificiellement” comme invariants sous parité,
~ un pseudovecteur de mêmes composantes mais supposé
il peut être utile de pouvoir associer à un vecteur A,
~ et de même
~ ≡ A . Réciproquement, on notera ∗ A ≡ A,
invariant sous P. On notera ce pseudovecteur ∗A
~
pour les scalaires et les pseudoscalaires. ∗ est appelé star-opérateur de Hodge, ∗A est appelé dual de Hodge
~
de A.
x
x
8
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
1.2.2
Formulation locale/différentielle vs globale/intégrale
Les différents objets introduits dans le paragraphe précèdent, champs de (pseudo)scalaires/(pseudo)vecteurs,
sont associés à des objets géométriques et à des quantités physiques différentes.
– En un point (x, y, z), un champ scalaire f définit un scalaire (un nombre) f (x, y, z) (invariant sous
parité). Les champs scalaires sont donc associés aux points (dimension géométrique 0), et on s’attend
à ce qu’un champ scalaire physique soit dimensionné en L0 .
~ Sa circulation sur un chemin orienté C
– Considérons un champ de vecteurs A.
Z
~ · d~ℓ
A
C
~ · d~ℓ est invariant par parité. Par contre le
donne une quantité physique correctement définie, car A
flux d’un champ de vecteurs ne donne pas une quantité physique. Les champs de vecteurs sont donc
associés aux courbes orientées (dimension géométrique 1), et on s’attend à ce qu’un champ de vecteurs
physique soit dimensionné en L−1 pour compenser la dimension du vecteur de longueur infinitésimal
d~ℓ.
– Soit un champ de pseudovecteurs A . Sa circulation n’est pas bien définie, par contre son flux à travers
une surface orientée S, l’est parfaitement
ZZ
A ·dS
x
x
x
S
Les champs de pseudovecteurs sont associés aux surfaces (dimension géométriques 2), et on s’attend à
ce qu’un champ de pseudovecteurs physique soit dimensionné en L−2 pour compenser la dimension du
x
pseudovecteur de surface infinitésimale d S .
– Enfin, un champ pseudoscalaire f ne définit pas en point une quantité invariante par parité. Par contre,
l’intégration de f sur un volume orienté V est invariant :
ZZZ
f dτ
V
en effet, l’élément de volume infinitésimal dτ est défini (en coordonnées cartésiennes) comme le volume
d’un cube élémentaire dont les côtés sont infinitésimaux, soit
dτ = |d~x, d~y , d~z| = (d~x ∧ d~y ) · d~z
dτ est donc un pseudoscalaire. Les champs pseudoscalaires sont donc associés aux volumes (dimension
géométrique 3), et s’attend à ce qu’un champ de pseudoscalaires physique soit dimensionné en L−3 .
Théorème 1 (Théorèmes de Stokes).
• Soit un champ scalaire f de classe C 1 et un chemin orienté C,
d’extrémité initiale (x0 , y0 , z0 ) et d’extrémité finale (x1 , y1 , z1 ). Alors
Z
−−→
gradf · d~ℓ = f (x1 , y1 , z1 ) − f (x0 , y0 , z0 )
C
~ de classe C 1 et une surface orientée S ayant pour bord la courbe fermée
• Soit un champ de vecteurs A
orientée C. Alors
I
ZZ
~ ·dS =
~ · d~ℓ
rotA
A
x
x
C
S
x
• Soit un champ de pseudovecteurs A de classe C 1 et un volume orienté V ayant pour bord la surface
fermée orientée S. Alors
ZZZ
ZZ
div A dτ = A · d S
x
x
x
V
S
C’est donc le passage des formes locales (différentielles) aux formes globales (intégrales) qui relie les
différents champs aux objets géométriques :
−−→
grad
rot
∂
∂
x
div
0 −−−−→ scalaires −−−−→ vecteurs −−−−→ pseudovecteurs −−−−→ pseudoscalaires −−−−→ 0
x
x
x
x
R
RR 
RRR 





0 ←−−−− points ←−−−− chemins ←−−−−
le symbole ∂ signifiant ici “bord”.
surfaces
∂
←−−−−
volumes
←−−−− 0
9
1.2. RAPPELS SUR LES ÉQUATIONS DE MAXWELL
1.2.3
Champs et excitations
Les propriétés électromagnétiques sont décrites par une série de champs qui ont déjà été rencontrés dans
les cours antérieurs :
– La densité de charge électrique ρ : champ pseudoscalaire décrivant la densité volumique de charges
électriques (C.m−3 ).
x
– La densité de courant électrique j : champ de pseudovecteurs décrivant la densité surfacique
d’intensité électrique (A.m−2 ).
– Le potentiel scalaire électrique V : champ scalaire décrivant le potentiel de l’interaction électrique
(V ).
~ : champ de vecteurs décrivant le potentiel de l’interaction
– Le potentiel vecteur magnétique A
−1
magnétique (W b.m ).
~ : champ de vecteurs décrivant l’interaction électrique (V.m−1 ).
– Le champ électrique E
x
– Le champ magnétique B : champ de pseudovecteurs décrivant l’interaction magnétique (W b.m−2 ).
~ (C.m−2 ).
– L’excitation électrique D : champ de pseudovecteurs dual de E
~
~
– L’excitation magnétique H : champ de vecteurs dual de B (A.m−1 ).
x
Petit rappel sur les unités électromagnétiques :
– le Coulomb (C) est l’unité de charge électrique, la charge électrique étant la mesure du couplage de la
~
matière avec le champ électrique, cf. force électrostatique F~e = q E.
– l’Ampère (A) est l’unité d’intensité du courant électrique, c’est la quantité de charges transportées par
unité de temps. La charge transportée par unité de temps par la distance parcourue (A.m) mesure le
couplage de la matière avec le champ magnétique, cf. force magnétique F~m = q~v ∧ B .
– le Volt (V ) est l’unité de tension électrique et de force électromotrice. La force électromotrice d’un
générateur mesure la propension de celui-ci à mettre en mouvement des électrons. La tension appliquée
aux bornes d’une branche de circuit, induit un courant dans la branche dont l’intensité est limité par
la résistance de la branche suivant la loi d’Ohm U = Ri.
– le Weber (W b) est l’unité de flux magnétique et d’induction magnétique. L’induction magnétique
mesure la propension d’un aimant en mouvement à créer du courant électrique dans un circuit, la
force électromotrice de création du courant étant reliée au flux par e = − dφ
dt . Le flux magnétique à
travers une maille de circuit électrique, induit un courant dans la maille dont l’intensité est limité par
le coefficient d’auto-induction suivant la loi φ = Li.
x
Électrique
magnétique
ρ
V
~
E
x
champ
j
~
A
x
densité
potentiel
B
~
H
x
excitation
D
Champs et excitations sont reliés par les équations consitutives :
x
x
~+P
D = ǫ0 ∗ E
~ = 1 ∗ B −M
~
H
µ0
où ǫ0 et µ0 sont respectivement la permittivité électrique et la perméabilité magnétiques du vide.
x
x
– Le champ de polarisation P : champ pseudovectoriel décrivant la réponse électrique du milieu à
un champ électrique externe (C.m−2 ).
~ : champ vectoriel décrivant la réponse magnétique du milieu à un
– Le champ d’aimantation M
champ magnétique externe (A.m−1 ).
~ et M
~ = κH
~ où χ et κ sont appelés
Dans les matériaux linéaires, homogènes et isotropes on a P = ǫ0 χ ∗ E
susceptibilités électrique et magnétique du milieu. Dans ce cas les équations consitutives prennent la forme :
x
x
~
D =ǫ∗E
10
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
~ = 1 ∗B
H
µ
x
avec ǫ = (1 + χ)ǫ0 et µ = (1 + κ)µ0 la permittivité électrique et la perméabilité magnétique du milieu.
1.2.4
Les équations de Maxwell
Les champs et les excitations sont solutions des équations fondamentales de l’électromagnétisme, dites
équations de Maxwell :
Principe 1 (Équations de Maxwell).
• Équations topologiques :
◦ équation de Faraday :
x
x
~ =−
rotE
◦ conservativité du champ magnétique :
∂B
∂t
x
div B = 0
• Équations métriques :
◦ équation de Gauss :
x
div D = ρ
x
x
~ = j +
rotH
x
◦ équation de Maxwell-Ampère :
∂D
∂t
Les champs dérivent des potentiels par les équations structurelles :
~
−→
∂A
~ = −−
E
gradV −
∂t
x
x
~
B = rotA
1.2.5
Invariance de jauge
Soit χ : R4 → R un champ scalaire de l’espace-temps. Soient les transformations suivantes :
∂χ
∂t
−→
~′ = A
~+−
A
gradχ
V′ =V −
On a alors
~′
−→
−−→
−−→
−−→
−→
∂A
~=E
~
~ − ∂t −
~ ′ = −−
gradχ = −gradV − ∂t A
= −gradV + grad∂t χ − ∂t A
E
gradV ′ −
∂t
′
−→
~ ′ = rotA
~ + rot−
~=B
B = rotA
gradχ = rotA
x
x
x
x
x
x
x
~ B ) est donc invariant sous cette transformation de jauge sur les potentiels
Le champ électromagnétique (E,
~ Les deux postulats fondamentaux de l’électromagnétisme sont d’une part la symétrie de jauge (qui
(V, A).
est structurellement plus fondamentale que les équations de Maxwell topologiques), d’autre part les loi de
Gauss et de Maxwell-Ampère.
)
(
)
(
−→
~
~ = −−
gradV − ∂∂tA
E
V ≍ V − ∂χ
~ = −∂ B
∂t
rotE
=⇒
=⇒
∂t
−−→
~
~
~
A ≍ A + gradχ
divB = 0
B = rotA
(
divD = ρ
x
x
x
x
x
x
~ = j +
rotH
∂D
∂t
x
11
1.3. FORMALISME DE LA GÉOMÉTRIE DIFFÉRENTIELLE
Le fait que les potentiels soient définis à un changement de jauge près, conduit à penser que dans la dualité de description potentiels/champs, ce sont les champs qui sont porteurs du sens physique (de l’essence de
l’électromagnétisme), les potentiels n’étant que des intermédiaires de calcul. Cette posture, adoptée d’ailleurs
par la très grande majorité des physiciens, se tient puisque épistémologiquement parlant, il est plus satisfaisant que les entités physiques à caractère ontologique soient parfaitement et univoquement définies. Une
entité qui dépend d’un choix arbitraire du physicien ne semble pas pouvoir donner une description objective
et réaliste 2 de la nature. Mais comme on l’a vu, ce choix arbitraire est structurellement plus fondamental que
les équations des champs. Vu que les transformations de jauge ne sont pas à proprement parlé des objets 3 ,
on peut adopter la posture consistant à considérer que les objets sur lesquels ils portent, les potentiels, sont
les porteurs du sens physique. On verra que l’effet Aharonov-Bohm apporte des arguments en faveur de cette
posture 4 .
~ des quantités qui sont définies
Remarquons qu’il est possible de construire à partir de V (en statique) et A
de manière univoque. La différence de potentiel entre deux points ou tension (mesurée en V ) :
U ((x1 , y1 , z1 ); (x2 , y2 , z2 )) = V (x2 , y2 , z2 ) − V (x1 , y1 , z1 )
et la circulation du potentiel sur un chemin fermé ou boucle de Wilson (mesurée en W b) :
I
~ · d~ℓ
w(C; t) =
A
C
Ces deux entités sont invariantes sous changement de jauge :
U ′ ((x1 , y1 , z1 ); (x2 , y2 , z2 ); t) = (V (x2 , y2 , z2 ) + k) − (V (x1 , y1 , z1 ) + k) = U ((x1 , y1 , z1 ); (x2 , y2 , z2 ))
I
I
−→
~ · d~ℓ + −
gradχ · d~ℓ = w(C; t)
A
w′ (C; t) =
C
C
mais ces quantités sont non-locales (car définies sur plusieurs points). Remarque : pour des raisons qui
apparaîtront plus claires dans la suite, on définit généralement la boucle de Wilson par
W (C; t) = e−ı~
−1
e
H
C
~ ~
A·d
ℓ
(~ étant la constante de Planck et e la charge électrique élémentaire).
1.3
1.3.1
Formalisme de la géométrie différentielle
Les formes différentielles
Puisque un champ de vecteurs ~
ω attend naturellement son intégration dans une circulation, on peut le
représenter par une 1-forme différentielle :
ω=ω
~ · d~ℓ = ωx dx + ωy dy + ωz dz
x
De la même façon, on souhaiterait représenter les champs de pseudovecteurs ω , qui attendent leur intégration
dans un flux, par un objet de la forme
x
x
ω · d S = ωx d~y ∧ d~z + ωy d~z ∧ d~x + ωz d~x ∧ d~y
où d~x = dx~ex . Les éléments de la forme d~x ∧ d~y = dxdy ∗ ~ez constituent une base de l’espace vectoriel des
éléments infinitésimaux de surface orientée. On les note simplement dx ∧ dy (avec la propriété dy ∧ dx =
2. ces deux termes étant utilisés ici dans leur sens philosophique, le réalisme objectiviste consistant en la croyance en
l’existence d’une réalité en soi, accessible et composée d’objets
3. dans le cadre du réalisme pythagoricien, la réalité en soi n’est pas constituée d’objets, seules les structures sont réelles.
Une interprétation physique faite dans ce cadre induirait immédiatement que la symétrie de jauge est en elle-même la seule
réalité physique. Ce point de vu est peu populaire, la grande majorité des physiciens sont des réalistes objectivistes.
4. remarque : l’argument naïf souvent invoqué pour justifier que les champs sont physiques et pas les potentiels, à savoir
qu’ils seraient mesurables expérimentalement, est faux. Aucun dispositif expérimental ne mesure directement un champ, la
seule et unique quantité qui soit directement mesurable est la force. Les dispositifs mesurant le champ électrique mesurent en
réalité la force électrique s’appliquant à une charge connue. À partir de cette mesure primaire, on obtient le champ par une
~ =F
~ /q, on peut faire de même pour le potentiel même si la reconstruction est plus compliquée
reconstruction mathématique E
12
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
−dx ∧ dy). Par abstraction, le lien avec la géométrie vectorielle peut être oublié, et l’opération ∧ entre 1formes différentielles peut être définie par ses propriétés algébriques (elle porte le nom de produit extérieur).
Les pseudovecteurs peuvent donc être représenter par ce que l’on appelle des 2-formes différentielles :
ω = ωxy dx ∧ dy + ωyz dy ∧ dz + ωzx dz ∧ dx
avec ωxy ≡ ωz (et permutations circulaires de (xyz)).
De la même façon, les champs pseudoscalaires qui attendent d’être intégrés dans un volume,
ωdτ = ω(d~x ∧ d~y ) · d~z = ω|d~x, d~y , d~z|
peuvent être représentés par des 3-formes différentielles :
ω = ωxyz dx ∧ dy ∧ dz
où dx ∧ dy ∧ dz est une abstraction de |d~x, d~y , d~z| dans laquelle on considère simplement les propriétés
algébriques du produit extérieur (linéaire, anticommutatif et associatif).
Le produit extérieur et les formes différentielles peuvent être définis dans n’importe quel espace Rn et même
sur n’importe quelle variété (objet géométrique) M . On note Ωn M l’ensemble des n-formes différentielles de
M :
Ωn M = {ωµ1 ...µn dxµ1 ∧ ... ∧ dxµn }
où les ωµ1 ...µn sont des fonctions de M (antisymétrique par échange des indices) et où {x1 , ..., xn } constituent
un système de coordonnées de M (on adopte la convention d’Einstein sur la répétition des indices).
On a donc pour les entités électromagnétiques, les formes différentielles de l’espace (dépendantes du temps) :
ρ
j
V
A
E
B
D
H
1.3.2
∈ Ω3 R3
∈ Ω2 R3
∈ Ω0 R3
∈ Ω1 R3
∈ Ω1 R3
∈ Ω2 R3
∈ Ω2 R3
∈ Ω1 R3
La différentielle extérieure
Soit d la différentielle de l’espace : pour toute fonction f ∈ Ω0 R3 on a
df =
∂f i
dx
∂xi
On étend sa définition à l’ensemble des formes différentielles : ∀ω ∈ Ωn M :
dω =
∂ωµ1 ...µn µ0
dx ∧ dxµ1 ∧ ... ∧ dxµn ∈ Ωn+1 M
∂xµ0
Cette extension est alors appelée différentielle extérieure. On notera que du fait des propriétés d’antisymétrie
du produit extérieur, on a la règle de Leibniz (graduée)
– ω
~ champ vectoriel / ω ∈ Ω1 R3
−−→
gradf · d~ℓ = df
x
On a dans R3 les équivalences suivantes :
– f champ scalaire (0-forme)
d(ω ∧ η) = dω ∧ η + (−1)n ω ∧ dη
x
∀ω ∈ Ωn M, ∀η ∈ Ωp M,
rotω · d S = dω
1.3. FORMALISME DE LA GÉOMÉTRIE DIFFÉRENTIELLE
13
x
– ω champ pseudovectoriel / ω ∈ Ω2 R3
divωdτ = dω
La différentielle extérieure remplace donc tous les opérateurs vectoriels. Les équations de Maxwell prennent
donc la forme suivante :
• Équations topologiques :
◦ équation de Faraday :
∂B
dE = −
∂t
◦ conservativité du champ magnétique :
dB = 0
• Équations métriques :
◦ équation de Gauss :
dD = ρ
◦ équation de Maxwell-Ampère :
dH = j +
∂D
∂t
avec les équations structurelles :
E = −dV −
∂A
∂t
B = dA
D
On notera que d2 = 0, et que l’invariance de jauge s’écrit :
V′ =V −
∂χ
∂t
A′ = A + dχ
avec χ ∈ Ω0 R4 .
Le théorème de Stokes s’écrit alors d’une manière générale :
Théorème 2 (Théorème de Stokes). Soit ω ∈ Ωn M une n-forme différentielle et V une sous-variété de M
(un objet géométrique dans M ) de dimension n + 1.
Z
I
dω =
ω
V
∂V
où ∂V est la sous-variété de dimension n bord de V.
Preuve : Démontrons le théorème dans le cas où n = 1 et donc où V est une surface. Supposons
dans un premier temps qu’il existe un paramètrage de V (un système de coordonnées sur V) tel que les
coordonnées forment un pavé de R2 : [u1 , u2 ] × [v1 , v2 ] ∋ (u, v) 7→ x(u, v) ∈ V.
ZZ
dω
=
V
=
=
=
ZZ
∂ωµ ν
dx ∧ dxµ
ν
V ∂x
«
ZZ „
∂ωµ
1
∂ων
dxν ∧ dxµ
−
2
∂xν
∂xµ
V
«
Z u2 Z v2 „
∂ωµ
∂ων ∂xν ∂xµ
−
dudv
∂xν
∂xµ ∂u ∂v
u1
v1
«
Z u2 Z v2 „
∂ων ∂xν
∂ωµ ∂xµ
−
dudv
∂u ∂v
∂v ∂u
u1
v1
Par intégration par parties, on a
Z
u2
u1
»
–u
Z u2
∂xµ 2
∂ωµ ∂xµ
∂ 2 xµ
du = ωµ
du
−
ωµ
∂u ∂v
∂v u1
∂u∂v
u1
14
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
d’où
Z
u2
u1
Z
v2
v1
„
∂ωµ ∂xµ
∂ων ∂xν
−
∂u ∂v
∂v ∂u
«
dudv
=
=
»
–u
Z v2 Z u2
∂xµ 2
∂ 2 xµ
ωµ
dudv
dv −
ωµ
∂v u1
∂u∂v
v1
v1
u1
–
Z u2 »
Z
Z
v
u2
v2
∂xµ 2
∂ 2 xµ
dvdu
−
ωµ
du +
ωµ
∂u v1
∂v∂u
u1
u1
v1
–
–
»
Z
Z v2 »
u
v
u2
∂xµ 2
∂xµ 2
dv −
du
ωµ
ωµ
∂v u1
∂u v1
u1
v1
Z
v2
L’intégration de ω sur le bord de V est donnée par
I
I
ω =
ωµ dxµ
←
−
↓ ↑
→
−
∂V
=
Z
=
Z
→
−
u2
u1
Z
Z
Z
∂xµ
∂xµ
∂xµ
∂xµ
du +
dv + ←
du
+
dv
ω
ωµ
ωµ
µ
−
∂u
∂v
∂u
∂v
↑
↓
–
–
–
–
Z v2
Z u2
Z v2
∂xµ
∂xµ
∂xµ
∂xµ
du +
dv −
du −
dv
ωµ
ωµ
ωµ
ωµ
∂u v1
∂v u2
∂u v2
∂v u2
v1
u1
v1
ωµ
où = [u1 , u2 ] × [v1 , v2 ]. En comparant les deux expressions, on a bien
ZZ
I
dω =
ω
∂V
V
Si V ne peut être munie d’un système coordonnées engendrant un pavé, on décompose V en morceaux
qui peuvent chancun être indépendamment paramétrés par un pavé. Le théorème de Stokes s’applique
sur chaque morceau, et les contributions des bords des morceaux ne se trouvant pas sur ∂V s’annulent
←
−
←
−
←
−←
−
deux à deux : ↓ ↑↓ ↑=↓ ↑. Seules subistent donc les contributions de ∂V , ce qui démontre le
→
−
→
−
→
−→
−
théorème pour toute surface V.
La démonstration du théorème est essentiellement la même en dimension quelconque (avec quelques subtilités techniques supplémentaires), on l’admettra pour n > 1. Dans R3 on a donc
d
0 −−−−→ Ω0 R3 −−−−→
x


∂
Ω1 R3
x
R

d
−−−−→
∂
Ω2 R3
x
RR 

d
−−−−→
∂
Ω3 R3
x
RRR 

−−−−→ 0
0 ←−−−− points ←−−−− chemins ←−−−− surfaces ←−−−− volumes ←−−−− 0
avec d2 = 0 et ∂ 2 = 0. Compte-tenu de la dualité entre la différentielle extérieure d et l’opérateur de bord ∂,
d est aussi quelque fois appelée opérateur de cobord. La ligne du bas du diagramme est appelée un complexe
d’homologie, et celle du haut un complexe de cohomologie.
La dualité engendre également que les formes différentielles exactes :
B n M = {dω; ω ∈ Ωn−1 M } ⊂ Ωn M
(ce que l’on appelle en thermodynamique dans un langage quelque peu archaïque, les différentielles totales
exactes) sont aussi appelées des cobords. De plus les objets géométriques fermés n’ayant pas de bord, on
dira qu’une forme différentielle ω est fermée si dω = 0. Les formes différentielles fermées
Z n M = {ω ∈ Ωn M |dω = 0} ⊂ Ωn M
porte également le nom de cocycles. On notra que puisque d2 = 0, on a B n M ⊂ Z n M .
Considérons le champ magnétique B ∈ Ω2 R3 et le potentiel magnétique A ∈ Ω1 R3 . Du fait de l’équation
structurelle B = dA, le champ magnétique est un cobord B ∈ B 2 R3 . On sait qu’il est difficile de considérer
A comme le porteur du sens physique du magnétisme car celui-ci est défini à un cobord près :
A′ = A + dχ ⇒ dA′ = dA = B
Il dépend
H donc d’un choix arbitraire, et ne peut pas être considéré comme une essence. La boucle de Wilson
w(C) = C A est définie de façon univoque, mais c’est une entité non-locale (c’est une fonction sur l’ensemble
1.4. LES DIFFÉRENTES THÉORIES DE JAUGE
15
des boucles). B semble donc être la seule entité satisfaisante pour être l’essence du magnétisme. Mais il en
existe en fait une autre. On ne considère pas A mais la classe d’équivalence représentée par A :
[A]d = {A + dχ, χ ∈ Ω0 R3 }
[A]d est l’ensemble de tous les potentiels magnétiques possibles. Cet ensemble est défini de façon univoque (on
considère dans la même entité tous les choix de jauge), et il est local (il ne dépend que du point considéré).
Le prix a payer est que l’entité n’est plus une forme différentielle mais un ensemble de formes différentielles.
Dans la même idée, si on considère un cocycle ω ∈ Z n M , on peut redéfinir celui-ci par l’ajout d’un cobord,
ω ′ = ω + dη (η ∈ Ωn−1 M ) avec toujours dω ′ = 0. On peut considérer la classe [ω]d = {ω + dη, η ∈ Ωn−1 M }.
L’ensemble de ces classes :
H n M = Z n M/B n M = {[ω]d , ω ∈ Z n M }
porte le nom de groupe de cohomologie. Son rôle en électromagnétisme sera abordé plus tard.
Les complexes de (co)homologie vus dans cette section sont dit de (co)homologie de de Rham. H n M porte
donc le nom de groupe de cohomologie de de Rham de degré n.
Le concept de théorie de cohomologie n’est donc qu’une formalisation algébrique de principe physique d’invariance de jauge.
1.4
1.4.1
Les différentes théories de jauge
Théorie de jauge de degré 1
Le champ électrostatique
Considérons un physicien qui fait une expérience d’électrostatique. Comme le potentiel est défini à une
constante près, il fait dans son laboratoire un choix de jauge arbitraire. Notons U α le voisinage de son
laboratoire. Supposons qu’un autre physicien, fasse une autre expérience d’électrostatique, il fixe donc un
choix de jauge dans son propre laboratoire. Notons U β la voisinage de ce second laboratoire. Il n’y a pas de
raison que les deux choix arbitraires soient les mêmes, on doit donc considérer, V α le choix de potentiel du
premier physicien et V β celui du second. Supposons que les deux voisinages aient une petite région commune
U α ∩ U β . Alors ∀x ∈ U α ∩ U β on a
E = −dV α = −dV β
V β − V α = καβ
où καβ est une constante. Ces dernières équations sont un point important des théories de jauge (on dit
qu’elles caractérisent une théorie de jauge de degré 1). Le potentiel électrostatique n’est défini que localement
(pour des voisinages, encore appelés cartes locales de R3 ) alors que le champ électrostatique est bien défini
globalement. Si on considère trois cartes, on voit que l’on doit avoir
κβγ − καγ + καβ = 0
dite condition de cocycle. On peut étendre une des définitions locales du potentiel aux deux autres cartes
(grâce à la relation précédente). Finalement, en regroupant les cartes, il est possible de s’accorder sur la
choix de jauge dans tout R3 (et ainsi définir un potentiel global). On dit que la théorie de jauge est triviale.
C’est pour cela qu’en général, on oublie toute référence aux cartes locales.
Notons que dE = 0 et comme il existe un potentiel global tel que E = −dV , on a [E]d = {dV + dχ, χ ∈
Ω0 R3 } = [0]d ∈ H 1 R3 . Le fait que la classe de cohomologie de de Rham du champ soit la classe nulle et une
autre manifestation de la trivialité de la théorie.
L’électromagnétisme porte néanmoins une théorie de jauge de degré 1 non triviale.
L’excitation magnétique
On considère une boucle C fixe dans l’espace parcourue par un courant I. On ne peut pas définir simplement un potentiel scalaire magnétique Υ tel que H = −dΥ, car alors dH = −d2 Υ 6= j (j = IδC (x) ∗ ds où
δC est la distribution de Dirac associée à C et s est une coordonnée curviligne de C). Néanmoins, de par la
loi de Biot et Savart, on a
Z ~′
dℓ ∧ (~r − ~r′ )
I
~
H(~r) =
4π C k~r − ~r′ k3
16
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
Avec un peu de calculs on montre que
C
d~ℓ′ ∧ (~r − ~r′ )
k~r − ~r′ k3
−−→
= −grad
ZZ
S
−−→
= −gradΩ(~r)
x
Z
′
d S · (~r − ~r′ )
k~r − ~r′ k3
où Ω(~r) est l’angle solide sous lequel on voit la boucle de courant depuis le point ~r (C = ∂S). On peut donc
écrire que
I
H = − dΩ
4π
Mais il faut noter que Ω est une fonction multivaluée. Pour simplifier prenons l’exemple de l’angle β sous
lequel on voit un segment dans le plan, en changeant le point de vue suivant deux chemins menant au même
point.
Entre les deux chemins, on a un écart de 2π sur la valeur de l’angle β. Avec un angle solide dans l’espace,
on aurait un écart de 4π. Pour introduire un potentiel scalaire magnétique, il faut donc considérer au moins
quatre cartes locales autour de la boucle C. U α comme un pseudocylindre au dessus de C, U β comme le
pseudocylindre en dessous de C et U γ , U δ comme des zones entourant le cylindre. On dédinit alors Υα =
I
α
4π Ω|U (restreint à une carte, l’angle solide est une fonction monovaluée), avec
H = −dΥα
et aux intersections
Υβ − Υα = καβ = I
Υγ − Υα = καγ = 0
Υγ − Υβ = κβγ = 0
Cette fois on ne peut pas faire un choix de jauge qui annule les κ car
κβγ − καγ + καβ = I 6= 0
Néanmoins, la condition de cocycle est toujours vérifiée car U α ∩ U β ∩ U γ = ∅ (il n’y a pas de point commun
à ces trois cartes). La relation précédente n’a donc pas de sens géométrique et n’exprime que le fait que l’on
ne peut pas étendre le choix de jauge à tout l’espace.
On a une théorie de jauge de degré 1 non triviale. La constante I est alors l’indice de non-trivialité de la
théorie.
On notera que [H]d = {H + dχ, χ ∈ Ω0 R} ∈ H 1 (R3 \ C) n’est pas la classe nulle, car H n’est pas globalement
exacte (mais seulement localement, il n’y pas de fonction Υ définie sur tout R3 \ C telle que H = −dΥ).
On notera que dH = j au sens des distributions, mais qu’au sens des dérivées naturelles dH = 0 et donc H
est une forme fermée. La classe de cohomologie [H]d est aussi un indice de non-trivialité. En fait [H]d et I
sont des informations redondantes (de par le théorème de de Rham que l’on ne discutera pas ici).
17
1.4. LES DIFFÉRENTES THÉORIES DE JAUGE
1.4.2
Théorie de jauge de degré 2
Le champ magnétique
La discussion sur les cartes locales peut être reprise ici. On aura donc
B = dAα
et à l’intersection de deux cartes
Aβ − Aα = dχαβ
où χαβ ∈ Ω0 (U α ∩ U β ). La condition de cohérence entre trois cartes impose seulement que
χβγ − χαγ + χαβ = z αβγ
avec z αβγ une constante sur U α ∩ U β ∩ U γ (dz αβγ = 0). Comme dans le cas du champ électrostatique, on
peut choisir les conventions de jauge telles que z αβγ = 0, et faire en sorte d’étendre l’une des conventions
aux trois cartes, puis à tout l’espace. On a une théorie de jauge de degré 2 triviale. La classe de cohomogie
de de Rham est à nouveau nulle, [B]d = [0]d ∈ H 2 R3 , en accord avec la trivialité de la théorie de jauge.
L’excitation électrique
On considère une charge électrique q ponctuelle dans l’espace. On cherche un potentiel vecteur électrique
dont dérive l’excitation électrique. Comme pour le cas de l’excitation magnétique, le potentiel ne sera pas
defini globalement. Soit un système de coordonnées sphériques centrées sur la charge. On considère U N
une carte locale essentiellement dans la partie nord du système de coordonnées, et U S une carte locale
essentiellement dans la partie sud (les cartes s’intersectent dans un voisinage du plan équatorial). On introduit
alors le potentiel vecteur électrique :
q
(1 − cos θ)dϕ
CN =
4π
q
C S = − (1 + cos θ)dϕ
4π
où θ est la colatitude et ϕ la longitude. On a alors
q
D = dC N = dC S =
sin θdθ ∧ dϕ
4π
En utilisant le fait que d~ℓ = dr~er + rdθ~eθ + r sin θdϕ~eϕ , on retrouve bien
x
D=
q ∗~r
4π r3
à l’intersection
q
dϕ = dχN S
2π
q
ϕ, mais cette fonction est multivaluée, en effet les points xgw se trouvant dans
On aurait donc χN S = − 2π
le plan équatorial et dans le plan du méridien fondamental, ont deux longitudes ϕ = 0 ou ϕ = 2π. Ainsi
on peut avoir χN S (xgw ) = 0 ou χN S (xgw ) = −q. Pour résoudre ce problème, il est nécessaire de scinder les
cartes. On considère U α la carte locale essentiellement dans le quart nord est, U β dans la quart nord ouest
(U α ∪ U β = U N ), U γ dans le quart sud est et U δ dans le quart sud ouest (U γ ∪ U δ = U S ). On a alors
q
χαγ = − 2π
ϕ|U α ∩U γ et χαβ = 0 avec
D = dC α
CS − CN = −
et aux intersections
C β − C α = dχαβ
et
C γ − C α = dχαγ
χβγ − χαγ + χαβ = −q
On notera que compte-tenu de la quantification des charges électriques, −q = z αβγ e avec e charge élémentaire
et z αβγ ∈ Z. L’entier z αβγ est l’indice de non-trivialité de la théorie de jauge de degré 2. Remarque : pour
une raison que l’on ne développera pas ici, les théories de jauge de degré 2 (et plus) ont toujours un indice
de non-trivialité quantifié.
dD = qδ(x, y, z) au sens des distributions, mais au sens des dérivées naturelles D est une forme fermée
dD = 0. Sa classe de cohomologie de de Rham [D]d ∈ H 2 (R3 \ {(0, 0, 0)}) est une information redondante
avec q (théorème de de Rham).
18
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
1.4.3
Le cas général
Théorie de jauge de degré 1
καβ ∈ Z
V
α
0
∈Ω U
κβγ − καγ + καβ = 0
α
E ∈ Ω1 M
V β − V α ∝ καβ
E = −dV α
dE = 0
Théorie de jauge de degré 2
z αβγ ∈ Z
z βγδ − z αγδ + z αβδ − z αβγ = 0
χαβ ∈ Ω0 (U α ∩ U β )
χβγ − χαγ + χαβ ∝ z αβγ
F ∈ Ω2 M
F = dAα
Aα ∈ Ω1 U α
Aβ − Aα = dχαβ
dF = 0
Théorie de jauge de degré 3
Par généralisation, on peut définir une théorie de jauge de degré 3
wαβγδ ∈ Z
wβγδζ −wαγδζ +wαβδζ −wαβγζ +wαβγδ = 0
ξ αβγ ∈ Ω0 (U α ∩ U β ∩ U γ )
ξ βγδ −ξ αγδ +ξ αβδ −ξ αβγ ∝ wαβγδ
B α ∈ Ω2 U α
B β − B α = dAαβ
Aαβ ∈ Ω1 (U α ∩ U β )
Aβγ − Aαγ + Aαβ = −dξ αβγ
H ∈ Ω3 M
H = dB α
dH = 0
Les théories de jauge de degré 3 se rencontrent en théorie (classique) des cordes pour décrire une cordre
chargée dans un champ électromagnétique.
On peut encore généraliser est définir une théorie de jauge de degré quelconque.
La cohomologie de Deligne
L’invariance de jauge peut être exprimée comme suit :
– dans une théorie de jauge de degré 1, V α et Ṽ α = V α + k (avec k ∈ R) définissent le même champ E
et le même indice de non trivialité associé à καβ .
– dans une théorie de jauge de degré 2, les couples (χαβ , Aα ) et (χ̃αβ , Ãα ) = (χαβ + ζ β − ζ α , Aα + dζ α )
(avec ζ α ∈ Ω0 U α ) définissent les mêmes F et z αβγ .
– dans une théorie de jauge de degré 3, les triplets (ξ αβγ , Aαβ , B α ) et (ξ˜αβγ , Ãαβ , B̃ α ) = (ξ αβγ + ζ βγ −
ζ αγ + ζ αβ , Aαβ − dζ αβ + k β − k α , B α + dk α ) (avec ζ αβ ∈ Ω0 (U α ∩ U β ) et k α ∈ Ω1 U α ) définissent les
mêmes H et wαβγδ .
Les classes d’équivalence
[V α ]D
[χαβ , Aα ]D
[ξ αβγ , Aαβ , B α ]D
= {V α + k, k ∈ R}
= {(χαβ + ζ β − ζ α , Aα + dζ α ); ζ α ∈ Ω0 U α }
= {(ξ αβγ + ζ βγ − ζ αγ + ζ αβ , Aαβ − dζ αβ + k β − k α , B α + dk α ); ζ αβ ∈ Ω0 (U α ∩ U β ), k α ∈ Ω1 U α }
sont dites classes de cohomologie de Deligne.
On peut donc généraliser la discussion sur les essences de l’électromagnétisme, on a des entités définies
de manière univoque, locales et intégrant tous les choix de jauge en considérant les classes de Deligne. Pour
l’électrostatique :
1 3
2
[V ]D ∈ HD
R
[χαβ , C α ]D ∈ HD
(R3 \ {~0})
19
1.4. LES DIFFÉRENTES THÉORIES DE JAUGE
et pour le magnétisme
2 3
[0, A]D ∈ HD
R
1
[Υα ]D ∈ HD
(R3 \ C)
On remarquera que [A]d = [0, A]D n’est pas un élément du groupe de cohomologie de de Rham (A n’est pas
fermé) mais est en fait un élément du groupe de cohomogie de Deligne. C’est donc la théorie de cohomologie
de Deligne qui est le formalisme complet de l’invariance de jauge.
D’un point de vue algébrique, l’opérateur de cobord de Deligne D est donné en théorie de jauge de dégré n
par
(
δω + (−1)deg(ω) dω si deg(ω) ≤ n
Dω =
δω mod Z
si deg(ω) = n
où δ est l’opérateur “de dérivation discrète par rapport aux indices de cartes” : (δω)αβ = ω β − ω α , (δω)αβγ =
ω βγ − ω αγ + ω αβ ,...
Il y a une troisième théorie de cohomologie en électromagnétisme, la cohomologie de Čech qui est associée
à la combinatoire des cartes locales, et que l’on n’abordera pas ici. On dira simplement que les indices de
non-trivialités que l’on a trouvés dans les sections précédentes sont en fait les classes de cohomologie de
Čech. Le théorème de de Rham que l’on a évoqué énonce que les groupes de cohomologies de de Rham et
de Čech sont isomorphes (à la limite où les cartes locales deviennent infinitésimales).
20
CHAPITRE 1. THÉORIE DE JAUGE EN ÉLECTROMAGNÉTISME ET COHOMOLOGIE
Chapitre 2
L’effet Aharonov-Bohm et homotopie
2.1
2.1.1
Transport d’une particule dans un champ électromagnétique
Principe d’invariance de jauge de Weyl
Soit une particule de charge q et de masse m soumise à un champ électrique et magnétique. L’équation
de Schrödinger de cette particule est (sans considérer le spin)
ı~
2
∂ψ
1 ~ − qA
~ ψ + qV ψ
−ı~∇
=
∂t
2m
où ψ(x, y, z, t) est l’amplitude de probabilité de présence de la particule, c’est à dire que la probabilité de
trouver la particule dans un portion Ω ⊂ R3 de l’espace est
ZZZ
|ψ(x, y, z, t)|2 dxdydz
PΩ (t) =
Ω
Si la source du champ est une particule chargée fixe, avec l’absence du champ magnétique, on retrouve
l’équation de Schrödinger de l’atome d’hydrogène :
ı~
−~2
∂ψ
=
∆ψ + qV ψ
∂t
2m
Le problème est que l’équation de Schrödinger n’est pas invariante sous changement de jauge électromagnétique
−→
∂χ
~′ = A
~+−
V′ =V −
A
gradχ
∂t
ı~
∂ψ
∂t
=
=
2
1 ~ − qA
~ ′ ψ + qV ′ ψ
−ı~∇
2m
−→ 2
∂χ
1 ~ − qA
~ − q−
−ı~∇
gradχ ψ + qV ψ − q ψ
2m
∂t
La probabilité de présence de la particule semble donc dépendre du choix de jauge, or ce choix est
arbitraire. Pour résoudre le problème, il faut remarquer qu’il y aussi un degré de liberté dans le choix de la
fonction d’onde. En effet, considérons la fonction d’onde
ψ ′ (x, y, z, t) = eıϕ(x,y,z,t)ψ(x, y, z, t)
où ϕ : R4 → R est une fonction arbitraire. Sous cette transformation, dite de changement local de phase, la
probabilité de présence est invariante :
ZZZ
ZZZ
|eıϕ(x,y,z,t)ψ(x, y, z, t)|2 dxdydz =
|ψ(x, y, z, t)|2 dxdydz = PΩ (t)
PΩ′ (t) =
Ω
Ω
Afin de rendre compatible l’équation de Schrödinger avec l’invariance de jauge électromagnétique, il faut,
lorsqu’on procède à un changement de jauge, faire un changement local de phase qui le compense.
21
22
CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE
Théorème 3 (Principe d’invariance de jauge de Weyl). L’équation de Schrödinger est invariante sous le
changement de jauge et le changement local de phase :
∂
χ(x, y, z, t)
∂t
−→
~ ′ (x, y, z, t) = A(x,
~ y, z, t) + −
A
gradχ(x, y, z, t)
V ′ (x, y, z, t) = V (x, y, z, t) −
ψ ′ (x, y, z, t) = eı~
−1
qχ(x,y,z,t)
ψ(x, y, z, t)
où χ : R4 → R.
x
2.1.2
ψ =e
ı~−1 qχ
x
Quantique
′
~ = −∂ B
rotE
∂t
x
Magnétique
V ′ = V − ∂χ
∂t
−→
~′ = A
~+−
A
gradχ
équations invariantes
x
Electrique
quantités invariantes
−→
~
~ = −−
E
gradV − ∂∂tA
~
B = rotA
div B = 0
2
dP = |ψ| dxdydz
ψ
x
changement de jauge
ı~∂t ψ =
~
~ 2ψ
(−ı~∇−q
A)
2m
+ qV ψ
Transport d’une particule
Propriété 1. Soit une particule de charge électrique q, de fonction d’onde ψ(x, y, z), supposée être un paquet
~ règne dans l’espace.
d’ondes localisé autour d’un point (x0 , y0 , z0 ) de l’espace. Un potentiel magnétique A
On astreint la particule (ou plutôt le paquet d’ondes) à se déplacer suivant un chemin fermé C partant de
(x0 , y0 , z0 ). Alors après avoir déplacé la particule, sa fonction d’onde est :
ψ ′ (x, y, z) = eı~
−1
q
H
C
A
ψ(x, y, z)
~ · d~ℓ ∈ Ω1 R3 .
avec A = A
Preuve : On suppose dans un premier temps que l’on translate le paquet d’ondes suivant un vecteur
infinitésimal d~
ℓ. Le paquet d’ondes n’étant pas déformé par l’opération, la fonction d’onde translatée
s’identifie à la fonction d’onde initiale à une phase près que l’on peut supposer proportionnelle à d~
ℓ:
ψ(x + dx, y + dy, z + dz) = eı~
−1
q ϕ·d
~ ~
ℓ
d’où
ψ(x + dx, y + dy, z + dz) − ψ(x, y, z) = (eı~
par un développement limité
ψ(x, y, z)
−1
q ϕ·d
~ ~
ℓ
− 1)ψ(x, y, z)
−−→
gradψ · d~
ℓ = ı~−1 q ϕ
~ · d~
ℓψ
−−→
ı~gradψ = −q ϕ
~ψ
On procède à un changement de jauge ψ ′ = eı~
−1
qχ
ψ, on a alors
−−→
~ ′ ψ′
ı~gradψ ′ = −q ϕ
−−→
−−→
⇐⇒ ı~gradψ − q gradχψ = −q ϕ
~ ′ψ
−−→
−
−
→
⇐⇒ ı~gradψ = −q(~
ϕ′ − gradχ)ψ
On en déduit que
−−→
ϕ
~′ = ϕ
~ + gradχ
~ On a donc
On peut donc identifier ϕ
~ à A.
−−→
~ · d~
gradψ · d~
ℓ = ı~−1 q A
ℓψ
On note (x(s), y(s), z(s) la paramétrisation de la courbe C. Le long de cette courbe l’équation précédente
s’écrit
~
dψ
~ · dℓ ψ(s)
= ı~−1 q A
ds
ds
d’où
−1 R s ~ d~
ℓ
ψ(s) = eı~ q 0 A· ds ds ψ(0)
23
2.2. L’EFFET AHARONOV-BOHM
Cette propriété peut également être démontrée en utilisant l’expression semi-classique de la fonction
d’onde
−1
ψ(x, y, z) = |ψ(x, y, z)|e−ı~ S(x,y,z)
où S est l’action classique qui est ici
~
~ · dℓ
L + qA
dt
Z
S=
!
dt
avec L le Lagrangien en l’absence de champ magnétique.
Enfin si on introduit l’opérateur impulsion généralisé :
~ − qA
~
~π = −ı~∇
On peut définir l’opérateur de translation magnétique :
T (w)
~ = eı~
avec
T (w)ψ(x,
~
y, z) = e−ı~
−1
−1
qw i Ai (x,y,z)
w i πi
ψ(x + w1 , y + x2 , z + w3 )
L’algèbre des translations magnétiques satisfait à
[xi , πj ] = ı~δji
[πi , πj ] = −ı~Bij
1
[πi , [πj , πk ]]dxi ∧ dxj ∧ dxk = −~2 dB = 0
2
avec B = dA le champ magnétique.
2.2
2.2.1
L’effet Aharonov-Bohm
L’effet Aharonov-Bohm
Supposons qu’une particule chargée se trouve dans un solide infini percé d’un tube infini de rayon a
dans lequel on a installé un solénoïde infini parcouru par un courant I et comportant ν spires par unité de
longueur. Le cylindre est ainsi une portion de l’espace interdite à la particule. On note z l’axe du cylindre et
(x, y) les coordonnées dans le plan perpendiculaire au cylindre. Le problème étant symétrique par translation
suivant z, les champs ne vont pas dépendrepde z. De plus le problème étant invariant par rotation autour
de z, les champs ne dépendent que de r = x2 + y 2 . Les plans (x, y) étant plan de symétrie, et le champ
magnétique étant orthogonal à tous plan de symétrie, on a
B = B(r)dx ∧ dy
Par application du théorème d’Ampère :
(
µ0 νIdx ∧ dy
B=
0
et
A=
(
µ0 νIr 2
dθ
2
µ0 νIa2
dθ
2
si r < a
si r > a
si r < a
si r > a
(dr ∧ rdθ = dx ∧ dy).
Supposons que l’on astreint la particule à suivre un cercle C dans le plan (x, y) de rayon R > a centré sur
l’axe du tube. Alors après le déplacement, la fonction d’onde de la particule devient
ψ ′ (x, y, z) =
=
eı~
−1
eı~
−1
q
H
C
A
ψ(x, y, z)
qµ0 νIπa2
ψ(x, y, z)
24
CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE
La phase acquise par la fonction d’onde au cours du déplacement est mesurable, il suffit de faire interférer
le paquet d’ondes déplacé avec un paquet d’ondes resté inchangé :
ψtot (x, y, z) =
ψ(x, y, z) + ψ ′ (x, y, z)
√
2
2
21
|ψtot (x, y, z)| = |ψ(x, y, z)|
+ cos ~−1 q
2
H
C
A
La particule voit tout au long du chemin un champ magnétique nul, et pourtant elle subit un effet
magnétique visible dans sa phase, c’est l’effet Aharonov-Bohm.
2.2.2
Retour sur l’épistémologie du magnétisme
L’effet Aharonov-Bohm induit un questionnement difficile sur l’interprétation ontologique de l’électromagnétisme, c’est à dire sur la recherche de l’entité porteuse du sens physique, de l’objet fondamentale de
l’électromagnétisme, de l’essence de la théorie physique. Comme on l’a déjà évoqué la champ magnétique
est généralement considéré comme la bonne entité physique, car contrairement au potentiel, il est défini
de manière univoque. Le problème de cette interprétation est que l’électron ne voie jamais qu’un champ
magnétique nul. Si le champ magnétique B est porteur du sens physique, la logique serait qu’aucun effet
magnétique ne serait mesurable sur une particule qui ne rencontre que des champs nuls. Or ce n’est pas le cas.
Si on admet que le potentiel A est le porteur du sens physique, alors l’interprétation est cohérente avec l’effet
Aharonov-Bohm, sauf que la définition de l’objet fondamental est soumise à un choix arbitraire,
ce qui n’est
H
−1
pas très satisfaisant. Une autre possibilité est de considérer la boucle de Wilson W (C) = eı~ q C A comme la
bonne entité physique. Ce serait cohérent avec l’effet Aharonov-Bohm (c’est d’ailleurs l’entité qui apparaît
explicitement dans l’effet), et cela nous donne un objet défini de manière univoque. Le défaut majeur de ce
point de vue est que cet objet est non-local (car définie sur un chemin et non en un point). Or comme la
théorie des champs avait été précisément introduite pour donner une interprétation locale des interactions
à distance, on a là un retour en arrière – il faut néanmoins noter, qu’avec l’émergence de la mécanique
quantique, la notion de physique non-locale n’est plus aussi choquante pour les physiciens d’aujourd’hui que
pour ceux des siècles antérieurs au XXème –.
Une possibilité serait de considérer la classe de cohomologie de Deligne [0, A]D = [A]d comme la bonne entité
physique. Elle permet d’interpréter l’effet Aharonov-Bohm, est locale et est définie de manière univoque.
Le seul problème est que ce n’est pas à proprement parlé un champ, et donc une entité concrète. En tant
que classe, c’est une entité quelque peu abstraite. On pourrait presque la considérer comme n’étant pas
une interprétation réaliste objectiviste, mais comme une interprétation réaliste pythagoricienne tant [0, A]D
est lié à la symétrie de jauge. On notera néanmoins que l’on a déjà l’habitude de considérer des classes
d’équivalence comme des objets physiques en mécanique quantique. L’état d’un système est en effet la classe
[ψ] = {eıφ ψ, φ ∈ R} puisque la phase n’a pas de sens physique (seule la différence de phase à un sens). Plus
encore, lorsque l’on dit que ψ est une fonction de carré sommable, on oublie que l’on considère en fait non
pas ψ comme état quantique mais la classe des fonctions presque partout égales à ψ (si on change la valeur
ψ en des points isolés 1 on ne change pas les probabilités de présence). Il en est de même pour les densités
de probabilité en général. Ces exemples supposent tout de même que l’on attribue à la fonction d’onde en
mécanique quantique ou aux densités de probabilité en général, un caractère ontologique ; ce qui ne va pas
de soi.
Il n’y a pas de réponse tranchée quant à la question du choix de l’entité porteuse du sens physique, celui-ci
doit être considéré comme une posture philosophique sur ce qu’est la nature de l’électromagnétisme et pas
comme un fait établi. Le choix d’une des quatre postures (ou d’un total agnosticisme) est tout à fait respectable, il faut juste connaître ce que l’on gagne en le faisant et surtout ce à quoi l’on renonce. Pour finir, on
donne un tableau résumant les différentes postures et ce qu’elles apportent en terme d’interprétation :
1. en fait sur un ensemble de mesure de Lebesgues nulle
25
2.3. LA NOTION D’HOMOTOPIE
Le champ magnétique B est
la quantité physique fondamentale
Le potentiel magnétique A
est la quantité physique fondamentale
La boucle de Wilson W (C)
est la quantité physique fondamentale
La classe de cohomologie de
Deligne [0, A]D est la quantité physique fondamentale
Il n’y a pas d’objets fondamentaux en physique, seule
la symétrie de jauge est porteuse du sens physique (interprétation réaliste pythagoricienne)
La physique n’a avoir
qu’avec les résultats expérimentaux, la recherche de
la nature d’une “réalité” est
en dehors du champ de la
physique qui ne s’intéresse
qu’au pouvoir prédictif
d’une théorie (interprétation instrumentaliste)
La chose en soi étant par
nature essentiellement inconnaissable (ou si c’est le
cas elle ne peut être que
de nature mentale), l’électromagnétisme n’est qu’une
représentation de la nature et n’a aucune valeur
ontologique (interprétation
idéaliste, positiviste, Kantienne)
Fournit une interprétation
locale des phénomènes
magnétiques
Fournit un objet porteur
du sens physique défini de
manière univoque
Permet d’interpréter l’effet
Aharonov-Bohm
oui
oui
non
oui
non
oui
non
oui
oui
oui
oui
oui
oui
∅
oui
∅
∅
∅
agnostique
∅
agnostique
Le symbole ∅ signifie que la question n’a pas sens dans l’interprétation considérée.
2.3
2.3.1
La notion d’homotopie
Le groupe d’homotopie et l’effet Aharonov-Bohm
Considérons un chemin Ca qui n’entoure pas le tube. Alors par le théorème de Stokes :
ZZ
I
B=0
A=
w(Ca ) =
Ca
S
où ∂S = C.
Comme on l’a déjà vu, si on transporte l’électron le long d’un cercle Cb du plan (Oxy), de centre O et de
rayon rb et orienté dans le sens direct on a
w(Cb ) = µ0 νIπa2
Si on le transporte en sens suivant le même chemin mais en sens inverse, la boucle de Wilson est
w(Cb−1 ) = −µ0 νIπa2
26
CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE
Si on le transporte en lui faisant suivre deux fois le cercle :
w((Cb )2 ) = 2µ0 νIπa2
Soit Cc un chemin quelconque du plan (Oxy) entourant une fois le solénoïde comme sur la figure ci-dessous.
Soit Cd un cercle de centre O à l’intérieur de Cc (et entourant le solénoïde) et soit Sc la surface (grisée sur
la figure) délimitée par Cc et Cd (les orientations de Cc , Cd et Sc indiquées sur la figure sont cohérentes entre
elles). Par le théorème de Stokes, on a
ZZ
B = w(Cc ) + w(Cd )
Sc
or B = 0 à l’extérieur du solénéoïde, donc
w(Cc ) = −w(Cd ) = µ0 νIπa2
Soient Ce et Cf deux chemins quelconques du plan (Oxy) entourant chacun une fois le solénoïde et ayant un
point M en commun (comme sur la figure ci-dessous).
On note Ce ◦ Cf le chemin consistant à transporter l’électron le long de Ce depuis M , puis une fois revenu en
M , à le transporter le long Cf . La boucle de Wilson est alors
w(Ce ◦ Cf ) = 2µ0 νIπa2
On voit donc avec ces différents exemples que d’une manière générale, pour un chemin C, la boucle de Wilson
est
w(C) = nC µ0 νIπa2
où nC ∈ Z est le nombre de tours orientés que fait C autour du solénoïde.
Soit LM l’ensemble des chemins orientés fermés (les boucles) du plan (Oxy) passant par le point M et
ne passant pas par le solénoïde. ∀Cα , Cβ ∈ LM , ∀n ∈ N∗ , on note :
– Cα ◦ Cβ le chemin consistant à parcourir depuis M , Cα puis Cβ .
– (Cα )−1 le même chemin que Cα mais parcouru en sens inverse.
– (Cα )n le chemin Cα parcouru n fois ((Cα )n = Cα ◦ ... ◦ Cα ).
– (Cα )−n = ((Cα )n )−1 le chemin Cα parcouru n fois en sens inverse.
– 1M le chemin consistant à rester sur le point M (1M ◦ Cα = Cα , Cα ◦ (Cα )−1 = 1M ).
L’application π : LM → Z telle que π(C) = nC est un homomophisme de groupe, i.e.
π((Cα )p ◦ (Cβ )q ) = pπ(Cα ) + qπ(Cβ )
π1 (R2 \ DS ) ≡ π(LM ) = Z est appelé groupe d’homotopie de la région accessible à l’électron R2 \ DS (DS
est le disque section du solénoïde). Pour un chemin donné C, π(C) est dite classe d’homotopie de C. L’effet
Aharonov-Bohm est donc une mesure directe de la classe d’homotopie du chemin sur lequel on transporte
l’électron.
2.3. LA NOTION D’HOMOTOPIE
2.3.2
27
Sur les groupes d’homotopie
Définition 3 (Chemins homotopes). Deux chemins fermés (deux boucles) sur une variété M sont dits
homotopes (appartenant à la même classe d’homotopie) si on peut déformer continuement l’un en l’autre.
Définition 4 (Groupe d’homotopie). Soit M une variété connexe (d’un seul tenant). Le groupe d’homotopie
de M , π1 (M ), est l’ensemble des classes de boucles homotopes sur M .
Dans une variété “sans trou”, comme R2 , toutes les boucles sont homotopes à la boucle identité (on
peut toujours contracter continuement une boucle en un point). Par conséquent ces variétés ont un groupe
d’homotopie trivial. π1 (R2 ) = {0}. On dit que ces variétés sont simplement connexes.
Si on considère une variété avec un trou, comme R2 \ D (où D est un domaine simplement connexe, le
passage d’un tube de flux magnétique – un solénoïde – dans l’effet Aharonov-Bohm, la région interdite à
l’électron), alors on a π1 (R2 \ D) = Z. On dit que ces variétés sont infiniment connexes.
On remarquera que π1 (R3 \ (D × R)) = Z (où D × R est un cylindre infini – le solénoïde –). Par contre
π1 (R3 \ B 2 ) = {0} (où B 2 est une boule), car on peut toujours déformer un chemin autour d’une sphère
pour le contracter en un point (d’ailleurs il n’existe pas de flux magnétique ayant la géométrie d’une sphère !).
Avec deux tubes de flux magnétique (deux trous), on a π1 (R2 \ (D1 ∪ D2 )) = Z ⊕ Z (les régions D1 et
D2 sont supposées disjointes). Dans ce cas, π1 (C) = (n1C , n2C ) où n1C est le nombre de tours orientés que fait
C autour de D1 et où n2C est le nombre de tours orientés que fait C autour de D2 .
À la place d’un solénoïde infini, on considère maintenant un bobine toroïdale. Pour simplifier, considérons
seulement des boucles sur une enveloppe en forme de tore, notée T 2 , entourant la bobine toroïdale. La variété
T 2 a un genus (un “trou de donut”). On a alors π1 (T 2 ) = Z ⊕ Z. Dans ce cas, π1 (C) = (n1C , n2C ) où n1C est le
nombre de tours orientés que fait C autour de la section du tore et où n2C est le nombre de tours orientés que
fait C autour de l’âme du tore (le cercle générateur au centre du tore).
Le tore T 2 peut être vu comme un rectangle dont a identifié les côtés deux à deux (avec la même orientation).
Sur ces graphes, on a dessiné un chemin de classe d’homotopie (1, 2).
On peut considérer un objet plus exotique, le plan projectif réel RP 2 . Celui-ci est obtenu comme le tore
par identification des côtés d’un rectangle deux à deux, mais en renversant ceux-ci.
Sur ce graphe du plan projectif réel RP 2 on a dessinées deux boucles, une contractible en un point (de
classe d’homotopie nulle) en trait plein ; et une qui ne l’est pas en pointillés. Lorsqu’elles font une fois le tour
de RP 2 les boucles ne sont pas contractibles. Par contre, une boucle qui fait deux fois le tour de RP 2 est
contractible en un point.
28
CHAPITRE 2. L’EFFET AHARONOV-BOHM ET HOMOTOPIE
Ce graphe représente la déformation d’une boucle qui fait deux fois le tour de RP 2 : trait plein → pointillés
serrés → pointillés moyens → pointillés lâches → réduit au point M . On a donc π1 (RP 2 ) = Z/2Z = {0, 1}.
Pour une boucle C, π(C) = 0 si elle fait un nombre pair de tours autour de RP 2 , et π(C) = 1 si elle fait un
nombre impair de tours autour de RP 2 . On dit que RP 2 est doublement connexe.
Le groupe d’homotopie π1 (M ) n’est en général pas abélien (sur certaines variétés bizarres π(C1 ) ∗ π(C2 ) 6=
π(C2 ) ∗ π(C1 ) où ∗ est la loi de groupe notée “+” quand π1 (M ) était construit à partir de Z). On note H1 (M )
l’abélianisation de π1 (M ) (les éléments de H1 (M ) sont les classes d’équivalence de pi1 (M ) pour la relation
π(C1 )∗ π(C2 ) ∼ π(C2 )∗ π(C1 )). Dans les cas les plus courants π1 (M ) = H1 (M ) (lorsque le groupe d’homotopie
est au départ abélien). H1 (M ) est appelé groupe d’homologie de de Rham de M (de degré 1), il s’agit du
groupe dual du groupe de cohomologie de de Rham H 1 (M ) (dualité induite par l’intégration et le théorème
de Stokes). On pourrait définir π2 (M ) et H2 (M ) en considérant les déformations continues des surfaces et
ainsi de suite...
Chapitre 3
Le transport adiabatique et holonomie
3.1
3.1.1
Contrôle quantique
Problèmes de contrôle quantique
On parle de contrôle quantique lorsqu’on peut agir sur un système quantique par un appareillage pour
~ par
essayer de contrôler l’état quantique du système. Par exemple, le contrôle de l’orientation d’un spin S
~
un champ magnétique B est associé à l’Hamiltonien :
~ =S
~ ·B
~
H(B)
~
En faisant varier dans le temps le champ magnétique t 7→ B(t),
on a une dynamique engendrée par t 7→
~
H(B(t)). D’une manière générale, un problème de contrôle se présentera comme décrit par un Hamiltonien
autoadjoint dépendant de paramètres classiques x = (x1 , ..., xn ), les paramètres que l’on peut faire varier à
notre guise pour contrôler le système. L’ensemble des paramètres accessibles forment la variété de contrôle
M . Dans notre exemple, si l’intensité du champ magnétique est gardée constante, alors M est une sphère
~
décrivant les différentes directions de polarisation de B.
Les problèmatiques de contrôle se présentent alors sous la forme suivante : sachant que l’état initial du
système est ψin , quelle doit être le chemin C à suivre dans M et à quelle vitesse, pour que la solution de
l’équation de Schrödinger ψ(t) :
ı~
dψ
= H(x(t))ψ(t)
dt
ψ(0) = ψin
(avec t 7→ x(t) formant C dans M ), soit telle que ψ(T ) = ψtarget (T durée du contrôle). L’état cible ψtarget
étant un objectif prédéfini.
3.1.2
L’approximation adiabatique
Les paramètres de contrôle étant classiques, ceux-ci vont varier lentement par rapport au temps propre
quantique (temps caractéristique de transition d’un état propre vers un autre). Dans ces conditions, on peut
appliquer un théorème adiabatique. Un tel théorème stipule le résultat suivant :
Soient {λb (x)}b et {φb (x)}b les valeurs et vecteurs propres de H(x).
H(x)φb (x) = λb (x)φb (x)
Soit λa (x) une valeur propre non-dégénérée ∀x ∈ M (on ne traitera pas ici le cas des valeurs propres
dégénérées). On suppose que ψin = φa (x(0)). Alors si les variations de x(t) sont suffisamment lentes, ψ(t)
solution de l’équation de Schrödinger reste toujours projetée sur φa (x) :
∀t,
ψ(t) = eıϕ(t) φa (x(t))
Il existe de nombreux théorèmes adiabatiques dans la littérature. On ne donnera ici aucun de ceux-ci, mais
un raisonnement heuristique.
29
30
CHAPITRE 3. LE TRANSPORT ADIABATIQUE ET HOLONOMIE
Les vecteurs propres formant une base de l’espace de Hilbert, on peut décomposer la fonction d’onde sur
celle-ci à chaque instant :
X
ψ(t) =
cb (t)φb (x(t))
b
avec cb (t) = hφb (x(t))|ψ(t)i. On injecte cette expression dans l’équation de Schrödinger.
ı~
dψ
= Hψ
dt
⇐⇒
⇐⇒
X
ċb φb +
b
X
b
X
b
cb φ̇b = −ı~−1
ċb φb = −ı~−1
X
b
X
cb Hφb
b
cb λb φb −
X
cb φ̇b
b
On projette cette dernière équation sur φd (d 6= a) (les vecteurs propres étant orthonormés hφd |φb i = δdb ) :
X
ċd = −ı~−1 cd λd −
cb hφd |φ̇b i
b
En dérivant Hφa = λa φa on a
Ḣφa + H φ̇a = λ̇a φa + λa φ̇a
et en projetant sur φd
par conséquent
hφd |Ḣ|φa i + λd hφd |φ̇a i = λa hφd |φ̇a i
hφd |φ̇a i =
=
hφd |Ḣ|φa i
λa − λd
∂H
ẋµ
hφd | µ |φa i
∂x
λa − λd
d|
= τab est le temps caractéristique de transition de l’état φa vers l’état φd . Ainsi |λa −λ
= τ1ab = ωab
~
est la pulsation de la transition que l’on peut assimiler à la vitesse de transition de l’état φa vers l’état φd .
ẋµ est la vitesse de variation du paramètre de contrôle xµ . L’hypothèse adiabatique consiste à poser que
la vitesse de variation des paramètres de contrôle est lente devant la vitesse de transition quantique, i.e.
ωab ≪ ẋµ et donc
hφd |φ̇a i ≃ 0
~
|λa −λd |
Il faut noter que cette hypothèse implique qu’il doit rester un gap non-nul entre λa et les autres valeurs
propres (ce qui suppose qu’aucun croisement de valeur propre n’est rencontré durant l’évolution, i.e. λa reste
tout au long de l’évolution non-dégénérée).
On a donc au final
X
ċd = −ı~−1 cd λd −
hφd |φ̇b icb
b6=a
donc
cd (t) =
X
Udb (t)cb (0)
b6=a
où U est la “matrice” solution de l’équation U̇ = −(ı~−1 Λ − Φ)U , avec U (0) = 1 et Λdb = λb δdb et Φdb =
hφd |φ̇b i. Or ∀b 6= a, cb (0) = 0, donc ∀d 6= a, cd (t) = 0.
3.2
3.2.1
Le transport adiabatique et la phase géométrique
Fonction d’onde dans l’approximation adiabatique
Comme vu précédemment, dans les conditions de l’approximation adiabatique on a
ψ(t) = eıϕ(t) φa (x(t))
En injectant cette expression dans l’équation de Schrödinger on trouve
ıϕ̇eıϕ φa + eıϕ φ̇a = −ı~−1 eıϕ λa φa
31
3.3. LA THÉORIE DE JAUGE ADIABATIQUE
En projetant cette équation sur φa , on trouve
ıϕ̇ = −ı~−1 λa − hφa |φ̇a i
et donc
ψ(t) = e−ı~
3.2.2
−1
Rt
0
λa (x(t′ ))dt′ −
Rt
0
hφa |φ̇a idt′
φa (x(t))
La phase géométrique
On pose A ∈ Ω1 M la 1-forme définie par
A(x) = ıhφa (x)|d|φa (x)i = ıhφa (x)|
On a donc
Z
R
T
0
hφa |φ̇a idt = −ı
Z
∂
|φa (x)idxµ
∂xµ
A
C
La phase eı C A ne dépend donc pas de T le temps écoulé lors Rdu contrôle, mais seulement de la forme du
−1 T
chemin C dans M . On l’appelle donc phase géométrique (e−ı~ 0 λa (t)dt porte le nom de phase dynamique).
Pour un chemin fermé x(T ) = x(0), on a donc
ψ(0) =
φa (x(0))
ψ(T ) =
e−ı~
−1
RT
0
λa (x(t))dt ı
e
H
C
A
φa (x(0))
La forme de cette équation est similaire à celle du transport d’une particule dans un champ magnétique. A qui
est appelé potentiel de Berry, joue le rôle du potentiel magnétique. On parle alors de transport adiabatique.
On ne transporte pas ici une particule dans l’espace physique, mais l’état quantique du système dans la
variété de contrôle M .
3.3
3.3.1
La théorie de jauge adiabatique
L’exemple du spin dans un champ magnétique
~ = (x1 , x2 , x3 ) et donc décrit par l’hamiltonien
On considère un spin contrôlé par un champ magnétique B
~ i
~
x3
x1 − ıx2
~
~
H(x) = B · S = x σi =
x2 + ıx2
−x3
2
2
Le spectre instantané de H(x) est
p
λ± (x) = ± (x1 )2 + (x2 )2 + (x3 )2 = ±r
Le point r = 0 est interdit pour le transport adiabatique car il correspond à des valeurs propres dégénérées.
On introduit les angles
p
(x1 )2 + (x2 )2
x2
θ = arctan
ϕ
=
arctan
x3
x1
r est l’intensité du champ magnétique de contrôle, et (θ, ϕ) sont les angles (en coordonnées sphériques) de la
direction de polarisation du champ magnétique de contrôle. On considère le transport adiabatique de l’état
d’énergie λ+ (x). Un vecteur propre possible est
1
r + x3
cos θ2
N
p
=
φ+ (x) =
x1 + ıx2
eıϕ sin θ2
2r(r + x3 )
On remarque que ce choix de convention de phase (qui est arbitraire), induit un facteur de normalisation
qui est singulier au pôle sud (x1 = 0, x2 = 0, x3 < 0) On choisit donc de n’utiliser ce choix que sur une
carte locale U N restreinte à l’hémisphère nord (et dépassant un petit peu de l’équateur). L’autre convention
possible est
1
−ıϕ
1
x − ıx2
e
cos θ2
=
φS− (x) = p
r − x3
sin θ2
2r(r − x3 )
32
CHAPITRE 3. LE TRANSPORT ADIABATIQUE ET HOLONOMIE
La convention induit maintenant un facteur de normalisation singulier au pôle nord (x1 = 0, x2 = 0, x3 > 0),
on ne l’applique donc que sur une carte locale U S restreinte à l’hémisphère sud (et dépassant légèrement de
l’équateur). Ce problème montre qu’en général, avec un hamiltonien dépendant de paramètres, on ne peut
pas fixer le même choix de convention des vecteurs propres sur la totalité de l’espace des paramètres de
contrôle. Il est nécessaire d’utiliser un système de cartes locales.
À l’intersection des deux cartes, on a un changement de phase
S
−ıϕ
g N S (θ, ϕ) = hφN
+ |φ+ i = e
Le générateur de la phase géométrique est alors sur U N :
1 x2 dx1 − x1 dx2
1
= − (1 − cos θ)dϕ
3
2 r(r + x )
2
N
AN (x) = ıhφN
+ |d|φ+ i =
et sur U S
AS (x) = ıhφS+ |d|φS+ i = −
À l’intersection des deux cartes, on a alors
1 x2 dx1 − x1 dx2
1
= (1 + cos θ)dϕ
2 r(r − x3 )
2
AN − AS = dχN S = −dϕ
Comme pour les exemples de l’électromagnétisme, la fonction χN S = −ϕ est multivaluée car ϕ = 0 et ϕ = 2π
correspondent au même point physique. Il faut donc scinder les cartes, avec U α dans le quart nord est, U β
dans le quart nord ouest, U γ dans le quart sud est et U δ dans le quart sud ouest. On a alors χαγ = −ϕ|U α ∩U γ
et
χβγ − χαγ + χαβ = −2π
On a donc une théorie de jauge de dégré 2 non triviale, avec un champ
F = dAN = dAS = −
1
1 x1 dx2 ∧ dx3 + x2 dx3 ∧ dx1 + x3 dx1 ∧ dx2
= − sin θdθ ∧ dϕ
3
2
r
2
appelé courbure adiabatique.
Pour une courbe fermée C complètement inscrite dans l’hémisphère nord, la phase géométrique du transport
adiabatique est donc
H
RR
N
eı C A = eı S F
en utilisant le théorème de Stokes et avec ∂S = C. De plus
eı
RR
S
F
ı
= e− 2
RR
S
sin θdθ∧dϕ
ı
= e− 2 ΩC
où ΩC est l’angle solide sous lequel on voit C depuis le point r = 0.
Le transport adiabatique est semblable au transport d’une particule dans un champ magnétique, mais n’est
pas tout à fait similaire à l’effet Aharonov-Bohm. La phase associée à une chemin C ne dépend pas seulement
de la classe d’homotopie du chemin mais de toute sa géométrie (si on déforme le chemin, on change l’angle
solide sous lequel il est vu).
3.3.2
Cas général
La théorie de jauge du transport adiabatique est dans le cas général liée au fait que l’on ne peut pas avoir
une convention de phase continue sur tout l’espace des paramètres de contrôle M . On doit donc introduire
un système de cartes locales, avec
∀x ∈ U α ,
α
H(x)φα
a (x) = λa (x)φa (x)
et à l’intersection entre deux cartes, un changement local de phase
∀x ∈ U α ∩ U β ,
αβ
hφα (x)|φβ (x)i = eıχ
ce qui induit une théorie de jauge de degré 2 non-triviale, avec
α
Aα = ıhφα
a |d|φa i
(x)
33
3.3. LA THÉORIE DE JAUGE ADIABATIQUE
Aβ − Aα = dχαβ
F = dAα
H
La phase géométrique sur un chemin fermé eı C A (la boucle de Wilson) est appelée en mathématique
holonomie du potentiel de Berry. L’ensemble des classes de boucles qui ont la même holonomie forme le
groupe d’homotopie fine π11 (M ) de M .
Théorème 4 (Théorème de Wu-Yang-Alvarez). La circulation d’un potentiel d’une théorie de jauge de degré
2, compatible avec le théorème de Stokes en exponentielle, est telle que :
Soit C : xi → xf un chemin traversant deux cartes U α et U β , et Aα/β le potentiel de la théorie de jauge.
Alors
Z xf
Z
Z xαβ
Aβ
Aα + χαβ (xαβ ) +
A=
xαβ
C
xi
R
où xαβ ∈ U α ∩ U β ∩ C est un point arbitraire de C à l’intersection des deux cartes. C A ne depend pas de ce
choix arbitraire.
Preuve : On considère une surface orientée S de bord C. La définition de la circulation de A le long de
C doit pour être compatible avec le théorème de Stokes vérifier
eı
RR
S B
= eı
H
CA
S
On décompose S en une multitude de petites surfaces {σ α }α telles que σ α ⊂ U α , α σα = S et telles
que pour deux surfaces contiguës σ α ∩ σ β = eαβ soit un chemin morceau des bords de σ α et σ β . Pour une
surface σ α à la limite de S, on note eα la partie de son bord qui se confond avec C. Pour trois surfaces
contiguës, on note xαβγ = σ α ∩ σ β ∩ σ γ = eαβ ∩ eβγ ∩ eαγ le point de rencontre des bords des trois
surfaces. Pour deux surfaces contigües à la limite de S, on note xαβ = σ α ∩ σ β = eα ∩ eβ le de C entre
les deux surfaces.
Par le théorème de Stokes, on a
ZZ
X ZZ
X I
B=
B=
Aα
S
σα
σ α ⊂S
σ α ⊂S
∂σ α
Pour deux surfaces contiguës σ α et σ β , on a eαβ = (∂σ α ) ∩ (∂σ β ), mais eαβ est parcouru en sens inverse
←
−
←
−
←
−←
−
d’une surface à l’autre : ↓ ↑↓ ↑=↓ ↑. Ainsi la contribution de eαβ est
→
−
→
−
→
−→
−
Z
Z
(Aβ − Aα ) =
dχαβ = χαβ (xαβγ ) − χαβ (xαβδ )
eαβ
α
eαβ
β
où on a supposé que σ et σ étaient contiguës à σ γ à une extrémité de eαβ et à σ δ à l’autre.
Pour trois surfaces contiguës, σ α , σ β et σ γ , on voit donc que la contribution du point xαβγ est
χβγ (xαβγ ) − χαγ (xαβγ ) + χαβ (xαβγ ) = 2πz αβγ
avec z αβγ ∈ Z (un indice de non-trivialité). Au final, ne reste que les contributions des points de rencontre
entre surfaces, des bords des surfaces se confondant avec C et des points entre ces bords :
eı
RR
S B
= eı
P
α
eα A
eı
P
xαβ
χαβ (xαβ )
P αβγ
2πı
z
|e {z
}
=1
Ce qui prouve la première partie du théorème.
Il reste à prouver que cette expression en dépend du choix arbitraire de la décomposition. Soit xαβ , y αβ ∈
U α ∩ U β ∩ C. On utilise la relation de Chasles :
Z
Z y αβ
Z xαβ
Z
Z y αβ
Z xαβ
Aα + χαβ (y αβ ) +
Aα +
Aα + χαβ (y αβ ) +
Aβ +
Aβ =
Aβ
xαβ
y αβ
=
=
=
=
Z
xαβ
Z
xαβ
Z
xαβ
Z
xαβ
Aα + χαβ (y αβ ) +
Aα + χαβ (y αβ ) +
y αβ
Z
Z
xαβ
(Aβ − Aα ) +
y αβ
xαβ
dχαβ +
y αβ
Z
xαβ
Z
Aβ
xαβ
Aβ
xαβ
Aα + χαβ (y αβ ) + χαβ (xαβ ) − χαβ (y αβ ) +
Aα + χαβ (xαβ ) +
Z
Aβ
xαβ
Z
Aβ
xαβ
Téléchargement