PARTICULES ET NOYAUX Physique des particules Cours donné

publicité
Version 1.20
6 juillet 2001
PARTICULES ET NOYAUX
Physique des particules
Cours donné par Martin Pohl
Assistant: Lorenzo Moneta
Université de Genève
Été 2001
ii
1
Chapitre 1
Introduction
Le but de la physique des particules est aussi simple à formuler que difficile à atteindre:
il s’agit de comprendre tout l’univers par ses propriétés microscopiques. L’univers, à l’échelle
microscopique, contient principalement le vide – l’espace-temps – peuplé par la matière et les
forces. Pour approcher une compréhension générale de l’univers, mission évidemment impossible, les hypothèses suivantes sont généralement faites aujourd’hui:
– La matière consiste en un nombre limité de catégories de particules élémentaires, qui sont
identifiées par leur masse unique et leurs propriétés vis-à-vis des forces, c’est à dire par
leurs nombres quantiques. Une particule dite élémentaire n’a pas de structure intérieure,
c’est ‘a dire qu’elle correspond à un point dans l’espace-temps.
– Il y a un nombre limité de forces qui agissent entre les constituants de la matière. Dans
le cas idéal, celles-ci seraient juste des manifestations d’une seule force universelle.
– Forces et matière évoluent dans le vide, l’espace-temps à quatre dimensions. Le vide sert
à paramétriser le mouvement des particules mais intervient aussi, comme partenaire actif,
dans les interactions entre et avec eux.
– L’homme, qui fait lui-même partie de ce système dynamique, arriverait néanmoins à
comprendre son fonctionnement, grâce à la méthode de l’expérience scientifique et de sa
description mathématique.
La dernière hypothèse étant évidemment la plus contestable, tout ce programme manque complètement de cette modestie qui convient au scientifique comme à tous et à chacun. S’il devait
jamais se réaliser, il ne faudrait pas seulement que tout l’univers se décrive par quelques propriétés irréductibles, mais aussi que l’on arrive à traduire ces propriétés et lois du monde
microscopique à des dimensions qui caractérisent le macrocosme. Aussi contestable que soit ce
programme, on va toutefois l’adopter pour le moment pour voir jusqu’où on arrive.
Matière:
Dans le scénario de la physique des particules d’aujourd’hui, la matière consiste en particules,
qui sont des Fermions de spin un demi. Une liste des particules élémentaires connues à ce jour
est donnée dans le Tableau 1.1.
Pour chaque particule il existe une antiparticule, identique en masse, mais avec tous les
nombres quantiques représentant une charge inversés. Matière et antimatière peuvent s’annihiler
mutuellement et se convertir en énergie. Inversement, si suffisamment d’énergie est concentrée
dans une petite région d’espace-temps, matière et antimatière seront produites en quantité
égale.
CHAPITRE 1. INTRODUCTION
2
Tab. 1.1 – Particules de matière et de force avec quelques-uns de leurs nombres quantiques.
Pour chaque particules il y a une antiparticule, de même masse, mais avec toutes leurs charges
inversées.
Nom
Spin
Leptons:
e,µ,τ
1/2
νe ,νµ ,ντ
1/2
Quarks:
u, c, t
1/2
d, s, b
1/2
Bosons de jauge:
γ
1
Z0 , W±
1
Gluons
1
Vide
0
Nombre baryonique
Nombre leptonique
Charge électr.
0
0
1
1
−1
0
1/3
1/3
0
0
+2/3
−1/3
0
0
0
0
0
0
0
0
0
0,±1
0
0
En raison de leur propriétés similaires, on peut organiser les particules de la matière en un
système périodique, comme dans le Tableau 1.2. Les particules se regroupent en quatre familles
qui se distinguent par leur fonction: leptons chargés, neutrinos, quarks du type up et quarks
du type down. Ils ont des types de charges différents et ainsi sont soumis à différents types de
forces. En ce qui concerne la première génération, le lepton chargé, l’électron, figure dans l’atome
comme porteur de ses propriétés chimiques. Lui et le neutrino, le lepton neutre, apparaissent
dans les désintégrations radioactives. Et les quarks up et down sont les constituants des protons
et neutrons qui forment les noyaux.
Chaque famille s’étend sur trois générations, dont les membres se distinguent par leur masse
ainsi qu’un nombre quantique génériquement appelé flavor, mais qui subissent les mêmes forces.
Toutes les interactions sauf les interactions faibles chargées conservent le flavor. Ainsi, les leptons chargés et neutres de chaque génération sont produits en paires particule/antiparticule
par les interactions électromagnétiques et faibles neutres: e+ e− , νe ν̄e , uū, dd̄, mais non pas
e+ µ− , νµ ν̄τ , uc̄ ou sb̄. Les interactions fortes génèrent également des quarks en paires particule/antiparticule, tout en respectant un autre nombre quantique conservé, appelé color. Les
interactions faibles chargées peuvent convertir les particules d’une génération à une autre.
Pour les quarks ceci est un effet connu depuis longtemps. Pour les leptons, seules les indications expérimentales d’oscillations entre neutrinos de différentes générations indiquent un effet
semblable mais beaucoup plus faible. Par contre, le nombre total de leptons et de quarks est
strictement conservé par toutes les forces connues jusque là. Ceci correspond à deux nombres
quantiques séparément conservés, le nombre baryonique et le nombre leptonique, attribués
comme montré dans le Tableau 1.1 pour la matière et négatif pour l’antimatière. Ainsi un
proton, par exemple, qui contient principalement les quarks uud, a le nombre baryonique +1,
tandis que l’antineutron, qui contient les quarks ūd̄d̄, a le nombre baryonique −1.
Les masses des particules dans le tableau de la matière ont tout pour nous surprendre.
L’éventail s’étend de la masse des neutrinos, très faible et probablement dans les millielectronvolt, jusqu’au quark top qui est aussi lourd qu’un noyau de Hafnium. Les quelques particules
dans le Tableau 1.2 suffisent pour constituer tout les particules observés jusque là et que l’on
trouve dans la publication du Particle Data Group, l’autorité mondiale dans la domaine. Son site
3
Tab. 1.2 – Système périodique des composants de la matière. Les générations de chaque famille
ont les mêmes constantes de couplage, donc ils subissent les mêmes forces. Ils se distinguent
par leur masse ainsi qu’un nombre quantique génériquement appelé flavor.
Génération
Famille
1 2 3
Neutrinos
νe νµ ντ
Leptons
e µ τ
Quarks up
u c
t
Quarks down d s b
web, http://www.cern.ch/pdg, met à disposition une liste exhaustive des particules observées
(et non-observées), qui est régulièrement mise à jour, ainsi qu’une liste de leur propriétés.
Forces:
La mécanique quantique, caractérisée par l’équation de Schrödinger et ses solutions, décrit le
mouvement non-relativiste des particules dans un champ extérieur. Elle ne décrit pas comment
un tel champ est généré, ni comment il arrive à interagir avec la particule en question. C’est
cette question que se propose d’élucider théorie des champs quantique. Le mécanisme de base
de la transmission de force est l’émission de quanta du champ, des bosons de spin 1, par les
particules de matière. La Figure 1.1 représente ce processus par l’exemple d’un électron qui émet
un photon, changeant ainsi son impulsion. On verra plus tard comment résoudre le problème
de conservation de l’énergie-impulsion associé a ce processus. Pour le moment, il nous suffit
d’accepter que les champs sont transmis d’un endroit à un autre par des bosons vecteurs. Si le
boson messager est ensuite absorbé par une autre particule, comme le démontre la Figure 1.2,
une impulsion est transmise entre les deux particules, l’un a donc exercé une force sur l’autre.
Il est claire que l’échange d’une seule particule n’est qu’une première approximation de la vraie
interaction entre deux particules.
e(E ,p )
e(E,
p)
-
γ(k0 ,k)
Fig. 1.1 – Un électron entrant émet un photon.
La Figure 1.3 montre les quatre forces qui peuvent être représentées de cette manière. La
force électromagnétique est responsable de tant de phénomènes quotidiens, y inclue toute la
chimie. Les forces faibles sont à l’origine de la radioactivité β. Les interactions fortes génèrent
les forces nucléaires.
Il est remarquable que dans ce scénario standard la matière ne consiste que de fermions,
les forces sont transmises exclusivement par des bosons. Cette asymétrie est mise en cause par
CHAPITRE 1. INTRODUCTION
4
e
-
e
γ
e
e
Fig. 1.2 – Diffusion de deux électrons par l’échange d’un boson intermédiaire.
u
e
u
u
-
-
e
-
γ
d
ν
@
-
@
@
@
@
@
W+
u
u
-
γ
e
W+
e
e
@
@
-
@
@
@
Z0
@
Z0
uR
uG
-
gR̄G
Fig. 1.3 – De haut en bas: Les interactions électromagnétiques, faibles chargées et neutres ainsi
que fortes, représentées par les vertex d’émission de leurs bosons. A gauche on représente les
interactions des quarks, à droite celles des leptons, s’ils existent.
1.1. CINÉMATIQUE RELATIVISTE
5
des nouvelles théories, dites supersymétriques, qui postulent des forces fermioniques ainsi que
de la matière bosonique. Cette approche présente des avantages et dans la conception et dans
la pratique, mais aucun effet prédit par une telle théorie ne s’est manifesté expérimentalement
jusqu’à maintenant.
Le mécanisme de transmission de forces, relevé par la théorie quantique des champs, est un
mécanisme tout à fait local. Le boson intermédiaire est émis à un point dans l’espace-temps
bien précis, il se déplace jusqu’à un autre point de l’espace-temps où il est réabsorbé.
Vide:
Il est remarquable que la force la plus longuement connue, celle des interactions gravitationelles, à ce jour ne se décrit pas par les mêmes moyens. La seule théorie connue de la gravitation,
la théorie de la relativité générale, prend une déformation de l’espace-temps lui-même comme
mécanisme de transmission de la force. Ceci est un premier exemple que l’espace-temps, le vide,
n’est pas pour rien dans notre scénario du jeu entre matière et forces. Nous verrons plus tard
que le vide est un lieu où se passent beaucoup des choses: des particules se créent spontanément,
peut-être même une propriété particulière du vide est-elle à l’origine de la création de la masse
de tous les particules.
Avant de nous embarquer dans les détails de ce scénario fascinant des phénomènes microscopiques, nous devons passer en revue quelques outils nécessaires pour comprendre le monde
á haute énergie et a petite échelle.
1.1
Cinématique relativiste
Cette partie du cours va traiter des phénomènes à haute énergie, c’est à dire à des vitesses
qui nécessitent un traitement relativiste. Un événement d’espace-temps, localisé par les coordonnées cartésiennes (t,x), est décrit par un quadrivecteur xµ . La métrique de l’espace vectoriel
associé aux quadrivecteur est définie par la constance de la vitesse de lumière c, constante dans
chaque système inertial. Supposons qu’un rayon de lumière relie deux événements, (t1 ,x1 ) et
(t1 ,x1 ). La distance entre les deux points dans l’espace est toujours proportionnelle au temps
de propagation:
d = (x1 − x2 )2 + (y1 − y2 )2 + (y1 − y2 )2
1
2
= c (t1 − t2 )
(1.1)
Comme la constante de proportionnalité est la même dans chaque système inertial, il en suit
que la norme s d’un quadrivecteur, définie en coordonnées cartésiennes comme
s = ct2 − x2 − y 2 − x2
(1.2)
est indépendante du système de référence. Les transformations de Lorentz, pour l’exemple de
deux systèmes qui se déplacent avec une vitesse v = βc dans une direction parallèle a l’axe x,
donnent
x
y
z
t
=
=
=
=
γ (x − βt)
y
z
γ (t − βx)
donc une rotation dans l’espace-temps qui laisse la norme s invariante.
(1.3)
(1.4)
(1.5)
(1.6)
CHAPITRE 1. INTRODUCTION
6
Plus généralement on appelle quadrivecteurs covariants tous ceux qui se transforment comme
le quadrivecteur xµ de l’espace-temps sous les transformations de Lorentz de l’équation 1.3:
xµ = (x0 ,x1 ,x2 ,x3 ) = (ct,x,y,z)
(1.7)
Un exemple important est le quadrivecteur covariant de l’énergie-impulsion pµ :
E
pµ = (p0 ,p1 ,p2 ,p3 ) = ( ,px ,py ,pz )
c
(1.8)
La norme s est définie par le produit scalaire entre un quadrivecteur covariant et son homologue
contravariant
xµ = (x0 ,x1 ,x2 ,x3 ) = (t, − x, − y, − z)
E
pµ = (p0 ,p1 ,p2 ,p3 ) = ( , − px , − py , − pz )
c
(1.9)
(1.10)
qui sont reliés par l’application du tenseur métrique gµν
xµ = gµν xν
(1.11)
En coordonnées cartésiennes ce tenseur est
⎛
⎜
⎜
⎝
gµν = ⎜
1 0
0
0
0 −1 0
0
0 0 −1 0
0 0
0 −1
⎞
⎟
⎟
⎟
⎠
(1.12)
Le produit scalaire est donc défini comme
s = xµ xµ = x0 x0 + x1 x1 + x2 x2 + x3 x3
(1.13)
en utilisant la convention que les indices quadrivecteurs, symbolisés par les indices grecs, sont
toujours sommés implicitement. En coordonnées cartésiennes cela donne:
xµ xµ = c2 t2 − x2 − y 2 − z 2 = c2 t2 − x2
E2
E2
2
2
2
−
p
−
p
−
p
=
− p2 = m2 c2
pµ pµ =
x
y
z
c2
c2
(1.14)
(1.15)
La norme du quadrivecteur espace-temps définit donc une distance entre deux événements. La
norme du quadrivecteur énergie-impulsion définit la masse de la particule qui évolue.
Exemple 1: Système du laboratoire
Prenons comme exemple une collision entre un projectile de masse m et une cible de masse M
est esquissé dans le Système du laboratoire. Ce système est caractérisé par le fait que la cible y
est au repos, son quadrivecteur énergie-impulsion est donc (M,0). Le quadrivecteur du projectile
soit (E/c,
p). Comme l’énergie et l’impulsion doivent être conservées dans la réaction, il faut
que le quadrivecteur énergie-impulsion total de l’état initial et de l’état final soient les mêmes.
Dans l’état initial on a:
E + Mc2
pµ + k µ =
(1.16)
p
1.2. SYSTÈME D’UNITÉS NATURELS
7
La norme s de ce vecteur correspond au carré de l’énergie totale disponible pour créer l’état
final
2
(1.17)
s = E + Mc2 − c2 p2 = m2 c4 + c2 p2 + 2EMc2 + M 2 c4 − c2 p2
Si le projectile est beaucoup plus légér et énergetique que la cible, m M et E M, on peut
approximer ceci comme
s 2EMc2
(1.18)
Pour avoir une idée des ordres de grandeur, prenons un électron d’impulsion
√ 100 GeV/c incident sur un proton au repos. L’énergie totale du système est de seulement s 14 GeV.
Exemple 2: Système du centre des masses
Comparons ce résultat à une situation où deux particules entrent en collision dans le système
du centre de masse. Ce système est caractérisé par le fait que l’impulsion totale de tous ses
composants est zéro. Donc, les quadrivecteurs des deux particules dans l’état initial sont pµ =
(E,
p) et kµ = (E , − p). Le quadrivecteur total est
pµ + k µ =
est sa norme est
E + E
0
s = (E + E )2
(1.19)
(1.20)
Donc, si l’électron de 100 GeV/c de l’exemple précédent entre en collision
√ avec un proton de
100 GeV/c d’impulsion dans le centre de masse, le système totalise bien s 200GeV .
1.2
Système d’unités naturels
On voit déjà très bien à partir de ces exemples triviaux qu’il est ni pratique ni instructif de
toujours tenir soigneusement compte des constantes comme c dans nos calculs. Les physiciens
des hautes énergies ont donc presque à l’unanimité adopté un système d’unité qui les débarrasse
de deux constantes
h̄ ≡
h
1.055 × 10−34 J s
2π
c 2.998 × 108 m/s
(1.21)
(1.22)
avec les dimensions
ML2
T
L
[c] =
T
[h̄] =
(1.23)
(1.24)
En mettant
h̄ = c = 1
(1.25)
ont définit donc h̄ comme l’unité de l’action et c comme l’unité de vitesse. Avec un léger manque
de rigueur, ceci nous permet de mesurer les masse (m), les impulsions (mc) et les énergies (mc2 )
toutes avec les mêmes unités
[E,M,p] =
ML2
= GeV = 109 eV Mp
2
T
(1.26)
CHAPITRE 1. INTRODUCTION
8
L’unité de base, électronvolt (eV), est définie comme le gain en énergie que fait un électron en
parcourant une différence en potentiel de 1V. Un milliard de ces unités correspond à peu près
à la masse du proton, Mp , et forme ainsi l’échelle naturelle de la physique des hautes énergies.
Le Tableau 1.3 montre quelques facteurs de conversion entre les unités conventionnelles et les
unités naturelles.
Tab. 1.3 – Masse, longueur et temps en unités naturelles.
Quantité
Masse
Longueur
Temps
Facteur de
conversion
1 kg = 5.61 × 1026 GeV
1 m = 5.07 × 1015 GeV−1
1 s = 1.52 × 1024 GeV−1
Unités
naturelles
GeV
GeV−1
GeV−1
Unités
conventionnelles
GeV/c2
h̄c/GeV
h̄/GeV
Dans le système des unités naturelles, la charge électrique est sans dimension
√
[e] = [ h̄c] = [1]
(1.27)
Elle paraı̂tra souvent dans nos discussions sous forme de la constante de structure fine, α, donc
de l’énergie électrostatique de deux électrons à l’unité de la distance divisée par la masse de
l’électron
1 e2
1
e2
4π h̄/mc
α=
(1.28)
=
2
mc
4πh̄c
137
Cette constante n’a donc pas de dimension non plus.
1.3
Transmission des forces et principe de Heisenberg
Regardons donc d’un peu plus près l’émission d’une particule par une autre, mécanisme
proposé pour la transmission des forces. La Figure 1.1 définit les quadrivecteurs de l’énergieimpulsion des partenaires dans la réaction. La conservation de l’énergie et de l’impulsion réclame
que pour µ = 0...3
pµ = pµ + kµ
(1.29)
Pour la longueur de ce quadrivecteur total de l’énergie-impulsion, qui est invariante, on trouve
E 2 − p2 = (E + k0 )2 − (p + k)2
me 2 = me 2 + mγ 2 + 2E k0 − 2pk
(1.30)
(1.31)
Si l’on se base sur des photons réels, qui ont mγ = 0, on trouve alors
E ≤ |p |
(1.32)
en désaccord avec la masse me = 0 de l’électron. Un tel mécanisme est donc uniquement
admissible si le photon émis est virtuel et n’a pas sa masse habituelle.
Pour une particule intermédiaire, dans un processus de diffusion, il est entièrement acceptable qu’elle n’ait pas sa masse habituelle. Le principe de Heisenberg nous dit que la nature
1.3. TRANSMISSION DES FORCES ET PRINCIPE DE HEISENBERG
9
ondulatoire des particules nous empêche de les localiser à mieux qu’une distance ∆x près si
nous connaissons leur impulsion mieux qu’à une impulsion ∆px près, avec
∆x∆px ≥ h
(1.33)
Cette limite principale est applicable à chaque paire de variables canoniquement conjuguées,
donc aussi pour l’énergie et le temps
∆E∆t ≥ h
(1.34)
Pour les particules porteuses de force, qui sont absorbées après un court laps de temps ∆t, l’incertitude sur l’énergie sera donc suffisamment grande pour permettre de respecter les conditions
de l’Equation 1.30.
On retient donc que la relation pµ pµ = m2 est valable pour les particules réelles, mais
n’est pas respectée pour les particules virtuelles. Les variables décrivant l’espace de phase sous
l’aspect particule, c’est à dire. le quadrivecteur (E,
p), sont complètement équivalentes à celles
qui caractérisent l’aspect onde, c’est à dire (ω,k). La trajectoire classique d’un point de masse
n’existe plus, mais est remplacé par la fonction d’onde
√ i(px−Et)
Φ(x) =
Ne
(1.35)
√ =
N cos (kx − ωt) + i sin (kx − ωt)
(1.36)
qui permet de facilement changer entre les deux représentation. Avec la relation p = 1/λ, on voit
que les détails auxquelles un projectile est sensible sont d’autant plus petits que l’impulsion du
projectile est grande. Par exemple, pour étudier la sous-structure du nucléon avec une résolution
spatiale de 0.1 fm, il faut utiliser des particules de plusieurs GeV. Pour assurer que les particules
dites élémentaires dans le Tableau 1.1 sont bien ponctuelles, il faut des faisceaux de particules
bien plus énergétiques encore. Les accélérateurs de haute énergie, et de haute intensité, sont
donc primordiaux pour l’étude du monde à petite échelle.
10
CHAPITRE 1. INTRODUCTION
11
Chapitre 2
Les accélérateurs
Dans ce chapitre 1 on va toucher les bases de la physique pour deux types d’accélérateurs, les
circulaires et les linéaires. les deux se basent bien sûr sur les lois qui gouvernent le mouvement
des particules chargées dans un champ électromagnétiques. La force sur une particule de charge
et magnétique B
est
e dans un champ électrique E
d
p
+ v × B
=e E
dt
(2.1)
Les champs électriques servent donc à accélérer les particules, les champs magnétiques à les
dévier de leur direction initiale, soit pour les stocker dans un anneau, soit pour les focaliser.
Le plus simple mécanisme d’accélération est réalisé pour des électrons dans chaque tube cathodique. Le schéma est montré dans la Figure 2.1: l’électron qui sort d’un filament chauffé est
accéléré par un potentiel V et émis par un trou dans la cathode. L’énergie de l’électron sortant
correspond donc exactement à V GeV. Les accélérateurs électrostatiques enchaı̂nent tout simplement des étages de ce type. Ils sont limités évidemment par la stabilité d’une isolation de
haute tension, donc leur énergie ne dépasse pas quelques MeV. Pour arriver à une plus haute
énergie, il faut que le projectile passe plusieurs fois par un potentiel accélérant.
Fig. 2.1 – Principe d’un accélérateur électrostatique, comme un tube cathodique.
1. Ce chapitre se base sur le matériel du cours Simple Introduction to Accelerators, donné dans le cadre
de l’entraı̂nement académique du CERN par E.J.N. Wilson, cf http://schools.web.cern.ch/Schools/CAS/ATLectures.html
CHAPITRE 2. LES ACCÉLÉRATEURS
12
2.1
Le cyclotron
Le plus simple accélérateur circulaire est le cyclotron, son principe de fonctionnement est
uniforme et constant, une particule
montré dans la Figure 2.2. Dan un champ magnétique B
de charge e se déplace sur un cercle de rayon
ρ=
p
eB
(2.2)
si p est son impulsion. La fréquence angulaire de ce mouvement s’appelle Fréquence cyclotronique
eB
ωc =
(2.3)
E
et est inversement proportionelle à l’énergie de la particule. La particule est accélérée par le
champ électrique présent dans l’espace entre les deux cavités en forme de D. Ce champ est établi
par un générateur de radiofréquence tel que sa fréquence ωrf égale la fréquence cyclotronique.
Dans le domaine non-relativiste, cette fréquence est constante. Ceci est facile à voir comme le
rayon de courbure ρ est proportionnel à la vitesse v de la particule et la fréquence de rotation
est
v
ν=
= const
(2.4)
2πρ
On peut donc injecter des particules d’une manière quasi-continue long que la fréquence est
haute et un multiple pair de la fréquence cyclotronique.
Fig. 2.2 – Principe du cyclotron.
Le cyclotron trouve sa limite par le fait que la vitesse de la particule ne reste pas proportionelle à l’impulsion mais tend vers la vitesse de la lumière dans un processus de saturation.
En fonction de l’énergie on a
β=
1−
m2
E2
(2.5)
Comme la vitesse n’augmente guère malgré l’augmentation constante en énergie, la radiofréquence d’accélération et la rotation de la particule se déphasent très vite, à une énergie de
quelques dizaines de MeVpour des protons.
2.2. LE SYNCHROTRON
2.2
13
Le synchrotron
Mais l’obtention d’une vitesse constante asymptotique, celle de la lumière, est très utile
pourvu que le rayon de courbure reste constant. Dans ce cas, la fréquence de rotation devient
de nouveau indépendante de l’énergie. Ceci est le principe du synchrotron. En augmentant de
champ magnétique proportionnellement à l’impulsion de la particule, le rayon de courbure reste
constant. On évite alors d’une part d’avoir à remplir tout un espace avec le champ magnétique
et peut le concentrer autour d’une chambre à vide dont la forme s’approche d’un anneau.
D’autre part, la fréquence cyclotronique devient constante à haute énergie si le champ
B est maintenu proportionnel à l’énergie. On peut alors travailler avec une radiofréquence
accélératrice constante. Cette radiofréquence est transmise au faisceau par des cavités résonantes. Comme ce principe du synchrotron réclame une certaine vitesse initiale qui s’approche
déjà suffisamment de la vitesse de lumière, on injecte un faisceau de particules pré-accélérées,
d’habitude par un accélérateur linéaire (voir Section 2.3). Le processus d’accélération doit
s’arrêter quand on arrive au champ limite des aimants dipolaires. On extrait alors le faisceau
ou on convertit l’accélérateur en anneau de stockage. Dans ce mode d’opération, on fournit à
chaque tour juste l’énergie perdue par le faisceau en rayonnement de freinage.
Electron
Beam
Pulsed
Magnet
1 meter
Pulsed
Inflector
View Port
RF
TV
RF
Spark
Chambers
Pulsed Inflector
Fig. 2.3 – Le synchrotron en anneau de stockage pour électrons de Princeton-Stanford. Les
structures en quart d’anneau sont des aimants dipolaires.
La séparation des fonctions et la concentration des composantes autour d’un anneau permet
de combiner deux anneaux pour arriver à un collisonneur. Un anneau de ce type est montré
CHAPITRE 2. LES ACCÉLÉRATEURS
14
dans la Figure 2.3. Il s’agit de l’anneau de stockage de Princeton-Stanford 2 un des premiers
exemples de collisionneurs de particules.
On peut se demander pourquoi on a toujours besoin de radiofréquence accélératrice dans
un anneau de stockage, même après que l’énergie finale, déterminée par le champ maximum
des aimants dipolaires, aie été atteinte. Ceci est dû au fait qu’une particule chargée accélérée
perd une certaine fraction de son énergie sous forme de radiation, c’est à dire en émettant
des photons. Ce processus est le rayonnement par freinage, ou Bremsstrahlung, qui produit les
photons dans un tube de Roentgen. Dans ce tube, l’accélération des particules est longitudinale.
Mais aussi l’accélération transversale crée la Bremsstrahlung. La puissance perdue en radiation
par la déviation magnétique se comporte comme
PB ∼
E3
γ3
∼ 3
ρ
mρ
(2.6)
et est donc grande pour particules légères circulant sur de petits cercles. Cette perte doit être
remplacée constamment pour obtenir un faisceau qui circule d’une manière stable.
La focalisation transversale du faisceau se fait par des champs magnétiques quadrupolaires.
Une faible composante quadrupolaire est normalement présente même dans des aimants dipolaires. La Figure 2.4 3 montre qualitativement les forces focalisants verticalement résultant
d’une légère composante quadrupolaire horizontale. En alternant cette configuration avec une
qui est tournée de 90◦ , on obtient une focalisation dans les deux directions transversales au
faisceau.
Fig. 2.4 – Focalisation par une composante quadrupolaire dans un champ dipolaire.
Les aimants avec champ dipolaire et quadrupolaire accompagnant accélérateur en anneau
sont construits comme le montre la Figure 2.5. Deux bobines créent un champ dipolaire, quatre
un champ quadrupolaire. Aujourd’hui ces bobines sont normalement supraconducteurs pour
minimiser les pertes ohmiques.
Mais une focalisation s’impose aussi dans la direction longitudinale. La raison est que les
particules doivent arriver d’une manière synchrone aux points d’accélération. On les injecte
donc par courts paquets. Si ils arrivent aux résonateurs de radiofréquence sur la pente croissant
du champ électrique, leur phase reste stable. Cet effet est visualisé dans la Figure 2.6. Une
2. W.C. Barber et al., Wide Angle Electron-Electron-Scattering on the Princeton-Stanford Storage Rings,
Proceedings of the Vth International Conference on High Energy Accelerators, M. Grilli edt., Frascati 1965;
W.C. Barber et al., Test of Quantum Electrodynamics by Electron-Electron-Scattering, Phys. Rev. Lett 16
(1966) 1127
3. P. Schmüser, Basic course on accelerator optics, CERN Accelerator School 1986, CERN 87-10.
2.3. L’ACCÉLÉRATEUR LINÉAIRE
15
Fig. 2.5 – Arrangement de bobines pour aimants dipolaires et quadrupolaires.
particule qui arrive avec un léger retard par rapport à la phase idéale verra un champ qui est
plus fort que le champ moyen. Par contre, une particule avec une légère avance verra moins de
champ accélérateur. De cette manière, les particules seront amenées à osciller automatiquement
autour de la phase idéale.
Fig. 2.6 – Le principe de la stabilité de phase sur la pente croissante de l’onde de radiofréquence.
Les plus puissants accélérateurs d’aujourd’hui travaillent en majorité selon le principe du
synchrotron. La Figure 2.7 montre un exemple, le Large Electron Positron collider LEP du
CERN à Genève. Les paramètres de quelques importants collisionneurs circulaires, en cours
d’exploitation et planifiés pour le futur proche, sont affichés dans le Tableau 2.1.
2.3
L’accélérateur linéaire
Il est tentant de vouloir combattre la perte d’énergie dans un synchrotron selon l’Equ. 2.6,
que l’on appelle aussi rayonnement synchrotron tellement elle est typique de ce type d’accéléra-
CHAPITRE 2. LES ACCÉLÉRATEURS
16
Fig. 2.7 – Le réseau des accélérateurs du CERN, avec le Proton Synchrotron (PS), le Super
Proton Synchrotron (SPS) et les collisionneurs Large Electron Positron collider (LEP) et Large
Hadron Collider (LHC).
Tab. 2.1 – Quelques collisionneurs à hautes énergies couramment en exploitation ou planifiés.
Le collisionneur LHC est en construction. Le projet Tesla est en cours d’évaluation.
Nom
LEP
SLC
Tevatron
HERA
PEP-II
KEKB
LHC
TESLA
Centre
CERN, Genève
SLAC, Stanford
FNAL, Chicago
DESY, Hamburg
SLAC, Stanford
KEK, Tsukuba
CERN, Genève
DESY, Hamburg
Principe/Particules
Synchrotron, e+ e−
Coll. linéaire, e+ e−
Synchrotron, pp̄
Synchrotron, e± p
Synchrotron e+ e−
Synchrotron e+ e−
Synchrotron, pp
Coll. linéaire, e+ e−
√
s[ GeV]
90 à 200
90
2000
330
10.5
10.5
14000
300 à 800
WWW site
www.cern.ch
www.slac.stanford.edu
www.fnal.gov
www.desy.de
www.slac.stanford.edu
www.kek.jp
www.cern.ch
www.desy.de
2.3. L’ACCÉLÉRATEUR LINÉAIRE
17
teur, en augmentant le rayon de courbure ρ et en affaiblissant le champ des aimants dipolaires
en même temps. Ceci mène aux complexes d’accélérateurs assez vastes comme ceux montrés
dans la Figure 2.7. Pour encore augmenter l’énergie on peut avoir recours aux particules plus
lourdes, comme dans le cas du LHC, collisionneur pp qui remplacera le LEP, collisionneur e+ e− ,
dans le même tunnel du CERN (voir le Tableau 2.1). Le désavantage est que des particules plus
lourds que l’électron sont soit instables (comme le µ 4 ou le τ ), soit non-ponctuelles comme le
proton. Dans le premier cas, on ne peut pas stocker les particules à volonté, en contraste avec
le LEP qui les garde pour plusieurs heures. Dans le deuxième cas, ce ne sont pas vraiment les
protons, mais les quarks qui interagissent pour créer une réaction voulue. Si l’on suppose que
chacun des trois quarks porte à peu près un tiers de l’impulsion du proton (ce qui n’est pas
tout à fait vrai, voir Chapitre 6), on réalise que seule une petite fraction de l’énergie fournie
peut être utilisée dans une collision hadronique.
L’alternative à l’utilisation des particules lourdes est donc de les dévier le moins possible et
de laisser ρ tendre vers l’infini. Cela donne un accélérateur linéaire, dont le principe est visualisé
dans la Figure 2.8. Une grande partie du tube à vide qui contient le faisceau est elle-même une
structure résonante de radiofréquence, dans laquelle une onde électromagnétique se déplace.
Entre les cavités résonantes, il y a des gaps, réalisés par des tubes conducteurs ou simplement
par une distance non-equipée entre deux cavités. La longueur l des gaps doit suivre la vitesse
v des particules accélérées
vT
l=
(2.7)
2
où T est la période de la radiofréquence. Il faut aussi qu’au passage de la particule dans une
partie non-blindée de la cavité, le champ électrique soit de la valeur et du signe voulus. Une
fois que la vitesse de la particule s’approche suffisamment de c, l devient donc constant. Les
conditions de la stabilité de la phase accélératrice ainsi que les mécanismes de focalisation
transversale sont les mêmes que dans le cas des machines circulaires.
Fig. 2.8 – Principe de l’accélérateur linéaire.
Pour que les particules soient accélérées dans un guide d’onde, il faut que
– le champ électrique ait une grande composante Ez le long la direction de la particule et
des petites composantes transverses à cette direction. Ceci nécessite une onde de type
T M, c’est à dire avec le champ magnétique transverse par rapport à la direction de
propagation;
– la vitesse de phase vp soit à peu près la même que celle de la particule.
4. Il existent des plans pour un collisionneur de muons au CERN, voir le site web http://muonstoragerings.c̃ern.ch
CHAPITRE 2. LES ACCÉLÉRATEURS
18
Soit Φ = ωt − kz la phase d’une onde électromagnétique qui se propage dans la direction z. La
fréquence angulaire, vue par un observateur au repos dans le laboratoire à z = const, sera
dΦ
=ω
dt
(2.8)
tandis que celle vue par un observateur en mouvement avec la vitesse v sera
dt
dz dt
dΦ
=
ω
−
k
= γ(ω − vk)
dt
dt
dt dt
Etant donné que k = ω/vp, on a
v
dΦ
=
γω
1
−
dt
vp
(2.9)
(2.10)
La condition de synchronisme veut que ∂Φ/∂t = 0. Il en suit que nous devons arranger la
cavité tel que vp = v c.
Fig. 2.9 – Cavité résonante supraconductrice avec neuf cellules en Niobdène pour le collisionneur linéaire Tesla.
Il faut de toute façon tenir compte du fait que les particules ne passent qu’une seule fois par
les structures accélératrices, en contraste avec les machines circulaires où ils passent des milliers
de fois par seconde. On doit donc obtenir les plus grandes valeurs du champ électrique possibles.
Ceci réclame des cavités supraconductrices qui peuvent atteindre des champs de l’ordre de 25
MV/m. La Figure 2.9 montre une telle cavité supraconductrice on Niobdène 5 avec neuf cellules.
Un grand accélérateur linéaire a besoin de plusieurs milliers de structures accélératrices. Cela
veut aussi dire que les machines linéaires ne sont pas toutes courtes non plus. La Figure 2.10
montre l’exemple du premier collisionneur linéaire, le SLAC Linear Collider (SLC) du Stanford
Linear Accelerator Center (SLAC) en Californie.
5. TESLA Conceptual Design Report, R. Brinkmann et al., DESY 1997-048, http://www-mpy.desy.de/lccdr/tesla/tesla.html
2.3. L’ACCÉLÉRATEUR LINÉAIRE
19
Fig. 2.10 – Schéma du SLAC Linear Collider (SLC) du Stanford Linear Accelerator Center
(SLAC) près de San Francisco en Californie.
20
CHAPITRE 2. LES ACCÉLÉRATEURS
21
Chapitre 3
Lois d’invariance et grandeurs
conservées
L’importance des symétries, c’est à dire des lois d’invariance, respectées en physique des
particules ne doit pas être sousestimée. Sans trop d’exagération on peut même dire que tout
cette physique se base sur de tels principes. Un exemple primordial nous est déjà familier: l’invariance vis-à-vis les transformation de Lorentz. Dans ce chapitre on va traiter des symétries
envers d’autres transformations de ce même type, celui des transformation des coordonnées de
l’espace-temps, Φ(x) → Φ(x ). Ceci concerne les transformation continues, comme les translations et rotation, aussi bien que discrètes, comme la parité et le renversement du temps.
On va également considérer des transformations qui concernent les champs eux-mêmes, donc
Φ(x) → Φ (x) au lieu de Φ(x) → Φ(x ). Les transformation de jauge et la conjugaison de charge
seront nos exemples de ce type.
3.1
Formalisme de Lagrange
Pour analyser les propriétés de symétrie on utilise souvent le formalisme de Lagrange, qui
concentre toutes les propriétés d’un système dans une seule fonction. On vous rappelle d’abord
l’application classique que vous avez apprise dans votre cours de Mécanique analytique.
Un système classique est caractérisé par la fonction de Lagrange, L(q,q̇,t), qui peut dépendre
des coordonnées généralisées q, des vitesses q̇ ainsi qu’éventuellement explicitement du temps
t. De L résulte l’action classique, S,
S=
t2
dtL(q,q̇,t)
(3.1)
t1
par intégration sur le temps. Les équation de mouvement découlent du principe de Hamilton
de l’action minimale. Celui-ci postule que l’action est stationnaire pour la trajectoire physique
du système dans l’espace des qi et q̇i :
δS = δ
t2
dtL(q,q̇) = 0
(3.2)
t1
avec la condition que la variation des coordonnées généralisées est zéro au début et à la fin de
la trajectoire:
(3.3)
δqi (t1 ) = δqi (t2 ) = 0
22
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
Si en plus L ne dépend par explicitement du temps, mais uniquement de qi et q̇i , on obtient les
équations du mouvement à partir des équations de Euler-Lagrange
d
dt
∂L
∂ q̇i
−
∂L
=0
∂qi
(3.4)
La signification physique de la fonction de Lagrange est qu’elle représente la différence entre
l’énergie cinétique T d’un système et son énergie potentielle V
L=T −V
(3.5)
La fonction de Lagrange a donc la dimension d’une énergie.
Les équations d’Euler-Lagrange lient la fonction de Lagrange aux équations du mouvement
pour tous les systèmes conservatifs. Il en suit que chaque transformation qui laisse L invariante
ne change pas la trajectoire des particules du système. Une telle invariance correspond donc à
une transformation invisible du système.
Exemple 3: Invariance de translation dans l’espace
Prenons une seule particule de masse m dans un système unidimensionnel comme exemple.
Dans un potentiel V (x), sa fonction de Lagrange sera
1
L = mẋ2 − V (x)
2
L’équation d’Euler-Lagrange mène alors à
∂V
= F (x)
∂x
donc à l’équation du mouvement de la mécanique Newtonienne.
mẍ = −
(3.6)
(3.7)
En ce qui concerne les symétries, l’importance de L provient du fait que l’impulsion pk =
∂L/∂ q̇k est conservée si L ne dépend pas explicitement de la coordonnée canoniquement associée, qk . Dans le cas ou un changement de cette coordonnée est invisible, l’impulsion correspondante devient alors une constante du mouvement.
Plus généralement, considérons un système où toutes les forces résultent d’un potentiel V .
La fonction de Lagrange sera
L = T (q̇i ) − V (qi )
(3.8)
Une translation des coordonnées le long d’un axe qi ne change donc pas l’énergie cinétique T .
Les équations d’Euler-Lagrange
d
dt
se simplifient alors à
∂(T − V )
∂(T − V )
−
=0
∂ q̇i
∂qi
(3.9)
d ∂T
∂V
=−
(3.10)
dt ∂ q̇i
∂qi
Nous reconnaissons à gauche la dérivé temporelle de l’impulsion généralisée, à droit la force
généralisée, toutes deux dans la direction qi . Sous condition que le potentiel V ne dépend pas
de qi , l’impulsion pi correspondante sera donc conservée.
En résumé, on constate que l’invariance sous la transformation qi → qi + ∆qi nécessite la
conservation de l’impulsion. De la même façon, l’invariance sous une rotation autour d’une axe
mène à la conservation du moment cinétique correspondant.
3.1. FORMALISME DE LAGRANGE
23
Exemple 4: Invariance sous la translation dans le temps
Si L ne dépend pas explicitement du temps, on a
dL ∂L dqj ∂L dq̇k
=
+
dt
j ∂qj dt
k ∂ q̇k dt
(3.11)
∂L
d ∂L
=
∂qj
dt ∂ q̇j
(3.12)
d ∂L
∂L dq̇k
dL
=
q̇j +
dt
j dt ∂ q̇j
k ∂ q̇k dt
(3.13)
Avec
il en suit que
=
d
∂L
q̇j
dt
∂ q̇j
j
(3.14)
Il y a donc une quantité conservée, qui est la fonction de Hamilton:
⎛
⎞
∂L
d ⎝
⎠=0
L−
q̇j
dt
∂ q̇j
j
(3.15)
Pour tels systèmes la fonction de Hamilton H est donc constante:
H=
q̇j
j
∂L
− L = T + V = const
∂ q̇j
(3.16)
et l’énergie totale est conservée. La base de la conservation de l’énergie-impulsion est donc
l’invariance par rapport aux translations dans l’espace-temps.
Tout cela est valable d’une manière analogue pour une théorie des champs. La différence
principale est naturellement que l’on n’utilise plus les coordonnées discrètes qi (t) mais que l’on
généralise pour les champs continus Φ(t,x). Le champ peut être vue comme une coordonnée
généralisée à chaque valeur de son argument, c’est à dire à chaque point de l’espace-temps. Cela
donne un système avec une infinité de degrés de liberté. La description du système se base sur
la densité de Lagrange
L = L(Φ(x),∂µ Φ(x))
(3.17)
qui dépend du champ Φ(x) et de son quadri-gradient ∂µ Φ(x). L’intégrale de l’action devient
S=
t2
dt
t1
d3x L(Φ,∂µ Φ)
(3.18)
où l’intégrale sur l’espace change la densité de Lagrange L en fonction de Lagrange L:
L=
d3x L(Φ,∂µ Φ)
(3.19)
Le principe de Hamilton détermine la trajectoire du système:
δ
t2
t1
d4 x L(Φ,∂µ Φ) = 0
(3.20)
24
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
avec les condition initiales et finales δΦ(t1 ) = δΦ(t2 ) = 0. Par le même raisonnement qui
s’applique aux systèmes classiques on obtient donc les équations d’Euler-Lagrange pour une
théorie des champs:
∂L
∂L
− ∂µ
=0
(3.21)
∂Φ(x)
∂(∂µ Φ)
Elles mènent aux équations du mouvement pour les champs. Si la densité de Lagrange est
un opérateur scalaire sous les transformations de Lorentz, donc invariant, les équations du
mouvement seront alors covariantes.
Exemple 5: Densité de Lagrange pour un champ scalaire
Pour un champs scalaire libre Φ(x) de masse m, la densité de Lagrange
L=
1
1
(∂µ Φ)∗ (∂ µ Φ) − m2 Φ∗ Φ
2
2
(3.22)
mène à l’équation de Klein-Gordon
∂µ ∂ µ Φ + m2 Φ = 0
(3.23)
qui décrit son évolution dans l’espace-temps. La solution de cette équation est une onde plane
√
µ
(3.24)
Φ(x) = Ne−ipµ x
L’insertion dans la densité de Lagrange donne
1
1
L = Npµ pµ − Nm2
2
2
(3.25)
mettant ainsi en évidence l’interprétation en énergie cinétique du premier terme ainsi qu’en
énergie potentielle du deuxième. L’insertion dans l’équation du mouvement nous donne
(pµ pµ )e−ipµ x − m2 e−ipµ x = 0
µ
µ
(3.26)
ce qui implique que l’énergie-impulsion doit être conservée dans tout l’espace-temps. L’invariance de L sous les translations implique donc la conservation de l’énergie-impulsion.
Le fait que les invariance d’un système entraı̂nent la conservation d’une propriété physique
du système est une observation tout à fait générale connue sous le nom de théorème de Noether 1 .
Ce théorème nous dit que si l’équation du mouvement, ou bien la fonction de Lagrange qui lui
est équivalente, est invariante sous une transformation, alors l’observable correspondant au
générateur de de cette transformation est une constante du mouvement.
Pour comprendre le concept du générateur, prenons encore la translation comme exemple.
Une translation infinitésimale δx dans la direction x transforme le champ Φ en
∂
Φ = Φ(x + δx) = 1 + δx
Φ(x)
∂x
(3.27)
Exprimé en impulsions, pµ = −i∂µ , cela correspond à
Φ = (1 + iδxpx ) Φ(x)
1. Nommé après la mathématicienne allemande Emmy Amalie Noether, 1882 à 1935
(3.28)
3.2. PARITÉ
25
Une série de n transformations infinitésimales donne une translation finie de ∆x = nδx:
Φ = Φ(x) lim (1 + ipx δx)n = Φ(x)eipx ∆x
n→∞
(3.29)
Il est donc logique d’appeler px le générateur des translations le long l’axe x. Par conséquent,
une translation aµ en quatre dimensions est générée par pµ . Pour une petite translation nous
avons
µ
xν = eiaµ p xν
(1 + aµ ∂ µ ) = xν + aν
(3.30)
(3.31)
Selon le théorème de Noether, invariance sous les translations implique donc conservation
d’énergie-impulsion comme dans le cas classique.
3.2
Parité
Autres que translations et rotations, les transformations des coordonnées incluent aussi les
transformations discrètes qui sont la parité et le renversement du temps. La parité transforme
le quadrivecteur x = (t,x,y,z) en x = (t, − x, − y, − z) par l’action d’un opérateur P. Pour les
champs on a
PΦ(t,r) = Φ(t, − r)
(3.32)
La répétition de l’opération donne P(PΦ) = Φ, P est donc un opérateur unitaire avec P2 = 1.
Les états propres de P sont ceux pour lesquels
PΦ = ±Φ
(3.33)
avec les valeurs propres limitées à P = ±1 par l’unitarité de l’opérateur. Il existe toutefois
bien des fonctions d’onde qui ne sont pas des états propres de P. Par exemple, une fonction
Φ = cos x+sin x se transforme en PΦ = cos x−sin x qui est ni +Φ, ni −Φ. Parmi les importantes
quantités qui sont, par contre, des états propres de P, on trouve notamment celles cités dans
le Tableau 3.1.
La parité est conservée dans les réactions dues aux forces fortes et électromagnétiques, mais
pas dans les interactions faibles. Ceci veut dire que si un système est dans un état propre de P
avant la réaction, il sera dans un état propre avec la même valeur propre après la réaction. Une
telle loi de conservation ne peut être établie qu’expérimentalement, on cherche donc toujours à
trouver des cas ou elle ne serait pas respectée.
quantité
scalaires s
pseudoscalaires p
vecteurs v
pseudovecteurs a
transformation P
P(s) = s
P(p) = −p
P(v) = −v
P(a) = a
JP
0+
0−
1−
1+
Tab. 3.1 – Propriétés de quelques quantités états propres sous transformation de parité.
Les systèmes avec un potentiel à symétrie sphérique sont états propres de P. Une exemple
est l’atome de hydrogène avec sa fonction d’onde en coordonnées sphériques
Φ(r,θ,φ) = χ(r)Ylm (θ,φ)
(3.34)
26
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
avec les harmoniques sphériques Ylm . La transformation r → −r équivaut à (r,θ,φ) → (r,π −
θ,π + φ) et donc
(3.35)
Ylm (θ,φ) → Ylm (π − θ,π + φ) = (−1)l Ylm (θ,φ)
La parité d’un tel système est donc (−1)l . Les transitions électromagnétiques d’un tel système
réclament ∆l = ±1, donc la parité d’un photon doit être (−1) si la parité doit être conservée
dans la transition.
Les hadrons sont des états propres de la parité, on peut alors utiliser sa valeur propre pour
caractériser une particule, tout comme le spin, la charge électrique ou le nombre baryonique etc.
Le moment cinétique total J = l + s intervient en plus de la parité intrinsèque des composantes.
On utilise par conséquent la notation J P comme caractéristique. Vous la trouverez dans les
tableaux du PDG pour chaque particule.
La parité des fermions est opposée à celle des antifermions. Par convention, on fixe la parité
arbitrairement à (+1) pour les quarks, les antiquarks ont donc la parité (−1). Pour les bosons
la parité est la même pour particule et antiparticule.
La parité est un nombre quantique multiplicatif, de telle sorte que la parité totale d’un
système à l’état fondamental est le produit des parités individuelles de ses composantes. Si il y
a un moment cinétique relatif entre les composantes caractérisé par un nombre quantique l, il
faut en tenir compte par un facteur (−1)l comme dans l’atome d’hydrogène.
Exemple 6: Parité des baryons et mésons
Les baryons qui contiennent juste trois quarks sans moment cinétique relatif, comme le proton
+
(uud) et le neutron (udd) ont la parité (+1)3 = (+1), donc J P = 12 . Les mésons les plus légers,
√
comme les pions (ud̄,dū, (uū+dd̄)/ 2)) et les kaons, contiennent quark et antiquarks avec spins
antiparallèles (↑↓). Ils ont parité (+1)(−1) = (−1) et on les appelle mésons pseudoscalaires,
en accord avec la nomenclature du Tableau 3.1. Les états analogues avec spins parallèles (↑↑),
comme les mésons ρ, K∗ , ω, Φ sont appelés mésons vectoriels, ils ont J P = 1− .
Les états excités, plus lourds, ont souvent des propriétés de transformation plus complexe.
Par exemple les mésons avec (l = 1,s = 1) forment trois sortes d’états, comme le f0 (980) qui
est un méson scalaire avec J P = 0+ , le a0 (1260) qui est un pseudovecteur avec J P = 1+ , ou le
f2 (1810) qui est un tenseur avec J P = 2+ . Comme ces résonances sont récourentes à plusieurs
reprises, on les distingue par leur masse (en MeV) qui est donnée entre parenthèses.
Exemple 7: Désintégration du π 0
La parité n’est pas seulement un concept théorique mais a des effets mesurables partout où elle
correspond à une observable conservée. Regardons la désintégration dominante du π 0 → γγ. Le
π 0 est un boson de spin 0 qui se désintègre donc en deux bosons de spin 1. Pour considérer les
spins, on va les projeter sur le seule axe naturel du système, qui est donné par la direction des
deux photons dans le système de repos du π 0 . La conservation du moment cinétique réclame
donc que l’une des deux configuration esquissées dans la Figure 3.1, ou une combinaison des
deux, soit réalisé dans la désintégration. La première configuration correspond à deux photons
émis dans un état de polarisation circulaire droite, ΦR , la deuxième avec deux photons polarisés
à gauche, ΦL . Sous l’opération P, les impulsions ki des deux photons changent de signe en −ki ,
mais leur spins si , étant pseudovecteurs, ne changent pas. La parité change donc la première
configuration dans la deuxième et vice versa. Comme la parité est conservée dans le processus,
il faut donc que la fonction d’onde totale, Φ, soit un état propre de P. Donc à une constante
de normalisation près on a les deux possibilités
1 2
Φ± = Φ1R ΦR
2 ± ΦL ΦL
(3.36)
3.3. RENVERSEMENT DU TEMPS
27
avec parité (±1), respectivement.
L’onde plane du photon est caractérisée par son vecteur de polarisation, qui pointe dans la
Pour les photons libres, ce vecteur est normal à la direction
direction du champ électrique E.
⊥ k. Soit k = (0,0,kz ), on peut donc avoir une combinaison linéaire des
du mouvement, E
x = (Ex ,0,0) et E
y = (0,Ey ,0). Les états ΦR et ΦL correspondent à
polarisation E
x + iE
R = √1 E
y
E
2
1
y
L = √ E
x − iE
E
2
(3.37)
(3.38)
(3.39)
Pour la fonction d’onde totale du système, on trouve
1E
2 1 2
Φ+ = E
x x − Ey Ey
1E
2 1 2
Φ− = E
x y + Ey Ex
(3.40)
(3.41)
(3.42)
Dans le premier cas, Φ+ , les polarisations des deux photons seront coplanaires, dans le deuxième,
Φ− , elles seront orthogonales. Expérimentalement on trouve qu’elles sont orthogonales 2, la parité du π 0 est donc bien (−1) comme prévu par son contenu en quarks.
π0
• ⇐=
=⇒
π0
• =⇒
⇐=
Fig. 3.1 – Direction du mouvement des deux photons et alignement de leurs spins dans une
désintégration π 0 → γγ au repos.
3.3
Renversement du temps
L’opération du renversement du temps transforme le quadrivecteur x = (t,x,y,z) en x =
(−t,x,y,z) par l’action d’un opérateur unitaire T. Pour les champs on définit
TΦ(t,r) = Φ∗ (−t,r)
(3.43)
La conjugaison complexe est nécessaire à cause de la transformation de l’équation de Schrödinger
∂Φ(t,x)
(3.44)
HΦ(t,x) = i
∂t
2. Pour la première mesure voir R. Plano et al., Phys. Rev. Lett. 3 (1959) 525.
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
28
Avec un opérateur H de l’énergie totale qui est invariant sous T, on a
HΦ∗ (−t,x) = i
∂ − Φ∗ (t,x)
∂t
(3.45)
bien qu’on aurait obtenu (−i) à droite si T ne changerait pas Φ en Φ∗ . Sauf pour les champs de
bosons réels, il n’y a donc pas d’états propres de T tout seul, donc également pas de quantité
conservée. L’importance de T se trouve plutôt dans la combinaison avec les transformation
discrètes de la parité P et de la conjugaison de charge C, parce que l’on peut démontrer que
toute théorie des champs locale doit être invariante sous l’action conjointe de CPT.
3.4
Conjugaison de charge
L’opérateur de conjugaison de charge, C, est un premier exemple pour une transformation
qui concerne le champ lui-même et non pas les coordonnées. Il transforme la fonction d’onde
d’une particule, Φp , en fonction d’onde de son antiparticule, Φp̄ :
CΦp = Φp̄
(3.46)
L’opération change donc le signe de la charge électrique, du moment magnétique, du nombre
baryonique et leptonique, bref, de tous les nombres quantiques du type charge. Ainsi, l’opérateur
C sur un fermion donne un antifermion avec tous les charges opposées, mais avec la même masse,
le même spin et la même impulsion.
Encore une fois, les interactions électromagnétiques et fortes respectent C, tandis que les
interactions faibles la violent. Certaines particules peuvent à elles seules être des états propres
de C. Puisque C inverse le signe des charges, un état propre doit être un boson neutre, avoir
ni nombre baryonique ni leptonique.
Par exemple, le méson pseudoscalaire π 0 , qui est sa propre antiparticule, a CΦπ0 = Φπ0 ,
avec valeur propre C = (+1). Comme le photon est généré par des charges en mouvement, qui
changent de signe sous C, on a CAµ = −Aµ . La conjugaison de charge est encore un nombre
quantique multiplicatif, un système de n photons a C = (−1)n . Par exemple, la désintégration
π 0 → γγ respecte la conservation de C, mais π 0 → γγγ est interdit. En effet, le rapport
d’embranchement de dette dernière désintégration 3 est inférieur à 3.1 × 10−8 .
3.5
Transformations de jauge
Une importante classe de transformation des champs reste à discuter, les transformation
de phase, historiquement appelées les transformations de jauge. Vous en connaissez déjà un
exemple qui appartient à la physique classique: les transformations de jauge du champ du
photon, Aµ . Vous avez le droit de vous étonner que l’on identifie ici le quadripotentiel Aµ avec
et magnétique, B.
Vous verrez dans
le champ du photon et non pas les champs électrique, E
l’Exemple 3.5 une justification expérimentale frappante pour cette manoeuvre.
Les équations du mouvement du photon libre sont les équations de Maxwell homogènes, qui
peuvent être écrites comme
(3.47)
∂µ F µν = 0
3. Voir http://pdg.web.cern.ch/pdg/19999/mxxx.html
3.5. TRANSFORMATIONS DE JAUGE
29
avec le tenseur du champ
⎛
⎜
⎜
⎝
F µν = ∂ µ Aν − ∂ ν Aµ = ⎜
⎞
0
E1
E2
E3
−E1
0
B3 −B2 ⎟
⎟
⎟
−E2 −B3
0
B1 ⎠
−E3
B2 −B1
0
(3.48)
Ce tenseur suit d’un quadripotentiel Aµ
Aµ =
V
A
(3.49)
donnent les
ainsi que ses composantes, le potentiel scalaire, V , et le potentiel vectoriel, A,
champs
= ∇
×A
B
(3.50)
= −∇V
− ∂A
E
∂t
(3.51)
Les équation du mouvement du photon sont invariantes sous les transformations de jauge
+ ∇Λ
→ A
= A
A
∂Λ
V → V =V +
∂t
(3.52)
(3.53)
avec une fonction scalaire Λ(x) arbitraire. Ces transformations peuvent être écrites d’une
manière covariante comme Aµ → Aµ = Aµ + ∂ µ Λ. Une telle transformation du potentiel
et B
invariants. Elle ne change pas non plus les équations du mouvement
laisse les champs E
du photon.
Dans votre cours de physique classique vous en avez probablement conclu, au moins implicitement, que cette ambiguı̈té dans la définition du potentiel est un défaut qui vous a fait
penser que les particules interagissent avec le champ plutôt qu’avec le potentiel. Le contraire
est le cas au niveau quantique: l’expérience montre que les champs matière interagissent avec
le potentiel. Et l’invariance de jauge du potentiel est une vertu qui entraı̂ne la conservation des
charges. Nous entrons un peu dans les détails pour étoffer ces deux faits étonnants.
Exemple 8: L’expérience de Aharonov-Bohm
Le potentiel électromagnétique entraı̂ne un changement de phase d’un champ de particule chargée,
plus exactement de sa fonction d’onde ou de son amplitude de probabilité. Pour voir ceci on
regarde d’abord une particule libre non-relativiste, qui suit l’équation de Schrödinger
i
∂ψ0
= H0 ψ0
∂t
(3.54)
Dans un potentiel scalaire qui dépend du temps on aura l’équation inhomogène
i
∂ψ
= Hψ = [H0 + V (t)] ψ
∂t
(3.55)
Ses solutions auront une phase S(t) qui dépend du temps
ψ = ψ0 e−iS
(3.56)
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
30
et on obtient
i
∂S
∂ψ
∂ψ0 −iS
+ ψ0 e−iS
= i
e
∂t
∂t
∂t
∂S
−iS
ψ0 e−iS
= H0 ψ0 e
+
∂t
∂S
= H0 +
ψ
∂t
(3.57)
(3.58)
(3.59)
La comparaison des coefficients avec l’Equation 3.55 nous montre que
∂S
= V (t)
∂t
(3.60)
Sur un parcours fermé on obtient alors un décalage ∆S de la phase
V (t)dt
∆S =
(3.61)
De même, on trouve pour un quadripotentiel Aµ :
∆S =
V dt −
x=
Ad
Aµ dxµ
(3.62)
Le décalage de la phase est donc proportionnel au flux magnétique inclu dans le parcours. Un
tel changement de phase devrait être observable, car une différence de phase – en contraste avec
une phase absolue de la fonction d’onde – est mesurable dans une expérience interferométrique.
On peut alors se demander si les décalages de phases se produisent aussi si la particule parcourt
un espace où le champ disparaı̂t partout, mais ou le potentiel n’est pas zéro partout.
Le principe d’une telle expérience 4 est esquissée dans la Figure 3.2. Des électrons sortent
de la source S. Ils sont mis en interférence par le biprisme à double fente b. Les franges d’interférence apparaissent sur l’écran en o. Si l’on introduit une très fine bobine solénoidale longue 5
dans le parcours à l’endroit a, il en résulte un potentiel sur le parcours des électrons, bien que
le champ magnétique soit zéro partout. Si l’on varie le flux magnétique, on observe alors un
décalage des franges. Ceci démontre que les électrons interagissent bel et bien avec le potentiel
même en absence de champs.
Le potentiel électromagnétique change la phase des champs de matière. Ceci correspond à
une transformation de la fonction d’onde selon
Φ(x) → Φ (x) = eiαQ Φ(x)
(3.63)
avec un angle constant α = α(x) et l’opérateur de la charge Q dont toutes les particules chargées
sont des états propres:
QΦ(x) = ±eΦ(x)
(3.64)
Il s’agit d’une transformation dite globale, parce qu’elle concerne tous les champs et change leur
phase par le même angle partout. Les équations du mouvement d’un champ scalaire complexe
Φ(x) suivent d’une densité de Lagrange
L = (∂µ Φ)∗ (∂ µ Φ) − m2 Φ∗ Φ
(3.65)
4. Y. Aharonov and D. Bohm, Phys. Rev. 115 (1959) 485; R.G. Chambers, Phys. Rev. Lett 5 (1960) 3.
5. G. Möllenstedt et W. Bath, Phys. Blätter (1962) 299
3.5. TRANSFORMATIONS DE JAUGE
31
Intensitat I
0
Intensitat I
0
Intensitat I
Interferenzbild am Biprisma
0
1
0.75
0.5
0.25
0
b
a’
s
a
o
1
0.75
0.5
0.25
0
1
0.75
0.5
0.25
0
2.5
5
7.5 10 12.5 15 17.5 20 22.5 25
Auslenkung o
2.5
5
7.5 10 12.5 15 17.5 20 22.5 25
Auslenkung o
2.5
(a)
5
7.5 10 12.5 15 17.5 20 22.5 25
Auslenkung o
(b)
Fig. 3.2 – (a) Principe de l’expérience de Aharonov et Bohm démontré avec un biprisme. (b)
Franges d’interférence (de haut en bas) de la diffraction par une fente, pour un biprisme idéal
et pour les deux ensembles.
qui est invariante sous ces transformations de phase. Cette invariance implique un courant
conservé. Prenons une transformation infinitésimale
Φ → (1 + iαQ)Φ
(3.66)
L’invariance de la densité de Lagrange veut dire que
∂L
∂L
∂L ∗
∂L
δΦ +
δ(∂µ Φ) +
δ(∂µ Φ∗ )
δΦ +
∗
∂Φ
∂(∂µ Φ)
∂Φ
∂(∂µ Φ∗ )
∂L
∂L
(iαeΦ) +
(iαe∂µ Φ) + ...
=
∂Φ
∂(∂µ Φ)
∂L
∂L
∂L
Φ + iαe∂µ
= iαe
− ∂µ
Φ + ...
∂Φ
∂(∂µ Φ)
∂(∂µ Φ)
δL =
(3.67)
(3.68)
(3.69)
Le premier terme disparaı̂t à cause de l’équation de Euler-Lagrange. Ainsi l’invariance δL = 0
demande que
∂L
∂L
∗
e∂µ
Φ−Φ
=0
(3.70)
∂(∂µ Φ)
∂(∂µ Φ∗ )
Le terme entre parenthèses donne le courant recherché
j µ = −e (Φ∗ ∂ µ Φ − Φ∂ µ Φ∗ )
(3.71)
qui est alors conservé selon ∂µ j µ = 0. Considérons d’abord la partie temporelle de ce quadricourant
∂
j 0 = −e (Φ∗ (x)Φ(x))
(3.72)
∂t
32
CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES
Il s’agit là du changement local de la densité de charge. La partie spatiale
(Φ∗ (x)Φ(x))
j = −e∇
(3.73)
est le vecteur du flux de charge, ou plus précisément du flux de la densité de charge. L’équation
de continuité ∂µ j µ = 0 veut donc dire que la densité de charge dans un volume ne peut changer
que par un flux de particules qui entre ou sort du volume. La charge est donc conservée.
Ainsi on a démontré que l’invariance de la densité de Lagrange sous les transformations de
jauge globales implique la conservation de la charge, observable correspondant au générateur
des transformations de phase. Le lien entre ces transformations et les transformations de jauge
classiques de Aµ est donné par le fait que c’est Aµ même qui change la phase des champs
de matière. Donc un changement de jauge pour Aµ change globalement toutes les phases des
champs de matière. Il est plausible que la physique doit être invariante sous ce changement, ce
qui implique la conservation de la charge électrique.
Dans les théories des champs modernes qui forment ensemble le Modèle Standard, on demande une invariance de jauge bien au delà des transformations globales. On impose à la
densité de Lagrange une invariance sous les transformation de jauge locales, avec un angle α(x)
indépendant en chaque point de l’espace-temps. Ceci définit la structure même des interactions
électromagnétiques, faibles et fortes. Leurs théories des champs, basé sur un tel principe, sont
alors collectivement appelées théories de jauge. On laisse aux cours avancés, consacrés à ces
interactions, approfondir ce sujet fascinant.
33
Chapitre 4
Amplitude et section efficace
Jusqu’ici on s’est plutôt intéressé aux situations statiques et stationnaires, où les champs
évoluent librement dans l’espace-temps. Maintenant on va créer un peu de dynamique en faisant
intervenir des forces, c’est à dire que l’on va commencer à étudier les processus de diffusion
et de désintégration. Pour caractériser ces processus on a besoin d’une quantité qui mesure la
puissance d’une réaction, ou, dans le contexte de la mécanique quantique, sa probabilité. Cette
quantité est la section efficace, σ, pour les diffusions et son analogue pour les désintégrations,
le taux de désintégration, Γ.
c
a
b
d
Fig. 4.1 – Section efficace géométrique
4.1
Section efficace
L’origine du concept de la section efficace est purement géométrique, comme son nom l’indique. Considérons une réaction a + b → c + d, voir Figure 4.1. Dans le laboratoire, le flux Fa
des projectiles a, c’est à dire leur nombre par unité de surface et de temps, est
Fa = ρa va
(4.1)
avec leur densité ρa et leur vitesse (par rapport au cible b au repos) va . Si chaqu’une des
particules cibles a une section efficace σ, qui représente la probabilité de la toucher, le taux des
réactions par seconde sera
W = Fa Nb σ
(4.2)
34
CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE
avec le nombre Nb de cibles. La section efficace est donc définie comme le taux de réaction
par unité de flux projectiles et par particule cible. Le facteur de normalisation est aussi appelé
la luminosité, L = Fa Nb dans le laboratoire. Dans le centre de masse, par exemple dans un
collisionneur, la luminosité est
Na Nb ν
L=
(4.3)
A
où Na et Nb sont les nombres de particules de chaque type par bunch, ν est la fréquence de
circulation des bunches et A est leur surface commune au point de collision.
La section efficace a la dimension d’une surface. Elle est mesurée dans l’unité (énorme!) de
barn, 1b = 10−28 m2 . Les sections efficaces que l’on trouve pour les leptons et quarks sont plutôt
de l’ordre de nanobarn, 1nb = 10−9 b, ou picobarn, 1pb = 10−12 b = 10−40 m2 .
Au lieu d’observer seulement le taux total d’une réaction, on peut en enregistrer la distribution, par rapport à l’angle solide, par exemple. Dans ce cas, après normalisation par la
luminosité, on mesure la section efficace différentielle, dσ/dΩ, avec
σ=
4.2
dσ
dΩ
dΩ
(4.4)
Taux de désintégration
En ce qui concerne les désintégrations, la définition est tout à fait analogue. Il n’y a pas
de projectile, donc on considère uniquement les particules b dans l’état initial. On normalise le
nombre de désintégrations par seconde, dNb /dt, par leur nombre Nb et on trouve donc un taux
de désintégration
dNb 1
1
Γ=−
=
(4.5)
dt Nb
τb
qui est l’inverse de leur temps de vie τb . Le taux Γ a la dimension d’une énergie. On l’appelle
aussi la largeur de la particule, car elle correspond à l’incertitude en masse de la particules.
On peut donc la mesurer soit en mesurant le temps de vie d’une particule, soit en observant
la largeur de la distribution en masse invariante de ses produits de désintégration. Si plusieurs
canaux de désintégration existent, le temps de vie observé dans chaque canal est bien sûr le
même. Néanmoins le taux de désintégration dépend du canal. En définit alors un taux partiel
Γi pour chaque canal i. Evidemment, la conservation de la probabilité réclame que
Γ=
i
Γi =
1
τb
(4.6)
Analogue à la section efficace différentielle, on peut aussi mesurer le taux différentiel d’une
désintégration, par exemple dΓ/dΩ.
4.3
Amplitude invariante
Le définition donnée ci-dessus pour la section efficace et le taux de désintégration est une
prescription de mesure: on observe le taux d’une réaction et normalise par le flux des projectiles
et par le nombre de cibles exposés au faisceau. Pour évaluer une théorie, c’est à dire pour
confronter ses prédictions à l’expérience, il nous faut aussi une prescription pour le calcul de
4.3. AMPLITUDE INVARIANTE
35
sections efficaces. Cette prescription s’appelle la Règle d’or de Fermi. Nous rappelons que dans
la théorie de diffusion non-relativiste, le taux de diffusion est donné par
W = |M|2Q
(4.7)
avec l’amplitude invariante de diffusion, M, et la densité d’états finaux, Q = dNc /dt. Cette
dernière tient compte du nombre d’états – dans le sens quantique – que peut contenir l’état
final. L’amplitude M peu être interprétée comme l’amplitude de probabilité pour une diffusion
qui convertit un état initial Φa en état final Φc . Elle est donc une amplitude de probabilité dans
le même sens que la fonction d’onde.
Φa
Φb
jµac
@
@
R =⇒
@
@
)
(
)
~ Aµ
Fig. 4.2 – Interaction d’une particule avec un potentiel statique, ici avec le potentiel électromagnétique.
On s’imagine qu’au premier ordre, une seule action locale d’un potentiel V(x) transforme
l’état initial Φa en l’état final Φc , comme représenté dans la Figure 4.2:
Φc (x) = V(x)Φa (x)
(4.8)
L’amplitude de probabilité pour ce processus – ignorant la normalisation exacte pour le moment
– est donné par
M = −i d4 x Φ∗c (x)V(x)Φa (x)
(4.9)
L’argument de l’intégrale est la probabilité de trouver Φc à x parmi tous les états finaux produits
par V à partir de l’état initial Φa . L’intégration sur l’espace-temps tient compte du fait que
cette interaction locale peut intervenir partout où règne le potentiel. Pour aider votre intuition,
imaginez que les deux fonctions d’onde Φa et Φc correspondent à des particules libres partout
sauf au moment de l’action du potentiel. L’état initial Φa sera donc une superposition d’états
propres de l’Hamiltonien libre avec un certain set de coefficients. Le potentiel va transformer ces
coefficients pour produire une autre superposition d’états propres, avec un différent ensemble
de coefficients. L’amplitude M est alors juste l’amplitude de l’état final Φc que contient ce
nouveau mélange.
La section efficace peut être calculée en normalisant la probabilité de la réaction, qui correspond à |M|2 . On obtient
|M|2
dQ
(4.10)
dσ =
F
avec le flux incident pour l’état initial
F = |va − vb | 2Ea 2Eb = 4 (pa pb )2 + m2a m2b
(4.11)
CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE
36
qui dépend de la vitesse relative va − vb | de particule et cible. La dernière équation est valable
pour va ||vb et met en évidence l’invariance de ce flux par rapport aux transformations de
Lorentz. Le facteur de l’espace de phase, dQ, tient comte du nombre d’états qui peuvent être
réalisés dans l’état final
dQ = (2π)4 δ (4) (pc + pd − pa − pb )
d 3 pd
d 3 pc
(2π)3 2Ec (2π)3 2Ed
(4.12)
Il contient un terme qui assure la conservation de l’énergie-impulsion, ainsi que le comptage
du nombre d’états quantiques pour tous les particules dans l’état final. Les facteurs Ni = 2Ei
pour tous les facteurs de normalisation interviennent à cause de notre manière de normaliser
les fonctions d’onde.
L’amplitude invariante, M, contient toute la dynamique de la réaction, donc toute la physique caractéristique pour le type d’interaction qui intervient. Il suit donc de l’opérateur du
potentiel, V. Celui-ci est le même qui modifie les équations de mouvement homogènes de tel
sorte que
∂µ ∂ µ + m2 = −VΦ
(4.13)
Pour les interactions électromagnétiques, cette équation inhomogène suit de l’équation de KleinGordon par la substitution (dite minimale) i∂µ → i∂µ + eAµ . Pour le potentiel on obtient alors,
en négligeant des termes proportionnels à e2 1,
V = −ie (∂µ Aµ + Aµ ∂µ )
(4.14)
Pour l’amplitude invariante on trouve
M = −i
= −e
= −i
d4 x Φ∗c (x)V(x)Φa (x)
(4.15)
d4 x Φ∗c (x) (∂µ Aµ + Aµ ∂µ ) Φa (x)
(4.16)
d4 x jµac Aµ
(4.17)
La densité de courant électromagnétique qui intervient ici
µ
= −ie (Φ∗c ∂ µ Φa − Φa ∂ µ Φ∗c )
jac
(4.18)
est la même que l’on a trouvé dans l’Equation 3.71. A l’exception près que les champs dans
l’état initial et final ne sont plus les mêmes, comme il y a eu interaction. C’est donc la densité
du courant de charge qui interagit localement avec le champ du photon, Aµ . Reste à comprendre
comment le potentiel naı̂t, comment le photon est produit.
Pour les interactions électromagnétiques, ce sont les équations de Maxwell inhomogènes qui
nous disent comment les champs sont produits:
∂µ F µν = j ν
(4.19)
à partir d’une densité de courant j ν . En potentiel, cela donne
∂µ ∂ µ Aν + ∂ ν ∂µ Aµ = 0
(4.20)
En utilisant l’invariance du champ de photon Aµ sous les transformation de jauge
Aµ → Aµ + ∂µ χ
(4.21)
4.3. AMPLITUDE INVARIANTE
37
avec un champ scalaire arbitraire χ(x), on peut toujours s’arranger ainsi que
∂µ Aµ = 0
(4.22)
On appelle cet arrangement, la jauge de Lorentz. Sous cette jauge, les équations de Maxwell
homogènes, ∂µ ∂ µ Aν = 0, sont bien quatres équations Klein-Gordon pour les composantes du
champ, dont seulement trois sont indépendantes à cause de la condition de jauge même, Equation 4.22. Cela justifie que nous avons considéré les équations de Maxwell 4.19 comme les
équations de mouvement pour le photon dans le chapitre 3. En présence d’un courant, les
équations deviennent
∂µ ∂ µ Aν = j ν
(4.23)
Nous construisons j ν à partir des fonctions d’onde des deux autres partenaires dans la réaction,
b et d, qui sont les sources du champ:
ν
jbd
= +ei Nb Nd (pνb + pνd ) e−i(pd −pb )x
(4.24)
Par conséquent, un champ de photon
Aµ = −
1
jµ
q2
(4.25)
avec la quadri-impulsion transférée, q = pd − pb = pa − pc , respecte les équations inhomogènes
de Maxwell, Equation 4.23. L’amplitude correspond donc à l’interaction entre deux courants
M=i
d4 x jµac
1 µ
j
q 2 bd
(4.26)
en faisant intervenir le propagateur 1/q 2 qui décrit l’amplitude de probabilité qu’un photon
d’impulsion q soit échangé entre les deux.
Φa
Φb
jµac
@
@
R =⇒
@
@
)
( γ(q)
)
@
@
R
=⇒ @
@
Φc
Φd
jµbd
Fig. 4.3 – Interaction d’une particule avec une autre, par échange d’un photon.
Ce processus peut être représenté par un diagramme de Feynman que montre la Figure 4.3.
Ces diagrammes décrivent les processus élémentaires de diffusion et de désintégration d’une
manière à la fois élégante et intuitive. Ils sont en même temps des prescriptions de calcul pour
l’amplitude invariante correspondante. Les vertex sont caractérisés par une constante de couplage, la charge électrique e dans le cas des interactions électromagnétiques, et par un opérateur
38
CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE
qui décrit les propriétés de transformation de l’interaction. Le lignes correspondent aux propagateurs des particules, réels pour les lignes extérieures, virtuels pour les lignes intérieurs qui
relient deux vertex. Le propagateur 1/q 2 que nous avons trouvé pour le photon virtuel est un
cas spécial du plus général, 1/(q 2 − M 2 ), pour les bosons intermédiaires massifs.
Si plus d’un processus élémentaire peut intervenir dans une réaction, nous devons additionner soit les amplitudes soit les sections efficaces. A cause de la nature quantique des processus
en question il existe deux cas:
– Si les états initial et final des processus sont principalement indiscernables, il faut additionner au niveau des amplitudes.
– Quand il existe une observable qui permet en principe de distinguer les différentes contribution, si elle est réellement mesurée ou non, il s’agit de sous-processus indépendants et
il faut additionner les sections efficaces.
Le premier cas intervient par exemple si l’on considère deux contributions de différent ordre à
la même réaction: l’échange d’un et de deux photons intervient entre les mêmes états initiaux
et finaux. Si l’on les décrit par des amplitudes M1 et M2 , respectivement, l’amplitude carrée
qui rentre dans le calcul de la section efficace est |M|2 = |M21 + M22 + M1 M2 |. Au niveau de
la probabilité apparaissent alors des termes d’interférence entre les amplitudes.
Ceci n’est justement pas le cas si les processus sont discernables en principe. Prenons
l’exemple des différentes orientations du spin des particules qui entrent en interaction. Ceux-ci
sont principalement observables. Si l’on commence avec un état initial non-polarisé, cela correspond juste à un mélange de tous leurs orientations possibles à proportions égales. Il faut donc
moyenner les section efficaces, ou |M|2, sur les orientations du spin des particules initiales. Si
l’on ne distingue pas la polarisation des particules dans l’état final, ont fait juste la somme de
toutes les sections efficaces correspondant aux différentes orientations de leurs spins. Le carré
de l’amplitude qui sort ces deux opérations, donc moyenné sur les spin initiaux et sommé sur
les spins finaux, est dénoté par le |M|2 .
39
Chapitre 5
Interactions électromagnétiques
5.1
Le moment magnétique de l’électron
d’une particule par l’équation
Le moment magnétique, µ, est relie au moment cinétique, L,
q L
(5.1)
µl =
2m
Cela est très facile à voir pour une particule qui circule sur un cercle de rayon r:
1
µl = IA = qωr 2
2
L = mvr = mωr 2
(5.2)
(5.3)
Il est plausible, que la présence d’un moment cinétique intrinsèque, de spin s, mène à un moment
magnétique analogue:
q
µs = g
s
(5.4)
2m
avec le rapport gyromagnétique, ou facteur de Landé, g. Sa valeur dépend de la structure interne
de la particule. Pour un fermion ponctuel, comme l’électron, le muon ou le τ , on a s = 1/2 et
q = −e, donc
e
(5.5)
µe = −ge
4m
Un calcul au premier ordre donne ge 2. Une interaction électromagnétique avec le moment
magnétique peut servir à mesurer ge avec grande précision.
Exemple 9: Penning Trap
L’expérience classique pour la mesure de ge utilise un électron piégé dans une bouteille électromagnétique que l’on appelle un Penning trap 1 . Son principe est montré dans la Figure 5.1.
Le système ressemble à un atome macroscopique où le noyau est remplacé par un champ
extérieur. La Figure 5.2a montre la configuration du champ magnétique et électrique d’un Penning trap. L’électron circule dans un champ magnétique qui est à peu près homogène, sauf pour
sa composante focalisante qui est généré par un anneau de Nickel dans le plan équatorial. Le
champ électrique s’oppose aux excursions le long l’axe du champ magnétique. Il est générée par
une électrode en anneau et deux électrodes en coupe. Les trois modes principaux du mouvement
de l’électron sont visualisés dans la Figure 5.2b.
1. P. Ekstrom et D. Wineland, The Isolated Electron, Sci. Am. 243 (1980) 90;
R.S. Van Dyck, P.B. Schwinberg et H.G. Dehmelt, Phys. Rev. Lett. 38 (1977) 310, Phys. Rev. Lett. 47 (1981)
1679, Phys. Rev. D34 (1986) 722.
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
40
Fig. 5.1 – Penning Trap
CAP ELECTRODE
ELECTRIC-FIELD
LINES
RING
ELECTRODE
NICKEL
RING
AXIAL OSCILLATION
CYCLOTRON MOTION
MAGNETRON
MOTION
CAP ELECTRODE
MAGNETIC-FIELD LIINES
(a)
(b)
Fig. 5.2 – a) Champs magnétiques et électriques dans un Penning trap. L’anneau en Nickel
déforme légèrement le champ magnétique et introduit ainsi un couplage entre le mouvement
circulaire et l’oscillation axiale. b) Trajectoire d’un électron dans un Penning trap. Les trois
modes principaux de l’oscillation sont montrés.
5.1. LE MOMENT MAGNÉTIQUE DE L’ÉLECTRON
41
Calculons les niveaux d’énergie d’un tel atome macroscopique. Pour simplifier, nous faisons abstraction des composantes focalisantes magnétiques et électriques. Il reste un champ
magnétique homogène en direction z:
⎛
⎞
0
⎜
⎟
B=⎝ 0 ⎠
B
qui dérive d’un potentiel
⎛
(5.6)
⎞
−By
⎟
=⎜
A
⎝ 0 ⎠
0
(5.7)
L’Hamiltonien correspondant est
1 2
p − eA
2m
1 2
A
− eA
p
=
p + e2 B 2 y 2 − e ∇
2m
1 2
m
=
px + p2y + p2z + ω 2 y 2 + ωypx
2m
2
H =
(5.8)
(5.9)
(5.10)
avec la fréquence de base, ω = eB/m. En mettant y0 = px /mω, on peut réduire ceci à
H=
p2y
m
p2z
+
+ ω 2 (y − y0 )2
2m 2m
2
(5.11)
Le premier terme correspond à un mouvement libre dans la direction z, comme prévu dans le
choix de la direction du champ. Ce mouvement est contraint par les composantes focalisantes que
nous avons négligées dans le calcul. Les deux termes qui suivent correspondent à un oscillateur
harmonique dans le plan équatorial, avec valeurs propres de l’énergie
1
En = ω n +
2
(5.12)
pour n = 0, 1, 2 etc. En ajoutant le moment magnétique du spin, µs , on obtient
H = H − µs B
(5.13)
Les deux orientations du spin, sz = +1/2 et sz = −1/2, se distinguent donc par la même
différence en énergie ω que les niveaux principaux, pourvu que ge égale exactement 2. Les deux
échelles des niveaux pour spin parallèle et anti-parallèle à z seraient déplacés par un rang, ω.
Cette dégénérescence n’existe pas si la valeur de ge dévie de 2. Les niveaux sont alors décalés
par une fréquence δω = ω(ge − 2)/2 qui peut être mesurée 2.
Le principe de la mesure est montré par son analogue électrique dans la Figure 5.3. Les trois
électrodes vides forment un réseau de capacités qui transmet le signal généré par un émetteur
en haut et qui est reçu par un détecteur en bas. L’électron introduit un RL additionnel dans ce
circuit. L’observation de la transmission en fonction de la fréquence permet par conséquent de
mesurer l’amplitude du signal transmis, qui indique le nombre d’électrons dans l’appareil, et du
décalage en fréquence, δω, qui détermine la déviation (ge − 2)/2. Un exemple de signal détecté
est reproduit dans la Figure 5.4.
2. En effet on excite plutôt les oscillations axiales, en plus des changements de spin. Celles-ci sont couplés
aux niveaux En du mouvement circulaire à cause de l’inhomogéneité légère du champ magnétique.
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
SIGNAL
GENERATOR
SIGNAL
GENERATOR
ELECTRODE
CAPACITANCE
ELECTRON
+ -
+ -
D.C.
VOLTAGE
D.C.
VOLTAGE
EMPTY TRAP
SIGNAL
DETECTOR
SIGNAL
DETECTOR
SIGNAL
GENERATOR
ELECTRON ELECTRON
INDUCTANCE CAPACITANCE
42
ELECTRODE
CAPACITANCE
+ D.C.
VOLTAGE
TRAP WITH ELECTRON
SIGNAL
DETECTOR
Fig. 5.3 – Analogue électrique d’un Penning trap.
0
5
10
15
20
25
AXIAL FREQUENCY SHIFT
DETECTED SIGNAL
CHANGES IN
CYCLOTRON-ORBIT SIZE
TIME
TIMES (MINUTES)
CHANGES IN SPIN ORIENTATION
Fig. 5.4 – A gauche: Amplitude du signal dans un Penning trap en fonction du temps, pour (au
début) sept électrons qui sont perdus un par un. A droite: Décalage en fréquence entre générateur
et détecteur, en fonction du temps. Les minima du décalage au début de la mesure indiquent
les deux orientations du spin. Le grandes variations qui apparaissent plus tard correspondent à
des changements du rayon de l’orbite.
5.2. LA DIFFUSION DE COMPTON
43
La précision des résultats d’une telle expérience est étonnante. On a obtenu il n’y a pas trop
longtemps 3 :
(5.14)
ge = 2.002319304366(20)
Comparaison de cette valeur avec la théorie réclame un calcul de la même quantité jusqu’au
huitième ordre 4 . On trouve un bon accord entre calcul et théorie, même à cette précision sans
égal dans la physique de particules. En effet cette mesure nous fournit l’une des valeurs les plus
précises de la constante de structure fine, α = e2 /4π, qui intervient comme paramètre dans les
calculs.
5.2
La diffusion de Compton
La diffusion de Compton, γe− → γe− , fait intervenir un électron virtuel intermédiaire,
comme le montre la Figure 5.5. La cinématique du processus est caractérisée par l’énergie
ω du photon incident et l’angle de diffusion, θ = (k,k ). La conservation de l’énergie-impulsion
donne pour l’énergie émise
ω
(5.15)
ω =
1+r
avec une réduction r = (1 − cos θ)ω/m où m est la masse de l’électron. Pour la section efficace
différentielle on trouve la formule de Klein-Nishina:
1 2
1
r2
dσ
µ 2
α
=
+
4
µ
dΩ
4m2 (1 + r)2 1 + r
(5.16)
Deux facteurs nous intéressent particulièrement. Le premier est le facteur α2 qui détermine
l’ordre de grandeur de la section efficace. Il sort du fait que chaque vertex fait intervenir un
facteur e dans l’amplitude invariante M. Pour la section efficace on a par conséquent σ ∼
|M|2 ∼ e4 ∼ α2 .
k = (ω ,k )
k = (ω,k)
p = (m,0)
-
e∗
@
R
@
@
p = (E ,
p )
Fig. 5.5 – Un des deux diagrammes de Feynman qui contribuent à la diffusion de Compton,
γe− → γe− , au premier ordre. L’autre diagramme est celui où le photon initial rejoint l’électron
après l’émission du photon final.
Le deuxième facteur intéressant fait intervenir le produit des quadrivecteurs de polarisation
des deux photons, et . Ceux-ci apparaissent dans la fonction d’onde du photon libre
Aν = ν (k) e−ikµ x
µ
3. E.R. Cohen et B.W. Taylor, Rev. Mod. Phys. 59 (1987) 1121
4. T. Kinoshita et W.B. Lindquist, Phys. Rev. D 27 (1983) 877
(5.17)
44
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
qui est la solution des équations de mouvement, Equ. 4.19. Sous la jauge de Lorentz, les
équations de mouvement donnent
(∂µ ∂ µ ) Aν = 0
(∂µ ∂ µ ) ν e−ikx = ν e−ikx (−kµ k µ ) = 0
(5.18)
(5.19)
ce qui signifie justement que k 2 = 0, la condition pour un photon réel. La condition de jauge,
∂µ Aµ = 0, donne
(5.20)
∂µ µ e−ikx = µ e−ikx (−ikµ ) = 0
ce qui signifie que µ kµ = 0. Le quadrivecteur de la polarisation, qui indique la direction du
champ électromagnétique, est alors normal au quadrivecteur de l’impulsion du photon. Par
dessus le marché, cette condition de jauge nous démontre que la fonction d’onde du photon a
seulement trois composantes indépendantes (et non pas quatre comme on pourrait le croire). Il
est donc justifié de l’appeler une particule vecteur.
Quand la polarisation de l’état initial est zéro, et celle de l’état final n’est pas mesurée, il
faut moyenner sur les orientations des spins initiaux et sommer sur ceux de l’état final. Pour
le facteur en question ce procédé donne
4 (µ µ )2 = 1 + cos2 θ
(5.21)
A hautes énergies pour le photon, ω m, on trouve approximativement, pour la section efficace
totale
2πα2
dσ
s
dΩ log
(5.22)
σ=
dΩ
s
m2
avec le carré de l’énergie totale
s = (k + p)2 = (k + p )2
(5.23)
et la constante de structure fine α.
Exemple 10: Diffusion de Compton au LEP
La diffusion de Compton peut être mesurée à très hautes énergies en utilisant un collisionneur
électron-positron comme le LEP (voire Chapitre 2). Le faisceau incident de photons est généré
par le mécanisme de radiation de freinage qui est aussi à l’origine de la radiation synchrotron:
une charge qui est accélérée a tendance à émettre des photons dans une direction perpendiculaire
à l’accélération. Ici le freinage est causé par la force électromagnétique qu’exercent les particules
d’un bunch sur ceux de l’autre. Elle est dirigée plutôt transversale au faisceau, les photons
sont alors émis plutôt longitudinalement. La Figure 5.6 montre le mécanisme. L’électron (ou
le positron) émet un photon. Celui interagit avec un positron (ou un électron) dans l’autre
faisceau par diffusion de Compton. On observe l’électron et le photon sortant de la diffusion
dans le détecteur.
Comme le photon initial relie deux vertex, il s’agit d’un photon virtuel avec k 2 = 0, bien que
notre raisonnement sur l’effet de Compton s’applique aux photons réel, k 2 = 0. Par analyse
cinématique on peut néanmoins sélectionner des évènements pour lesquelles la masse du photon
initial est négligeable, k 2 s.
La Figure 5.7 montre la section efficace pour cette diffusion de Compton avec des photons
quasi-réels mesuré par l’expérience L3 au LEP 5 . On observe en effet la dépendance prévue par
le résultat de l’Equation 5.22, proportionnel approximativement à 1/s.
5. L3 collaboration, M. Accarri et al., Phys. Lett. B439 (1998) 183.
5.2. LA DIFFUSION DE COMPTON
45
γ
e
−
−
e
e
+
γ
e
+
σ [pb]
Fig. 5.6 – Mécanisme pour la réalisation d’une diffusion de Compton à un collisionneur
d’électron-positron. L’électron (ou le positron) émet un photon par radiation de freinage. Celui
interagit avec un positron (ou un électron) dans l’autre faisceau. Bien que le photon soit en
principe virtuel, la cinématique des électrons et photons sortants permet de privilégier des très
basses masses.
10
3
10
2
γ e →γ e
L3
10
Data
|cosθ| < 0.8
QED
20
40
60
80 100 120 140
√s
[GeV]
Fig. 5.7 – Section efficace restreinte aux√angles de diffusion | cos θ| < 0.8, pour la diffusion de
Compton en fonction de l’énergie totale s, mesurée à hautes énergies par l’expérience L3.
46
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
e+
@
R
@ @
γ
e− 6
−
e
γ
Fig. 5.8 – Un des deux diagrammes qui contribuent au premier ordre à l’annihilation en paire,
e+ e− → γγ. L’autre diagramme est celui où les deux photons de l’état final sont permutés.
Exemple 11: Annihilation en paire de photons
En tournant de 90◦ le diagramme de la diffusion de Compton, on obtient un autre processus, l’annihilation d’une paire d’électron-positron en une paire de photons, e+ e− → γγ. Le diagramme de Feynman correspondant est montré dans la Figure 5.8. Vous remarquez que nous
avons aussi converti l’électron sortant du processus de Compton en positron entrant. Ceci reste
sans conséquence parce que ces deux états sont entièrement équivalents.
Avec les modification de la cinématique qui conviennent, à partir du calcul pour la diffusion
de Compton, on arrive à la section efficace pour l’annihilation en paire, dans le système de
centre de masse et en négligeant les masses (s 4m2e ):
α2 1 + cos2 θ
dσ
=
dΩ
s 1 − cos2 θ
(5.24)
Nous reconnaissons encore une fois les facteurs caractéristiques: α2 , qui vient des constantes
de couplage, et 1/s, qui vient de la division par le flux incident.
Le facteur (1 − cos2 θ) dans le dénominateur peut encore étonner, parce qu’il fait diverger la
section efficace quand l’angle de diffusion s’approche de θ = 0◦ ou θ = 180◦ . Une telle divergence
n’est pas admissible, la section efficace qui tient le rôle d’une probabilité doit toujours respecter
une limite supérieure, celle de l’unitarité qui correspond à probabilité 1 pour le processus. Déjà
le facteur 1/s nous paraı̂t un peu suspect, mais la limite dangereuse s → 0 ne peut pas être
atteint, à cause du seuil, s > 4m2e . La divergence angulaire par contre, est bien réelle. Elle
ne se réalise finalement pas à cause des corrections d’ordre supérieur. En effet, une expansion
par ordres d’une petite constante de couplage finit toujours par converger, dans une théorie de
champs basée sur les principes de l’invariance de jauge. La preuve de ce fait a été récompensée
par le prix Nobel 1999 6.
Aussi la section efficace est-elle évidemment finie. Le Figure 5.9 montre des mesures récentes 7.
La section efficace suit avec grande précision – en grandeur absolue ainsi qu’en dépendance en
l’énergie – la prédiction de l’électrodynamique quantique.
6. voir http://www.nobel.se/laureates/physics-1999.html
7. M. Pohl, The L3 Experiment at LEP 200: Electron-Positron Reactions at Highest Energies, Réunion annuelle de la Société Suisse de physique, Montreux, 16 mars 2000
5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS
47
L3
60
50
data
σγγ(γ) (pb)
40
QED
30
20
10
80
100
120 140
√s (GeV)
160
180
200
Fig. 5.9 – Section efficace pour l’annihilation en paire en fonction de l’énergie totale
mesurée à hautes énergies par l’expérience L3.
5.3
√
s,
Annihilation électron-positron en leptons et quarks
L’annihilation des paires d’électron-positron en paires de photons n’est pas la seule réaction
de ce type. Il existe toute une classe de réactions e+ e− → f f̄ d’annihilations en paires de fermionantifermion:
e+ e− → µ+ µ−
e+ e− → τ + τ −
e+ e− → qq̄
(5.25)
(5.26)
(5.27)
Tous ces réactions sont, au premier ordre, décrit par le diagramme de Feynman de la Figure 5.10 8 .
Prenons la première réaction comme prototype. La Figure 5.11 montre un évènement
exemplaire. Dans le centre de masse, l’état final est caractérisé par deux muons d’impulsions égales et anti-parallèles. N’ayant pas d’interaction forte et trop lourds pour causer des
gerbes électromagnétiques, les muons pénètrent tout le matériel du détecteur. La section efficace
différentielle est
dσ α2
= (1 + cos2 θ)
(5.28)
dΩ cm 4s
si l’on néglige les masses, s 4m2µ . L’Equation 5.28 est une distribution angulaire symétrique
vis-à-vis l’angle de diffusion θ. La section efficace totale est
4πα2
σ(e e → µ µ ) =
3s
+ −
+ −
(5.29)
8. On n’inclut pas la réaction e+ e− → e+ e− qui est compliquée par un deuxième diagramme de diffusion, où
les deux électrons échangent un photon au lieu de s’annihiler.
48
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
e− (k)
µ+ (p)
@
@
R
γ(s) @
@
@
@
R
@
@
e+ (k )
µ− (p )
Fig. 5.10 – Diagramme de Feynman de premier ordre pour la réaction e+ e− → µ+ µ− .
10
O
O
OO
O
OOO
O
O
OOO
OO O
OO
O
OO
O
OO
OOO
O
OOO
O OOO
O OOOO
O
O
O
OO
OOO
OO
O
O
O
O
O
O
O
9
Fig. 5.11 – Un évènement de la réaction e+ e− → µ+ µ− observé par l’expérience L3 au collisionneur LEP.
5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS
49
qui réunit encore une fois tous les facteurs, α2 et s−1 , caractéristiques pour les réactions entre
particules ponctuelles. La Figure 5.12 montre des résultats expérimentaux 9 pour la section
efficace totale en fonction de l’énergie initiale carrée, s. La distribution angulaire, Figure 5.13 10 ,
montre une déviation de la forme symétrique de l’Equation 5.28 qui augmente avec l’énergie.
Elle est due à l’interférence avec l’interaction faible que nous allons traiter dans le Chapitre 8.
Fig. 5.12 – Sections efficaces totales pour les réactions e+ e− → µ+ µ− et e+ e− → τ + τ − observé
par l’expérience JADE au collisionneur PETRA.
Exemple 12: e+ e− → µ+ µ− et e+ e− → τ + τ −
Cette section efficace prototype s’applique à tous les réactions d’annihilation qui produisent une
paire de fermions de masse négligeable et de charge ±e, constante de couplage qui se cache
dans la constante de structure fine, α. La même section efficace et distribution angulaire est en
9. B. Naroska, Phys. Rept. 148 (1987) 67.
10. M. Pohl, The MARK J Experiment at PETRA: Gauge Theories on the Workbench, ETH Zürich 1989
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
50
effet observée pour la réaction e+ e− → τ + τ − pour s 4m2τ , comme le montrent également les
Figures 5.12 et 5.13.
MARK J
e+e- → µ+µ-
e+e- → τ+τ-
1.2
1/N dN/dcos θ
1/N dN/dcos θ
1.2
0.8
0.4
0.8
0.4
√s = 34.8 GeV
√s = 43.5 GeV
0.0
0.0
MARK J
e+e- → µ+µ-
1.2
1/N dN/dcos θ
1/N dN/dcos θ
1.2
0.8
0.4
e+e- → τ+τ-
0.8
0.4
√s = 43.8 GeV
√s = 34.6 GeV
0.0
-0.8
-0.4
0.0
cos θ
0.4
0.8
0.0
-1.0
-0.5
0.0
0.5
1.0
cos θ
Fig. 5.13 – Distributions angulaires pour les réactions e+ e− → µ+ µ− et e+ e− → τ + τ − observé par l’expérience MARK J au collisionneur PETRA. Les lignes traitillées indiquent la
forme symétrique de la distribution prédit par QED. Les lignes continues incluent un terme
asymétrique qui vient le l’interférence électrofaible.
En ce qui concerne la production de paires de quarks, il faut tenir compte de deux modifications importantes. Primo, les quarks portent les charges Qu = 2/3 pour (u,c,t) et Qd = −1/3
pour (d,s,b), par rapport à la charge élémentaire, e. Comme la charge du quark intervient à
un seul des deux vertex, il faut introduire un facteur Q2i dans la section efficace. Secundo,
les quarks sont produit en trois couleurs, (r,g,b), charges responsables pour leur interactions
fortes, auxquelles les interactions électromagnétiques sont insensibles. La couleur des quarks
est encore un exemple pour les propriétés qui ne sont observables qu’en principe: n’empêche
que l’on ne connaı̂t aucun moyen pour les mesurer, ils distinguent néanmoins les états finaux
5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS
51
correspondant aux différents couleurs. On doit par conséquent additionner les |M|2, ou bien
les section efficaces. Ils sont évidemment indépendant de la couleur et on obtient en somme
σ(e+ e− → qi q̄i ) = 3Q2i σ(e+ e− → µ+ µ− )
(5.30)
pour chaque saveur i. La masse des quarks est négligeable pour u, d et s, mais non pas pour
les
√ surtout t. Pour ces derniers
√ il existe des seuils de production qui sont
√ quarks lourds c, b, et
s 2mc 3.7 GeV, s 2mb 10 GeV, et s 2mt 350 GeV. Dans la section efficace
inclusive, σ(e+ e− → qq̄), on trouve alors des discontinuités à ces seuils là.
Les quarks de l’état final ne sont pas observés tels quels à cause de leur interaction forte,
qui commence à agir dès qu’ils sont produits. Le champ qui s’établit entre eux est tellement
énergétique que des paires quark-antiquark additionnels sont spontanément formés, qui se regroupent autour des quarks primordiaux et forment des gerbes de hadrons. Ces gerbes, que l’on
appelle des jets de hadrons, suivent la direction initiale des quarks, et leur énergie totale est
celle des quarks. Les évènements e+ e− → qq̄ se présentent par conséquent comme le démontre
l’exemple de la Figure 5.14. La multiplicité de particules chargées et neutres est élevée, et les
particules forment au moins deux jets.
L3
L
L
L
L
3
3
3
3
3
LLLLLL3
L
3
Fig. 5.14 – Un évènement à deux jets d’hadrons, causé par la réaction e+ e− → qq̄ au LEP.
A cause de la conversion des quarks en hadrons, on n’arrive pas forcement à distinguer leur
type (saveur) non plus. On considère plutôt la section efficace hadronique inclusive
σ(e+ e− → hadrons) σ(e+ e− → qi q̄i )
(5.31)
i
qui est au premier ordre donnée par la somme des sections efficaces individuelles, ceci encore
à cause de la discernabilité principale des processus élémentaires. On peut se demander si la
conversion des quarks en hadrons ne modifie pas la section efficace. Ceci est le cas parce que –
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
52
autant que l’on sache – cette conversion se passe toujours, avec une probabilité égale à 1. En
autre mots, les quarks sont toujours et sans résidus convertis en hadrons, la section efficace ne
change donc pas.
Pour compenser la grande réduction ∼ 1/s de toutes les section efficaces électron-positron
avec l’énergie, on forme souvent le rapport
R≡
σ(e+ e− → hadrons)
Q2i
3
σ(e+ e− → µ+ µ− )
i
(5.32)
La somme
√ inclut tous les saveurs qui peuvent être produites à une énergie dans le centre de
masse, s, donnée. Dans les différent régions d’énergie on obtient donc au premier ordre:
R = 3[( 23 )2 + 2( 13 )2 ] = 2 u, d, s
R = 2 + 3( 23 )2 =
10
3
R=
10
3
+ 3( 13 )2 =
11
3
R=
13
3
+ 3( 23 )2 = 5
√
s < 2mc 3.7 GeV
√
u, d, s, c
3.7 <
u, d, s, c, b
10 <
u, d, s, c, b, t
350 <
√
s < 2mb 10 GeV
s < 2mt 350 GeV
√
s
Exemple 13: e+ e− → hadrons
La Figure 5.15 11 compare ce calcul à une compilation de résultats expérimentaux qui proviennent
du collisionneur PETRA. On voit grosso modo la dépendance de la section efficace prédite, y
inclus les discontinuités prévus. Mais les sections efficaces mesurées sont nettement supérieures
aux prédictions. Ceci est encore dû aux ordres supérieurs qui contribuent. On verra dans le Chapitre 7, que les états finaux e+ e− → qq̄g avec gluons additionnels, ajoutent quelques pourcents
à la section efficace hadronique inclusive. A hautes énergies on voit même l’influence des interactions faibles neutres, dont la particule médiatrice Z peut aussi contribuer à la section efficace
totale (voir Chapitre 8).
5.4
Diffusion de fermions ponctuels
Le processus prototype pour la diffusion de fermions ponctuels, e− µ− → e− µ− , est très
similaire à la réaction d’annihilation, tourné de 90◦ comme le montre le diagramme de Feynman,
Figure 5.16. On va s’approcher de ce processus par étapes.
La première étape est de considérer une diffusion par une cible très lourde, sans structure intérieure et sans spin. En faisant abstraction aussi du spin de l’électron projectile et en
négligeant sa masse, on obtient la section efficace de Rutherford
dσ
α2
=
dΩ Rutherford 4E 2 sin4
θ
2
(5.33)
Comme d’habitude, la facteur α2 vient des deux vertex. Le facteur en dénominateur résulte du
propagateur du photon virtuel, qui est
1
1
1
= 2
2
2
q
(k − k)
4E sin4
θ
2
(5.34)
11. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, p.
146-147
5.4. DIFFUSION DE FERMIONS PONCTUELS
53
Fig. 5.15 – A gauche: Section efficace totale pour la réaction e+ e− → hadrons, normalisé par
la section efficace modèle σ(e+ e− → µ+ µ− ).
e− (k)
e− (k )
@
@
R
@
@
)
(
)
@
@
R
@
@
µ− (p)
µ− (p )
Fig. 5.16 – Diagramme de Feynman pour la réaction de diffusion, e− µ− → e− µ− , au premier
ordre.
CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES
54
avec l’énergie du photon incident et sortant, k0 = k0 = E, et l’angle de diffusion θ = (k,k ).
La distribution angulaire est extrêmement raide, pour la diffusion des particules ponctuelles,
comme vous avez pu constater lors de vos travaux pratiques.
Ceci reste le cas quand on tient compte du spin des particules ainsi que du recul de la cible.
On obtient alors la section efficace de Mott
dσ
α2
=
dΩ Mott 4E 2 sin4
θ
2
β cos2 θ2
1 + 2E
sin2
M
(5.35)
θ
2
avec la masse M de la cible. Le facteur additionnel tient compte en numérateur de la conservation du moment cinétique qui réclame la conservation de l’hélicité de l’électron quand sa
vitesse β s’approche de celle de la lumière. L’hélicité est la projection du spin sur la direction
de mouvement d’une particule. Pour un électron relativiste, elle peut être de ±1/2, correspondant au spin parallèle ou anti-parallèle à l’impulsion. La conservation de l’hélicité réclame tout
simplement que la section efficace pour la diffusion en arrière, θ → 180◦, doit disparaı̂tre.
Le facteur additionnel en dénominateur tient compte du recul de la cible. Il correspond au
rapport entre l’énergie de l’électron incident et sortant, E /E. Ce rapport égale 1 pour un cible
infiniment lourde, mais dévie de 1 si un recul important intervient.
La formule de Mott néglige encore la composante magnétique de l’interaction. Pour un
fermion cible ponctuel, avec moment magnétique µ = e/2M, on trouve en somme, au système
du laboratoire et pour un électron projectile relativiste
α2
dσ
=
dΩ Mott 4E 2 sin4
θ
2
1
1+
2E
M
q2
θ
2 θ
cos +
sin
2 2M 2
2
2
sin2
θ
2
(5.36)
Le dernier terme est de nature magnétique et devient important à haute impulsion transférée,
q 2 M 2 . La distribution angulaire suit, dans son premier terme, la forme de la formule de
Rutherford, le deuxième terme tient compte du recul du cible. Le troisième terme contient des
sous-termes proportionnels à cos2 θ et sin2 θ, qui réduisent un peu la raideur de la distribution
angulaire.
55
Chapitre 6
La structure des hadrons
Quand on connaı̂t la structure d’une interaction, on peut l’utiliser comme instrument pour
mieux comprendre les particules qui interviennent. On verra dans ce chapitre comment la
diffusion électron-nucléon est utilisée pour déterminer la structure interne du nucléon. Dans ce
cas on profite du fait que l’électron – autant que l’on sache – est une particule ponctuelle, et
que l’on connaı̂t d’une façon exemplaire les interactions électromagnétiques, à fin d’élucider une
seule inconnue, mais de taille, qui est la distribution et la dynamique des quarks à l’intérieur
du proton et du neutron.
On verra également comment la formation de résonances mésoniques, par un photon incident
par exemple, peut servir à mieux connaı̂tre la force forte qui relie les quarks entre eux.
6.1
Diffusion élastique
Comme d’habitude, on commence nos considérations par le plus simple exemple qui soit,
la diffusion élastique par une cible non-ponctuelle. Prenons d’abord une distribution de charge
statique ρ(x), normalisée pour que la charge de la cible reste élémentaire, c’est à dire ρd3 r = 1.
La section efficace sera alors réduite, par rapport à une cible ponctuelle, à
dσ
=
dΩ
dσ
|F (q)|2
dΩ Mott
(6.1)
par un facteur |F |2, que l’on appelle un facteur de forme:
F (q) =
ρ(x) eiqx d3 x
(6.2)
qui provient, dans le cas statique, seulement de la transformation de Fourrier le la distribution
de charge même. Pour petites impulsions transférées on peut développer le facteur de forme:
F (q) =
(qx)2
+ · · · ρ(x)d3 x
1 + iqx −
2
(6.3)
Si la distribution possède une symétrie sphérique, c’est à dire si ρ(x) = ρ(r), les termes à
exposant impair ne contribuent pas et l’on obtient
F (q) =
(qx)2
1
+ · · · ρ(x)d3 x = 1 − |q|2 < r 2 >
1−
2
6
(6.4)
CHAPITRE 6. LA STRUCTURE DES HADRONS
56
Ainsi le facteur
de forme mesure le rayon moyen quadratique de la distribution de charge,
< r 2 >= ρ r 2 dr, qui représente la taille de la distribution en question. Prenons comme
exemple une distribution exponentielle
ρ(r) ∼ e−Λr
(6.5)
qui mène à un facteur de forme dit dipolaire:
|q|2
F (|q|) ∼ 1 + 2
Λ
2
(6.6)
Il est clair que dans le cas non-statique d’une distribution de charge les choses se compliquent. La distribution elle-même changera pendant le temps d’interaction représenté par la
composante temporelle, q0 , du transfert d’énergie-impulsion. Par l’action des charges en mouvement à l’intérieur de la distribution, les termes électriques et magnétiques seront modifiés et
leurs fonctions mélangées. On trouve alors une section efficace
dσ =
dΩ Lab
α2
4E 2 sin4
Θ
2
E
E
G2E + τ G2M
Θ
Θ
cos2 + 2τ G2M sin2
1+τ
2
2
(6.7)
avec le paramètre
τ≡
−q 2
4M 2
(6.8)
comme rapport entre impulsion transférée et masse de la cible. On appelle GE et GM les facteurs
de forme électrique et magnétique, bien que la distinction de ces deux rôles dépende évidemment
du système de référence. Dans le même sens, on peut attribuer GE et GM à la transformation
de Fourrier de la distribution de la charge et du moment magnétique à l’intérieur de la cible,
bien que cette interprétation ne soit valable que dans un système de référence très spécial 1 .
Exemple 14: Facteurs de forme élastiques du proton
Les facteurs de forme GE et GM du proton sont mesurés en observant section efficace différentielle
de la réaction e− p → e− p et on séparant les termes proportionnels à cos2 θ et sin2 θ de la la
distribution angulaire selon l’Equation 6.7. La Figure 6.1 montre des résultats représentatifs
obtenus par Hofstadter et collaborateurs au SLAC 2 . On observe que GE et GM suivent bien la
forme dipolaire que l’Equation 6.6 prédit pour les distributions exponentielles. Le paramètre Λ
qui caractérise la taille de la distribution, est de Λ 0.84 GeV dans les deux cas. La taille
dGE (q 2 )
< r >= 6
dq 2
= (0.81 × 10−13 cm)2
2
(6.9)
q 2 =0
est alors de l’ordre d’un Fermi, et la même pour GE et GM . Que l’on trouve la même distribution
pour les deux facteurs de forme n’est pas un miracle : les quarks à l’intérieur du nucléon sont
à l’origine de la distribution de la charge et du moment magnétique.
1. Dans le système de Breit, caractérisé par p = −
p et dans le cas non-relativiste, |q| M 2 , on arrive à
séparer les composantes temporelles et spatiales.
2. T. Janssen et al., Phys Rev. 142 (1966) 922.
6.2. DIFFUSION INÉLASTIQUE
57
Fig. 6.1 – Facteurs de forme GE (à gauche) et GM (à droite) pour le proton en fonction de
l’impulsion transférée, extraits de la section efficace pour la réaction e− p → e− p.
6.2
Diffusion inélastique
Les facteurs de forme diminuent rapidement avec q 2 . Par conséquent, la probabilité d’observer une diffusion élastique devient très faible à haut transfert d’énergie-impulsion. Ceci n’est
pas étonnant. Les grands q 2 correspondent aux courtes longueurs d’onde du photon échangé
qui est alors de plus en plus capable de résoudre les structures intérieurs de la particule cible.
Ces structures ne resteront alors pas insensibles à l’énergie-impulsion t transférée: la cible sera
excitée, voire détruite. En autres mots, les processus inélastiques prennent la relève.
Les processus rencontrés à q 2 modéré sont d’abord les excitations de résonances nucléoniques,
comme
e− p → e− ∆+ → e− pπ 0
→ e− nπ +
(6.10)
(6.11)
Ces résonances ont un temps de vie extrêmement court, et par conséquent une distribution de
masse large. L’inélasticité de la réaction est d’abord notée dans la distribution en énergie de
l’électron sortant, qui n’est plus à peu près fixe comme dans le cas élastique. Il se forme des
maxima secondaires qui correspondent aux états excités du nucléon, clairement visibles dans la
distribution de masse invariante des hadrons sortants.
Exemple 15: Electro-production du ∆(1236)
La Figure 6.2 montre un résultat pour une expérience de diffusion électron-proton 3, à une
énergie initiale, k0 3 GeV et à un angle de diffusion fixe. La distribution de l’énergie k0 de
3. S. Galston et al., Phys. Rev. D5 (1972) 519.
CHAPITRE 6. LA STRUCTURE DES HADRONS
58
l’électron sortant montre un grand maximum correspondant à la diffusion élastique, k0 k0 , et
plusieurs maxima secondaires qui correspondent aux différents résonances. La Figure 6.2 montre
également la distribution de masse invariante hadronique correspondante. Un maximum plutôt
large indique la position et le temps de vie de la résonance ∆+ (1236), dont les propriétés sont
étudiées dans l’expérience.
Fig. 6.2 – A gauche: Distribution en énergie de l’électron sortant dans la réaction e− p → e− X
autour de 3 GeV et à angle de diffusion fixe. Les maxima secondaires correspondent aux
résonances. A droite: Distribution en masse invariante hadronique pour la même réaction;
le pic élastique est proéminent.
Une fois la région des résonances traversée, on entre dans de régime des diffusions dites
profondément inélastiques. C’est la région ou le photon interagit individuellement avec les
constituants chargés du nucléon. La section efficace peut être paramétrisée avec deux termes,
comme auparavant,
d2 σ =
dE dΩ lab
α2
4e2 sin4
Θ
Θ
+ 2W1 (ν,q 2 ) sin2
W2 (ν,q ) cos
2
2
2
Θ
2
2
(6.12)
mais avec de fonctions de structure W1 et W2 , qui paramétrisent distribution et dynamique des
constituants du nucléon. Ils dépendent de l’énergie transférée, ν = E − E , qui est l’énergie du
photon, et de sa masse invariante, q 2 . La cinématique est fixé avec un paramètre additionnel,
parce que la masse du système hadronique n’est plus fixée, ni à celle du proton (cas élastique)
ni à celle d’une résonance. La masse hadronique devient donc une variable libre additionnelle.
Les fonctions de structure sont mesurés expérimentalement en observant la dépendance de la
section efficace de l’angle de diffusion, comme dans le cas élastique.
La grande découverte au SLAC, vers la fin des années 60, a été que les fonctions de structure
ne dépendent pas de ν et q 2 séparément, mais de leur rapport,
xBJ =
q2
2Mν
(6.13)
La variable porte dans son indice le nom de son inventeur, J.D. Bjorken 4 . Le phénomène a été
baptisé scaling à l’époque à cause de l’observation très générale que la variable xBJ ne dépend
4. J.D. Bjorken et E.A. Paschos, Phys. Rev. 185 (1969) 1975.
6.2. DIFFUSION INÉLASTIQUE
59
d’aucune dimension, ni d’énergie ni de masse. Les fonctions de structure suivent en effet le
scaling si à l’intérieur du nucléon il existe des sous-structures ponctuelles.
Cette interprétation du phénomène de scaling se fait dans la limite des grands q 2 , ou l’interaction des quarks entre eux est négligeable par rapport à la force transmise par le photon. Les
quarks réagissent alors comme des particules quasi-libres. Dans cette limite, le photon interagit
d’une manière incohérente avec les quarks comme le montre schématiquement la Figure 6.3.
- ~E,p
@
@
R
@
@
=
dx e2i
~
E,p
i
xE,xp
Fig. 6.3 – Diffusion inélastique électron-nucléon dans un modèle de quarks quasi-libres.
Pour obéir aux contraintes cinématiques, le photon cherche un quark partenaire qui porte
une fraction x de l’énergie-impulsion du nucléon qui correspond au xBJ porté par le photon. Par
conséquent, la section efficace sera proportionnelle à la probabilité de trouver un tel quark dans
le nucléon. Dans la limite q 2 → ∞, les fonctions de structure W1 tendent vers des fonctions Fi
qui sont directement liées aux distributions d’impulsion, fi (x) = dpi /dx, des quarks de type i:
νW2 (ν,Q2 ) → F2 (x) =
e2i fi (x)x
(6.14)
i
MW1 (ν,Q2 ) → F1 (x) =
1
F2 (x)
2x
(6.15)
Exemple 16: Diffusion électron-proton profondément inélastique
Les expériences au SLAC ont en effet montré que le phénomène de scaling se produit déjà à q 2
modérés 5. Comme le montre la Figure 6.4, les fonctions de structure se lissent en augmentant
q 2 au dessus de la région des résonances, pour suivre ensuite une fonction de xBJ universelle.
Le scaling des fonctions de structure n’est pas exact. La Figure 6.5 montre des mesures
modernes qui viennent des expériences au collisionneur ep HERA 6 . A petits x, donc à petites impulsions des quarks, les fonctions de structure dépendent fortement de q 2 à cause des
interactions fortes entre les quarks 7 .
Les fonctions de structure peuvent servir à mesurer la distribution en impulsion des constituants chargés, les quarks, dans le nucléon. La figure 6.6 montre qualitativement le comportement de la fonction de structure F2 (x) à partir de la dynamique des quarks à l’intérieur du
nucléon. Si le nucléon était constitué de trois quarks sans interaction, x serait 1/3 pour chaque
5. M. Breidenbach et al., Phys. Rev. Lett. 23 (1969) 935;
F.J. Gilman, Phys. Rept. 4 (1972) 95.
6. G. Bernardini, QCD in Deep Inelastic Scattering at HERA, SLAC Topical Conference, 12/08/98, voir
http://www-h1.desy.de/
7. Les déviations à très grands x sont plus subtiles, parce que la constante de couplage des interactions fortes
dépend du transfert en impulsion.
60
CHAPITRE 6. LA STRUCTURE DES HADRONS
Fig. 6.4 – A gauche:Fonction de structure W2 en fonction de la variable cinématique ω 1/xBJ
à bas et modérés q 2 . Les structures dues aux résonances s’estompent et une forme universelle
émerge. A droite: Comparaison des fonctions de structure mesurées à différents q 2 , en fonction de ω. Dans les limites des erreurs expérimentales, les fonctions de structure dépendent
uniquement de xBJ .
Fp2+ci(x)
6.2. DIFFUSION INÉLASTIQUE
61
16
NMC
x=0.00002(i=24)
BCDMS
x=0.000032
x=0.00008
H1 97 Preliminary
(low Q2)
x=0.00013 (i=20)
x=0.0002
H1 94-97 Preliminary
(high Q2)
x=0.00032
12
H1
H1 96 Preliminary
(ISR)
x=0.00005
14
SLAC
x=0.0005
x=0.0008
NLO QCD Fit
H1 Preliminary
x=0.0013
10
x=0.002
ci(x)= 0.6 • (i(x)-0.4)
x=0.0032
x=0.005
8
x=0.008
x=0.013
6
(i=10)
x=0.02
x=0.032
x=0.05
4
x=0.08
x=0.13
x=0.18
2
x=0.25
x=0.40
x=0.65(i=1)
0
1
10
10
2
10
3
10
4
10
2
5
Q /GeV
2
Fig. 6.5 – Fonction de structure F2 du proton mesurée par l’expérience H1 au collisionneur
HERA, en fonction de q 2 pour différents intervalles en x.
CHAPITRE 6. LA STRUCTURE DES HADRONS
62
F2
quark et F2 serait une fonction δ à la même valeur. Si s’agissait d’une sorte de gaz où les quarks
seraient légèrement liés par des gluons, la valeur moyenne de x serait toujours de 1/3, mais avec
une distribution plus large autour de cette valeur. Si l’on tient compte finalement du fait que
les quarks peuvent émettre des gluons virtuels, qui se transforment en paire de quark-antiquark
de basse énergie, on comprend que la distribution d’impulsion des quarks ait tendance à se
remplir pour x → 0.
1
0.75
0.5
0.25
0
Un seul quark
-
0
0.25
0.5
0.75
1
Trois quarks libres
-
F2
x
1
0.75
0.5
0.25
0
0
0.25
0.5
0.75
1
x
Trois quarks liés
-
F2
0.2
0.1
0
0
0.25
0.5
0.75
1
x
Trois quarks liés + paires additionelles
-
@
@
@
F2
-
0.3
0.2
0.1
0
0
0.25
0.5
0.75
1
x
Fig. 6.6 – Comportement qualitatif de la fonction de structure F2 sous différentes hypothèses
simplifiantes sur les constituants et leurs interactions.
Les données expérimentaux suivent en effet la forme prédit par ce raisonnement. Si vous
inversez l’ordinate logarithmique dans la Figure 6.4 pour obtenir la dépendance de w2 en x au
lieu de ω, vous retrouvez la forme qualitativement caractérisé par la Figure 6.6.
6.3. RÉSONANCES ENTRE QUARKS ET ANTIQUARKS
6.3
63
Résonances entre quarks et antiquarks
En plus des résonances baryoniques qui sont des états excités des baryons ordinaires, il y a
des résonances entre quarks et antiquarks. S’il s’agit de mésons neutres, ils peuvent être produits
in vacuo par un photon virtuel. Leur masse est légèrement inférieur à deux fois la masse du
quark correspondant. La Figure 6.7 montre, par exemple, un processus de production pour la
production du méson ρ, état lié entre quarks légers. Des résonances peuvent aussi figurer comme
états intermédiaires dans des réactions hadroniques. Dans ces cas là, il y a plus de liberté en
ce qui concerne leurs nombres quantiques. En général, les états liés entre quarks et anti-quarks
ont une durée de vie courte, surtout pour les quarks légers.
e− (k)
π + (p)
@
@
R
@
@t
ρ0
t
@
@
R
@
@
e+ (k )
π − (p )
Fig. 6.7 – Diagramme pour la production d’une résonance ρ0 par un photon qui sort d’une
annihilation e+ e− . La résonance se désintègre en une paire de pions.
La dépendance en énergie de la section efficace électron-positron autour d’une résonance
suit généralement une fonction de Breit-Wigner
√
Γ2 /4
√
σ( s) = σmax
( s − M)2 + Γ2 /4
(6.16)
où Γ est la largeur de la
√ résonance. La section efficace est réduite à un demi de sa valeur
maximale, σmax , pour s = M ± Γ/2. Le temps de vie de la résonance est τ = 1/Γ. La
forme de fonction Breit-Wigner ressemble à celle qui décrit un oscillateur amorti classique:
√
s correspond à la fréquence d’excitation, M à la fréquence de résonance et Γ au facteur
amortissant. La section efficace correspond dans cette analogie au carré de l’amplitude de
l’oscillateur.
Pour les résonances entre quarks légers, comme ρ et ω, on trouve des largeurs entre quelques
MeV et 150 MeV, correspondent à des temps de vie entre 10−22 s et 10−24 s. Ils sont produits d’une
manière résonante par le photon intermédiaire, c’est à dire quand la masse du photon virtuel
égale à peu près celle du méson. Par conséquent les mésons ont J P = 1− . Ils se désintègrent en
pions.
Vers une masse d’approximativement 1 GeV, on peut produire la résonance Φ, un état lié
de ss̄, qui se désintègre en particules étranges, Φ → K+ K− , K0 K̄0 . Sa largeur est de l’ordre de
4.4 MeV seulement.
Aux alentours de 3 GeV, on trouve les résonances J/ψ, états liés de cc̄, vers 10 GeV les
résonances Υ, faites de bb̄. Leur largeurs sont petites, ∼ 90 keV pour J/ψ, ∼ 50 keV pour
Υ. Leur temps de vie est donc longue et la section efficace se trouve élargie d’une manière
importante autour de leur masse.
64
CHAPITRE 6. LA STRUCTURE DES HADRONS
Exemple 17: Mésons Upsilon
La Figure 6.9 montre la section efficace e+ e− → hadrons autour de la résonance Υ(1s) et ses
états excités Υ(2s) et Υ(3s) 8 . La forme résonante est mise en évidence. Les états se distinguent
par le moment cinétique relatif des deux quarks. Les spins restent de toute façon parallèles pour
produire un méson vectoriel. La résonance Υ(4s) correspond déjà plutôt à un état de deux
mésons, BB̄, faiblement liés.
L’étude des états résonants, surtout ceux des quarks lourds, permet de mieux comprendre
et le potentiel des forces fortes qui lient les quarks dans un méson, et les mécanismes de
désintégration. La Figure 6.8 9 montre, par exemple, le spectre des résonances cc̄ et bb̄. Les
niveaux d’énergie indiquent que le potentiel suit une loi
V (r) = −
4 αs
+ kr
3 r
(6.17)
avec le paramètre αs 0.2, analogue de la constante de structure fine électromagnétique pour
les interactions fortes, et une autre constante k 1GeV/fm (voir Chapitre 7).
Fig. 6.8 – Spectres des résonances J/ψ et Υ et de leurs états excités.
Les pics de la section efficace autour d’une résonance invitent à construire des machines
pour la fabrication en masse des états correspondants. Les collisionneurs DAFNE à Frascati 10
8. Collaboration CLEO, D. Andrews et al., Phys. Rev. Lett. 44 (1980) 1108, Phys. Rev. Lett. 45 (1980) 219.
Collaboration CUSB, T. Bohringer et al., Phys. Rev. Lett. 44 (1980) 1111, G. Finocchiaro et al., Phys. Rev.
Lett. 45 (1980) 222.
9. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, p. 106
10. voir http://www.lnf.infn.it
6.3. RÉSONANCES ENTRE QUARKS ET ANTIQUARKS
65
est une telle fabrique de Φ, les collisionneurs PEP-II à SLAC 11 et KEK-B 12 sont des fabriques
de B.
Par le système des largeurs décroissant avec la masse de la résonance, on pourrait être
amené à croire qu’une résonance tt̄ serait très étroite, donc aurait un grand temps de vie et une
section efficace importante. Ceci n’est par contre pas le cas du tout. Le quark top est tellement
lourd, 175 GeV, que l’espace de phase pour son désintégration devient énorme. Le quark se
désintègre donc avant que la formation d’un état lié puisse avoir lieu. Par conséquent, il n’y a
guère d’augmentation de la section efficace au seuil pour la production de paires de quarks top.
Fig. 6.9 – Section efficace pour la réaction e+ e− → hadrons autour de la résonance Υ et ses
états excités.
11. voir http://www.slac.stanford.edu/accel/pepii/home.html
12. voir http://www-acc.kek.jp/WWW-ACC-exp/KEKB/KEKB-home.html
66
CHAPITRE 6. LA STRUCTURE DES HADRONS
67
Chapitre 7
Interactions fortes
On vient de voir que les interactions fortes ont des propriétés particulières. Les quarks, vu
à courte distance, se comportent comme des particules quasi-libres à l’intérieur des hadrons.
Néanmoins des quarks libres n’ont jamais été observés. Cela indique que la force forte les confine
à l’intérieur des hadrons et ne permet pas de les séparer à grandes distances. Dans ce chapitre
on essaiera d’expliquer qualitativement ces propriétés apparemment incompatibles.
7.1
Couleur
Nous avons déjà introduit la couleur comme nombre quantique des quarks (voir Chapitre 1)
et nous avons vu sa conséquence immédiate de tripler la section efficace pour la réaction
e+ e− → hadrons (voir Chapitre 5). La couleur est la propriété des quarks responsable de
leurs interactions fortes. La théorie formelle de ces interactions est la chromodynamique quantique QCD. La couleur prend trois valeurs différents, disons rouge, bleu et vert pour les quarks.
On les indique par un index inférieur, par exemple uR , uB et uV . Les anti-quarks portent des
anti-couleurs, par exemple ūR̄ , ūB̄ et ūV̄ .
Les interactions entre quarks procèdent par un échange de couleur. Les bosons médiateurs
des interactions fortes sont les gluons, g. Ils portent une couleur et une anti-couleur et ne
sont donc pas neutres en charge couleur. Ceci en contraste de photon, qui se couple aux
charges électromagnétiques, mais n’en porte pas lui même. Pour les interactions fortes il y
a par conséquent en total huit gluons, avec les combinaisons de couleur:
1
1
RB̄,RV̄ ,B V̄ ,V R̄,V B̄, √ (RR̄ − B B̄), √ (RR̄ + B B̄ − 2V V̄ )
2
6
(7.1)
Avec trois couleurs et trois anti-couleurs, on aurait pu s’attendre à un total de 32 combinaisons.
L’une d’elles, la combinaison totalement symétrique
1
√ (RR̄ + B B̄ + V V̄ )
3
(7.2)
ne porte pas de couleur nette et ne participe par conséquent pas aux interactions. Les huit
gluons restants sont des bosons électromagnétiquement neutres et de masse zéro. Le vertex
de base pour l’interaction forte des quarks est montré dans la Figure 7.1. La constante de
couplage qui intervient au vertex est dénotée par g, son carré apparaı̂t – en analogie à la
constante de structure fine – comme αs = g 2 /4π. L’interaction est la même pour les trois
couleurs ou pour toute superposition de couleurs. Il y a donc invariance sous des rotations
CHAPITRE 7. INTERACTIONS FORTES
68
globales dans l’espace des trois couleurs. Selon le théorème de Noether, cela correspond à une
loi de conservation pour la couleur. Par conséquent le vertex de la Figure 7.1 conserve la couleur.
L’amplitude correspondante est bien sûr aussi indépendante de la saveur des quarks et de leur
charge électromagnétique, qui sont tous les deux conservés par les interactions fortes.
uV
uR
-
gRV̄
Fig. 7.1 – Vertex pour l’interaction entre quarks et gluons.
Si les gluons portent eux même de la couleur, il doivent être capable d’interagir entr’eux.
Parce qu’ils portent en plus couleur et anti-couleur, il en suit l’existence de deux vertex additionnels que montre la Figure 7.2. Le vertex entre trois gluons est proportionnel à g et représente
par conséquent une force de même taille que le vertex quark-gluon. Il faut, dans chaque calcul,
tenir compte du fait qu’il existe beaucoup plus de différentes couleurs pour les gluons que pour
les quarks. Le vertex entre quatre gluons, par contre, est proportionnel à g 2 et donc défavorisé.
gRV̄
gBV̄
gV B̄
gRB̄
gRB̄ gBR̄
gRV̄
Fig. 7.2 – Vertex pour l’interaction entre trois et quatre gluons.
La couleur n’intervient pas comme nombre quantique dans notre caractérisation des hadrons,
ils sont de couleur blanche. Si l’on considère toutes les combinaisons attractives et répulsives
entre quarks dues à l’échange de gluons, on trouve en effet qu’uniquement les combinaisons qq̄
et qqq de couleur neutre correspondent à un état lié. Autres combinaisons, comme par exemple
qq q̄q̄ , subissent une force répulsive et ne correspondent pas à un état stable.
Le méson π + , par exemple, contient une superposition de paires quarks-antiquarks, uR d̄R̄ ,
uB d̄B̄ et uV d̄V̄ , en proportions égales. Les gluons échangés entre les quarks pour établir la liaison
changent en effet constamment la couleur des quarks comme l’esquisse la Figure 7.3, tout en
préservant la couleur blanche du méson. Le même effet joue à l’intérieur d’un baryon.
7.2
Le potentiel fort
A courte distance l’échange de gluons produit un potentiel entre quark et anti-quarks qui
est analogue à celui causé par le photon dans un état positronium. Ce potentiel varie avec la
7.3. POLARISATION DU VIDE
uR
69
uB
RB̄
g
d̄R̄
gV B̄
d̄B̄
uV
d̄V̄
Fig. 7.3 – Les gluons changent constamment la couleur des quarks à l’intérieur d’un méson.
distance comme 1/r, comme le potentiel de Coulomb. A grande distance, on observe un tout
autre comportement: le potentiel devient de plus en plus grand avec la distance. Le potentiel
qui convient à la description des spectres des états J/ψ et Υ est (voir Chapitre 6)
V (r) =
4 αs
+ kr
3 r
(7.3)
avec αs = g 2/4π 0.2. Le deuxième terme détermine le comportement du potentiel à grande
distance, qui ressemble au potentiel d’un ressort à tension croissante, avec une constante k 1
GeV/fm.
Ce deuxième terme est crée par l’interaction des gluons entr’eux. En termes d’un langage
chromostatique, la force additionnelle entre gluons concentre le champ couleur le long d’une
ligne qui relie les deux charges couleur. Il en résulte la force kr qui ne permet pas de séparer
couleur et anti-couleurs, mais les confie à des distances de l’ordre de 1 fm. A cause de la forme
particulière du champ on parle aussi d’un string qui relie les couleurs 1 .
7.3
Polarisation du vide
Une manière plus chromodynamique de décrire le même mécanisme est de comparer les
corrections quantiques des propagateurs du photon et du gluon. Dans le cas du photon, une
correction importante du propagateur du photon est celle qui introduit une boucle d’électronpositron comme le montre la Figure 7.4. Cette boucle crée des charges additionnelles entre
le projectile et la cible. On appelle ce phénomène la polarisation du vide. Dans un langage
électrostatique on peut dire qu’elle masque la charge de la cible comme le visualise la Figure 7.5 2 .
Par conséquent, la charge effective diminue avec la distance. Autrement dit, elle croit avec
le transfert en impulsion q 2 . Ceci est en effet ce que l’on trouve expérimentalement, comme le
montre la Figure 7.6 3 . Pour l’électrodynamique ceci est un petit effet. Il faut monter des transferts d’impulsion quasiment zéro, où α 1/137 est mesuré très précisément (voir l’Exemple Penning Trap, Chapitre 5), jusqu’aux énergies du LEP, pour voir changer α de quelques pourcent.
Pour la QCD, le même effet est beaucoup plus prononcé. A cause de la taille même du
couplage fort, la polarisation du vide et la variation de la charge nette sont plus importants. En
plus, le signe de l’effet est inversé: la force forte devient de plus en plus forte avec la distance.
Ceci est du au fait qu’il existe deux types de polarisation du vide pour les gluons. L’analogue
1. A ne pas confondre avec les théories de strings qui sont considérés comme alternatives aux théories quantiques des champs.
2. F. Jegerlehner, Nucl. Phys. Suppl. 51C (1996) 131.
3. L3 Collab., M. Acciarri et al., CERN-EP-2000-005
CHAPITRE 7. INTERACTIONS FORTES
70
@
@
@
)
(
)
n
)
(
)
@
@
@
+;
;
+;
+
+;
+
+;
;
+;
Fig. 7.4 – Modification du propagateur du photon par boucles d’électrons.
;
+;
+
+;
+
+;
;
+;
+;
+;
+;
;
r
;
Fig. 7.5 – Les charges crées par la polarisation du vide masquent partiellement la charge de la
cible.
136
L3
α-1(Q2)
134
132
130
small angle
large angle
128
-1
0
10
1
2
log(-Q2/GeV2)
3
4
Fig. 7.6 – Variation de l’inverse de la constante de structure fine α−1 avec le transfert en
impulsion q 2 , mesuré au LEP en utilisant le processus e+ e− → e+ e− .
7.3. POLARISATION DU VIDE
71
de la polarisation électromagnétique introduit une boucle de quarks dans le propagateur du
gluon. Elle masque la charge couleur. Mais en plus, le couplage des gluons entr’eux introduit
des boucles de gluons additionnels, qui diffèrent de celle des quarks par un signe parce qu’elles
font intervenir des bosons. Dans un langage chromostatique on pourrait dire que les boucles de
gluons introduisent des paires de charges couleurs-anticouleurs additionnels, donc attractifs. Au
lieu de masquer la charge couleur de la cible, elles la renforcent. A cause du grand nombre de
gluons et de leur masse zéro, les boucles de gluons prennent le dessus et dominent la polarisation
forte du vide.
@
@
@
@
@
@
@
@
@
n
@
@
@
Fig. 7.7 – Contributions au propagateur du gluon par boucles de quarks et gluons.
Par conséquent, la charge couleur de la cible augmente avec la distance, qui est proportionelle
à l’inverse du transfert en impulsion. La figure 7.8 4 montre que cet effet est beaucoup plus
notable que son analogue électromagnétique.
0.4
L3
Rτ
RΖ
Event Shape
QCD Evolution
0.35
αs
0.3
0.25
0.2
0.15
0.1
0
25
50
75
100
125
150
175
200
√s (GeV)
Fig. 7.8
forte, αs , avec le transfert en impulsion
√ –2 Variation du carré de la constante de couplage
√
+ −
s = q , mesuré au LEP en utilisant le processus e e → hadrons ainsi que la désintégration
hadronique du lepton τ .
4. L3 Collab., M. Acciarri et al., CERN-EP-2000-064
CHAPITRE 7. INTERACTIONS FORTES
72
7.4
Hadronisation
A cause de la grande énergie potentielle stockée dans un champs chromostatique à grande
distance, les charges couleurs séparées par une force suffisante créeront des particules au lieu
de devenir des quarks ou gluons libres. Une telle séparation par force se produit, par exemple,
dans la création de quarks e+ e− → qq̄ à hautes énergies. Encore une fois il y a deux approches
pour comprendre qualitativement ce processus:
Dans l’approche chromostatique, la paire de quarks initiale crée des paires quarks-antiquarks
une fois séparés par une distance de l’ordre de 1 fm, comme le montre la Figure 7.9. Ce processus
se poursuit jusqu’à ce que l’impulsion relative entre les quarks soit suffisamment modérée pour
permettre la formation d’états liées. Leur formation se passe le long des strings, donc avec une
impulsion transversale limitée. Ils forment par conséquent des jets qui suivent plus ou moins la
direction des quarks initiaux.
1 1̄
←− ◦ • −→
1 2̄ 2 1̄
←− ◦ •◦ • −→
1 3̄ 3 2̄ 2 4̄ 4 1̄
←− ◦ •◦ •...◦ • ◦ • −→
Fig. 7.9 – Hadronisation dans l’approche chromostatique des strings.
Dans une approche plus chromodynamique, le processus peut être vu en termes d’une cascade
de quarks et gluons La cascade se compose des vertex élémentaires de la QCD, caractérisés par
une constante de couplage d’autant plus forte que masse virtuelle q 2 des participants diminue.
Une partie d’une telle cascade est représentée dans la Figure 7.10.
e−
e+
@
@
@
R
@
@
@
@
@
@
@
@
Fig. 7.10 – Cascade de quarks et gluons qui approxime la première phase de l’hadronisation
dans une approche chromodynamique. Seule une gerbe de particules est montrée.
Il est clair que cette approche ne peut pas servir à complètement couvrir le processus de
l’hadronisation. A grandes distances, la valeur de la constante de couplage prend des valeurs
si grandes qu’une approche perturbative, d’expansion par ordres de la constante de couplage,
ne peut plus converger. Dans ce domaine dominent les effets collectifs, qui aboutissent à la
formation de mésons et baryons.
7.4. HADRONISATION
73
Les hadrons sont de toute façon formés in vacuo, leurs impulsions transversales sont donc
limitées par le principe de Heisenberg à quelques 300 MeV. Les hadrons sont alors concentrés
autour de la direction initiale et forment des jets. Leur impulsion transversale est petite et
indépendante de l’impulsion du quark. Les jets deviennent de plus en plus collimés si l’énergie
du quark augmentante.
Si le premier gluon émis dans la cascade a une impulsion transversale suffisamment grande
par rapport à cette largeur naturelle, une troisième gerbe discernable de particules le long la
direction du gluon se formera. On observe alors un évènement à trois jets comme le montre
la Figure 7.11. Ces évènements sont donc attribués à la réaction e+ e− → qq̄g et leur section
efficace est calculée à partir du diagramme de Feynman de la Figure 7.12.
L3
L
L
L
L
3
L3
L
L
L
L
33
L
L
L
333
Fig. 7.11 – Evènement à trois jets hadroniques créés dans l’expérience L3 au LEP.
e−
e+
q̄
@
R
@
g
@
@
R
@
@ q
e−
e+
q̄
@
R
@
@
g
@ @
@ q
Fig. 7.12 – Diagrammes de Feynman pour l’émission de gluons dans le processus e+ e− → qq̄g.
L’émission de gluons par un quark a toutes les caractéristiques d’un processus de radiation
de freinage. Il existe deux divergences de son amplitude: elle devient très grande pour l’émission
d’un gluon de basse énergie (divergence infrarouge) et pour une émission vers l’avant (divergence
74
CHAPITRE 7. INTERACTIONS FORTES
collinéaire). Dans les deux cas, le gluon devient pratiquement indiscernable dans l’état final
hadronique. Pas conséquent, ce processus doit être inclus dans le calcul de la section efficace
e+ e− → hadrons. On obtient alors une meilleure approximation du rapport R (voir Chapitre 5)
qui est
σ(e+ e− → hadrons)
αs
2
R≡
Q
1
+
(7.4)
3
i
σ(e+ e− → µ+ µ− )
π
i
Cette correction met les donnés en encore meilleure accord avec le calcul, comme le montre la
Figure 5.15.
75
Chapitre 8
Interactions faibles
Les interactions faibles ne méritent pas leur nom. Leur faiblesse apparente à basse énergie est
due au fait qu’elles sont transmises par des particules lourdes, le Z neutre et les W± chargés, dont
le propagateur affaiblit l’amplitude à bas transfert d’impulsion. Leurs constantes de couplage,
g et g , par contre, sont du même ordre de grandeur que la charge électrique, e.
e−
u
νe
@
@
R
@g @
)
( W−
)
@
@
R
@
@
d
νµ
q
νµ
@
@
R
@g @
)
( Z
)
@
@
R
@
@
q
Fig. 8.1 – Diagrammes de Feynman de premier ordre pour les réaction e− u → νe d (à gauche),
et νµ q → νµ q (à droite).
La figure 8.1 montre des interaction faible chargées et neutres typiques. La comparaison
avec diagramme électromagnétique correspondant, Figure 5.16, montre que la structure de
l’amplitude faible est assez similaire à celle de l’électromagnétisme. La composante neutre
des interactions faibles peut même interférer avec les interactions électromagnétiques quand il
s’agit de particules chargées. Il y a néanmoins des différences majeures entre les deux types
d’interactions:
– La charge faible est une quantité à deux composantes, en contraste avec une seule composante pour la charge électromagnétiques et trois composantes pour la couleur. On l’appelle
isospin faible par analogie au spin qui lui aussi a deux composantes libres. On caractérise
les particules par leur isospin faible total, T , et sa troisième composante, T3 .
– La force faible est transmise par des bosons vectoriels, similaires au photon et aux gluons,
mais très lourds. La masse du W± est de l’ordre de 80 GeV, celle du Z est de l’ordre de
90 GeV. Les deux bosons portent eux-mêmes l’isospin faible. En plus les bosons chargés
peuvent évidemment interagir avec le photon.
– Les interactions faibles ne conservent pas la parité. Ainsi ils produisent des phénomènes
de polarisation longitudinale même à partir d’états initials non-polarisés.
CHAPITRE 8. INTERACTIONS FAIBLES
76
Cette non-conservation de la parité est l’exemple le plus visible des symétries respectées par les
autres interactions, mais non pas par les interactions faibles. Celles-ci ne respectent même pas
la symétrie combinée CP et sont par conséquent les seules interactions connues qui distinguent
entre matière et anti-matière. En même temps – et probablement pour la même raison – elles
sont les seules interactions qui relient des particules de différentes générations à un seul vertex.
Par conséquent, elles ne conservent pas la saveur. Ce fait est bien établi pour les quarks, mais
vient d’être observé aussi pour les leptons, en de plus faibles proportions 1 .
Dans ce chapitre on introduira d’abord la non-conservation de la parité par les interactions
faibles chargées. Ensuite on commentera sur trois processus prototypes: la désintégration du
muon via des interactions faibles chargées; l’interférence entre interactions électro-faibles dans
l’annihilation e+ e− en paires de fermions; et la diffusion neutrino-électron pour les pures interactions faibles neutres. On finira par couvrir superficiellement les désintégrations faibles des
quarks ainsi que les oscillations de neutrinos.
8.1
Non-conservation de la parité
En 1956, à partir d’une étude des données expérimentales, Lee et Yang 2 ont conclus que les
interactions faibles ne sont pas invariantes sous l’opération de la parité, PΦ(t,r) = Φ(t, − r).
Pour mettre en évidence leur comportement sous cette transformation, Wu et al. 3 ont conçu
une expérience qui reste un classique de la discipline.
Exemple 18: Expérience de Wu et al.
Elle utilise la désintégration faible des neutrons, n → pe− ν̄e , liés dans des noyaux de 60 Co. A
très basse température, de l’ordre de 0.01 K, et en présence d’un champ magnétique, les vecteurs
du spin de ces noyaux à J = 5 sont fortement alignés avec la direction du champ extérieur.
Leur désintégration, 60 Co(J = 5) →60 Ni∗ (J = 4) e− ν̄e , peut procéder par deux configurations
de spins montrés dans la Figure 8.2.
Dans le cas a), l’électron est émis dans une direction opposée à celle du spin du 60 Co,
dans le cas b) il est émis dans cette direction. Toute combinaison des deux cas est admise par la
conservation du moment cinétique. Le cas a) correspond à un taux différentiel de désintégration
dΓ
σ p
= Γ0 1 −
dΩ
E
(8.1)
ou p et E dénotent impulsion et énergie de l’électron émis, et σ dénote un vecteur unitaire dans
la direction du spin du noyaux. Le cas b), par contre, donne une distribution angulaire
dΓ
σ p
= Γ0 1 +
dΩ
E
(8.2)
L’expérience met en évidence la distribution angulaire du cas a), Equ. 8.1, et n’admet pas une
– même faible – contribution de la configuration b).
1. Super-Kamiokande Coll., Y Fukada et al, Evidence for oscillation of atmospheric neutrinos, Phys. Rev.
Lett. 81 (1998) 1562.
2. T.D. Lee et C.N. Yang, Question of parity conservation in weak interactions, Phys.Rev. 104 (1956) 254.
3. C.S. Wu, E. Ambler, R.W. Hayward, D.D. Hoppes et R.P. Hudson, Experimental test of parity conservation
in beta decay, Phys.Rev. 105 (1957) 1413.
8.1. NON-CONSERVATION DE LA PARITÉ
77
_
νe
60
J=4
λ = +1
Ni *
a)
J=5
e-
λ = −1
e-
λ = +1
60
Co
J=4
60
_
νe
Ni *
b)
λ = −1
Fig. 8.2 – Configurations de spins permises par la conservation du moment cinétique dans la
désintégration 60 Co(J = 5) →60 Ni∗ (J = 4) e− ν̄e .
En effet, conservation de la parité réclamerait que les probabilités des deux configurations
a) et b) de la Figure 8.2 soient les mêmes. La direction du spin, σ , est un pseudo-vecteur avec
Pσ = +σ ; l’impulsion, p, est un vecteur avec Pp = −p. Le terme σ p change son signe sous P, il
est un pseudo-scalaire. Si la distribution angulaire ne représente pas un mélange à proportions
égales entre les Equ. 8.1 et 8.2, la parité n’est pas conservée dans la réaction. Elle est même
violée d’une manière maximale en supprimant carrément l’amplitude du cas b).
Cela veut dire aussi que les interactions faibles chargées n’admettent que certains polarisation des fermions intervenants. Dans notre exemple, les deux spins de l’électron et du neutrino
doivent être alignés avec celui du noyaux pour respecter la conservation du moment cinétique.
Par conséquent, dans le cas de la Figure 8.2a), le spin de l’électron est anti-parallèle à sa direction de mouvement, celui de l’anti-neutrino est parallèle. Si l’on néglige la masse des leptons
émis – celle de l’anti-neutrino est de toute façon très petite – on trouve donc que le lepton a
une hélicité négative, l’anti-lepton une hélicité positive.
Cette propriété des interactions faibles chargées peut être généralisée. Autant que l’on sache,
le W interagit uniquement avec des fermions d’hélicité négative et avec des anti-fermions
d’hélicité positive. Les interactions faibles chargées violent la parité d’une façon maximale.
L’amplitude contient des termes vectoriels (V ) et pseudo-vectoriels (A) en même proportion,
mais avec signe opposé. La structure de l’amplitude est donc caractérisée comme V − A.
En s’inspirant de l’image des boules en rotation pour le phénomène du spin, on parle de
champs gauchers, ψL , si le spin est anti-parallèle à la direction du mouvement, donc pour λ < 0.
Inversement, une particules est appelée droitière si λ > 0. Il est évident que des particules nonpolarisée sont représentée par un mélange statistique avec probabilités égales.
CHAPITRE 8. INTERACTIONS FAIBLES
78
Par conséquent on arrange les leptons gauchers dans des doublets d’isospin faible, les leptons
droitiers dans des singlet:
νe
T = 1/2 ; T3 =
e− L
νµ
T = 1/2 ; T3 =
µ− L
ντ
T = 1/2 ; T3 =
τ− L
+1/2
−1/2
+1/2
−1/2
+1/2
−1/2
eR T = 0 ; T3 = 0
µR T = 0 ; T3 = 0
(8.3)
τR T = 0 ; T3 = 0
De cette façon les champs gauchers ont une charge faible et se couplent au W et Z, les champs
droitiers non. De la même manière on arrange les quarks dans des doublets et singlets:
u
T = 1/2 ; T3 =
d L
c
T = 1/2 ; T3 =
s L
t
T = 1/2 ; T3 =
b L
+1/2
−1/2
+1/2
−1/2
+1/2
−1/2
uR ,dR T = 0 ; T3 = 0
cR ,sR
T = 0 ; T3 = 0
(8.4)
tR ,bR T = 0 ; T3 = 0
On peut se demander pourquoi les composantes droitières du neutrino ne figurent pas dans
ce tableau, bien que celles des particules chargées apparaissent. Ceci est dû au fait que les
neutrinos, étant électriquement neutres et sans couleur, ne subissent aucune force sauf la faible.
Comme cette dernière ne se couple pas aux champs droitiers, ils ne peuvent être produits par
aucune force. Par conséquent et dans la mesure où leur masse est zéro, ils n’existent pas.
L’hélicité est un bon nombre quantique uniquement pour des particules qui voyagent à la
vitesse de la lumière. Ce sont les seules qui peuvent être complètement polarisées longitudinalement. Dans la plupart des cas cette approximation s’applique aussi aux électrons et muons, à
haute énergie même aux leptons tau. Pour les puristes il existe néanmoins un nombre quantique
qui s’appelle chiralité et qui exprime le même concept d’une manière plus rigoureuse. Elle est +1
si la projection du spin sur la direction du mouvement est seulement positive, et -1 autrement,
sans restriction sur la valeur de la composante projetée.
8.2
Désintégration du muon
Le prototype des réactions du W± est la désintégration du muon. Son amplitude de première
ordre est représentée dans la Figure 8.3. Elle fait intervenir les couplages du W± aux leptons
de la première et deuxième génération.
2
Dans son amplitude, le propagateur du W± contribue un facteur ∼ 1/(q 2 −MW
), qui affaiblit
2
2
l’amplitude pour q MW . Aux bas transferts d’impulsion qui figurent dans la désintégration
2
2
des particules légères, où q 2 ≤ m2µ MW
, le propagateur est donc constant, 1/MW
.
Par convention, on absorbe ce résidu du propagateur, avec le carré de la constante de
couplage g 2 , dans la constante de Fermi, GF :
G
g2
√F =
2
8MW
2
(8.5)
8.2. DÉSINTÉGRATION DU MUON
79
νµ (k)
µ− (p)
−
W
-
-
e− (p )
6
νe (−k )
Fig. 8.3 – Diagramme de Feynman de premier ordre pour la désintégration du muon.
Dans cette approximation on obtient une description des interactions faibles qui correspond à
l’interaction directe entre deux courants qui changent la charge des particules
4GF
MCC = √ Jµ+ J −µ
2
(8.6)
Cette approximation est représenté par le diagramme de la Figure 8.4. Les courants sont analogues au courant électromagnétique introduit dans le Chapitre 4. On les dénote – d’une manière
imprécise – comme courants chargés (CC). Analogiquement on obtient comme approximation
pour les interaction du Z pour q 2 MZ2
4GF
MN C = √ 2ρJµ0 J 0µ
2
(8.7)
Ceci est l’interaction de deux courants neutres (NC). La constante ρ
ρ=
MW
MZ cos θW
(8.8)
fait intervenir l’angle de Weinberg, θW , qui mesure le rapport entre les constantes de couplage
des interactions faibles chargées et neutres
tan θW =
g
g
(8.9)
La constante ρ égale 1 avec une bonne précision.
Le taux différentiel de désintégration du muon est (en négligeant me mµ )
dΓ
G2F 2 2
4E =
m
E
(3
−
)
dE 12π 3 µ
mµ
(8.10)
en fonction de l’énergie E de l’électron sortant. Cette énergie peut varier dans les limites 0 ≤
E ≤ mµ /2. Comme le processus µ− → e− ν̄e νµ et pratiquement le seul canal de désintégration
du muon, le taux total est
1
Γ=
=
τµ
=
mµ /2
0
G2F m5µ
192π 3
dE dΓ
dE (8.11)
(8.12)
CHAPITRE 8. INTERACTIONS FAIBLES
80
µ−
νµ
Jµ+
@
@
R =⇒
@
@y
@
@
=⇒
R
@
@
J−
νe
µ
νµ
Jµ0
@
@
R =⇒
@
@y
@
@
=⇒
R
@
@
J0
e−
e−
µ
νµ
e−
Fig. 8.4 – Processus prototypes pour interactions faibles chargées et neutres dans d’approximation de Fermi, qui fait intervenir un couplage direct entre deux courants à faibles transferts en
impulsion. Notez que pour la désintégration du muon l’anti-neutrino sortant a été converti en
neutrino entrant pour donner la direction du courant.
Le temps de vie du muon mesuré étant à peu près 2.2 × 10−6 s, nous trouvons une constante
de Fermi GF 10−5 [1/GeV2 ].
Le facteur 1/m5 vient des facteurs d’espace de phase qui entrent dans le calcul de Γ. Par
conséquent on trouvera la même formule pour d’autres désintégrations faibles des fermions
ponctuels, comme par exemple celles du lepton tau, pourvu que la constante de couplage soit
la même. Le taux partiel de la désintégration analogue est
Γ(τ − → e− ν̄e ντ ) =
BR(τ − → e− ν̄e ντ )
G2 m5
= F 3τ
ττ
192π
(8.13)
Il ne correspond pas directement au taux total parce que le tau a d’autres canaux de désintégration
importants, à cause de sa grande masse.
Exemple 19: Temps de vie du muon
Une des expériences les plus précises qui ont mesuré le temps de vie du muon est représentée
dans la Figure 8.5 4. Un faisceau de µ+ entre par la gauche, est collimé par les absorbeurs en
plomb et arrêté dans la cible en souffre. L’hodoscope de scintillateurs (Sc) enregistre les positrons
provenant de la désintégration et mesure leur temps de passage. La Figure 8.6 montre un résultat
représentatif. Le taux de désintégration par unité de temps suit bien une loi exponentielle, avec
un faible bruit de fond venant de coı̈ncidences accidentelles.
La pente de la courbe donne le temps de vie du muon. Bardin et collaborateurs trouvent
τµ+ = 2197.078 ± 0.073 ns. La valeur moyenne mondiale, déterminée par le Particle Data
Group 5 est
τµ+ = 2197.03 ± 0.04 ns
(8.14)
correspondant à une constante de Fermi 6
GF = (1.16637 ± 0.00001)−5 GeV−2
qui est donc connu avec une précision de 10 ppm.
4. G. Bardin et al., Phys. Lett. 137B (1984) 135.
5. http://pdg.web.cern.ch/pdg/1999/lxxx.html
6. T. van Ritbergen et R.G. Stuart Phys.Rev.Lett. 82 (1999) 488.
(8.15)
8.2. DÉSINTÉGRATION DU MUON
81
Fig. 8.5 – Schématique de l’expérience de Bardin et al. pour le temps de vie du muon. Le
faisceau de µ+ entre par la gauche, est collimé par les absorbeurs en plomb et arrêté dans
la cible en souffre. L’hodoscope de scintillateurs (Sc) enregistre les positrons provenant de la
désintégration et mesure leur temps de passage.
Fig. 8.6 – Taux de désintégration des muons par unité de temps. On observe une loi exponentielle avec un faible bruit de fond causé par des coı̈ncidences accidentelles.
CHAPITRE 8. INTERACTIONS FAIBLES
82
Exemple 20: Temps de vie du lepton tau
Le temps de vie du lepton tau est trop court pour une mesure directe. On le mesure plutôt par
son distance de parcours à hautes énergies. On produit les leptons√tau par e+ e− → τ + τ − , seule
réaction observée à ce jour qui les produit. A hautes énergies, s = 2Eτ , leur temps de vie
dans le laboratoire est dilaté par un facteur γ. Leur parcours moyen, L, est par conséquent
p
ττ
(8.16)
L = γvττ =
mτ
avec un facteur de proportionnalité relativiste et connue. Avec un temps de vie de quelques
centaines de fs, le parcours lui-même est inobservable même à hautes énergies. A une énergie
du τ de 50 GeV, par exemple, le parcours moyen est de l’ordre de 2.5 mm, et donc complètement
contenu dans le tube à vide qui contient les faisceaux. On mesure alors la longueur du parcours
via leur désintégration en trois particules chargées, τ ± → π ± π + π − ντ . La Figure 8.7 montre le
principe. Les trajectoires des trois pions sont mesurées avec un détecteur de traces directement
à l’extérieur du tube à vide, qui est typiquement un détecteur en silicium 7 . Elles sont extrapolées
et leur origine commune détermine le vertex de désintégration du lepton tau. Son origine étant
connue de la position des faisceaux, on détermine alors la longueur du parcours.
(a)
three-prong
L xy
τ
Fig. 8.7 – Principe de la mesure du temps de vie du tau par la reconstruction de son parcours. Son origine (+) est connue par la position des faisceaux. Les trajectoires des pions
produits par sa désintégration sont mesurées dans un détecteur de traces. Elles sont extrapolées
et déterminent un vertex de désintégration. La distance entre les deux points correspond au
parcours du τ .
Une distribution de parcours est montrée dans la Figure 8.8 8 . Dans la représentation logarithmique elle met en évidence le comportement exponentiel attendu, mais modulé par une
résolution expérimentale qui est nettement pire que dans le cas du muon. La pente de la distribution mesure le parcours moyen, qui donne le temps de vie en appliquant l’Equation 8.16.
7. Voir par exemple: L3 Collab., M. Acciarri et al., Nucl. Instrum. Meth. A360 (1995) 103.
8. L3 Collab., M. Acciarri et al., Phys.Lett. B479 (2000) 67.
8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z
Number of Decays / 0.44 mm
Number of Decays / 0.44 mm
10
L3 1994
500
Data
400
Fit
300
200
100
-10
-5
0
5
10
15
20
83
3
L3 1994
Data
10
2
Fit
10
1
-10
Decay length [mm]
-5
0
5
10
15
20
Decay length [mm]
Fig. 8.8 – Distribution de parcours pour les leptons τ se désintégrant en trois pions et un
neutrino, en abscisse linéaire (à gauche) et logarithmique (à droite). La représentation logarithmique met en évidence la loi exponentielle de la désintégration.
La valeur moyenne mondiale du temps de vie du tau, déterminée par le Particle Data Group 5
est
ττ = 290.0 ± 1.2 fs
(8.17)
Ce chiffre est en excellent accord avec la prédiction de l’Equ. 8.13 et démontre que les constantes
de couplage de l’électron, du muon et du tau au W sont les mêmes à quelques pour-milles près.
8.3
Annihilations électron-positron et le Z
Dans le chapitre 5 on avait déjà discuté le processus prototype e+ e− → µ+ µ− pour la production de paires de fermions par l’annihilation électron-positron. En plus des interactions
électromagnétiques. Ce processus peut être engendré par les interactions faibles neutres, comme
le montre la Figure 8.9.
Les états initiaux et finaux sont indiscernables, il faut additionner les amplitudes. Dans la
section efficace apparaissent par conséquent trois termes au premier ordre:
σtot (e+ e− → µ+ µ− ) = σγ + σZ + σint
(8.18)
Le premier terme, σγ , contient le carré de l’amplitude pour l’échange d’un photon, le deuxième,
σZ , celui d’un Z et le troisième, σint , l’interférence entre les deux. Pour le photon, on avait
trouvé dans le Chapitre 5:
dσγ
dΩ
σγ
α2 1 + cos2 θ
4s
4πα2
=
3s
=
(8.19)
(8.20)
CHAPITRE 8. INTERACTIONS FAIBLES
84
e− (k)
e− (k)
µ+ (p)
@
@
R
γ(s) @
@
@
@
R
@
@
e+ (k )
µ+ (p)
@
@
R
Z(s) @
@
@
@
R
@
@
µ− (p )
e+ (k )
µ− (p )
Fig. 8.9 – Diagrammes de Feynman de premier ordre pour la réaction e+ e− → µ+ µ− , engendrés
par le photon (à gauche) et le Z (à droite).
La section efficace totale qui tient compte des trois termes peut être écrite comme suit:
α2 dσ
=
A0 1 + cos2 θ + A1 cos θ
(8.21)
dΩ
4s
et contient un terme symétrique dans l’angle de diffusion, θ = (e− ,µ− ), et un terme asymétrique.
Leurs coefficients sont
A0 = 1 + 2(r)gV2 + |r|2 (gv2 + gA2 )
A1 =
2(r)gA2 + 8|r|2gV2 gA2
avec un terme, r, qui correspond au pôle du Z:
√
2GF
sMZ2
r=
e2 s − MZ2 + iMZ ΓZ
2
(8.22)
(8.23)
qui correspond à la fonction de Breit-Wigner caractéristique pour les résonances. Les couplages
gV et gA proviennent des charges faibles
gV = T3 − 2Q sin2 θW
gA = T3
(8.24)
(8.25)
avec la troisième composante de l’isospin faible, T3 , et la charge électrique, Q. L’indice de
ces constantes correspond aux composantes vectorielles et pseudo-vectorielles de l’interaction
faible neutre. Pour simplifier, et en accord avec l’Equation 8.3, on a mis les mêmes constantes
de couplage pour l’électron et le muon. La décomposition des coefficients A0 et A1 , dans l’Equation 8.22, montre la répartition voulue entre les termes électromagnétiques, 1 et 0 respectivement, les termes d’interférences, ∼ (r) et quadratiques en g, et les termes faibles, ∼ |r|2 et
quadratiques en g 2 .
Le terme d’interférence introduit une asymétrie dans la distribution angulaire que l’on avait
déjà remarqué dans la Figure 5.13.On définit une asymétrie angulaire, AF B , en comparant le
taux de diffusion vers l’avant à celui vers l’arrière
σF − σB
AF B =
(8.26)
σF + σB
avec les sections efficaces partielles
dσ
d cos θ
0 dΩ
0
dσ
d cos θ
=
−1 dΩ
σF =
σB
1
(8.27)
(8.28)
8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z
85
En termes des coefficients et des couplages, on obtient
⎧
AF B
3
2
2
3A1 ⎨ 2 (r)gA pour |s − MZ | ΓZ
2 g2
=
3gV
A
pour |s − MZ2 | ΓZ
8A0 ⎩ (g2 +g
2 )2
V
La section efficace totale est
σ=
(8.29)
A
4πα2
A0
3s
(8.30)
Exemple 21: Annihilation électron-positron en muons
A basses énergies, où r 0 et l’influence de l’interaction faible est négligeable, on retrouve le
résultat électromagnétique, qui correspond à A0 = 1 et A1 = 0. Dans la région intermédiaire, où
(r) se fait sentir, mais où |r|2 est encore négligeable, l’interférence électro-faible se manifeste.
Et finalement, proche de la masse du Z, où les termes proportionnels à |r|2 dominent, on
trouve l’interactions faible neutre qui domine l’interaction électromagnétique par deux ordres de
grandeur.
La Figure 8.10 9 montre une compilation de mesures de la section efficace et de l’asymétrie
angulaire pour e+ e− → µ+ µ− en fonction de l’énergie. La résonance du Z se manifeste par un
énorme pic dans la section efficace, l’interférence électro-faible se manifeste par une asymétrie
angulaire importante aux flancs de la résonance.
La valeur de l’angle électro-faible, sin2 θW est proche d’un quart 10
sin2 θW = 0.23151 ± 0.00017
(8.31)
Par conséquent, on trouve pour les leptons chargés une interaction faible qui est dominée par
sa composante pseudo-vectorielle:
gVl −0.03 ; gAl = −0.50
(8.32)
gVν = +0.50 ; gAν = +0.50
(8.33)
Pour les neutrinos en a
Pour les quarks du type up on trouve:
gVu +0.20 ; gAu = +0.50
(8.34)
gVd −0.30 ; gAd = −0.50
(8.35)
et pour les quarks du type down:
Près de la résonance du Z, on peut négliger complètement et l’interaction électromagnétique
et l’interférence électro-faible. On obtient alors pour la section efficace de toute réaction 11
e+ e− → f f¯ en paires de fermions f :
σZ (s) = σZmax
sγZ2
2
(s − MZ2 ) + MZ2 Γ2Z
(8.36)
9. J. Mnich, Experimental Tests of the Standard Model in e+ e− → f f̄ at the Z resonance, Phys. Rep. 271
(1996) 181.
10. The LEP Collaborations, Aleph, Delphi, L3 and Opal, and the LEP Electroweak Working Group and the
SLD Heavy Flavor and Electroweak Groups, A Combination of Preliminary Electroweak Measurements and
Constraints on the Standard Model, CERN-EP-2000-016 (2000)
11. Toute réaction sauf e+ e− → e+ e− , où plus de diagrammes contribuent.
CHAPITRE 8. INTERACTIONS FAIBLES
86
σ [nb]
10
PEP
PETRA
HRS
MAC
MARK II
1
10
10
TRISTAN LEP
CELLO
JADE
MARK J
PLUTO
TASSO
AMY
TOPAZ
VENUS
L3
+ −
+ −
e e →µ µ
-1
-2
0
20
40
60
80
100
120
140
160
180
AFB
√s [GeV]
SPEAR
1
MARK I
0.75
PEP
PETRA
TRISTAN LEP
HRS
CELLO
AMY
MAC
JADE
TOPAZ
MARK II
MARK J
VENUS
0.5
L3
PLUTO
TASSO
0.25
0
-0.25
-0.5
+ −
+ −
e e →µ µ
-0.75
-1
0
20
40
60
80
100
120
140
160 180
√s [GeV]
Fig. 8.10 – Section efficace es asymétrie angulaire pour√la réaction e+ e− → µ+ µ− en fonction
de l’énergie totale dans le système du centre de masse, s.
8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z
avec un maximum de
σZmax = 12π
87
Γe Γf
Mz2 Γ2Z
(8.37)
La section efficace s’exprime alors en termes du taux de désintégration, ΓZ , d’un boson Z réel.
Le carré de son impulsion est en effet s MZ près de la résonance, cette notion est donc
justifiée. Les taux partiels en électrons, Γe , et en fermions f , Γf , sont
Γf = Nc T3f − 2Qf sin2 θf
GF MZ
√
2π 2
(8.38)
avec les charges faibles et électriques appropriées.
Exemple 22: Couplages faibles pour les leptons
Les couplages gV et gA des leptons sont mesurés en utilisant sections efficaces, asymétries
angulaires et polarisation des réactions e+ e− → l¯l, pour l = (e,µ,τ ). La Figure 8.11 montre
le résultat 12 . On trouve que notre choix pour l’isospin faible des leptons chargés est le bon.
On trouve aussi que toutes les générations ont les mêmes constantes de couplage à quelques
pour-milles près.
-0.031
Preliminary
-0.035
gVl
mH
-0.039
mt
Al (SLD)
+−
-0.043
ll
+ −
ee
+ −
µµ
+ −
ττ
-0.503
68% CL
-0.502
-0.501
-0.5
gAl
Fig. 8.11 – Constantes de couplage des interactions faibles neutres pour les trois générations
de leptons chargés.
Les valeurs expérimentales des constantes de couplage des leptons chargés sont
gVl = −0.03772 ± 0.00041
gAl = −0.50117 ± 0.00027
(8.39)
(8.40)
12. The LEP Collaborations, Aleph, Delphi, L3 and Opal, and the LEP Electroweak Working Group and the
SLD Heavy Flavor and Electroweak Groups, A Combination of Preliminary Electroweak Measurements and
Constraints on the Standard Model, CERN-EP-2000-016 (2000)
CHAPITRE 8. INTERACTIONS FAIBLES
88
Pour les neutrinos on trouve
gVν = gAν = −0.50085 ± 0.00075
(8.41)
Tous ces valeurs sont compatible avec notre attribution de l’isospin faible de l’équation 8.3.
8.4
Diffusion neutrino-électron
Les processus faisant intervenir les neutrinos sont uniquement dûs aux interactions faibles,
parce que les neutrinos ne portent ni charge électrique ni couleur. Le processus qui a permis de découvrir les interactions faibles neutres 13 est la diffusion élastique neutrino-électron
νµ e− → νµ e− . Le diagramme de Feynman de premier ordre est montré dans la Figure 8.12. La
section efficace différentielle est (s MZ2 )
dσ
G2 s
(νµ e) = F [(gVe + gAe )2 + (gVe − gAe )2 (1 − y)2 ]
dy
4π
(8.42)
avec les constantes de couplages gV et gA de l’électron. Ceux du neutrino ont été fixés à un
demi. La variable cinématique est le transfert en énergie relatif
y=
pq
E
Eν − Eν
e
=
pk
Eν
Eν
(8.43)
dans le système de repos de l’électron, c’est à dire dans le laboratoire.
νµ (k ) ν̄µ (k)
νµ (k)
e− (p)
@
@
R
@
@
) Z(q)
(
@
@
R
@
@
e− (p ) e− (p)
ν̄µ (k )
@
@
R
@
@
) Z(q)
(
@
@
R
@
@
e− (p )
Fig. 8.12 – Diagrammes de Feynman pour la diffusion neutrino-électron (à gauche) et antineutrino-électron (à droite).
L’intégration sur cette variable donne la section efficace totale pour la diffusion neutrinoélectron, pour les neutrino de deuxième et troisième génération, νµ et ντ :
σ(νµ e− → νµ e− ) =
G2F s e2
(g + gVe gAe + gAe2)
3π V
(8.44)
G2F s e2
(g − gVe gAe + gAe2 )
3π V
(8.45)
Pour l’anti-neutrino on trouve:
σ(ν̄µ e− → ν̄µ e− ) =
13. Gargamelle Collab., F.J. Hasert et al., Search for elastic muon-neutrino electron scattering, Phys.Lett.
B46 (1973) 121.
8.5. DÉSINTÉGRATIONS FAIBLES DES QUARKS
89
Quand, par contre, on considère des neutrinos de la première génération, comme le νe qui est
abondamment produit dans les centrales nucléaires par la désintégration de neutrons, on doit
tenir compte de la contribution des interactions faibles chargées, comme le montre la Figure 8.13.
Comme les états initiaux et finaux sont les mêmes, on a affaire à une interférence entre les
courants chargés et neutres. Les sections efficaces proviennent de celles des Equations 8.44 et
8.45 en remplaçant gV → (gV + 1) et gA → (gA + 1).
e− (p)
νe (k )
νe (k )
νe (k)
@
@
R
@
@
) Z(q)
(
@
@
R
@
@
νe (k)
-
)@
( @ W (q) ) @
(
R
@
)
@
@
@
−
e− (p)
e− (p )
e− (p )
Fig. 8.13 – Diagrammes de Feynman pour la diffusion neutrino-électron par le courant neutre
(à gauche) et le courant chargé (à droite).
Exemple 23: Sections efficaces neutrino-électron
Les mesures de ces sections efficaces fixent une ellipse dans le plan de gV et gA , les constantes
de couplages de l’électron à l’interaction faible neutre. La Figure 8.14 montre ces quatres ellipses pour les valeurs des couplages correspondant aux Equations 8.44 et 8.45. On montre aussi
une compilation de résultats expérimentaux 14 dans la même représentation. Les ellipses s’interceptent en deux endroits, gV 0 et gA −1/2, et gV −1/2 et gA 0. L’interférence
électro-faible dans les interactions électron-positron décide pour la solution de l’Equation 8.3.
Les section efficaces neutrino-électrons sont extrêmement petites. Les taux sont faibles et
il est difficile d’obtenir des résultats précis pour les sections efficaces. Les contraintes pour les
couplages sont par conséquent assez faibles. La comparaison avec les résultats obtenus au LEP,
voir la Figure 8.11, met en évidence l’énorme progrès expérimental dans ce domaine venu avec
les expériences électron-positron du LEP et du SLC.
8.5
Désintégrations faibles des quarks
Les interactions entre le W± et les quarks se passent, d’une manière dominante entre les
membres de la même génération, mais elles existent aussi entre deux générations. La Figure 8.15 montre un exemple pour le cas dominant, π + → µ+ νµ , ainsi qu’un exemple pour
une désintégration au delà des générations, K+ → µ+ νµ .
Le rapport entre leurs taux partiels est
τπ+ BR(K+ → µ+ νµ )
Γ(K+ → µ+ νµ )
=
Γ(π + → µ+ νµ )
τK + BR(π + → µ+ νµ )
(8.46)
14. J. Mnich, Experimental Tests of the Standard Model in e+ e− → f f̄ at the Z resonance, Phys. Rep. 271
(1996) 181.
CHAPITRE 8. INTERACTIONS FAIBLES
90
1.0
1987
e+ e - → µ+ µ -
νµ e-
gA
0.5
–
νµ e-
0.0
-0.5
–
ν ee -
–
ν ee -1.0
-1.0
-0.5
νe e 0.0
0.5
gV
Fig. 8.14 – Ellipses représentant les sections efficaces neutrino-électron constantes dans le plan
de gV et gA , constantes de couplage de l’électron au courant neutre. A gauche: résultat prévu
par le calcul de première ordre
µ+
-
u
d
@
W+
@
R
@
@
νµ
µ+
u
s
@
W+
@
R
@
@
νµ
Fig. 8.15 – Diagramme de Feynman pour la désintégration π + → µ+ νµ (à gauche) et K+ →
µ+ νµ (à droite).
8.5. DÉSINTÉGRATIONS FAIBLES DES QUARKS
91
2.60 × 10−8 63.5%
1.23 × 10−8 100%
=
(8.47)
et donc de l’ordre de 1. Ce résultat expérimental montre que la désintégration du kaon est très
défavorisée. A cause du grand espace de phase du kaon par rapport au pion, on se serait attendu
à un rapport
mK + 5
495 5
Γ(K+ → µ+ νµ )
O(100)
(8.48)
Γ(π + → µ+ νµ )
mπ+
140
On en conclut que les interactions inter-génération sont défavorisées par rapport aux interactions intra-génération, par au moins un facteur 100 dans le taux, ou un facteur 10 dans
l’amplitude.
En 1963, N. Cabbibo 15 a proposé une manière de voir ces processus. Les états qui interagissent avec le W± ne sont pas les quarks qui figurent dans le Tableau 8.4, mais des mélanges
u
d
L
c
s
L
t
b
(8.49)
L
Les états d , s et b , ne sont pas les états propres de l’opérateur de masse, donc pas des vraies
particules qui évoluent dans l’espace-temps, mais ils proviennent d’une rotation dans l’espace
des saveurs. Comme cette rotation ne doit pas changer le nombre de fermions, l’opération doit
être unitaire. Pour deux générations on a symboliquement
d = d cos θC + s sin θC
s = −d sin θC + s cos θC
(8.50)
(8.51)
où l’on a substitué le nom du quark pour sa fonction d’onde. Ceci correspond à une modification du courant faible chargé des quarks: on met un peu d’amplitude d’un quark d’une
autre génération dans la fonction d’onde de chaque quark du type down. Par conséquent, des
amplitudes de leurs interactions avec le W± changent. Pour les interactions dominantes du W,
avec les quarks ud et cs, par exemple, la rotation introduit un facteur cos θC dans l’amplitude.
Pour les interactions défavorisés, les interactions du W± avec us et cd dans notre exemple,
un facteur sin θC apparaı̂t. Les taux relatives des deux types d’interactions, comme celui de
l’Equation 8.48, sont donc réduits par un facteur tan2 θC . A partir de la réduction observée on
conclut donc à un angle de rotation θC 10◦ .
En ce qui concerne les trois générations de quarks, on introduit une notation matricielle
entre les états qui figurent dans le courant faible chargé, d , s et b , et les “vrais” quarks, d, s
et b:
⎛ ⎞
⎛
⎞⎛
⎞
d
Vud Vus Vub
d
⎜ ⎟
⎜
⎟⎜
⎟
(8.52)
⎝ s ⎠ = ⎝ Vcd Vcs Vcb ⎠ ⎝ s ⎠
b
b L
Vtd Vts Vtb
La matrice unitaire V s’appelle la matrice de Cabbibo-Kobayashi-Maskawa (CKM) d’après ses
inventeurs. Les bandes actuellement connues pour les valeurs absolues de ses éléments sont 16
⎛
⎞
0.9742 − 0.9757 0.219 − 0.226
0.002 − 0.005
⎜
0.9734 − 0.9749 0.037 − 0.043 ⎟
⎝ 0.219 − 0.225
⎠
0.004 − 0.014
0.035 − 0.043 0.9990 − 0.9993
15. N. Cabbibo, Unitary symmetry and nonleptonic decays, Phys. Rev. Lett. 10 (1963) 531.
16. http://pdg.web.cern.ch/pdg/1999/kmmixrpp.ps
(8.53)
92
CHAPITRE 8. INTERACTIONS FAIBLES
Ces facteurs interviennent à chaque vertex du W± avec une paire de quarks. Les valeurs absolues
sont mesurées en comparant les taux de désintégration de chaque type, sauf pour les interactions
du quark top où ils sont déduits de l’unitarit́e de la matrice. Il convient de noter que les éléments
de la matrice peuvent être complexes. Par conséquent il peut apparaı̂tre un angle de phase non
trivial dans la matrice. Ce facteur rend non-invariant les amplitudes concernés sous l’opération
CP.
Les éléments de la matrice deviennent de plus en plus petits quand on s’éloigne de la
diagonale. Ceci veut dire que les interactions intra-générations dominent le courant faible chargé.
Les interactions inter-génération qui sautent une génération sont défavorisé, ceux qui sautent
deux générations le sont encore plus. La structure de la matrice favorise par conséquent les
chaı̂nes de désintégrations en cascade, comme par exemple
t → bl+ νl
→
cl− ν̄l
→
sl+ νe
→ ul− ν̄l
8.6
(8.54)
Oscillations particule-antiparticule et violation de CP
La matrice CKM n’est pas nécessairement réelle, mais permet une phase complexe nontriviale, que l’on ne peut pas faire disparaı̂tre par une rotation globale dans l’espace des saveurs.
L’existence d’une telle phase a des conséquences très importantes que l’on va discuter dans ce
qui suit.
On a déjà vu que l’interaction faible viole la parité, P, d’une façon maximale. A part
l’expérience de Wu citée dans l’Exemple 8.1, on peut encore prendre la désintégration du pion
chargé comme exemple. Le canal dominant est π + → µ+ νµL . Le neutrino produit dans cette
désintégration doit être gaucher à cause de la structure de l’interaction même qui le réclame.
Comme le pion est un boson scalaire, le µ+ doit aussi être gaucher, ce qui est admis dans la
mesure où sa masse est importante et lui permet d’avoir la “mauvaise” hélicité. Ceci explique
d’ailleurs pourquoi la désintégration du π ± en électron est tellement défavorisée malgré son
facteur de l’espace de phase beaucoup plus important: la faible masse de l’électron le contraint
d’autant plus d’avoir la “bonne” hélicité, pourtant défendue par la conservation du moment
cinétique.
La désintégration du pion chargé viole en même temps la symétrie de la conjugaison de
charge, C. Sous cette opération, on obtient
C(π + → µ+ νµL ) = (π − → µ− ν̄µL )
(8.55)
ce qui est défendu par le fait que le W ne se couple pas à l’anti-neutrino gaucher, mais uniquement à ν̄R . Comme les symétries C et P sont donc tous les deux violées d’une façon maximale
par les interactions faibles chargées, on pourrait s’attendre à ce que la symétrie PC combinée
soit respectée. Ceci est en effet le cas dans les exemples cités. Pour le pion il est simple de vérifier
que l’opération CP convertit en effet la désintégration du π + en celle du π − ; ces processus sont
donc des états propres de CP.
Mais ceci n’est pas le cas pour tous les processus faibles chargés. Regardons un peu plus
de près les mésons neutres comme K0 (d,s̄), ou B0 (d,b̄). Ceux-ci peuvent se convertir dans leurs
propres anti-particules par les processus de deuxième ordre dont la Figure 8.16 montre les
diagrammes de Feynman.
8.6. OSCILLATIONS PARTICULE-ANTIPARTICULE ET VIOLATION DE CP
d
K0
s
W
-
-
u
u
?
6
s
d
K̄0
K0
d
s
u
-
W
(
)
(
)
(
)
(
)
(
)
-
W
93
s
K̄0
d
u
W
Fig. 8.16 – Diagrammes de Feynman pour la conversion de K0 en K̄0 . Les diagrammes sont
dominant à cause de mu mc mt . Les diagrammes pour le B0 s’obtiennent en remplaçant
les quarks s par des quarks b.
Les mésons pseudoscalaires K0 et B0 sont des états propres de P
PΦK0 = −ΦK0 ; PΦK̄0 = −ΦK̄0
(8.56)
mais non pas de C parce que cette opération change l’étrangeté:
CΦK0 = ΦK̄0 ; CΦK̄0 = ΦK0
(8.57)
Par conséquent, ni K0 , ni K̄0 sont des états propres de CP. Par contre on peut construire des
combinaisons linéaires
ΦK1 =
√1
2
(ΦK0 − ΦK̄0 ) ; ΦK2 =
√1
2
(ΦK0 + ΦK̄0 )
(8.58)
qui sont des états propres avec CP(ΦK1 ) = +ΦK1 et CP(ΦK2 ) = −ΦK2 . Si la valeur propre de
CP était conservée en interactions faibles, K1 et K2 seraient des particules qui se désintègrent
par la force faible, avec les états finaux K1 → π + π − et K2 → π + π − π0 qui ont les bonnes
propriétés sous CP.
Ceci est approximativement vrai. Les états K1 et K2 sont presque identiques aux particules
0
KS et K0L que l’on trouve dans la liste du Particle Data Group 17 . A cause des deux facteurs
de l’espace de phase très différents, un trouve un temps de vie du K1 qui est beaucoup plus
court que celui du K2 , ce qui explique la notation du K short et du K long. Mais l’identification
KS K1 et KL K2 n’est pas parfaite.
D’abord, les deux masses ne sont pas tout à fait les mêmes, les deux particules se distinguent
par un petit décalage de
∆m = m1 − m2 3.5 × 10−6 eV
(8.59)
Cette différence en masse produit des oscillation particules-antiparticules dans le temps.
Imaginez vous un mésons K1 au repos dans le vide. Sa fonction d’onde est
ΦK1 (t) = ΦK1 (0)eim1 t e−Γ1 t/2
(8.60)
avec m1 et Γ1 la masse et la largeur du K1 . La densité de probabilité de trouver un K1 au temps
t est
Φ∗K1 (t)ΦK1 (t) = |ΦK1 (0)|2 e−Γ1 t
(8.61)
et de même pour un K2 , avec m2 et Γ2 .
17. http://pdg.web.cern.ch/pdg/1999/s012.pdf et http://pdg.web.cern.ch/pdg/1999/s013.pdf
CHAPITRE 8. INTERACTIONS FAIBLES
94
Comme les interactions fortes conservent les saveurs, y inclus l’étrangeté, un état produit
par eux sera un état avec étrangeté définie, comme K0 ou K̄0 . Si l’on produit, par exemple, un
K0 à t = 0, on aura un mélange de K1 et de K2 avec
1
ΦK1 (0) = ΦK2 (0) = √
2
(8.62)
A un temps t plus tard on trouvera
Γ1 +Γ2
1 −Γ1 t
=
e
+ e−Γ2 t + 2e− 2 cos ∆mt
4
Γ1 +Γ2
1
∗
e−Γ1 t + e−Γ2 t − 2e− 2 cos ∆mt
ΦK̄0 (t)ΦK̄0 (t) =
4
Φ∗K0 (t)ΦK0 (t)
(8.63)
(8.64)
Si l’on mesure alors l’étrangeté de l’état en fonction du temps (par encore une interaction forte,
par exemple), on trouve qu’elle oscille entre K0 et K̄0 avec une fréquence ∆m.
Jusqu’ici la symétrie combinée CP est encore respectée. Mais on trouve en effet que la
particule de long durée de vie, K0L K1 à une faible probabilité de se désintégrer en π + π − ,
état avec la mauvaise valeur propre de CP. On doit alors admettre que K0L K2 contient une
faible amplitude de K1 aussi:
1
(ΦK2 + ΦK1 )
ΦKL = 1 + ||2
(8.65)
Le coefficient || 2.3 × 10−3 est petit mais non zéro. Par conséquent, les interactions faibles
chargées violent aussi la symétrie CP, mais seulement un petit peu.
Une phase complexe dans la matrice CKM permet d’introduire cette petite asymétrie dans
le mélange des états qui interviennent dans les interactions faibles. On trouve un angle de
phase Φ tan−1 ∆mτS 45◦ . Ceci décrit le phénomène en utilisant la matrice CKM, mais
ne l’explique pas. La violation de CP dans les interactions faibles est le seul effet connu qui
distingue la matière de l’anti-matière. La violation de CP est un sujet de recherche très actuel,
dans le secteur des kaons aussi bien que dans les désintégrations du B0 .
8.7
Oscillations de neutrinos
Un phénomène analogue vient d’être découvert dans la famille des neutrinos. Des oscillations
dans le vide entre neutrinos peuvent se produire si les neutrinos ont une masse non-zéro et si
cette masse varie avec les générations.
Considérons deux saveurs de neutrinos, νe et νµ par exemple, qui participent aux interactions
faibles, et deux états propres de l’opérateur de masse – deux vraies particules – ν1 et ν2 avec
masses m1 et m2 . Les relations entre les deux sont
νe
νµ
=
cos θ12 sin θ12
− sin θ12 cos θ12
(ν1 ν2 )
(8.66)
Les deux états ν1 et ν2 propagent, dans la direction z par exemple, avec leurs fonctions d’onde
ψi (t) = ψi (0)e−i(Ei t−pz)
ψ1 (0)e
−im2 z
i
2E
(8.67)
(8.68)
8.7. OSCILLATIONS DE NEUTRINOS
95
où la deuxième équation est valable dans l’approximation ultra-rélativiste E = p + m2 /2E
et t = z. Considérons alors un faisceau de νµ = −ν1 sin θ12 + ν2 cos θ12 à t = 0, par une
désintégration de π + → µ+ νµ , par exemple. A un temps t donné, donc à une distance z de son
origine, ce faisceau sera composé comme
ψ(z) = −ψ1 (0) sin θ12 e
1m2
1z
2E
+ ψ2 (0) cos θ12 e
1m2
2z
2E
(8.69)
La probabilité de trouver un νe = ν1 cos θ12 + ν2 sin θ12 dans ce faisceau sera alors
Pνµ →νe (z) =
1m2
1z
cos θ12 sin θ12 e 2E
−e
1.27δm2 z
E
= sin2 2θ12 sin2
1m2
2z
2E
(8.70)
(8.71)
où le facteur 1.27 tient compte des constantes ainsi que de la conversion des unités ainsi que
l’on peut mettre δm2 = m21 − m22 et E en GeV et z en km. Les deux facteurs de l’équation
correspondent à l’amplitude et at la phase d’une oscillation. En choisissant une distance z qui
est du même ordre de grandeur que δm2 /4E on peut alors faire disparaı̂tre une partie des νµ
et les convertir en νe . Il est évident par l’unitarité de l’opération que Pνµ →νµ = 1 − Pνµ →νe .
Une telle disparition de νµ a récemment été observée 18 . Les rayons cosmiques incident sur
l’atmosphère de la Terre sont pour la plupart des protons. La gerbe hadronique qu’ils causent
dans l’atmosphère sont dominés par des pions. En se désintégrant, ces pions produisent des
neutrinos
π + → µ+ νµ ; µ+ → e+ νe ν̄µ
(8.72)
π − → µ− ν̄µ ; µ− → e− ν̄e νµ
Il devait y avoir, par conséquent, deux fois plus de νµ et ν̄µ dans ces gerbes que de νe et ν̄e . Si,
par contre, les neutrinos subissent des oscillation, le rapport des deux générations de neutrinos
devait varier avec la distance. Heureusement, la terre elle-même nous donne les moyens de
faire varier la distance entre source et cible sans bouger l’expérience. Les neutrinos venant des
antipodes parcourent une distance plus grande par le diamètre de la terre que ceux venant
du zénith. Comme le flux primaire de protons cosmiques est homogène et isotrope, et comme
les neutrinos de basse énergie n’interagissent pratiquement pas avec la matière terrestre, toute
variation de rapport entre νµ et νe avec l’angle vis-à-vis le zénith indique des oscillations.
Le flux des neutrinos est mesuré et leur saveur identifiée en mesurant le taux des réactions
νµ N → µ− hadrons
νe N → e− hadrons
(8.73)
(8.74)
ou N dénote génériquement protons et neutrons. Avec une section efficace connue, le taux de
réaction est proportionnel au flux incident de neutrinos. On trouve expérimentalement que le
flux observé est compatible avec une probabilité de survie qui est
Pνµ →νµ
1.27δm223 z
= 1 − A23 sin
E
2
(8.75)
A23 = 10.0
0.2
(8.76)
avec une amplitude
18. Super-Kamiokande Coll., Y Fukada et al., Evidence for oscillation of atmospheric neutrinos, Phys. Rev.
Lett. 81 (1998) 1562.
CHAPITRE 8. INTERACTIONS FAIBLES
96
et donc un angle θ23 de 45◦ ± 13◦ . La différence des carrés de masse est de l’ordre de 3 × 10−3
eV2 et donc extrêmement petit. Comme les indices l’indiquent, il est considéré plus probable
que ces oscillations des neutrinos atmosphériques se passent entre la deuxième et la troisième
génération, c’est à dire entre νµ et ντ .
En général, la relation entre les états participants aux interactions faibles leptoniques, νe ,
νµ et ντ , et les états propres de l’opérateur de masse, ν1 , ν2 et ν3 , est décrit par une matrice
unitaire de 3 × 3 éléments, analogue à la matrice de Cabbibo-Kobayashi-Maskawa pour les
courrants hadroniques. Pour les leptons, on l’apelle la matrice de maki-Nakagawa-Sakata.
8.8
Couplages entre bosons électro-faibles
On a constaté que les bosons vectoriels porteurs de forces électro-faibles portent eux-mêmes
les charges électro-faibles; les W± ont une charge électrique, les W± et le Z ont un isospin
faible. Par conséquent il existe des vertex d’interaction entre ces bosons. Les plus importants
sont montrés dans la Figure 8.17.
W+
γ
W+
Z
W−
W−
Fig. 8.17 – Vertex pour les interaction entre les boson électro-faibles.
Les bosons chargés peuvent alors être produit en l’annihilation électron-positron, par la
réaction e+ e− → W+ W− . Les diagrammes de Feynman de première ordre sont montrés dans
la Figure 8.18. L’équilibre et l’interférence entre les trois contributions est indispensable pour
le bon fonctionnement de la théorie. Les processus son individuellement divergeants, seule leur
somme (au niveau des amplitudes) est finie. Le graphe avec l’échange d’un νe virtuel, par
exemple, donne à lui seul une section efficace
σν =
πα2 s
4
96 sin4 θW MW
(8.77)
dans la limite s m2W asymptotique. Cette section efficace croit avec ∼ s et éventuellement
viole la limite d’unitarité. En prenant, par contre, les trois processus ensemble, avec les couplages
requis par la condition d’unification, on obtient
σtot =
s
πα2 s 1
log 2
4
Mw
2 sin θW s
(8.78)
dans la même limite s m2W . Cette compensation nécessite l’existence des couplages γW+ W−
et ZW+ W− , avec leurs couplages exactement comme prévus.
Exemple 24: Annihilation électron-positron en paires de W
8.8. COUPLAGES ENTRE BOSONS ÉLECTRO-FAIBLES
e+
−
e+
W+
@
@
R
γ/Z
@
@ e
W
-
97
W+
νe
-
e−
−
W−
Fig. 8.18 – Processus élémentaires contribuant à la réaction e+ e− → W+ W− .
Les données pour la section efficace de la réaction e+ e− → W+ W− au LEP soutiennent l’hypothèse que la compensation des processus électro-faibles a en effet lieu. Le Figure 8.19 montre
les mesures au LEP comparées à la théorie complète et aux contributions des différents processus.
⎯
σ(e+e−→W+W−(γ)) [pb]
√s ≥ 189 GeV: preliminary
L3
20
10
Data
Standard Model
no ZWW vertex
only νe exchange
0
160
170
⎯
180
190
200
√s [GeV]
Fig. 8.19 – Section efficace pour la réaction e+ e− → W+ W− au LEP, comparée à la théorie
complète et ses sous-processus.
L’inspection détaillée du processus montre en effet que le W a exactement les propriétés que
l’on attend d’un boson vectoriel ponctuel. Sa charge est ±e, son moment magnétique (dipolaire)
est
e
µW =
(8.79)
MW
CHAPITRE 8. INTERACTIONS FAIBLES
98
et son moment électrique quadrupolaire est
QW = −
e
2
MW
(8.80)
Les valeurs trouvés par les expériences sont compatibles avec ces valeurs et ne permettent pas des
déviations au delà des erreurs de mesure, qui sont de l’ordre de quelques pourcents seulement.
Avec les couplages entre les bosons faibles, une dépendance caractéristique des constantes
de couplages faibles de la distance est prédite. La Figure 8.20 montre l’évolution 19 des trois
constantes de couplage
5 g 2
3 4π
g2
=
4π
g2
= s
4π
α1 =
(8.81)
α2
(8.82)
α3
(8.83)
construits en suivant le modèle de la constante de structure fine, pour les interactions faibles
neutres, chargées et l’interaction forte. Les trois extrapolations se croisent à une énergie qui est
de l’ordre de 1014 GeV, où tous les interactions atteignent la même puissance. A cette énergie,
une grande unification qui réunit toutes les forces dans une seule est donc concevable.
Fig. 8.20 – Evolution des constantes de couplage pour les interactions électro-faibles et fortes
avec l’énergie.
19. U. Amaldi et al., Phys. Rev. D36 (1987) 1385.
99
Chapitre 9
Particules et cosmologie
Depuis quelques décennies, les liens entre la cosmologie – comme théorie physique de l’univers – l’astrophysique et la physique des particules – comme disciplines expérimentales – deviennent de plus en plus évidents. Le but ambitieux d’une synergie entre ces disciplines serait de
construire un modèle standard de l’univers, couvrant de son début jusqu’à sa fin, à partir uniquement des mécanismes microscopiques. Dans cette perspective, la cosmologie deviendra une
branche appliquée de la physique des particules. Au moins pour le moment et tant qu’il manque
un bon nombre d’ingrédients dans un tel modèle, les rôles sont plutôt inversés: la cosmologie
sert à indiquer les défauts et omissions du modèle standard de la physique des particules et de
leurs interactions. Ceux-ci sont à rechercher en utilisant les observations en astrophysique ainsi
que celles réalisées aux accélérateurs.
Un des plus intéressants aspects de cette convergence des disciplines vient du fait qu’astrophysique et cosmologie font intervenir la gravitation, d’habitude négligée en physique des
particules.
Les observations indiquent que notre univers a été crée il y a quelques dizaines de milliards
d’années dans un Big Bang, et a traversé une période extrêmement chaude après. Il s’est ensuite
refroidi par expansion jusqu’à sa température actuelle qui est de 2.7 K. Les traits du modèle
standard cosmologique comme il se présente aujourd’hui sont basés principalement sur les
observations suivantes:
– le décalage vers le rouge des spectres de ligne provenant de galaxies lointaines, dont le
systématique amène à la loi de Hubble;
– les abondances des éléments légers dans les rayons cosmiques;
– la radiation micro-ondes cosmique qui correspond à celle d’un corps noir;
– la distribution des structures à grande échelle (galaxies, amas, etc.) et sa relation avec les
anisotropies de la radiation micro-ondes.
L’introduction élémentaire présentée ici suivra l’approche de Perkins 1 .
9.1
La loi de Hubble
Vers la fin des années 20, Hubble observa que les spectres de lignes des galaxies lointaines
sont décalés vers le rouge. Ceci à cause de l’effet Doppler associé à leur vitesse v de régression.
La longueur d’onde λ observé sur la Terre est décalée par rapport à celle, λ, dans le système
1. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, chap. 10
CHAPITRE 9. PARTICULES ET COSMOLOGIE
100
du repos de l’émetteur:
λ =λ
1+v
≡ λ(1 + z)
1−v
(9.1)
avec le paramètre de décalage z = ∆λ/λ. En utilisant ces décalages pour mesurer la vitesse, et
la magnitude comme estimateur de la distance r, on observe empiriquement la loi de Hubble
(voir Fig. 9.1)
v = Hr
(9.2)
Les vitesses de régression sont proportionnelles à la distance, avec un coefficient appelé la
constante de Hubble, H. Cette loi correspond à une expansion uniforme de toutes les distances,
y inclus toutes les longueurs d’onde, par un facteur R(t)
r(t) = r0 R(t)
(9.3)
où r0 correspond à l’échelle actuelle, à t = t0 . Sans perte de généralité on peut normaliser toute
distance à r0 ≡ 1, R devient alors une échelle générique. La constante de Hubble est donnée
par
(9.4)
v(t) = Ṙ(t)r0
Ṙ
H =
R
(9.5)
Contrairement à son nom, H n’est pas constante à cause de l’effet freinant de la gravité sur
l’expansion de l’univers. Aujourd’hui on trouve
H0 = 100h0
km 1
s MPc
(9.6)
avec h0 = 0.7 ± 0.1.
9.2
L’équation de Friedmann
L’évolution de l’univers suit une solution des équations d’Einstein décrivant la relativité
générale. Pour une distribution homogène et isotropique de la matière, elle est décrite par
l’équation de Friedmann
2
8πGN ρ
Λ
Ṙ
K
2
H =
=
− 2+
(9.7)
R
3
R
3
avec la constante de Newton GN , la densité de masse (ou énergie) ρ et les constantes K et Λ
qui déterminent l’évolution asymptotique. La constante cosmologique Λ est petite mais ne vaut
probablement pas zéro 2 . Ce terme correspond à une énergie associée au vide (dark energy). On
négligera ce terme dans la discussion qui suit.
Le raisonnement suivant peut servir à comprendre l’équation 9.7. Une masse ponctuelle à
une (grande) distance R de la Terre sentira l’attraction par une masse M = 4πR3 ρ/3. Son
équation de mouvement est par conséquent
mR̈ = −GN
Mm
R2
(9.8)
2. A.G. Riess et al., The Farthest Known Supernova: Support for an Accelerating Universe and a Glimps of
the Epoch of Deceleration, astro-ph/0104445 (2001), to appear in Astroph. J.
9.2. L’ÉQUATION DE FRIEDMANN
101
Fig. 9.1 – Décalage vers le rouge (échelle à gauche) ou vitesse de régression (échelle à droite)
en fonction de la magnitude, c’est à dire de la distance.
L’intégration donne
1
1
mM
mṘ2 − GN
= const = − Km
(9.9)
2
R
2
où l’on choisit la constante d’intégration de façon à obtenir l’Equation 9.7 pour Λ = 0. Les
termes à gauche sont l’énergie cinétique et potentielle, la constante du mouvement correspond
alors à l’énergie totale.
En ce qui concerne l’évolution asymptotique on peut distinguer trois cas:
– K = −1: correspond à une énergie totale positive. Ce cas décrit un univers dit ouvert qui
s’étend jusqu’à l’infini, avec Ṙ → 1 pour grands R. Dans ce cas le terme dit de courbure,
−K/R2 est positif.
– K = +1: correspond à une énergie totale négative, un univers clos avec courbure négative
qui arrive à un rayon maximum et se rétrécit ensuite.
– K = 0: est le cas spécial l’un univers plat, où les énergies cinétiques et potentielles sont
égales et l’énergie totale et la courbure valent zéro. La vitesse d’expansion tend vers Ṙ → 0
à long terme.
Ces trois principales évolutions de l’échelle en fonction du temps sont esquissées dans la figure 9.2.
En intégrant l’équation de Friedmann pour le cas spécial K = Λ = 0 et dans l’approximation
non-relativiste, on obtient
1
9GN M 3 2
R(t) =
t3
(9.10)
2
et pour la constante de Hubble actuelle
H0−1 =
3t0
R
=
2
Ṙ
(9.11)
CHAPITRE 9. PARTICULES ET COSMOLOGIE
102
Fig. 9.2 – Paramètre d’échelle en fonction du temps pour différentes valeurs de la courbure K.
Par conséquent, l’âge t0 de l’univers serait
t0 = √
1
2
6.6 × 109 a
= H0−1 =
6πGN ρ0
3
h0
(9.12)
ce qui correspond à t0 = (9.4 ± 1.3) Ga. Ce résultat n’est pas très différent, sinon légèrement
au dessous de l’âge des objets les plus âgés que l’on connaı̂t dans l’univers; celui-ci varie entre
10 et 14 Ga. Evidemment K = −1 et/ou une valeur non-zéro de la constante cosmologique Λ
fait croı̂tre la prédiction de t0 par l’équation de Friedmann.
Toujours pour K = Λ = 0, on peut intégrer l’équation 9.10 une deuxième fois, pour obtenir
un densité critique ρc qui va tout juste clore l’univers
ρc =
3H02
kg
= 1.9 × 10−26 h20 3
8πGN
m
(9.13)
Le rapport entre la densité actuelle de l’univers, ρ, et cette densité critique est appelé le paramètre de clôture
k
ρ
= 1+ 2 2
(9.14)
Ω=
ρc
H R
On mesure actuellement les contributions suivantes à Ω:
– La matière visible, donc lumineuse, concentrée dans les étoiles, gaz et poussières donne
kg
ρlum 2 × 10−29 3
m
Ωlum 0.003h−2
0
(9.15)
(9.16)
– Le nombre total de baryons, visibles ou invisibles, déduit du modèle de baryosynthèse
primordiale (voir Section 9.5) donne
ρB (3 ± 1.5) × 10−28
ΩB (0.01 ÷ 0.03)h−2
0
kg
m3
(9.17)
(9.18)
9.3. RADIATION MICRO-ONDE COSMIQUE
103
– La densité totale de la matière, déduite du potentiel gravitationnel mesurable par la
dynamique du mouvement des étoiles dans les galaxies est beaucoup plus grand que les
deux précédents:
ρm ≥ 5 × 10−27
Ωm ≥ 0.3
kg
m3
(9.19)
(9.20)
La plupart de la matière est donc ni visible ni baryonique. On l’appelle matière noire
(dark matter).
On peut conclure de ces mesures que la majorité de la matière baryonique est non-lumineuse,
et que la majorité de la matière tout court est non-baryonique. Cela veut dire qu’il doit y avoir
des objets baryoniques noirs, de la matière stellaire non rayonnante. En effet, de tels objets
ont été observés, par exemple par leur effet d’aberration gravitationnel. En plus, l’énergie de
l’univers est dominée par une composante inconnue qui est ni stellaire ni même baryonique.
Cette composante inconnue éveille beaucoup de spéculation et fait l’objet d’un important effort
expérimental.
Un premier inventaire du contenu de l’univers aboutit à une densité remarquablement proche
à la densité critique, qui correspond à K = Λ = 0 et est la seule densité à donner Ω = 1 ∀t.
Le fait que l’univers apparaisse approximativement plat encore aujourd’hui pose en effet un
formidable problème de conditions initiales. Pour y arriver il faut qu’initialement Ω égalait 1
à une précision vertigineuse de δΩ 10−50 . Il existe évidemment un mécanisme qui supprime
le terme de courbure dans Equ. 9.14. Le concept de la période d’inflation peut résoudre ce
problème, ainsi que celui posé par l’étonnante homogénéité et isotropie du bruit de fond microonde.
9.3
Radiation micro-onde cosmique
Si la matière dans l’univers est conservée sous forme de particules stables, sa densité varie
comme ρm ∼ R−3 . Si la radiation dans l’univers est en équilibre thermique, sa densité varie
comme ρr ∼ T 4 , selon la loi de Stefan-Bolzmann.
Comme une échelle absolue de la longueur n’existe pas, tous les longueurs d’onde doivent
être proportionnelles à R. L’énergie moyenne des photons hν ∼ kT doit être proportionelle à
R−1 . Bien que le nombre de photons varie comme R−3 , leur densité d’énergie varie comme R−4 .
Par conséquent on constate que tôt dans l’histoire de l’univers, pour petites valeurs de R,
la radiation a dominé sur la matière. Par conséquent, l’équation de Friedmann durant cette
période devient
H
2
Ṙ2
et, avec ρr ∼ R−4 ,
2
8πGN ρr
Ṙ
=
=
R
3
8πGN 2
R
=
3
(9.21)
(9.22)
8πGN
ρ̇r
4Ṙ
= −4
ρr
=
ρr
R
3
(9.23)
CHAPITRE 9. PARTICULES ET COSMOLOGIE
104
Pour un gaz de photons on obtient en termes d’énergie
45
kT =
32π 3 GN
1
4
1
t
1
2
1MeV
√
t
(9.24)
avec t en secondes. Pour la température T on a
T 1010 K
√
t
(9.25)
Par conséquent, l’univers a été extrêmement chaud à son début; on parle d’un hot Big Bang.
La température du gaz de photons dans l’univers actuel, i.e. de la radiation micro-onde
découverte par Penzias et Wilson en 1965 3 , est
T = (2.73 ± 0.01) K
(9.26)
Le spectre de ce gaz suit exactement celui émis d’un corps noir
N(p)dp =
p2 dp
π 2 (e−p/kT − 1)
(9.27)
comme le montrent les résultats du satellite COBE 4 , voir Figure 9.3.
Fig. 9.3 – Distribution spectrale du bruit de fond micro-onde mesuré par le satellite COBE. La
courbe montre le spectre de Planck, émis par un corps noir idéal.
L’homogénéité et l’isotropie de cette radiation est remarquable. Les températures de la
radiation micro-onde qui nous parviennent de directions opposées du ciel sont égales à ∆T /T 3. A.A. Penzias and R.W. Wilson, Astrophys. J. 142 (1965) 419
4. D.J. Fixsen et al., Astrophys. J. 486 (1996) 623.
9.4. PÉRIODES DE RADIATION ET DE MATIÈRE
105
10−4 près. Ceci pose un problème de causalité. Ces régions n’ont jamais été en contact thermique
si l’univers s’était toujours étendu avec une vitesse inférieure à celle de la lumière. Il nous faut
par conséquent une période ou l’univers s’est étendu plus vite que cela; on l’appelle la période
d’inflation 5 . Pendant cette période, moyennant un champ spécialement conçu à ce propos, le
facteur d’échelle aurait varié exponentiellement. Ceci ne constitue pas une violation des axiomes
de la relativité, parce que c’est l’espace-temps lui même qui s’étend; il n’y a donc pas transport
superluminal d’information. Néanmoins cette expansion exponentielle permettrait un contact
thermique initial de régions aujourd’hui très éloignées.
9.4
Périodes de radiation et de matière
A très hautes températures, kT M, radiation et particules jusqu’à une certaine masse
M sont en équilibre thermique. Ceci veut dire que le temps entre deux collisions, l’inverse du
taux W de collisions, est court par rapport à l’âge t de l’univers, W t−1 . Le taux de collision
dépend de la section efficace σ et la vitesse v des particules
W = Nvσ
(9.28)
La moyenne est prise par rapport à la distribution des vitesses. Il y a deux raisons pourquoi
l’équilibre peut être rompu: le croisement d’un seuil ou un taux d’interaction insuffisant.
Prenons l’équilibre entre photons et protons comme exemple de l’intervention d’un seuil. La
réaction γγ ↔ pp̄ reste réversible tant que la température moyenne kT Mp . Jusqu’au seuil,
les protons et anti-protons perdus par annihilation seront reproduits par la réaction. Grâce
aux queues de la distribution d’énergie des photons, le seuil n’est toutefois pas très rigide. La
réaction est encore partiellement soutenue au-dessous du seuil. Seulement pour une température
moyenne kT Mp , tous les protons s’annihilent.
Une réaction à bas seuil est e+ e− ↔ ν ν̄. Néanmoins, comme la section efficace des neutrinos
est proportionelle à l’énergie, au dessous de kT 3 MeV, le taux d’annihilation neutrino-antineutrino devient insuffisant. Les neutrinos se découplent du reste de la matière et évoluent
indépendamment.
Pour quelques 105 ans après le Big Bang, la matière sous forme d’hydrogène et la radiation
étaient tenues en équilibre par le processus e− p ↔ γH. Le seuil de cette réaction est 13.6 MeV,
le potentiel d’ionisation de l’hydrogène. Par conséquent, à une température bien plus petite, en
effet à kT = 0.3 eV, la population de la queue de la distribution en énergie devient insuffisant
pour maintenir l’équilibre. A cette température, la matière devient transparente à la radiation.
L’univers a franchi cette température vers t 3 × 105 a. Un peu plus tard, vers t 106 a, la
densité en énergie de la matière, ∼ T −3 , a excédé celle de la radiation, ∼ T −4 . Depuis ce temps
là, la matière domine l’énergie de l’univers et son expansion. La variation de kT avec le temps
est esquissé dans la Figure 9.4.
9.5
Nucléosynthèse primordiale
A peu près une seconde après le Big Bang, tous les particules instables s’étaient déjà
désintégrées et seulement les électrons, neutrinos, photons, neutrons et protons peuplaient
5. A.H. Guth, Phys. Rev. D23 (1981) 347
106
CHAPITRE 9. PARTICULES ET COSMOLOGIE
Fig. 9.4 – Evolution de la température de l’univers avec le temps dans le modèle du Big Bang
chaud Les périodes mentionnées dans le texte sont indiquées.
9.5. NUCLÉOSYNTHÈSE PRIMORDIALE
107
l’univers. Leurs nombres relatifs étaient déterminés par l’équilibre des réactions de l’interaction
faible:
νe n ↔ e− p
ν̄e p ↔ e+ n
n → p e− ν̄e
(9.29)
(9.30)
(9.31)
En cours de l’expansion, kT devient plus petit que la masse du nucléon, MN , et ceux-ci deviennent non-relativistes, E MN2 + p2 /2MN . Leurs nombres relatifs sont donnés par les
facteurs de Boltzmann
Q
Nn
= e− kT
(9.32)
Np
avec Q = Mn − Mp = 1.3 MeV. A températures suffisamment basses, kT 0.87 MeV, le taux
inverse des réactions qui maintiennent l’équilibre entre neutrons et protons sera plus grand que
l’âge de l’univers. En ce moment, p et n tombent hors équilibre thermique et découplent. Leur
nombre en ce moment était
Q
Nn (0)
= e− kT = 0.23
(9.33)
Np (0)
Plus tard, les neutrons libres se désintègrent. A un temps t il en reste
Nn (t) = Nn (0)e−t/τn
(9.34)
et le nombre de protons augmente à
Np (t) = Np (0) + Nn (0) 1 − e−t/τn
(9.35)
avec le temps de vie du neutron, τn = 896 ± 10 s. Le rapport des deux nucléons évolue comme
0.23e−t/τn
Nn (t)
=
Np (t)
1.23 − 0.23e−t/τn
(9.36)
Si rien de plus se produirait, les neutrons disparaı̂tront et on aura un univers peuplé uniquement
de protons, électrons et neutrinos.
Mais protons et neutrons peuvent former des noyaux stables. La nucléosynthèse commence
avec la formation de deutérons
n p ↔ γ 2H
(9.37)
L’énergie de liaison est très grande, Eγ > 2.2 MeV, ainsi que la section efficace de ce processus,
σ 0.1mb. Par conséquent, et en contraste avec les processus faibles, celui-ci reste longtemps
en équilibre thermique. Le nombre énorme de photons maintient la photodesintégration du
deutéron jusqu’à une température de kT 0.05 MeV. Ensuite, 2 H dévient stable et la synthèse
d’hélium commence:
H n → 3H γ
3
H p → 4 He γ
2
H p → 3 He γ
3
He p → 4 He γ
2
(9.38)
(9.39)
A ce moment, à kT 0.05 MeV correspondant à t 400s, le rapport de neutrons à protons
selon Equ. 9.36 était
Nn (t)
= 0.14
(9.40)
r=
Np (t)
CHAPITRE 9. PARTICULES ET COSMOLOGIE
108
Comme il faut deux protons et deux neutrons pour synthétiser en noyau de 4 He, le rapport
entre les masses totales d’hélium et de protons sera (MHe 4Mp )
Y ≡
4NHe
2r
MHe
= 0.25
=
=
Mp
4NHe + Np
1+r
(9.41)
Expérimentalement on trouve en effet dans le système solaire et au niveau galactique Y =
0.24 ± 0.1. Cet accord entre prédiction et observation est un des grands triomphes du modèle
du Big Bang. De même les abondances de 2 H, 3 He et 7 Li sont prédites correctement; elles
excèdent d’une manière significative celles provenant de la synthèse à l’intérieur des étoiles.
Le taux total des noyaux correspond à une densité baryonique totale de
ΩB = (3.0 ± 1.5) × 10−28
kg
m3
(9.42)
ou à une densité en nombre de NB = (0.18 ± 0.09)/m3 . On comparant à la densité de photons
dans le bruit de fond micro-onde, on trouve
NB
(4 ± 2) × 10−10
Nγ
(9.43)
Les nombres de baryons et photons étaient bien sûr comparables lorsque l’équilibre thermique
entre radiation et matière était encore intact. La vaste majorité des baryons a depuis disparu,
laissant les baryons minoritaire par un facteur d’un sur un milliard.
A l’époque de l’équilibre, la réaction pp̄ ↔ γγ garantissait aussi un équilibre entre matière
et anti-matière. On s’attendrait par conséquent aujourd’hui soit à une absence quasi totale de
baryons, soit à un taux très faible mais égal de matière et anti-matière, NB /Nγ = NB /Nγ 10−18 . Ceci n’est pas le cas. On observe un rapport plus grand, correspondant à l’Equation 9.43,
pour la matière. Mais dans les expériences comme AMS conçues pour la recherche d’anti-matière
dans les rayons cosmiques n’ont pas observés un seul anti-noyau dans plusieurs millions de
noyaux enregistrés, voir Figure 9.5 6 . Cela démontre que le système solaire, la voie lactée et
tout le super-amas dont elle fait partie contiennent uniquement de la matière et que l’antimatière en est entièrement absente.
Il y a deux possibilités pour réconcilier cette observation avec les principes d’un Big Bang
symétrique. Soit qu’un mécanisme encore inconnu a discriminé matière et anti-matière dans
des régions très éloignées de l’univers. Dans ce cas, une prolongation de la recherche d’antinoyaux jusqu’à l’anti-Lithium révélera éventuellement la présence d’anti-matière primordiale
extra-galactique. Si l’on trouvait des anti-noyaux encore plus lourds, comme par exemple l’anticarbone, l’existence d’anti-étoiles serait mise en évidence. Si des expériences telles qu’AMS
arrivent à trouver de l’anti-matière extra-galactique, un mécanisme de ségrégation doit par
conséquent être trouvé.
La deuxième possibilité est que l’anti-matière a carrément disparu pendant l’histoire de
l’univers. En 1967, Sakharov 7 a formulé les conditions nécessaires pour une telle disparition:
– Une interaction qui ne conserve pas le nombre baryonique doit exister.
– Une violation des symétries C et CP distingue d’une manière non-ambigüe entre matière
et anti-matière.
6. AMS Coll., J. Alcaraz et al., Phys. Lett. B461 (1999) 387.
7. A.D. Sakharov, Pisma Zh. Eksp. Teor. Fiz. 5 (1967) 32
9.5. NUCLÉOSYNTHÈSE PRIMORDIALE
109
Antihelium/Helium Upper Limit
– Une période hors d’équilibre permet que l’interaction qui ne conserve pas le nombre
baryonique fasse disparaı̂tre l’anti-matière sans qu’elle soit recréée par la réaction inverse.
Parmi ces trois conditions, seule la violation de C et CP à été observé expérimentalement. Si
des expérience comme AMS arrivent cependant à exclure l’existence de domaines lointains
d’anti-matière, les phénomènes responsables pour les deux autres conditions – concevables
théoriquement mais sans support expérimental – restent à être trouvés.
10-4
AMS
STS - 91
|Z| = 2
Rmin=1.6 GV
10-5
Excluded
10-6
3
10
70
GV
Rmax
-3
Antimatter/Matter Upper Limit 95% CL Z=2
10
Published Conservative Limits
Smoot et al. (1975)
Golden et al. (1997)
-4
10
Buffington et al. (1981)
-5
10
BESS 1993-1995
AMS 1998
-6
10
1
10
10
Rigidity (GV)
Fig. 9.5 – A gauche: Schématique du spectromètre magnétique AMS qui sera installé sur la
station spatiale ISS en 2004; à droite: limites supérieures sur le rapport entre les flux d’antihélium et de hélium dérivés des données d’un premier vol du détecteur de 10 jours sur la navette
spatiale en 1998, comparé aux résultats d’expériences sur des ballons.
Les deux explications alternatives de l’asymétrie apparente entre matière et anti-matière
réclament de nouveaux phénomènes, au delà de ceux contenus dans le modèle standard de
la physique des particules et établis par l’expérimentation aux accélérateurs. Dans ce sens
là, astrophysique et cosmologie mettent aujourd’hui en défi la physique des particules, tant
théorique qu’expérimentale.
2
110
CHAPITRE 9. PARTICULES ET COSMOLOGIE
Téléchargement