Version 1.20 6 juillet 2001 PARTICULES ET NOYAUX Physique des particules Cours donné par Martin Pohl Assistant: Lorenzo Moneta Université de Genève Été 2001 ii 1 Chapitre 1 Introduction Le but de la physique des particules est aussi simple à formuler que difficile à atteindre: il s’agit de comprendre tout l’univers par ses propriétés microscopiques. L’univers, à l’échelle microscopique, contient principalement le vide – l’espace-temps – peuplé par la matière et les forces. Pour approcher une compréhension générale de l’univers, mission évidemment impossible, les hypothèses suivantes sont généralement faites aujourd’hui: – La matière consiste en un nombre limité de catégories de particules élémentaires, qui sont identifiées par leur masse unique et leurs propriétés vis-à-vis des forces, c’est à dire par leurs nombres quantiques. Une particule dite élémentaire n’a pas de structure intérieure, c’est ‘a dire qu’elle correspond à un point dans l’espace-temps. – Il y a un nombre limité de forces qui agissent entre les constituants de la matière. Dans le cas idéal, celles-ci seraient juste des manifestations d’une seule force universelle. – Forces et matière évoluent dans le vide, l’espace-temps à quatre dimensions. Le vide sert à paramétriser le mouvement des particules mais intervient aussi, comme partenaire actif, dans les interactions entre et avec eux. – L’homme, qui fait lui-même partie de ce système dynamique, arriverait néanmoins à comprendre son fonctionnement, grâce à la méthode de l’expérience scientifique et de sa description mathématique. La dernière hypothèse étant évidemment la plus contestable, tout ce programme manque complètement de cette modestie qui convient au scientifique comme à tous et à chacun. S’il devait jamais se réaliser, il ne faudrait pas seulement que tout l’univers se décrive par quelques propriétés irréductibles, mais aussi que l’on arrive à traduire ces propriétés et lois du monde microscopique à des dimensions qui caractérisent le macrocosme. Aussi contestable que soit ce programme, on va toutefois l’adopter pour le moment pour voir jusqu’où on arrive. Matière: Dans le scénario de la physique des particules d’aujourd’hui, la matière consiste en particules, qui sont des Fermions de spin un demi. Une liste des particules élémentaires connues à ce jour est donnée dans le Tableau 1.1. Pour chaque particule il existe une antiparticule, identique en masse, mais avec tous les nombres quantiques représentant une charge inversés. Matière et antimatière peuvent s’annihiler mutuellement et se convertir en énergie. Inversement, si suffisamment d’énergie est concentrée dans une petite région d’espace-temps, matière et antimatière seront produites en quantité égale. CHAPITRE 1. INTRODUCTION 2 Tab. 1.1 – Particules de matière et de force avec quelques-uns de leurs nombres quantiques. Pour chaque particules il y a une antiparticule, de même masse, mais avec toutes leurs charges inversées. Nom Spin Leptons: e,µ,τ 1/2 νe ,νµ ,ντ 1/2 Quarks: u, c, t 1/2 d, s, b 1/2 Bosons de jauge: γ 1 Z0 , W± 1 Gluons 1 Vide 0 Nombre baryonique Nombre leptonique Charge électr. 0 0 1 1 −1 0 1/3 1/3 0 0 +2/3 −1/3 0 0 0 0 0 0 0 0 0 0,±1 0 0 En raison de leur propriétés similaires, on peut organiser les particules de la matière en un système périodique, comme dans le Tableau 1.2. Les particules se regroupent en quatre familles qui se distinguent par leur fonction: leptons chargés, neutrinos, quarks du type up et quarks du type down. Ils ont des types de charges différents et ainsi sont soumis à différents types de forces. En ce qui concerne la première génération, le lepton chargé, l’électron, figure dans l’atome comme porteur de ses propriétés chimiques. Lui et le neutrino, le lepton neutre, apparaissent dans les désintégrations radioactives. Et les quarks up et down sont les constituants des protons et neutrons qui forment les noyaux. Chaque famille s’étend sur trois générations, dont les membres se distinguent par leur masse ainsi qu’un nombre quantique génériquement appelé flavor, mais qui subissent les mêmes forces. Toutes les interactions sauf les interactions faibles chargées conservent le flavor. Ainsi, les leptons chargés et neutres de chaque génération sont produits en paires particule/antiparticule par les interactions électromagnétiques et faibles neutres: e+ e− , νe ν̄e , uū, dd̄, mais non pas e+ µ− , νµ ν̄τ , uc̄ ou sb̄. Les interactions fortes génèrent également des quarks en paires particule/antiparticule, tout en respectant un autre nombre quantique conservé, appelé color. Les interactions faibles chargées peuvent convertir les particules d’une génération à une autre. Pour les quarks ceci est un effet connu depuis longtemps. Pour les leptons, seules les indications expérimentales d’oscillations entre neutrinos de différentes générations indiquent un effet semblable mais beaucoup plus faible. Par contre, le nombre total de leptons et de quarks est strictement conservé par toutes les forces connues jusque là. Ceci correspond à deux nombres quantiques séparément conservés, le nombre baryonique et le nombre leptonique, attribués comme montré dans le Tableau 1.1 pour la matière et négatif pour l’antimatière. Ainsi un proton, par exemple, qui contient principalement les quarks uud, a le nombre baryonique +1, tandis que l’antineutron, qui contient les quarks ūd̄d̄, a le nombre baryonique −1. Les masses des particules dans le tableau de la matière ont tout pour nous surprendre. L’éventail s’étend de la masse des neutrinos, très faible et probablement dans les millielectronvolt, jusqu’au quark top qui est aussi lourd qu’un noyau de Hafnium. Les quelques particules dans le Tableau 1.2 suffisent pour constituer tout les particules observés jusque là et que l’on trouve dans la publication du Particle Data Group, l’autorité mondiale dans la domaine. Son site 3 Tab. 1.2 – Système périodique des composants de la matière. Les générations de chaque famille ont les mêmes constantes de couplage, donc ils subissent les mêmes forces. Ils se distinguent par leur masse ainsi qu’un nombre quantique génériquement appelé flavor. Génération Famille 1 2 3 Neutrinos νe νµ ντ Leptons e µ τ Quarks up u c t Quarks down d s b web, http://www.cern.ch/pdg, met à disposition une liste exhaustive des particules observées (et non-observées), qui est régulièrement mise à jour, ainsi qu’une liste de leur propriétés. Forces: La mécanique quantique, caractérisée par l’équation de Schrödinger et ses solutions, décrit le mouvement non-relativiste des particules dans un champ extérieur. Elle ne décrit pas comment un tel champ est généré, ni comment il arrive à interagir avec la particule en question. C’est cette question que se propose d’élucider théorie des champs quantique. Le mécanisme de base de la transmission de force est l’émission de quanta du champ, des bosons de spin 1, par les particules de matière. La Figure 1.1 représente ce processus par l’exemple d’un électron qui émet un photon, changeant ainsi son impulsion. On verra plus tard comment résoudre le problème de conservation de l’énergie-impulsion associé a ce processus. Pour le moment, il nous suffit d’accepter que les champs sont transmis d’un endroit à un autre par des bosons vecteurs. Si le boson messager est ensuite absorbé par une autre particule, comme le démontre la Figure 1.2, une impulsion est transmise entre les deux particules, l’un a donc exercé une force sur l’autre. Il est claire que l’échange d’une seule particule n’est qu’une première approximation de la vraie interaction entre deux particules. e(E ,p ) e(E, p) - γ(k0 ,k) Fig. 1.1 – Un électron entrant émet un photon. La Figure 1.3 montre les quatre forces qui peuvent être représentées de cette manière. La force électromagnétique est responsable de tant de phénomènes quotidiens, y inclue toute la chimie. Les forces faibles sont à l’origine de la radioactivité β. Les interactions fortes génèrent les forces nucléaires. Il est remarquable que dans ce scénario standard la matière ne consiste que de fermions, les forces sont transmises exclusivement par des bosons. Cette asymétrie est mise en cause par CHAPITRE 1. INTRODUCTION 4 e - e γ e e Fig. 1.2 – Diffusion de deux électrons par l’échange d’un boson intermédiaire. u e u u - - e - γ d ν @ - @ @ @ @ @ W+ u u - γ e W+ e e @ @ - @ @ @ Z0 @ Z0 uR uG - gR̄G Fig. 1.3 – De haut en bas: Les interactions électromagnétiques, faibles chargées et neutres ainsi que fortes, représentées par les vertex d’émission de leurs bosons. A gauche on représente les interactions des quarks, à droite celles des leptons, s’ils existent. 1.1. CINÉMATIQUE RELATIVISTE 5 des nouvelles théories, dites supersymétriques, qui postulent des forces fermioniques ainsi que de la matière bosonique. Cette approche présente des avantages et dans la conception et dans la pratique, mais aucun effet prédit par une telle théorie ne s’est manifesté expérimentalement jusqu’à maintenant. Le mécanisme de transmission de forces, relevé par la théorie quantique des champs, est un mécanisme tout à fait local. Le boson intermédiaire est émis à un point dans l’espace-temps bien précis, il se déplace jusqu’à un autre point de l’espace-temps où il est réabsorbé. Vide: Il est remarquable que la force la plus longuement connue, celle des interactions gravitationelles, à ce jour ne se décrit pas par les mêmes moyens. La seule théorie connue de la gravitation, la théorie de la relativité générale, prend une déformation de l’espace-temps lui-même comme mécanisme de transmission de la force. Ceci est un premier exemple que l’espace-temps, le vide, n’est pas pour rien dans notre scénario du jeu entre matière et forces. Nous verrons plus tard que le vide est un lieu où se passent beaucoup des choses: des particules se créent spontanément, peut-être même une propriété particulière du vide est-elle à l’origine de la création de la masse de tous les particules. Avant de nous embarquer dans les détails de ce scénario fascinant des phénomènes microscopiques, nous devons passer en revue quelques outils nécessaires pour comprendre le monde á haute énergie et a petite échelle. 1.1 Cinématique relativiste Cette partie du cours va traiter des phénomènes à haute énergie, c’est à dire à des vitesses qui nécessitent un traitement relativiste. Un événement d’espace-temps, localisé par les coordonnées cartésiennes (t,x), est décrit par un quadrivecteur xµ . La métrique de l’espace vectoriel associé aux quadrivecteur est définie par la constance de la vitesse de lumière c, constante dans chaque système inertial. Supposons qu’un rayon de lumière relie deux événements, (t1 ,x1 ) et (t1 ,x1 ). La distance entre les deux points dans l’espace est toujours proportionnelle au temps de propagation: d = (x1 − x2 )2 + (y1 − y2 )2 + (y1 − y2 )2 1 2 = c (t1 − t2 ) (1.1) Comme la constante de proportionnalité est la même dans chaque système inertial, il en suit que la norme s d’un quadrivecteur, définie en coordonnées cartésiennes comme s = ct2 − x2 − y 2 − x2 (1.2) est indépendante du système de référence. Les transformations de Lorentz, pour l’exemple de deux systèmes qui se déplacent avec une vitesse v = βc dans une direction parallèle a l’axe x, donnent x y z t = = = = γ (x − βt) y z γ (t − βx) donc une rotation dans l’espace-temps qui laisse la norme s invariante. (1.3) (1.4) (1.5) (1.6) CHAPITRE 1. INTRODUCTION 6 Plus généralement on appelle quadrivecteurs covariants tous ceux qui se transforment comme le quadrivecteur xµ de l’espace-temps sous les transformations de Lorentz de l’équation 1.3: xµ = (x0 ,x1 ,x2 ,x3 ) = (ct,x,y,z) (1.7) Un exemple important est le quadrivecteur covariant de l’énergie-impulsion pµ : E pµ = (p0 ,p1 ,p2 ,p3 ) = ( ,px ,py ,pz ) c (1.8) La norme s est définie par le produit scalaire entre un quadrivecteur covariant et son homologue contravariant xµ = (x0 ,x1 ,x2 ,x3 ) = (t, − x, − y, − z) E pµ = (p0 ,p1 ,p2 ,p3 ) = ( , − px , − py , − pz ) c (1.9) (1.10) qui sont reliés par l’application du tenseur métrique gµν xµ = gµν xν (1.11) En coordonnées cartésiennes ce tenseur est ⎛ ⎜ ⎜ ⎝ gµν = ⎜ 1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1 ⎞ ⎟ ⎟ ⎟ ⎠ (1.12) Le produit scalaire est donc défini comme s = xµ xµ = x0 x0 + x1 x1 + x2 x2 + x3 x3 (1.13) en utilisant la convention que les indices quadrivecteurs, symbolisés par les indices grecs, sont toujours sommés implicitement. En coordonnées cartésiennes cela donne: xµ xµ = c2 t2 − x2 − y 2 − z 2 = c2 t2 − x2 E2 E2 2 2 2 − p − p − p = − p2 = m2 c2 pµ pµ = x y z c2 c2 (1.14) (1.15) La norme du quadrivecteur espace-temps définit donc une distance entre deux événements. La norme du quadrivecteur énergie-impulsion définit la masse de la particule qui évolue. Exemple 1: Système du laboratoire Prenons comme exemple une collision entre un projectile de masse m et une cible de masse M est esquissé dans le Système du laboratoire. Ce système est caractérisé par le fait que la cible y est au repos, son quadrivecteur énergie-impulsion est donc (M,0). Le quadrivecteur du projectile soit (E/c, p). Comme l’énergie et l’impulsion doivent être conservées dans la réaction, il faut que le quadrivecteur énergie-impulsion total de l’état initial et de l’état final soient les mêmes. Dans l’état initial on a: E + Mc2 pµ + k µ = (1.16) p 1.2. SYSTÈME D’UNITÉS NATURELS 7 La norme s de ce vecteur correspond au carré de l’énergie totale disponible pour créer l’état final 2 (1.17) s = E + Mc2 − c2 p2 = m2 c4 + c2 p2 + 2EMc2 + M 2 c4 − c2 p2 Si le projectile est beaucoup plus légér et énergetique que la cible, m M et E M, on peut approximer ceci comme s 2EMc2 (1.18) Pour avoir une idée des ordres de grandeur, prenons un électron d’impulsion √ 100 GeV/c incident sur un proton au repos. L’énergie totale du système est de seulement s 14 GeV. Exemple 2: Système du centre des masses Comparons ce résultat à une situation où deux particules entrent en collision dans le système du centre de masse. Ce système est caractérisé par le fait que l’impulsion totale de tous ses composants est zéro. Donc, les quadrivecteurs des deux particules dans l’état initial sont pµ = (E, p) et kµ = (E , − p). Le quadrivecteur total est pµ + k µ = est sa norme est E + E 0 s = (E + E )2 (1.19) (1.20) Donc, si l’électron de 100 GeV/c de l’exemple précédent entre en collision √ avec un proton de 100 GeV/c d’impulsion dans le centre de masse, le système totalise bien s 200GeV . 1.2 Système d’unités naturels On voit déjà très bien à partir de ces exemples triviaux qu’il est ni pratique ni instructif de toujours tenir soigneusement compte des constantes comme c dans nos calculs. Les physiciens des hautes énergies ont donc presque à l’unanimité adopté un système d’unité qui les débarrasse de deux constantes h̄ ≡ h 1.055 × 10−34 J s 2π c 2.998 × 108 m/s (1.21) (1.22) avec les dimensions ML2 T L [c] = T [h̄] = (1.23) (1.24) En mettant h̄ = c = 1 (1.25) ont définit donc h̄ comme l’unité de l’action et c comme l’unité de vitesse. Avec un léger manque de rigueur, ceci nous permet de mesurer les masse (m), les impulsions (mc) et les énergies (mc2 ) toutes avec les mêmes unités [E,M,p] = ML2 = GeV = 109 eV Mp 2 T (1.26) CHAPITRE 1. INTRODUCTION 8 L’unité de base, électronvolt (eV), est définie comme le gain en énergie que fait un électron en parcourant une différence en potentiel de 1V. Un milliard de ces unités correspond à peu près à la masse du proton, Mp , et forme ainsi l’échelle naturelle de la physique des hautes énergies. Le Tableau 1.3 montre quelques facteurs de conversion entre les unités conventionnelles et les unités naturelles. Tab. 1.3 – Masse, longueur et temps en unités naturelles. Quantité Masse Longueur Temps Facteur de conversion 1 kg = 5.61 × 1026 GeV 1 m = 5.07 × 1015 GeV−1 1 s = 1.52 × 1024 GeV−1 Unités naturelles GeV GeV−1 GeV−1 Unités conventionnelles GeV/c2 h̄c/GeV h̄/GeV Dans le système des unités naturelles, la charge électrique est sans dimension √ [e] = [ h̄c] = [1] (1.27) Elle paraı̂tra souvent dans nos discussions sous forme de la constante de structure fine, α, donc de l’énergie électrostatique de deux électrons à l’unité de la distance divisée par la masse de l’électron 1 e2 1 e2 4π h̄/mc α= (1.28) = 2 mc 4πh̄c 137 Cette constante n’a donc pas de dimension non plus. 1.3 Transmission des forces et principe de Heisenberg Regardons donc d’un peu plus près l’émission d’une particule par une autre, mécanisme proposé pour la transmission des forces. La Figure 1.1 définit les quadrivecteurs de l’énergieimpulsion des partenaires dans la réaction. La conservation de l’énergie et de l’impulsion réclame que pour µ = 0...3 pµ = pµ + kµ (1.29) Pour la longueur de ce quadrivecteur total de l’énergie-impulsion, qui est invariante, on trouve E 2 − p2 = (E + k0 )2 − (p + k)2 me 2 = me 2 + mγ 2 + 2E k0 − 2pk (1.30) (1.31) Si l’on se base sur des photons réels, qui ont mγ = 0, on trouve alors E ≤ |p | (1.32) en désaccord avec la masse me = 0 de l’électron. Un tel mécanisme est donc uniquement admissible si le photon émis est virtuel et n’a pas sa masse habituelle. Pour une particule intermédiaire, dans un processus de diffusion, il est entièrement acceptable qu’elle n’ait pas sa masse habituelle. Le principe de Heisenberg nous dit que la nature 1.3. TRANSMISSION DES FORCES ET PRINCIPE DE HEISENBERG 9 ondulatoire des particules nous empêche de les localiser à mieux qu’une distance ∆x près si nous connaissons leur impulsion mieux qu’à une impulsion ∆px près, avec ∆x∆px ≥ h (1.33) Cette limite principale est applicable à chaque paire de variables canoniquement conjuguées, donc aussi pour l’énergie et le temps ∆E∆t ≥ h (1.34) Pour les particules porteuses de force, qui sont absorbées après un court laps de temps ∆t, l’incertitude sur l’énergie sera donc suffisamment grande pour permettre de respecter les conditions de l’Equation 1.30. On retient donc que la relation pµ pµ = m2 est valable pour les particules réelles, mais n’est pas respectée pour les particules virtuelles. Les variables décrivant l’espace de phase sous l’aspect particule, c’est à dire. le quadrivecteur (E, p), sont complètement équivalentes à celles qui caractérisent l’aspect onde, c’est à dire (ω,k). La trajectoire classique d’un point de masse n’existe plus, mais est remplacé par la fonction d’onde √ i(px−Et) Φ(x) = Ne (1.35) √ = N cos (kx − ωt) + i sin (kx − ωt) (1.36) qui permet de facilement changer entre les deux représentation. Avec la relation p = 1/λ, on voit que les détails auxquelles un projectile est sensible sont d’autant plus petits que l’impulsion du projectile est grande. Par exemple, pour étudier la sous-structure du nucléon avec une résolution spatiale de 0.1 fm, il faut utiliser des particules de plusieurs GeV. Pour assurer que les particules dites élémentaires dans le Tableau 1.1 sont bien ponctuelles, il faut des faisceaux de particules bien plus énergétiques encore. Les accélérateurs de haute énergie, et de haute intensité, sont donc primordiaux pour l’étude du monde à petite échelle. 10 CHAPITRE 1. INTRODUCTION 11 Chapitre 2 Les accélérateurs Dans ce chapitre 1 on va toucher les bases de la physique pour deux types d’accélérateurs, les circulaires et les linéaires. les deux se basent bien sûr sur les lois qui gouvernent le mouvement des particules chargées dans un champ électromagnétiques. La force sur une particule de charge et magnétique B est e dans un champ électrique E d p + v × B =e E dt (2.1) Les champs électriques servent donc à accélérer les particules, les champs magnétiques à les dévier de leur direction initiale, soit pour les stocker dans un anneau, soit pour les focaliser. Le plus simple mécanisme d’accélération est réalisé pour des électrons dans chaque tube cathodique. Le schéma est montré dans la Figure 2.1: l’électron qui sort d’un filament chauffé est accéléré par un potentiel V et émis par un trou dans la cathode. L’énergie de l’électron sortant correspond donc exactement à V GeV. Les accélérateurs électrostatiques enchaı̂nent tout simplement des étages de ce type. Ils sont limités évidemment par la stabilité d’une isolation de haute tension, donc leur énergie ne dépasse pas quelques MeV. Pour arriver à une plus haute énergie, il faut que le projectile passe plusieurs fois par un potentiel accélérant. Fig. 2.1 – Principe d’un accélérateur électrostatique, comme un tube cathodique. 1. Ce chapitre se base sur le matériel du cours Simple Introduction to Accelerators, donné dans le cadre de l’entraı̂nement académique du CERN par E.J.N. Wilson, cf http://schools.web.cern.ch/Schools/CAS/ATLectures.html CHAPITRE 2. LES ACCÉLÉRATEURS 12 2.1 Le cyclotron Le plus simple accélérateur circulaire est le cyclotron, son principe de fonctionnement est uniforme et constant, une particule montré dans la Figure 2.2. Dan un champ magnétique B de charge e se déplace sur un cercle de rayon ρ= p eB (2.2) si p est son impulsion. La fréquence angulaire de ce mouvement s’appelle Fréquence cyclotronique eB ωc = (2.3) E et est inversement proportionelle à l’énergie de la particule. La particule est accélérée par le champ électrique présent dans l’espace entre les deux cavités en forme de D. Ce champ est établi par un générateur de radiofréquence tel que sa fréquence ωrf égale la fréquence cyclotronique. Dans le domaine non-relativiste, cette fréquence est constante. Ceci est facile à voir comme le rayon de courbure ρ est proportionnel à la vitesse v de la particule et la fréquence de rotation est v ν= = const (2.4) 2πρ On peut donc injecter des particules d’une manière quasi-continue long que la fréquence est haute et un multiple pair de la fréquence cyclotronique. Fig. 2.2 – Principe du cyclotron. Le cyclotron trouve sa limite par le fait que la vitesse de la particule ne reste pas proportionelle à l’impulsion mais tend vers la vitesse de la lumière dans un processus de saturation. En fonction de l’énergie on a β= 1− m2 E2 (2.5) Comme la vitesse n’augmente guère malgré l’augmentation constante en énergie, la radiofréquence d’accélération et la rotation de la particule se déphasent très vite, à une énergie de quelques dizaines de MeVpour des protons. 2.2. LE SYNCHROTRON 2.2 13 Le synchrotron Mais l’obtention d’une vitesse constante asymptotique, celle de la lumière, est très utile pourvu que le rayon de courbure reste constant. Dans ce cas, la fréquence de rotation devient de nouveau indépendante de l’énergie. Ceci est le principe du synchrotron. En augmentant de champ magnétique proportionnellement à l’impulsion de la particule, le rayon de courbure reste constant. On évite alors d’une part d’avoir à remplir tout un espace avec le champ magnétique et peut le concentrer autour d’une chambre à vide dont la forme s’approche d’un anneau. D’autre part, la fréquence cyclotronique devient constante à haute énergie si le champ B est maintenu proportionnel à l’énergie. On peut alors travailler avec une radiofréquence accélératrice constante. Cette radiofréquence est transmise au faisceau par des cavités résonantes. Comme ce principe du synchrotron réclame une certaine vitesse initiale qui s’approche déjà suffisamment de la vitesse de lumière, on injecte un faisceau de particules pré-accélérées, d’habitude par un accélérateur linéaire (voir Section 2.3). Le processus d’accélération doit s’arrêter quand on arrive au champ limite des aimants dipolaires. On extrait alors le faisceau ou on convertit l’accélérateur en anneau de stockage. Dans ce mode d’opération, on fournit à chaque tour juste l’énergie perdue par le faisceau en rayonnement de freinage. Electron Beam Pulsed Magnet 1 meter Pulsed Inflector View Port RF TV RF Spark Chambers Pulsed Inflector Fig. 2.3 – Le synchrotron en anneau de stockage pour électrons de Princeton-Stanford. Les structures en quart d’anneau sont des aimants dipolaires. La séparation des fonctions et la concentration des composantes autour d’un anneau permet de combiner deux anneaux pour arriver à un collisonneur. Un anneau de ce type est montré CHAPITRE 2. LES ACCÉLÉRATEURS 14 dans la Figure 2.3. Il s’agit de l’anneau de stockage de Princeton-Stanford 2 un des premiers exemples de collisionneurs de particules. On peut se demander pourquoi on a toujours besoin de radiofréquence accélératrice dans un anneau de stockage, même après que l’énergie finale, déterminée par le champ maximum des aimants dipolaires, aie été atteinte. Ceci est dû au fait qu’une particule chargée accélérée perd une certaine fraction de son énergie sous forme de radiation, c’est à dire en émettant des photons. Ce processus est le rayonnement par freinage, ou Bremsstrahlung, qui produit les photons dans un tube de Roentgen. Dans ce tube, l’accélération des particules est longitudinale. Mais aussi l’accélération transversale crée la Bremsstrahlung. La puissance perdue en radiation par la déviation magnétique se comporte comme PB ∼ E3 γ3 ∼ 3 ρ mρ (2.6) et est donc grande pour particules légères circulant sur de petits cercles. Cette perte doit être remplacée constamment pour obtenir un faisceau qui circule d’une manière stable. La focalisation transversale du faisceau se fait par des champs magnétiques quadrupolaires. Une faible composante quadrupolaire est normalement présente même dans des aimants dipolaires. La Figure 2.4 3 montre qualitativement les forces focalisants verticalement résultant d’une légère composante quadrupolaire horizontale. En alternant cette configuration avec une qui est tournée de 90◦ , on obtient une focalisation dans les deux directions transversales au faisceau. Fig. 2.4 – Focalisation par une composante quadrupolaire dans un champ dipolaire. Les aimants avec champ dipolaire et quadrupolaire accompagnant accélérateur en anneau sont construits comme le montre la Figure 2.5. Deux bobines créent un champ dipolaire, quatre un champ quadrupolaire. Aujourd’hui ces bobines sont normalement supraconducteurs pour minimiser les pertes ohmiques. Mais une focalisation s’impose aussi dans la direction longitudinale. La raison est que les particules doivent arriver d’une manière synchrone aux points d’accélération. On les injecte donc par courts paquets. Si ils arrivent aux résonateurs de radiofréquence sur la pente croissant du champ électrique, leur phase reste stable. Cet effet est visualisé dans la Figure 2.6. Une 2. W.C. Barber et al., Wide Angle Electron-Electron-Scattering on the Princeton-Stanford Storage Rings, Proceedings of the Vth International Conference on High Energy Accelerators, M. Grilli edt., Frascati 1965; W.C. Barber et al., Test of Quantum Electrodynamics by Electron-Electron-Scattering, Phys. Rev. Lett 16 (1966) 1127 3. P. Schmüser, Basic course on accelerator optics, CERN Accelerator School 1986, CERN 87-10. 2.3. L’ACCÉLÉRATEUR LINÉAIRE 15 Fig. 2.5 – Arrangement de bobines pour aimants dipolaires et quadrupolaires. particule qui arrive avec un léger retard par rapport à la phase idéale verra un champ qui est plus fort que le champ moyen. Par contre, une particule avec une légère avance verra moins de champ accélérateur. De cette manière, les particules seront amenées à osciller automatiquement autour de la phase idéale. Fig. 2.6 – Le principe de la stabilité de phase sur la pente croissante de l’onde de radiofréquence. Les plus puissants accélérateurs d’aujourd’hui travaillent en majorité selon le principe du synchrotron. La Figure 2.7 montre un exemple, le Large Electron Positron collider LEP du CERN à Genève. Les paramètres de quelques importants collisionneurs circulaires, en cours d’exploitation et planifiés pour le futur proche, sont affichés dans le Tableau 2.1. 2.3 L’accélérateur linéaire Il est tentant de vouloir combattre la perte d’énergie dans un synchrotron selon l’Equ. 2.6, que l’on appelle aussi rayonnement synchrotron tellement elle est typique de ce type d’accéléra- CHAPITRE 2. LES ACCÉLÉRATEURS 16 Fig. 2.7 – Le réseau des accélérateurs du CERN, avec le Proton Synchrotron (PS), le Super Proton Synchrotron (SPS) et les collisionneurs Large Electron Positron collider (LEP) et Large Hadron Collider (LHC). Tab. 2.1 – Quelques collisionneurs à hautes énergies couramment en exploitation ou planifiés. Le collisionneur LHC est en construction. Le projet Tesla est en cours d’évaluation. Nom LEP SLC Tevatron HERA PEP-II KEKB LHC TESLA Centre CERN, Genève SLAC, Stanford FNAL, Chicago DESY, Hamburg SLAC, Stanford KEK, Tsukuba CERN, Genève DESY, Hamburg Principe/Particules Synchrotron, e+ e− Coll. linéaire, e+ e− Synchrotron, pp̄ Synchrotron, e± p Synchrotron e+ e− Synchrotron e+ e− Synchrotron, pp Coll. linéaire, e+ e− √ s[ GeV] 90 à 200 90 2000 330 10.5 10.5 14000 300 à 800 WWW site www.cern.ch www.slac.stanford.edu www.fnal.gov www.desy.de www.slac.stanford.edu www.kek.jp www.cern.ch www.desy.de 2.3. L’ACCÉLÉRATEUR LINÉAIRE 17 teur, en augmentant le rayon de courbure ρ et en affaiblissant le champ des aimants dipolaires en même temps. Ceci mène aux complexes d’accélérateurs assez vastes comme ceux montrés dans la Figure 2.7. Pour encore augmenter l’énergie on peut avoir recours aux particules plus lourdes, comme dans le cas du LHC, collisionneur pp qui remplacera le LEP, collisionneur e+ e− , dans le même tunnel du CERN (voir le Tableau 2.1). Le désavantage est que des particules plus lourds que l’électron sont soit instables (comme le µ 4 ou le τ ), soit non-ponctuelles comme le proton. Dans le premier cas, on ne peut pas stocker les particules à volonté, en contraste avec le LEP qui les garde pour plusieurs heures. Dans le deuxième cas, ce ne sont pas vraiment les protons, mais les quarks qui interagissent pour créer une réaction voulue. Si l’on suppose que chacun des trois quarks porte à peu près un tiers de l’impulsion du proton (ce qui n’est pas tout à fait vrai, voir Chapitre 6), on réalise que seule une petite fraction de l’énergie fournie peut être utilisée dans une collision hadronique. L’alternative à l’utilisation des particules lourdes est donc de les dévier le moins possible et de laisser ρ tendre vers l’infini. Cela donne un accélérateur linéaire, dont le principe est visualisé dans la Figure 2.8. Une grande partie du tube à vide qui contient le faisceau est elle-même une structure résonante de radiofréquence, dans laquelle une onde électromagnétique se déplace. Entre les cavités résonantes, il y a des gaps, réalisés par des tubes conducteurs ou simplement par une distance non-equipée entre deux cavités. La longueur l des gaps doit suivre la vitesse v des particules accélérées vT l= (2.7) 2 où T est la période de la radiofréquence. Il faut aussi qu’au passage de la particule dans une partie non-blindée de la cavité, le champ électrique soit de la valeur et du signe voulus. Une fois que la vitesse de la particule s’approche suffisamment de c, l devient donc constant. Les conditions de la stabilité de la phase accélératrice ainsi que les mécanismes de focalisation transversale sont les mêmes que dans le cas des machines circulaires. Fig. 2.8 – Principe de l’accélérateur linéaire. Pour que les particules soient accélérées dans un guide d’onde, il faut que – le champ électrique ait une grande composante Ez le long la direction de la particule et des petites composantes transverses à cette direction. Ceci nécessite une onde de type T M, c’est à dire avec le champ magnétique transverse par rapport à la direction de propagation; – la vitesse de phase vp soit à peu près la même que celle de la particule. 4. Il existent des plans pour un collisionneur de muons au CERN, voir le site web http://muonstoragerings.c̃ern.ch CHAPITRE 2. LES ACCÉLÉRATEURS 18 Soit Φ = ωt − kz la phase d’une onde électromagnétique qui se propage dans la direction z. La fréquence angulaire, vue par un observateur au repos dans le laboratoire à z = const, sera dΦ =ω dt (2.8) tandis que celle vue par un observateur en mouvement avec la vitesse v sera dt dz dt dΦ = ω − k = γ(ω − vk) dt dt dt dt Etant donné que k = ω/vp, on a v dΦ = γω 1 − dt vp (2.9) (2.10) La condition de synchronisme veut que ∂Φ/∂t = 0. Il en suit que nous devons arranger la cavité tel que vp = v c. Fig. 2.9 – Cavité résonante supraconductrice avec neuf cellules en Niobdène pour le collisionneur linéaire Tesla. Il faut de toute façon tenir compte du fait que les particules ne passent qu’une seule fois par les structures accélératrices, en contraste avec les machines circulaires où ils passent des milliers de fois par seconde. On doit donc obtenir les plus grandes valeurs du champ électrique possibles. Ceci réclame des cavités supraconductrices qui peuvent atteindre des champs de l’ordre de 25 MV/m. La Figure 2.9 montre une telle cavité supraconductrice on Niobdène 5 avec neuf cellules. Un grand accélérateur linéaire a besoin de plusieurs milliers de structures accélératrices. Cela veut aussi dire que les machines linéaires ne sont pas toutes courtes non plus. La Figure 2.10 montre l’exemple du premier collisionneur linéaire, le SLAC Linear Collider (SLC) du Stanford Linear Accelerator Center (SLAC) en Californie. 5. TESLA Conceptual Design Report, R. Brinkmann et al., DESY 1997-048, http://www-mpy.desy.de/lccdr/tesla/tesla.html 2.3. L’ACCÉLÉRATEUR LINÉAIRE 19 Fig. 2.10 – Schéma du SLAC Linear Collider (SLC) du Stanford Linear Accelerator Center (SLAC) près de San Francisco en Californie. 20 CHAPITRE 2. LES ACCÉLÉRATEURS 21 Chapitre 3 Lois d’invariance et grandeurs conservées L’importance des symétries, c’est à dire des lois d’invariance, respectées en physique des particules ne doit pas être sousestimée. Sans trop d’exagération on peut même dire que tout cette physique se base sur de tels principes. Un exemple primordial nous est déjà familier: l’invariance vis-à-vis les transformation de Lorentz. Dans ce chapitre on va traiter des symétries envers d’autres transformations de ce même type, celui des transformation des coordonnées de l’espace-temps, Φ(x) → Φ(x ). Ceci concerne les transformation continues, comme les translations et rotation, aussi bien que discrètes, comme la parité et le renversement du temps. On va également considérer des transformations qui concernent les champs eux-mêmes, donc Φ(x) → Φ (x) au lieu de Φ(x) → Φ(x ). Les transformation de jauge et la conjugaison de charge seront nos exemples de ce type. 3.1 Formalisme de Lagrange Pour analyser les propriétés de symétrie on utilise souvent le formalisme de Lagrange, qui concentre toutes les propriétés d’un système dans une seule fonction. On vous rappelle d’abord l’application classique que vous avez apprise dans votre cours de Mécanique analytique. Un système classique est caractérisé par la fonction de Lagrange, L(q,q̇,t), qui peut dépendre des coordonnées généralisées q, des vitesses q̇ ainsi qu’éventuellement explicitement du temps t. De L résulte l’action classique, S, S= t2 dtL(q,q̇,t) (3.1) t1 par intégration sur le temps. Les équation de mouvement découlent du principe de Hamilton de l’action minimale. Celui-ci postule que l’action est stationnaire pour la trajectoire physique du système dans l’espace des qi et q̇i : δS = δ t2 dtL(q,q̇) = 0 (3.2) t1 avec la condition que la variation des coordonnées généralisées est zéro au début et à la fin de la trajectoire: (3.3) δqi (t1 ) = δqi (t2 ) = 0 22 CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES Si en plus L ne dépend par explicitement du temps, mais uniquement de qi et q̇i , on obtient les équations du mouvement à partir des équations de Euler-Lagrange d dt ∂L ∂ q̇i − ∂L =0 ∂qi (3.4) La signification physique de la fonction de Lagrange est qu’elle représente la différence entre l’énergie cinétique T d’un système et son énergie potentielle V L=T −V (3.5) La fonction de Lagrange a donc la dimension d’une énergie. Les équations d’Euler-Lagrange lient la fonction de Lagrange aux équations du mouvement pour tous les systèmes conservatifs. Il en suit que chaque transformation qui laisse L invariante ne change pas la trajectoire des particules du système. Une telle invariance correspond donc à une transformation invisible du système. Exemple 3: Invariance de translation dans l’espace Prenons une seule particule de masse m dans un système unidimensionnel comme exemple. Dans un potentiel V (x), sa fonction de Lagrange sera 1 L = mẋ2 − V (x) 2 L’équation d’Euler-Lagrange mène alors à ∂V = F (x) ∂x donc à l’équation du mouvement de la mécanique Newtonienne. mẍ = − (3.6) (3.7) En ce qui concerne les symétries, l’importance de L provient du fait que l’impulsion pk = ∂L/∂ q̇k est conservée si L ne dépend pas explicitement de la coordonnée canoniquement associée, qk . Dans le cas ou un changement de cette coordonnée est invisible, l’impulsion correspondante devient alors une constante du mouvement. Plus généralement, considérons un système où toutes les forces résultent d’un potentiel V . La fonction de Lagrange sera L = T (q̇i ) − V (qi ) (3.8) Une translation des coordonnées le long d’un axe qi ne change donc pas l’énergie cinétique T . Les équations d’Euler-Lagrange d dt se simplifient alors à ∂(T − V ) ∂(T − V ) − =0 ∂ q̇i ∂qi (3.9) d ∂T ∂V =− (3.10) dt ∂ q̇i ∂qi Nous reconnaissons à gauche la dérivé temporelle de l’impulsion généralisée, à droit la force généralisée, toutes deux dans la direction qi . Sous condition que le potentiel V ne dépend pas de qi , l’impulsion pi correspondante sera donc conservée. En résumé, on constate que l’invariance sous la transformation qi → qi + ∆qi nécessite la conservation de l’impulsion. De la même façon, l’invariance sous une rotation autour d’une axe mène à la conservation du moment cinétique correspondant. 3.1. FORMALISME DE LAGRANGE 23 Exemple 4: Invariance sous la translation dans le temps Si L ne dépend pas explicitement du temps, on a dL ∂L dqj ∂L dq̇k = + dt j ∂qj dt k ∂ q̇k dt (3.11) ∂L d ∂L = ∂qj dt ∂ q̇j (3.12) d ∂L ∂L dq̇k dL = q̇j + dt j dt ∂ q̇j k ∂ q̇k dt (3.13) Avec il en suit que = d ∂L q̇j dt ∂ q̇j j (3.14) Il y a donc une quantité conservée, qui est la fonction de Hamilton: ⎛ ⎞ ∂L d ⎝ ⎠=0 L− q̇j dt ∂ q̇j j (3.15) Pour tels systèmes la fonction de Hamilton H est donc constante: H= q̇j j ∂L − L = T + V = const ∂ q̇j (3.16) et l’énergie totale est conservée. La base de la conservation de l’énergie-impulsion est donc l’invariance par rapport aux translations dans l’espace-temps. Tout cela est valable d’une manière analogue pour une théorie des champs. La différence principale est naturellement que l’on n’utilise plus les coordonnées discrètes qi (t) mais que l’on généralise pour les champs continus Φ(t,x). Le champ peut être vue comme une coordonnée généralisée à chaque valeur de son argument, c’est à dire à chaque point de l’espace-temps. Cela donne un système avec une infinité de degrés de liberté. La description du système se base sur la densité de Lagrange L = L(Φ(x),∂µ Φ(x)) (3.17) qui dépend du champ Φ(x) et de son quadri-gradient ∂µ Φ(x). L’intégrale de l’action devient S= t2 dt t1 d3x L(Φ,∂µ Φ) (3.18) où l’intégrale sur l’espace change la densité de Lagrange L en fonction de Lagrange L: L= d3x L(Φ,∂µ Φ) (3.19) Le principe de Hamilton détermine la trajectoire du système: δ t2 t1 d4 x L(Φ,∂µ Φ) = 0 (3.20) 24 CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES avec les condition initiales et finales δΦ(t1 ) = δΦ(t2 ) = 0. Par le même raisonnement qui s’applique aux systèmes classiques on obtient donc les équations d’Euler-Lagrange pour une théorie des champs: ∂L ∂L − ∂µ =0 (3.21) ∂Φ(x) ∂(∂µ Φ) Elles mènent aux équations du mouvement pour les champs. Si la densité de Lagrange est un opérateur scalaire sous les transformations de Lorentz, donc invariant, les équations du mouvement seront alors covariantes. Exemple 5: Densité de Lagrange pour un champ scalaire Pour un champs scalaire libre Φ(x) de masse m, la densité de Lagrange L= 1 1 (∂µ Φ)∗ (∂ µ Φ) − m2 Φ∗ Φ 2 2 (3.22) mène à l’équation de Klein-Gordon ∂µ ∂ µ Φ + m2 Φ = 0 (3.23) qui décrit son évolution dans l’espace-temps. La solution de cette équation est une onde plane √ µ (3.24) Φ(x) = Ne−ipµ x L’insertion dans la densité de Lagrange donne 1 1 L = Npµ pµ − Nm2 2 2 (3.25) mettant ainsi en évidence l’interprétation en énergie cinétique du premier terme ainsi qu’en énergie potentielle du deuxième. L’insertion dans l’équation du mouvement nous donne (pµ pµ )e−ipµ x − m2 e−ipµ x = 0 µ µ (3.26) ce qui implique que l’énergie-impulsion doit être conservée dans tout l’espace-temps. L’invariance de L sous les translations implique donc la conservation de l’énergie-impulsion. Le fait que les invariance d’un système entraı̂nent la conservation d’une propriété physique du système est une observation tout à fait générale connue sous le nom de théorème de Noether 1 . Ce théorème nous dit que si l’équation du mouvement, ou bien la fonction de Lagrange qui lui est équivalente, est invariante sous une transformation, alors l’observable correspondant au générateur de de cette transformation est une constante du mouvement. Pour comprendre le concept du générateur, prenons encore la translation comme exemple. Une translation infinitésimale δx dans la direction x transforme le champ Φ en ∂ Φ = Φ(x + δx) = 1 + δx Φ(x) ∂x (3.27) Exprimé en impulsions, pµ = −i∂µ , cela correspond à Φ = (1 + iδxpx ) Φ(x) 1. Nommé après la mathématicienne allemande Emmy Amalie Noether, 1882 à 1935 (3.28) 3.2. PARITÉ 25 Une série de n transformations infinitésimales donne une translation finie de ∆x = nδx: Φ = Φ(x) lim (1 + ipx δx)n = Φ(x)eipx ∆x n→∞ (3.29) Il est donc logique d’appeler px le générateur des translations le long l’axe x. Par conséquent, une translation aµ en quatre dimensions est générée par pµ . Pour une petite translation nous avons µ xν = eiaµ p xν (1 + aµ ∂ µ ) = xν + aν (3.30) (3.31) Selon le théorème de Noether, invariance sous les translations implique donc conservation d’énergie-impulsion comme dans le cas classique. 3.2 Parité Autres que translations et rotations, les transformations des coordonnées incluent aussi les transformations discrètes qui sont la parité et le renversement du temps. La parité transforme le quadrivecteur x = (t,x,y,z) en x = (t, − x, − y, − z) par l’action d’un opérateur P. Pour les champs on a PΦ(t,r) = Φ(t, − r) (3.32) La répétition de l’opération donne P(PΦ) = Φ, P est donc un opérateur unitaire avec P2 = 1. Les états propres de P sont ceux pour lesquels PΦ = ±Φ (3.33) avec les valeurs propres limitées à P = ±1 par l’unitarité de l’opérateur. Il existe toutefois bien des fonctions d’onde qui ne sont pas des états propres de P. Par exemple, une fonction Φ = cos x+sin x se transforme en PΦ = cos x−sin x qui est ni +Φ, ni −Φ. Parmi les importantes quantités qui sont, par contre, des états propres de P, on trouve notamment celles cités dans le Tableau 3.1. La parité est conservée dans les réactions dues aux forces fortes et électromagnétiques, mais pas dans les interactions faibles. Ceci veut dire que si un système est dans un état propre de P avant la réaction, il sera dans un état propre avec la même valeur propre après la réaction. Une telle loi de conservation ne peut être établie qu’expérimentalement, on cherche donc toujours à trouver des cas ou elle ne serait pas respectée. quantité scalaires s pseudoscalaires p vecteurs v pseudovecteurs a transformation P P(s) = s P(p) = −p P(v) = −v P(a) = a JP 0+ 0− 1− 1+ Tab. 3.1 – Propriétés de quelques quantités états propres sous transformation de parité. Les systèmes avec un potentiel à symétrie sphérique sont états propres de P. Une exemple est l’atome de hydrogène avec sa fonction d’onde en coordonnées sphériques Φ(r,θ,φ) = χ(r)Ylm (θ,φ) (3.34) 26 CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES avec les harmoniques sphériques Ylm . La transformation r → −r équivaut à (r,θ,φ) → (r,π − θ,π + φ) et donc (3.35) Ylm (θ,φ) → Ylm (π − θ,π + φ) = (−1)l Ylm (θ,φ) La parité d’un tel système est donc (−1)l . Les transitions électromagnétiques d’un tel système réclament ∆l = ±1, donc la parité d’un photon doit être (−1) si la parité doit être conservée dans la transition. Les hadrons sont des états propres de la parité, on peut alors utiliser sa valeur propre pour caractériser une particule, tout comme le spin, la charge électrique ou le nombre baryonique etc. Le moment cinétique total J = l + s intervient en plus de la parité intrinsèque des composantes. On utilise par conséquent la notation J P comme caractéristique. Vous la trouverez dans les tableaux du PDG pour chaque particule. La parité des fermions est opposée à celle des antifermions. Par convention, on fixe la parité arbitrairement à (+1) pour les quarks, les antiquarks ont donc la parité (−1). Pour les bosons la parité est la même pour particule et antiparticule. La parité est un nombre quantique multiplicatif, de telle sorte que la parité totale d’un système à l’état fondamental est le produit des parités individuelles de ses composantes. Si il y a un moment cinétique relatif entre les composantes caractérisé par un nombre quantique l, il faut en tenir compte par un facteur (−1)l comme dans l’atome d’hydrogène. Exemple 6: Parité des baryons et mésons Les baryons qui contiennent juste trois quarks sans moment cinétique relatif, comme le proton + (uud) et le neutron (udd) ont la parité (+1)3 = (+1), donc J P = 12 . Les mésons les plus légers, √ comme les pions (ud̄,dū, (uū+dd̄)/ 2)) et les kaons, contiennent quark et antiquarks avec spins antiparallèles (↑↓). Ils ont parité (+1)(−1) = (−1) et on les appelle mésons pseudoscalaires, en accord avec la nomenclature du Tableau 3.1. Les états analogues avec spins parallèles (↑↑), comme les mésons ρ, K∗ , ω, Φ sont appelés mésons vectoriels, ils ont J P = 1− . Les états excités, plus lourds, ont souvent des propriétés de transformation plus complexe. Par exemple les mésons avec (l = 1,s = 1) forment trois sortes d’états, comme le f0 (980) qui est un méson scalaire avec J P = 0+ , le a0 (1260) qui est un pseudovecteur avec J P = 1+ , ou le f2 (1810) qui est un tenseur avec J P = 2+ . Comme ces résonances sont récourentes à plusieurs reprises, on les distingue par leur masse (en MeV) qui est donnée entre parenthèses. Exemple 7: Désintégration du π 0 La parité n’est pas seulement un concept théorique mais a des effets mesurables partout où elle correspond à une observable conservée. Regardons la désintégration dominante du π 0 → γγ. Le π 0 est un boson de spin 0 qui se désintègre donc en deux bosons de spin 1. Pour considérer les spins, on va les projeter sur le seule axe naturel du système, qui est donné par la direction des deux photons dans le système de repos du π 0 . La conservation du moment cinétique réclame donc que l’une des deux configuration esquissées dans la Figure 3.1, ou une combinaison des deux, soit réalisé dans la désintégration. La première configuration correspond à deux photons émis dans un état de polarisation circulaire droite, ΦR , la deuxième avec deux photons polarisés à gauche, ΦL . Sous l’opération P, les impulsions ki des deux photons changent de signe en −ki , mais leur spins si , étant pseudovecteurs, ne changent pas. La parité change donc la première configuration dans la deuxième et vice versa. Comme la parité est conservée dans le processus, il faut donc que la fonction d’onde totale, Φ, soit un état propre de P. Donc à une constante de normalisation près on a les deux possibilités 1 2 Φ± = Φ1R ΦR 2 ± ΦL ΦL (3.36) 3.3. RENVERSEMENT DU TEMPS 27 avec parité (±1), respectivement. L’onde plane du photon est caractérisée par son vecteur de polarisation, qui pointe dans la Pour les photons libres, ce vecteur est normal à la direction direction du champ électrique E. ⊥ k. Soit k = (0,0,kz ), on peut donc avoir une combinaison linéaire des du mouvement, E x = (Ex ,0,0) et E y = (0,Ey ,0). Les états ΦR et ΦL correspondent à polarisation E x + iE R = √1 E y E 2 1 y L = √ E x − iE E 2 (3.37) (3.38) (3.39) Pour la fonction d’onde totale du système, on trouve 1E 2 1 2 Φ+ = E x x − Ey Ey 1E 2 1 2 Φ− = E x y + Ey Ex (3.40) (3.41) (3.42) Dans le premier cas, Φ+ , les polarisations des deux photons seront coplanaires, dans le deuxième, Φ− , elles seront orthogonales. Expérimentalement on trouve qu’elles sont orthogonales 2, la parité du π 0 est donc bien (−1) comme prévu par son contenu en quarks. π0 • ⇐= =⇒ π0 • =⇒ ⇐= Fig. 3.1 – Direction du mouvement des deux photons et alignement de leurs spins dans une désintégration π 0 → γγ au repos. 3.3 Renversement du temps L’opération du renversement du temps transforme le quadrivecteur x = (t,x,y,z) en x = (−t,x,y,z) par l’action d’un opérateur unitaire T. Pour les champs on définit TΦ(t,r) = Φ∗ (−t,r) (3.43) La conjugaison complexe est nécessaire à cause de la transformation de l’équation de Schrödinger ∂Φ(t,x) (3.44) HΦ(t,x) = i ∂t 2. Pour la première mesure voir R. Plano et al., Phys. Rev. Lett. 3 (1959) 525. CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES 28 Avec un opérateur H de l’énergie totale qui est invariant sous T, on a HΦ∗ (−t,x) = i ∂ − Φ∗ (t,x) ∂t (3.45) bien qu’on aurait obtenu (−i) à droite si T ne changerait pas Φ en Φ∗ . Sauf pour les champs de bosons réels, il n’y a donc pas d’états propres de T tout seul, donc également pas de quantité conservée. L’importance de T se trouve plutôt dans la combinaison avec les transformation discrètes de la parité P et de la conjugaison de charge C, parce que l’on peut démontrer que toute théorie des champs locale doit être invariante sous l’action conjointe de CPT. 3.4 Conjugaison de charge L’opérateur de conjugaison de charge, C, est un premier exemple pour une transformation qui concerne le champ lui-même et non pas les coordonnées. Il transforme la fonction d’onde d’une particule, Φp , en fonction d’onde de son antiparticule, Φp̄ : CΦp = Φp̄ (3.46) L’opération change donc le signe de la charge électrique, du moment magnétique, du nombre baryonique et leptonique, bref, de tous les nombres quantiques du type charge. Ainsi, l’opérateur C sur un fermion donne un antifermion avec tous les charges opposées, mais avec la même masse, le même spin et la même impulsion. Encore une fois, les interactions électromagnétiques et fortes respectent C, tandis que les interactions faibles la violent. Certaines particules peuvent à elles seules être des états propres de C. Puisque C inverse le signe des charges, un état propre doit être un boson neutre, avoir ni nombre baryonique ni leptonique. Par exemple, le méson pseudoscalaire π 0 , qui est sa propre antiparticule, a CΦπ0 = Φπ0 , avec valeur propre C = (+1). Comme le photon est généré par des charges en mouvement, qui changent de signe sous C, on a CAµ = −Aµ . La conjugaison de charge est encore un nombre quantique multiplicatif, un système de n photons a C = (−1)n . Par exemple, la désintégration π 0 → γγ respecte la conservation de C, mais π 0 → γγγ est interdit. En effet, le rapport d’embranchement de dette dernière désintégration 3 est inférieur à 3.1 × 10−8 . 3.5 Transformations de jauge Une importante classe de transformation des champs reste à discuter, les transformation de phase, historiquement appelées les transformations de jauge. Vous en connaissez déjà un exemple qui appartient à la physique classique: les transformations de jauge du champ du photon, Aµ . Vous avez le droit de vous étonner que l’on identifie ici le quadripotentiel Aµ avec et magnétique, B. Vous verrez dans le champ du photon et non pas les champs électrique, E l’Exemple 3.5 une justification expérimentale frappante pour cette manoeuvre. Les équations du mouvement du photon libre sont les équations de Maxwell homogènes, qui peuvent être écrites comme (3.47) ∂µ F µν = 0 3. Voir http://pdg.web.cern.ch/pdg/19999/mxxx.html 3.5. TRANSFORMATIONS DE JAUGE 29 avec le tenseur du champ ⎛ ⎜ ⎜ ⎝ F µν = ∂ µ Aν − ∂ ν Aµ = ⎜ ⎞ 0 E1 E2 E3 −E1 0 B3 −B2 ⎟ ⎟ ⎟ −E2 −B3 0 B1 ⎠ −E3 B2 −B1 0 (3.48) Ce tenseur suit d’un quadripotentiel Aµ Aµ = V A (3.49) donnent les ainsi que ses composantes, le potentiel scalaire, V , et le potentiel vectoriel, A, champs = ∇ ×A B (3.50) = −∇V − ∂A E ∂t (3.51) Les équation du mouvement du photon sont invariantes sous les transformations de jauge + ∇Λ → A = A A ∂Λ V → V =V + ∂t (3.52) (3.53) avec une fonction scalaire Λ(x) arbitraire. Ces transformations peuvent être écrites d’une manière covariante comme Aµ → Aµ = Aµ + ∂ µ Λ. Une telle transformation du potentiel et B invariants. Elle ne change pas non plus les équations du mouvement laisse les champs E du photon. Dans votre cours de physique classique vous en avez probablement conclu, au moins implicitement, que cette ambiguı̈té dans la définition du potentiel est un défaut qui vous a fait penser que les particules interagissent avec le champ plutôt qu’avec le potentiel. Le contraire est le cas au niveau quantique: l’expérience montre que les champs matière interagissent avec le potentiel. Et l’invariance de jauge du potentiel est une vertu qui entraı̂ne la conservation des charges. Nous entrons un peu dans les détails pour étoffer ces deux faits étonnants. Exemple 8: L’expérience de Aharonov-Bohm Le potentiel électromagnétique entraı̂ne un changement de phase d’un champ de particule chargée, plus exactement de sa fonction d’onde ou de son amplitude de probabilité. Pour voir ceci on regarde d’abord une particule libre non-relativiste, qui suit l’équation de Schrödinger i ∂ψ0 = H0 ψ0 ∂t (3.54) Dans un potentiel scalaire qui dépend du temps on aura l’équation inhomogène i ∂ψ = Hψ = [H0 + V (t)] ψ ∂t (3.55) Ses solutions auront une phase S(t) qui dépend du temps ψ = ψ0 e−iS (3.56) CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES 30 et on obtient i ∂S ∂ψ ∂ψ0 −iS + ψ0 e−iS = i e ∂t ∂t ∂t ∂S −iS ψ0 e−iS = H0 ψ0 e + ∂t ∂S = H0 + ψ ∂t (3.57) (3.58) (3.59) La comparaison des coefficients avec l’Equation 3.55 nous montre que ∂S = V (t) ∂t (3.60) Sur un parcours fermé on obtient alors un décalage ∆S de la phase V (t)dt ∆S = (3.61) De même, on trouve pour un quadripotentiel Aµ : ∆S = V dt − x= Ad Aµ dxµ (3.62) Le décalage de la phase est donc proportionnel au flux magnétique inclu dans le parcours. Un tel changement de phase devrait être observable, car une différence de phase – en contraste avec une phase absolue de la fonction d’onde – est mesurable dans une expérience interferométrique. On peut alors se demander si les décalages de phases se produisent aussi si la particule parcourt un espace où le champ disparaı̂t partout, mais ou le potentiel n’est pas zéro partout. Le principe d’une telle expérience 4 est esquissée dans la Figure 3.2. Des électrons sortent de la source S. Ils sont mis en interférence par le biprisme à double fente b. Les franges d’interférence apparaissent sur l’écran en o. Si l’on introduit une très fine bobine solénoidale longue 5 dans le parcours à l’endroit a, il en résulte un potentiel sur le parcours des électrons, bien que le champ magnétique soit zéro partout. Si l’on varie le flux magnétique, on observe alors un décalage des franges. Ceci démontre que les électrons interagissent bel et bien avec le potentiel même en absence de champs. Le potentiel électromagnétique change la phase des champs de matière. Ceci correspond à une transformation de la fonction d’onde selon Φ(x) → Φ (x) = eiαQ Φ(x) (3.63) avec un angle constant α = α(x) et l’opérateur de la charge Q dont toutes les particules chargées sont des états propres: QΦ(x) = ±eΦ(x) (3.64) Il s’agit d’une transformation dite globale, parce qu’elle concerne tous les champs et change leur phase par le même angle partout. Les équations du mouvement d’un champ scalaire complexe Φ(x) suivent d’une densité de Lagrange L = (∂µ Φ)∗ (∂ µ Φ) − m2 Φ∗ Φ (3.65) 4. Y. Aharonov and D. Bohm, Phys. Rev. 115 (1959) 485; R.G. Chambers, Phys. Rev. Lett 5 (1960) 3. 5. G. Möllenstedt et W. Bath, Phys. Blätter (1962) 299 3.5. TRANSFORMATIONS DE JAUGE 31 Intensitat I 0 Intensitat I 0 Intensitat I Interferenzbild am Biprisma 0 1 0.75 0.5 0.25 0 b a’ s a o 1 0.75 0.5 0.25 0 1 0.75 0.5 0.25 0 2.5 5 7.5 10 12.5 15 17.5 20 22.5 25 Auslenkung o 2.5 5 7.5 10 12.5 15 17.5 20 22.5 25 Auslenkung o 2.5 (a) 5 7.5 10 12.5 15 17.5 20 22.5 25 Auslenkung o (b) Fig. 3.2 – (a) Principe de l’expérience de Aharonov et Bohm démontré avec un biprisme. (b) Franges d’interférence (de haut en bas) de la diffraction par une fente, pour un biprisme idéal et pour les deux ensembles. qui est invariante sous ces transformations de phase. Cette invariance implique un courant conservé. Prenons une transformation infinitésimale Φ → (1 + iαQ)Φ (3.66) L’invariance de la densité de Lagrange veut dire que ∂L ∂L ∂L ∗ ∂L δΦ + δ(∂µ Φ) + δ(∂µ Φ∗ ) δΦ + ∗ ∂Φ ∂(∂µ Φ) ∂Φ ∂(∂µ Φ∗ ) ∂L ∂L (iαeΦ) + (iαe∂µ Φ) + ... = ∂Φ ∂(∂µ Φ) ∂L ∂L ∂L Φ + iαe∂µ = iαe − ∂µ Φ + ... ∂Φ ∂(∂µ Φ) ∂(∂µ Φ) δL = (3.67) (3.68) (3.69) Le premier terme disparaı̂t à cause de l’équation de Euler-Lagrange. Ainsi l’invariance δL = 0 demande que ∂L ∂L ∗ e∂µ Φ−Φ =0 (3.70) ∂(∂µ Φ) ∂(∂µ Φ∗ ) Le terme entre parenthèses donne le courant recherché j µ = −e (Φ∗ ∂ µ Φ − Φ∂ µ Φ∗ ) (3.71) qui est alors conservé selon ∂µ j µ = 0. Considérons d’abord la partie temporelle de ce quadricourant ∂ j 0 = −e (Φ∗ (x)Φ(x)) (3.72) ∂t 32 CHAPITRE 3. LOIS D’INVARIANCE ET GRANDEURS CONSERVÉES Il s’agit là du changement local de la densité de charge. La partie spatiale (Φ∗ (x)Φ(x)) j = −e∇ (3.73) est le vecteur du flux de charge, ou plus précisément du flux de la densité de charge. L’équation de continuité ∂µ j µ = 0 veut donc dire que la densité de charge dans un volume ne peut changer que par un flux de particules qui entre ou sort du volume. La charge est donc conservée. Ainsi on a démontré que l’invariance de la densité de Lagrange sous les transformations de jauge globales implique la conservation de la charge, observable correspondant au générateur des transformations de phase. Le lien entre ces transformations et les transformations de jauge classiques de Aµ est donné par le fait que c’est Aµ même qui change la phase des champs de matière. Donc un changement de jauge pour Aµ change globalement toutes les phases des champs de matière. Il est plausible que la physique doit être invariante sous ce changement, ce qui implique la conservation de la charge électrique. Dans les théories des champs modernes qui forment ensemble le Modèle Standard, on demande une invariance de jauge bien au delà des transformations globales. On impose à la densité de Lagrange une invariance sous les transformation de jauge locales, avec un angle α(x) indépendant en chaque point de l’espace-temps. Ceci définit la structure même des interactions électromagnétiques, faibles et fortes. Leurs théories des champs, basé sur un tel principe, sont alors collectivement appelées théories de jauge. On laisse aux cours avancés, consacrés à ces interactions, approfondir ce sujet fascinant. 33 Chapitre 4 Amplitude et section efficace Jusqu’ici on s’est plutôt intéressé aux situations statiques et stationnaires, où les champs évoluent librement dans l’espace-temps. Maintenant on va créer un peu de dynamique en faisant intervenir des forces, c’est à dire que l’on va commencer à étudier les processus de diffusion et de désintégration. Pour caractériser ces processus on a besoin d’une quantité qui mesure la puissance d’une réaction, ou, dans le contexte de la mécanique quantique, sa probabilité. Cette quantité est la section efficace, σ, pour les diffusions et son analogue pour les désintégrations, le taux de désintégration, Γ. c a b d Fig. 4.1 – Section efficace géométrique 4.1 Section efficace L’origine du concept de la section efficace est purement géométrique, comme son nom l’indique. Considérons une réaction a + b → c + d, voir Figure 4.1. Dans le laboratoire, le flux Fa des projectiles a, c’est à dire leur nombre par unité de surface et de temps, est Fa = ρa va (4.1) avec leur densité ρa et leur vitesse (par rapport au cible b au repos) va . Si chaqu’une des particules cibles a une section efficace σ, qui représente la probabilité de la toucher, le taux des réactions par seconde sera W = Fa Nb σ (4.2) 34 CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE avec le nombre Nb de cibles. La section efficace est donc définie comme le taux de réaction par unité de flux projectiles et par particule cible. Le facteur de normalisation est aussi appelé la luminosité, L = Fa Nb dans le laboratoire. Dans le centre de masse, par exemple dans un collisionneur, la luminosité est Na Nb ν L= (4.3) A où Na et Nb sont les nombres de particules de chaque type par bunch, ν est la fréquence de circulation des bunches et A est leur surface commune au point de collision. La section efficace a la dimension d’une surface. Elle est mesurée dans l’unité (énorme!) de barn, 1b = 10−28 m2 . Les sections efficaces que l’on trouve pour les leptons et quarks sont plutôt de l’ordre de nanobarn, 1nb = 10−9 b, ou picobarn, 1pb = 10−12 b = 10−40 m2 . Au lieu d’observer seulement le taux total d’une réaction, on peut en enregistrer la distribution, par rapport à l’angle solide, par exemple. Dans ce cas, après normalisation par la luminosité, on mesure la section efficace différentielle, dσ/dΩ, avec σ= 4.2 dσ dΩ dΩ (4.4) Taux de désintégration En ce qui concerne les désintégrations, la définition est tout à fait analogue. Il n’y a pas de projectile, donc on considère uniquement les particules b dans l’état initial. On normalise le nombre de désintégrations par seconde, dNb /dt, par leur nombre Nb et on trouve donc un taux de désintégration dNb 1 1 Γ=− = (4.5) dt Nb τb qui est l’inverse de leur temps de vie τb . Le taux Γ a la dimension d’une énergie. On l’appelle aussi la largeur de la particule, car elle correspond à l’incertitude en masse de la particules. On peut donc la mesurer soit en mesurant le temps de vie d’une particule, soit en observant la largeur de la distribution en masse invariante de ses produits de désintégration. Si plusieurs canaux de désintégration existent, le temps de vie observé dans chaque canal est bien sûr le même. Néanmoins le taux de désintégration dépend du canal. En définit alors un taux partiel Γi pour chaque canal i. Evidemment, la conservation de la probabilité réclame que Γ= i Γi = 1 τb (4.6) Analogue à la section efficace différentielle, on peut aussi mesurer le taux différentiel d’une désintégration, par exemple dΓ/dΩ. 4.3 Amplitude invariante Le définition donnée ci-dessus pour la section efficace et le taux de désintégration est une prescription de mesure: on observe le taux d’une réaction et normalise par le flux des projectiles et par le nombre de cibles exposés au faisceau. Pour évaluer une théorie, c’est à dire pour confronter ses prédictions à l’expérience, il nous faut aussi une prescription pour le calcul de 4.3. AMPLITUDE INVARIANTE 35 sections efficaces. Cette prescription s’appelle la Règle d’or de Fermi. Nous rappelons que dans la théorie de diffusion non-relativiste, le taux de diffusion est donné par W = |M|2Q (4.7) avec l’amplitude invariante de diffusion, M, et la densité d’états finaux, Q = dNc /dt. Cette dernière tient compte du nombre d’états – dans le sens quantique – que peut contenir l’état final. L’amplitude M peu être interprétée comme l’amplitude de probabilité pour une diffusion qui convertit un état initial Φa en état final Φc . Elle est donc une amplitude de probabilité dans le même sens que la fonction d’onde. Φa Φb jµac @ @ R =⇒ @ @ ) ( ) ~ Aµ Fig. 4.2 – Interaction d’une particule avec un potentiel statique, ici avec le potentiel électromagnétique. On s’imagine qu’au premier ordre, une seule action locale d’un potentiel V(x) transforme l’état initial Φa en l’état final Φc , comme représenté dans la Figure 4.2: Φc (x) = V(x)Φa (x) (4.8) L’amplitude de probabilité pour ce processus – ignorant la normalisation exacte pour le moment – est donné par M = −i d4 x Φ∗c (x)V(x)Φa (x) (4.9) L’argument de l’intégrale est la probabilité de trouver Φc à x parmi tous les états finaux produits par V à partir de l’état initial Φa . L’intégration sur l’espace-temps tient compte du fait que cette interaction locale peut intervenir partout où règne le potentiel. Pour aider votre intuition, imaginez que les deux fonctions d’onde Φa et Φc correspondent à des particules libres partout sauf au moment de l’action du potentiel. L’état initial Φa sera donc une superposition d’états propres de l’Hamiltonien libre avec un certain set de coefficients. Le potentiel va transformer ces coefficients pour produire une autre superposition d’états propres, avec un différent ensemble de coefficients. L’amplitude M est alors juste l’amplitude de l’état final Φc que contient ce nouveau mélange. La section efficace peut être calculée en normalisant la probabilité de la réaction, qui correspond à |M|2 . On obtient |M|2 dQ (4.10) dσ = F avec le flux incident pour l’état initial F = |va − vb | 2Ea 2Eb = 4 (pa pb )2 + m2a m2b (4.11) CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE 36 qui dépend de la vitesse relative va − vb | de particule et cible. La dernière équation est valable pour va ||vb et met en évidence l’invariance de ce flux par rapport aux transformations de Lorentz. Le facteur de l’espace de phase, dQ, tient comte du nombre d’états qui peuvent être réalisés dans l’état final dQ = (2π)4 δ (4) (pc + pd − pa − pb ) d 3 pd d 3 pc (2π)3 2Ec (2π)3 2Ed (4.12) Il contient un terme qui assure la conservation de l’énergie-impulsion, ainsi que le comptage du nombre d’états quantiques pour tous les particules dans l’état final. Les facteurs Ni = 2Ei pour tous les facteurs de normalisation interviennent à cause de notre manière de normaliser les fonctions d’onde. L’amplitude invariante, M, contient toute la dynamique de la réaction, donc toute la physique caractéristique pour le type d’interaction qui intervient. Il suit donc de l’opérateur du potentiel, V. Celui-ci est le même qui modifie les équations de mouvement homogènes de tel sorte que ∂µ ∂ µ + m2 = −VΦ (4.13) Pour les interactions électromagnétiques, cette équation inhomogène suit de l’équation de KleinGordon par la substitution (dite minimale) i∂µ → i∂µ + eAµ . Pour le potentiel on obtient alors, en négligeant des termes proportionnels à e2 1, V = −ie (∂µ Aµ + Aµ ∂µ ) (4.14) Pour l’amplitude invariante on trouve M = −i = −e = −i d4 x Φ∗c (x)V(x)Φa (x) (4.15) d4 x Φ∗c (x) (∂µ Aµ + Aµ ∂µ ) Φa (x) (4.16) d4 x jµac Aµ (4.17) La densité de courant électromagnétique qui intervient ici µ = −ie (Φ∗c ∂ µ Φa − Φa ∂ µ Φ∗c ) jac (4.18) est la même que l’on a trouvé dans l’Equation 3.71. A l’exception près que les champs dans l’état initial et final ne sont plus les mêmes, comme il y a eu interaction. C’est donc la densité du courant de charge qui interagit localement avec le champ du photon, Aµ . Reste à comprendre comment le potentiel naı̂t, comment le photon est produit. Pour les interactions électromagnétiques, ce sont les équations de Maxwell inhomogènes qui nous disent comment les champs sont produits: ∂µ F µν = j ν (4.19) à partir d’une densité de courant j ν . En potentiel, cela donne ∂µ ∂ µ Aν + ∂ ν ∂µ Aµ = 0 (4.20) En utilisant l’invariance du champ de photon Aµ sous les transformation de jauge Aµ → Aµ + ∂µ χ (4.21) 4.3. AMPLITUDE INVARIANTE 37 avec un champ scalaire arbitraire χ(x), on peut toujours s’arranger ainsi que ∂µ Aµ = 0 (4.22) On appelle cet arrangement, la jauge de Lorentz. Sous cette jauge, les équations de Maxwell homogènes, ∂µ ∂ µ Aν = 0, sont bien quatres équations Klein-Gordon pour les composantes du champ, dont seulement trois sont indépendantes à cause de la condition de jauge même, Equation 4.22. Cela justifie que nous avons considéré les équations de Maxwell 4.19 comme les équations de mouvement pour le photon dans le chapitre 3. En présence d’un courant, les équations deviennent ∂µ ∂ µ Aν = j ν (4.23) Nous construisons j ν à partir des fonctions d’onde des deux autres partenaires dans la réaction, b et d, qui sont les sources du champ: ν jbd = +ei Nb Nd (pνb + pνd ) e−i(pd −pb )x (4.24) Par conséquent, un champ de photon Aµ = − 1 jµ q2 (4.25) avec la quadri-impulsion transférée, q = pd − pb = pa − pc , respecte les équations inhomogènes de Maxwell, Equation 4.23. L’amplitude correspond donc à l’interaction entre deux courants M=i d4 x jµac 1 µ j q 2 bd (4.26) en faisant intervenir le propagateur 1/q 2 qui décrit l’amplitude de probabilité qu’un photon d’impulsion q soit échangé entre les deux. Φa Φb jµac @ @ R =⇒ @ @ ) ( γ(q) ) @ @ R =⇒ @ @ Φc Φd jµbd Fig. 4.3 – Interaction d’une particule avec une autre, par échange d’un photon. Ce processus peut être représenté par un diagramme de Feynman que montre la Figure 4.3. Ces diagrammes décrivent les processus élémentaires de diffusion et de désintégration d’une manière à la fois élégante et intuitive. Ils sont en même temps des prescriptions de calcul pour l’amplitude invariante correspondante. Les vertex sont caractérisés par une constante de couplage, la charge électrique e dans le cas des interactions électromagnétiques, et par un opérateur 38 CHAPITRE 4. AMPLITUDE ET SECTION EFFICACE qui décrit les propriétés de transformation de l’interaction. Le lignes correspondent aux propagateurs des particules, réels pour les lignes extérieures, virtuels pour les lignes intérieurs qui relient deux vertex. Le propagateur 1/q 2 que nous avons trouvé pour le photon virtuel est un cas spécial du plus général, 1/(q 2 − M 2 ), pour les bosons intermédiaires massifs. Si plus d’un processus élémentaire peut intervenir dans une réaction, nous devons additionner soit les amplitudes soit les sections efficaces. A cause de la nature quantique des processus en question il existe deux cas: – Si les états initial et final des processus sont principalement indiscernables, il faut additionner au niveau des amplitudes. – Quand il existe une observable qui permet en principe de distinguer les différentes contribution, si elle est réellement mesurée ou non, il s’agit de sous-processus indépendants et il faut additionner les sections efficaces. Le premier cas intervient par exemple si l’on considère deux contributions de différent ordre à la même réaction: l’échange d’un et de deux photons intervient entre les mêmes états initiaux et finaux. Si l’on les décrit par des amplitudes M1 et M2 , respectivement, l’amplitude carrée qui rentre dans le calcul de la section efficace est |M|2 = |M21 + M22 + M1 M2 |. Au niveau de la probabilité apparaissent alors des termes d’interférence entre les amplitudes. Ceci n’est justement pas le cas si les processus sont discernables en principe. Prenons l’exemple des différentes orientations du spin des particules qui entrent en interaction. Ceux-ci sont principalement observables. Si l’on commence avec un état initial non-polarisé, cela correspond juste à un mélange de tous leurs orientations possibles à proportions égales. Il faut donc moyenner les section efficaces, ou |M|2, sur les orientations du spin des particules initiales. Si l’on ne distingue pas la polarisation des particules dans l’état final, ont fait juste la somme de toutes les sections efficaces correspondant aux différentes orientations de leurs spins. Le carré de l’amplitude qui sort ces deux opérations, donc moyenné sur les spin initiaux et sommé sur les spins finaux, est dénoté par le |M|2 . 39 Chapitre 5 Interactions électromagnétiques 5.1 Le moment magnétique de l’électron d’une particule par l’équation Le moment magnétique, µ, est relie au moment cinétique, L, q L (5.1) µl = 2m Cela est très facile à voir pour une particule qui circule sur un cercle de rayon r: 1 µl = IA = qωr 2 2 L = mvr = mωr 2 (5.2) (5.3) Il est plausible, que la présence d’un moment cinétique intrinsèque, de spin s, mène à un moment magnétique analogue: q µs = g s (5.4) 2m avec le rapport gyromagnétique, ou facteur de Landé, g. Sa valeur dépend de la structure interne de la particule. Pour un fermion ponctuel, comme l’électron, le muon ou le τ , on a s = 1/2 et q = −e, donc e (5.5) µe = −ge 4m Un calcul au premier ordre donne ge 2. Une interaction électromagnétique avec le moment magnétique peut servir à mesurer ge avec grande précision. Exemple 9: Penning Trap L’expérience classique pour la mesure de ge utilise un électron piégé dans une bouteille électromagnétique que l’on appelle un Penning trap 1 . Son principe est montré dans la Figure 5.1. Le système ressemble à un atome macroscopique où le noyau est remplacé par un champ extérieur. La Figure 5.2a montre la configuration du champ magnétique et électrique d’un Penning trap. L’électron circule dans un champ magnétique qui est à peu près homogène, sauf pour sa composante focalisante qui est généré par un anneau de Nickel dans le plan équatorial. Le champ électrique s’oppose aux excursions le long l’axe du champ magnétique. Il est générée par une électrode en anneau et deux électrodes en coupe. Les trois modes principaux du mouvement de l’électron sont visualisés dans la Figure 5.2b. 1. P. Ekstrom et D. Wineland, The Isolated Electron, Sci. Am. 243 (1980) 90; R.S. Van Dyck, P.B. Schwinberg et H.G. Dehmelt, Phys. Rev. Lett. 38 (1977) 310, Phys. Rev. Lett. 47 (1981) 1679, Phys. Rev. D34 (1986) 722. CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES 40 Fig. 5.1 – Penning Trap CAP ELECTRODE ELECTRIC-FIELD LINES RING ELECTRODE NICKEL RING AXIAL OSCILLATION CYCLOTRON MOTION MAGNETRON MOTION CAP ELECTRODE MAGNETIC-FIELD LIINES (a) (b) Fig. 5.2 – a) Champs magnétiques et électriques dans un Penning trap. L’anneau en Nickel déforme légèrement le champ magnétique et introduit ainsi un couplage entre le mouvement circulaire et l’oscillation axiale. b) Trajectoire d’un électron dans un Penning trap. Les trois modes principaux de l’oscillation sont montrés. 5.1. LE MOMENT MAGNÉTIQUE DE L’ÉLECTRON 41 Calculons les niveaux d’énergie d’un tel atome macroscopique. Pour simplifier, nous faisons abstraction des composantes focalisantes magnétiques et électriques. Il reste un champ magnétique homogène en direction z: ⎛ ⎞ 0 ⎜ ⎟ B=⎝ 0 ⎠ B qui dérive d’un potentiel ⎛ (5.6) ⎞ −By ⎟ =⎜ A ⎝ 0 ⎠ 0 (5.7) L’Hamiltonien correspondant est 1 2 p − eA 2m 1 2 A − eA p = p + e2 B 2 y 2 − e ∇ 2m 1 2 m = px + p2y + p2z + ω 2 y 2 + ωypx 2m 2 H = (5.8) (5.9) (5.10) avec la fréquence de base, ω = eB/m. En mettant y0 = px /mω, on peut réduire ceci à H= p2y m p2z + + ω 2 (y − y0 )2 2m 2m 2 (5.11) Le premier terme correspond à un mouvement libre dans la direction z, comme prévu dans le choix de la direction du champ. Ce mouvement est contraint par les composantes focalisantes que nous avons négligées dans le calcul. Les deux termes qui suivent correspondent à un oscillateur harmonique dans le plan équatorial, avec valeurs propres de l’énergie 1 En = ω n + 2 (5.12) pour n = 0, 1, 2 etc. En ajoutant le moment magnétique du spin, µs , on obtient H = H − µs B (5.13) Les deux orientations du spin, sz = +1/2 et sz = −1/2, se distinguent donc par la même différence en énergie ω que les niveaux principaux, pourvu que ge égale exactement 2. Les deux échelles des niveaux pour spin parallèle et anti-parallèle à z seraient déplacés par un rang, ω. Cette dégénérescence n’existe pas si la valeur de ge dévie de 2. Les niveaux sont alors décalés par une fréquence δω = ω(ge − 2)/2 qui peut être mesurée 2. Le principe de la mesure est montré par son analogue électrique dans la Figure 5.3. Les trois électrodes vides forment un réseau de capacités qui transmet le signal généré par un émetteur en haut et qui est reçu par un détecteur en bas. L’électron introduit un RL additionnel dans ce circuit. L’observation de la transmission en fonction de la fréquence permet par conséquent de mesurer l’amplitude du signal transmis, qui indique le nombre d’électrons dans l’appareil, et du décalage en fréquence, δω, qui détermine la déviation (ge − 2)/2. Un exemple de signal détecté est reproduit dans la Figure 5.4. 2. En effet on excite plutôt les oscillations axiales, en plus des changements de spin. Celles-ci sont couplés aux niveaux En du mouvement circulaire à cause de l’inhomogéneité légère du champ magnétique. CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES SIGNAL GENERATOR SIGNAL GENERATOR ELECTRODE CAPACITANCE ELECTRON + - + - D.C. VOLTAGE D.C. VOLTAGE EMPTY TRAP SIGNAL DETECTOR SIGNAL DETECTOR SIGNAL GENERATOR ELECTRON ELECTRON INDUCTANCE CAPACITANCE 42 ELECTRODE CAPACITANCE + D.C. VOLTAGE TRAP WITH ELECTRON SIGNAL DETECTOR Fig. 5.3 – Analogue électrique d’un Penning trap. 0 5 10 15 20 25 AXIAL FREQUENCY SHIFT DETECTED SIGNAL CHANGES IN CYCLOTRON-ORBIT SIZE TIME TIMES (MINUTES) CHANGES IN SPIN ORIENTATION Fig. 5.4 – A gauche: Amplitude du signal dans un Penning trap en fonction du temps, pour (au début) sept électrons qui sont perdus un par un. A droite: Décalage en fréquence entre générateur et détecteur, en fonction du temps. Les minima du décalage au début de la mesure indiquent les deux orientations du spin. Le grandes variations qui apparaissent plus tard correspondent à des changements du rayon de l’orbite. 5.2. LA DIFFUSION DE COMPTON 43 La précision des résultats d’une telle expérience est étonnante. On a obtenu il n’y a pas trop longtemps 3 : (5.14) ge = 2.002319304366(20) Comparaison de cette valeur avec la théorie réclame un calcul de la même quantité jusqu’au huitième ordre 4 . On trouve un bon accord entre calcul et théorie, même à cette précision sans égal dans la physique de particules. En effet cette mesure nous fournit l’une des valeurs les plus précises de la constante de structure fine, α = e2 /4π, qui intervient comme paramètre dans les calculs. 5.2 La diffusion de Compton La diffusion de Compton, γe− → γe− , fait intervenir un électron virtuel intermédiaire, comme le montre la Figure 5.5. La cinématique du processus est caractérisée par l’énergie ω du photon incident et l’angle de diffusion, θ = (k,k ). La conservation de l’énergie-impulsion donne pour l’énergie émise ω (5.15) ω = 1+r avec une réduction r = (1 − cos θ)ω/m où m est la masse de l’électron. Pour la section efficace différentielle on trouve la formule de Klein-Nishina: 1 2 1 r2 dσ µ 2 α = + 4 µ dΩ 4m2 (1 + r)2 1 + r (5.16) Deux facteurs nous intéressent particulièrement. Le premier est le facteur α2 qui détermine l’ordre de grandeur de la section efficace. Il sort du fait que chaque vertex fait intervenir un facteur e dans l’amplitude invariante M. Pour la section efficace on a par conséquent σ ∼ |M|2 ∼ e4 ∼ α2 . k = (ω ,k ) k = (ω,k) p = (m,0) - e∗ @ R @ @ p = (E , p ) Fig. 5.5 – Un des deux diagrammes de Feynman qui contribuent à la diffusion de Compton, γe− → γe− , au premier ordre. L’autre diagramme est celui où le photon initial rejoint l’électron après l’émission du photon final. Le deuxième facteur intéressant fait intervenir le produit des quadrivecteurs de polarisation des deux photons, et . Ceux-ci apparaissent dans la fonction d’onde du photon libre Aν = ν (k) e−ikµ x µ 3. E.R. Cohen et B.W. Taylor, Rev. Mod. Phys. 59 (1987) 1121 4. T. Kinoshita et W.B. Lindquist, Phys. Rev. D 27 (1983) 877 (5.17) 44 CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES qui est la solution des équations de mouvement, Equ. 4.19. Sous la jauge de Lorentz, les équations de mouvement donnent (∂µ ∂ µ ) Aν = 0 (∂µ ∂ µ ) ν e−ikx = ν e−ikx (−kµ k µ ) = 0 (5.18) (5.19) ce qui signifie justement que k 2 = 0, la condition pour un photon réel. La condition de jauge, ∂µ Aµ = 0, donne (5.20) ∂µ µ e−ikx = µ e−ikx (−ikµ ) = 0 ce qui signifie que µ kµ = 0. Le quadrivecteur de la polarisation, qui indique la direction du champ électromagnétique, est alors normal au quadrivecteur de l’impulsion du photon. Par dessus le marché, cette condition de jauge nous démontre que la fonction d’onde du photon a seulement trois composantes indépendantes (et non pas quatre comme on pourrait le croire). Il est donc justifié de l’appeler une particule vecteur. Quand la polarisation de l’état initial est zéro, et celle de l’état final n’est pas mesurée, il faut moyenner sur les orientations des spins initiaux et sommer sur ceux de l’état final. Pour le facteur en question ce procédé donne 4 (µ µ )2 = 1 + cos2 θ (5.21) A hautes énergies pour le photon, ω m, on trouve approximativement, pour la section efficace totale 2πα2 dσ s dΩ log (5.22) σ= dΩ s m2 avec le carré de l’énergie totale s = (k + p)2 = (k + p )2 (5.23) et la constante de structure fine α. Exemple 10: Diffusion de Compton au LEP La diffusion de Compton peut être mesurée à très hautes énergies en utilisant un collisionneur électron-positron comme le LEP (voire Chapitre 2). Le faisceau incident de photons est généré par le mécanisme de radiation de freinage qui est aussi à l’origine de la radiation synchrotron: une charge qui est accélérée a tendance à émettre des photons dans une direction perpendiculaire à l’accélération. Ici le freinage est causé par la force électromagnétique qu’exercent les particules d’un bunch sur ceux de l’autre. Elle est dirigée plutôt transversale au faisceau, les photons sont alors émis plutôt longitudinalement. La Figure 5.6 montre le mécanisme. L’électron (ou le positron) émet un photon. Celui interagit avec un positron (ou un électron) dans l’autre faisceau par diffusion de Compton. On observe l’électron et le photon sortant de la diffusion dans le détecteur. Comme le photon initial relie deux vertex, il s’agit d’un photon virtuel avec k 2 = 0, bien que notre raisonnement sur l’effet de Compton s’applique aux photons réel, k 2 = 0. Par analyse cinématique on peut néanmoins sélectionner des évènements pour lesquelles la masse du photon initial est négligeable, k 2 s. La Figure 5.7 montre la section efficace pour cette diffusion de Compton avec des photons quasi-réels mesuré par l’expérience L3 au LEP 5 . On observe en effet la dépendance prévue par le résultat de l’Equation 5.22, proportionnel approximativement à 1/s. 5. L3 collaboration, M. Accarri et al., Phys. Lett. B439 (1998) 183. 5.2. LA DIFFUSION DE COMPTON 45 γ e − − e e + γ e + σ [pb] Fig. 5.6 – Mécanisme pour la réalisation d’une diffusion de Compton à un collisionneur d’électron-positron. L’électron (ou le positron) émet un photon par radiation de freinage. Celui interagit avec un positron (ou un électron) dans l’autre faisceau. Bien que le photon soit en principe virtuel, la cinématique des électrons et photons sortants permet de privilégier des très basses masses. 10 3 10 2 γ e →γ e L3 10 Data |cosθ| < 0.8 QED 20 40 60 80 100 120 140 √s [GeV] Fig. 5.7 – Section efficace restreinte aux√angles de diffusion | cos θ| < 0.8, pour la diffusion de Compton en fonction de l’énergie totale s, mesurée à hautes énergies par l’expérience L3. 46 CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES e+ @ R @ @ γ e− 6 − e γ Fig. 5.8 – Un des deux diagrammes qui contribuent au premier ordre à l’annihilation en paire, e+ e− → γγ. L’autre diagramme est celui où les deux photons de l’état final sont permutés. Exemple 11: Annihilation en paire de photons En tournant de 90◦ le diagramme de la diffusion de Compton, on obtient un autre processus, l’annihilation d’une paire d’électron-positron en une paire de photons, e+ e− → γγ. Le diagramme de Feynman correspondant est montré dans la Figure 5.8. Vous remarquez que nous avons aussi converti l’électron sortant du processus de Compton en positron entrant. Ceci reste sans conséquence parce que ces deux états sont entièrement équivalents. Avec les modification de la cinématique qui conviennent, à partir du calcul pour la diffusion de Compton, on arrive à la section efficace pour l’annihilation en paire, dans le système de centre de masse et en négligeant les masses (s 4m2e ): α2 1 + cos2 θ dσ = dΩ s 1 − cos2 θ (5.24) Nous reconnaissons encore une fois les facteurs caractéristiques: α2 , qui vient des constantes de couplage, et 1/s, qui vient de la division par le flux incident. Le facteur (1 − cos2 θ) dans le dénominateur peut encore étonner, parce qu’il fait diverger la section efficace quand l’angle de diffusion s’approche de θ = 0◦ ou θ = 180◦ . Une telle divergence n’est pas admissible, la section efficace qui tient le rôle d’une probabilité doit toujours respecter une limite supérieure, celle de l’unitarité qui correspond à probabilité 1 pour le processus. Déjà le facteur 1/s nous paraı̂t un peu suspect, mais la limite dangereuse s → 0 ne peut pas être atteint, à cause du seuil, s > 4m2e . La divergence angulaire par contre, est bien réelle. Elle ne se réalise finalement pas à cause des corrections d’ordre supérieur. En effet, une expansion par ordres d’une petite constante de couplage finit toujours par converger, dans une théorie de champs basée sur les principes de l’invariance de jauge. La preuve de ce fait a été récompensée par le prix Nobel 1999 6. Aussi la section efficace est-elle évidemment finie. Le Figure 5.9 montre des mesures récentes 7. La section efficace suit avec grande précision – en grandeur absolue ainsi qu’en dépendance en l’énergie – la prédiction de l’électrodynamique quantique. 6. voir http://www.nobel.se/laureates/physics-1999.html 7. M. Pohl, The L3 Experiment at LEP 200: Electron-Positron Reactions at Highest Energies, Réunion annuelle de la Société Suisse de physique, Montreux, 16 mars 2000 5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS 47 L3 60 50 data σγγ(γ) (pb) 40 QED 30 20 10 80 100 120 140 √s (GeV) 160 180 200 Fig. 5.9 – Section efficace pour l’annihilation en paire en fonction de l’énergie totale mesurée à hautes énergies par l’expérience L3. 5.3 √ s, Annihilation électron-positron en leptons et quarks L’annihilation des paires d’électron-positron en paires de photons n’est pas la seule réaction de ce type. Il existe toute une classe de réactions e+ e− → f f̄ d’annihilations en paires de fermionantifermion: e+ e− → µ+ µ− e+ e− → τ + τ − e+ e− → qq̄ (5.25) (5.26) (5.27) Tous ces réactions sont, au premier ordre, décrit par le diagramme de Feynman de la Figure 5.10 8 . Prenons la première réaction comme prototype. La Figure 5.11 montre un évènement exemplaire. Dans le centre de masse, l’état final est caractérisé par deux muons d’impulsions égales et anti-parallèles. N’ayant pas d’interaction forte et trop lourds pour causer des gerbes électromagnétiques, les muons pénètrent tout le matériel du détecteur. La section efficace différentielle est dσ α2 = (1 + cos2 θ) (5.28) dΩ cm 4s si l’on néglige les masses, s 4m2µ . L’Equation 5.28 est une distribution angulaire symétrique vis-à-vis l’angle de diffusion θ. La section efficace totale est 4πα2 σ(e e → µ µ ) = 3s + − + − (5.29) 8. On n’inclut pas la réaction e+ e− → e+ e− qui est compliquée par un deuxième diagramme de diffusion, où les deux électrons échangent un photon au lieu de s’annihiler. 48 CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES e− (k) µ+ (p) @ @ R γ(s) @ @ @ @ R @ @ e+ (k ) µ− (p ) Fig. 5.10 – Diagramme de Feynman de premier ordre pour la réaction e+ e− → µ+ µ− . 10 O O OO O OOO O O OOO OO O OO O OO O OO OOO O OOO O OOO O OOOO O O O OO OOO OO O O O O O O O 9 Fig. 5.11 – Un évènement de la réaction e+ e− → µ+ µ− observé par l’expérience L3 au collisionneur LEP. 5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS 49 qui réunit encore une fois tous les facteurs, α2 et s−1 , caractéristiques pour les réactions entre particules ponctuelles. La Figure 5.12 montre des résultats expérimentaux 9 pour la section efficace totale en fonction de l’énergie initiale carrée, s. La distribution angulaire, Figure 5.13 10 , montre une déviation de la forme symétrique de l’Equation 5.28 qui augmente avec l’énergie. Elle est due à l’interférence avec l’interaction faible que nous allons traiter dans le Chapitre 8. Fig. 5.12 – Sections efficaces totales pour les réactions e+ e− → µ+ µ− et e+ e− → τ + τ − observé par l’expérience JADE au collisionneur PETRA. Exemple 12: e+ e− → µ+ µ− et e+ e− → τ + τ − Cette section efficace prototype s’applique à tous les réactions d’annihilation qui produisent une paire de fermions de masse négligeable et de charge ±e, constante de couplage qui se cache dans la constante de structure fine, α. La même section efficace et distribution angulaire est en 9. B. Naroska, Phys. Rept. 148 (1987) 67. 10. M. Pohl, The MARK J Experiment at PETRA: Gauge Theories on the Workbench, ETH Zürich 1989 CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES 50 effet observée pour la réaction e+ e− → τ + τ − pour s 4m2τ , comme le montrent également les Figures 5.12 et 5.13. MARK J e+e- → µ+µ- e+e- → τ+τ- 1.2 1/N dN/dcos θ 1/N dN/dcos θ 1.2 0.8 0.4 0.8 0.4 √s = 34.8 GeV √s = 43.5 GeV 0.0 0.0 MARK J e+e- → µ+µ- 1.2 1/N dN/dcos θ 1/N dN/dcos θ 1.2 0.8 0.4 e+e- → τ+τ- 0.8 0.4 √s = 43.8 GeV √s = 34.6 GeV 0.0 -0.8 -0.4 0.0 cos θ 0.4 0.8 0.0 -1.0 -0.5 0.0 0.5 1.0 cos θ Fig. 5.13 – Distributions angulaires pour les réactions e+ e− → µ+ µ− et e+ e− → τ + τ − observé par l’expérience MARK J au collisionneur PETRA. Les lignes traitillées indiquent la forme symétrique de la distribution prédit par QED. Les lignes continues incluent un terme asymétrique qui vient le l’interférence électrofaible. En ce qui concerne la production de paires de quarks, il faut tenir compte de deux modifications importantes. Primo, les quarks portent les charges Qu = 2/3 pour (u,c,t) et Qd = −1/3 pour (d,s,b), par rapport à la charge élémentaire, e. Comme la charge du quark intervient à un seul des deux vertex, il faut introduire un facteur Q2i dans la section efficace. Secundo, les quarks sont produit en trois couleurs, (r,g,b), charges responsables pour leur interactions fortes, auxquelles les interactions électromagnétiques sont insensibles. La couleur des quarks est encore un exemple pour les propriétés qui ne sont observables qu’en principe: n’empêche que l’on ne connaı̂t aucun moyen pour les mesurer, ils distinguent néanmoins les états finaux 5.3. ANNIHILATION ÉLECTRON-POSITRON EN LEPTONS ET QUARKS 51 correspondant aux différents couleurs. On doit par conséquent additionner les |M|2, ou bien les section efficaces. Ils sont évidemment indépendant de la couleur et on obtient en somme σ(e+ e− → qi q̄i ) = 3Q2i σ(e+ e− → µ+ µ− ) (5.30) pour chaque saveur i. La masse des quarks est négligeable pour u, d et s, mais non pas pour les √ surtout t. Pour ces derniers √ il existe des seuils de production qui sont √ quarks lourds c, b, et s 2mc 3.7 GeV, s 2mb 10 GeV, et s 2mt 350 GeV. Dans la section efficace inclusive, σ(e+ e− → qq̄), on trouve alors des discontinuités à ces seuils là. Les quarks de l’état final ne sont pas observés tels quels à cause de leur interaction forte, qui commence à agir dès qu’ils sont produits. Le champ qui s’établit entre eux est tellement énergétique que des paires quark-antiquark additionnels sont spontanément formés, qui se regroupent autour des quarks primordiaux et forment des gerbes de hadrons. Ces gerbes, que l’on appelle des jets de hadrons, suivent la direction initiale des quarks, et leur énergie totale est celle des quarks. Les évènements e+ e− → qq̄ se présentent par conséquent comme le démontre l’exemple de la Figure 5.14. La multiplicité de particules chargées et neutres est élevée, et les particules forment au moins deux jets. L3 L L L L 3 3 3 3 3 LLLLLL3 L 3 Fig. 5.14 – Un évènement à deux jets d’hadrons, causé par la réaction e+ e− → qq̄ au LEP. A cause de la conversion des quarks en hadrons, on n’arrive pas forcement à distinguer leur type (saveur) non plus. On considère plutôt la section efficace hadronique inclusive σ(e+ e− → hadrons) σ(e+ e− → qi q̄i ) (5.31) i qui est au premier ordre donnée par la somme des sections efficaces individuelles, ceci encore à cause de la discernabilité principale des processus élémentaires. On peut se demander si la conversion des quarks en hadrons ne modifie pas la section efficace. Ceci est le cas parce que – CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES 52 autant que l’on sache – cette conversion se passe toujours, avec une probabilité égale à 1. En autre mots, les quarks sont toujours et sans résidus convertis en hadrons, la section efficace ne change donc pas. Pour compenser la grande réduction ∼ 1/s de toutes les section efficaces électron-positron avec l’énergie, on forme souvent le rapport R≡ σ(e+ e− → hadrons) Q2i 3 σ(e+ e− → µ+ µ− ) i (5.32) La somme √ inclut tous les saveurs qui peuvent être produites à une énergie dans le centre de masse, s, donnée. Dans les différent régions d’énergie on obtient donc au premier ordre: R = 3[( 23 )2 + 2( 13 )2 ] = 2 u, d, s R = 2 + 3( 23 )2 = 10 3 R= 10 3 + 3( 13 )2 = 11 3 R= 13 3 + 3( 23 )2 = 5 √ s < 2mc 3.7 GeV √ u, d, s, c 3.7 < u, d, s, c, b 10 < u, d, s, c, b, t 350 < √ s < 2mb 10 GeV s < 2mt 350 GeV √ s Exemple 13: e+ e− → hadrons La Figure 5.15 11 compare ce calcul à une compilation de résultats expérimentaux qui proviennent du collisionneur PETRA. On voit grosso modo la dépendance de la section efficace prédite, y inclus les discontinuités prévus. Mais les sections efficaces mesurées sont nettement supérieures aux prédictions. Ceci est encore dû aux ordres supérieurs qui contribuent. On verra dans le Chapitre 7, que les états finaux e+ e− → qq̄g avec gluons additionnels, ajoutent quelques pourcents à la section efficace hadronique inclusive. A hautes énergies on voit même l’influence des interactions faibles neutres, dont la particule médiatrice Z peut aussi contribuer à la section efficace totale (voir Chapitre 8). 5.4 Diffusion de fermions ponctuels Le processus prototype pour la diffusion de fermions ponctuels, e− µ− → e− µ− , est très similaire à la réaction d’annihilation, tourné de 90◦ comme le montre le diagramme de Feynman, Figure 5.16. On va s’approcher de ce processus par étapes. La première étape est de considérer une diffusion par une cible très lourde, sans structure intérieure et sans spin. En faisant abstraction aussi du spin de l’électron projectile et en négligeant sa masse, on obtient la section efficace de Rutherford dσ α2 = dΩ Rutherford 4E 2 sin4 θ 2 (5.33) Comme d’habitude, la facteur α2 vient des deux vertex. Le facteur en dénominateur résulte du propagateur du photon virtuel, qui est 1 1 1 = 2 2 2 q (k − k) 4E sin4 θ 2 (5.34) 11. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, p. 146-147 5.4. DIFFUSION DE FERMIONS PONCTUELS 53 Fig. 5.15 – A gauche: Section efficace totale pour la réaction e+ e− → hadrons, normalisé par la section efficace modèle σ(e+ e− → µ+ µ− ). e− (k) e− (k ) @ @ R @ @ ) ( ) @ @ R @ @ µ− (p) µ− (p ) Fig. 5.16 – Diagramme de Feynman pour la réaction de diffusion, e− µ− → e− µ− , au premier ordre. CHAPITRE 5. INTERACTIONS ÉLECTROMAGNÉTIQUES 54 avec l’énergie du photon incident et sortant, k0 = k0 = E, et l’angle de diffusion θ = (k,k ). La distribution angulaire est extrêmement raide, pour la diffusion des particules ponctuelles, comme vous avez pu constater lors de vos travaux pratiques. Ceci reste le cas quand on tient compte du spin des particules ainsi que du recul de la cible. On obtient alors la section efficace de Mott dσ α2 = dΩ Mott 4E 2 sin4 θ 2 β cos2 θ2 1 + 2E sin2 M (5.35) θ 2 avec la masse M de la cible. Le facteur additionnel tient compte en numérateur de la conservation du moment cinétique qui réclame la conservation de l’hélicité de l’électron quand sa vitesse β s’approche de celle de la lumière. L’hélicité est la projection du spin sur la direction de mouvement d’une particule. Pour un électron relativiste, elle peut être de ±1/2, correspondant au spin parallèle ou anti-parallèle à l’impulsion. La conservation de l’hélicité réclame tout simplement que la section efficace pour la diffusion en arrière, θ → 180◦, doit disparaı̂tre. Le facteur additionnel en dénominateur tient compte du recul de la cible. Il correspond au rapport entre l’énergie de l’électron incident et sortant, E /E. Ce rapport égale 1 pour un cible infiniment lourde, mais dévie de 1 si un recul important intervient. La formule de Mott néglige encore la composante magnétique de l’interaction. Pour un fermion cible ponctuel, avec moment magnétique µ = e/2M, on trouve en somme, au système du laboratoire et pour un électron projectile relativiste α2 dσ = dΩ Mott 4E 2 sin4 θ 2 1 1+ 2E M q2 θ 2 θ cos + sin 2 2M 2 2 2 sin2 θ 2 (5.36) Le dernier terme est de nature magnétique et devient important à haute impulsion transférée, q 2 M 2 . La distribution angulaire suit, dans son premier terme, la forme de la formule de Rutherford, le deuxième terme tient compte du recul du cible. Le troisième terme contient des sous-termes proportionnels à cos2 θ et sin2 θ, qui réduisent un peu la raideur de la distribution angulaire. 55 Chapitre 6 La structure des hadrons Quand on connaı̂t la structure d’une interaction, on peut l’utiliser comme instrument pour mieux comprendre les particules qui interviennent. On verra dans ce chapitre comment la diffusion électron-nucléon est utilisée pour déterminer la structure interne du nucléon. Dans ce cas on profite du fait que l’électron – autant que l’on sache – est une particule ponctuelle, et que l’on connaı̂t d’une façon exemplaire les interactions électromagnétiques, à fin d’élucider une seule inconnue, mais de taille, qui est la distribution et la dynamique des quarks à l’intérieur du proton et du neutron. On verra également comment la formation de résonances mésoniques, par un photon incident par exemple, peut servir à mieux connaı̂tre la force forte qui relie les quarks entre eux. 6.1 Diffusion élastique Comme d’habitude, on commence nos considérations par le plus simple exemple qui soit, la diffusion élastique par une cible non-ponctuelle. Prenons d’abord une distribution de charge statique ρ(x), normalisée pour que la charge de la cible reste élémentaire, c’est à dire ρd3 r = 1. La section efficace sera alors réduite, par rapport à une cible ponctuelle, à dσ = dΩ dσ |F (q)|2 dΩ Mott (6.1) par un facteur |F |2, que l’on appelle un facteur de forme: F (q) = ρ(x) eiqx d3 x (6.2) qui provient, dans le cas statique, seulement de la transformation de Fourrier le la distribution de charge même. Pour petites impulsions transférées on peut développer le facteur de forme: F (q) = (qx)2 + · · · ρ(x)d3 x 1 + iqx − 2 (6.3) Si la distribution possède une symétrie sphérique, c’est à dire si ρ(x) = ρ(r), les termes à exposant impair ne contribuent pas et l’on obtient F (q) = (qx)2 1 + · · · ρ(x)d3 x = 1 − |q|2 < r 2 > 1− 2 6 (6.4) CHAPITRE 6. LA STRUCTURE DES HADRONS 56 Ainsi le facteur de forme mesure le rayon moyen quadratique de la distribution de charge, < r 2 >= ρ r 2 dr, qui représente la taille de la distribution en question. Prenons comme exemple une distribution exponentielle ρ(r) ∼ e−Λr (6.5) qui mène à un facteur de forme dit dipolaire: |q|2 F (|q|) ∼ 1 + 2 Λ 2 (6.6) Il est clair que dans le cas non-statique d’une distribution de charge les choses se compliquent. La distribution elle-même changera pendant le temps d’interaction représenté par la composante temporelle, q0 , du transfert d’énergie-impulsion. Par l’action des charges en mouvement à l’intérieur de la distribution, les termes électriques et magnétiques seront modifiés et leurs fonctions mélangées. On trouve alors une section efficace dσ = dΩ Lab α2 4E 2 sin4 Θ 2 E E G2E + τ G2M Θ Θ cos2 + 2τ G2M sin2 1+τ 2 2 (6.7) avec le paramètre τ≡ −q 2 4M 2 (6.8) comme rapport entre impulsion transférée et masse de la cible. On appelle GE et GM les facteurs de forme électrique et magnétique, bien que la distinction de ces deux rôles dépende évidemment du système de référence. Dans le même sens, on peut attribuer GE et GM à la transformation de Fourrier de la distribution de la charge et du moment magnétique à l’intérieur de la cible, bien que cette interprétation ne soit valable que dans un système de référence très spécial 1 . Exemple 14: Facteurs de forme élastiques du proton Les facteurs de forme GE et GM du proton sont mesurés en observant section efficace différentielle de la réaction e− p → e− p et on séparant les termes proportionnels à cos2 θ et sin2 θ de la la distribution angulaire selon l’Equation 6.7. La Figure 6.1 montre des résultats représentatifs obtenus par Hofstadter et collaborateurs au SLAC 2 . On observe que GE et GM suivent bien la forme dipolaire que l’Equation 6.6 prédit pour les distributions exponentielles. Le paramètre Λ qui caractérise la taille de la distribution, est de Λ 0.84 GeV dans les deux cas. La taille dGE (q 2 ) < r >= 6 dq 2 = (0.81 × 10−13 cm)2 2 (6.9) q 2 =0 est alors de l’ordre d’un Fermi, et la même pour GE et GM . Que l’on trouve la même distribution pour les deux facteurs de forme n’est pas un miracle : les quarks à l’intérieur du nucléon sont à l’origine de la distribution de la charge et du moment magnétique. 1. Dans le système de Breit, caractérisé par p = − p et dans le cas non-relativiste, |q| M 2 , on arrive à séparer les composantes temporelles et spatiales. 2. T. Janssen et al., Phys Rev. 142 (1966) 922. 6.2. DIFFUSION INÉLASTIQUE 57 Fig. 6.1 – Facteurs de forme GE (à gauche) et GM (à droite) pour le proton en fonction de l’impulsion transférée, extraits de la section efficace pour la réaction e− p → e− p. 6.2 Diffusion inélastique Les facteurs de forme diminuent rapidement avec q 2 . Par conséquent, la probabilité d’observer une diffusion élastique devient très faible à haut transfert d’énergie-impulsion. Ceci n’est pas étonnant. Les grands q 2 correspondent aux courtes longueurs d’onde du photon échangé qui est alors de plus en plus capable de résoudre les structures intérieurs de la particule cible. Ces structures ne resteront alors pas insensibles à l’énergie-impulsion t transférée: la cible sera excitée, voire détruite. En autres mots, les processus inélastiques prennent la relève. Les processus rencontrés à q 2 modéré sont d’abord les excitations de résonances nucléoniques, comme e− p → e− ∆+ → e− pπ 0 → e− nπ + (6.10) (6.11) Ces résonances ont un temps de vie extrêmement court, et par conséquent une distribution de masse large. L’inélasticité de la réaction est d’abord notée dans la distribution en énergie de l’électron sortant, qui n’est plus à peu près fixe comme dans le cas élastique. Il se forme des maxima secondaires qui correspondent aux états excités du nucléon, clairement visibles dans la distribution de masse invariante des hadrons sortants. Exemple 15: Electro-production du ∆(1236) La Figure 6.2 montre un résultat pour une expérience de diffusion électron-proton 3, à une énergie initiale, k0 3 GeV et à un angle de diffusion fixe. La distribution de l’énergie k0 de 3. S. Galston et al., Phys. Rev. D5 (1972) 519. CHAPITRE 6. LA STRUCTURE DES HADRONS 58 l’électron sortant montre un grand maximum correspondant à la diffusion élastique, k0 k0 , et plusieurs maxima secondaires qui correspondent aux différents résonances. La Figure 6.2 montre également la distribution de masse invariante hadronique correspondante. Un maximum plutôt large indique la position et le temps de vie de la résonance ∆+ (1236), dont les propriétés sont étudiées dans l’expérience. Fig. 6.2 – A gauche: Distribution en énergie de l’électron sortant dans la réaction e− p → e− X autour de 3 GeV et à angle de diffusion fixe. Les maxima secondaires correspondent aux résonances. A droite: Distribution en masse invariante hadronique pour la même réaction; le pic élastique est proéminent. Une fois la région des résonances traversée, on entre dans de régime des diffusions dites profondément inélastiques. C’est la région ou le photon interagit individuellement avec les constituants chargés du nucléon. La section efficace peut être paramétrisée avec deux termes, comme auparavant, d2 σ = dE dΩ lab α2 4e2 sin4 Θ Θ + 2W1 (ν,q 2 ) sin2 W2 (ν,q ) cos 2 2 2 Θ 2 2 (6.12) mais avec de fonctions de structure W1 et W2 , qui paramétrisent distribution et dynamique des constituants du nucléon. Ils dépendent de l’énergie transférée, ν = E − E , qui est l’énergie du photon, et de sa masse invariante, q 2 . La cinématique est fixé avec un paramètre additionnel, parce que la masse du système hadronique n’est plus fixée, ni à celle du proton (cas élastique) ni à celle d’une résonance. La masse hadronique devient donc une variable libre additionnelle. Les fonctions de structure sont mesurés expérimentalement en observant la dépendance de la section efficace de l’angle de diffusion, comme dans le cas élastique. La grande découverte au SLAC, vers la fin des années 60, a été que les fonctions de structure ne dépendent pas de ν et q 2 séparément, mais de leur rapport, xBJ = q2 2Mν (6.13) La variable porte dans son indice le nom de son inventeur, J.D. Bjorken 4 . Le phénomène a été baptisé scaling à l’époque à cause de l’observation très générale que la variable xBJ ne dépend 4. J.D. Bjorken et E.A. Paschos, Phys. Rev. 185 (1969) 1975. 6.2. DIFFUSION INÉLASTIQUE 59 d’aucune dimension, ni d’énergie ni de masse. Les fonctions de structure suivent en effet le scaling si à l’intérieur du nucléon il existe des sous-structures ponctuelles. Cette interprétation du phénomène de scaling se fait dans la limite des grands q 2 , ou l’interaction des quarks entre eux est négligeable par rapport à la force transmise par le photon. Les quarks réagissent alors comme des particules quasi-libres. Dans cette limite, le photon interagit d’une manière incohérente avec les quarks comme le montre schématiquement la Figure 6.3. - ~E,p @ @ R @ @ = dx e2i ~ E,p i xE,xp Fig. 6.3 – Diffusion inélastique électron-nucléon dans un modèle de quarks quasi-libres. Pour obéir aux contraintes cinématiques, le photon cherche un quark partenaire qui porte une fraction x de l’énergie-impulsion du nucléon qui correspond au xBJ porté par le photon. Par conséquent, la section efficace sera proportionnelle à la probabilité de trouver un tel quark dans le nucléon. Dans la limite q 2 → ∞, les fonctions de structure W1 tendent vers des fonctions Fi qui sont directement liées aux distributions d’impulsion, fi (x) = dpi /dx, des quarks de type i: νW2 (ν,Q2 ) → F2 (x) = e2i fi (x)x (6.14) i MW1 (ν,Q2 ) → F1 (x) = 1 F2 (x) 2x (6.15) Exemple 16: Diffusion électron-proton profondément inélastique Les expériences au SLAC ont en effet montré que le phénomène de scaling se produit déjà à q 2 modérés 5. Comme le montre la Figure 6.4, les fonctions de structure se lissent en augmentant q 2 au dessus de la région des résonances, pour suivre ensuite une fonction de xBJ universelle. Le scaling des fonctions de structure n’est pas exact. La Figure 6.5 montre des mesures modernes qui viennent des expériences au collisionneur ep HERA 6 . A petits x, donc à petites impulsions des quarks, les fonctions de structure dépendent fortement de q 2 à cause des interactions fortes entre les quarks 7 . Les fonctions de structure peuvent servir à mesurer la distribution en impulsion des constituants chargés, les quarks, dans le nucléon. La figure 6.6 montre qualitativement le comportement de la fonction de structure F2 (x) à partir de la dynamique des quarks à l’intérieur du nucléon. Si le nucléon était constitué de trois quarks sans interaction, x serait 1/3 pour chaque 5. M. Breidenbach et al., Phys. Rev. Lett. 23 (1969) 935; F.J. Gilman, Phys. Rept. 4 (1972) 95. 6. G. Bernardini, QCD in Deep Inelastic Scattering at HERA, SLAC Topical Conference, 12/08/98, voir http://www-h1.desy.de/ 7. Les déviations à très grands x sont plus subtiles, parce que la constante de couplage des interactions fortes dépend du transfert en impulsion. 60 CHAPITRE 6. LA STRUCTURE DES HADRONS Fig. 6.4 – A gauche:Fonction de structure W2 en fonction de la variable cinématique ω 1/xBJ à bas et modérés q 2 . Les structures dues aux résonances s’estompent et une forme universelle émerge. A droite: Comparaison des fonctions de structure mesurées à différents q 2 , en fonction de ω. Dans les limites des erreurs expérimentales, les fonctions de structure dépendent uniquement de xBJ . Fp2+ci(x) 6.2. DIFFUSION INÉLASTIQUE 61 16 NMC x=0.00002(i=24) BCDMS x=0.000032 x=0.00008 H1 97 Preliminary (low Q2) x=0.00013 (i=20) x=0.0002 H1 94-97 Preliminary (high Q2) x=0.00032 12 H1 H1 96 Preliminary (ISR) x=0.00005 14 SLAC x=0.0005 x=0.0008 NLO QCD Fit H1 Preliminary x=0.0013 10 x=0.002 ci(x)= 0.6 • (i(x)-0.4) x=0.0032 x=0.005 8 x=0.008 x=0.013 6 (i=10) x=0.02 x=0.032 x=0.05 4 x=0.08 x=0.13 x=0.18 2 x=0.25 x=0.40 x=0.65(i=1) 0 1 10 10 2 10 3 10 4 10 2 5 Q /GeV 2 Fig. 6.5 – Fonction de structure F2 du proton mesurée par l’expérience H1 au collisionneur HERA, en fonction de q 2 pour différents intervalles en x. CHAPITRE 6. LA STRUCTURE DES HADRONS 62 F2 quark et F2 serait une fonction δ à la même valeur. Si s’agissait d’une sorte de gaz où les quarks seraient légèrement liés par des gluons, la valeur moyenne de x serait toujours de 1/3, mais avec une distribution plus large autour de cette valeur. Si l’on tient compte finalement du fait que les quarks peuvent émettre des gluons virtuels, qui se transforment en paire de quark-antiquark de basse énergie, on comprend que la distribution d’impulsion des quarks ait tendance à se remplir pour x → 0. 1 0.75 0.5 0.25 0 Un seul quark - 0 0.25 0.5 0.75 1 Trois quarks libres - F2 x 1 0.75 0.5 0.25 0 0 0.25 0.5 0.75 1 x Trois quarks liés - F2 0.2 0.1 0 0 0.25 0.5 0.75 1 x Trois quarks liés + paires additionelles - @ @ @ F2 - 0.3 0.2 0.1 0 0 0.25 0.5 0.75 1 x Fig. 6.6 – Comportement qualitatif de la fonction de structure F2 sous différentes hypothèses simplifiantes sur les constituants et leurs interactions. Les données expérimentaux suivent en effet la forme prédit par ce raisonnement. Si vous inversez l’ordinate logarithmique dans la Figure 6.4 pour obtenir la dépendance de w2 en x au lieu de ω, vous retrouvez la forme qualitativement caractérisé par la Figure 6.6. 6.3. RÉSONANCES ENTRE QUARKS ET ANTIQUARKS 6.3 63 Résonances entre quarks et antiquarks En plus des résonances baryoniques qui sont des états excités des baryons ordinaires, il y a des résonances entre quarks et antiquarks. S’il s’agit de mésons neutres, ils peuvent être produits in vacuo par un photon virtuel. Leur masse est légèrement inférieur à deux fois la masse du quark correspondant. La Figure 6.7 montre, par exemple, un processus de production pour la production du méson ρ, état lié entre quarks légers. Des résonances peuvent aussi figurer comme états intermédiaires dans des réactions hadroniques. Dans ces cas là, il y a plus de liberté en ce qui concerne leurs nombres quantiques. En général, les états liés entre quarks et anti-quarks ont une durée de vie courte, surtout pour les quarks légers. e− (k) π + (p) @ @ R @ @t ρ0 t @ @ R @ @ e+ (k ) π − (p ) Fig. 6.7 – Diagramme pour la production d’une résonance ρ0 par un photon qui sort d’une annihilation e+ e− . La résonance se désintègre en une paire de pions. La dépendance en énergie de la section efficace électron-positron autour d’une résonance suit généralement une fonction de Breit-Wigner √ Γ2 /4 √ σ( s) = σmax ( s − M)2 + Γ2 /4 (6.16) où Γ est la largeur de la √ résonance. La section efficace est réduite à un demi de sa valeur maximale, σmax , pour s = M ± Γ/2. Le temps de vie de la résonance est τ = 1/Γ. La forme de fonction Breit-Wigner ressemble à celle qui décrit un oscillateur amorti classique: √ s correspond à la fréquence d’excitation, M à la fréquence de résonance et Γ au facteur amortissant. La section efficace correspond dans cette analogie au carré de l’amplitude de l’oscillateur. Pour les résonances entre quarks légers, comme ρ et ω, on trouve des largeurs entre quelques MeV et 150 MeV, correspondent à des temps de vie entre 10−22 s et 10−24 s. Ils sont produits d’une manière résonante par le photon intermédiaire, c’est à dire quand la masse du photon virtuel égale à peu près celle du méson. Par conséquent les mésons ont J P = 1− . Ils se désintègrent en pions. Vers une masse d’approximativement 1 GeV, on peut produire la résonance Φ, un état lié de ss̄, qui se désintègre en particules étranges, Φ → K+ K− , K0 K̄0 . Sa largeur est de l’ordre de 4.4 MeV seulement. Aux alentours de 3 GeV, on trouve les résonances J/ψ, états liés de cc̄, vers 10 GeV les résonances Υ, faites de bb̄. Leur largeurs sont petites, ∼ 90 keV pour J/ψ, ∼ 50 keV pour Υ. Leur temps de vie est donc longue et la section efficace se trouve élargie d’une manière importante autour de leur masse. 64 CHAPITRE 6. LA STRUCTURE DES HADRONS Exemple 17: Mésons Upsilon La Figure 6.9 montre la section efficace e+ e− → hadrons autour de la résonance Υ(1s) et ses états excités Υ(2s) et Υ(3s) 8 . La forme résonante est mise en évidence. Les états se distinguent par le moment cinétique relatif des deux quarks. Les spins restent de toute façon parallèles pour produire un méson vectoriel. La résonance Υ(4s) correspond déjà plutôt à un état de deux mésons, BB̄, faiblement liés. L’étude des états résonants, surtout ceux des quarks lourds, permet de mieux comprendre et le potentiel des forces fortes qui lient les quarks dans un méson, et les mécanismes de désintégration. La Figure 6.8 9 montre, par exemple, le spectre des résonances cc̄ et bb̄. Les niveaux d’énergie indiquent que le potentiel suit une loi V (r) = − 4 αs + kr 3 r (6.17) avec le paramètre αs 0.2, analogue de la constante de structure fine électromagnétique pour les interactions fortes, et une autre constante k 1GeV/fm (voir Chapitre 7). Fig. 6.8 – Spectres des résonances J/ψ et Υ et de leurs états excités. Les pics de la section efficace autour d’une résonance invitent à construire des machines pour la fabrication en masse des états correspondants. Les collisionneurs DAFNE à Frascati 10 8. Collaboration CLEO, D. Andrews et al., Phys. Rev. Lett. 44 (1980) 1108, Phys. Rev. Lett. 45 (1980) 219. Collaboration CUSB, T. Bohringer et al., Phys. Rev. Lett. 44 (1980) 1111, G. Finocchiaro et al., Phys. Rev. Lett. 45 (1980) 222. 9. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, p. 106 10. voir http://www.lnf.infn.it 6.3. RÉSONANCES ENTRE QUARKS ET ANTIQUARKS 65 est une telle fabrique de Φ, les collisionneurs PEP-II à SLAC 11 et KEK-B 12 sont des fabriques de B. Par le système des largeurs décroissant avec la masse de la résonance, on pourrait être amené à croire qu’une résonance tt̄ serait très étroite, donc aurait un grand temps de vie et une section efficace importante. Ceci n’est par contre pas le cas du tout. Le quark top est tellement lourd, 175 GeV, que l’espace de phase pour son désintégration devient énorme. Le quark se désintègre donc avant que la formation d’un état lié puisse avoir lieu. Par conséquent, il n’y a guère d’augmentation de la section efficace au seuil pour la production de paires de quarks top. Fig. 6.9 – Section efficace pour la réaction e+ e− → hadrons autour de la résonance Υ et ses états excités. 11. voir http://www.slac.stanford.edu/accel/pepii/home.html 12. voir http://www-acc.kek.jp/WWW-ACC-exp/KEKB/KEKB-home.html 66 CHAPITRE 6. LA STRUCTURE DES HADRONS 67 Chapitre 7 Interactions fortes On vient de voir que les interactions fortes ont des propriétés particulières. Les quarks, vu à courte distance, se comportent comme des particules quasi-libres à l’intérieur des hadrons. Néanmoins des quarks libres n’ont jamais été observés. Cela indique que la force forte les confine à l’intérieur des hadrons et ne permet pas de les séparer à grandes distances. Dans ce chapitre on essaiera d’expliquer qualitativement ces propriétés apparemment incompatibles. 7.1 Couleur Nous avons déjà introduit la couleur comme nombre quantique des quarks (voir Chapitre 1) et nous avons vu sa conséquence immédiate de tripler la section efficace pour la réaction e+ e− → hadrons (voir Chapitre 5). La couleur est la propriété des quarks responsable de leurs interactions fortes. La théorie formelle de ces interactions est la chromodynamique quantique QCD. La couleur prend trois valeurs différents, disons rouge, bleu et vert pour les quarks. On les indique par un index inférieur, par exemple uR , uB et uV . Les anti-quarks portent des anti-couleurs, par exemple ūR̄ , ūB̄ et ūV̄ . Les interactions entre quarks procèdent par un échange de couleur. Les bosons médiateurs des interactions fortes sont les gluons, g. Ils portent une couleur et une anti-couleur et ne sont donc pas neutres en charge couleur. Ceci en contraste de photon, qui se couple aux charges électromagnétiques, mais n’en porte pas lui même. Pour les interactions fortes il y a par conséquent en total huit gluons, avec les combinaisons de couleur: 1 1 RB̄,RV̄ ,B V̄ ,V R̄,V B̄, √ (RR̄ − B B̄), √ (RR̄ + B B̄ − 2V V̄ ) 2 6 (7.1) Avec trois couleurs et trois anti-couleurs, on aurait pu s’attendre à un total de 32 combinaisons. L’une d’elles, la combinaison totalement symétrique 1 √ (RR̄ + B B̄ + V V̄ ) 3 (7.2) ne porte pas de couleur nette et ne participe par conséquent pas aux interactions. Les huit gluons restants sont des bosons électromagnétiquement neutres et de masse zéro. Le vertex de base pour l’interaction forte des quarks est montré dans la Figure 7.1. La constante de couplage qui intervient au vertex est dénotée par g, son carré apparaı̂t – en analogie à la constante de structure fine – comme αs = g 2 /4π. L’interaction est la même pour les trois couleurs ou pour toute superposition de couleurs. Il y a donc invariance sous des rotations CHAPITRE 7. INTERACTIONS FORTES 68 globales dans l’espace des trois couleurs. Selon le théorème de Noether, cela correspond à une loi de conservation pour la couleur. Par conséquent le vertex de la Figure 7.1 conserve la couleur. L’amplitude correspondante est bien sûr aussi indépendante de la saveur des quarks et de leur charge électromagnétique, qui sont tous les deux conservés par les interactions fortes. uV uR - gRV̄ Fig. 7.1 – Vertex pour l’interaction entre quarks et gluons. Si les gluons portent eux même de la couleur, il doivent être capable d’interagir entr’eux. Parce qu’ils portent en plus couleur et anti-couleur, il en suit l’existence de deux vertex additionnels que montre la Figure 7.2. Le vertex entre trois gluons est proportionnel à g et représente par conséquent une force de même taille que le vertex quark-gluon. Il faut, dans chaque calcul, tenir compte du fait qu’il existe beaucoup plus de différentes couleurs pour les gluons que pour les quarks. Le vertex entre quatre gluons, par contre, est proportionnel à g 2 et donc défavorisé. gRV̄ gBV̄ gV B̄ gRB̄ gRB̄ gBR̄ gRV̄ Fig. 7.2 – Vertex pour l’interaction entre trois et quatre gluons. La couleur n’intervient pas comme nombre quantique dans notre caractérisation des hadrons, ils sont de couleur blanche. Si l’on considère toutes les combinaisons attractives et répulsives entre quarks dues à l’échange de gluons, on trouve en effet qu’uniquement les combinaisons qq̄ et qqq de couleur neutre correspondent à un état lié. Autres combinaisons, comme par exemple qq q̄q̄ , subissent une force répulsive et ne correspondent pas à un état stable. Le méson π + , par exemple, contient une superposition de paires quarks-antiquarks, uR d̄R̄ , uB d̄B̄ et uV d̄V̄ , en proportions égales. Les gluons échangés entre les quarks pour établir la liaison changent en effet constamment la couleur des quarks comme l’esquisse la Figure 7.3, tout en préservant la couleur blanche du méson. Le même effet joue à l’intérieur d’un baryon. 7.2 Le potentiel fort A courte distance l’échange de gluons produit un potentiel entre quark et anti-quarks qui est analogue à celui causé par le photon dans un état positronium. Ce potentiel varie avec la 7.3. POLARISATION DU VIDE uR 69 uB RB̄ g d̄R̄ gV B̄ d̄B̄ uV d̄V̄ Fig. 7.3 – Les gluons changent constamment la couleur des quarks à l’intérieur d’un méson. distance comme 1/r, comme le potentiel de Coulomb. A grande distance, on observe un tout autre comportement: le potentiel devient de plus en plus grand avec la distance. Le potentiel qui convient à la description des spectres des états J/ψ et Υ est (voir Chapitre 6) V (r) = 4 αs + kr 3 r (7.3) avec αs = g 2/4π 0.2. Le deuxième terme détermine le comportement du potentiel à grande distance, qui ressemble au potentiel d’un ressort à tension croissante, avec une constante k 1 GeV/fm. Ce deuxième terme est crée par l’interaction des gluons entr’eux. En termes d’un langage chromostatique, la force additionnelle entre gluons concentre le champ couleur le long d’une ligne qui relie les deux charges couleur. Il en résulte la force kr qui ne permet pas de séparer couleur et anti-couleurs, mais les confie à des distances de l’ordre de 1 fm. A cause de la forme particulière du champ on parle aussi d’un string qui relie les couleurs 1 . 7.3 Polarisation du vide Une manière plus chromodynamique de décrire le même mécanisme est de comparer les corrections quantiques des propagateurs du photon et du gluon. Dans le cas du photon, une correction importante du propagateur du photon est celle qui introduit une boucle d’électronpositron comme le montre la Figure 7.4. Cette boucle crée des charges additionnelles entre le projectile et la cible. On appelle ce phénomène la polarisation du vide. Dans un langage électrostatique on peut dire qu’elle masque la charge de la cible comme le visualise la Figure 7.5 2 . Par conséquent, la charge effective diminue avec la distance. Autrement dit, elle croit avec le transfert en impulsion q 2 . Ceci est en effet ce que l’on trouve expérimentalement, comme le montre la Figure 7.6 3 . Pour l’électrodynamique ceci est un petit effet. Il faut monter des transferts d’impulsion quasiment zéro, où α 1/137 est mesuré très précisément (voir l’Exemple Penning Trap, Chapitre 5), jusqu’aux énergies du LEP, pour voir changer α de quelques pourcent. Pour la QCD, le même effet est beaucoup plus prononcé. A cause de la taille même du couplage fort, la polarisation du vide et la variation de la charge nette sont plus importants. En plus, le signe de l’effet est inversé: la force forte devient de plus en plus forte avec la distance. Ceci est du au fait qu’il existe deux types de polarisation du vide pour les gluons. L’analogue 1. A ne pas confondre avec les théories de strings qui sont considérés comme alternatives aux théories quantiques des champs. 2. F. Jegerlehner, Nucl. Phys. Suppl. 51C (1996) 131. 3. L3 Collab., M. Acciarri et al., CERN-EP-2000-005 CHAPITRE 7. INTERACTIONS FORTES 70 @ @ @ ) ( ) n ) ( ) @ @ @ +; ; +; + +; + +; ; +; Fig. 7.4 – Modification du propagateur du photon par boucles d’électrons. ; +; + +; + +; ; +; +; +; +; ; r ; Fig. 7.5 – Les charges crées par la polarisation du vide masquent partiellement la charge de la cible. 136 L3 α-1(Q2) 134 132 130 small angle large angle 128 -1 0 10 1 2 log(-Q2/GeV2) 3 4 Fig. 7.6 – Variation de l’inverse de la constante de structure fine α−1 avec le transfert en impulsion q 2 , mesuré au LEP en utilisant le processus e+ e− → e+ e− . 7.3. POLARISATION DU VIDE 71 de la polarisation électromagnétique introduit une boucle de quarks dans le propagateur du gluon. Elle masque la charge couleur. Mais en plus, le couplage des gluons entr’eux introduit des boucles de gluons additionnels, qui diffèrent de celle des quarks par un signe parce qu’elles font intervenir des bosons. Dans un langage chromostatique on pourrait dire que les boucles de gluons introduisent des paires de charges couleurs-anticouleurs additionnels, donc attractifs. Au lieu de masquer la charge couleur de la cible, elles la renforcent. A cause du grand nombre de gluons et de leur masse zéro, les boucles de gluons prennent le dessus et dominent la polarisation forte du vide. @ @ @ @ @ @ @ @ @ n @ @ @ Fig. 7.7 – Contributions au propagateur du gluon par boucles de quarks et gluons. Par conséquent, la charge couleur de la cible augmente avec la distance, qui est proportionelle à l’inverse du transfert en impulsion. La figure 7.8 4 montre que cet effet est beaucoup plus notable que son analogue électromagnétique. 0.4 L3 Rτ RΖ Event Shape QCD Evolution 0.35 αs 0.3 0.25 0.2 0.15 0.1 0 25 50 75 100 125 150 175 200 √s (GeV) Fig. 7.8 forte, αs , avec le transfert en impulsion √ –2 Variation du carré de la constante de couplage √ + − s = q , mesuré au LEP en utilisant le processus e e → hadrons ainsi que la désintégration hadronique du lepton τ . 4. L3 Collab., M. Acciarri et al., CERN-EP-2000-064 CHAPITRE 7. INTERACTIONS FORTES 72 7.4 Hadronisation A cause de la grande énergie potentielle stockée dans un champs chromostatique à grande distance, les charges couleurs séparées par une force suffisante créeront des particules au lieu de devenir des quarks ou gluons libres. Une telle séparation par force se produit, par exemple, dans la création de quarks e+ e− → qq̄ à hautes énergies. Encore une fois il y a deux approches pour comprendre qualitativement ce processus: Dans l’approche chromostatique, la paire de quarks initiale crée des paires quarks-antiquarks une fois séparés par une distance de l’ordre de 1 fm, comme le montre la Figure 7.9. Ce processus se poursuit jusqu’à ce que l’impulsion relative entre les quarks soit suffisamment modérée pour permettre la formation d’états liées. Leur formation se passe le long des strings, donc avec une impulsion transversale limitée. Ils forment par conséquent des jets qui suivent plus ou moins la direction des quarks initiaux. 1 1̄ ←− ◦ • −→ 1 2̄ 2 1̄ ←− ◦ •◦ • −→ 1 3̄ 3 2̄ 2 4̄ 4 1̄ ←− ◦ •◦ •...◦ • ◦ • −→ Fig. 7.9 – Hadronisation dans l’approche chromostatique des strings. Dans une approche plus chromodynamique, le processus peut être vu en termes d’une cascade de quarks et gluons La cascade se compose des vertex élémentaires de la QCD, caractérisés par une constante de couplage d’autant plus forte que masse virtuelle q 2 des participants diminue. Une partie d’une telle cascade est représentée dans la Figure 7.10. e− e+ @ @ @ R @ @ @ @ @ @ @ @ Fig. 7.10 – Cascade de quarks et gluons qui approxime la première phase de l’hadronisation dans une approche chromodynamique. Seule une gerbe de particules est montrée. Il est clair que cette approche ne peut pas servir à complètement couvrir le processus de l’hadronisation. A grandes distances, la valeur de la constante de couplage prend des valeurs si grandes qu’une approche perturbative, d’expansion par ordres de la constante de couplage, ne peut plus converger. Dans ce domaine dominent les effets collectifs, qui aboutissent à la formation de mésons et baryons. 7.4. HADRONISATION 73 Les hadrons sont de toute façon formés in vacuo, leurs impulsions transversales sont donc limitées par le principe de Heisenberg à quelques 300 MeV. Les hadrons sont alors concentrés autour de la direction initiale et forment des jets. Leur impulsion transversale est petite et indépendante de l’impulsion du quark. Les jets deviennent de plus en plus collimés si l’énergie du quark augmentante. Si le premier gluon émis dans la cascade a une impulsion transversale suffisamment grande par rapport à cette largeur naturelle, une troisième gerbe discernable de particules le long la direction du gluon se formera. On observe alors un évènement à trois jets comme le montre la Figure 7.11. Ces évènements sont donc attribués à la réaction e+ e− → qq̄g et leur section efficace est calculée à partir du diagramme de Feynman de la Figure 7.12. L3 L L L L 3 L3 L L L L 33 L L L 333 Fig. 7.11 – Evènement à trois jets hadroniques créés dans l’expérience L3 au LEP. e− e+ q̄ @ R @ g @ @ R @ @ q e− e+ q̄ @ R @ @ g @ @ @ q Fig. 7.12 – Diagrammes de Feynman pour l’émission de gluons dans le processus e+ e− → qq̄g. L’émission de gluons par un quark a toutes les caractéristiques d’un processus de radiation de freinage. Il existe deux divergences de son amplitude: elle devient très grande pour l’émission d’un gluon de basse énergie (divergence infrarouge) et pour une émission vers l’avant (divergence 74 CHAPITRE 7. INTERACTIONS FORTES collinéaire). Dans les deux cas, le gluon devient pratiquement indiscernable dans l’état final hadronique. Pas conséquent, ce processus doit être inclus dans le calcul de la section efficace e+ e− → hadrons. On obtient alors une meilleure approximation du rapport R (voir Chapitre 5) qui est σ(e+ e− → hadrons) αs 2 R≡ Q 1 + (7.4) 3 i σ(e+ e− → µ+ µ− ) π i Cette correction met les donnés en encore meilleure accord avec le calcul, comme le montre la Figure 5.15. 75 Chapitre 8 Interactions faibles Les interactions faibles ne méritent pas leur nom. Leur faiblesse apparente à basse énergie est due au fait qu’elles sont transmises par des particules lourdes, le Z neutre et les W± chargés, dont le propagateur affaiblit l’amplitude à bas transfert d’impulsion. Leurs constantes de couplage, g et g , par contre, sont du même ordre de grandeur que la charge électrique, e. e− u νe @ @ R @g @ ) ( W− ) @ @ R @ @ d νµ q νµ @ @ R @g @ ) ( Z ) @ @ R @ @ q Fig. 8.1 – Diagrammes de Feynman de premier ordre pour les réaction e− u → νe d (à gauche), et νµ q → νµ q (à droite). La figure 8.1 montre des interaction faible chargées et neutres typiques. La comparaison avec diagramme électromagnétique correspondant, Figure 5.16, montre que la structure de l’amplitude faible est assez similaire à celle de l’électromagnétisme. La composante neutre des interactions faibles peut même interférer avec les interactions électromagnétiques quand il s’agit de particules chargées. Il y a néanmoins des différences majeures entre les deux types d’interactions: – La charge faible est une quantité à deux composantes, en contraste avec une seule composante pour la charge électromagnétiques et trois composantes pour la couleur. On l’appelle isospin faible par analogie au spin qui lui aussi a deux composantes libres. On caractérise les particules par leur isospin faible total, T , et sa troisième composante, T3 . – La force faible est transmise par des bosons vectoriels, similaires au photon et aux gluons, mais très lourds. La masse du W± est de l’ordre de 80 GeV, celle du Z est de l’ordre de 90 GeV. Les deux bosons portent eux-mêmes l’isospin faible. En plus les bosons chargés peuvent évidemment interagir avec le photon. – Les interactions faibles ne conservent pas la parité. Ainsi ils produisent des phénomènes de polarisation longitudinale même à partir d’états initials non-polarisés. CHAPITRE 8. INTERACTIONS FAIBLES 76 Cette non-conservation de la parité est l’exemple le plus visible des symétries respectées par les autres interactions, mais non pas par les interactions faibles. Celles-ci ne respectent même pas la symétrie combinée CP et sont par conséquent les seules interactions connues qui distinguent entre matière et anti-matière. En même temps – et probablement pour la même raison – elles sont les seules interactions qui relient des particules de différentes générations à un seul vertex. Par conséquent, elles ne conservent pas la saveur. Ce fait est bien établi pour les quarks, mais vient d’être observé aussi pour les leptons, en de plus faibles proportions 1 . Dans ce chapitre on introduira d’abord la non-conservation de la parité par les interactions faibles chargées. Ensuite on commentera sur trois processus prototypes: la désintégration du muon via des interactions faibles chargées; l’interférence entre interactions électro-faibles dans l’annihilation e+ e− en paires de fermions; et la diffusion neutrino-électron pour les pures interactions faibles neutres. On finira par couvrir superficiellement les désintégrations faibles des quarks ainsi que les oscillations de neutrinos. 8.1 Non-conservation de la parité En 1956, à partir d’une étude des données expérimentales, Lee et Yang 2 ont conclus que les interactions faibles ne sont pas invariantes sous l’opération de la parité, PΦ(t,r) = Φ(t, − r). Pour mettre en évidence leur comportement sous cette transformation, Wu et al. 3 ont conçu une expérience qui reste un classique de la discipline. Exemple 18: Expérience de Wu et al. Elle utilise la désintégration faible des neutrons, n → pe− ν̄e , liés dans des noyaux de 60 Co. A très basse température, de l’ordre de 0.01 K, et en présence d’un champ magnétique, les vecteurs du spin de ces noyaux à J = 5 sont fortement alignés avec la direction du champ extérieur. Leur désintégration, 60 Co(J = 5) →60 Ni∗ (J = 4) e− ν̄e , peut procéder par deux configurations de spins montrés dans la Figure 8.2. Dans le cas a), l’électron est émis dans une direction opposée à celle du spin du 60 Co, dans le cas b) il est émis dans cette direction. Toute combinaison des deux cas est admise par la conservation du moment cinétique. Le cas a) correspond à un taux différentiel de désintégration dΓ σ p = Γ0 1 − dΩ E (8.1) ou p et E dénotent impulsion et énergie de l’électron émis, et σ dénote un vecteur unitaire dans la direction du spin du noyaux. Le cas b), par contre, donne une distribution angulaire dΓ σ p = Γ0 1 + dΩ E (8.2) L’expérience met en évidence la distribution angulaire du cas a), Equ. 8.1, et n’admet pas une – même faible – contribution de la configuration b). 1. Super-Kamiokande Coll., Y Fukada et al, Evidence for oscillation of atmospheric neutrinos, Phys. Rev. Lett. 81 (1998) 1562. 2. T.D. Lee et C.N. Yang, Question of parity conservation in weak interactions, Phys.Rev. 104 (1956) 254. 3. C.S. Wu, E. Ambler, R.W. Hayward, D.D. Hoppes et R.P. Hudson, Experimental test of parity conservation in beta decay, Phys.Rev. 105 (1957) 1413. 8.1. NON-CONSERVATION DE LA PARITÉ 77 _ νe 60 J=4 λ = +1 Ni * a) J=5 e- λ = −1 e- λ = +1 60 Co J=4 60 _ νe Ni * b) λ = −1 Fig. 8.2 – Configurations de spins permises par la conservation du moment cinétique dans la désintégration 60 Co(J = 5) →60 Ni∗ (J = 4) e− ν̄e . En effet, conservation de la parité réclamerait que les probabilités des deux configurations a) et b) de la Figure 8.2 soient les mêmes. La direction du spin, σ , est un pseudo-vecteur avec Pσ = +σ ; l’impulsion, p, est un vecteur avec Pp = −p. Le terme σ p change son signe sous P, il est un pseudo-scalaire. Si la distribution angulaire ne représente pas un mélange à proportions égales entre les Equ. 8.1 et 8.2, la parité n’est pas conservée dans la réaction. Elle est même violée d’une manière maximale en supprimant carrément l’amplitude du cas b). Cela veut dire aussi que les interactions faibles chargées n’admettent que certains polarisation des fermions intervenants. Dans notre exemple, les deux spins de l’électron et du neutrino doivent être alignés avec celui du noyaux pour respecter la conservation du moment cinétique. Par conséquent, dans le cas de la Figure 8.2a), le spin de l’électron est anti-parallèle à sa direction de mouvement, celui de l’anti-neutrino est parallèle. Si l’on néglige la masse des leptons émis – celle de l’anti-neutrino est de toute façon très petite – on trouve donc que le lepton a une hélicité négative, l’anti-lepton une hélicité positive. Cette propriété des interactions faibles chargées peut être généralisée. Autant que l’on sache, le W interagit uniquement avec des fermions d’hélicité négative et avec des anti-fermions d’hélicité positive. Les interactions faibles chargées violent la parité d’une façon maximale. L’amplitude contient des termes vectoriels (V ) et pseudo-vectoriels (A) en même proportion, mais avec signe opposé. La structure de l’amplitude est donc caractérisée comme V − A. En s’inspirant de l’image des boules en rotation pour le phénomène du spin, on parle de champs gauchers, ψL , si le spin est anti-parallèle à la direction du mouvement, donc pour λ < 0. Inversement, une particules est appelée droitière si λ > 0. Il est évident que des particules nonpolarisée sont représentée par un mélange statistique avec probabilités égales. CHAPITRE 8. INTERACTIONS FAIBLES 78 Par conséquent on arrange les leptons gauchers dans des doublets d’isospin faible, les leptons droitiers dans des singlet: νe T = 1/2 ; T3 = e− L νµ T = 1/2 ; T3 = µ− L ντ T = 1/2 ; T3 = τ− L +1/2 −1/2 +1/2 −1/2 +1/2 −1/2 eR T = 0 ; T3 = 0 µR T = 0 ; T3 = 0 (8.3) τR T = 0 ; T3 = 0 De cette façon les champs gauchers ont une charge faible et se couplent au W et Z, les champs droitiers non. De la même manière on arrange les quarks dans des doublets et singlets: u T = 1/2 ; T3 = d L c T = 1/2 ; T3 = s L t T = 1/2 ; T3 = b L +1/2 −1/2 +1/2 −1/2 +1/2 −1/2 uR ,dR T = 0 ; T3 = 0 cR ,sR T = 0 ; T3 = 0 (8.4) tR ,bR T = 0 ; T3 = 0 On peut se demander pourquoi les composantes droitières du neutrino ne figurent pas dans ce tableau, bien que celles des particules chargées apparaissent. Ceci est dû au fait que les neutrinos, étant électriquement neutres et sans couleur, ne subissent aucune force sauf la faible. Comme cette dernière ne se couple pas aux champs droitiers, ils ne peuvent être produits par aucune force. Par conséquent et dans la mesure où leur masse est zéro, ils n’existent pas. L’hélicité est un bon nombre quantique uniquement pour des particules qui voyagent à la vitesse de la lumière. Ce sont les seules qui peuvent être complètement polarisées longitudinalement. Dans la plupart des cas cette approximation s’applique aussi aux électrons et muons, à haute énergie même aux leptons tau. Pour les puristes il existe néanmoins un nombre quantique qui s’appelle chiralité et qui exprime le même concept d’une manière plus rigoureuse. Elle est +1 si la projection du spin sur la direction du mouvement est seulement positive, et -1 autrement, sans restriction sur la valeur de la composante projetée. 8.2 Désintégration du muon Le prototype des réactions du W± est la désintégration du muon. Son amplitude de première ordre est représentée dans la Figure 8.3. Elle fait intervenir les couplages du W± aux leptons de la première et deuxième génération. 2 Dans son amplitude, le propagateur du W± contribue un facteur ∼ 1/(q 2 −MW ), qui affaiblit 2 2 l’amplitude pour q MW . Aux bas transferts d’impulsion qui figurent dans la désintégration 2 2 des particules légères, où q 2 ≤ m2µ MW , le propagateur est donc constant, 1/MW . Par convention, on absorbe ce résidu du propagateur, avec le carré de la constante de couplage g 2 , dans la constante de Fermi, GF : G g2 √F = 2 8MW 2 (8.5) 8.2. DÉSINTÉGRATION DU MUON 79 νµ (k) µ− (p) − W - - e− (p ) 6 νe (−k ) Fig. 8.3 – Diagramme de Feynman de premier ordre pour la désintégration du muon. Dans cette approximation on obtient une description des interactions faibles qui correspond à l’interaction directe entre deux courants qui changent la charge des particules 4GF MCC = √ Jµ+ J −µ 2 (8.6) Cette approximation est représenté par le diagramme de la Figure 8.4. Les courants sont analogues au courant électromagnétique introduit dans le Chapitre 4. On les dénote – d’une manière imprécise – comme courants chargés (CC). Analogiquement on obtient comme approximation pour les interaction du Z pour q 2 MZ2 4GF MN C = √ 2ρJµ0 J 0µ 2 (8.7) Ceci est l’interaction de deux courants neutres (NC). La constante ρ ρ= MW MZ cos θW (8.8) fait intervenir l’angle de Weinberg, θW , qui mesure le rapport entre les constantes de couplage des interactions faibles chargées et neutres tan θW = g g (8.9) La constante ρ égale 1 avec une bonne précision. Le taux différentiel de désintégration du muon est (en négligeant me mµ ) dΓ G2F 2 2 4E = m E (3 − ) dE 12π 3 µ mµ (8.10) en fonction de l’énergie E de l’électron sortant. Cette énergie peut varier dans les limites 0 ≤ E ≤ mµ /2. Comme le processus µ− → e− ν̄e νµ et pratiquement le seul canal de désintégration du muon, le taux total est 1 Γ= = τµ = mµ /2 0 G2F m5µ 192π 3 dE dΓ dE (8.11) (8.12) CHAPITRE 8. INTERACTIONS FAIBLES 80 µ− νµ Jµ+ @ @ R =⇒ @ @y @ @ =⇒ R @ @ J− νe µ νµ Jµ0 @ @ R =⇒ @ @y @ @ =⇒ R @ @ J0 e− e− µ νµ e− Fig. 8.4 – Processus prototypes pour interactions faibles chargées et neutres dans d’approximation de Fermi, qui fait intervenir un couplage direct entre deux courants à faibles transferts en impulsion. Notez que pour la désintégration du muon l’anti-neutrino sortant a été converti en neutrino entrant pour donner la direction du courant. Le temps de vie du muon mesuré étant à peu près 2.2 × 10−6 s, nous trouvons une constante de Fermi GF 10−5 [1/GeV2 ]. Le facteur 1/m5 vient des facteurs d’espace de phase qui entrent dans le calcul de Γ. Par conséquent on trouvera la même formule pour d’autres désintégrations faibles des fermions ponctuels, comme par exemple celles du lepton tau, pourvu que la constante de couplage soit la même. Le taux partiel de la désintégration analogue est Γ(τ − → e− ν̄e ντ ) = BR(τ − → e− ν̄e ντ ) G2 m5 = F 3τ ττ 192π (8.13) Il ne correspond pas directement au taux total parce que le tau a d’autres canaux de désintégration importants, à cause de sa grande masse. Exemple 19: Temps de vie du muon Une des expériences les plus précises qui ont mesuré le temps de vie du muon est représentée dans la Figure 8.5 4. Un faisceau de µ+ entre par la gauche, est collimé par les absorbeurs en plomb et arrêté dans la cible en souffre. L’hodoscope de scintillateurs (Sc) enregistre les positrons provenant de la désintégration et mesure leur temps de passage. La Figure 8.6 montre un résultat représentatif. Le taux de désintégration par unité de temps suit bien une loi exponentielle, avec un faible bruit de fond venant de coı̈ncidences accidentelles. La pente de la courbe donne le temps de vie du muon. Bardin et collaborateurs trouvent τµ+ = 2197.078 ± 0.073 ns. La valeur moyenne mondiale, déterminée par le Particle Data Group 5 est τµ+ = 2197.03 ± 0.04 ns (8.14) correspondant à une constante de Fermi 6 GF = (1.16637 ± 0.00001)−5 GeV−2 qui est donc connu avec une précision de 10 ppm. 4. G. Bardin et al., Phys. Lett. 137B (1984) 135. 5. http://pdg.web.cern.ch/pdg/1999/lxxx.html 6. T. van Ritbergen et R.G. Stuart Phys.Rev.Lett. 82 (1999) 488. (8.15) 8.2. DÉSINTÉGRATION DU MUON 81 Fig. 8.5 – Schématique de l’expérience de Bardin et al. pour le temps de vie du muon. Le faisceau de µ+ entre par la gauche, est collimé par les absorbeurs en plomb et arrêté dans la cible en souffre. L’hodoscope de scintillateurs (Sc) enregistre les positrons provenant de la désintégration et mesure leur temps de passage. Fig. 8.6 – Taux de désintégration des muons par unité de temps. On observe une loi exponentielle avec un faible bruit de fond causé par des coı̈ncidences accidentelles. CHAPITRE 8. INTERACTIONS FAIBLES 82 Exemple 20: Temps de vie du lepton tau Le temps de vie du lepton tau est trop court pour une mesure directe. On le mesure plutôt par son distance de parcours à hautes énergies. On produit les leptons√tau par e+ e− → τ + τ − , seule réaction observée à ce jour qui les produit. A hautes énergies, s = 2Eτ , leur temps de vie dans le laboratoire est dilaté par un facteur γ. Leur parcours moyen, L, est par conséquent p ττ (8.16) L = γvττ = mτ avec un facteur de proportionnalité relativiste et connue. Avec un temps de vie de quelques centaines de fs, le parcours lui-même est inobservable même à hautes énergies. A une énergie du τ de 50 GeV, par exemple, le parcours moyen est de l’ordre de 2.5 mm, et donc complètement contenu dans le tube à vide qui contient les faisceaux. On mesure alors la longueur du parcours via leur désintégration en trois particules chargées, τ ± → π ± π + π − ντ . La Figure 8.7 montre le principe. Les trajectoires des trois pions sont mesurées avec un détecteur de traces directement à l’extérieur du tube à vide, qui est typiquement un détecteur en silicium 7 . Elles sont extrapolées et leur origine commune détermine le vertex de désintégration du lepton tau. Son origine étant connue de la position des faisceaux, on détermine alors la longueur du parcours. (a) three-prong L xy τ Fig. 8.7 – Principe de la mesure du temps de vie du tau par la reconstruction de son parcours. Son origine (+) est connue par la position des faisceaux. Les trajectoires des pions produits par sa désintégration sont mesurées dans un détecteur de traces. Elles sont extrapolées et déterminent un vertex de désintégration. La distance entre les deux points correspond au parcours du τ . Une distribution de parcours est montrée dans la Figure 8.8 8 . Dans la représentation logarithmique elle met en évidence le comportement exponentiel attendu, mais modulé par une résolution expérimentale qui est nettement pire que dans le cas du muon. La pente de la distribution mesure le parcours moyen, qui donne le temps de vie en appliquant l’Equation 8.16. 7. Voir par exemple: L3 Collab., M. Acciarri et al., Nucl. Instrum. Meth. A360 (1995) 103. 8. L3 Collab., M. Acciarri et al., Phys.Lett. B479 (2000) 67. 8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z Number of Decays / 0.44 mm Number of Decays / 0.44 mm 10 L3 1994 500 Data 400 Fit 300 200 100 -10 -5 0 5 10 15 20 83 3 L3 1994 Data 10 2 Fit 10 1 -10 Decay length [mm] -5 0 5 10 15 20 Decay length [mm] Fig. 8.8 – Distribution de parcours pour les leptons τ se désintégrant en trois pions et un neutrino, en abscisse linéaire (à gauche) et logarithmique (à droite). La représentation logarithmique met en évidence la loi exponentielle de la désintégration. La valeur moyenne mondiale du temps de vie du tau, déterminée par le Particle Data Group 5 est ττ = 290.0 ± 1.2 fs (8.17) Ce chiffre est en excellent accord avec la prédiction de l’Equ. 8.13 et démontre que les constantes de couplage de l’électron, du muon et du tau au W sont les mêmes à quelques pour-milles près. 8.3 Annihilations électron-positron et le Z Dans le chapitre 5 on avait déjà discuté le processus prototype e+ e− → µ+ µ− pour la production de paires de fermions par l’annihilation électron-positron. En plus des interactions électromagnétiques. Ce processus peut être engendré par les interactions faibles neutres, comme le montre la Figure 8.9. Les états initiaux et finaux sont indiscernables, il faut additionner les amplitudes. Dans la section efficace apparaissent par conséquent trois termes au premier ordre: σtot (e+ e− → µ+ µ− ) = σγ + σZ + σint (8.18) Le premier terme, σγ , contient le carré de l’amplitude pour l’échange d’un photon, le deuxième, σZ , celui d’un Z et le troisième, σint , l’interférence entre les deux. Pour le photon, on avait trouvé dans le Chapitre 5: dσγ dΩ σγ α2 1 + cos2 θ 4s 4πα2 = 3s = (8.19) (8.20) CHAPITRE 8. INTERACTIONS FAIBLES 84 e− (k) e− (k) µ+ (p) @ @ R γ(s) @ @ @ @ R @ @ e+ (k ) µ+ (p) @ @ R Z(s) @ @ @ @ R @ @ µ− (p ) e+ (k ) µ− (p ) Fig. 8.9 – Diagrammes de Feynman de premier ordre pour la réaction e+ e− → µ+ µ− , engendrés par le photon (à gauche) et le Z (à droite). La section efficace totale qui tient compte des trois termes peut être écrite comme suit: α2 dσ = A0 1 + cos2 θ + A1 cos θ (8.21) dΩ 4s et contient un terme symétrique dans l’angle de diffusion, θ = (e− ,µ− ), et un terme asymétrique. Leurs coefficients sont A0 = 1 + 2(r)gV2 + |r|2 (gv2 + gA2 ) A1 = 2(r)gA2 + 8|r|2gV2 gA2 avec un terme, r, qui correspond au pôle du Z: √ 2GF sMZ2 r= e2 s − MZ2 + iMZ ΓZ 2 (8.22) (8.23) qui correspond à la fonction de Breit-Wigner caractéristique pour les résonances. Les couplages gV et gA proviennent des charges faibles gV = T3 − 2Q sin2 θW gA = T3 (8.24) (8.25) avec la troisième composante de l’isospin faible, T3 , et la charge électrique, Q. L’indice de ces constantes correspond aux composantes vectorielles et pseudo-vectorielles de l’interaction faible neutre. Pour simplifier, et en accord avec l’Equation 8.3, on a mis les mêmes constantes de couplage pour l’électron et le muon. La décomposition des coefficients A0 et A1 , dans l’Equation 8.22, montre la répartition voulue entre les termes électromagnétiques, 1 et 0 respectivement, les termes d’interférences, ∼ (r) et quadratiques en g, et les termes faibles, ∼ |r|2 et quadratiques en g 2 . Le terme d’interférence introduit une asymétrie dans la distribution angulaire que l’on avait déjà remarqué dans la Figure 5.13.On définit une asymétrie angulaire, AF B , en comparant le taux de diffusion vers l’avant à celui vers l’arrière σF − σB AF B = (8.26) σF + σB avec les sections efficaces partielles dσ d cos θ 0 dΩ 0 dσ d cos θ = −1 dΩ σF = σB 1 (8.27) (8.28) 8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z 85 En termes des coefficients et des couplages, on obtient ⎧ AF B 3 2 2 3A1 ⎨ 2 (r)gA pour |s − MZ | ΓZ 2 g2 = 3gV A pour |s − MZ2 | ΓZ 8A0 ⎩ (g2 +g 2 )2 V La section efficace totale est σ= (8.29) A 4πα2 A0 3s (8.30) Exemple 21: Annihilation électron-positron en muons A basses énergies, où r 0 et l’influence de l’interaction faible est négligeable, on retrouve le résultat électromagnétique, qui correspond à A0 = 1 et A1 = 0. Dans la région intermédiaire, où (r) se fait sentir, mais où |r|2 est encore négligeable, l’interférence électro-faible se manifeste. Et finalement, proche de la masse du Z, où les termes proportionnels à |r|2 dominent, on trouve l’interactions faible neutre qui domine l’interaction électromagnétique par deux ordres de grandeur. La Figure 8.10 9 montre une compilation de mesures de la section efficace et de l’asymétrie angulaire pour e+ e− → µ+ µ− en fonction de l’énergie. La résonance du Z se manifeste par un énorme pic dans la section efficace, l’interférence électro-faible se manifeste par une asymétrie angulaire importante aux flancs de la résonance. La valeur de l’angle électro-faible, sin2 θW est proche d’un quart 10 sin2 θW = 0.23151 ± 0.00017 (8.31) Par conséquent, on trouve pour les leptons chargés une interaction faible qui est dominée par sa composante pseudo-vectorielle: gVl −0.03 ; gAl = −0.50 (8.32) gVν = +0.50 ; gAν = +0.50 (8.33) Pour les neutrinos en a Pour les quarks du type up on trouve: gVu +0.20 ; gAu = +0.50 (8.34) gVd −0.30 ; gAd = −0.50 (8.35) et pour les quarks du type down: Près de la résonance du Z, on peut négliger complètement et l’interaction électromagnétique et l’interférence électro-faible. On obtient alors pour la section efficace de toute réaction 11 e+ e− → f f¯ en paires de fermions f : σZ (s) = σZmax sγZ2 2 (s − MZ2 ) + MZ2 Γ2Z (8.36) 9. J. Mnich, Experimental Tests of the Standard Model in e+ e− → f f̄ at the Z resonance, Phys. Rep. 271 (1996) 181. 10. The LEP Collaborations, Aleph, Delphi, L3 and Opal, and the LEP Electroweak Working Group and the SLD Heavy Flavor and Electroweak Groups, A Combination of Preliminary Electroweak Measurements and Constraints on the Standard Model, CERN-EP-2000-016 (2000) 11. Toute réaction sauf e+ e− → e+ e− , où plus de diagrammes contribuent. CHAPITRE 8. INTERACTIONS FAIBLES 86 σ [nb] 10 PEP PETRA HRS MAC MARK II 1 10 10 TRISTAN LEP CELLO JADE MARK J PLUTO TASSO AMY TOPAZ VENUS L3 + − + − e e →µ µ -1 -2 0 20 40 60 80 100 120 140 160 180 AFB √s [GeV] SPEAR 1 MARK I 0.75 PEP PETRA TRISTAN LEP HRS CELLO AMY MAC JADE TOPAZ MARK II MARK J VENUS 0.5 L3 PLUTO TASSO 0.25 0 -0.25 -0.5 + − + − e e →µ µ -0.75 -1 0 20 40 60 80 100 120 140 160 180 √s [GeV] Fig. 8.10 – Section efficace es asymétrie angulaire pour√la réaction e+ e− → µ+ µ− en fonction de l’énergie totale dans le système du centre de masse, s. 8.3. ANNIHILATIONS ÉLECTRON-POSITRON ET LE Z avec un maximum de σZmax = 12π 87 Γe Γf Mz2 Γ2Z (8.37) La section efficace s’exprime alors en termes du taux de désintégration, ΓZ , d’un boson Z réel. Le carré de son impulsion est en effet s MZ près de la résonance, cette notion est donc justifiée. Les taux partiels en électrons, Γe , et en fermions f , Γf , sont Γf = Nc T3f − 2Qf sin2 θf GF MZ √ 2π 2 (8.38) avec les charges faibles et électriques appropriées. Exemple 22: Couplages faibles pour les leptons Les couplages gV et gA des leptons sont mesurés en utilisant sections efficaces, asymétries angulaires et polarisation des réactions e+ e− → l¯l, pour l = (e,µ,τ ). La Figure 8.11 montre le résultat 12 . On trouve que notre choix pour l’isospin faible des leptons chargés est le bon. On trouve aussi que toutes les générations ont les mêmes constantes de couplage à quelques pour-milles près. -0.031 Preliminary -0.035 gVl mH -0.039 mt Al (SLD) +− -0.043 ll + − ee + − µµ + − ττ -0.503 68% CL -0.502 -0.501 -0.5 gAl Fig. 8.11 – Constantes de couplage des interactions faibles neutres pour les trois générations de leptons chargés. Les valeurs expérimentales des constantes de couplage des leptons chargés sont gVl = −0.03772 ± 0.00041 gAl = −0.50117 ± 0.00027 (8.39) (8.40) 12. The LEP Collaborations, Aleph, Delphi, L3 and Opal, and the LEP Electroweak Working Group and the SLD Heavy Flavor and Electroweak Groups, A Combination of Preliminary Electroweak Measurements and Constraints on the Standard Model, CERN-EP-2000-016 (2000) CHAPITRE 8. INTERACTIONS FAIBLES 88 Pour les neutrinos on trouve gVν = gAν = −0.50085 ± 0.00075 (8.41) Tous ces valeurs sont compatible avec notre attribution de l’isospin faible de l’équation 8.3. 8.4 Diffusion neutrino-électron Les processus faisant intervenir les neutrinos sont uniquement dûs aux interactions faibles, parce que les neutrinos ne portent ni charge électrique ni couleur. Le processus qui a permis de découvrir les interactions faibles neutres 13 est la diffusion élastique neutrino-électron νµ e− → νµ e− . Le diagramme de Feynman de premier ordre est montré dans la Figure 8.12. La section efficace différentielle est (s MZ2 ) dσ G2 s (νµ e) = F [(gVe + gAe )2 + (gVe − gAe )2 (1 − y)2 ] dy 4π (8.42) avec les constantes de couplages gV et gA de l’électron. Ceux du neutrino ont été fixés à un demi. La variable cinématique est le transfert en énergie relatif y= pq E Eν − Eν e = pk Eν Eν (8.43) dans le système de repos de l’électron, c’est à dire dans le laboratoire. νµ (k ) ν̄µ (k) νµ (k) e− (p) @ @ R @ @ ) Z(q) ( @ @ R @ @ e− (p ) e− (p) ν̄µ (k ) @ @ R @ @ ) Z(q) ( @ @ R @ @ e− (p ) Fig. 8.12 – Diagrammes de Feynman pour la diffusion neutrino-électron (à gauche) et antineutrino-électron (à droite). L’intégration sur cette variable donne la section efficace totale pour la diffusion neutrinoélectron, pour les neutrino de deuxième et troisième génération, νµ et ντ : σ(νµ e− → νµ e− ) = G2F s e2 (g + gVe gAe + gAe2) 3π V (8.44) G2F s e2 (g − gVe gAe + gAe2 ) 3π V (8.45) Pour l’anti-neutrino on trouve: σ(ν̄µ e− → ν̄µ e− ) = 13. Gargamelle Collab., F.J. Hasert et al., Search for elastic muon-neutrino electron scattering, Phys.Lett. B46 (1973) 121. 8.5. DÉSINTÉGRATIONS FAIBLES DES QUARKS 89 Quand, par contre, on considère des neutrinos de la première génération, comme le νe qui est abondamment produit dans les centrales nucléaires par la désintégration de neutrons, on doit tenir compte de la contribution des interactions faibles chargées, comme le montre la Figure 8.13. Comme les états initiaux et finaux sont les mêmes, on a affaire à une interférence entre les courants chargés et neutres. Les sections efficaces proviennent de celles des Equations 8.44 et 8.45 en remplaçant gV → (gV + 1) et gA → (gA + 1). e− (p) νe (k ) νe (k ) νe (k) @ @ R @ @ ) Z(q) ( @ @ R @ @ νe (k) - )@ ( @ W (q) ) @ ( R @ ) @ @ @ − e− (p) e− (p ) e− (p ) Fig. 8.13 – Diagrammes de Feynman pour la diffusion neutrino-électron par le courant neutre (à gauche) et le courant chargé (à droite). Exemple 23: Sections efficaces neutrino-électron Les mesures de ces sections efficaces fixent une ellipse dans le plan de gV et gA , les constantes de couplages de l’électron à l’interaction faible neutre. La Figure 8.14 montre ces quatres ellipses pour les valeurs des couplages correspondant aux Equations 8.44 et 8.45. On montre aussi une compilation de résultats expérimentaux 14 dans la même représentation. Les ellipses s’interceptent en deux endroits, gV 0 et gA −1/2, et gV −1/2 et gA 0. L’interférence électro-faible dans les interactions électron-positron décide pour la solution de l’Equation 8.3. Les section efficaces neutrino-électrons sont extrêmement petites. Les taux sont faibles et il est difficile d’obtenir des résultats précis pour les sections efficaces. Les contraintes pour les couplages sont par conséquent assez faibles. La comparaison avec les résultats obtenus au LEP, voir la Figure 8.11, met en évidence l’énorme progrès expérimental dans ce domaine venu avec les expériences électron-positron du LEP et du SLC. 8.5 Désintégrations faibles des quarks Les interactions entre le W± et les quarks se passent, d’une manière dominante entre les membres de la même génération, mais elles existent aussi entre deux générations. La Figure 8.15 montre un exemple pour le cas dominant, π + → µ+ νµ , ainsi qu’un exemple pour une désintégration au delà des générations, K+ → µ+ νµ . Le rapport entre leurs taux partiels est τπ+ BR(K+ → µ+ νµ ) Γ(K+ → µ+ νµ ) = Γ(π + → µ+ νµ ) τK + BR(π + → µ+ νµ ) (8.46) 14. J. Mnich, Experimental Tests of the Standard Model in e+ e− → f f̄ at the Z resonance, Phys. Rep. 271 (1996) 181. CHAPITRE 8. INTERACTIONS FAIBLES 90 1.0 1987 e+ e - → µ+ µ - νµ e- gA 0.5 – νµ e- 0.0 -0.5 – ν ee - – ν ee -1.0 -1.0 -0.5 νe e 0.0 0.5 gV Fig. 8.14 – Ellipses représentant les sections efficaces neutrino-électron constantes dans le plan de gV et gA , constantes de couplage de l’électron au courant neutre. A gauche: résultat prévu par le calcul de première ordre µ+ - u d @ W+ @ R @ @ νµ µ+ u s @ W+ @ R @ @ νµ Fig. 8.15 – Diagramme de Feynman pour la désintégration π + → µ+ νµ (à gauche) et K+ → µ+ νµ (à droite). 8.5. DÉSINTÉGRATIONS FAIBLES DES QUARKS 91 2.60 × 10−8 63.5% 1.23 × 10−8 100% = (8.47) et donc de l’ordre de 1. Ce résultat expérimental montre que la désintégration du kaon est très défavorisée. A cause du grand espace de phase du kaon par rapport au pion, on se serait attendu à un rapport mK + 5 495 5 Γ(K+ → µ+ νµ ) O(100) (8.48) Γ(π + → µ+ νµ ) mπ+ 140 On en conclut que les interactions inter-génération sont défavorisées par rapport aux interactions intra-génération, par au moins un facteur 100 dans le taux, ou un facteur 10 dans l’amplitude. En 1963, N. Cabbibo 15 a proposé une manière de voir ces processus. Les états qui interagissent avec le W± ne sont pas les quarks qui figurent dans le Tableau 8.4, mais des mélanges u d L c s L t b (8.49) L Les états d , s et b , ne sont pas les états propres de l’opérateur de masse, donc pas des vraies particules qui évoluent dans l’espace-temps, mais ils proviennent d’une rotation dans l’espace des saveurs. Comme cette rotation ne doit pas changer le nombre de fermions, l’opération doit être unitaire. Pour deux générations on a symboliquement d = d cos θC + s sin θC s = −d sin θC + s cos θC (8.50) (8.51) où l’on a substitué le nom du quark pour sa fonction d’onde. Ceci correspond à une modification du courant faible chargé des quarks: on met un peu d’amplitude d’un quark d’une autre génération dans la fonction d’onde de chaque quark du type down. Par conséquent, des amplitudes de leurs interactions avec le W± changent. Pour les interactions dominantes du W, avec les quarks ud et cs, par exemple, la rotation introduit un facteur cos θC dans l’amplitude. Pour les interactions défavorisés, les interactions du W± avec us et cd dans notre exemple, un facteur sin θC apparaı̂t. Les taux relatives des deux types d’interactions, comme celui de l’Equation 8.48, sont donc réduits par un facteur tan2 θC . A partir de la réduction observée on conclut donc à un angle de rotation θC 10◦ . En ce qui concerne les trois générations de quarks, on introduit une notation matricielle entre les états qui figurent dans le courant faible chargé, d , s et b , et les “vrais” quarks, d, s et b: ⎛ ⎞ ⎛ ⎞⎛ ⎞ d Vud Vus Vub d ⎜ ⎟ ⎜ ⎟⎜ ⎟ (8.52) ⎝ s ⎠ = ⎝ Vcd Vcs Vcb ⎠ ⎝ s ⎠ b b L Vtd Vts Vtb La matrice unitaire V s’appelle la matrice de Cabbibo-Kobayashi-Maskawa (CKM) d’après ses inventeurs. Les bandes actuellement connues pour les valeurs absolues de ses éléments sont 16 ⎛ ⎞ 0.9742 − 0.9757 0.219 − 0.226 0.002 − 0.005 ⎜ 0.9734 − 0.9749 0.037 − 0.043 ⎟ ⎝ 0.219 − 0.225 ⎠ 0.004 − 0.014 0.035 − 0.043 0.9990 − 0.9993 15. N. Cabbibo, Unitary symmetry and nonleptonic decays, Phys. Rev. Lett. 10 (1963) 531. 16. http://pdg.web.cern.ch/pdg/1999/kmmixrpp.ps (8.53) 92 CHAPITRE 8. INTERACTIONS FAIBLES Ces facteurs interviennent à chaque vertex du W± avec une paire de quarks. Les valeurs absolues sont mesurées en comparant les taux de désintégration de chaque type, sauf pour les interactions du quark top où ils sont déduits de l’unitarit́e de la matrice. Il convient de noter que les éléments de la matrice peuvent être complexes. Par conséquent il peut apparaı̂tre un angle de phase non trivial dans la matrice. Ce facteur rend non-invariant les amplitudes concernés sous l’opération CP. Les éléments de la matrice deviennent de plus en plus petits quand on s’éloigne de la diagonale. Ceci veut dire que les interactions intra-générations dominent le courant faible chargé. Les interactions inter-génération qui sautent une génération sont défavorisé, ceux qui sautent deux générations le sont encore plus. La structure de la matrice favorise par conséquent les chaı̂nes de désintégrations en cascade, comme par exemple t → bl+ νl → cl− ν̄l → sl+ νe → ul− ν̄l 8.6 (8.54) Oscillations particule-antiparticule et violation de CP La matrice CKM n’est pas nécessairement réelle, mais permet une phase complexe nontriviale, que l’on ne peut pas faire disparaı̂tre par une rotation globale dans l’espace des saveurs. L’existence d’une telle phase a des conséquences très importantes que l’on va discuter dans ce qui suit. On a déjà vu que l’interaction faible viole la parité, P, d’une façon maximale. A part l’expérience de Wu citée dans l’Exemple 8.1, on peut encore prendre la désintégration du pion chargé comme exemple. Le canal dominant est π + → µ+ νµL . Le neutrino produit dans cette désintégration doit être gaucher à cause de la structure de l’interaction même qui le réclame. Comme le pion est un boson scalaire, le µ+ doit aussi être gaucher, ce qui est admis dans la mesure où sa masse est importante et lui permet d’avoir la “mauvaise” hélicité. Ceci explique d’ailleurs pourquoi la désintégration du π ± en électron est tellement défavorisée malgré son facteur de l’espace de phase beaucoup plus important: la faible masse de l’électron le contraint d’autant plus d’avoir la “bonne” hélicité, pourtant défendue par la conservation du moment cinétique. La désintégration du pion chargé viole en même temps la symétrie de la conjugaison de charge, C. Sous cette opération, on obtient C(π + → µ+ νµL ) = (π − → µ− ν̄µL ) (8.55) ce qui est défendu par le fait que le W ne se couple pas à l’anti-neutrino gaucher, mais uniquement à ν̄R . Comme les symétries C et P sont donc tous les deux violées d’une façon maximale par les interactions faibles chargées, on pourrait s’attendre à ce que la symétrie PC combinée soit respectée. Ceci est en effet le cas dans les exemples cités. Pour le pion il est simple de vérifier que l’opération CP convertit en effet la désintégration du π + en celle du π − ; ces processus sont donc des états propres de CP. Mais ceci n’est pas le cas pour tous les processus faibles chargés. Regardons un peu plus de près les mésons neutres comme K0 (d,s̄), ou B0 (d,b̄). Ceux-ci peuvent se convertir dans leurs propres anti-particules par les processus de deuxième ordre dont la Figure 8.16 montre les diagrammes de Feynman. 8.6. OSCILLATIONS PARTICULE-ANTIPARTICULE ET VIOLATION DE CP d K0 s W - - u u ? 6 s d K̄0 K0 d s u - W ( ) ( ) ( ) ( ) ( ) - W 93 s K̄0 d u W Fig. 8.16 – Diagrammes de Feynman pour la conversion de K0 en K̄0 . Les diagrammes sont dominant à cause de mu mc mt . Les diagrammes pour le B0 s’obtiennent en remplaçant les quarks s par des quarks b. Les mésons pseudoscalaires K0 et B0 sont des états propres de P PΦK0 = −ΦK0 ; PΦK̄0 = −ΦK̄0 (8.56) mais non pas de C parce que cette opération change l’étrangeté: CΦK0 = ΦK̄0 ; CΦK̄0 = ΦK0 (8.57) Par conséquent, ni K0 , ni K̄0 sont des états propres de CP. Par contre on peut construire des combinaisons linéaires ΦK1 = √1 2 (ΦK0 − ΦK̄0 ) ; ΦK2 = √1 2 (ΦK0 + ΦK̄0 ) (8.58) qui sont des états propres avec CP(ΦK1 ) = +ΦK1 et CP(ΦK2 ) = −ΦK2 . Si la valeur propre de CP était conservée en interactions faibles, K1 et K2 seraient des particules qui se désintègrent par la force faible, avec les états finaux K1 → π + π − et K2 → π + π − π0 qui ont les bonnes propriétés sous CP. Ceci est approximativement vrai. Les états K1 et K2 sont presque identiques aux particules 0 KS et K0L que l’on trouve dans la liste du Particle Data Group 17 . A cause des deux facteurs de l’espace de phase très différents, un trouve un temps de vie du K1 qui est beaucoup plus court que celui du K2 , ce qui explique la notation du K short et du K long. Mais l’identification KS K1 et KL K2 n’est pas parfaite. D’abord, les deux masses ne sont pas tout à fait les mêmes, les deux particules se distinguent par un petit décalage de ∆m = m1 − m2 3.5 × 10−6 eV (8.59) Cette différence en masse produit des oscillation particules-antiparticules dans le temps. Imaginez vous un mésons K1 au repos dans le vide. Sa fonction d’onde est ΦK1 (t) = ΦK1 (0)eim1 t e−Γ1 t/2 (8.60) avec m1 et Γ1 la masse et la largeur du K1 . La densité de probabilité de trouver un K1 au temps t est Φ∗K1 (t)ΦK1 (t) = |ΦK1 (0)|2 e−Γ1 t (8.61) et de même pour un K2 , avec m2 et Γ2 . 17. http://pdg.web.cern.ch/pdg/1999/s012.pdf et http://pdg.web.cern.ch/pdg/1999/s013.pdf CHAPITRE 8. INTERACTIONS FAIBLES 94 Comme les interactions fortes conservent les saveurs, y inclus l’étrangeté, un état produit par eux sera un état avec étrangeté définie, comme K0 ou K̄0 . Si l’on produit, par exemple, un K0 à t = 0, on aura un mélange de K1 et de K2 avec 1 ΦK1 (0) = ΦK2 (0) = √ 2 (8.62) A un temps t plus tard on trouvera Γ1 +Γ2 1 −Γ1 t = e + e−Γ2 t + 2e− 2 cos ∆mt 4 Γ1 +Γ2 1 ∗ e−Γ1 t + e−Γ2 t − 2e− 2 cos ∆mt ΦK̄0 (t)ΦK̄0 (t) = 4 Φ∗K0 (t)ΦK0 (t) (8.63) (8.64) Si l’on mesure alors l’étrangeté de l’état en fonction du temps (par encore une interaction forte, par exemple), on trouve qu’elle oscille entre K0 et K̄0 avec une fréquence ∆m. Jusqu’ici la symétrie combinée CP est encore respectée. Mais on trouve en effet que la particule de long durée de vie, K0L K1 à une faible probabilité de se désintégrer en π + π − , état avec la mauvaise valeur propre de CP. On doit alors admettre que K0L K2 contient une faible amplitude de K1 aussi: 1 (ΦK2 + ΦK1 ) ΦKL = 1 + ||2 (8.65) Le coefficient || 2.3 × 10−3 est petit mais non zéro. Par conséquent, les interactions faibles chargées violent aussi la symétrie CP, mais seulement un petit peu. Une phase complexe dans la matrice CKM permet d’introduire cette petite asymétrie dans le mélange des états qui interviennent dans les interactions faibles. On trouve un angle de phase Φ tan−1 ∆mτS 45◦ . Ceci décrit le phénomène en utilisant la matrice CKM, mais ne l’explique pas. La violation de CP dans les interactions faibles est le seul effet connu qui distingue la matière de l’anti-matière. La violation de CP est un sujet de recherche très actuel, dans le secteur des kaons aussi bien que dans les désintégrations du B0 . 8.7 Oscillations de neutrinos Un phénomène analogue vient d’être découvert dans la famille des neutrinos. Des oscillations dans le vide entre neutrinos peuvent se produire si les neutrinos ont une masse non-zéro et si cette masse varie avec les générations. Considérons deux saveurs de neutrinos, νe et νµ par exemple, qui participent aux interactions faibles, et deux états propres de l’opérateur de masse – deux vraies particules – ν1 et ν2 avec masses m1 et m2 . Les relations entre les deux sont νe νµ = cos θ12 sin θ12 − sin θ12 cos θ12 (ν1 ν2 ) (8.66) Les deux états ν1 et ν2 propagent, dans la direction z par exemple, avec leurs fonctions d’onde ψi (t) = ψi (0)e−i(Ei t−pz) ψ1 (0)e −im2 z i 2E (8.67) (8.68) 8.7. OSCILLATIONS DE NEUTRINOS 95 où la deuxième équation est valable dans l’approximation ultra-rélativiste E = p + m2 /2E et t = z. Considérons alors un faisceau de νµ = −ν1 sin θ12 + ν2 cos θ12 à t = 0, par une désintégration de π + → µ+ νµ , par exemple. A un temps t donné, donc à une distance z de son origine, ce faisceau sera composé comme ψ(z) = −ψ1 (0) sin θ12 e 1m2 1z 2E + ψ2 (0) cos θ12 e 1m2 2z 2E (8.69) La probabilité de trouver un νe = ν1 cos θ12 + ν2 sin θ12 dans ce faisceau sera alors Pνµ →νe (z) = 1m2 1z cos θ12 sin θ12 e 2E −e 1.27δm2 z E = sin2 2θ12 sin2 1m2 2z 2E (8.70) (8.71) où le facteur 1.27 tient compte des constantes ainsi que de la conversion des unités ainsi que l’on peut mettre δm2 = m21 − m22 et E en GeV et z en km. Les deux facteurs de l’équation correspondent à l’amplitude et at la phase d’une oscillation. En choisissant une distance z qui est du même ordre de grandeur que δm2 /4E on peut alors faire disparaı̂tre une partie des νµ et les convertir en νe . Il est évident par l’unitarité de l’opération que Pνµ →νµ = 1 − Pνµ →νe . Une telle disparition de νµ a récemment été observée 18 . Les rayons cosmiques incident sur l’atmosphère de la Terre sont pour la plupart des protons. La gerbe hadronique qu’ils causent dans l’atmosphère sont dominés par des pions. En se désintégrant, ces pions produisent des neutrinos π + → µ+ νµ ; µ+ → e+ νe ν̄µ (8.72) π − → µ− ν̄µ ; µ− → e− ν̄e νµ Il devait y avoir, par conséquent, deux fois plus de νµ et ν̄µ dans ces gerbes que de νe et ν̄e . Si, par contre, les neutrinos subissent des oscillation, le rapport des deux générations de neutrinos devait varier avec la distance. Heureusement, la terre elle-même nous donne les moyens de faire varier la distance entre source et cible sans bouger l’expérience. Les neutrinos venant des antipodes parcourent une distance plus grande par le diamètre de la terre que ceux venant du zénith. Comme le flux primaire de protons cosmiques est homogène et isotrope, et comme les neutrinos de basse énergie n’interagissent pratiquement pas avec la matière terrestre, toute variation de rapport entre νµ et νe avec l’angle vis-à-vis le zénith indique des oscillations. Le flux des neutrinos est mesuré et leur saveur identifiée en mesurant le taux des réactions νµ N → µ− hadrons νe N → e− hadrons (8.73) (8.74) ou N dénote génériquement protons et neutrons. Avec une section efficace connue, le taux de réaction est proportionnel au flux incident de neutrinos. On trouve expérimentalement que le flux observé est compatible avec une probabilité de survie qui est Pνµ →νµ 1.27δm223 z = 1 − A23 sin E 2 (8.75) A23 = 10.0 0.2 (8.76) avec une amplitude 18. Super-Kamiokande Coll., Y Fukada et al., Evidence for oscillation of atmospheric neutrinos, Phys. Rev. Lett. 81 (1998) 1562. CHAPITRE 8. INTERACTIONS FAIBLES 96 et donc un angle θ23 de 45◦ ± 13◦ . La différence des carrés de masse est de l’ordre de 3 × 10−3 eV2 et donc extrêmement petit. Comme les indices l’indiquent, il est considéré plus probable que ces oscillations des neutrinos atmosphériques se passent entre la deuxième et la troisième génération, c’est à dire entre νµ et ντ . En général, la relation entre les états participants aux interactions faibles leptoniques, νe , νµ et ντ , et les états propres de l’opérateur de masse, ν1 , ν2 et ν3 , est décrit par une matrice unitaire de 3 × 3 éléments, analogue à la matrice de Cabbibo-Kobayashi-Maskawa pour les courrants hadroniques. Pour les leptons, on l’apelle la matrice de maki-Nakagawa-Sakata. 8.8 Couplages entre bosons électro-faibles On a constaté que les bosons vectoriels porteurs de forces électro-faibles portent eux-mêmes les charges électro-faibles; les W± ont une charge électrique, les W± et le Z ont un isospin faible. Par conséquent il existe des vertex d’interaction entre ces bosons. Les plus importants sont montrés dans la Figure 8.17. W+ γ W+ Z W− W− Fig. 8.17 – Vertex pour les interaction entre les boson électro-faibles. Les bosons chargés peuvent alors être produit en l’annihilation électron-positron, par la réaction e+ e− → W+ W− . Les diagrammes de Feynman de première ordre sont montrés dans la Figure 8.18. L’équilibre et l’interférence entre les trois contributions est indispensable pour le bon fonctionnement de la théorie. Les processus son individuellement divergeants, seule leur somme (au niveau des amplitudes) est finie. Le graphe avec l’échange d’un νe virtuel, par exemple, donne à lui seul une section efficace σν = πα2 s 4 96 sin4 θW MW (8.77) dans la limite s m2W asymptotique. Cette section efficace croit avec ∼ s et éventuellement viole la limite d’unitarité. En prenant, par contre, les trois processus ensemble, avec les couplages requis par la condition d’unification, on obtient σtot = s πα2 s 1 log 2 4 Mw 2 sin θW s (8.78) dans la même limite s m2W . Cette compensation nécessite l’existence des couplages γW+ W− et ZW+ W− , avec leurs couplages exactement comme prévus. Exemple 24: Annihilation électron-positron en paires de W 8.8. COUPLAGES ENTRE BOSONS ÉLECTRO-FAIBLES e+ − e+ W+ @ @ R γ/Z @ @ e W - 97 W+ νe - e− − W− Fig. 8.18 – Processus élémentaires contribuant à la réaction e+ e− → W+ W− . Les données pour la section efficace de la réaction e+ e− → W+ W− au LEP soutiennent l’hypothèse que la compensation des processus électro-faibles a en effet lieu. Le Figure 8.19 montre les mesures au LEP comparées à la théorie complète et aux contributions des différents processus. ⎯ σ(e+e−→W+W−(γ)) [pb] √s ≥ 189 GeV: preliminary L3 20 10 Data Standard Model no ZWW vertex only νe exchange 0 160 170 ⎯ 180 190 200 √s [GeV] Fig. 8.19 – Section efficace pour la réaction e+ e− → W+ W− au LEP, comparée à la théorie complète et ses sous-processus. L’inspection détaillée du processus montre en effet que le W a exactement les propriétés que l’on attend d’un boson vectoriel ponctuel. Sa charge est ±e, son moment magnétique (dipolaire) est e µW = (8.79) MW CHAPITRE 8. INTERACTIONS FAIBLES 98 et son moment électrique quadrupolaire est QW = − e 2 MW (8.80) Les valeurs trouvés par les expériences sont compatibles avec ces valeurs et ne permettent pas des déviations au delà des erreurs de mesure, qui sont de l’ordre de quelques pourcents seulement. Avec les couplages entre les bosons faibles, une dépendance caractéristique des constantes de couplages faibles de la distance est prédite. La Figure 8.20 montre l’évolution 19 des trois constantes de couplage 5 g 2 3 4π g2 = 4π g2 = s 4π α1 = (8.81) α2 (8.82) α3 (8.83) construits en suivant le modèle de la constante de structure fine, pour les interactions faibles neutres, chargées et l’interaction forte. Les trois extrapolations se croisent à une énergie qui est de l’ordre de 1014 GeV, où tous les interactions atteignent la même puissance. A cette énergie, une grande unification qui réunit toutes les forces dans une seule est donc concevable. Fig. 8.20 – Evolution des constantes de couplage pour les interactions électro-faibles et fortes avec l’énergie. 19. U. Amaldi et al., Phys. Rev. D36 (1987) 1385. 99 Chapitre 9 Particules et cosmologie Depuis quelques décennies, les liens entre la cosmologie – comme théorie physique de l’univers – l’astrophysique et la physique des particules – comme disciplines expérimentales – deviennent de plus en plus évidents. Le but ambitieux d’une synergie entre ces disciplines serait de construire un modèle standard de l’univers, couvrant de son début jusqu’à sa fin, à partir uniquement des mécanismes microscopiques. Dans cette perspective, la cosmologie deviendra une branche appliquée de la physique des particules. Au moins pour le moment et tant qu’il manque un bon nombre d’ingrédients dans un tel modèle, les rôles sont plutôt inversés: la cosmologie sert à indiquer les défauts et omissions du modèle standard de la physique des particules et de leurs interactions. Ceux-ci sont à rechercher en utilisant les observations en astrophysique ainsi que celles réalisées aux accélérateurs. Un des plus intéressants aspects de cette convergence des disciplines vient du fait qu’astrophysique et cosmologie font intervenir la gravitation, d’habitude négligée en physique des particules. Les observations indiquent que notre univers a été crée il y a quelques dizaines de milliards d’années dans un Big Bang, et a traversé une période extrêmement chaude après. Il s’est ensuite refroidi par expansion jusqu’à sa température actuelle qui est de 2.7 K. Les traits du modèle standard cosmologique comme il se présente aujourd’hui sont basés principalement sur les observations suivantes: – le décalage vers le rouge des spectres de ligne provenant de galaxies lointaines, dont le systématique amène à la loi de Hubble; – les abondances des éléments légers dans les rayons cosmiques; – la radiation micro-ondes cosmique qui correspond à celle d’un corps noir; – la distribution des structures à grande échelle (galaxies, amas, etc.) et sa relation avec les anisotropies de la radiation micro-ondes. L’introduction élémentaire présentée ici suivra l’approche de Perkins 1 . 9.1 La loi de Hubble Vers la fin des années 20, Hubble observa que les spectres de lignes des galaxies lointaines sont décalés vers le rouge. Ceci à cause de l’effet Doppler associé à leur vitesse v de régression. La longueur d’onde λ observé sur la Terre est décalée par rapport à celle, λ, dans le système 1. D.H. Perkins, Introduction to High Energy Physics, 4th edition, Cambridge University Press, 2000, chap. 10 CHAPITRE 9. PARTICULES ET COSMOLOGIE 100 du repos de l’émetteur: λ =λ 1+v ≡ λ(1 + z) 1−v (9.1) avec le paramètre de décalage z = ∆λ/λ. En utilisant ces décalages pour mesurer la vitesse, et la magnitude comme estimateur de la distance r, on observe empiriquement la loi de Hubble (voir Fig. 9.1) v = Hr (9.2) Les vitesses de régression sont proportionnelles à la distance, avec un coefficient appelé la constante de Hubble, H. Cette loi correspond à une expansion uniforme de toutes les distances, y inclus toutes les longueurs d’onde, par un facteur R(t) r(t) = r0 R(t) (9.3) où r0 correspond à l’échelle actuelle, à t = t0 . Sans perte de généralité on peut normaliser toute distance à r0 ≡ 1, R devient alors une échelle générique. La constante de Hubble est donnée par (9.4) v(t) = Ṙ(t)r0 Ṙ H = R (9.5) Contrairement à son nom, H n’est pas constante à cause de l’effet freinant de la gravité sur l’expansion de l’univers. Aujourd’hui on trouve H0 = 100h0 km 1 s MPc (9.6) avec h0 = 0.7 ± 0.1. 9.2 L’équation de Friedmann L’évolution de l’univers suit une solution des équations d’Einstein décrivant la relativité générale. Pour une distribution homogène et isotropique de la matière, elle est décrite par l’équation de Friedmann 2 8πGN ρ Λ Ṙ K 2 H = = − 2+ (9.7) R 3 R 3 avec la constante de Newton GN , la densité de masse (ou énergie) ρ et les constantes K et Λ qui déterminent l’évolution asymptotique. La constante cosmologique Λ est petite mais ne vaut probablement pas zéro 2 . Ce terme correspond à une énergie associée au vide (dark energy). On négligera ce terme dans la discussion qui suit. Le raisonnement suivant peut servir à comprendre l’équation 9.7. Une masse ponctuelle à une (grande) distance R de la Terre sentira l’attraction par une masse M = 4πR3 ρ/3. Son équation de mouvement est par conséquent mR̈ = −GN Mm R2 (9.8) 2. A.G. Riess et al., The Farthest Known Supernova: Support for an Accelerating Universe and a Glimps of the Epoch of Deceleration, astro-ph/0104445 (2001), to appear in Astroph. J. 9.2. L’ÉQUATION DE FRIEDMANN 101 Fig. 9.1 – Décalage vers le rouge (échelle à gauche) ou vitesse de régression (échelle à droite) en fonction de la magnitude, c’est à dire de la distance. L’intégration donne 1 1 mM mṘ2 − GN = const = − Km (9.9) 2 R 2 où l’on choisit la constante d’intégration de façon à obtenir l’Equation 9.7 pour Λ = 0. Les termes à gauche sont l’énergie cinétique et potentielle, la constante du mouvement correspond alors à l’énergie totale. En ce qui concerne l’évolution asymptotique on peut distinguer trois cas: – K = −1: correspond à une énergie totale positive. Ce cas décrit un univers dit ouvert qui s’étend jusqu’à l’infini, avec Ṙ → 1 pour grands R. Dans ce cas le terme dit de courbure, −K/R2 est positif. – K = +1: correspond à une énergie totale négative, un univers clos avec courbure négative qui arrive à un rayon maximum et se rétrécit ensuite. – K = 0: est le cas spécial l’un univers plat, où les énergies cinétiques et potentielles sont égales et l’énergie totale et la courbure valent zéro. La vitesse d’expansion tend vers Ṙ → 0 à long terme. Ces trois principales évolutions de l’échelle en fonction du temps sont esquissées dans la figure 9.2. En intégrant l’équation de Friedmann pour le cas spécial K = Λ = 0 et dans l’approximation non-relativiste, on obtient 1 9GN M 3 2 R(t) = t3 (9.10) 2 et pour la constante de Hubble actuelle H0−1 = 3t0 R = 2 Ṙ (9.11) CHAPITRE 9. PARTICULES ET COSMOLOGIE 102 Fig. 9.2 – Paramètre d’échelle en fonction du temps pour différentes valeurs de la courbure K. Par conséquent, l’âge t0 de l’univers serait t0 = √ 1 2 6.6 × 109 a = H0−1 = 6πGN ρ0 3 h0 (9.12) ce qui correspond à t0 = (9.4 ± 1.3) Ga. Ce résultat n’est pas très différent, sinon légèrement au dessous de l’âge des objets les plus âgés que l’on connaı̂t dans l’univers; celui-ci varie entre 10 et 14 Ga. Evidemment K = −1 et/ou une valeur non-zéro de la constante cosmologique Λ fait croı̂tre la prédiction de t0 par l’équation de Friedmann. Toujours pour K = Λ = 0, on peut intégrer l’équation 9.10 une deuxième fois, pour obtenir un densité critique ρc qui va tout juste clore l’univers ρc = 3H02 kg = 1.9 × 10−26 h20 3 8πGN m (9.13) Le rapport entre la densité actuelle de l’univers, ρ, et cette densité critique est appelé le paramètre de clôture k ρ = 1+ 2 2 (9.14) Ω= ρc H R On mesure actuellement les contributions suivantes à Ω: – La matière visible, donc lumineuse, concentrée dans les étoiles, gaz et poussières donne kg ρlum 2 × 10−29 3 m Ωlum 0.003h−2 0 (9.15) (9.16) – Le nombre total de baryons, visibles ou invisibles, déduit du modèle de baryosynthèse primordiale (voir Section 9.5) donne ρB (3 ± 1.5) × 10−28 ΩB (0.01 ÷ 0.03)h−2 0 kg m3 (9.17) (9.18) 9.3. RADIATION MICRO-ONDE COSMIQUE 103 – La densité totale de la matière, déduite du potentiel gravitationnel mesurable par la dynamique du mouvement des étoiles dans les galaxies est beaucoup plus grand que les deux précédents: ρm ≥ 5 × 10−27 Ωm ≥ 0.3 kg m3 (9.19) (9.20) La plupart de la matière est donc ni visible ni baryonique. On l’appelle matière noire (dark matter). On peut conclure de ces mesures que la majorité de la matière baryonique est non-lumineuse, et que la majorité de la matière tout court est non-baryonique. Cela veut dire qu’il doit y avoir des objets baryoniques noirs, de la matière stellaire non rayonnante. En effet, de tels objets ont été observés, par exemple par leur effet d’aberration gravitationnel. En plus, l’énergie de l’univers est dominée par une composante inconnue qui est ni stellaire ni même baryonique. Cette composante inconnue éveille beaucoup de spéculation et fait l’objet d’un important effort expérimental. Un premier inventaire du contenu de l’univers aboutit à une densité remarquablement proche à la densité critique, qui correspond à K = Λ = 0 et est la seule densité à donner Ω = 1 ∀t. Le fait que l’univers apparaisse approximativement plat encore aujourd’hui pose en effet un formidable problème de conditions initiales. Pour y arriver il faut qu’initialement Ω égalait 1 à une précision vertigineuse de δΩ 10−50 . Il existe évidemment un mécanisme qui supprime le terme de courbure dans Equ. 9.14. Le concept de la période d’inflation peut résoudre ce problème, ainsi que celui posé par l’étonnante homogénéité et isotropie du bruit de fond microonde. 9.3 Radiation micro-onde cosmique Si la matière dans l’univers est conservée sous forme de particules stables, sa densité varie comme ρm ∼ R−3 . Si la radiation dans l’univers est en équilibre thermique, sa densité varie comme ρr ∼ T 4 , selon la loi de Stefan-Bolzmann. Comme une échelle absolue de la longueur n’existe pas, tous les longueurs d’onde doivent être proportionnelles à R. L’énergie moyenne des photons hν ∼ kT doit être proportionelle à R−1 . Bien que le nombre de photons varie comme R−3 , leur densité d’énergie varie comme R−4 . Par conséquent on constate que tôt dans l’histoire de l’univers, pour petites valeurs de R, la radiation a dominé sur la matière. Par conséquent, l’équation de Friedmann durant cette période devient H 2 Ṙ2 et, avec ρr ∼ R−4 , 2 8πGN ρr Ṙ = = R 3 8πGN 2 R = 3 (9.21) (9.22) 8πGN ρ̇r 4Ṙ = −4 ρr = ρr R 3 (9.23) CHAPITRE 9. PARTICULES ET COSMOLOGIE 104 Pour un gaz de photons on obtient en termes d’énergie 45 kT = 32π 3 GN 1 4 1 t 1 2 1MeV √ t (9.24) avec t en secondes. Pour la température T on a T 1010 K √ t (9.25) Par conséquent, l’univers a été extrêmement chaud à son début; on parle d’un hot Big Bang. La température du gaz de photons dans l’univers actuel, i.e. de la radiation micro-onde découverte par Penzias et Wilson en 1965 3 , est T = (2.73 ± 0.01) K (9.26) Le spectre de ce gaz suit exactement celui émis d’un corps noir N(p)dp = p2 dp π 2 (e−p/kT − 1) (9.27) comme le montrent les résultats du satellite COBE 4 , voir Figure 9.3. Fig. 9.3 – Distribution spectrale du bruit de fond micro-onde mesuré par le satellite COBE. La courbe montre le spectre de Planck, émis par un corps noir idéal. L’homogénéité et l’isotropie de cette radiation est remarquable. Les températures de la radiation micro-onde qui nous parviennent de directions opposées du ciel sont égales à ∆T /T 3. A.A. Penzias and R.W. Wilson, Astrophys. J. 142 (1965) 419 4. D.J. Fixsen et al., Astrophys. J. 486 (1996) 623. 9.4. PÉRIODES DE RADIATION ET DE MATIÈRE 105 10−4 près. Ceci pose un problème de causalité. Ces régions n’ont jamais été en contact thermique si l’univers s’était toujours étendu avec une vitesse inférieure à celle de la lumière. Il nous faut par conséquent une période ou l’univers s’est étendu plus vite que cela; on l’appelle la période d’inflation 5 . Pendant cette période, moyennant un champ spécialement conçu à ce propos, le facteur d’échelle aurait varié exponentiellement. Ceci ne constitue pas une violation des axiomes de la relativité, parce que c’est l’espace-temps lui même qui s’étend; il n’y a donc pas transport superluminal d’information. Néanmoins cette expansion exponentielle permettrait un contact thermique initial de régions aujourd’hui très éloignées. 9.4 Périodes de radiation et de matière A très hautes températures, kT M, radiation et particules jusqu’à une certaine masse M sont en équilibre thermique. Ceci veut dire que le temps entre deux collisions, l’inverse du taux W de collisions, est court par rapport à l’âge t de l’univers, W t−1 . Le taux de collision dépend de la section efficace σ et la vitesse v des particules W = Nvσ (9.28) La moyenne est prise par rapport à la distribution des vitesses. Il y a deux raisons pourquoi l’équilibre peut être rompu: le croisement d’un seuil ou un taux d’interaction insuffisant. Prenons l’équilibre entre photons et protons comme exemple de l’intervention d’un seuil. La réaction γγ ↔ pp̄ reste réversible tant que la température moyenne kT Mp . Jusqu’au seuil, les protons et anti-protons perdus par annihilation seront reproduits par la réaction. Grâce aux queues de la distribution d’énergie des photons, le seuil n’est toutefois pas très rigide. La réaction est encore partiellement soutenue au-dessous du seuil. Seulement pour une température moyenne kT Mp , tous les protons s’annihilent. Une réaction à bas seuil est e+ e− ↔ ν ν̄. Néanmoins, comme la section efficace des neutrinos est proportionelle à l’énergie, au dessous de kT 3 MeV, le taux d’annihilation neutrino-antineutrino devient insuffisant. Les neutrinos se découplent du reste de la matière et évoluent indépendamment. Pour quelques 105 ans après le Big Bang, la matière sous forme d’hydrogène et la radiation étaient tenues en équilibre par le processus e− p ↔ γH. Le seuil de cette réaction est 13.6 MeV, le potentiel d’ionisation de l’hydrogène. Par conséquent, à une température bien plus petite, en effet à kT = 0.3 eV, la population de la queue de la distribution en énergie devient insuffisant pour maintenir l’équilibre. A cette température, la matière devient transparente à la radiation. L’univers a franchi cette température vers t 3 × 105 a. Un peu plus tard, vers t 106 a, la densité en énergie de la matière, ∼ T −3 , a excédé celle de la radiation, ∼ T −4 . Depuis ce temps là, la matière domine l’énergie de l’univers et son expansion. La variation de kT avec le temps est esquissé dans la Figure 9.4. 9.5 Nucléosynthèse primordiale A peu près une seconde après le Big Bang, tous les particules instables s’étaient déjà désintégrées et seulement les électrons, neutrinos, photons, neutrons et protons peuplaient 5. A.H. Guth, Phys. Rev. D23 (1981) 347 106 CHAPITRE 9. PARTICULES ET COSMOLOGIE Fig. 9.4 – Evolution de la température de l’univers avec le temps dans le modèle du Big Bang chaud Les périodes mentionnées dans le texte sont indiquées. 9.5. NUCLÉOSYNTHÈSE PRIMORDIALE 107 l’univers. Leurs nombres relatifs étaient déterminés par l’équilibre des réactions de l’interaction faible: νe n ↔ e− p ν̄e p ↔ e+ n n → p e− ν̄e (9.29) (9.30) (9.31) En cours de l’expansion, kT devient plus petit que la masse du nucléon, MN , et ceux-ci deviennent non-relativistes, E MN2 + p2 /2MN . Leurs nombres relatifs sont donnés par les facteurs de Boltzmann Q Nn = e− kT (9.32) Np avec Q = Mn − Mp = 1.3 MeV. A températures suffisamment basses, kT 0.87 MeV, le taux inverse des réactions qui maintiennent l’équilibre entre neutrons et protons sera plus grand que l’âge de l’univers. En ce moment, p et n tombent hors équilibre thermique et découplent. Leur nombre en ce moment était Q Nn (0) = e− kT = 0.23 (9.33) Np (0) Plus tard, les neutrons libres se désintègrent. A un temps t il en reste Nn (t) = Nn (0)e−t/τn (9.34) et le nombre de protons augmente à Np (t) = Np (0) + Nn (0) 1 − e−t/τn (9.35) avec le temps de vie du neutron, τn = 896 ± 10 s. Le rapport des deux nucléons évolue comme 0.23e−t/τn Nn (t) = Np (t) 1.23 − 0.23e−t/τn (9.36) Si rien de plus se produirait, les neutrons disparaı̂tront et on aura un univers peuplé uniquement de protons, électrons et neutrinos. Mais protons et neutrons peuvent former des noyaux stables. La nucléosynthèse commence avec la formation de deutérons n p ↔ γ 2H (9.37) L’énergie de liaison est très grande, Eγ > 2.2 MeV, ainsi que la section efficace de ce processus, σ 0.1mb. Par conséquent, et en contraste avec les processus faibles, celui-ci reste longtemps en équilibre thermique. Le nombre énorme de photons maintient la photodesintégration du deutéron jusqu’à une température de kT 0.05 MeV. Ensuite, 2 H dévient stable et la synthèse d’hélium commence: H n → 3H γ 3 H p → 4 He γ 2 H p → 3 He γ 3 He p → 4 He γ 2 (9.38) (9.39) A ce moment, à kT 0.05 MeV correspondant à t 400s, le rapport de neutrons à protons selon Equ. 9.36 était Nn (t) = 0.14 (9.40) r= Np (t) CHAPITRE 9. PARTICULES ET COSMOLOGIE 108 Comme il faut deux protons et deux neutrons pour synthétiser en noyau de 4 He, le rapport entre les masses totales d’hélium et de protons sera (MHe 4Mp ) Y ≡ 4NHe 2r MHe = 0.25 = = Mp 4NHe + Np 1+r (9.41) Expérimentalement on trouve en effet dans le système solaire et au niveau galactique Y = 0.24 ± 0.1. Cet accord entre prédiction et observation est un des grands triomphes du modèle du Big Bang. De même les abondances de 2 H, 3 He et 7 Li sont prédites correctement; elles excèdent d’une manière significative celles provenant de la synthèse à l’intérieur des étoiles. Le taux total des noyaux correspond à une densité baryonique totale de ΩB = (3.0 ± 1.5) × 10−28 kg m3 (9.42) ou à une densité en nombre de NB = (0.18 ± 0.09)/m3 . On comparant à la densité de photons dans le bruit de fond micro-onde, on trouve NB (4 ± 2) × 10−10 Nγ (9.43) Les nombres de baryons et photons étaient bien sûr comparables lorsque l’équilibre thermique entre radiation et matière était encore intact. La vaste majorité des baryons a depuis disparu, laissant les baryons minoritaire par un facteur d’un sur un milliard. A l’époque de l’équilibre, la réaction pp̄ ↔ γγ garantissait aussi un équilibre entre matière et anti-matière. On s’attendrait par conséquent aujourd’hui soit à une absence quasi totale de baryons, soit à un taux très faible mais égal de matière et anti-matière, NB /Nγ = NB /Nγ 10−18 . Ceci n’est pas le cas. On observe un rapport plus grand, correspondant à l’Equation 9.43, pour la matière. Mais dans les expériences comme AMS conçues pour la recherche d’anti-matière dans les rayons cosmiques n’ont pas observés un seul anti-noyau dans plusieurs millions de noyaux enregistrés, voir Figure 9.5 6 . Cela démontre que le système solaire, la voie lactée et tout le super-amas dont elle fait partie contiennent uniquement de la matière et que l’antimatière en est entièrement absente. Il y a deux possibilités pour réconcilier cette observation avec les principes d’un Big Bang symétrique. Soit qu’un mécanisme encore inconnu a discriminé matière et anti-matière dans des régions très éloignées de l’univers. Dans ce cas, une prolongation de la recherche d’antinoyaux jusqu’à l’anti-Lithium révélera éventuellement la présence d’anti-matière primordiale extra-galactique. Si l’on trouvait des anti-noyaux encore plus lourds, comme par exemple l’anticarbone, l’existence d’anti-étoiles serait mise en évidence. Si des expériences telles qu’AMS arrivent à trouver de l’anti-matière extra-galactique, un mécanisme de ségrégation doit par conséquent être trouvé. La deuxième possibilité est que l’anti-matière a carrément disparu pendant l’histoire de l’univers. En 1967, Sakharov 7 a formulé les conditions nécessaires pour une telle disparition: – Une interaction qui ne conserve pas le nombre baryonique doit exister. – Une violation des symétries C et CP distingue d’une manière non-ambigüe entre matière et anti-matière. 6. AMS Coll., J. Alcaraz et al., Phys. Lett. B461 (1999) 387. 7. A.D. Sakharov, Pisma Zh. Eksp. Teor. Fiz. 5 (1967) 32 9.5. NUCLÉOSYNTHÈSE PRIMORDIALE 109 Antihelium/Helium Upper Limit – Une période hors d’équilibre permet que l’interaction qui ne conserve pas le nombre baryonique fasse disparaı̂tre l’anti-matière sans qu’elle soit recréée par la réaction inverse. Parmi ces trois conditions, seule la violation de C et CP à été observé expérimentalement. Si des expérience comme AMS arrivent cependant à exclure l’existence de domaines lointains d’anti-matière, les phénomènes responsables pour les deux autres conditions – concevables théoriquement mais sans support expérimental – restent à être trouvés. 10-4 AMS STS - 91 |Z| = 2 Rmin=1.6 GV 10-5 Excluded 10-6 3 10 70 GV Rmax -3 Antimatter/Matter Upper Limit 95% CL Z=2 10 Published Conservative Limits Smoot et al. (1975) Golden et al. (1997) -4 10 Buffington et al. (1981) -5 10 BESS 1993-1995 AMS 1998 -6 10 1 10 10 Rigidity (GV) Fig. 9.5 – A gauche: Schématique du spectromètre magnétique AMS qui sera installé sur la station spatiale ISS en 2004; à droite: limites supérieures sur le rapport entre les flux d’antihélium et de hélium dérivés des données d’un premier vol du détecteur de 10 jours sur la navette spatiale en 1998, comparé aux résultats d’expériences sur des ballons. Les deux explications alternatives de l’asymétrie apparente entre matière et anti-matière réclament de nouveaux phénomènes, au delà de ceux contenus dans le modèle standard de la physique des particules et établis par l’expérimentation aux accélérateurs. Dans ce sens là, astrophysique et cosmologie mettent aujourd’hui en défi la physique des particules, tant théorique qu’expérimentale. 2 110 CHAPITRE 9. PARTICULES ET COSMOLOGIE