Gravitation relativiste : une approche simple basée sur le critère de

publicité
Gravitation relativiste :
une approche simple
basée sur le critère de Schild
Jean-Pierre Chabert (Lambesc, mars 2008)
L'important n'est pas de convaincre, mais de donner à rééchir (Bernard Werber)
Table des matières
1 Avertissement
4
2 Introduction
4
3 Approche préliminaire
6
4 Ordres de grandeur
11
5 Le paradoxe de Schild
13
6 Ralentissement des horloges dans un champ gravitationnel
15
7 Contraction des règles dans un champ gravitationnel
16
8 Matrices de changement de potentiel
17
9 Evaluation des vitesses en fonction du potentiel
19
10 Evaluation des masses en fonction du potentiel
20
11 Mise au point
21
12 Eet Einstein
23
13 Newton, Einstein, et encore Einstein...
24
14 Métrique de l'espace-temps
27
15 Quelques conséquences
29
16 Métriques de Schwarzschild et de Ni
31
1
17 Le formalisme post-newtonien paramétrisé
35
18 Principes d'équivalence
36
19 Le pari d'Einstein
38
20 Equations des géodésiques en métrique de Ni
39
21 Version cartésienne des géodésiques
42
22 Tenseur de Ricci en métrique de Ni
46
23 Tenseur de Ricci en métrique de Schwarzschild
57
24 Courbure intrinsèque
61
25 Interprétation
62
26 Théorèmes d'unicité
66
27 Pseudo-accélération
66
28 Potentiel newtonien et relativité : le conit ?
67
29 Entraînement quadrivectoriel et immobilité gravitationnelle
71
30 L'hypothèse du champ tensoriel
73
31 Conservation de l'énergie-impulsion
74
32 Le graviton existe-t-il ?
75
33 Etude du système solaire : les bases
76
34 Aphélie et périhélie
77
35 Orbites circulaires
80
36 Vitesse de libération
82
37 Orbites elliptiques et lois de Kepler
87
38 Orbites paraboliques
92
39 Orbites hyperboliques
92
40 Précession du périhélie
93
41 Déexion de la lumière
94
2
42 Eet Shapiro
98
43 La "création d'espace"
103
44 Modèle newtonien des systèmes binaires
103
45 Modèle relativiste des systèmes binaires
110
46 Précession du périastre des pulsars binaires
112
47 Décalage gravitationnel des pulsars binaires
113
48 Eet Einstein à la surface des étoiles à neutrons
116
49 Eet Shapiro chez les pulsars binaires
118
50 Précession géodétique des pulsars binaires
121
51 Eet Nordtvedt
127
52 Les trous noirs en métrique de Ni
130
53 Les ondes gravitationnelles en métrique de Ni
140
54 La détection des ondes gravitationnelles
148
55 L'événement GW150914
153
56 Les ondes gravitationnelles dissipent-elles de l'énergie ?
156
57 L'hypothèse du transfert de moment cinétique
158
58 Qu'est-ce que l'eet Lense-Thirring ?
166
59 La matière noire existe-t-elle ?
168
60 La gravitation est-elle la clé de la cosmologie ?
170
61 Pourquoi l'univers est-il globalement plat ?
172
62 L'énergie sombre existe-t-elle ?
173
63 Pour terminer ...
184
64 Liens
184
3
1 Avertissement
Ce document fait partie d'un triptyque dont les deux autres volets sont :
Les vitesses en Relativité restreinte
Métriques de Schwarzschild et de Ni
2 Introduction
Après la publication de la théorie de la relativité restreinte par Albert Einstein, il est apparu de manière évidente que l'électromagnétisme de Maxwell
était parfaitement compatible avec cette nouvelle théorie ; mais la gravitation
de Newton ne l'était pas.
Einstein s'est alors xé un objectif très ambitieux : modier la théorie de
Newton pour la rendre compatible avec la relativité restreinte, tout en introduisant une vitesse limite des interactions.
La solution qu'il a proposée, en 1916, après une dizaine d'années de travail,
est la relativité générale.
Il a atteint ses objectifs : toutes les prédictions de la nouvelle théorie, dans
le système solaire, ont été conrmées, et l'étude des pulsars binaires a permis
de pousser la précision encore beaucoup plus loin : la déexion de la lumière
par le Soleil (le double de celle prévue par la théorie de Newton) est bien établie, la précession du périhélie (de Mercure d'abord, puis des autres planètes, et
des pulsars binaires) est maintenant bien comprise, l'eet Shapiro a été mesuré
avec une très grande précision (lors d'une occultation de Mercure par le Soleil,
puis par l'étude des pulsars binaires) ; le retard des horloges dans un champ
gravitationnel (eet Einstein) est pris en compte dans la technologie du GPS ;
l'"anomalie Pioneer", qui a longtemps posé problème, semble aujourd'hui résolue. Hors du système solaire, les mirages gravitationnels sont fréquemment
observés, les trous noirs sont traqués et des "candidats" de plus en plus nombreux ont été repérés (même si leur nature exacte soulève des questions), et
sont activement étudiés ; les ondes gravitationnelles n'avaient pas encore été détectées directement lorsque j'ai commencé à écrire ces lignes (en 2008), mais la
première observation vient d'être publiée en février 2016.
Cependant, beaucoup de physiciens estiment que la relativité générale n'est
pas une théorie dénitive. Ils font observer, bien sûr, que la célèbre équation
d'Einstein (ou équation des champs) n'a jamais été démontrée ; d'autre part,
quatre reproches principaux sont régulièrement formulés :
- les idées développées par Einstein sont incompatibles avec celles de la méca4
nique quantique : on estime souvent qu'à l'échelle des atomes et des particules
élémentaires, des modications seront nécessaires pour permettre à la relativité
générale de s'intégrer dans le contexte quantique ;
- l'apparition de singularités et d'innis intempestifs est souvent présentée comme
un défaut qu'il est urgent de corriger ;
- la nécessité de faire appel à des phénomènes tels que l'"ination" et l'"énergie
sombre" pour modéliser l'expansion de l'univers a marginalisé le rôle de la relativité générale en cosmologie ;
- enn, l'étude de la rotation des galaxies fait apparaître des phénomènes inattendus, qu'on n'arrive pas à expliquer dans le cadre de cette théorie, à moins
d'imaginer la présence d'une grande quantité de matière noire ; présence qui
n'est pas en accord avec certaines observations (en particulier avec la loi empirique de Tully-Fischer).
Pour ces raisons, de nombreuses théories concurrentes ont été développées.
Beaucoup d'entre elles ont été éliminées, parce-que leurs prédictions s'écartent
des observations ; d'autres sont encore en course.
Le but du présent travail était, à l'origine, d'élaborer une présentation simpliée et pédagogique de la relativité générale, basée sur des notions physiques
simples et concrètes (issues du "critère de Schild") et accessibles à tous.
Cependant, j'ai constaté très vite que les équations qui sortent spontanément de cette approche ne sont pas nécessairement équivalentes à celles de la
relativité générale ! Elles sont pourtant en parfait accord avec les observations,
dans le domaine des champs faibles : en eet, les applications au système solaire conduisent aux mêmes conclusions ; elles expliquent bien, comme nous le
verrons, le comportement des pulsars binaires. Mais dès qu'on est en présence
de champs forts (au voisinage des trous noirs par exemple), ces équations ne
conrment plus du tout celles de la relativité générale. Elles convergent davantage vers la seconde théorie de Ni (1972), que vers celle d'Einstein.
J'ai donc été conduit, par la force des choses, à redénir mon projet : plutôt
que de présenter la relativité générale d'Einstein comme la seule possible, j'ai
préféré adopter une position beaucoup plus ouverte. Je me suis même amusé,
chaque fois que j'ai été confronté à un choix, à privilégier la solution la moins orthodoxe. Cette attitude me semble la plus constructive : si, au bout du compte,
je suis amené à conclure que la relativité générale est la seule théorie de la gravitation qui soit viable, j'aurai la satisfaction d'avoir apporté des éléments pour
la renforcer. Mais je n'aurai pas fait un travail de propagande.
L'approche proposée ici ne constitue pas une nouvelle théorie de la gravitation, mais un raccourci permettant d'accéder très rapidement, par des considérations élémentaires et non conventionnelles, à une "gravitation relativiste
minimale". Ma ligne directrice sera l'économie des moyens. Le but est de mettre
à la portée du plus grand nombre des résultats réputés inabordables pour le
5
commun des mortels, en choisissant sur chaque sujet l'approche qui me semble
la plus naturelle et la plus instructive, pour que chacun puisse se faire une opinion par lui-même.
Comme on va le voir, des équations élémentaires basées sur un raisonnement simpliste permettent de retrouver sans diculté la plupart des résultats
attribués à la relativité générale, concernant aussi bien le système solaire que
les systèmes doubles, car les pulsars binaires permettent d'aller beaucoup plus
loin dans les tests gravitationnels. C'est principalement sur les trous noirs et
les ondes gravitationnelles que des interprétations divergentes vont apparaître,
deux sujets sur lesquels les astronomes apporteront sans doute dans un proche
avenir des éléments nouveaux.
En cours de route, chaque fois que nous aurons le choix entre deux directions
divergentes, nous marquerons le carrefour d'une pierre blanche pour y revenir
par la suite.
3 Approche préliminaire
Attention : cette approche préliminaire est à la fois essentielle (elle contient
les équations qui sont à la base de ce travail) et pleine de pièges : elle devra être
réinterprétée et corrigée à la lumière du critère de Schild, sans quoi elle nous
conduirait à des absurdités. On s'en rendra compte en lisant la section "Mise
au point".
A partir d'ici, on pourra imaginer un mobile ponctuel (une "planète") de
masse m, tournant autour d'un corps central immobile (le "Soleil"), également
ponctuel, de masse M ; on supposera m négligeable par rapport à M ; le mouvement se faisant dans un plan, on se limitera à deux dimensions spatiales
(auxquelles il faut ajouter, bien sûr, une dimension temporelle) : on travaillera
donc dans un espace-temps à trois dimensions. Le fait que le Soleil soit immobile
nous permettra de raisonner sur un champ gravitationnel statique, ce qui nous
dispensera, au moins dans un premier temps, de faire intervenir sa vitesse de
propagation.
Dans la théorie de Newton, trois formules jouent un rôle central : la première (appelée loi de la gravitation universelle) permet d'exprimer la force qui
s'exerce entre deux corps massifs, la seconde exprime la conservation de l'énergie,
la troisième la conservation du moment cinétique. Ces trois formules ne sont pas
indépendantes : historiquement, la seconde et la troisième ont été démontrées
à l'aide de la première, qui joue le rôle de pilier de la gravitation newtonienne.
Nous examinerons ses conséquences, pour voir si elles sont compatibles avec la
relativité restreinte.
6
Selon la loi de la gravitation universelle, la planète subit une force attractive
dirigée vers le Soleil, proportionnelle à m et à M, et inversement proportionnelle
au carré de la distance (ou du rayon vecteur) r :
GmM
~u,
F~ = −
r2
où G est la constante de la gravitation, et ~u un vecteur unitaire dirigé du Soleil
vers la planète.
Nous noterons ~v la vitesse, et w
~ la rapidité du mobile considéré (la planète).
Comme l'accélération ~Γ = ddtw~ s'obtient en divisant F~ par m, on peut écrire :
~
GM
~Γ = dw
= − 2 ~u.
dt
r
Il s'agit bien, ici, de ~Γ (~Γ =
dw
~
dt
) et non de ~γ (~γ =
d~
v
dt
)!
Si vous désirez plus d'informations sur la diérence entre vitesse et rapidité,
~
F
et sur l'origine de la formule ~Γ = ddtw~ = m
(c'est susamment important pour
mériter une étude approfondie), vous pouvez vous reporter à mon site sur la
relativité restreinte : Les vitesses en Relativité restreinte, et plus particulièrement à la n de la section intitulée "Quelques mots sur la mécanique relativiste".
Remarquons bien que l'introduction de la notion de rapidité n'est pas nécessaire à notre raisonnement : tous les calculs peuvent se faire avec des vitesses.
Mais les rapidités permettent de simplier ces calculs de manière appréciable,
à condition de ne pas être rebuté par les fonctions hyperboliques. Si
on préfère
v
les vitesses, on se rappellera que ch wc = p 1 v2 , que sh wc = p c v2 , et que
1−
v
c
=
sh w
c
ch w
c
=
th wc
.
c2
1−
c2
Rappelons brièvement quelques formules essentielles (en nous limitant à une
dimention spatiale) ; en relativité restreinte, on a (en notant m la masse d'un
mobile, m0 sa masse au repos, v sa vitesse dans un référentiel donné, w sa rapidité, p son impulsion, E son énergie) :

m = pm0 v2 = m0 ch wc ;


1− 2


c




v

p = m v = m0 c p c v2 = m0 c sh wc ;
1− 2

c





2

m c
w

 E = m c2 = p 0 v2 = m0 c2 ch c .
1−
c2
7
La force étant dénie, comme en mécanique classique, par : F =
F =
dp
dt
= m0 c
d
dt
sh wc = m0 c ch wc
dw
c dt
= m0 ch wc
dw
dt
=m
dp
dt
, on a :
dw
dt .
Plus généralement :
dw
~
d~
p
=m
.
F~ =
dt
dt
Si le vecteur w
~ fait un angle α avec ~u (vecteur unitaire dirigé du Soleil vers
la planète), on peut écrire (en notant w le module de w
~) :
dw
GM
= − 2 cos α.
dt
r
Toutes ces formules sont valables en relativité restreinte ; nous verrons un
peu plus loin comment elles s'adaptent au contexte gravitationnel.
Voici donc notre choix initial sur lequel s'appuie tout le travail qui va suivre :
nous resterons le plus près possible de la gravitation newtonienne, et nous conservons sa pierre angulaire (la loi de la gravitation universelle), à savoir une force
d'attraction proportionnelle à la masse de chacun des deux corps, et inversement
proportionnelle au carré de leur distance. Mais toutes les conséquences de cette
loi (à commencer par la conservation de l'énergie) seront reformulées dans un
cadre relativiste.
Dans la théorie de Newton, l'énergie potentielle (gravitationnelle) d'un mo~ (où Ep désigne
bile est liée au travail de la force gravitationnelle : dEp = −F~ .dl
~
l'énergie potentielle, et dl un déplacement élémentaire). Le potentiel gravitationnel s'obtient en divisant l'énergie gravitationnelle par la masse du mobile,
et l'accélération s'obtient en divisant la force par cette même masse ; donc, en
divisant les deux membres de l'égalité précédente par m, nous obtenons :
~
dΦ = −~Γ.dl.
On pourrait donc dire que le potentiel est lié au "travail" du vecteur ~Γ. Comme
~Γ = − GM
u, on a :
r2 ~
~ =
dΦ = −~Γ.dl
GM ~
GM
~u.dl = 2 .dr = −GM.d
r2
r
En intégrant, nous obtenons les formules classiques :
Φ=−
GM
GM m
, et Ep = mΦ = −
.
r
r
8
1
.
r
Remarquons bien le double rôle du vecteur ~Γ = − GM
u:
r2 ~
dw
~
~
- d'une part, il modie la rapidité du mobile : Γ = dt ;
~
- d'autre part il modie le potentiel gravitationnel : dΦ = −~Γ.dl.
Pour Newton, ces deux rôles n'en font qu'un : ce sont deux aspects d'un même
phénomène, lié à la notion de force, qui a une place centrale dans sa théorie.
Mais nous serons amenés (disons-le tout de suite) à dissocier ces deux rôles.
Nous en reparlerons.
La conservation de l'énergie, toujours dans la théorie de Newton, s'écrit :
E=
GmM
1
GM
1
1
mv 2 −
= mv 2 − m
= mv 2 + mΦ
2
r
2
r
2
où 12 mv 2 représente l'énergie cinétique de la planète, − GmM
son énergie potenr
GM
tielle, et Φ = − r le potentiel gravitationnel.
Cette formule doit être profondément remaniée pour être cohérente avec la
relativité restreinte. Nous allons reprendre sa démonstration au point de départ,
c'est-à-dire à partir de la loi de la gravitation universelle.
Nous allons dériver ch wc par rapport à t. Nous notons α l'angle formé par le
vecteur vitesse ~v avec le rayon vecteur ~u ; l'égalité ~Γ = ddtw~ devient donc (sous
GM
forme scalaire) : dw
dt = Γ.cosα = − r 2 .cosα.
v
w Γ
v
w −GM
d w
w dw
= .ch . .cosα = .ch .
.cosα ;
ch
= sh .
dt
c
c cdt
c
c c
c
c cr2
d w
w −GM dr
w −GM
ch
= ch . 2 2 .v.cosα = ch . 2 2 . .
dt
c
c c r
c c r dt
k
GM
Φ
Posons : k = GM
c2 . On a donc : r = rc2 = − c2 . Ce nombre k dépend de G
et c (constantes), ainsi que de M , que nous supposerons (provisoirement) xé.
On a alors :
d
w
w −k dr
ch
= ch . 2 .
;
dt
c
c r dt
d w
w d k
ch
= ch . r ;
dt
c
c dt
w
d ch c
k
−d
=0;
ch wc
r
k
w
d Log ch
+ d Log e− r = 0 ;
c
w
k
Log ch e− r = constante ;
c
9
ch
w −k
e r = constante, ou, si on préfère :
c
w Φ
ch e c2 = constante.
c
En l'absence de champ gravitationnel, l'énergie du mobile est donnée par la
formule : E = m0 c2 ch wc ; dans le champ gravitationnel, la formule devient :
E = m0 c2 ch
w Φ
w −k
e r = m0 .c2 .ch .e c2 .
c
c
Cette formule va jouer un rôle fondamental ; pour cette raison, nous conseillons
à nos lecteurs de relire et d'analyser sa démonstration. Elle peut être discutée ;
d'ailleurs, nous la discuterons plus loin, lorsque nous aurons tous les éléments
pour le faire.
Il est clair que cette formule est équivalente à la précédente quand r tend
vers l'inni ; mais, à la diérence de cette dernière, elle inclut l'énergie potentielle (négative) de la planète.
Notre but va être de déterminer jusqu'où cette formule peut nous mener.
Nous allons voir qu'elle nous permet de retrouver un grand nombre de résultats
bien connus, et conrmés par les observations, concernant plus particulièrement
le système solaire. Mais il n'est pas question de lui attribuer un pouvoir illimité : si on désire l'appliquer à des conditions "exotiques" (qu'on ne rencontre
pas dans le système solaire), il faudra l'analyser, l'interpréter, et éventuellement
la corriger, pour la rendre extrapolable à ces situations extrêmes. Mais en attendant, conservons-la telle qu'elle est, et voyons ce qu'elle contient.
Posons : E 0 = m0 c2 ch wc ; c'est ce que j'appellerai l'énergie apparente. C'est
une expression de l'énergie qui prend en compte ses aspects "actuels" : masse
et mouvement, mais qui néglige l'énergie potentielle, alors que l'énergie réelle
E inclut l'énergie potentielle. Elle est liée à l'énergie réelle E par l'égalité :
k
k
E 0 = E e r . On a donc : E 0 e− r = constante. En l'absence de champ gravitationnel (ou lorsque r tend vers l'inni), l'énergie apparente se confond avec
l'énergie réelle ; mais quand r tend vers 0, E 0 tend vers l'inni (donc la rapidité
w aussi), alors que E reste constante.
Une question qu'on peut légitimement se poser est la suivante : la relativité
restreinte fait la distinction0 entre la masse au repos m0 et la masse maupertuisienne m = m0 ch wc = Ec2 . Dans tout ce qui précède, c'est la masse maupertuisienne m que nous avons utilisée : nous avons écrit la loi de Newton sous la
M
forme F~ = − G m
~u, et non F~ = − G mr02 M0 ~u. Est-ce justié ? En fait, il n'est
r2
pas urgent de répondre à cette question : nous allons étudier le système solaire
dans un repère lié au Soleil ; on aura donc M = M0 ; d'autre part, la masse
10
des planètes n'interviendra pas, puisque le Soleil produit un champ d'accéléra~
F
tion (plutôt qu'un champ de forces) : c'est la quantité ~Γ = m
= − GM
u (et
r2 ~
~
non F ) qui est indépendante de la particule-test, ou de la planète considérée.
Cependant, la distinction entre masse au repos et masse maupertuisienne est
fondamentle, et nous en reparlerons longuement.
Pour la lumière, l'équivalent de l'énergie apparente est E 0 = hν (où ν désigne
k
k
la fréquence du rayonnement) ; donc E 0 e− r = hν e− r = constante. Comme la
k
r
période est T = 2π
ν , on a, bien sûr : T e = constante. Quand r tend vers 0, la
fréquence ν tend vers l'inni, la périodekT et la longueur
d'onde λ = cTk tendent
k
vers 0. On peut écrire aussi : ν = ν∞ e r , T = T∞ e− r et λ = λ∞ e− r (où ν∞ ,
T∞ et λ∞ sont la fréquence, la période et la longueur d'onde limites quand r
tend vers l'inni, autrement dit quand le rayonnement s'échappe du champ de
gravitation).
Le choix de conserver la loi de la gravitation universelle telle qu'elle a été
formulée par Newton (à partir de la notion de force) n'est pas anodin : il implique que l'accélération à prendre en compte dans l'attraction gravitationnelle
v
est ~Γ = ddtw~ et non ~γ = d~
dt . Entre autres conséquences, ceci va entraîner que la
vitesse de libération à la surface d'un corps pesant sera toujours inférieure à c ;
nous en reparlerons au sujet des trous noirs. Une autre conséquence importante
est qu'il sera plus facile, par la suite, d'établir des ponts entre la gravitation et
les autres forces de la nature (même si la gravitation n'est pas une force comme
les autres) ; en eet, si on choisit de "jeter" la notion de force pour lui substituer
d'emblée l'accélération et la géométrie de l'espace-temps, on risque de casser le
dialogue nécessaire avec la mécanique quantique.
4 Ordres de grandeur
Dans ce travail, nous raisonnerons le plus souvent comme si le champ gravitationnel en question était celui du Soleil ; précisons donc la valeur de k pour ce
champ particulier, ainsi que celle du rapport kr , qui interviendra souvent dans
les équations.
Comme en gravitation newtonienne, nous appellons potentiel gravitationnel la quantité (négative) : Φ = − GM
r . Nous dirons qu'un champ est fort si le
nombre kΦk est grand.
La masse du Soleil est M ≈ 1, 9891.1030 kg ; la constante de la gravitation est G ≈ 6, 6742.10−11 m3 .kg −1 .s−2 ; et la vitesse de la lumière : c ≈
2, 99792.108 m.s−1 ; donc :
k=
6, 6742.10−11 .1, 9891.1030
GM
≈
≈ 1, 47.103 m.
c2
8, 9875.1016
11
Si on note r = rt ≈ 1, 5.1011 m le rayon de l'orbite terrestre, par exemple,
3
−8
,
le nombre kr qui apparaît dans les équations vaudra : kr ≈ 1,47.10
1,5.1011 ≈ 10
2
3
k
k
−16
−24
donc r ≈ 10 , r ≈ 10 , etc. Quand on étudiera l'action du champ
gravitationnel du Soleil sur la Terre (ou sur une autre planète), on ne pourra
pas négliger kr (ce serait négliger la gravitation !) mais on pourra sans crainte
négliger ses puissances.
k
Si on note r = rs ≈ 6, 96.108 m le rayon du Soleil, on aura : kΦk
c2 = r ≈
2
3
1,47.103
k
k
−6
, r ≈ 4.10−12 , r ≈ 8.10−18 , etc. Ceci montre qu'à la
6,96.108 ≈ 2.10
surface du Soleil, les puissances de kr seront très vite négligeables.
Considérons maintenant une étoile à neutrons ayant pour masse 1, 4 fois la
masse du Soleil, et pour rayon 14 km. A sa surface, on aura : k ≈ 1,4 . 1, 47.103 ≈
k
k 2
≈ 0, 0216 ;
2, 058.103 m, et r = 1, 4.104 m, donc kΦk
c2 = r ≈ 0, 147 ;
r
k 3
k 4
k 5
≈
0,
0032
;
≈
0,
00047
;
≈
0,
00007
;
...
Il
faudra
donc
être très
r
r
r
k
prudent avant de négliger des puissances de r à la surface d'une étoile à neutrons ! Nous sommes ici dans le domaine des champs gravitationnels forts ...
Revenons à la surface de la Terre. La masse de notre planète est M ≈
6.1024 kg ; son rayon est r ≈ 6, 37.106 m ; donc :
k
GM
6, 67.10−11 .6.1024
kΦk
= =
=
≈ 0, 7.10−9 .
2
2
c
r
rc
6, 37.106 .9.1016
On voit donc qu'à la surface de la Terre, le champ créé par la Terre elle-même
−9
−8
( kΦk
) est un peu inférieur au champ créé par le Soleil ( kΦk
).
c2 ≈ 0, 7.10
c2 ≈ 10
Etudions maintenant le champ créé par notre Galaxie (la Voie Lactée) à la
surface de la Terre. Imaginons par exemple une masse de 3.1011 soleils (évaluation raisonnable ?) concentrée au centre de la Galaxie, à une distance de
28000 AL, soit 2, 6.1020 m. On a alors :
k
GM
6, 67.10−11 .2.1030 .3.1011
kΦk
=
=
=
≈ 1, 7.10−6 .
c2
r
r c2
2, 6.1020 .9.1016
Le potentiel gravitationnel créé par la Galaxie dans le voisinage de la Terre
dépasse largement celui qui est dû au Soleil. (Bien entendu, il ne faut pas
confondre ce potentiel avec la force d'attraction.)
On pourrait étudier ensuite la contribution des galaxies voisines (groupe
local), qui est non négligeable, puis celle des galaxies lointaines ; pour ces dernières, le calcul est délicat : il fait intervenir la masse moyenne des galaxies,
12
leur répartition dans l'espace, leur âge, leur vitesse de fuite due à l'expansion de
l'Univers... Si les galaxies étaient en nombre inni, réparties uniformément dans
l'espace et dans le temps, dans un Univers statique, leur contribution totale au
champ gravitationnel serait innie, ce qui nous poserait de sérieux problèmes :
tous les calculs qui suivent seraient caducs. Mais la faible luminosité du ciel
nocturne (voir le paradoxe d'Olbers : "pourquoi le ciel est-il noir la nuit ?")
suggère que le champ gravitationnel total pourrait bien être faible aussi ; mais
le paradoxe d'Olbers concerne la lumière, dont l'intensité est en r12 , alors que le
potentiel gravitationnel est en 1r . Le calcul reste à faire.
5 Le paradoxe de Schild
Jusqu'ici, le rapprochement de la gravitation newtonienne et de la relativité
restreinte a semblé se passer de manière simple, facile et naturelle ; mais nous
allons voir surgir un paradoxe qui va nous conduire à envisager la possibilité
d'un espace-temps courbe : c'est le "critère" (ou paradoxe) de Schild.
De même que le paradoxe de Michelson est la porte d'entrée de la relativité
restreinte, je considère le paradoxe de Schild comme la voie royale pour aborder
la relativité générale.
Historiquement, ce n'est pas cette porte qu'Einstein a empruntée lorsqu'il
s'est attaqué à la gravitation ; en eet, le travail de Schild (A. Schild, Evidence
for gravitational theories, Academic Press, 1961) est bien postérieur.
De quoi s'agit-il ?
Le paradoxe de Schild s'appuie sur l'analyse de l'expérience de Pound et
Rebka. Ces deux physiciens, par un procédé très astucieux, ont réussi à mesurer
la perte d'énergie d'un rayon lumineux se déplaçant de bas en haut, du pied
d'une tour jusqu'à son sommet. Cette perte d'énergie est due à l'action de la
gravité terrestre : la lumière doit lutter contre elle pour atteindre le sommet de
la tour.
Pour notre part, nous imaginerons un observateur envoyant un rayon lumineux en direction du Soleil. Cet observateur est supposé immobile par rapport
au Soleil, et susamment éloigné de celui-ci pour qu'il soit possible de négliger
l'action de la gravité solaire à cette distance. Nous l'appellerons l'observateur
distant. D'autre part, nous imaginerons, sur le parcours de la lumière, entre
l'émetteur (l'observateur distant) et le Soleil, plusieurs autres observateurs, tous
immobiles par rapport au Soleil, mais subissant une action non négligeable de la
gravité solaire. Nous les appellerons observateurs locaux. La distance par rapport au Soleil sera noté r ; bien entendu, elle n'est pas identique pour tous les
observateurs.
13
Les observateurs locaux sont habilités à faire des observations seulement
dans leur voisinage immédiat. Au passage de l'onde lumineuse, ils vont relever
sa période Tloc , sa longueur d'onde λloc , et sa vitesse cloc . L'observateur distant
se charge de faire la synthèse : il va essayer de reconstituer le déroulement des
événements, en les replaçant dans un cadre euclidien (peut-être articiel, mais
qui est destiné à reéter au mieux sa vision des choses). Les mesures établies
par cet observateur distant seront notées Tdist , λdist et cdist . Toutes ces mesures
sont des fonctions de r.
Conformément au résultat de l'expérience de Pound et Rebka, nous nous
attendons à un accroissement de l'énergie apparente de cette onde, au fur et à
mesure qu'elle se rapproche du Soleil. Comment cet accroissement de l'énergie
va-t-il se manifester ?
Les formules E = hν , ν = Eh , T = ν1 = Eh , λ = cT = hc
E permettent de
prévoir qu'un accroissement de l'énergie apparente va se traduire par une diminution de la période et de la longueur d'onde. Dans le cadre de la physique
classique, nous nous attendons donc aux résultats suivants :
- résultats des observateurs locaux : on peut penser que la vitesse de la lumière
cloc est constante, et que la période Tloc et la longueur d'onde λloc diminuent
quand le rayonnement se rapproche du Soleil (c'est-à-dire quand r décroît) ;
- synthèse de l'observateur distant : on s'attend aux mêmes résultats, autrement
dit : cdist est constante, Tdist et λdist diminuent quand r décroît.
D'après ce que nous avons vu dans notre approche préliminaire, on peut même
k
préciser que Tloc , λloc , Tdist et λdist vont décroître proportionnellement à e− r .
Mais ces conclusions naïves vont s'écrouler comme un château de cartes.
Elles vont se heurter à trois problèmes qui vont en avoir raison. Nous serons
obligés de faire de profonds réajustements, et ceci en trois temps.
Le premier problème, le plus fondamental, constitue le noyau du paradoxe
de Schild : la période Tdist ne peut pas être décroissante.
Imaginez des voitures roulant à 120 km/h sur une autoroute, régulièrement
espacées (de 100 m par exemple) ; si, pour cause de travaux, elles doivent réduire
leur vitesse à 60 km/h, la distance entre deux voitures successives passera de
100 m à 50 m, tandis que l'intervalle de temps (chronométré par un observateur
immobile au bord de la route) ne changera pas. De la même façon, l'intervalle
de temps entre deux maxima successifs de l'onde (donc la période T) ne peut
pas varier le long de la trajectoire ! Il est essentiel de bien comprendre ce problème, car toute la suite en découle... On peut imaginer une vitesse de la lumière
variable le long du parcours (comme pour les voitures de notre exemple), mais
ceci ne change rien au problème. Celui-ci serait résolu si les diérents chronométreurs étaient en mouvement les uns par rapport aux autres, mais dans notre
expérience imaginaire, comme dans celle (bien réelle) de Pound et Rebka, ils
14
sont immobiles...
6 Ralentissement des horloges dans un champ
gravitationnel
Comment sortir de cette impasse ? C'est en fait assez simple. Rappelons-nous
l'idée proposée par Einstein pour résoudre le paradoxe de Michelson : deux observateurs en mouvement uniforme l'un par rapport à l'autre travaillent avec des
règles et des horloges diérentes. Pour résoudre le paradoxe de Schild, il sut
d'admettre que l'observateur distant et l'observateur local travaillent, eux aussi,
avec des règles et des horloges diérentes. Dans l'univers tel qu'il est reconstitué
par l'observateur distant, le rayon lumineux ne change pas de période lorsqu'il
se propage vers l'observateur local ; mais celui-ci croit mesurer une période plus
courte parce-que son horloge de référence est plus lente que celle de l'observateur distant. Et c'est, bien entendu, le champ gravitationnel qui est responsable
de cette distorsion.
En m'engageant dans cette voie, je suis en train d'admettre, d'une certaine
manière, la courbure de l'espace-temps (même si je ne sais pas s'il s'agit d'une
courbure réelle, ou seulement d'une illusion due à la modication des règles et
des horloges). Cette innovation majeure de la relativité générale a été fortement
critiquée à l'époque où la théorie a été proposée par Einstein ; mais ensuite,
divers physiciens (et plus particulièrement Schild, pour qui la courbure était
une évidence) ont réuni une argumentation forte à l'appui de cette conception
de l'espace-temps. Mais, comme on le verra, les arguments de Schild peuvent
être interprétés de plusieurs manières... Eectivement, les idées toutes simples
que je viens de proposer dans le paragraphe précédent vont m'aiguiller dans une
direction qui n'est ni celle d'Einstein, ni celle de Schild ! J'avais décidé de baser
mon travail sur les idées de Schild, mais, dès le début, je constate que je suis
déjà en train de leur faire dire autre chose que ce que Schild pensait lui-même !
Peu importe : continuons dans cette direction, quitte à corriger le tir plus tard,
s'il le faut.
D'après ce que nous avons dit, le coecient de ralentissement de l'horloge
Φ
k
locale, par rapport à l'horloge distante, est : e− r , autrement dit : e c2 .
Nous devons bien intégrer le fait que l'intervalle spatio-temporel (intervalle
d'univers) entre deux événements très proches ne va pas être évalué de la même
façon par nos deux observateurs (local et distant).
En ce qui concerne l'intervalle temporel, on aura donc :
Φ
k
dtloc = e− r dtdist = e c2 dtdist .
15
7 Contraction des règles dans un champ gravitationnel
Il est certain que la gravité modie la vitesse des horloges, donc l'évaluation
locale des durées. Mais modie-t-elle aussi les règles, donc l'évaluation locale
des distances ?
Voici la réponse que nous proposons. Elle se base sur l'idée suivante : un
observateur se déplaçant selon une géodésique (nous dirons un "observateur
inertiel") est en droit de se considérer immobile. S'il utilise une règle dl disposée longitudinalement dans la direction du déplacement, il jugera sa longueur
constante, c'est-à-dire indépendante de sa vitesse.
Observons la scène, du point de vue de l'observateur distant (immobile par
rapport au corps central - disons le Soleil - et assez loin pour que le potentiel gravitationnel soit négligeable). Pour décrire la trajectoire du mobile inerk
tiel, nous utilisons la formule : E = E0 .ch wc .e− r = cte , ou plus simplement :
k
k
ch wc .e− r = cte . Pour simplier encore, supposons qu'on ait : ch wc .e− r = 1,
k
autrement dit ch wc = e r . Ceci signie que nous raisonnons sur une orbite parabolique (ou une "géodésique d'évasion") : la rapidité w tend vers 0 quand r
tend vers l'inni. Donc sur toute la géodésique on a w = wl et v = vl (vl étant la
vitesse de libération, variable en fonction de r). Précisons pourquoi nous choisissons une géodésique d'évasion, plutôt qu'une géodésique quelconque : c'est
parce-qu'à l'inni la vitesse de l'observateur mobile va tendre vers 0, donc son
point de vue va s'identier à celui de l'observateur distant. Ils seront donc d'accord sur l'évaluation de dl. D'autre part, rappelons que v et w sont la vitesse et
la rapidité du mobile mesurées par des observateurs locaux situés sur le passage
du mobile (mais eux sont immobiles par rapport à la Terre, comme l'observateur distant). Donc les mesures de v et w ne sont pas directement accessibles à
l'observateur distant.
Lorsque le mobile inertiel se rapproche du Soleil, sa vitesse augmente. La
longueur dl de la règle, du point de vue du mobile, ne change pas. Pour l'observateur local immobile, c'est diérent : en raison de l'eet de contraction des
règles en mouvement, résultant de la relativité restreinte, il doit, en principe, en
donner une évaluation dl0 inférieure à celle que donne l'observateur mobile, soit
dl ; le rapport entre ces deux évaluations étant :
dl0 =
dl
dl
−k
r .dl
w = k =e
ch c
er
L'observateur distant pourra interpréter ce résultat de deux façons :
16
- s'il choisit de raisonner en termes d'espace plat (euclidien), il dira : la règle
de l'observateur inertiel se contracte vraiment quand il se rapproche du Soleil,
mais il ne s'en rend pas compte ;
- s'il choisit de raisonner en termes d'espace courbe, il dira : l'observateur inertiel
a parfaitement raison de dire que ses règles sont de longueur constante ; c'est
son point de vue qui fait autorité ; par conséquent, l'observateur local doit l'admettre, et il doit harmoniser ses règles personnelles avec celles de l'observateur
inertiel ; autrement dit, il doit travailler avec des règles plus courtes.
Nous allons choisir le second point de vue. Il y a deux raisons à cela : d'abord,
nous avons été obligés d'admettre que les horloges sont modiées par la gravité,
et nous n'avons pas de raison de penser qu'il n'en soit pas de même pour les
règles ; ensuite, nous pensons que le fait de considérer le point de vue des observateurs inertiels comme référence permet de serrer au plus près la réalité physique.
Le fait que les règles de l'observateur local soient plus courtes que celles de
l'observateur distant signie que ces deux observateurs ne vont pas donner la
même évaluation de la longueur d'un segment (immobile) donné, puisqu'ils vont
l'évaluer avec des unités diérentes ; l'évaluation fournie par l'observateur local
sera, bien sûr, supérieure à celle que donnera l'observateur distant :
k
dlloc = e r .dldist ;
k
dldist = e− r .dlloc .
Nous dirons que le coecient de dilatation de l'espace est e r . Ceci signie
que, lorsqu'on se rapproche du corps central (le Soleil), il y a plus d'espace disponible que prévu par la géométrie euclidienne. Si on préfère, on peut dire que
les unités de longueur sont contractées par l'eet du champ gravitationnel.
k
On peut remarquer qu'en un point donné il passe une innité de géodésiques
d'évasion, de toutes directions ; le raisonnement qui précède est donc valable
quelle que soit la direction, ce qui signie que le coecient de dilatation de
l'espace est identique dans toutes les directions.
Si nous comparons les formules dldist = e− r .dlloc et dtdist = e r .dtloc , nous
voyons que les coecients qui interviennent sont inverses l'un de l'autre.
k
8 Matrices de changement de potentiel
Pour résumer ce qui vient d'être dit, on peut écrire :
  −k
e r
dtloc
 dxloc  = 
 0
dyloc
0

0
k
er
0
17


0
dtdist

0   dxdist  ;
k
dydist
er
k
  k
er
dtdist
 dxdist  = 
 0
dydist
0

0
e

−k
r
0
0
0
e− r
k

dtloc

dxloc .

dyloc
On pourra écrire aussi :
  Φ2
ec
dtloc
 dxloc  = 
 0
dyloc
0

0
e

− Φ2
c
0
0
0
e − c2
  − Φ2
e c
dtdist
 dxdist  = 
 0
dydist
0
Φ


dtdist

dxdist  ;

dydist


0
dtloc

0   dxloc .
Φ
dyloc
e c2
0
Φ
e c2
0
Notons bien que les matrices que nous utilisons ici (que j'appellerai "matrices
de changement de potentiel") sont valables lorsqu'on passe d'un observateur local à un observateur distant (ou l'inverse), ou bien (par composition) lorsqu'on
passe d'un observateur local à un autre observateur local. Mais ces observateurs
ne sont pas des observateurs quelconques : ce sont des observateurs immobiles
par rapport au Soleil. Ceci soulève des questions : que se passe-t-il lorsque les observateurs ne sont pas immobiles ? Que devient la notion d'immobilité lorsqu'on
étudie le champ gravitationnel créé par plusieurs corps en mouvement ? Dans
ce cas, il faudra probablement faire appel à des notions plus sophistiquées, et à
des outils plus performants comme les tenseurs ; mais pour le moment notre but
premier est l'application d'idées simples à une situation simple : le mouvement
des planètes dans le système solaire. Nous évoquerons les tenseurs (plus précisément le tenseur deRicci) un peu plus loin. En attendant, "immobile" signiera :
"immobile par rapport au Soleil".
Si nous considérons, non plus un observateur distant et un observateur local,
mais deux observateurs locaux diérents loc1 et loc2 (tous deux immobiles par
rapport au Soleil), situés dans des potentiels quelconques, alors il sera possible
de passer successivement de l'observateur loc1 à l'observateur distant, puis de
l'observateur distant à l'observateur loc2 , par une composition de matrices :
  Φ22
ec
dt2
 dx2  = 
 0
dy2
0
0

  Φ22
ec
dt2
 dx2  = 
 0
dy2
0

0
Φ2
e − c2
0
e
0
Φ2
e− c2
0
0
e
0
 
0
 
.
−
Φ2
c2
18
−
e
Φ2
c2
−Φ1
c2
 

dtdist
 
dxdist  ;
.
dydist
0
Φ1
0
0
e c2
0
0
0
e c2
Φ1
 

dt1
 
dx1  ;
.
dy1
2
  − Φ1 −Φ
c2
e
dt2

 dx2  = 
0
dy2
0
0

e
0
Φ1 −Φ2
c2
0
0
e
Φ1 −Φ2
c2
 

dt1
 
dx1 .
.
dy1
Pour passer d'un observateur local à un autre, on pourra donc utiliser les
mêmes matrices de changement de potentiel que pour passer d'un observateur local à un observateur distant, à condition de considérer que Φ désigne la diérence
de potentiel entre les deux observateurs. On pourra même prendre l'habitude de
considérer Φ comme une quantité relative : Φ = Φmob − Φobs , où Φmob désigne
le potentiel gravitationnel dans lequel se trouve le mobile observé (par exemple
la planète), et Φobs le potentiel dans lequel se trouve l'observateur. C'est cette
diérence de potentiel, interposée entre l'observateur et la scène observée, qui
joue le rôle de verre déformant.
La relativité restreinte est basée sur la matrice de Lorentz ; la gravitation
relativiste, telle que nous la concevons, se base sur la matrice de changement de
potentiel. Si nous cherchons à combiner ces deux types de matrices pour étudier
de manière générale les changements de référentiel (référentiels en mouvement
l'un par rapport à l'autre, situés dans des potentiels diérents), nous rencontrons
très vite des problèmes. La raison est la suivante : notre solution du paradoxe
de Schild dissocie les rôles de l'espace et du temps, alors que la relativité restreinte les considère comme deux aspects d'une même chose. Pour que ces deux
types de transformations soient compatibles, il est nécessaire d'admettre que la
matrice de changement de potentiel ne s'applique qu'à des référentiels particuliers, que nous appellerons "gravitationnellement immobiles". La signication
de cette formule sera précisée plus loin.
9 Evaluation des vitesses en fonction du potentiel
Voyons maintenant l'évaluation des vitesses.
Voici le troisièmek problème : si nous disons que Tdist est constant et que λdist
dist
, nous en déduisons que cdist est
est multiplié par e− r , sachant que cdist = λTdist
k
k
−r
multiplié par e . De même, si nous disons que Tloc est multiplié par e− r et
loc
que λloc est constant, sachant que cloc = λTloc
, nous en déduisons que cloc est
k
−r
divisé par e .
Ce raisonnement est inexact, car λdist n'est pas multiplié par e− r dans l'absolu (un absolu qui n'existe pas !), mais par rapport à λloc . De même, Tloc n'est
k
19
pas multiplié par e− r dans l'absolu, mais par rapport à Tdist .
k
En réalité, comme nous l'enseigne la relativité restreinte, tout observateur,
mesurant la vitesse de la lumière dans son voisinage, obtiendra un résultat rigoureusement égal à la constante c ; on a donc : cloc = c.
Si un observateur local calcule la vitesse d'un mobile par la formule : vloc =
, alors l'observateur distant évaluera la même vitesse de la façon suivante :
dlloc
dtloc
vdist =
Φ
dldist
dtdist
=
e c2 .dlloc
− Φ
e c2
2Φ
= e c2 .vloc .
.dtloc
La vitesse locale de la lumière sera toujours constante : cloc = c ; mais sa
2Φ
vitesse évaluée par un observateur distant ne le sera pas : cdist = c.e c2 . Par
exemple, lorsque la lumière passe dans le voisinage d'un corps massif (Φ < 0),
sa vitesse évaluée par un observateur distant sera inférieure à c, de sorte que
celui-ci aura l'illusion de voir la lumière ralentir.
La solution du paradoxe de Schild que nous proposons comporte donc trois
volets interdépendants et étroitement imbriqués. Le premier est le ralentissement des horloges dans un champ gravitationnel (volet sans lequel l'eet Einstein - voir plus loin - n'existerait pas) ; c'est l'élément central de notre vision
du paradoxe de Schild. Le second est la contraction des règles dans un champ
gravitationnel (volet sans lequel la déviation de la lumière, ou les mirages gravitationnels, seraient incompréhensibles : voir la section sur la déexion de la
lumière) ; c'est le complément indispensable du premier, sa facette spatiale pour
ainsi dire. Le troisième est la constance de la vitesse locale de la lumière (indispensable si nous admettons la validité locale de la relativité restreinte) ; nous
aurions pu commencer par lui, tant il va de soi. Il implique que la vitesse de
la lumière, pour un observateur distant, semble varier en fonction du champ
gravitationnel. Cette variation apparaîtra de manière spectaculaire dans l'eet
Shapiro. Ces trois volets sont (au moins qualitativement) nécessaires ; sont-ils
quantitativement satisfaisants, et jusqu'à quel point ? C'est ce que nous allons
examiner.
Mais auparavant, soulignons encore une conséquence importante concernant
l'évaluation des masses.
10 Evaluation des masses en fonction du potentiel
Dès notre approche préliminaire, nous avons vu apparaître la formule :
E = m0 c2 ch
w −k
w Φ
e r = m0 c2 ch e c2 ,
c
c
20
dans laquelle E est l'énergie d'un mobile évaluée par un observateur distant, et
Φ la diérence de potentiel entre l'objet observé et l'observateur. Si cet objet
est au repos (w = 0), la formule devient :
k
Φ
E = m0 c2 e− r = m0 c2 e c2 .
L'observateur distant va alors évaluer la masse au repos de ce corps de la façon
suivante :
mrep =
Φ
k
E
= m 0 e − r = m 0 e c2 .
2
c
Cet observateur va donc estimer que la masse au repos du mobile est plus faible
quand celui-ci est plongé dans un champ gravitationnel plus fort.
Si, de plus, nous supposons que l'observateur est situé dans le même potentiel gravitationnel que le mobile, alors la diérence de potentiel Φ s'annule, et
on obtient : mrep = m0 ; on peut donc dire que m0 est la masse au repos du
mobile, évaluée par un observateur lié à ce mobile (ou, au moins, plongé dans
un potentiel identique).
Comme on le verra par la suite, l'énergie d'un mobile se déplaçant librement
sur une géodésique semblera constante aux yeux de l'observateur distant : les
variations de la masse au repos seront compensées exactement par les variations
Φ
de la rapidité, le produit ch wc e c2 restant constant sur la trajectoire (en l'absence de cause physique susceptible de le modier).
11 Mise au point
Avant de continuer, revenons à notre "approche préliminaire", qui doit être
réinterprétée à la lumière du critère de Schild. En particulier, nous venons de
voir que la plupart des mesures dépendent de l'observateur (local ou distant) ;
nous n'en avions pas parlé dans l'approche préliminaire, et nous n'avions pas
cherché à savoir par qui étaient évaluées les diérentes quantités impliquées dans
le calcul. Mais il est temps de le faire, sans quoi des contradictions risquent de
surgir par la suite.
Reprenons la même situation : une planète de masse au repos m0 , se déplaçant dans le champ gravitationnel du Soleil, de masse M .
Nous avions utilisé plusieurs formules, dont l'expression de l'accélération
adaptée de la mécanique newtonienne : ~Γ = ddtw~ .
Nous avions aussi exprimé l'accélération gravitationnelle selon la gravitation
de Newton : ~Γ = − GM
u.
r2 ~
21
~ =
Nous avions écrit aussi : dΦ = −~Γ.dl
.
nous en avions conclu que : Φ = − GM
r
GM
~
u.dl
r2 ~
=
GM
r 2 .dr
= d − GM
, et
r
C'est à partir de ces bases que nous avions démontré que ch wc .e c2 = constante
(conservation de l'énergie du mobile).
Φ
Dans cette démonstration, il était admis implicitement que toutes les quantités étaient évaluées par un observateur local, puisque la notion d'observateur
distant n'avait pas encore été introduite. Ceci est évident en ce qui concerne
la vitesse v et la rapidité w (provenant du coecient ch wc = p 1 v2 ), qui dé1−
c2
signaient, et continueront à désigner, une vitesse et une rapidité locales ; mais
nous avions admis aussi que dr = dl.cosα, avec dl = v.dt, ce qui suppose que r,
dl et dt étaient aussi évalués localement (c'est-à-dire par un observateur situé
dans un potentiel égal à celui dans lequel évolue la planète).
Dès lors, la signication de toutes les formules doit être reconsidérée.
G.Mloc
Quand nous écrivions : Φ = − G.M
r , il fallait comprendre : Φ = − rloc .
Mais nous savons maintenant que les masses et les longueurs sont évaluées différemment selon le potentiel dans lequel est plongé l'observateur ; de plus, on
passe du point de vue local (potentiel Φ) au point de vue distant (potentiel 0)
Φ
en multipliant les masses et les longueurs par le même coecient : e c2 . On a
donc :
Φ=−
G.Mloc
G.Mdist
=−
.
rloc
rdist
Ceci signie que les potentiels (ou plutôt les diérences de potentiel) ont une signication absolue, indépendante de l'observateur. Par la suite, nous admettrons
que M = Mdist et r = rdist (ce qui est purement arbitraire, mais commode), et
nous écrirons : Φ = − G.M
r .
Il en va diéremment de l'"accélération" Γ. Si nous choisissons cette dénition :
Γ=−
nous aurons
Γdist
Γloc
=
rloc
rdist
Φ
G.M
=
2
r
r
= e− c2 , ce qui entraîne :
Φ
Φ
Γdist = e− c2 .Γloc .
~ . En eet :
Ceci est cohérent
avec la formule dΦ = −~Γ.dl
~ dist = e− cΦ2 .~Γloc .e cΦ2 dl
~ loc = ~Γloc .dl
~ loc .
~Γdist .dl
Cette formule est donc valable pour tous les observateurs :
~ dist = ~Γloc .dl
~ loc .
dΦ = ~Γdist .dl
Quant à la formule ~Γ = ddtw~ , que nous avons employée dans un contexte
w
~
local : ~Γloc = dtdloc
, nous pouvons l'écrire dw
~ = ~Γloc .dtloc . Rappelons que w
~
22
désigne toujours la rapidité locale, quel que soit l'observateur.
Φ
2Φ
2Φ
Φ
~ , on
Puisque ~Γdist .dtdist = e− c2 .~Γloc .e− c2 dtloc = e− c2 .~Γloc .dtloc = e− c2 .dw
peut dire que la formule ~Γ = ddtw~ n'est valable que pour l'observateur local.
Pour l'observateur distant, elle devient :
2Φ
~
~Γdist = dw
.e− c2
dtdist
où Φ est la diérence de potentiel entre le mobile observé et l'observateur :
Φ = Φscene − Φobservateur .
Passons à laΦformule F~Φ = m.~Γ. On a :
mdist .~Γdist = e c2 .mloc .e− c2 .~Γloc = mloc .~Γloc .
Il s'ensuit que l'évaluation de F~ (comme celle de Φ) est indépendante du poten-
tiel dans lequel est plongé l'observateur.
F~ = mdist .~Γdist = mloc .~Γloc .
L'égalité ch wc .e = constante est vraie pour tous les observateurs situés
dans un potentiel constant. La quantité Φ désigne toujours la diérence de potentiel entre le mobile observé et l'observateur.
Φ
Φ
2
2
0 .c .e c
La formule E = m0 .c2 .ch wc .e c2 = mp
est donc générale.
v2
Φ
c2
1−
c2
12 Eet Einstein
D'après ce que nous venons de voir, un rayon lumineux se dirigeant de bas
en haut dans le champ gravitationnel de la Terre doit perdre de l'énergie apparente : sa fréquence doit être décalée vers le rouge (pour un observateur immobile). C'est précisément ce qui a été vérié par Pound et Rebka en 1959 ; si
on analyse leur expérience, on voit qu'ils ont cherché à annuler ce décalage vers
le rouge par un eet Doppler opposé (décalage vers le bleu produit par le rapprochement de l'émetteur et du récepteur, à une vitesse soigneusement calculée).
On en déduit qu'une horloge immobile dans un champ gravitationnel doit
retarder par rapport à une horloge identique située hors de ce champ. Ceci a
été vérié d'abord dans des avions, puis dans des satellites articiels : dans ce
cas, l'horloge embarquée avance par rapport à celles qui restent à la surface de
la Terre, car le champ est plus faible à haute altitude. Cette distorsion (appelée
"eet Einstein") est systématiquement prise en compte dans les calculs du positionnement GPS. L'expérience de Pound et Rebka était donc la première (mais
non la dernière !) mesure de cet eet Einstein.
En relativité générale, le coecient de dilatation du temps est p 1
1+ 2Φ
2
=
c
√
1
1− 2k
r
k
1
; ici, nous avons trouvé e− c2 = e r . On peut remarquer que √1−
et
2k
Φ
r
23
e r ont le même développement limité au premier ordre en kr ; c'est : 1 + kr ; la
diérence est donc insensible pour r très grand par rapport à k, comme c'est le
k
cas dans l'environnement terrestre, et dans la plupart des situations que nous
étudierons.
Mais imaginons que r tende vers 2k (ce qui correspond à l'horizon d'un trou
k
1
tend vers +∞, tandis que e r tend
noir : nous en reparlerons !). Alors √1−
2k
r
vers e 2 , soit 1, 649 environ : pour un observateur distant, un chronomètre situé
à la surface d'un trou noir semblera s'arrêter, si c'est la première formule qui est
la bonne ; mais si c'est la seconde formule qui est correcte, alors ce chronomètre
semblera tourner à 60, 6% de sa vitesse normale. Ce n'est pas du tout pareil !
1
Calculons plus précisément
la diérence des deux coecients de dilatation
k
1
r ;
−
e
du temps : √1−
2k
r
- à la surface du Soleil ( kr ≈ 0, 000002) :
√
1
1−0,000004
négligeable !
− e0,000002 ≈ 1, 000002000006 − 1, 000002000002 ≈ 4.10−12 . C'est
- à la surface d'une étoile à neutrons de 1, 4 masse solaire et 14 km de rayon
( kr ≈ 0, 147) :
1
√
− e0,147 ≈ 1, 190 − 1, 158 ≈ 0, 032. (Diérence relative : 0,032
1,19 ≈ 17%.)
1−2.0,147
En théorie, cet écart devrait pouvoir être mis en évidence par l'étude des
radiations provenant de la surface des étoiles à neutrons : dans notre modèle,
le décalage vers le rouge (redshift gravitationnel) est de 17% moins élevé qu'en
relativité générale. Nous en reparlerons dans la section consacrée à la mesure de
l'eet Einstein à la surface des étoiles à neutrons.
13 Newton, Einstein, et encore Einstein...
Avant de continuer, arrêtons-nous un instant pour observer les piliers sur
lesquels s'appuie notre réexion.
Le premier est, bien entendu, la gravitation de Newton : nous avons pris au
pied de la lettre la loi de la gravitation universelle.
Le second est la relativité restreinte d'Einstein, théorie incontournable, maintes
fois conrmée, devenue un pilier essentiel de la physique, car elle est indispensable à la compréhension de l'électromagnétisme, de l'optique, de la physique
quantique, de la théorie des champs, etc.
Mais ces deux théories conduisent à une contradiction apparente, mise en évi24
dence par le paradoxe de Schild. Pour résoudre ce paradoxe, nous avons proposé
une idée, qui constitue le troisième pilier de notre réexion : nous imaginons
que l'évaluation de l'espace, du temps, de l'énergie et de l'impulsion, dépend
non seulement de l'état de mouvement de l'observateur (comme en relativité
restreinte), mais aussi du potentiel gravitationnel. Cette idée est inspirée par
la relativité restreinte, mais ne coïncide pas avec les hypothèses de la relativité
générale, bien qu'elle puisse être interprétée en termes de courbure de l'espacetemps.
Enn, cette façon de traiter le paradoxe de Schild trouve sa force et sa cohérence grâce à une autre idée d'Einstein, qui constitue le quatrième pilier de notre
réexion : par son étude de l'eet photoélectrique, il nous apprend que l'énergie d'un photon, la fréquence de l'onde associée, ainsi que sa longueur d'onde,
sont étroitement liées. Cette découverte n'étant pas due uniquement à Einstein,
mais aussi à Planck : c'est une analyse croisée de l'eet photoélectrique et du
rayonnement du corps noir qui a permis d'en révéler toute la profondeur. La
recherche de la cohérence avec cet aspect ondulatoire de l'énergie est l'une des
25
idées directrices de notre travail ; elle nous a servi de guide pour analyser le
paradoxe de Schild. La formule E = hν est ici d'une importance capitale : elle
établit un lien fondamental entre l'énergie, l'espace et le temps. Nous l'avons
appliquée à la lumière (car l'expérience de Pound et Rebka utilise un rayon lumineux), mais nous aurions pu l'appliquer à n'importe quel mobile : en eet, la
mécanique ondulatoire a montré qu'elle se généralise de manière remarquable.
Elle est devenue aussi l'une des bases de la mécanique quantique.
Précisons le rôle de cette formule : E = hν , dans la solution de notre problème.
L'énergie et l'impulsion ne sont pas évaluées de la même façon par tous les
observateurs :

Φ
Φ

 E = Edist = Eloc e c2 = m0 c2 ch wc e c2 ;

 p=p
− Φ2
w − Φ2
dist = ploc e c = m0 c sh c e c .
Dans le cas de la lumière :
Φ
Φ
E = Edist = hνdist = hνloc .e c2 = Eloc .e c2 ;
Φ
p = pdist
Φ
Φ
hνdist
hνloc .e c2
hνloc .e− c2
=
=
=
= ploc .e− c2 .
2Φ
cdist
c
2
c.e c
26
− 2
dist
c
Il en résulte que les formules Edist = Eloc .e c2 et pdist = hν
cdist = ploc .e
s'appliquent aussi bien aux rayonnements qu'aux corps massifs.
Φ
Φ
14 Métrique de l'espace-temps
Nous nous plaçons toujours dans le cas de gure le plus simple : nous voulons étudier les orbites de particules-test (de masse négligeable) dans la voisinage
d'un corps pesant de masse M , supposé immobile (confondu avec l'origine du
repère).
Nous allons formaliser ce qui a été dit précédemment, dans une optique inspirée de celle d'Einstein, c'est-à-dire basée sur la métrique de l'espace-temps et
les géodésiques. Le but est d'étudier comment nos idées s'insèrent dans un tel
cadre, où elles nous conduisent, et, éventuellement, comment elles devront être
corrigées.
Dans l'espace-temps euclidien de la relativité restreinte, on utilise la métrique minkowskienne : ds2 = c2 dt2 − dx2 − dy 2 (en ignorant la troisième dimension spatiale, selon notre choix exposé au début), ou, en coordonnées polaires :
ds2 = c2 dt2 − dr2 − r2 dθ2 . (Bien entendu, le corps massif que nous appelerons
"Soleil" occupe le centre du repère.)
L'intervalle d'univers innitésimal ds est une notion locale ; il s'évalue à l'aide
2
de dtloc , dxloc et dyloc : ds2 = c2 dt2loc − dx2loc − dyloc
.
Remplaçons dtloc par e− r dtdist , dxloc par e r dxdist et dyloc par e r dydist ; il
vient :
k
k
ds2 = c2 e−
Puisque
Φ
c2
2k
r
dt2dist − e
2k
r
dx2dist − e
k
2k
r
2
dydist
.
= − Gr cM2 = − kr , on peut écrire :
2Φ
2Φ
2Φ
2
ds2 = c2 e c2 dt2dist − e− c2 dx2dist − e− c2 dydist
.
Dans cette équation, (cdtdist , dxdist , dydist ) sont évalués par un observateur
distant (immobile par rapport à notre repère de référence, donc par rapport au
Soleil, et situé dans un potentiel nul), et Φ est le potentiel dans lequel est plongé
l'objet observé (ou l'observateur local). Mais on pourrait décider de choisir un
autre observateur (également immobile) situé dans un potentiel quelconque ;
27
dans ce cas, Φ désignera la diérence de potentiel entre l'objet observé et l'observateur.
Comme nous voulons étudier les équations du mouvement, nous ne pourrons pas nous référer à l'observateur local, qui sera nécessairement mobile ; nous
allons donc prendre l'observateur distant (immobile) comme observateur de référence ; nous posons donc : dt = dtdist , dx = dxdist et dy = dydist . Par conséquent :
ds2 = c2 e−
2k
r
dt2 − e
2k
r
dx2 − e
2k
r
dy 2 .
En coordonnées polaires, on obtient :
ds2 = c2 e−
2k
r
2k
r
dt2 − e
dr2 − e
2Φ
2Φ
2k
r
r2 dθ2 .
2Φ
ds2 = c2 e c2 dt2 − e− c2 dr2 − e− c2 r2 dθ2 .
Cette équation exprime la métrique de l'espace-temps au voisinage du corps
massif ; elle peut être interprétée comme étant celle d'un espace-temps non euclidien. Nous nous engageons donc, en suivant l'exemple d'Einstein, dans la voie
de l'espace-temps courbe, tout en gardant à l'esprit que cette courbure n'est
peut-être qu'une illusion.
On peut l'écrire sous forme matricielle :

ds2 =
dt

dθ . 
dr
2Φ
c2 e c2
0
0
0
2Φ
−e− c2
0
0
0
2Φ
−e− c2
 

dt
 
dr  ;
.
2
dθ
r
ou, si on préfère :
ds2 =
dt
dr

2 − 2k
r
 c e
dθ . 
0
0
0
2k
−e r
0
0
0
−e
2k
r
 

dt
 
dr  .
.
2
dθ
r
Supposons qu'on veuille modier légèrement la métrique que nous avons
trouvée, en jouant sur les exposants ; écrivons-la sous la forme générale :
ds2 = c2 e
mk
r
dt2 − e
nk
r
dr2 − e
pk
r
r2 dθ2
où m, n, p sont trois constantes. Alors, pour que la déexion de la lumière soit
conforme aux observations, on doit avoir : n − m = 4. (Ceci peut se prouver par
28
un calcul analogue à celui de la section : "Déexion de la lumière".) Pour obtenir
la bonne précession du périhélie de Mercure, la condition est : n + p − m = 6.
(On le montre en généralisant le calcul de la section : "Précession du périhélie".)
Comme le critère de Schild impose clairement que m = −2, on a nécessairement :
n = p = 2. Il est donc inutile d'essayer de modier ces exposants.
Bien entendu, il serait tentant de simplier cette métrique en écrivant :
ds2 = c2 e
2k
r
dt2 − e
2k
r
dr2 − e
2k
r
r2 dθ2 ;
ce qui entraînerait :
ds2 = e
ds2 = e
2k
r
2k
r
. c2 .dt2 − dr2 − r2 dθ2 , ou, si on préfère :
. c2 .dt2 − dx2 − dy 2 − dz 2 , et, par conséquent :
k p
ds = e r . c2 .dt2 − dx2 − dy 2 − dz 2 .
Dans ce cas, le coecient e r jouerait le rôle d'un "facteur d'échelle", aectant
de la même façon les coordonnées spatiales et temporelles. On pourrait alors
facilement dénir le lagrangien, qui est considéré comme une clé du calcul des
trajectoires, en électromagnétisme relativiste par exemple. Malheureusement,
les chercheurs qui voudraient s'engager dans cette voie seraient vite bloqués : en
eet, cette métrique n'est pas compatible avec la déviation de la lumière par les
objets massifs. En eet, elle correspond au cas m = n = p = 2, donc n − m = 0,
alors que la déviation de la lumière ne marche que pour n − m = 4. Oublions
donc ce genre de simplication, et retenons que la gravitation, par nature, opère
une distinction essentielle entre l'espace et le temps : cette dichotomie fait qu'elle
ne peut pas être traitée de la même façon que l'électromagnétisme, par exemple.
Elle est sans doute relativiste, mais probablement pas de la même manière !
k
15 Quelques conséquences
Notons dldist une distance innitésimale parcourue par le mobile étudié,
2
2
2
évaluée par un observateur distant. On a : dldist
= dx2dist + dydist
(ou dldist
=
2
2
2
dxdist + dydist + dzdist , si on choisit de rétablir la troisième dimension d'espace).
La métrique s'écrit alors :
2Φ
2Φ
2
2
ds2 = c2 dt2loc − dlloc
= c2 e c2 dt2dist − e− c2 dldist
;
ce qui entraîne :
2
2
ds = c
dt2loc
dl2
1 − 2 loc2
c dtloc
=c
2
dt2loc
v2
1 − loc
c2
c2 dt2loc
1
wloc
=
= ch2
.
2
vloc
ds2
c
1 − c2
29
;
Nous noterons simplement v et w la vitesse et la rapidité évaluées par l'observateur local.
On obtient :
c dtloc
w
= ch ;
ds
c
Φ
Φ
c dtdist
c dtloc .e− c2
w
=
= ch .e− c2 ;
ds
ds
c
Φ c dtdist
w
ch = e c2 .
.
c
ds
v c dtloc
v
w
w
dlloc
= .
= .ch = sh ;
ds
c ds
c
c
c
Φ
dldist
dlloc .e c2
w Φ
=
= sh .e c2 ;
ds
ds
c
w
− Φ2 dldist
sh = e c .
.
c
ds
On peut donc compléter les formules obtenues précédemment (en notant :
dt = dtdist et dl = dldist ) :

2Φ
Φ

 E = Edist = m0 c2 ch wc e c2 = m0 c2 e c2 . cdsdt ;

 p=p
− 2Φ
w − Φ2
2 dl
dist = m0 c sh c e c = m0 c e c . ds .
Une autre conséquence mérite d'être soulignée. Sachant que m0 c2 ch wc =
Φ
Φ
E.e− c2 et que m0 c2 sh wc = cp.e c2 , en utilisant le fait que ch2 wc − sh2 wc = 1,
on tire facilement :
2Φ
2Φ
E 2 .e− c2 − c2 p2 .e c2 = m20 c4 .
Pour Φ = 0, on retrouve la formule classique : E 2 − c2 p2 = m20 c4 .
Par souci de simplication, nous utiliserons souvent, par la suite, l'énergie
réduite E et l'impulsion réduite p, dénies par :


 E=

 p=
Edist
m0 c2
pdist
m0 c
Φ
2Φ
= ch wc e c2 = e c2 . cdsdt ;
Φ
2Φ
dl
= sh wc e− c2 = e− c2 . ds
.
30
On a, bien sûr :
2
2Φ
2Φ
E .e− c2 − c2 p2 .e c2 = 1.
Le moment cinétique d'un corps M par rapport à un point xe O sera noté
2Φ
~
dl
~ ∧ p~ = ~r ∧ p~. On aura donc : µ
µ
~ . Par dénition : µ
~ = OM
~ = m0 c e− c2 .~r ∧ ds
.
k
Φ
Dans notre étude du système solaire, on aura : c2 = − r ; de plus, la composante
~ qui intervient dans le produit vectoriel est la composante perpendiculaire
de dl
~ ; elle est égale (en valeur scalaire) à r dθ (où dθ désigne la
au rayon vecteur OM
variation innitésimale de l'angle au centre). On aura donc (en valeur scalaire) :
µ = m0 c e
2k
r
r2
dθ
.
ds
Nous utiliserons aussi le moment cinétique réduit :
µ=
2k
µ
dθ
= e r r2 .
m0 c
ds
Dans une étude telle que celle du système solaire, le moment cinétique des
planètes sera conservé ; ceci provient du fait que la force F~ est dirigée vers le
point xe O.
D'autre part, nous admettrons la loi de la conservation de l'énergie : ch wc e c2 =
2Φ
constante, ou e c2 . cdsdt = constante. Attention : ces formules seront valables à
condition que l'observateur (distant ou non) soit immobile dans un potentiel
constant.
Φ
16 Métriques de Schwarzschild et de Ni
Au point où nous sommes arrivés, arrêtons-nous un instant pour comparer
l'équation que nous venons d'obtenir avec celles qui ont été publiées dans le
cadre des diérentes théories de la gravitation.
Dans le cas de la relativité générale d'Einstein, la métrique de l'espacetemps au voisinage d'un corps massif ponctuel est donnée par la solution de
Schwarzschild :
2k 2 2
1
1−
c dt −
dr2 − r2 dθ2 , ou encore :
r
1 − 2k
r
2Φ
1
ds2 = 1 + 2 c2 dt2 −
dr2 − r2 dθ2 .
c
1 + 2Φ
2
c
ds2 =
31
Quant au physicien chinois Ni, dans sa seconde théorie de 1972 (à ne pas
confondre avec ses autres théories, dont certaines présentent de réels défauts !),
il obtient :
ds2 = c2 e2f ( c2 ) dt2 − e−2f ( c2 ) dr2 − e−2f ( c2 ) r2 dθ2
Φ
Φ
Φ
où f désigne une fonction arbitraire. Notre équation correspond donc au cas
particulier le plus simple de la théorie de Ni : le cas où f (x) = x. On pourrait
l'appeler : métrique triviale de Ni.
Remarquons que le coecient e− r = e c2 est présent dans plusieurs autres
théories de la gravitation, en particulier dans la première théorie de Nordstöm
(1912). Cette théorie a été prise en défaut, et Nordström a publié en 1913 une
seconde théorie, qui est restée célèbre, d'une part parce-qu'elle est considérée
comme la première théorie relativiste de la gravitation vraiment solide, d'autre
part parce-qu'elle a ouvert la voie à la relativité générale : Einstein l'a beaucoup
admirée, et s'en est fortement inspiré.
2Φ
2k
Les partisans de la théorie d'Einstein estiment que toutes les (nombreuses)
autres théories de la gravitation doivent être éliminées, pour des raisons variées.
Entre autres choses, ils reprochent à la plupart de ces théories de ne pas respecter le principe d'équivalence fort. Or, d'après la conjecture de Schi, une théorie
de la gravitation qui respecte le principe d'équivalence faible doit aussi respecter
le principe d'équivalence fort. Mais ceci n'est rien d'autre qu'une conjecture...
Je reviendrai plus loin sur ces principes d'équivalence.
Le but n'est pas ici d'opposer ces diérentes théories : rien ne permet de dire
que l'une d'elles soit totalement et dénitivement juste ! Si j'ai choisi d'étudier
la métrique triviale de Ni et ses implications, c'est parce-qu'un raisonnement
élémentaire nous conduit directement vers elle. Mon intention n'est pas de défendre la théorie de Ni contre celle d'Einstein : la seule chose qui m'intéresse
dans la théorie de Ni, c'est sa métrique, qui contient, selon moi, au moins un
embryon de vérité ; et nous allons voir jusqu'où elle nous mène, et quelles questions elle soulève.
Etudions maintenant les rapports entre les métriques de Ni et de Schwarzschild.
Prenons comme base de départ la métrique triviale de Ni au voisinage d'un
corps massif, en coordonnées polaires :
2Φ
2Φ
2Φ
ds2 = c2 .e c2 .dt2 − e− c2 .dr2 − e− c2 .r2 .dθ2 .
Serait-il possible de modier légèrement cette métrique, en s'inspirant des
idées d'Einstein ?
32
Considérons d'abord un observateur tombant vers le Soleil en ligne droite
(sa vitesse étant supposée nulle à l'inni). Rappelons-nous l'expérience de pensée d'Einstein : un physicien enfermé dans un ascenseur en chute libre se croit
immobile. S'il croise sur son chemin des "observateurs locaux" (immobiles par
rapport au Soleil), il sera en désaccord avec eux sur les mesures de distances
dans la direction radiale (d'après la relativité restreinte), mais il y aura accord
sur les distances élémentaires perpendiculaires au vecteur vitesse. La chute libre
de l'observateur modie son évaluation des distances selon la direction radiale
seulement ; donc, selon le principe d'équivalence fort, la présence d'une masse
ponctuelle au centre d'un cercle modie le rayon de ce cercle, mais pas son péΦ
rimètre. Cette remarque va nous amener à supprimer le coecient e− c2 devant
r2 dθ2 dans le dernier terme de notre métrique, qui devient donc :
2Φ
2Φ
ds2 = c2 .e c2 .dt2 − e− c2 .dr2 − r2 .dθ2 .
Considérons maintenant la seconde expérience de pensée d'Einstein : le physicien se trouve maintenant sur la plate-forme tournante, à la distance r du
centre O ; il estime que la force centrifuge qu'il subit est une force gravitationnelle. La vitesse est : v = rω (où ω désigne la vitesse angulaire) ; si on désigne par
Φ la diérence de potentiel entre P et O, c'est-à-dire le travail de la force centri2 2
fuge entre P et O, on a : Φ = − r 2ω ; le coecient
de dilatation
du temps,
calculé
q
q
q
v2
r2 ω2
selon la relativité restreinte, est donc : 1 − c2 = 1 − c2 = 1 + 2Φ
c2 . Ce
physicien va estimer que cette distorsion du temps est due au champ gravitaΦ
c2
tionnel
q Φ ; il va donc nous suggèrer de modier notre2Φmodèle, en remplaçant e2Φ
− 2
2Φ
c2 devient 1 +
c
par 1 + 2Φ
c2 dans notre métrique ; le coecient e
c2 , et e
1
devient 1+ 2Φ .
c2
Après avoir fait ces deux petites manipulations, nous obtenons la métrique
suivante :
ds2 =
1+
2Φ
c2
.c2 .dt2 −
1
.dr2 − r2 .dθ2
1 + 2Φ
2
c
ou, si on préfère :
2
ds =
sif.
2GM
1−
rc2
.c2 .dt2 −
1
1−
2GM
rc2
.dr2 − r2 .dθ2 .
C'est exactement la métrique de Schwarzschild au voisinage d'un corps mas-
Nous pouvons aussi réécrire
q cette métrique en imaginant un repère en chute
libre radiale, à la vitesse v = 2GM
(vitesse d'évasion évaluée localement). Ceci
r
v2
2GM
signie que 1 − c2 = 1 − rc2 .
33
Si nous notons dlt = r2 .dθ2 une longueur innitésimale "tangentielle", c'està-dire perpendiculaire à la direction de la chute (qui est verticale), la métrique
s'écrit :
ds2 =
1−
2GM
rc2
.c2 .dt2 −
1
1−
2GM
rc2
.dr2 − dlt2 .
Quant on passe du repère local immobile au repère local en chute libre, les
mesures innitésimales dt, dr et dlt se transforment en dt0 , dr0 et dlt0 . D'après
la relativité restreinte :
q

q
2

dt0 = 1 − vc2 .dt = 1 − 2GM


rc2 .dt ;




dr0 = p dr v2 = p dr2GM ;
1− 2

1− 2

rc
c




 0
dlt = dlt .
1
= 1 − 2GM
dt2 , dr02 = 1− 2GM
dr2 et dlt02 = dlt2 ; par
rc2
On a donc : dt02
conséquent, la métrique peut s'écrire ainsi :
rc2
ds2 = c2 .dt02 − dr02 − dlt02 .
Attention : le raisonnement que nous venons de faire ici est en contradiction
avec celui que nous avions fait pour la métrique de Ni, puisqu'ici nous avons supposé que le point de vue local et le point de vue distant dièrent, conformément
aux formules de la relativité restreinte, par l'introduction d'une vitesse virtuelle
égale à la vitesse d'évasion, et non par la diérence de potentiel gravitationnel ;
dans l'introduction de la métrique de Ni, nous avions supposé au contraire que
la diérence des points de vue était due uniquement à la diérence de potentiel. La métrique de Ni suppose une réalité physique qui justie les distorsions
observées, tandis que dans la métrique de Schwarzschild elles sont justiées par
la géométrie seule. La relativité générale prépare ainsi l'élimination des notions
de force et de potentiel gravitationnel.
La métrique de Schwarzschild se transforme (localement) en métrique de
Minkowski (métrique euclidienne relativiste) par simple changement de repère
(passage de l'observateur local immobile à l'observateur en chute libre). Ceci
signie que la courbure locale de l'espace-temps est une illusion qui disparaît
dans un repère convenablement choisi.
Posons-nous maintenant cette question : existe-t-il un changement de variables simple permettant de passer de la métrique de Schwarzschild à celle de
Ni ? Dans ce cas, on pourrait considérer qu'il s'agit de deux expressions d'une
même métrique. Mais non : c'est impossible, pour deux raisons au moins.
1
Première raison : dans la métrique de Schwarzschild, le coecient 1− 2GM
rc2
(qui multiplie dr2 , dans le second membre de la métrique) tend vers l'inni
34
quand r tend vers 2GM
c2 , ce qui fait apparaître une singularité associée à la
sphère de Schwarzschild ; cette singularité n'existe pas dans la métrique de Ni,
2GM
puisque le coecient correspondant, e− rc2 , ne diverge pas.
Seconde raison : appelons r1 la distance radiale qui intervient dans la métrique de Schwarzschild, et r2 celle qui intervient dans la métrique de Ni ; en
identiant les derniers termes des deux métriques, nous obtenons :
k
2k
r12 dθ2 = e r2 r22 dθ2 , donc : r1 = e r2 r2 .
Si nous faisons tendre r2 vers l'inni, r1 tend aussi vers l'inni : jusqu'ici, rien
de plus normal. Mais si, maintenant, nous faisons tendre r2 vers 0, alors r1 ne
tend pas vers 0, mais, une fois encore, vers l'inni ! Ceci entraîne qu'il est impossible d'établir une correspondance bijective entre r1 et r2 . Les deux métriques
sont fondamentalement incompatibles, du moins pour les valeurs de r proches
de 2GM
c2 , ou inférieures.
Quelle métrique allons-nous choisir ?
Comme nous avons calculé ce coecient e c2 en utilisant uniquement la loi
de la gravitation universelle de Newton, il apparaît de manière évidente qu'il
y a conit entre cette loi et le principe d'équivalence fort. La loi de Newton
n'ayant jamais (ou pas encore ?) été mise en échec, nous n'avons pas de raison
de l'abandonner ici. De plus, comme nous venons de le voir, la métrique de
Schwarzschild fait apparaître des singularités : c'est l'un des reproches majeurs
qui sont faits à la relativité générale. Evitons donc de nous précipiter dans cette
direction, tant que nous n'aurons pas de vraies raisons de le faire !
Φ
Nous n'oublions pas de placer ici un caillou blanc, car nous venons d'entrevoir une passerelle qui pourrait nous ramener vers la métrique de Schwarzschild.
17 Le formalisme post-newtonien paramétrisé
Les théories de la gravitation relativiste peuvent être étudiées et classées
selon les méthodes du "formalisme post-newtonien paramétrisé", qui attribue à
chaque théorie des coecients α, β , γ , etc.
La métrique que nous avons obtenue peut s'écrire :
2Φ
2Φ
2Φ
kc2
ds = c2 e c2 dt2 − e− c2 dr2 − e− c2 r2 dθ2 (avec Φ = − GM
r = − r ), ou encore,
en remplaçant c par 1 (selon l'usage des physiciens relativistes) :
2
ds2 = e2Φ dt2 − e−2Φ dr2 − e−2Φ r2 dθ2 .
En développant en série les coecients de la métrique, on obtient :
e2Φ = 1 + 2Φ + 2Φ2 + ...
35
−e−2Φ = −1 + 2Φ − 2Φ2 + ...
Ceci permet de calculer facilement les trois premiers coecients post-newtoniens
α, β , γ , car, d'après le formalisme post-newtonien paramétrisé, le premier développement en série est égal à :
1 + 2αΦ + 2βΦ2 + ...
et le second à :
−1 + 2γΦ + ...
La comparaison montre que notre métrique correspond à α = β = γ = 1,
ce qui est une condition nécessaire (mais peut-être pas susante) pour qu'une
théorie de la gravitation soit viable, compte-tenu de l'ensemble des mesures effectuées à ce jour dans le système solaire. Dans la suite de ce travail, le but
premier sera de montrer que notre métrique permet de retrouver les résultats
essentiels de la gravitation newtonienne et de la relativité générale ; mais nous
savons d'avance qu'elle va passer avec succès les principaux tests classiques.
18 Principes d'équivalence
Einstein a cherché à baser la relativité générale sur des principes.
Le premier, qu'on appelle aujourd'hui "principe d'équivalence faible", dit
que la masse gravique et la masse inerte sont équivalentes. Il a pour conséquence que, dans un champ gravitationnel donné, tous les corps subissent la
même accélération. Ce principe a toujours été conrmé, en particulier par les
expériences extrêmement précises d'Eötvös, de sorte qu'il ne semble pas très raisonnable, dans l'état actuel de nos connaissances, de le mettre en doute. Nous
avons implicitement admis ce principe, puisque nous avons fait intervenir dans
~
F
(loi fondamentale de la mécanique newtonienne,
les deux formules ~Γ = ddtw~ = m
GmM
~
relecture relativiste) et F = − r2 ~u (loi de la gravitation universelle) la même
expression de la masse m ; c'est ce qui nous a permis d'éliminer la masse, et
d'obtenir la formule : ~Γ = ddtw~ = − GM
u.
r2 ~
De plus, cette masse m correspond à la masse maupertuisienne : m = cE2 ;
comme E est l'énergie totale du corps en mouvement, on peut dire que nous
avons attribué le même rôle gravitationnel à toutes les formes d'énergie. La force
attractive entre deux corps est proportionnelle à l'énergie de chacun d'eux, et
non à leurs masses au repos. D'ailleurs la "masse au repos" d'un corps composé (étoile, planète, atome ...) inclut déjà diverses formes d'énergie (cinétique,
électromagnétique, etc ...) et ne peut pas être interprétée comme une caractéristique absolue de ce corps (comme la charge électrique par exemple) : les masses
qui interviennent en mécanique classique sont, en réalité, toujours maupertuisiennes ! C'est la relativité restreinte qui nous enseigne que la masse absolue est
36
un mythe : seules existent les masses maupertuisiennes (relatives), c'est-à-dire
l'énergie.
Nous avons donc admis implicitement l'équivalence de toutes les formes
d'énergie dans l'attraction gravitationnelle : c'est le second principe d'équivalence, qu'on appelle parfois le "principe d'équivalence d'Einstein", qui est respecté par la relativité générale et par la plupart des théories relativistes de la
gravitation. Mais ce principe ne doit pas être considéré comme un dogme, et
doit pouvoir être remis en question si les faits l'exigent...
Le troisième principe d'équivalence est bien diérent des deux premiers :
c'est le "principe d'équivalence fort". Il dit que l'eet d'un champ gravitationnel est équivalent à celui d'une accélération, ou encore, si on préfère, que l'eet
de la gravitation peut être (localement) "eacé" si on choisit un repère convenablement accéléré. Autrement dit, si un laboratoire fermé se trouve dans un
ascenseur en mouvement ou sur une plate-forme en rotation (pour reprendre
les célèbres expériences de pensée d'Einstein), ou encore dans une fusée, aucune
expérience embarquée ne permettra de prouver que les forces subies ne sont pas
gravitationnelles.
Précisons la signication de ce principe d'équivalence fort.
Les physiciens distinguent deux sortes de forces : les unes sont de "vraies"
forces au sens physique du terme ; elles mettent en jeu de véritables interactions, avec des échanges d'énergie, et ont une réalité objective indépendante
de l'observateur. Les autres ne sont que des illusions, qui varient selon l'état de
mouvement de l'observateur. Dans cette seconde catégorie, citons la force centrifuge ou la force de Coriolis. Ce sont des forces qu'on peut faire disparaître en se
plaçant dans un repère en mouvement convenablement choisi. Selon Einstein, les
"forces" gravitationnelles seraient, elles aussi, purement illusoires ; son postulat
est qu'il doit être possible de les faire disparaître en jouant sur le choix du repère.
Si ce postulat est exact, alors la gravitation doit être exclue du cercle des
forces fondamentales, qui ne comportera plus que trois membres : l'électromagnétisme, l'interaction faible et l'interaction forte.
Rappelons que la théorie de l'électromagnétisme est actuellement bien décrite grâce à son interprétation quantique : l'électrodynamique quantique. Dans
ce modèle, c'est l'échange de photons (réels ou virtuels) entre particules chargées
qui est la clé des interactions. Ces échanges ont une réalité physique. Les interactions faible et forte peuvent s'interpréter de manière analogue (en remplaçant
le photon par d'autres particules : bosons ou gluons). On pourrait imaginer d'interpréter également la gravitation par des échanges de particules (les gravitons) ;
mais cette direction de recherche est incompatible avec le principe d'équivalence
fort.
37
19 Le pari d'Einstein
Le choix d'Einstein, qui consiste à privilégier le principe d'équivalence fort
par rapport à la loi de Newton, sur la seule base d'expériences de pensée, constitue ce que j'appelle "le pari d'Einstein".
Les raisons de ce pari sont faciles à comprendre : à l'époque d'Einstein (et
probablement encore aujourd'hui), les données observationnelles étaient insufsantes pour conduire de manière directe à une théorie unique et certaine ; un
acte de foi était nécessaire pour pallier ce manque. Le choix du principe d'équivalence fort était précisément l'acte de foi qui devait permettre à Einstein de
résoudre de manière totale le problème de la gravité grâce à la virtuosité mathématique, en marginalisant le recours à l'observation et à l'expérimentation. En
pariant sur le principe d'équivalence fort, Einstein était parfaitement conscient
qu'il tenait l'élément clé qui allait lui permettre de mettre en place sa stratégie
de géométrisation de la gravité ; il entrevoyait sans doute déjà les outils mathématiques qu'il allait pouvoir utiliser, à commencer par les géodésiques.
Mais notre but est beaucoup plus limité : nous nous contenterons d'une
modeste approche, un simple débroussaillage. Pour atteindre ce but, nous devons nous appuyer sur des hypothèses minimales (selon le principe du rasoir
d'Occam) : nous n'utiliserons pas le principe d'équivalence fort, parce-que nous
n'avons pas besoin de cette hypothèse ; nous ne ferons aucun acte de foi, et nous
continuerons à travailler avec la métrique triviale de Ni, an d'étudier jusqu'où
elle peut nous conduire.
Bien entendu, on peut considérer que notre façon de résoudre le paradoxe de
Schild est basée, elle aussi, sur un pari. Plus précisément, lorsque nous supposons que le potentiel gravitationnel modie les règles de la même manière dans
toutes les directions, nous faisons un choix, qui est justié par notre parti-pris
de simplicité : nous estimons qu'il faut explorer les solutions les plus simples
avant de faire appel à des outils plus sophistiqués. Ce choix est contraire à la
relativité générale, comme on vient de le voir. Il est destiné à être testé, puis
révisé si nécessaire.
Faut-il douter du principe d'équivalence fort, qu'Einstein lui-même a qualié
d'"idée la plus heureuse de son existence" ? Plus exactement, il faut attendre,
pour l'adopter, d'y être contraint par la nécessité. En attendant, il est clair
qu'une étude de la gravitation doit s'appuyer en priorité sur la loi de Newton.
Le jour où cette loi sera prise en défaut, le moment sera venu d'en chercher
la raison, an de la corriger. Jusqu'à preuve du contraire, le seul défaut connu
de la loi de Newton est de ne pas être compatible avec la relativité restreinte ;
mais, comme nous venons de le voir, ce défaut peut être corrigé très simplement.
38
20 Equations des géodésiques en métrique de Ni
Nous voudrions maintenant tester la cohérence de nos équations avec la notion de géodésique, qui est à la base de la relativité générale.
Comme nous allons étudier le système solaire, nous exprimons la métrique
en coordonnées polaires ; la distance d'une planète par rapport au Soleil est
désignée par r. Sous forme matricielle, la métrique s'écrit :

2Φ
c2 e c2

(gij ) = 
0
0
0
2Φ
−e− c2
0
0
0
−e
− 2Φ
c2


c2 e−
 
0
=
2
0
r
2k
r
0
2k
−e r
0

0
0
−e
2k
r
r2

.
On a donc : g11 = c2 e− r , g22 = −e r , g33 = −e r r2 ; d'autre part, pour
i 6= j : gij = 0 (car notre matrice est diagonale).
2k
2k
2k
De plus, on notera : x1 = t, x2 = r, x3 = θ.Attention : les indices placés en
haut ne sont pas des exposants !
Le calcul des Rgéodésiques revient à rechercher les trajectoires qui maximisent
le temps propre ds.
Il existe deux méthodes principales pour calculer ces géodésiques : la première (la plus ancienne) est la méthode des variations ; elle s'inspire directement
du calcul innitésimal de Newton et Leibniz, qu'elle utilise d'une manière très
astucieuse ; elle a été mise au point par Lagrange et Euler. La seconde fait appel
à des notions plus abstraites (mais très rigoureuses) du calcul tensoriel, et plus
précisément aux symboles de Christoel.
Les équations ainsi obtenues peuvent s'écrire (en notation tensorielle) de la
manière suivante :
d
ds
gik
dxi
ds
=
1 dxi dxj ∂gij
.
2 ds ds ∂xk
Dans cette égalité, les indices i, j , k, qu'ils soient en position basse ou haute,
peuvent être égaux à 1, 2 ou 3 ; i et j sont des indices muets (ils sous-entendent
des sommations, selon la convention d'Einstein) ; k est le seul véritable indice,
ayant la même valeur dans les deux membres ; donc, à elle seule, l'égalité résume
neuf équations, qui expriment les contraintes imposées aux géodésiques. Mais
gik s'annule pour i 6= k , et gij s'annule pour i 6= j , donc il reste 3 équations
(une pour chaque valeur de k) :
d
ds
gkk
dxk
ds
"
#
2
1 X
dxi
∂gii
=
.
2 i
ds
∂xk
39


1)





2)






3)
d
ds
g11
dt
ds
=
1
2
dt 2 ∂g11
ds
∂t
+
1
2
dr 2 ∂g22
ds
∂t
+
1
2
dθ 2 ∂g33
ds
∂t
;
d
ds
g22
dr
ds
=
1
2
dt 2 ∂g11
ds
∂r
+
1
2
dr 2 ∂g22
ds
∂r
+
1
2
dθ 2 ∂g33
ds
∂r
;
d
ds
g33
dθ
ds
=
1
2
dt 2 ∂g11
ds
∂θ
+
1
2
dr 2 ∂g22
ds
∂θ
+
1
2
dθ 2 ∂g33
ds
∂θ .
Nous savons que :
2
2k
∂g11
− 2k
r ,
g11 = c2 e− r , donc : ∂g∂t11 = 0, ∂g∂r11 = 2kc
r2 e
∂θ = 0 ;
2k
2k
∂g
∂g
∂g
2k
22
22
22
g22 = −e r , donc : ∂t = 0, ∂r = r2 e r , ∂θ = 0 ;
2k
2k
33
g33 = −e r r2 , donc : ∂g∂t33 = 0, ∂g∂r33 = 2(k − r) e r , ∂g
∂θ = 0.
Faisons les substitutions dans les équations des géodésiques ; il vient :


1)







2)







 3)
d
ds
c2 e−
d
ds
−e
2k
r
dr
ds
d
ds
−e
2k
r
r2
2k
r
dt
ds
=
dθ
ds
=0;
kc2
r2
e−
2k
r
dt 2
ds
+
k
r2
e
2k
r
dr 2
ds
+ (k − r) e
2k
r
dθ 2
ds
;
= 0.
dt
La première égalité signie que la quantité e− r ds
est constante sur la
géodésique. Nous l'avons déjà rencontrée précédemment ; elle exprime la conservation de l'énergie. Elle provient du fait queles dérivées partielles de g11 , g22 et
g33 par rapport à t sont nulles (champ statique).
2k
La troisième signie que la quantité e r r2 dθ
ds est, elle aussi, constante. Nous
l'avons déjà rencontrée, elle aussi. Elle exprime la conservation du moment cinétique. Elle provient du fait queles dérivées partielles de g11 , g22 et g33 par
rapport à θ sont nulles (champ à symétrie sphérique).
2k
La seconde est un peu plus complexe : je choisirai de ne pas l'utiliser, et de
baser tous mes calculs, intégralement, sur les trois équations que je considère
comme essentielles : la métrique de l'espace-temps, la conservation de l'énergie et la conservation du moment cinétique. Nous pouvons cependant l'analyser
brièvement ; elle peut s'écrire :
d
ds
−e
2k
r
−e
2k
r
dr
ds
d2 r 2k 2k
+ er
ds2 r2
2
2
2
2k
kc2 − 2k dt
k 2k dr
dθ
r
r
r
+
+
(k
−
r)e
;
e
e
r2
ds
r2
ds
ds
2
2
2
2
2k
dr
kc2 − 2k dt
k 2k dr
dθ
r
r
r
= 2 e
+ 2e
+(k−r)e
;
ds
r
ds
r
ds
ds
=
40
e
2k
r
d2 r
kc2 − 2k
=
−
e r
ds2
r2
dt
ds
2
kc2 − 4k
d2 r
=
−
e r
dt2
r2
2
2
2k
k 2k dr
dθ
r
r
+ 2e
+ (r − k)e
;
r
ds
ds
2
2
k dr
dθ
+ 2
+ (r − k)
.
r
dt
dt
Sur une orbite circulaire (r=constante), on aura :
kc2 − 4k
d2 r
=
−
e r + (r − k)
dt2
r2
dθ
dt
2
dr
dt
= 0, donc, pour k << r :
GM
≈ − 2 + (r − k)
r
dθ
dt
2
.
Ceci signie que le mobile (la planète) subit une accélération centrale (dirigée
vers le Soleil) égale à GM
r 2 (c'est l'accélération gravitationnelle newtonienne) di2
minuée de la quantité (r − k) dθ
(qui correspond à peu près à l'accélération
dt
centrifuge de Newton, à un détail près : r est remplacé par r − k).
Voici donc les trois équations que nous avons choisi de privilégier :

2k
2k
2k

1) ds2 = c2 e− r dt2 − e r dr2 − e r r2 dθ2 (équation de la métrique) ;





2k
2) E = mE0 c2 = e− r cdt
ds = constante (conservation de l'énergie) ;





 3) µ = µ = e 2k
dθ
r r2
m0 c
ds = constante (conservation du moment cinétique).
Nous avions déjà établi ces trois formules avant de parler de géodésiques ;
le fait qu'un raisonnement basé uniquement sur les géodésiques nous conduise
précisément aux mêmes lois de conservation (conservation de l'énergie et conservation du moment cinétique) nous conforte dans l'idée que ces lois sont bien les
clés de l'étude du système solaire : la cohérence de ces équations avec la notion
de géodésique est parfaite jusqu'ici. Elles serviront de base à la suite de notre
travail.
Dans le calcul ci-dessus, il apparaît clairement que l'énergie se conserve uniquement parce-que le champ est statique : ∂Φ
∂t = 0. Quand le champ ne sera plus
statique, l'énergie du mobile pourra varier. Ceci ne doit pas nous surprendre.
Pensons par exemple à l'"eet catapulte" : lorsqu'on désire envoyer une sonde
spatiale sur une orbite d'évasion du système solaire, il n'est pas nécessaire de
lui fournir d'emblée une vitesse égale à la vitesse d'évasion. L'astuce est de lui
fournir seulement l'énergie convenable pour atteindre une grosse planète comme
Jupiter. Ensuite, en utilisant le sillage de cette planète, la sonde est propulsée
sur une orbite d'évasion. Le "sillage" de Jupiter est une région de l'espace où ∂Φ
∂t
est positif, ce qui permet à la sonde de faire une provision d'énergie. Il n'y a pas
de violation du principe de conservation de l'énergie, à condition que l'énergie
récupérée par la sonde soit prélevée sur l'énergie de Jupiter.
41
21 Version cartésienne des géodésiques
Nous allons maintenant examiner le cas général (Φ quelconque), en utilisant
un repère cartésien.
Sous forme cartésienne, la métrique peut s'écrire (en utilisant les coordonnées établies par l'observateur distant, et en négligeant la troisième dimension
spatiale) :
2Φ
2Φ
2Φ
ds2 = e c2 c2 dt2 − e− c2 dx2 − e− c2 dy 2 .
Posons : f = e c2 et g = −e− c2 ; la métrique s'écrit alors alors :
2Φ
2Φ
ds2 = f.(cdt)2 + g.dx2 + g.dy 2 .
De plus :
∂f
2 2Φ
= 2 e c2
c∂t
c
∂f
2 2Φ
= 2 e c2
∂x
c
2 2Φ
∂f
= 2 e c2
∂y
c
∂Φ
,
c∂t
∂Φ
,
∂x
∂Φ
,
∂y
2Φ
2
∂g
= 2 e − c2
c∂t
c
2Φ
∂g
2
= 2 e − c2
∂x
c
2Φ
2
∂g
= 2 e − c2
∂y
c
∂Φ
,
c∂t
∂Φ
,
∂x
∂Φ
.
∂y
Nous utilisons ici des dérivées partielles, car Φ, f et g varient en fonction de
t, x et y .
Comme nous avons limité à trois le nombre de variables, nous allons obtenir
trois équations pour les géodésiques :



1)







2)








 3)
d
ds
f. cdt
ds =
d
ds
g. dx
ds =
d
ds
g. dy
ds
=
1
2
1
2
1
2
cdt 2 ∂f
ds
c∂t
1
2
+
cdt 2 ∂f
ds
∂x
+
cdt 2 ∂f
ds
∂y
+
1
2
42
1
2
dx 2 ∂g
ds
c∂t
+
dx 2 ∂g
ds
∂x
+
dx 2 ∂g
ds
∂y
+
1
2
1
2
1
2
dy
ds
dy
ds
2
2
dy
ds
2
∂g
c∂t
∂g
∂x
;
∂g
∂y .
;
Dans la première équation, remplaçons f , g et leurs dérivées partielles par
leurs expressions en fonction de Φ :
d
ds
e
cdt
ds
2Φ
c2
1 2Φ ∂Φ
= 2 e c2
c
c∂t
cdt
ds
2
2Φ ∂Φ
1
+ 2 e − c2
c
c∂t
dx
ds
2
2Φ ∂Φ
1
+ 2 e − c2
c
c∂t
dy
ds
2
.
Par conséquent :
dE
1 ∂Φ
= 2
ds
c c∂t
"
e
2Φ
c2
cdt
ds
2
+e
− 2Φ
2
c
dx
ds
2
− 2Φ
2
+e
c
dy
ds
2 #
.
Dans le crochet, on a :
2Φ
e c2
cdt
ds
2
2Φ
+e− c2
dx
ds
2
2Φ
+e− c2
dy
ds
2
2Φ
= e c2
cdt
ds
2
2Φ
+e− c2
v2
loc
1+
2w
1
w
w
c2
+
=
+ sh2
= ch
=
... = ch
2
2
v
v
c
c
c
1 − cloc
1 − cloc
1−
2
2
2
dl
ds
2
vloc
c2
2
vloc
c2
2
= ...
.
L'équation pourra donc s'écrire, par exemple :
∂ Φ2 1 +
dE
= c
ds
c∂t 1 −
2
vloc
c2
2
vloc
c2
.
Faisons de même dans la seconde équation :
d
ds
2Φ
−e− c2
dx
ds
=
1 2Φ2 ∂Φ
ec
c2
∂x
dp
1 ∂Φ
− x = 2
ds
c ∂x
"
e
2Φ
c2
cdt
ds
cdt
ds
2
+
2
+e
1 − 2Φ2 ∂Φ
e c
c2
∂x
− 2Φ
2
c
dx
ds
+e
v2
loc
c2
v2
1− loc
c2
∂ Φ2 1 +
dpx
=− c
ds
∂x 1 −
2
vloc
c2
2
vloc
c2
.
dpy
∂ Φ2 1 +
=− c
ds
∂y 1 −
2
vloc
c2
2
vloc
c2
.
Et, si nous rétablissons la troisième dimension spatiale :
∂ Φ2 1 +
dpz
=− c
ds
∂z 1 −
43
2
vloc
c2
2
vloc
c2
.
dx
ds
2
1+
Comme précédemment, remplaçons le crochet par
Pour la même raison :
2
+
− 2Φ
2
c
:
1 − 2Φ2 ∂Φ
e c
c2
∂x
dy
ds
2 #
.
dy
ds
2
;
Multiplions par m0 c2 ; nous obtenons (sous forme vectorielle, en notant vloc =
v) :

E






 c px 

d 
 = m0 . 1 +



ds 
1−

 c py 


c pz
∂Φ
c∂t

 ∂Φ
 −
v
 ∂x
2
c
.
v2 
∂Φ
c2  −
 ∂y

2





.




− ∂Φ
∂z
On aura reconnu, à gauche, la dérivée du quadrivecteur impulsion-énergie
par rapport au temps propre s.
Dans le membre de droite, on trouve un quadrivecteur qui ressemble au quadrigradient du potentiel Φ (gradient quadridimensionnel, par rapport aux quatre
coordonnées de Minkowski : ct, x, y , z ), mais avec la signature (+, −, −, −) au
lieu de (+, +, +, +) : c'est ce que j'appelle le quadrigradient signé. On ne doit pas
s'étonner de voir apparaître ici un quadrigradient signé : en eet, nous voyons,
dans le membre de gauche de l'égalité, un quadrivecteur impulsion-énergie, qui
est contravariant, ce qui signie que, dans un changement de repère, il se transforme selon la matrice de Lorentz directe ; il est bien connu que le quadrigradient
usuel (non signé) est covariant : il se transforme selon la matrice de Lorentz
inverse. On peut montrer facilement que quadrigradient signé, contrairement
au quadrigradient usuel, est contravariant, comme le quadrivecteur impulsionénergie. Pour cela, il sut de composer la matrice de passage du quadrigradient
signé au quadrigradient usuel par la matrice de Lorentz, puis par la matrice de
passage du quadrigradient usuel au quadrigradient signé :
 
 

0
ch wc sh wc 0
1 0
0
0  .  sh wc ch wc 0  .  0 −1 0  = ...
−1
0
0
1
0 0 −1


−sh wc 0
ch wc
w
ch wc
0 .
...  −sh c
0
0
1
q
q
2
2Φ
Φ
− 2Φ
2
2
2 2
2
2
c
c
c
Comme ds = e c dt − e dl = e .c.dt. 1 − vcloc
2 , on peut écrire :

 ∂Φ 

E
c∂t






 ∂Φ 
r
 c px 


2
v
2
 − ∂x 

d 

 = m0 .e cΦ2 . 1 − v . 1 + c22 
 ;


c.dt 
c2 1 − vc2 
 c py 
 − ∂Φ 


 ∂y 




∂Φ
c pz
− ∂z

1
 0
0
0
−1
0
44

E


∂Φ
c∂t




 ∂Φ

 −
 c px 
2

 ∂x
Φ
d 
w
v
 = m0 .e c2 .ch . 1 +


.

 ∂Φ

2
c.dt 
c
c

 −
c
p
y

 ∂y




c pz
− ∂Φ
∂z

 ∂Φ 

E
c∂t





 ∂Φ 


 c px 

−
2
 E
 ∂x 
d 
= . 1+ v



.

 ∂Φ .
2
c.dt 
c2
 −
 c py  c


 ∂y 





∂Φ
c pz
− ∂z
On a donc :





 ;




dE
E
v2
∂Φ
= 2. 1 + 2 .
, et :
c.dt
c
c
c∂t
d~
p
E
v2 ~
= − 2 . 1 + 2 .5
Φ.
dt
c
c
~ désigne ici le gradient tridimensionnel.
Le nabla 5
On peut s'étonner de la présence du facteur 1+ vc2 ; on pourrait même penser
que nous avons commis une petite erreur de signe. Si les équations des géodésiques s'écrivaient :
2
d
ds
"
#
2
1 X
dxi
∂gii
dxk
gkk
=±
,
ds
2 i
ds
∂xk
le signe étant déterminé par la signature de la métrique, à savoir (+ − −−),
alors le crochet que nous avons rencontré dans nos calculs, dans cette section et
2
la précédente, serait égal à 1, et le facteur 1 + vc2 disparaîtrait.
Mais nous ne ferons pas cette manipulation, pour plusieurs raisons.
La première est que l'accélération centrifuge, calculée dans la section précédente, changerait de signe et deviendrait centripète, ce qui n'est pas acceptable.
Seconde raison : pour un rayon lumineux (v = c), ce facteur 1 + vc2 est égal à
2 ; c'est pourquoi la déviation de la lumière sera plus importante qu'en gravitation newtonienne, d'un facteur 2, précisément, conformément aux observations.
2
45
Troisième raison : sur une orbite elliptique, v augmente quand la planète se
2
rapproche du Soleil, donc le facteur 1 + vc2 également, ce qui fait que l'accélération centripète va alors augmenter un peu plus qu'en gravitation newtonienne,
ce qui va entraîner la précession du périhélie.
Dans le cas du système solaire, la vitesse locale v est dénie par rapport
au Soleil, qui dénit lui-même la notion d'immobilité. Mais dans le cas général,
avec plusieurs corps de masses non négieables, en mouvement les uns par rapport aux autres, cette notion d'"immobilité gravitationnelle" devra être dénie.
Nous en reparlerons.
22 Tenseur de Ricci en métrique de Ni
Nous allons aborder ici des questions un peu plus techniques, faisant intervenir les tenseurs.
Pour la rigueur des calculs, nous allons rétablir la troisième dimension spatiale, et nous allons travailler en coordonnées sphériques ; les coordonnées d'un
point de l'espace-temps seront donc : (ct, r, θ, φ). Les trois coordonnées spatiales (r, θ, φ) sont reliées aux coordonnées cartésiennes (x, y, z) par les formules :

x = r.sinθ.cosφ ;





y = r.sinθ.sinφ ;





z = r.cosθ.
En diérenciant ces égalités, nous obtenons :

dx = dr.sinθ.cosφ + r.cosθ.dθ.cosφ − r.sinθ.sinφ.dφ ;





dy = dr.sinθ.sinφ + r.cosθ.dθ.sinφ + r.sinθ.cosφ.dφ ;





dz = dr.cosθ − r.sinθ.dθ.
La distance élémentaire dl entre deux points très proches s'évalue ainsi :
dl2 = dx2 + dy 2 + dz 2 ;
dl2 = (sinθ.cosφ.dr + r.cosθ.cosφ.dθ − r.sinθ.sinφ.dφ)2 ...
... + (sinθ.sinφ.dr + r.cosθ.sinφ.dθ + r.sinθ.cosφ.dφ)2 ...
... + (cosθ.dr − r.sinθ.dθ)2 ;
dl2 = (sin2 θ.cos2 φ + sin2 θ.sin2 φ + cos2 θ).dr2 ...
46
... + (r2 .cos2 θ.cos2 φ + r2 .cos2 θ.sin2 φ + r2 .sin2 θ).dθ2 ...
... + (r2 .sin2 θ.sin2 φ + r2 .sin2 θ.cos2 φ).dφ2 ...
... + 2.(r.cosθ.sinθ.cos2 φ + r.cosθ.sinθ.sin2 φ − r.cosθ.sinθ).dr.dθ...
... + 2.(−r.sin2 θ.cosφ.sinφ + r.sin2 θ.cosφ.sinφ).dr.dφ...
... + 2.(−r2 .cosθ.sinθ.cosφ.sinφ + r2 .cosθ.sinθ.cosφ.sinφ).dθ.dφ.
Après simplication :
dl2 = dr2 + r2 .dθ2 + r2 .sin2 θ.dφ2 .
La métrique triviale de Ni s'écrit donc, en coordonnées sphériques :
ds2 = e−
2k
r
.c2 .dt2 −e
2k
r
.dl2 = e−
Nous allons noter : α = e
− 2k
r
2k
r
.c2 .dt2 −e
2k
r
.dr2 −e
, et, par suite :
1
α
2k
r
=e
.r2 .dθ2 −e
2k
r
2k
r
.r2 .sin2 θ.dφ2 .
.
La métrique pourra donc s'écrire :
ds2 = α.c2 .dt2 −
1 2
1
1
1
.dl = α.c2 .dt2 − .dr2 − .r2 .dθ2 − .r2 .sin2 θ.dφ2 .
α
α
α
α
Nous noterons α̇ et α̈ les dérivées partielles d'ordre un et deux de α par
rapport à r :
α̇ =
∂α
∂2α
et α̈ = 2 .
∂r
∂r
Comme, dans le cas présent, α ne dépend que de r, on aurait pu se dispenser
de parler de dérivées "partielles".
Attention : contrairement à un usage répandu chez les physiciens, il ne s'agit
pas de dérivées par rapport au temps !
On aura donc :
2k − 2k
.e r ;
r2
2k
4k − 2k
4k
k
r
− 3 .e
=− 3. 1−
.e− r .
r
r
r
α̇ =
α̈ =
4k 2 − 2k
.e r
r4
Selon l'usage du calcul tensoriel, nous noterons :

dx1 = c.dt ;








 dx2 = dr ;


dx3 = dθ ;







dx4 = dφ.
47
Les indices placés en haut ne sont pas des exposants, mais des indices contravariants ; les indices placés en bas sont covariants.
En coordonnées sphériques, les composantes covariantes de la métrique sont :

2k

g11 = e− r = α ;






2k


 g22 = −e r = − α1 ;
2

2k


g33 = −r2 .e r = − rα ;






2
2
2k

θ
g44 = −r2 .sin2 θ.e r = − r .sin
.
α
Ses composantes contravariantes sont :

2k

g 11 = e r = α1 ;






2k


 g 22 = −e− r = −α ;

2k


g 33 = − r12 .e− r = − rα2 ;






 44
α
1
− 2k
r = −
g = − r2 .sin
2 θ .e
r 2 .sin2 θ .
Les deux matrices sont diagonales (pour i 6= j , on a gij = g ij = 0) et inverses
l'une de l'autre.
Notre but est de calculer le tenseur de courbure de Ricci Rij associé à cette
métrique, puis le scalaire de Ricci R.
Pour cela, commençons par calculer les dérivées partielles de la métrique par
rapport aux coordonnées.
48



































∂g11
∂x2
=
∂α
∂r
∂g22
∂x2
=
1
∂ (− α
)
∂r
= α̇ ;
2
∂g33
∂x2
=
∂g44
∂x2
=
∂g44
∂x3
=
∂ − rα
α̇
α2
∂r
∂ −r
=
r 2 .α̇−2r.α
α2
=
2 .sin2 θ
α
=
∂r
∂ −r
;
2 .sin2 θ
α
∂θ
;
r 2 .α̇−2r.α
.sin2 θ
α2
;
2
= − 2rα .sinθ.cosθ.
Toutes les autres dérivées partielles sont nulles.
Nous allons ensuite calculer les symboles de Christoel, dénis par :
Γljk =
1 li
.g .
2
∂gik
∂gji
∂gjk
+
−
j
k
∂x
∂x
∂xi
.
Attention : nous avons utilisé précédemment la lettre Γ pour désigner la
pseudo-accélération ; ici, nous l'utilisons, selon l'usage du calcul tensoriel, pour
désigner les symboles de Christoel. En dimension quatre, il y a 64 symboles
diérents ; mais ici, compte-tenu du fait que g ij s'annule pour i 6= j , et que
beaucoup de dérivées partielles sont nulles, le nombre de symboles de Christoffel à calculer sera limité ; ils seront tous de la forme :
Γijk =
1 ii
.g .
2
∂gik
∂gji
∂gjk
+
−
j
k
∂x
∂x
∂xi
.
Commençons avec i = 1 :
Γ1jk =
1 11
.g .
2
∂g1k
∂gj1
∂gjk
+
−
j
k
∂x
∂x
∂x1
=
1 11
.g .
2
∂g1k
∂gj1
+
j
∂x
∂xk
.
Pour que cette expression soit non nulle, on doit avoir soit j = 1 et k = 2, soit
j = 2 et k = 1. Ces deux cas sont semblables :
1 11 ∂g12
∂g11
1
∂g11
1 1
α̇
1
1
Γ12 = Γ21 = .g .
+
= .g 11 . 2 = . .α̇ =
.
2
∂x1
∂x2
2
∂x
2 α
2α
49
Continuons avec i = 2 :
1 22
.g .
2
Γ2jk =
∂gj2
∂gjk
∂g2k
+
−
j
k
∂x
∂x
∂x2
.
On doit avoir : j = k = 1 ou j = k = 2 ou j = k = 3 ou j = k = 4.
Γ211
1
= .g 22 .
2
Γ222
Γ233
∂g12
∂g11
∂g21
+
−
∂x1
∂x1
∂x2
1
∂g11
= − .g 22 . 2 ;
2
∂x
1
α.α̇
Γ211 = − . (−α) .α̇ =
.
2
2
∂g22
∂g22
1
1
∂g22
∂g22
+
−
= .g 22 . 2 ;
= .g 22 .
2
∂x2
∂x2
∂x2
2
∂x
1
α̇
α̇
Γ222 = − . (−α) . 2 = − .
2
α
2α
1 22 ∂g23
∂g32
∂g33
1
∂g33
= .g .
+
−
= − .g 22 . 2 ;
2
∂x3
∂x3
∂x2
2
∂x
1
r2 .α̇ − 2r.α
r2 .α̇
Γ233 = − . (−α) .
−r ;
=
2
α2
2α
1
∂g24
∂g42
∂g44
∂g44
1
Γ244 = .g 22 .
+
−
= − .g 22 . 2 ;
2
∂x4
∂x4
∂x2
2
∂x
1
r2 .α̇ − 2r.α
r2 .α̇
Γ244 = − . (−α) .
.sin2 θ =
− r .sin2 θ.
2
2
α
2α
Etudions ensuite le cas i = 3 :
Γ3jk
1
= .g 33 .
2
∂g3k
∂gj3
∂gjk
+
−
∂xj
∂xk
∂x3
.
On doit avoir soit j = 2 et k = 3, soit j = 3 et k = 2, soit j = 4 et k = 4. Les
deux premiers cas sont semblables.
Γ323 = Γ332 =
1 33 ∂g33
.g . 2 ;
2
∂x
1 α r2 .α̇ − 2r.α
α̇
1
. − 2 .
=−
+ ;
2
r
α2
2α r
1
∂g44
Γ344 = − .g 33 . 3 ;
2
∂x
2
α
2r
1
.sinθ.cosθ = −sinθ.cosθ.
=− . − 2 . −
2
r
α
Γ323 = Γ332 =
Γ344
50
Etudions enn le cas i = 4 :
Γ4jk =
1 44
.g .
2
∂gj4
∂gjk
∂g4k
+
−
∂xj
∂xk
∂x4
=
1 44
.g .
2
∂gj4
∂g4k
+
∂xj
∂xk
.
On doit avoir soit j = 2 et k = 4, soit j = 4 et k = 2, soit j = 3 et k = 4, soit
j = 4 et k = 3. Les deux premiers cas sont semblables ; les deux derniers aussi.
Γ424 = Γ442 =
Γ424 = Γ442 =
Γ434 = Γ443
1 44 ∂g44
.g . 2 ;
2
∂x
r2 .α̇ − 2r.α
1 α
α̇
1
. − 2
.
.sin2 θ = −
+ ;
2
2
2
r .sin θ
α
2α r
1
∂g
44
Γ434 = Γ443 = .g 44 . 3 ;
2
∂x
2r2
α
cosθ
1 .
−
.sinθ.cosθ
=
.
= . − 2
2
2
r .sin θ
α
sinθ
Nous avons déjà dit que les symboles de Christoel sont utilisés pour calculer
les équations des géodésiques ; ils permettent aussi de calculer les composantes
du tenseur de courbure de Riemann-Christoel, selon la formule :
l
Rmns
=
4 X
∂Γl
i=1
mn
∂xs
−
∂Γlms
i
l
i
l
+
Γ
.Γ
−
Γ
.Γ
mn si
ms ni .
∂xn
En fait, il ne sera pas nécessaire d'eectuer la sommation, car chaque terme
sera non nul pour, au plus, une valeur de i.
Nous n'avons pas besoin de calculer toutes ces composantes, car notre but
est de calculer le tenseur de Ricci, déni par :
Rij =
4
X
k
Rikj
.
k=1
De plus, on peut vérier que Rij = 0 pour i 6= j ; ceci vient du fait que la
matrice (gij ) est diagonale. Nous allons donc calculer les quatre termes non nuls
Rii (i = 1, 2, 3, 4) du tenseur de Ricci, et, pour chacun de ces termes, nous avons
1
2
besoin de 4 termes du tenseur de Riemann-Christoel, de la forme : Ri1i
, Ri2i
,
3
4
Ri3i , Ri4i .
51
1
R111
=
2
R121
=
∂Γ111
∂Γ111
−
+ Γi11 .Γ11i − Γi11 .Γ11i = Γ211 .Γ112 − Γ211 .Γ112 = 0 ;
1
∂x
∂x1
∂Γ212
∂Γ211
∂Γ2
−
+ Γi12 .Γ21i − Γi11 .Γ22i = − 11
+ Γ112 .Γ211 − Γ211 .Γ222 ;
1
2
∂x
∂x
∂x2
∂Γ313
∂Γ311
3
R131
=
−
+ Γi13 .Γ31i − Γi11 .Γ33i = −Γ211 .Γ332 ;
1
∂x
∂x3
∂Γ411
∂Γ414
4
R141
=
−
+ Γi14 .Γ41i − Γi11 .Γ44i = −Γ211 .Γ442 .
∂x1
∂x4
1
2
3
4
R11 = R111
+ R121
+ R131
+ R141
;
R11 = −
1
R212
=
∂Γ211
+ Γ211 . Γ112 − Γ222 − Γ332 − Γ442 .
2
∂x
∂Γ121
∂Γ122
∂Γ121
−
+ Γi21 .Γ12i − Γi22 .Γ11i =
+ Γ121 .Γ121 − Γ222 .Γ112 ;
2
1
∂x
∂x
∂x2
∂Γ222
∂Γ222
−
+ Γi22 .Γ22i − Γi22 .Γ22i = 0 ;
2
∂x
∂x2
∂Γ323
∂Γ322
∂Γ323
3
R232
=
−
+ Γi23 .Γ32i − Γi22 .Γ33i =
+ Γ323 .Γ323 − Γ222 .Γ332 ;
2
3
∂x
∂x
∂x2
∂Γ422
∂Γ424
∂Γ424
i
4
i
4
4
−
+
Γ
.Γ
−
Γ
.Γ
=
+ Γ424 .Γ424 − Γ222 .Γ442 .
R242
=
24
2i
22
4i
∂x2
∂x4
∂x2
2
R222
=
1
2
3
4
R22 = R212
+ R222
+ R232
+ R242
;
R22 =
2
2
2
∂Γ121 ∂Γ323 ∂Γ424
+
+
+ Γ121 + Γ323 + Γ424 − Γ222 . Γ112 + Γ332 + Γ442 .
2
2
2
∂x
∂x
∂x
∂Γ133
∂Γ131
−
+ Γi31 .Γ13i − Γi33 .Γ11i = −Γ233 .Γ112 ;
3
∂x
∂x1
∂Γ233
∂Γ2
∂Γ232
=
−
+ Γi32 .Γ23i − Γi33 .Γ22i = − 33
+ Γ332 .Γ233 − Γ233 .Γ222 ;
3
2
∂x
∂x
∂x2
∂Γ333
∂Γ333
3
R333
=
−
+ Γi33 .Γ33i − Γi33 .Γ33i = 0 ;
3
∂x
∂x3
1
R313
=
2
R323
52
4
R343
=
2
∂Γ433
∂Γ434
∂Γ434
−
+ Γi34 .Γ43i − Γi33 .Γ44i =
+ Γ434 − Γ233 .Γ442 .
3
4
3
∂x
∂x
∂x
1
2
3
4
R33 = R313
+ R323
+ R333
+ R343
;
R33 = −
2
∂Γ233
∂Γ434
+
+ Γ434 + Γ233 . Γ332 − Γ112 − Γ222 − Γ442 .
2
3
∂x
∂x
1
R414
=
∂Γ141
∂Γ144
−
+ Γi41 .Γ14i − Γi44 .Γ11i = −Γ244 .Γ112 ;
4
∂x
∂x1
2
R424
=
∂Γ242
∂Γ244
∂Γ244
i
2
i
2
−
+
Γ
.Γ
−
Γ
.Γ
=
−
+ Γ442 .Γ244 − Γ244 .Γ222 ;
42
4i
44
2i
∂x4
∂x2
∂x2
3
R434
=
∂Γ343
∂Γ344
∂Γ344
i
3
i
3
−
+
Γ
.Γ
−
Γ
.Γ
=
−
+ Γ443 .Γ344 − Γ244 .Γ332 ;
43
4i
44
3i
∂x4
∂x3
∂x3
4
R444
=
∂Γ444
∂Γ444
−
+ Γi44 .Γ44i − Γi44 .Γ44i = 0.
∂x4
∂x4
1
2
3
4
R44 = R414
+ R424
+ R434
+ R444
;
R44 = −
∂Γ244
∂Γ344
−
+ Γ443 .Γ344 + Γ244 . Γ442 − Γ112 − Γ222 − Γ332 .
2
3
∂x
∂x
Nous allons avoir besoin des dérivées suivantes :
α.α̈ α̇2
∂Γ211
=
+
;
∂x2
2
2
α̇2
∂Γ121
α̈
−
=
;
∂x2
2α 2α2
∂Γ323
α̈
α̇2
1
=−
+ 2− 2 ;
2
∂x
2α 2α
r
∂Γ424
α̈
α̇2
1
=−
+ 2− 2 ;
2
∂x
2α 2α
r
r2 .α̈ r.α̇ r2 .α̇2
∂Γ233
=
+
−
−1 ;
2
∂x
2α
α
2α2
∂Γ434
1
=−
;
∂x3
sin2 θ
53
∂Γ244
=
∂x2
r2 .α̈ r.α̇ r2 .α̇2
−
1
.sin2 θ ;
+
−
2α
α
2α2
∂Γ344
= sin2 θ − cos2 θ.
∂x3
Reprenons maintenant les expressions de R11 , R22 , R33 et R44 , et substituons, aux symboles de Christoel et à leurs dérivées, les expressions que nous
venons de calculer :
∂Γ211
+ Γ211 . Γ112 − Γ222 − Γ332 − Γ442 ;
∂x2
α.α̇
α̇
α̇
α̇
1
α̇
1
α.α̈ α̇2
−
+
.
+
+
− +
−
;
R11 = −
2
2
2
2α 2α 2α r
2α r
˙
α.α̈ α̇2
α.α̇
α̇
α̇
2α
2
α.α̈ α̇2
α.α̇
=−
−
+
.
+
+
−
=−
−
+ α̇2 −
;
2
2
2
2α 2α
α
r
2
2
r
R11 = −
R11
R11 = −
α.α̇
α.α̈ α̇2
+
−
.
2
2
r
2
2
2
∂Γ121 ∂Γ323 ∂Γ424
+
+
+ Γ121 + Γ323 + Γ424 −Γ222 . Γ112 + Γ332 + Γ442 ;
2
2
2
∂x
∂x
∂x
2
α̈
α̇2
α̈
α̇2
1
α̈
α̇2
1
α̇2
α̇
1
=
− 2−
+ 2− 2−
+ 2− 2+ 2+ −
+
...
2α 2α
2α 2α
r
2α 2α
r
4α
2α r
2
α̇
1
α̇
α̇
α̇
1
α̇
1
... + −
+
+
.
−
+ −
+
;
2α r
2α 2α 2α r
2α r
R22 =
R22
R22 = −
α̇2
α̇2
1
α̇2
α̇2
1
α̇2
α̇2
2 α.α̈
α˙2
α˙2
−
+
+
+
−
+
+
−
+
−
+
;
r2 2α2 2α2 4α2 4α2 r.α r2 4α2 r.α r2 4α2 r.α
R22 = −
R33 = −
α̈
α̇2
α̇
+ 2−
.
2α α
r.α
2
∂Γ233
∂Γ434
+
+ Γ434 + Γ233 . Γ332 − Γ112 − Γ222 − Γ442 ;
∂x2
∂x3
R33 = −
1
cos2 θ
r2 .α̈ r.α̇ r2 .α̇2
−
+
+
1
−
+
...
2α
α
2α2
sin2 θ sin2 θ
54
... +
r2 .α̇
α̇
α̇
1
α̇
α̇
1
−r . −
−
+ +
+
−
;
2α
2α 2α r
2α 2α r
R33 = −
r2 .α̈ r.α̇ r2 .α̇2
.
−
+
2α
α
2α2
∂Γ244
∂Γ344
−
+ Γ443 .Γ344 + Γ244 . Γ442 − Γ112 − Γ222 − Γ332 ;
2
3
∂x
∂x
2
r .α̈ r.α̇ r2 .α̇2
R44 = −
+
1
.sin2 θ − sin2 θ + cos2 θ − cos2 θ...
−
+
2α
α
2α2
2
r .α̇
α̇
α̇
1
α̇
α̇
1
... +
− r .sin2 θ. −
−
+ +
+
−
;
2α
2α 2α r
2α 2α r
2
r .α̈ r.α̇ r2 .α̇2
R44 = −
−
+
.sin2 θ.
2α
α
2α2
R44 = −
Pour passer des composantes covariantes aux composantes mixtes, on procède de la façon suivante :
1
1
α.α̈ α̇2
α.α̇
α̈ α̇2
α̇
.R11 = . −
+
−
=− +
− ;
α
α
2
2
r
2
2α
r
α̈
α̇2
α̇
α̈ α̇2
α̇
R22 = g 22 .R22 = −α.R22 = (−α) . −
+ 2−
= −
+ ;
2α α
r.α
2
α
r
2
2 2
α
α
α̈ α̇ α̇2
r .α̈ r.α̇ r .α̇
R33 = g 33 .R33 = − 2 .R33 = − 2 . −
−
+
=
+ −
= −R11 ;
r
r
2α
α
2α2
2 r 2α
r2 .α̈ r.α̇ r2 .α̇2 α
α
4
44
R4 = g .R44 = − 2
.R44 = − 2
. −
−
+
.sin2 θ...
r .sin2 θ
r .sin2 θ
2α
α
2α2
R11 = g 11 .R11 =
=
α̈ α̇ α̇2
+ −
= −R11 = R33 .
2
r
2α
Après ces calculs généraux, revenons à la métrique de Ni ; nous savons que
2k
2k − 2k
4k − 2k
4k2 − 2k
r , que α̇ =
r , et que α̈ = −
r +
r . Nous allons faire
r 2 .e
r 3 .e
r 4 .e
les substitutions :
α = e−
R11 = −
2k
2k
2k
2k
α̈ α̇2
α̇
2k
2k 2
2k 2
2k
+
− = 3 .e− r − 4 .e− r + 4 .e− r − 3 .e− r = 0 ;
2
2α
r
r
r
r
r
55
R22 =
2k
2k
2k
2k
2k
α̈ α̇2 α̇
2k
2k 2
2k 2
2k
2k 2
− + = − 3 .e− r + 4 .e− r − 4 .e− r + 3 .e− r = − 4 .e− r ;
2 α r
r
r
r
r
r
R33 = −R11 = 0 ;
R44 = −R11 = 0.
Le scalaire de Ricci R se calcule de la façon suivante :
R = R11 + R22 + R33 + R44 = R22 = −
2k 2 − 2k
.e r .
r4
Il faut rappeler que le tenseur de Ricci se transforme selon les règles de l'algèbre linéaire quand on change de repère ; le scalaire de Ricci, quant à lui, est
invariant.
Nous allons calculer aussi les composantes covariantes du tenseur de Ricci :
R22
R11 = R33 = R44 = 0 ;
2k
1 2
2k 2 − 2k
2k 2
2
= g22 .R2 = − .R2 = −e r . − 4 .e r = 4 .
α
r
r
En dénitive, en coordonnées sphériques, les coordonnées covariantes (respectivement : mixtes, contravariantes) du tenseur de Ricci dans le vide, dans le
voisinage d'un point matériel, calculées selon la métrique triviale de Ni, s'expriment par les trois matrices suivantes :
0
1
0
0
0
0
0
0

0
0 
;
0 
0

0
2k 2 − 2k 
0
i
Rj = − 4 .e r . 
 0
r
0
0
1
0
0
0
0
0
0

0
0 
;
0 
0

0
1
0
0
0
0
0
0

0
0 
.
0 
0

0
2k 2 
0
(Rij ) = 4 . 
r  0
0
0
2
4k  0
2k
Rij = 4 .e− r . 
 0
r
0
56
Nous reparlerons de ces résultats dans la section "Interprétation".
23 Tenseur de Ricci en métrique de Schwarzschild
Revenons en arrière : nous avions laissé au bord du chemin des pierres
blanches. Par exemple, dans la section : "Nos choix... provisoires ?", nous avions
repéré deux raisons de nous écarter de la métrique triviale de Ni. C'est la seconde que nous allons examiner : nous avions expliqué que, pour rendre plus
cohérente la loi newtonienne en r12 , il était souhaitable que la contraction des
règles s'eectue seulement dans la direction du rayon vecteur ~r, ce qui suggère
d'étudier une version modiée de la métrique précédente. Nous allons donc supprimer le coecient α1 pour les directions perpendiculaires à ~r. La métrique
s'écrira alors :
ds2 = α.c2 .dt2 −
1 2
.dr − r2 .dθ2 − r2 .sin2 θ.dφ2 .
α
Les composantes covariantes de la métrique sont :

g11 = α ;








 g22 = − α1 ;


g33 = −r2 ;







g44 = −r2 .sin2 θ.
Ses composantes contravariantes sont :
 11
g = α1 ;








 g 22 = −α ;


g 33 = − r12 ;






 44
1
g = − r2 .sin
2θ .
Calculons les dérivées partielles de la métrique par rapport aux coordonnées.
57

































∂g11
∂x2
=
∂α
∂r
∂g22
∂x2
=
1
∂ (− α
)
∂r
=
∂g33
∂x2
=
∂ (−r 2 )
∂r
= −2r ;
∂g44
∂x2
=
∂ (−r 2 .sin2 θ )
∂r
= −2r.sin2 θ ;
∂g44
∂x3
=
∂ (−r 2 .sin2 θ )
∂θ
= −2r2 .sinθ.cosθ.
= α̇ ;
α̇
α2
;
Nous allons reprendre rapidement les calculs des symboles de Christoel.
1 11 ∂g11
α̇
.g . 2 =
;
2
∂x
2α
∂g11
α.α̇
1
;
Γ211 = − .g 22 . 2 =
2
∂x
2
1
∂g22
α̇
Γ222 = .g 22 . 2 = −
;
2
∂x
2α
1
∂g33
Γ233 = − .g 22 . 2 = −r.α ;
2
∂x
∂g
1
44
Γ244 = − .g 22 . 2 = −r.α.sin2 θ ;
2
∂x
1
∂g33
1
Γ323 = Γ332 = .g 33 . 2 = ;
2
∂x
r
1
∂g
44
Γ344 = − .g 33 . 3 = −sinθ.cosθ ;
2
∂x
∂g44
1
1
Γ424 = Γ442 = .g 44 . 2 = ;
2
∂x
r
1
∂g44
cosθ
Γ434 = Γ443 = .g 44 . 3 =
.
2
∂x
sinθ
Γ112 = Γ121 =
Calculons maintenant les composantes du tenseur de Ricci :
∂Γ211
+ Γ211 . Γ112 − Γ222 − Γ332 − Γ442 ;
2
∂x
α.α̈ α.α̇ 1 1
α.α̈ α.α̇
=−
−
.
+
=−
−
;
2
2
r
r
2
r
R11 = −
R11
58
R22 =
2
2
2
∂Γ121 ∂Γ323 ∂Γ424
+
+
+ Γ121 + Γ323 + Γ424 −Γ222 . Γ112 + Γ332 + Γ442 ;
2
2
2
∂x
∂x
∂x
1
1
1
α̇
α̈
1
1 1
α̈
α̇
R22 =
− 2− 2+ 2+ 2+
.
+
=
+
;
2α r
r
r
r
2α r
r
2α α.r
2
∂Γ434
∂Γ233
+
+ Γ434 + Γ233 . Γ332 − Γ112 − Γ222 − Γ442 ;
2
3
∂x
∂x
1
α̇
1
α̇
1
cos2 θ
= α + r.α̇ −
−
r.α.
−
+
+
−
+
= α + r.α̇ − 1 ;
sin2 θ
2α r
2α r
sin2 θ
R33 = −
R33
∂Γ344
∂Γ244
−
+ Γ443 .Γ344 + Γ244 . Γ442 − Γ112 − Γ222 − Γ332 ;
∂x2
∂x3
α̇
1
α̇
1
2
2
2
2
= (α + r.α̇) .sin θ+cos θ−sin θ−r.α.sin θ. −
+ +
−
−cos2 θ ;
2α r
2α r
R44 = −
R44
R44 = (α + r.α̇ − 1) .sin2 θ.
Calculons les composantes mixtes de ce tenseur :
R11
11
= g .R11
1
α.α̈ α.α̇
α̈ α̇
1
−
=− − ;
= .R11 = . −
α
α
2
r
2
r
R22 = g 22 .R22 = −α.R22 = (−α) .
R33 = g 33 .R33 = −
α̈
α̇
+
2α α.r
=−
α̈ α̇
− = R11 ;
2
r
1
1
.R33 = − 2 . (α + r.α̇ − 1) ;
r2
r
59
R44 = g 44 .R44 = −
1
r2 .sin2 θ
R44 = −
.R44 = −
1
r2 .sin2 θ
. (α + r.α̇ − 1) .sin2 θ ;
1
. (α + r.α̇ − 1) = R33 .
r2
Si nous remplaçons maintenant α par e− r , nous constatons qu'aucune des
composantes ci-dessus ne s'annule, alors que dans la section précédente, une
seule était non nulle. Nous avons donc le sentiment d'avoir perdu en simplicité.
2k
Ceci nous conduit à nous poser la question suivante : quelles conditions
devrait remplir la fonction α (considérée comme une fonction de r) pour que
certaines des composantes du tenseur de Ricci s'annulent ?
Examinons d'abord les deux premières composantes :
R11 = R22 = −
α̇
α̈
−
.
2α α.r
Elles s'annuleront si − α̈2 − α̇r = 0, autrement dit :
2α̇
d(α̇)
=−
;
dr
r
d(α̇)
2dr
=−
;
α̇
r
1
d (Log α̇) = −2.d (Log r) = d Log 2 ;
r
Log α̇ = Log
α̇ =
1
+ cte ;
r2
K1
, où K1 est une constante quelconque.
r2
En intégrant, on obtient :
α=−
K1
+ K2 , où K2 est une autre constante.
r
Passons aux deux autres composantes : R33 = R44 = α + r.α̇ − 1.
Elles s'annuleront si α + r.α̇ = 1, autrement dit :
d(r.α)
=1;
dr
60
r.α = r + K3 (où K3 est une nouvelle constante);
α=1+
K3
.
r
Comparons les deux conditions que nous venons de trouver :
α=−
K1
K3
+ K2 et α = 1 +
.
r
r
On voit immédiatement qu'elles se confondent pour K2 = 1 et K3 = −K1 . On
a alors : α = 1 − Kr1 et α̇ = Kr21 .
Dans ce cas, toutes les composantes du tenseur de Ricci s'annulent !
Mathématiquement, K1 peut prendre n'importe quelle valeur, mais, physiquement, si on veut obtenir une théorie de la gravitation équivalente à celle
de Newton pour les champs faibles, il faut prendre K1 = 2Gm
= 2k , donc
c2
α = 1 − 2k
;
on
obtient
alors
la
métrique
de
Schwarzschild
:
r
ds2 =
1−
2k
r
.c2 .dt2 −
dr2
− r2 .dθ2 − r2 .sin2 θ.dφ2 .
1 − 2k
r
Ce qu'il faut retenir, c'est que les coordonnées covariantes (resp. mixtes,
contravariantes) du tenseur de Ricci dans le vide, dans le voisinage d'un point
matariel, calculées selon la métrique de Schwarzschild, s'expriment par la matrice suivante :

0
 0
i
ij

(Rij ) = Rj = R = 
0
0
0
0
0
0
0
0
0
0

0
0 
.
0 
0
J'avais laissé plusieurs autres pierres blanches au bord du chemin, mais il est
inutile d'étudier chacune des pistes : on aura compris qu'elles convergent toutes
vers la métrique de Schwarzschild.
24 Courbure intrinsèque
Nous allons faire ici un petit rappel de géométrie, concernant la notion de
courbure. Imaginons d'abord une surface plane (variété de dimension deux, euclidienne), représentée par une feuille de papier non courbée. Si nous enroulons
61
cette feuille de manière à former un cylindre, sa courbure intrinsèque ne change
pas : elle est toujours nulle. Pour un observateur imaginaire vivant dans cet
espace à deux dimensions, la géométrie euclidienne reste valable. Par exemple,
si un triangle rectangle a été tracé sur la feuille, les longueurs de ses côtés sont
inchangées, et le théorème de Pythagore reste valable ; si c'est un cercle qui a été
tracé, son rayon et son périmètre sont inchangés, et le quotient est toujours égal
à 2.π . Si nous enroulons maintenant notre feuille de manière à former un cône,
tout ce qui vient d'être dit est encore localement vrai ; mais on voit apparaître
un point singulier, qui est le sommet du cône. Ces surfaces (le cylindre et le cône)
ont une courbure intrinsèque nulle en tout point (sauf au sommet du cône, où
elle est innie). Dans les deux cas, le tenseur de Ricci est identiquement nul,
donc le scalaire de Ricci est R = 0. Si nous considérons maintenant une surface
sphérique (qu'il est d'ailleurs impossible d'obtenir en enroulant une feuille de
papier), il est clair que sa géométrie est profondément diérente. Le théoréme
de Pythagore n'y est plus valable (il est même possible de construire un triangle à trois angles droits !) et le périmètre d'un cercle n'est plus égal à 2.π.r.
La courbure intrinsèque de la sphère est identique en tout point, et non nulle.
Cette courbure est évaluée grâce au scalaire de Ricci R, qui vérie : |R| = r2c2 ,
où rc est le rayon de la sphère.
Dans le cas de la métrique de Schwarzschild, on peut noter une analogie
avec le cône, mais en quatre dimensions spatio-temporelles. Nous avons démontré plus haut que la courbure intrinsèque de l'espace-temps est nulle en tout
point (en excluant bien sûr la singularité centrale). Mais on pouvait s'en douter.
Eectivement, nous avons vu, dans la section sur les métriques de Schwarzschild
et de Ni, que la première a une particularité : elle est localement équivalente à
la métrique de Minkowski pour un observateur en chute libre dont la vitesse est
égale à la vitesse d'évasion. Comme la métrique de Minkowski est euclidienne,
il est clair que la courbure intrinsèque est nulle pour cet observateur en chute
libre, donc aussi pour tout autre observateur.
25 Interprétation
La métrique de Schwarzschild a donc une particularité extraordinaire : dans
l'espace (supposé totalement vide) qui entoure un corps matériel ponctuel isolé,
supposé immobile, le tenseur de Ricci Rij , à 16 composantes, est identiquement
nul. Le scalaire de Ricci R est donc nul aussi. Cette propriété n'est pas liée à un
repère particulier : en eet, quand on change de repère, le tenseur se transforme
selon les règles de l'algébre linéaire ; ceci signie que, si tous les coecients du
tenseur sont nuls dans un repère, alors ils sont nuls aussi dans tous les autres
repères.
Pour Einstein, cette propriété est fondamentale ; toute la relativité générale
est bâtie sur elle. Une autre remarque nécessaire (et très subtile) est la profonde
62
parenté entre le tenseur de Ricci et le tenseur d'impulsion-énergie Tij , qui décrit
la répartition et les mouvements de la matière dans un volume innitésimal (et
qui est construit sur le modèle du tenseur de l'électromagnétisme, qui résume les
travaux de Maxwell, relativistes avant la lettre). Dans le vide, c'est-à-dire dans
un volume innitésimal où la densité ρ de matière est nulle, les deux tenseurs
Rij et Tij sont identiquement nuls ; mais pour ρ 6= 0, alors les deux tenseurs sont
non nuls. Dans ce cas, les deux tenseurs ne peuvent pas être égaux, car Tij a une
divergence nulle, ce qui n'est pas le cas de Rij . Une idée très astucieuse d'Einstein
est alors de fabriquer un tenseur à divergence nulle, s'annulant, comme Rij ,
dans le vide ; c'est le tenseur d'Einstein : Gij = Rij − 12 .gij .R. Il est clair que
la métrique de Schwarzschild annule ce tenseur, puisque dans ce cas on a à
la fois Rij = 0 et R = 0, donc Gij = Rij − 12 .gij .R = 0. Mais la métrique
de Schwarzschild décrit le champ dans le voisinage d'un corps non accéléré
isolé dans l'espace. Aura-t-on toujours Gij = 0, dans le vide, dans le voisinage
d'un système binaire, par exemple ? C'est l'un des postulats d'Einstein. Mais ce
postulat est peu utile, si on ne lui adjoint pas un second postulat beaucoup plus
fort : dans une région de l'espace où la densité de matière est non nulle (Tij 6= 0),
Gij est proportionnel à Tij . Le coecient de proportionnalité se détermine alors
par cohérence avec la gravitation de Newton (limite des champs faibles). Ce qui
conduit à la formule fondamentale de la relativité générale :
1
8πG
Gij = Rij − gij R = 4 .Tij .
2
c
La virtuosité mathématique d'Einstein ne peut que susciter l'admiration,
d'autant plus que les outils tensoriels utilisés n'étaient encore connus que d'un
petit nombre de mathématiciens à cette époque. Sa théorie a la particularité remarquable d'être "totalement covariante". Nous avons déjà parlé de covariance,
mais ici ce mot est employé dans un sens bien diérent : il signie que, si la
formule ci-dessus est vraie dans un repère, alors elle est vraie aussi dans tout
autre repère. Elle est totalement indépendante de l'observateur.
Les théoriciens qui ont comparé, analysé et discuté les diérentes théories
de la gravitation remarquent que la relativité générale est la seule qui soit parfaitement covariante ; ils estiment souvent que c'est ce qui fait sa supériorité
par rapport aux autres théories. Mais d'autres théoriciens, qui cherchent à interpréter la gravitation en termes quantiques, dans le but de l'intégrer dans
le cercle des forces fondamentales, constatent que cette covariance totale fait
de la relativité générale une théorie désincarnée, qui refuse d'entrer dans une
théorie uniée des forces fondamentales. Certains vont même jusqu'à dire que la
gravitation n'est pas une force. Paradoxalement, Einstein lui-même a passé les
dernières années de sa vie à rechercher cette unication, sans succès : c'est sa
façon d'aborder la gravitation qui est incompatible avec l'approche quantique.
La covariance totale de la relativité générale est-elle son point fort ? Ou bien
son point faible ?
Einstein était parfaitement conscient d'une chose : il n'a jamais prouvé que
63
sa formule soit vraie du point de vue de la physique ; il a seulement cherché (et
trouvé) une solution mathématique esthétique à un problème qu'il avait posé à
sa façon.
Ce qui peut sembler étonnant dans la formule fondamentale de la relativité
générale, c'est que le membre de gauche est une entité purement mathématique,
issue des travaux de Gauss, Riemann, Christoel, Ricci... Le membre de droite,
au contraire, est issu de la physique, puisqu'il représente l'impulsion-énergie,
c'est-à-dire la matière. La relativité restreinte nous a appris que la masse est
de l'impulsion-énergie (ce que personne, aujourd'hui, ne conteste) ; la relativité
générale nous dit que l'impulsion-énergie n'est rien d'autre que de la géométrie.
Cette marginalisation de la notion de matière, au prot de la géométrie, fait
l'originalité de la relativité générale ; en même temps, elle rend très dicile l'intégration de cette théorie dans le cercle des théories physiques modernes, dont
le noyau est la mécanique quantique.
Pour comparaison, examinons le scalaire de Ricci R (qui est invariant par
2
− 2k
r .
changement de repère), obtenu selon la métrique de Ni ; il est égal à 2k
r 4 .e
Mais peut-on estimer qu'il est "presque" nul ? Pour répondre, utilisons une grossière analogie : lorsqu'on étudie la courbure d'une surface sphérique de rayon rc ,
avec les outils tensoriels de la géométrie de Riemann, on trouve que |R| = r2c2 ;
donc rc =
q
2
|R|
. Appliquons cette idée à la gravitation, et appelons "rayon
2
de courbure" la quantité rc = |R|
(quantité qui serait innie dans le vide,
en relativité générale, puisque, selon cette théorie : R = 0 dans le vide). Pour
2
r2 k
r2
− 2k
r , on a donc r =
r
R = 2k
c
r 4 .e
k .e ≈ k . Evaluons ce rayon de courbure dans
deux cas :
- considérons d'abord le champ gravitationnel du Soleil (k ≈ 1, 5.103 m) dans
le voisinage de la Terre (r ≈ 1, 5.1011 m) ; le rayon de courbure, calculé selon
2
2
.1022
19
la formule ci-dessus, est : rc = rk ≈ 1,5
1,5.103 ≈ 1, 5.10 m, soit 150 annéeslumière ; comme les distances mises en jeu dans les calculs sur le système solaire
sont négligeables par rapport à 150 AL, on peut raisonnablement travailler avec
R = 0 : la métrique de Ni et celle de Schwarzschild sont alors équivalentes ;
- plaçons-nous maintenant à la surface d'une étoile à neutrons avec, typique2
8
ment, k ≈ 2.103 m et r ≈ 1, 4.104 m ; on a alors : rc ≈ 1,42.10.103 ≈ 105 m ≈ 100km.
Le rayon de l'étoile équivaut à 14% de rc , ce qui est loin d'être négligeable.
On comprend donc pourquoi il est crucial d'étudier les phénomènes qui se déroulent très près de la surface des étoiles à neutrons, ou, mieux, des trous noirs :
ils devraient permettre de déterminer si R est, ou n'est pas, égal à 0 dans le vide.
q
Cette métrique de Ni est intéressante, dans la mesure où elle est le prototype
d'une famille de théories de la gravitation : les théories dans lesquelles cohabitent
un potentiel scalaire ayant une signication physique, et une courbure, déterminée par ce potentiel, exprimée à l'aide d'un tenseur, ayant une signication
géométrique (ou spatio-temporelle). Nous appellons "théories tenseur-scalaire"
64
toutes les théories de la gravitation ayant ces deux caractéristiques. Ce nom
est parfois réservé à des théories qui font intervenir, en plus, des paramètres
ajustables, ce qui n'est pas le cas ici. Rappelons aussi que ce potentiel n'est
pas nécessairement une grandeur physique fondamentale : il peut s'agir d'une
manifestation (parmi d'autres) d'une entité plus complexe, par exemple d'une
pseudo-accélération quadrivectorielle, comme nous avons été amené à le supposer.
La diérence fondamentale entre la relativité générale et les théories tenseurscalaire peut s'exprimer ainsi : en relativité générale, une quantité innitésimale
de matière située en un point agit sur la courbure spatio-temporelle en ce point,
et seulement en ce point. Partout ailleurs, dans le vide, la courbure s'équilibre
selon sa loi propre (tenseur de Ricci nul). Dans les théories tenseur-scalaire (en
métrique de Ni par exemple), cette quantité innitésimale de matière va produire une modication physique (un potentiel, ou un champ quadrivectoriel)
dans l'espace qui l'entoure, et ce champ va, à son tour, agir sur la courbure
spatio-temporelle. Le champ peut être conçu comme une propriété physique
transmise par un messager de nature inconnue, que nous appellerons "graviton",
qui va agir sur la courbure à distance de l'émetteur. Le ux de gravitons émis
par une particule quelconque est décrit par une loi en r12 ; ces ux se composent
vectoriellement, et leur "travail" sur un parcours donné peut être interprété en
termes de diérence de potentiel gravitationnel. Ce sont ces gravitons qui commandent le potentiel, donc qui calibrent les règles et les horloges locales, dont
les distorsions dénissent la courbure spatio-temporelle. Ces gravitons sont les
chefs d'orchestre de l'espace et du temps.
La particularité de la relativité générale est d'éliminer totalement, à la fois,
non seulement le graviton, mais aussi le potentiel gravitationnel ; ceci est possible à condition que le tenseur de Ricci soit identiquement nul dans le vide. Il en
résulte que la relativité générale est à la fois la plus simple (conceptuellement)
de toutes les théories de la gravitation, du point de vue des mathématiciens, et
la plus dicile à comprendre, du point de vue des physiciens : c'est une sorte de
bulle parfaite et purement géométrique, d'où la vraie physique semble avoir été
exclue... Nous retrouvons ici le pari d'Einstein, qu'on peut formuler ainsi : "dans
une situation d'équilibre (champ constant), le tenseur de Ricci (donc également
son proche cousin, le tenseur d'Einstein) doit être identiquement nul dans le
vide ; dans une situation de déséquilibre (champ variable), le tenseur de Ricci
ne peut pas être identiquement nul, mais le tenseur d'Einstein l'est toujours".
Mais le tenseur de Ricci était un lien entre le champ gravitationnel et la physique des physiciens. Si on coupe ce lien, la bulle s'envole...
Actuellement, on est en droit de penser que toutes les théories de la gravitation sont des approximations, sauf une : la relativité générale, qui représenterait
La Perfection. Mais on peut penser aussi que la relativité générale est une idéalisation, donc une simplication de la réalité, certainement excellente pour les
champs faibles, mais pas nécessairement pour les champs forts, et qu'il existe
65
peut-être un champ gravitationnel ayant des propriétés physiques bien réelles, et
non illusoires, dont l'étude reste à faire avant de construire une théorie dénitive.
26 Théorèmes d'unicité
Dans le document : Métriques de Schwarzschild et de Ni, nous étudions de
manière systématique l'ensemble des métriques à symétrie sphérique, censées
être engendrées par l'action gravitationnelle d'un point matériel. La plupart des
démonstrations étant un peu longues, nous nous contenterons d'indiquer ici les
dénitions et les deux principaux théorèmes établis dans cette étude.
Les métriques étudiées sont toutes de la forme :
ds2 = α.c2 .dt2 − β.dr2 − γ. r2 .dθ2 + r2 .sin2 θ.dφ2 .
Elles sont dites symétriques si β = α1 , isotropes si γ = β , radiales si γ = 1.
Le premier théorème concerne les métriques symétriques et radiales, c'est-àdire les métriques de la forme :
ds2 = α.c2 .dt2 −
Théorème 1
1 2
.dr − r2 .dθ2 + r2 .sin2 θ.dφ2 .
α
La seule métrique symétrique et radiale ayant un tenseur de Ricci
identiquement nul est la métrique de Schwarzschild.
Le second théorème concerne les métriques symétriques et isotropes, c'està-dire les métriques de la forme :
ds2 = α.c2 .dt2 −
Théorème 2
1
. dr2 + r2 .dθ2 + r2 .sin2 θ.dφ2 .
α
La seule métrique symétrique et isotrope ayant un tenseur de
Ricci radial est la métrique triviale de Ni.
Par "tenseur de Ricci radial", nous désignons un tenseur de Ricci dont 15
composantes sont nulles, la seule composante non nulle étant la composante radiale, de rang (2, 2), c'est-à-dire celle qui concerne uniquement la variable r.
27 Pseudo-accélération
Quantitativement, la diérence entre les métriques de Ni et de Schwarzschild
n'est sensible que dans le domaine des champs forts ; mais qualitativement, elle
est très profonde. La métrique de Ni suppose qu'en chaque point, le tenseur de
Ricci subit l'inuence d'une quantité physique, qui doit donc être inscrite dans
66
l'information locale. De plus, sur les seize coecients du tenseur, un seul est
aecté par cette information, ce qui signie que celle-ci est orientée : son action
se manifeste uniquement selon l'axe ~r. Cette quantité physique orientée doit être
un quadrivecteur lorentzien : si ce n'était pas le cas, notre gravitation relativiste
n'aurait aucune chance d'être relativiste ! Dans notre calcul, ce quadrivecteur
se manifeste par une composante unique du tenseur (la composante spatiale
radiale), mais ceci vient du fait que nous avons travaillé dans un repère "immobile" ; tout changement de repère fait réapparaître les composantes cachées. Ce
quadrivecteur joue le rôle d'une pseudo-accélération ; cette pseudo-accélération
étant une modication des rapports que les particules établissent entre elles et
avec l'espace-temps. C'est cette modication que nous pouvons formaliser en
termes de courbure.
Par souci de simplicité, dénissons la pseudo-accélération à l'aide de la matrice (Rij ) covariante. Le seul coecient non nul du tenseur de cette matrice
2
pouvons alors dénir un rayon de courbure gaussien
est : |R22 | = 2k
r 4 . Nous
q
2
contravariant : rc = |R222 | = rk . La courbure covariante pourra être dénie
comme l'inverse de ce rayon de courbure au sens de Gauss : r1c = rk2 . Cette
courbure (orientée) dénit la pseudo-accélération quadrivectorielle.
Dans le cas particulier de la métrique de Schwarzschild, qui est statique, la
partie scalaire (temporelle) de ce quadrivecteur s'annule pour un observateur
"immobile" ; il s'identie alors (au signe près) au gradient du potentiel. Dans
un repère en mouvement, ou dans le cas d'un champ variable dans le temps, la
partie scalaire reparaît et on peut parler alors de quadri-gradient. Il s'agit d'un
quadrivecteur covariant.
La pseudo-accélération ressemble beaucoup, mathématiquement, à l'accélération newtonienne. Mais elle n'agit pas de la même manière : elle ne régit pas
directement l'accélération au sens classique (c'est-à-dire la dérivée du vecteur
vitesse par rapport au temps), mais elle a un rapport avec la courbure au sens
de Gauss (courbure qui, accessoirement, modie la vitesse des mobiles). De plus,
rien ne prouve que l'accélération classique soit toujours parallèle à la partie vectorielle de la pseudo-accélération, même si c'est le cas dans un champ statique
à symétrie sphérique comme celui du Soleil.
28 Potentiel newtonien et relativité : le conit ?
Jysqu'ici, nous avons attribué un rôle fondamental au potentiel scalaire
Φ = − GM
r . En même temps, nous avons admis dans notre approche préliminaire que la masse M devait être une masse relativiste (maupertuisienne). Il est
important de comprendre que ces notions risquent d'entrer en conit, si nous
n'y prenons pas garde. Ceci vient du fait que la masse au sens de Newton et la
67
masse au sens d'Einstein sont de nature profondément diérente.
Nous allons reprendre ici en partie la section sur la masse au repos et la
masse maupertuisienne gurant dans le document Les vitesses en Relativité
restreinte.pdf.
Considérons deux corps galiléens de masses au repos m1 et m2 (non nulles),
et de rapidités w
~ 1 et w
~ 2.
Les énergies des deux corps sont : E1 = m1 .c2 .ch wc1 et E2 = m2 .c2 .ch wc2 ;
leurs impulsions sont : p1 = m1 .c.sh wc1 et p2 = m2 .c.sh wc2 .
Pour prendre en compte la direction du déplacement, nous allons faire intervenir la rapidité sous forme vectorielle (w
~ ) plutôt que réelle (w). Pour condenser
les formules et les calculs, nous allons dénir l'exponentielle, le cosinus et le sinus
hyperboliques d'un vecteur tridimensionnel (spatial) ~u à l'aide de leurs développements en série, de la façon suivante :
e~x = 1 + ~x +
~x2 ~x3 ~x4 ~x5 ~x6
+
+
+
+
+ ...
2!
3!
4!
5!
6!
On peut démontrer très facilement, par récurrence, que les puissances de ~x
d'exposant pair sont des réelles, et que les puissances d'exposant impair sont
des vecteurs parallèles à ~x ; en notant x = ||~x|| le module de ~x, on peut écrire :
~x2n = x2n et ~x2n+1 = x2n .~x = x2n+1 . ~xx .
ch~x = 1 +
~x2 ~x4 ~x6 ~x8
x2
x4
x6
x8
+
+
+
+ ... = 1 +
+
+
+
+ ...
2!
4!
6!
8!
2!
4!
6!
8!
~x3 ~x5 ~x7 ~x9
sh~x = ~x +
+
+
+
+ ... =
3!
5!
7!
9!
x3
x5
x7
x9
~x
x+
+
+
+
+ ... . .
3!
5!
7!
9!
x
On voit donc que ch~x est un nombre réel positif, et que sh~x est un vecteur
tridimensionnel ; e~x = ch~x + sh~x comporte une partie réelle, égale à ch~x, et une
partie vectorielle, égale à sh~x. On peut dire que e~x est un quadrivecteur.
En relativité restreinte, le carré de la norme d'un quadrivecteur lorentzien
s'obtient en retranchant le carré de sa partie vectorielle au carré de sa partie
scalaire :
||e~x ||2 = (ch~x)2 − (sh~x)2 = 1 ;
||e~x || = 1.
Posons maintenant ~x = w~c , et réécrivons de manière condensée le quadrivecteur énergie-impulsion d'une particule de masse au repos m0 :
E + c.~
p = m0 .c2 .ch
w
~
w
~
w
~
+ m0 .c2 .sh = m0 .c2 .e c .
c
c
68
Remarquons que ||E + c.~p|| = m0 .c2 .||e c || = m0 .c2 .
w
~
Imaginons maintenant deux particules de masses au repos m1 et m2 , et de
rapidités (dans un repère donné) w
~ 1 et w
~ 2 . On a :
w
~1
w
~1
w
~1
+ m1 .c2 .sh
= m1 .c2 .e c ;
c
c
w
~2
w
~
w
~
2
2
E2 + c.~
p2 = m2 .c2 .ch
+ m2 .c2 .sh
= m2 .c2 .e c .
c
c
E1 + c.~
p1 = m1 .c2 .ch
On peut écrire aussi :
w
~1
w
~1
w
~1
− m1 .c2 .sh
= m1 .c2 .e− c ;
c
c
w
~2
w
~2
w
~2
E2 − c.~
p2 = m2 .c2 .ch
− m2 .c2 .sh
= m2 .c2 .e− c .
c
c
E1 − c.~
p1 = m1 .c2 .ch
Considérons maintenant le système formé par les deux corps de masses m1
et m2 . Appelons m la masse au repos de ce système, et w
~ sa rapidité globale,
ce qui signie que :
w
~
w
~
w
~
+ m.c2 .sh = m.c2 .e c ;
c
c
w
~
w
~
w
~
E − c.~
p = m.c2 .ch − m.c2 .sh = m.c2 .e− c .
c
c
Ce système aura pour énergie E = E1 + E2 et pour impulsion p~ = p~1 + p~2 ,
E + c.~
p = m.c2 .ch
donc :
w
~
p = (E1 + c.~
p1 ) + (E2 + c.~
p2 ) = m1 .c2 .e
m.c2 .e c = E + c.~
w
~1
c
w
~
m.c2 .e= c = E − c.~
p = (E1 − c.~
p1 ) + (E2 − c.~
p2 ) = m1 .c2 .e−
+ m2 .c2 .e
w
~1
c
w
~2
c
, et :
+ m2 .c2 .e−
w
~2
c
.
En résumé :
w
~
m.e c = m1 .e
m.e
~
−w
c
w
~1
c
+ m2 .e
w
~
− c1
= m1 .e
w
~2
c
, et :
+ m2 .e−
w
~2
c
.
Nous pouvons calculer facilement m en fonction de m1 , m2 , w~1 et w~2 . Commençons par faire les produits membre à membre des deux égalités précédentes ;
il vient :
m2 = (m1 .e
w
~1
c
+ m2 .e
m2 = m21 + m1 .m2 .e
w
~2
c
).(m1 .e−
w
~ 1 −w
~2
c
+ m2 .e−
+ m1 .m2 .e
m2 = m21 + 2.m1 .m2 .ch
69
w
~1
c
w
~ 2 −w
~1
c
w
~2
c
);
+ m22 ;
w
~1 − w
~2
+ m22 ;
c
r
m21 + 2.m1 .m2 .ch
m=
w
~1 − w
~2
+ m22 .
c
Si w
~1 = w
~ 2 , on a ch w~ 1 −c w~ 2 = 1, donc :
m=
q
m21 + 2.m1 .m2 + m22 = m1 + m2 ;
si w
~ 1 6= w
~ 2 , on a ch w~ 1 −c w~ 2 > 1, ce qui entraîne :
m > m1 + m2 .
On voit donc que les masses au repos ne sont pas additives en relativité
restreinte.
Considérons par exemple la masse M du Soleil, qui est constitué d'un très
grand nombre de particules en mouvement les unes par rapport aux autres. Pour
Newton, il allait de soi que cette masse M était nécessairement égale à la somme
des masses de toutes ces particules, et que le potentiel produit par le Soleil en
chaque point de l'espace s'obtenait en additionnant les potentiels produits par
toutes ces particules. Cette linéarité disparaît en relativité.
Considérons maintenant une particule de masse au repos nulle, par exemple
u (où
un photon, ayant pour énergie : E1 = h.ν , et pour impulsion : p~1 = h.ν
c .~
~u est un vecteur unitaire indiquant la direction de son déplacement). On peut
alors écrire :
E1 + c.~
p1 = h.ν.(1 + ~u).
Imaginons un second photon de même fréquence, mais de direction opposée. On
aura :
E2 + c.~
p2 = h.ν.(1 − ~u).
Le système formé par ces deux photons a pour quadrivecteur énergie-impulsion :
E + c.~
p = E1 + c.~
p1 + E2 + c.~
p2 = 2.h.ν.(1 + ~0).
Il a pour masse au repos :
m = 2.
h.ν
6= 0.
c2
Poussons ce raisonnement jusqu'à l'absurde : imaginons un corps formé uniquement de particules de masse nulle (disons des photons) rebondissant contre
une paroi sphérique parfaitement rééchissante, de masse négligeable. Comme
ci-dessus, la somme des impulsions peut très bien s'annuler (il sut de choisir
le repère convenable) mais l'énergie et la masse globale ne s'annulent pas :
E=
X
h.νi ,
donc
m=
i
E
1 X
= 2.
h.νi .
2
c
c
i
En théorie, un corps de masse au repos quelconque peut être reconstitué
par assemblage de particules en mouvement, de masses au repos nulles. Ceci ne
70
doit pas nous étonner, puisque nous savons qu'une particule et son antiparticule
peuvent se désintégrer sous forme de photons. Ce n'est pas la masse au repos,
mais l'énergie-impulsion quadrivectorielle, qui possède les propriétés fondamentales : conservation et additivité. Un photon doit nécessairement produire un
champ gravitationnel ; celui-ci ne peut pas être proportionnel à sa masse au repos (qui est nulle), mais, évidemment, à son quadrivecteur énergie-impulsion.
29 Entraînement quadrivectoriel et immobilité gravitationnelle
Pour Newton, le potentiel gravitationnel produit par un corps (ponctuel) de
masse M est déni par l'égalité :
Φ=−
G.M
,
r
où la masse M est une entité additive (propriété de linéarité) et où Φ est un
scalaire. D'après ce que nous venons de dire, cette conception du potentiel est
incompatible avec la relativité restreinte. Si nous voulons conserver la linéarité, il
faut remplacer la masse au sens de Newton (la masse au repos M ) par la quantité
w
~
qui lui correspond en relativité restreinte, c'est-à-dire l'énergie-impulsion M.e c ,
qui est un quadrivecteur. Le potentiel sera alors le quadrivecteur déni par :
w
~
Φ.e c = −
G.M w~
.e c .
r
Nous obtenons un champ quadrivectoriel, que nous appelons champ d'entraînement.
Remarquons que :
G.M .||e w~c || = G.M .
||Φ.e || = −
r r
w
~
c
De même que m0 .c2 est la norme du quadrivecteur énergie-impulsion m0 .c2 .e c ,
le potentiel scalaire Φ correspond (au signe près) à la norme du quadrivecteur
w
~
d'entraînement Φ.e c . L'entraînement est additif (il respecte la linéarité), mais
ce n'est pas le cas pour le potentiel Φ (pas plus que pour la masse au repos).
La norme d'une somme quadrivectorielle n'est pas égale à la somme des normes.
w
~
Si deux corps massifs A1 et A2 produisent en un point P les entraînements
w
~1
w
~2
c
et Φ2 .e c , alors l'entraînement résultant, au point P , sera :
Φ1 .e
w
~
Φ.e c = Φ1 .e
w
~1
c
71
+ Φ2 .e
w
~2
c
.
En reprenant le calcul que nous avons fait pour les quadrivecteurs énergieimpulsion, nous obtenons :
r
Φ=
Φ21 + 2.Φ1 .Φ2 .ch
w
~1 − w
~2
+ Φ22 .
c
Pour calculer w
~ , séparons les parties scalaires des parties vectorielles :
Φ.ch
Φ.sh
w
~
w
~1
w
~2
= Φ1 .ch
+ Φ2 .ch
(parties scalaires) ;
c
c
c
w
~
w
~1
w
~2
= Φ1 .sh
+ Φ2 .sh
(parties vectorielles).
c
c
c
En divisant membre à membre, nous obtenons :
sh w~c
Φ1 .sh w~c1 + Φ2 .sh w~c2
w
~
~v
= th =
=
.
w
~
c
c
ch c
Φ1 .ch w~c1 + Φ2 .ch w~c2
Pour un nombre quelconque de corps massifs, on obtiendrait :
P
Φi .sh w~ci
~v
= Pi
.
w
~i
c
i Φi .ch c
Pour calculer ~vc , il sut de diviser la somme des contributions vectorielles
par la somme des contributions scalaires.
Cette vitesse ~v est la vitesse associée au potentiel Φ produit au point P par
l'ensemble des corps de masses mi , en mouvement les uns par rapport aux autres.
Un observateur situé au point P et se déplaçant précisément à la vitesse
~v sera dit "gravitationnellement immobile". Autrement dit, un observateur est
gravitationnellement immobile si, dans son repère, la vitesse d'entraînement
s'annule. Pour un tel observateur, l'entraînement s'écrit (localement) : Φ.(1+~0) ;
on peut donc dire que l'entraînement se réduit au potentiel. C'est ce qui se passe,
par exemple, pour les "observateurs locaux", immobiles dans le champ gravitationnel du Soleil.
Attention : nous aurions pu dénir la notion d'immobilité gravitationnelle
G.M
à partir de la quantité G.M
r 2 , qui, comme − r , apparaît dans la théorie de
Newton. Le problème est que ces deux immobilités gravitationnelles ne sont pas
équivalentes, et nous ne pouvons pas dire laquelle possède une signication physique. Ce choix n'ayant pas de conséquence sur l'étude du système solaire, nous
laissons le problème ouvert.
Le cas du photon estw~particulier. Son quadrivecteur énergie-impulsion n'est
pas de la forme m0 .c2 .e c , mais h.ν.(1 + ~u), donc l'entraînement qu'il produit
w
~
h.ν
0
c
n'est pas de la forme − G.m
u). Cet entraînement n'est pas
r .e , mais − r .(1 + ~
72
nul, mais il a une norme nulle, donc le potentiel scalaire qu'il produit est nul
aussi ; un photon isolé produit un potentiel nul, mais un ensemble de photons
de directions diérentes produit un potentiel non nul. Chaque photon contribue
à l'entraînement global.
Une question très importante concerne le rapport entre le quadrivecteur d'entraînement et la pseudo-accélération. Une hypothèse naturelle est la suivante :
la pseudo-accélération pourrait être égale à l'opposé quadrigradient du potentiel
Φ, qui est lui-même l'opposé de la norme du quadrivecteur d'entraînement. En
pratique, ceci signie qu'il faut connaître le quadrivecteur d'entraînement pour
calculer le potentiel, qu'il faut connaître le potentiel pour calculer la pseudoaccélération, et que la pseudo-accélération peut s'interpréter en termes de courbure. Attention : il ne s'agit là que d'une hypothèse, qui doit être discutée et
testée.
30 L'hypothèse du champ tensoriel
Nous avons vu qu'il n'est pas du tout raisonnable d'imaginer un champ gravitationnel dépendant uniquement de la masse au repos des corps ; la nécessité de
prendre en compte les quatre composantes du quadrivecteur énergie-impulsion
apparaît clairement. Mais c'est une conception minimale, qui n'épuise peut-être
pas toutes les propriétés du champ. Rappelons-nous que la relativité générale
fait intervenir un champ (identié d'une part au tenseur de courbure, ou plus
exactement au tenseur d'Einstein qui en est dérivé, et d'autre part au tenseur
énergie-impulsion) qui n'a pas quatre conposantes, mais seize (dont dix indépendantes). Ceci est lié au fait que, dans cette théorie, le champ produit par une
particule en mouvement dépend non seulement de sa vitesse, mais aussi de son
accélération : dans les calculs, les dérivées de la position par rapport au temps
interviennent jusqu'au second ordre. Le tenseur énergie-impulsion n'est pas un
quadrivecteur : en plus de la masse et de la vitesse linéaire de l'ensemble des
particules qui circulent dans un volume élémentaire, il prend aussi en compte,
entre autres choses, le mouvement de rotation de cet ensemble de particules !
On ne peut pas exclure à priori que le champ puisse se comporter comme
un milieu physique transmettant de proche en proche non seulement un entraînement de type quadrivectoriel, mais aussi de type "rotation". Mais nous ne
savons pas quelles sont les équations qui régissent cette transmission. Le mérite d'Einstein est d'avoir imaginé un tenseur (celui qui porte son nom), conçu
d'après le d'Alembertien qui intervient en électromagnétisme, mais destiné à
transporter une information de type "courbure spatio-temporelle".
Il n'est pas question de nous engager dans cette voie tant que la nécessité
n'en sera pas avérée. C'est seulement lorsque nous parlerons de la transmission
de l'information gravitationnelle dans un système double que nous serons ame73
nés à nous poser ces questions.
31 Conservation de l'énergie-impulsion
La conservation de l'énergie s'éclaire de manière diérente selon le projecteur
utilisé : la relativité générale ou la métrique de Ni.
En relativité générale, la notion de conservation ne peut pas avoir une signication globale ; elle ne peut être que locale. Eectivement, lorsqu'on dit
que l'énergie totale d'un système se conserve de l'instant t1 à l'instant t2 , cela
suppose qu'il est possible de mesurer les énergies de toutes les parties du système, simultanément, à l'instant t1 , puis, de même, à l'instant t2 . Le grand
problème, c'est que la simultanéité n'existe pas en relativité. Par conséquent, le
mot "conservation" n'a pas de sens en relativité générale (ou seulement un sens
local).
Second problème : depuis la relativité restreinte, on sait que la notion d'énergie doit être remplacée par celle d'impulsion-énergie quadrivectorielle ; c'est ce
quadrivecteur qui doit se conserver. Mais dans le cas d'un système formé de
plusieurs parties éloignées, il faudrait pouvoir additionner les quadrivecteurs
impulsion-énergie des diérentes parties du système pour vérier que cette
somme se conserve. Or, dans un espace-temps courbe, des quadrivecteurs associés à des particules diérentes, éloignées l'une de l'autre, ne peuvent être
ni comparés, ni additionnés. Ceci peut s'expliquer par une analogie simple : si
on considère deux vecteurs à deux dimensions, en deux points A et B sur une
surface courbe à deux dimensions (comme la surface terrestre), on peut essayer
de les comparer en faisant glisser le premier de A jusqu'en B en "conservant sa
direction" (selon le principe du "transport parallèle"), selon un parcours choisi.
Mais la conclusion dépendra du parcours... Un cas particulier très instructif est
celui du triangle sphérique (ABC) à trois côtés égaux (équilatéral) et à trois
angles droits (par exemple A et B sur l'équateur, C au pôle). Lorsqu'on fait glisser un vecteur (par transport parallèle, c'est-à-dire sans modier l'angle entre le
vecteur et la direction du déplacement) de A jusqu'en B , puis jusqu'en C , puis
jusqu'en A, en suivant les côtés du triangle, on constate qu'il a tourné de 90°.
Ceci rend impossible la dénition d'une égalité vectorielle entre des vecteurs liés
à des points diérents. De même, dans un espace-temps courbe, il est impossible
de dénir une égalité quadrivectorielle entre impulsions-énergies de particules
éloignées. Ce n'est possible que dans un espace-temps euclidien.
La relativité générale est donc une théorie essentiellement locale. Ceci soulève un problème de compatibilité avec la mécanique quantique, qui admet la
non-localité. Deux particules intriquées ont des propriétés fondamentales liées de
manière simple, même si elles sont très éloignées l'une de l'autre. Par exemple,
imaginons deux particules produites lors d'une désintégration, avec des impul74
sions opposées. Peut-on dire que ces impulsions seront encore opposées lorsque
les particules seront loin l'une de l'autre ? Et si chacune de ces paricules se
désintègre de nouveau en deux autres particules, la somme des impulsions des
quatre particules sera-t-elle nulle ? Cette question possède-t-elle une réponse
indépendante du parcours suivi par ces particules ? D'ailleurs, cette notion de
parcours a-t-elle une signication en mécanique quantique ? Si nous faisons passer l'une des particules à la fois par deux trous diérents percés dans un écran
(comme cela a été réalisé dans des expériences célèbres), quel parcours faudrat-il prendre en compte ? Dans la logique de la mécanique quantique, la réalité
fondamentale est l'événement, ou l'interaction. On ne sait pas par où passe
une particule, ni même si elle existe, entre deux interactions. Les particules et
l'espace-temps apparaissent comme des constructions à posteriori, destinées à
exprimer la cohérence entre les interactions. Cet espace-temps doit en principe
être euclidien à quatre dimensions, tout simplement parce-que la notion fondamentale d'impulsion-énergie, qui est de nature quadrivectorielle, l'impose.
En métrique de Ni, l'espace-temps peut être interprété comme courbe, mais,
comme on l'a vu, le calcul de la courbure (plus précisément du tenseur de
Ricci) montre que celle-ci est régie par un vecteur (ou plus vraisemblablement
un quadrivecteur). La cohérence du raisonnement exige que ces quadrivecteurs
puissent être comparés (pas seulement localement) et additionnés. Ceci conduit
à admettre l'existence d'un espace-temps de référence, nécessairement euclidien.
Mais alors que signie la courbure dénie par ce quadrivecteur ? Elle évalue la
distorsion entre les règles et horloges des observateurs locaux ; mais cette distorsion n'est pas seulement subjective : elle a aussi une valeur objective (physique),
puisqu'elle inue sur le comportement des mobiles.
D'autre part, comme on l'a vu précédemment, le simple fait de s'appuyer
sur une quantité quadrivectorielle entraîne l'existence de repères privilégiés dits
"immobiles", qui permettent de dénir la notion de simultanéité, et par conséquent de donner un sens global au mot "conservation" : il est possible de dire
si l'impulsion-énergie globale d'un système étendu dans l'espace se conserve ou
non, d'un instant t1 à un instant t2 . Quelle que soit la réponse, cette question
possède, au moins, un sens.
32 Le graviton existe-t-il ?
On admet généralement que les forces fondamentales sont véhiculées par des
particules (le photon pour l'électromagnétisme, les bosons W +, W −, Z0 , pour
l'interaction faible, les gluons pour l'interaction forte), et on a imaginé que la
gravitation pourrait être véhiculée, elle aussi, par une particule : le graviton.
D'après la théorie, il s'agirait d'un boson de masse nulle, de spin égal à 2, se
déplaçant à la vitesse de la lumière ; mais cette particule n'a jamais été détectée
directement.
75
Les nombreux physiciens qui cherchent à rapprocher la gravitation de la mécanique quantique estiment que le graviton est l'outil privilégié qui permettra
d'avancer dans cette direction.
De même que l'électrodynamique quantique permet d'expliquer l'ensemble
des phénomènes électromagnétiques à partir d'échanges de photons virtuels
entre particules chargées, on peut espérer apporter un éclairage nouveau sur
les phénomènes gravitationnels en faisant intervenir des échanges de gravitons
virtuels entre particules massives ("gravitodynamique quantique"). Dans cette
approche, c'est la probabilité d'interaction entre particules (via l'échange de
gravitons virtuels) qui devient l'objet d'étude privilégié, les forces d'attraction,
le potentiel gravitationnel et la courbure de l'espace-temps étant relégués au
rang d'épiphénomènes.
En supposant que cette direction de recherche soit la bonne, on pourrait en tirer de multiples conséquences, dont trois nous intéressent plus particulièrement :
1) La transmission de l'information gravitationnelle doit avoir une vitesse
nie, qui est celle du graviton ; cette vitesse pouvant être la vitesse maximale
(celle de la lumière) puisque le graviton est censé être de masse nulle ;
2) La loi en d12 est facile à justier dans ce cadre, aussi bien en gravitodynamique qu'en électrodynamique quantique ;
3) A l'échelle macroscopique, la conservation de l'énergie-impulsion d'un système isolé est facile à justier, dans la mesure où, à l'échelle microscopique, elle
est nécessairement conservée par l'interaction de base (l'échange de gravitons
virtuels). Si on désire interpréter le mouvement des astres en termes de forces,
à la manière de Newton, on doit donc s'attendre à des forces centrales dans le
cas du système solaire, opposées dans le cas des systèmes doubles.
Il est clair que cette conception est en contradiction avec la notion de champ
tournant, comme nous l'avons noté précédemment. Le moment n'est pas venu
de trancher.
33 Etude du système solaire : les bases
A partir d'ici, nous allons étudier longuement le mouvement d'une particule
test dans le champ gravitationnel d'une masse ponctuelle (ou, si on préfère,
le mouvement d'une planète autour du Soleil) ; pour cela, nous utiliserons les
équations obtenues précédemment, en coordonnées polaires.
76
Les trajectoires sont dénies par les trois équations suivantes :

2k
2k
2k

1) ds2 = c2 e− r dt2 − e r dr2 − e r r2 dθ2 (équation de la métrique) ;





k
2k dt
2) E = mE0 c2 = e− r ds
= e− r ch wc = cte (conservation de E) ;





k
 3) µ = µ = r||~u∧~v|| = e 2k
dθ
w
te
r r2
r
(conservation de µ).
m0 c
m0 c
ds = e r sh c sinα = c
Comme précédemment, α désigne l'angle (~u, ~v ) formé par le rayon vecteur
~u et la vitesse ~v .
Toutes les quantités sont évaluées par l'observateur distant (E , µ, r, etc.),
sauf la vitesse v et la rapidité w, qui sont évaluées par l'observateur local.
34 Aphélie et périhélie
Lorsqu'une planète tourne autour du Soleil, elle s'éloigne et se rapproche
de celui-ci, alternativement. La distance r passe par un maximum (à l'aphélie,
ou à l'apoastre, s'il s'agit d'un astre autre que le Soleil) et par un minimum
(au périhélie, ou périastre) où la dérivée dr
dt s'annule. Nous allons rechercher ces
deux valeurs de r : r1 et r2 .
Dans l'équation de la métrique, divisons les deux membres par ds2 ; il vient :
2 − 2k
r
dt
ds
1=c e
2
−e
2k
r
dr
ds
2
−e
2k
r
2
r
Nous avons vu que E = e− r cdt
ds et µ = r e
2k
d'une planète, il est intéressant de substituer Ee r à
Nous obtenons :
2k
1=e
− 2k
r
Ee
1=e
Remplaçons ds par
2
2k
r
2k
r
r2 e
2k
r
µ
−e
2
2k
2k
r
E −e
dθ
1=e
2
dθ
ds
cdt
ds
dθ
ds
2
2k
r
2
2
2k
dr
µ − 2k
2
r
r
−e r
e
;
ds
r2
2
2
2k µ
dr
− e− r 2 .
ds
r
; il vient :
E −e
2k
r
2
dr

.
; pour étudier l'orbite
2k
et rµ2 e− r à dθ
ds .

2k
r
r
2
2k
r2 e r
µ
77
µ2
 − e− 2k
r
;
r2
dθ
1=e
Posons : u =
1
r
2k
r
2
E −e
− 2k
r
2
µ
dr
r2 dθ
2
− e−
2k
r
µ2
.
r2
(donc du = − dr
r 2 ) ; notre équation devient :
1=e
2ku
2
E −e
−2ku
2
µ
du
dθ
2
− e−2ku µ2 u2 .
Cette équation nous sera très utile par la suite ; mais dans l'immédiat, notre
but est d'étudier l'aphélie et le périhélie de l'orbite (s'il s'agit d'une planète
tournant autour du Soleil), ou l'apoastre et le périastre (dans le cas général).
Si une planète tourne autour du Soleil sur une orbite elliptique (avec ou
sans précession), la distance r passe alternativement par un maximum r1 (à
l'aphélie) et par un minimum r2 (au périhélie). Ces deux points de l'orbite sont
1
1
caractérisés par le fait que du
dθ = 0 ; donc, pour u = u1 = r1 et u = u2 = r2 , on
2
2
a : 1 = e2ku E − e−2ku µ2 u2 , donc E = e−4ku µ2 u2 + e−2ku .
D'où on tire : e−4ku1 µ2 u21 + e−2ku1 = e−4ku2 µ2 u22 + e−2ku2 ;
2
ce qui permet d'exprimer µ2 (puis E ) en fonction de u1 et u2 :
µ2 =
e−2ku2 − e−2ku1
.
− u22 e−4ku2
u21 e−4ku1
En multipliant le numérateur et le dénominateur par e2k(u1 +u2 ) , on obtient :
µ2 =
e2ku1 − e2ku2
.
− u22 e2k(u1 −u2 )
u21 e2k(u2 −u1 )
On en déduit l'expression de l'énergie :
2
E = e−4ku1 µ2 u21 + e−2ku1 = e−4ku1
2
E =
e−2ku2 − e−2ku1
u2 + e−2ku1 ;
− u22 e−4ku2 1
u21 e−4ku1
u21 e−2k(2u1 +u2 ) − u21 e−6ku1 + u21 e−6ku1 − u22 e−2k(u1 +2u2 )
;
u21 e−4ku1 − u22 e−4ku2
2
E = e−2k(u1 +u2 )
u21 e−2ku1 − u22 e−2ku2
.
u21 e−4ku1 − u22 e−4ku2
En multipliant le numérateur et le dénominateur par e2k(u1 +u2 ) , on obtient :
2
E =
u21 e−2ku1 − u22 e−2ku2
.
u21 e2k(u2 −u1 ) − u22 e2k(u1 −u2 )
78
Il peut être utile de calculer r1 et r2 en fonction de E et µ ; commençons par
2
remplacer les expressions de µ2 et E par leurs développements limités d'ordre
un en k (approximation acceptable si k est très petit par rapport à r1 et r2 ).
(1 + 2ku1 ) − (1 + 2ku2 )
;
u21 [1 + 2k(u2 − u1 )] − u22 [1 + 2k(u1 − u2 )]
µ2 ≈
2k
2kr1 r2
2k(u1 − u2 )
≈
≈
.
u21 − u22
u1 + u2
r1 + r2
µ2 ≈
u21 (1 − 2ku1 ) − u22 (1 − 2ku2 )
;
+ 2k(u2 − u1 )] − u22 [1 + 2k(u1 − u2 )]
2
E ≈
u21 [1
2
E ≈
(u21
2
E ≈
(u21 − u22 ) − 2k(u31 − u32 )
;
− u22 ) − 2k(u21 + u22 )(u1 − u2 )
(u1 + u2 ) − 2k(u21 + u1 u2 + u22 )
;
(u1 + u2 ) − 2k(u21 + u22 )
2
E ≈
1 − 2k
1−
u21 +u1 u2 +u22
u1 +u2
u2 +u2
2k u11 +u22
u2 + u1 u2 + u22
E ≈ 1 − 2k 1
u1 + u2
2
2
E ≈ 1 − 2k
2
;
u21 + u22
1 + 2k
;
u1 + u2
u21 + u1 u2 + u22
u2 + u22
+ 2k 1
;
u1 + u2
u1 + u2
E ≈1−
2ku1 u2
2k
≈1−
.
u1 + u2
r1 + r2
De cette dernière égalité, on tire :
r1 + r2 ≈
79
2k
1−E
2.
D'autre part :
r1 r2 ≈
µ2
µ2
2k
µ2
(r1 + r2 ) ≈
≈
2
2.
2k
2k 1 − E
1−E
Donc r1 et r2 sont (en première approximation) les racines de l'équation
2
(1 − E )X 2 − 2kX + µ2 = 0 ; ce qui nous donne :
q
2
k + k 2 − µ2 (1 − E )
r1 ≈
;
2
1−E
q
2
k − k 2 − µ2 (1 − E )
r2 ≈
.
2
1−E
Voici une autre façon d'aborder la recherche de l'aphélie et du périhélie. Re2
prenons l'équation E = e−4ku µ2 u2 + e−2ku ; écrivons-la sous la forme :
2
e2ku E − e−2ku u2 µ2 = 1, ou encore :
k
2
k
e2 r E − e−2 r
µ2
= 1.
r2
On peut d'ailleurs remarquer que ces égalités signient tout simplement que
ch2 wc − sh2 wc = 1, avec :
k
w
= eku E = e r E (ce qui est vrai dans tous les cas) ;
c
k µ
w
sh = e−ku uµ = e− r (ce qui est vrai seulement à l'aphélie et au périhélie).
c
r
ch
Ensuite, pour E et µ xés, on étudie par exemple les courbes des fonctions
2
2
k
k
f (r) = e2 r E − 1 et g(r) = e−2 r µr2 , et on recherche leurs points d'intersection.
Ce n'est pas la méthode que nous avons choisie, car cette recherche est relativement délicate.
35 Orbites circulaires
Nous allons calculer la vitesse circulaire, c'est-à-dire la vitesse (locale) d'une
planète se déplaçant sur une orbite circulaire de rayon r.
80
On peut partir, par exemple, de la formule :
2
E =
u21 e−2ku1
2
2k(u
2 −u1 )
u1 e
u2 e−2ku1 − u2 e−2ku2
− u22 e−2ku2
.
= 2k(u +u1 ) 2 −4ku2
2
2k(u
−u
)
1
2
2
1 [u e
1 − u2 e−4ku2 ]
− u2 e
e
2
1
Pour étudier le cas de l'orbite circulaire, faisons tendre r2 vers r1 , donc u2
vers u1 .
Posons : F (x) = x2 e−2kx et G(x) = x2 e−4kx .
Fx0 (u1 )
e4ku1 G0x (u1 )
2
Quand u2 tend vers u1 , E tend vers
.
F 0 (x) = 2xe−2kx + x2 (−2k)e−2kx = 2x(1 − kx)e−2kx ;
G0 (x) = 2xe−4kx + x2 (−4k)e−4kx = 2x(1 − 2kx)e−4kx .
Donc pour une orbite circulaire on a :
2
E =
1 − kr − 2k
2u(1 − ku)e−2ku
r − k − 2k
e r =
=
e r.
2k
4ku
−4ku
e
2u(1 − 2ku)e
r − 2k
1− r
Comme E = e− r
2k
cdt
ds
ch2
et ch wc = e− r
k
cdt
ds
, il est clair que E = e− r ch wc ;
k
1 − kr
2k
r−k
wc
2
=er E =
=
.
c
r
− 2k
1 − 2k
r
Bien entendu, wc désigne la rapidité circulaire : ch wcc = q 1
1−
signe la vitesse circulaire).
sh2
2
vc
c2
(où vc dé-
wc
wc
r−k
(r − k) − (r − 2k)
k
= ch2
−1=
−1=
=
;
c
c
r − 2k
r − 2k
r − 2k
sh wcc
vc
wc
= th
=
=
c
c
ch wcc
r
k
r − 2k
.
=
r − 2k r − k
r
vc
k
=
.
c
r−k
81
r
k
.
r−k
Quand r varie de l'inni à 2k, ch2 wcc varie de 1 à l'inni, donc la rapidité wc
varie de 0 à l'inni, et la vitesse circulaire vc varie de 0 à c.
Il en résulte qu'il ne peut pas y avoir d'orbite circulaire de rayon inférieur à
2GM
c2 .
2k , ou
Dans le même temps, l'énergie E décroît de 1 jusqu'à un minimum, puis
croît de nouveau et tend vers l'inni. On peut s'en rendre compte facilement
en étudiant la dérivée de la fonction E = f (r). On cherche ensuite pour quelle
valeur de r cette dérivée s'annule ; on obtient alors√une équation du second degré
dont la seule solution supérieure à 2 est kr = 3 + 5 ≈ 5,√236.
√
Le minimum de E est atteint pour r = (3 + 5).k = 3+2 5 .rs ≈ 2, 618.rs .
En reportant la valeur de kr ainsi obtenue dans l'expression de E , on trouve :
E min ≈ 0, 945213. D'autre part, quand r → ∞, il est clair que E → 1. On retiendra que l'amplitude de variation de E , entre ces deux valeurs, est très étroite.
En reprenant les formules vues précédemment, et en remarquant que µ = r p,
nous obtenons quelques égalités qui pourront être utiles par la suite :

− 2k


 E=e r


 µ = r2 e 2k
r
cdt
ds
dθ
ds
k
k
= e− r ch wc = e− r
k
k
q
= e r r sh wc = e r r
r−k
r−2k
q
;
k
r−2k .
Le nombre k = GM
c2 étant xé, à chaque valeur de la distance radiale r correspondent des valeurs de la vitesse circulaire vc , de l'énergie E et du moment
cinétique µ, bien déterminées et facilement calculables.
Pour r >> k, on pourra utiliser la formule approchée :
vc
≈
c
r
k
.
r
36 Vitesse de libération
Cherchons maintenant la vitesse de libération (ou vitesse d'évasion).
Nous allons supposer d'abord que le mobile se déplace (radialement) sur une
droite passant par le corps central ponctuel (le "Soleil") ; donc dθ
ds = 0.
Partons des formules :
82
1=e
− 2k
r
cdt
ds
2
−e
E = e−
1=e
2k
r
1=e
dr
cdt
2
E −e
2k
r
2
=
2k
r
2
e
2k
r
e
6k
r
dr
ds
2
;
cdt
.
ds
2k
r
2
E dr
e−
E −e
2k
r
2k
r
cdt
2
dr
2
E
;
cdt
2
E −1
6k
r
E
2
=e
−4k
r
e
−
;
−6k
r
E
−2k
dr
vdist
=
=e r
c
cdt
s
1−
e
−2k
r
E
2
;
2
.
Notons v la vitesse locale : v = vloc .
2k vdist
v
vloc
=
=er
=
c
c
c
s
1−
e
−2k
r
E
2
.
Pour calculer la vitesse de libération vl , on remplace E par 1 (car v doit
tendre vers 0 quand r tend vers l'inni). On obtient :
vl
=
c
q
1−e
−2k
r
.
Quand r tend vers l'inni, vl tend vers 0 ; quand r tend vers 0, vl tend vers c.
Pour r >> k, on pourra utiliser la formule approchée :
vl
≈
c
r
2k
.
r
Nous pouvons retrouver ce résultat, pour une orbite quelconque, à l'aide des
formules suivantes :
ch
k c dt
k
k
E
w
= e− r
=
er = E er ;
2
c
ds
m0 c
83
2
E =
u21 e−2ku1
2
u1 e2k(u2 −u1 )
− u22 e−2ku2
.
− u22 e2k(u1 −u2 )
Au périhélie, on aura :
u21 e−2ku1 − u22 e−2ku2
w2
2
e2ku2 .
= E e2ku2 = 2 2k(u
2 −u1 ) − u2 e2k(u1 −u2 )
c
u1 e
2
ch2
Faisons tendre r1 (aphélie) vers l'inni, donc u1 vers 0 ; alors u21 e−4ku1 tend vers
0, et ch2 wc2 tend vers 2e2ku2 ; donc :
ch2
1−
1
wl
=q
c
1−
= e2ku ;
vl2
c2
p
vl2
v2
vl
= e−2ku donc 2l = 1 − e−2ku donc
= 1 − e−2ku .
2
c
c
c
Nous allons considérer de nouveau un mobile en chute libre (radiale) vers le
corps central (ponctuel), et nous allons calculer le temps nécessaire pour que la
collision se produise. Nous allons adopter d'abord le point de vue d'un observateur lié au mobile, puis celui de l'observateur distant.
a:
Pour l'observateur lié au mobile, le temps propre (innitésimal) est ds. On
ds2 = e−
2k
r
c2 dt2 − e
dt = dtdist =
ds2 = e−
2k
r
dr
vdist
c2
e
=
2k
r
2k
r
dr2 , avec :
dr
vdist
dr
=
dr
−2k
e r
2
−e
v
2k
r
Nous avons vu que v = vloc = c

ds2 = 
1
−2k
1− e r2
E
− 1 e
2k
r
dr2 =
2k
r
1−
e
E
2
c2
v2
−2k
r
2
E
E
2
−2k
−e r
ds = q
dr
v
vloc
dr2 =
r

e
=
, donc :
−1
2k
r
dr2 .
, donc :
−
−2k
r
−2k
2
E −e r
E −e
2
E −e
dr
2
e
e
2k
r
−2k
r
−2k
−e r
e
dr2 =
E
2
e
2k
r
.
−2k
r
Quand r tend vers 0, on a : ds ≈ dr
; donc le temps propre du mobile ne diverge
E
pas au voisinage de r = 0, ce qui signie que, du point de vue du mobile, la
collision va se produire au bout d'un temps ni.
Etudions maintenant le point de vue de l'observateur
distant.
−2k
2
−4k v 2
−4k
vdist
r
dr 2
e
On sait que c2 = c2 dt2 = e r cloc
=e r
1 − 2 , donc :
2
E
84
dr2 ;
c dt = r
e
2k
r
1−
dr
e
−2k
r
2
.
E
Quand r tend vers 0, on a : c dt ≈ e r dr ; cette quantité diverge au voisinage de
r = 0, ce qui signie que, pour l'observateur distant, la collision n'aura jamais
lieu.
2k
Nous allons maintenant reprendre le calcul de la vitesse de libération, d'une
manière plus générale. Nous allons supposer que la métrique, dans le voisinage
du corps massif, est de la forme :
ds2 = α.c2 .dt2 − β.dr2 − γ.dθ2
où α, β et γ sont trois fonctions de r.
Nous imaginons une particule-test en chute libre radiale (dθ = 0).
1 = α.
2
dr2
c2 .dt2
dr2 c2 .dt2
c2 .dt2
vdist
c2 .dt2
−
β.
=
α.
−
β.
.
=
.
α
−
β.
.
ds2
ds2
ds2
c2 .dt2 ds2
ds2
c2
Comme on l'a vu précédemment (voir la section sur les géodésiques), on a :
c.dt
E
ds = α , donc :
te
α. c.dt
ds = c = E , donc
1=
2 2 2
2
E
vdist
E
β vdist
.
α
−
β.
.
1
−
.
=
.
α2
c2
α
α c2
2
2
On a toujours : dt2loc = α.dt2dist et dlloc
= β.dldist
, donc
2
β.dldist
α.dt2dist
2
=
β vdist
α . c2
2
vloc
c2
=
2
dlloc
dt2loc
=
, et, par conséquent :
1=
2 E
v2
. 1 − loc
.
α
c2
D'autre part, la vitesse de libération correspond toujours à E = 1, ce qui
donne (en notant vl la vitesse de libération locale) :
1
vl2
1= . 1− 2 ;
α
c
85
1−
vl2
= α.
c2
L'intérêt de cette comparaison est de bien souligner une diérence essentielle
entre la métrique de Schwarzschild et celle de Ni :
2
vl
2G.M
- dans
la métrique de Schwarzschild : α = 1− 2G.M
r.c2 , donc 1− c2 = 1− r.c2 , et
q
vl
2G.M
2G.M
c =
r.c2 ; la vitesse de libération est égale à c, évidemment, pour r =
c2 ,
et ceci ne dépend que du paramètre α ; la vitesse de libération est supérieure à
c pour r < 2G.M
c2 ;
- dans la métrique de Ni : α = e−
q
2G.M
r.c2
, donc 1 −
vl2
c2
= e−
2G.M
r.c2
, et
vl
c
=
1−e
; comme e
est toujours inférieur à 1, la vitesse de libération
vl est toujours inférieure à c.
− 2G.M
r.c2
− 2G.M
r.c2
On voit donc que la vitesse de libération est directement reliée au paramètre
α de la métrique. L'existence d'un "eet trou noir" est commandée par le choix
de ce paramètre.
Mais cette comparaison m'inspire une seconde remarque : la vitesse (locale)
de libération, en métrique de Schwarzschild (donc en relativité générale), est
exactement la même qu'en gravitation newtonienne ! Dès lors, il va de soi que
cette vitesse de libération dépasse celle de la lumière, pour r < 2G.M
c2 , comme
l'avait déjà noté Laplace, en étudiant les équations de Newton. Pour ma part,
je reste perplexe en voyant que la relativité générale nous ramène à une époque
que je croyais révolue.
Pourquoi révolue ? Parce-que la relativité restreinte a, depuis, fait triompher
une nouvelle conception de la composition des vitesses, donc de l'accélération.
Car l'accélération, me semble-t-il, doit être considérée comme une composition
de vitesses, qu'on pourrait formuler ainsi :
v ⊕ dv =
v + dv
dv
v.dv
dv v.dv
−
≈
v.
1
+
.
1
−
≈
v.
1
+
;
v
c2
v
c2
1 + v.dv
c2
v2
v ⊕ dv ≈ v + 1 − 2 .dv.
c
Nous
voyons
donc que la variation eective de la vitesse n'est pas dv , mais
2
1 − vc2 .dv . J'en déduis qu'il aurait été plus rationnel de noter dw la quantité
que nous avons notée dv , et de réserver la notation dv à la variation eective de
la vitesse (comme nous l'avions fait dans notre approche préliminaire) :
dv =
1−
v2
c2
.dw, donc : dw =
86
dv
2 .
1 − vc2
Par intégration, cette égalité donne :
v
w
= th .
c
c
On aura compris que w est une rapidité. Quand w tend vers l'inni, évidemment, v tend vers c.
Ce raisonnement, appliqué à une particule-test en chute libre radiale (dθ =
0), montre que la vitesse de chute ne peut pas dépasser celle de la lumière, donc,
par inversion du sens du vecteur vitesse, que la vitesse de libération, elle non
plus, ne sera jamais supérieure à c.
Ceci nous ramène à notre approche préliminaire : en eet, depuis le début,
c'est cette conception de l'accélération, directement inspirée par la relativité restreinte, que nous avons utilisée. Nous avions d'ailleurs introduit la distinction
entre l'accélération classique : γ = dv
dt , et l'accélération suggérée par le contexte
dw
relativiste : Γ = dt . Pourquoi Einstein n'a-t-il pas fait de même ? Probablement
parce-qu'il n'a pas conçu sa gravitation comme une continuation de la relativité
restreinte, mais comme un projet totalement diérent, dont l'objectif, entrevu
dans la section sur "le pari d'Einstein", apparaîtra mieux encore dans la section
sur "le tenseur de Ricci en métrique de Schwarzshild".
37 Orbites elliptiques et lois de Kepler
Si la vitesse de la planète est inférieure à la vitesse de libération, son orbite
va être, en première approximation, elliptique. Nous allons montrer que la métrique triviale de Ni permet bien de retrouver les lois de Kepler.
Dans la section "Aphélie et périhélie", nous avons démontré que :
2
1 = e2ku E − e−2ku µ2
du
dθ
2
− e−2ku µ2 u2 .
On en tire :
du
dθ
2
=
2
E
e4ku 2
"
#
2
e2ku
1
2ku
2ku E
−2ku 2
−u − 2 =e
e
−e
u − 2 ;
µ
µ
µ2
µ
2
dθ = q
±e−ku du
2
e2ku E
− e−2ku u2 −
µ2
87
.
1
µ2
Dans cette section, nous allons étudier le cas où r1 et r2 sont deux nombres
réels positifs, très supérieurs à k. Les nombres u1 = r11 et u2 = r12 sont donc
µ2
2k
également deux réels positifs. Comme r1 + r2 ≈ 1−E
2 et r1 r2 ≈
2 , nous nous
1−E
2
plaçons donc dans le cas où 1 − E > 0, donc 0 < E < 1.
2
2
Posons : A = e2ku Eµ2 − e−2ku u2 − µ12 , puis remplaçons µ2 et E par leurs
expressions calculées précédemment. Il vient :
u21 e2k(u−u1 ) − u22 e2k(u−u2 ) u2 e2k(u1 −u) − u2 e2k(u2 −u) u21 e2k(u2 −u1 ) − u22 e2k(u1 −u2 )
−
−
;
e2ku1 − e2ku2
e2ku1 − e2ku2
e2ku1 − e2ku2
u21 e2k(u−u1 ) − e2k(u2 −u1 ) + u22 e2k(u1 −u2 ) − e2k(u−u2 ) + u2 e2k(u2 −u) − e2k(u1 −u)
A=
.
e2ku1 − e2ku2
A=
Notons N le numérateur de cette fraction, D son dénominateur, et B1 , B2
et B les trois crochets du numérateur, associé à u21 , u22 et u2 . (Ils se déduisent
les uns des autres par permutation circulaire.)
Nous allons supposer pour le moment que k est très petit par rapport à r,
r1 et r2 . Ceci nous autorise à remplacer nos fonctions par des développements
limités d'ordre un ou deux en k ; en raison des simplications qui vont se produire, nous allons être obligés de choisir l'ordre deux.
B1 = e2k(u−u1 ) −e2k(u2 −u1 ) ≈ (1+2k(u−u1 )+2k 2 (u−u1 )2 )−(1+2k(u2 −u1 )+2k 2 (u2 −u1 )2 ) ;
B1 ≈ 2k(u − u2 ) + 2k 2 (u2 − 2uu1 + u21 − u22 + 2u1 u2 − u21 ) ;
B1 ≈ 2k(u − u2 ) + 2k 2 (u − u2 )(u + u2 − 2u1 ).
De même : B2 ≈ 2k(u1 − u) + 2k2 (u1 − u)(u1 + u − 2u2 )
et B ≈ 2k(u2 − u1 ) + 2k2 (u2 − u1 )(u2 + u1 − 2u).
Dans l'expression de N = u21 B1 + u22 B2 + u2 B , regroupons les termes en k
d'une part, en k2 d'autre part :
N ≈ 2k u21 (u − u2 ) + u22 (u1 − u) + u2 (u2 − u1 ) ...
... +2k 2 u21 (u − u2 )(u + u2 − 2u1 ) + u22 (u1 − u)(u1 + u − 2u2 ) + u2 (u2 − u1 )(u2 + u1 − 2u) ;
N ≈ 2k u2 (u2 − u1 ) + u(u1 − u2 )(u1 + u2 ) + u1 u2 (u2 − u1 ) ...
... +2k 2 u2 (u2 − u1 )(u2 + u1 − 2u) + u21 − u22 + u(u21 u2 − 2u31 − u21 u2 + u1 u22 ...
... − 2k 2 u1 u22 + 2u32 ) − u21 u2 (u2 − 2u1 ) + u1 u22 (u1 − 2u2 ) ;
88
N ≈ 2k(u2 − u1 )(u2 − u(u1 + u2 ) + u1 u2 ) ...
... +2k 2 u2 (u2 − u1 )(−2u) + 2u(u2 − u1 )(u21 + u1 u2 + u22 ) + u1 u2 (−u1 u2 + 2u21 + u2 u1 − 2u22 ) ;
N ≈ 2k(u2 − u1 )(u − u1 )(u − u2 ) ...
... + 2k (u2 − u1 ) −2u3 + 2u(u21 + u1 u2 + u22 ) − 2u1 u2 (u1 + u2 ) ;
2
N ≈ 2k(u2 − u1 )(u − u1 )(u − u2 ) ...
... − 4k (u2 − u1 ) u3 − u(u21 + u1 u2 + u22 ) + u1 u2 (u1 + u2 ) ;
2
N ≈ 2k(u2 − u1 )(u − u1 )(u − u2 ) ...
... − 4k 2 (u2 − u1 )(u − u1 )(u2 − uu1 − u1 u2 − u22 ) ;
N ≈ 2k(u2 − u1 )(u − u1 )(u − u2 ) − 4k 2 (u2 − u1 )(u − u1 )(u + u1 + u2 ) ;
N ≈ 2k(u2 − u1 )(u − u1 )(u − u2 ) [1 − 2k(u + u1 + u2 )] ;
N ≈ 2k(u1 − u2 )(u2 − u)(u − u1 ) [1 − 2k(u + u1 + u2 )] .
En ce qui concerne le dénominateur :
D = e2ku1 −e2ku2 ≈ (1+2ku1 +2k 2 u21 )−(1+2ku2 +2k 2 u22 ) ≈ 2k(u1 −u2 )+2k 2 (u1 −u2 )(u1 +u2 ) ;
D ≈ 2k(u1 − u2 ) [1 + k(u1 + u2 )] .
Par conséquent :
A=
2k(u1 − u2 )(u2 − u)(u − u1 ) [1 − 2k(u + u1 + u2 )]
N
≈
;
D
2k(u1 − u2 ) [1 + k(u1 + u2 )]
A≈
(u2 − u)(u − u1 ) [1 − 2k(u + u1 + u2 )]
.
1 + k(u1 + u2 )
Notre équation de départ devient donc :
s
±e−ku du
1 + k(u1 + u2 )
du
√
p
dθ =
≈ ±(1 − ku)
;
1 − 2k(u + u1 + u2 )
A
(u2 − u)(u − u1 )
89
u1 + u2
du
) [1 + k(u + u1 + u2 )] p
;
2
(u2 − u)(u − u1 )
du
u1 + u2
;
+ k(u + u1 + u2 ) p
dθ ≈ ± 1 − ku + k
2
(u2 − u)(u − u1 )
3(u1 + u2 )
du
p
dθ ≈ ± 1 + k
2
(u2 − u)(u − u1 )
dθ ≈ ±(1 − ku)(1 + k
Nous allons maintenant poser :
u=
1
1
(u2 + u1 ) + (u2 − u1 ) cosψ,
2
2
où ψ est un angle qui s'annule pour u = u2 (périhélie), qui vaut 180o pour
u = u1 (aphélie), et qui varie de 360o quand la planète parcourt son orbite.
1
1
1
1
u2 − u = u2 − u2 − u1 − (u2 − u1 ) cosψ = (u2 − u1 )(1 − cosψ) ;
2
2
2
2
1
1
1
1
u2 + u1 − u1 + (u2 − u1 ) cosψ = (u2 − u1 )(1 + cosψ) ;
2
2
2
2
1
1
(u2 − u)(u − u1 ) = (u2 − u1 )2 (1 − cos2 ψ) = (u2 − u1 )2 sin2 ψ ;
4
4
p
1
(u2 − u)(u − u1 ) = ± (u2 − u1 ) sinψ ;
2
1
1
du = (u2 − u1 ) d(cosψ) = − (u2 − u1 ) sinψ dψ.
2
2
u − u1 =
Ces deux dernières égalités prouvent (au signe près) que :
du
p
(u2 − u)(u − u1 )
= dψ.
L'équation du mouvement devient donc :
3(u1 + u2 )
dθ ≈ 1 + k
dψ.
2
Si k est très petit par rapport à r1 et r2 , le terme k 3(u12+u2 ) peut être négligé
en première approximation ; on obtient alors : dθ ≈ dψ , donc :
1
1
(u2 + u1 ) + (u2 − u1 ) cosθ ;
2
2
1
u2 − u1
u ≈ (u2 + u1 ) 1 +
cosθ .
2
u2 + u1
u≈
Rappelons que u = 1r ;
90
posons p1 = 12 (u2 + u1 ) = 21 ( r12 + r11 ) =
notre équation s'écrit alors :
, et e =
r1 +r2
2r1 r2
u2 −u1
u2 +u1
=
r1 −r2
r1 +r2
;
1
1
= (1 + e cos θ) ;
r
p
r=
p
.
1 + e cos θ
Cette équation est celle d'une ellipse ; c'est la première loi de Kepler !
Le nombre p est le paramètre de l'orbite ; e est son excentricité. Si r1 > r2 , on
a : 0 < e < 1.
Nous allons maintenant étudier la période de révolution T d'une planète ;
reprenons les égalités :
dt
dt
≈ m0 c2
;
ds
ds
2k dθ
dA
dθ
µ = m0 c r 2 e r
≈ m0 c r 2
≈ 2m0 c
.
ds
ds
ds
Nous désignons par dA l'aire balayée pendant le temps dt par le rayon vecteur
E = m 0 c2 e −
2k
r
joignant le Soleil à la planète.
dt ≈
E
E 2m0 c
2E
ds ≈
dA ≈
dA ;
2
2
m0 c
m0 c
µ
µc
µc
dA
≈
.
dt
2E
Pour une planète donnée (µ et E xés) cette quantité est constante, donc
l'aire balayée par le rayon vecteur qui joint le Soleil à la planète est proportionnelle au temps. On reconnaît la seconde loi de Kepler (ou loi des aires).
En intégrant dt sur un tour complet de l'orbite :
T ≈
Rappelons que : µ =
On en tire :
µ
m0 c
, µ2 ≈
2kr1 r2
r1 +r2
2E
µc
A
,E=
.
E
m0 c2
2
, E ≈ 1 − r12k
+r2 .
2
1 − r12k
E2
E
r1 + r2
1
+r2
=
≈
≈
≈
;
2
2kr
r
2
2
1
2
µ c
2kr1 r2
pk
µ
r +r
1
2
91
T2 ≈
4E 2
µ2 c4
A
2
≈
4
pkc2
A
2
.
2
Notons a le demi-grand axe de l'ellipse : a = r1 +r
2 .
L'aire de √
l'ellipse est donnée par la formule :
2
1 − e2 ; A2 = π 2 a4 (1 − e2 ) = π 2 a3 [a(1 − e2 )] = π 2 a3 p (car p =
A = πa
2
a(1 − e )). Donc :
T2 ≈
4
pkc2
A
2
≈
T2 ≈
4π 2 a3 p
4π 2 a3
≈
;
pkc2
GM
4π 2 a3
.
GM
On reconnaît la troisième loi de Kepler (ou loi des périodes).
38 Orbites paraboliques
L'étude des orbites paraboliques se déduit facilement de celle des orbites
elliptiques : il sut de faire tendre r1 vers l'inni, donc u1 vers 0. Comme
2
u21 e−2ku1 −u22 e−2ku2
E = u2 e2k(u
, on voit facilement que E tend vers 1, ce qui est
2 −u1 ) −u2 e2k(u1 −u2 )
1
2
µ
2k
cohérent avec les égalités (moins rigoureuses) : r1 + r2 ≈ 1−E
2 et r1 r2 ≈
2.
1−E
u2 −u1
r1 −r2
D'autre part, e = u2 +u1 = r1 +r2 ; on voit donc que l'excentricité de l'orbite
tend vers 1. L'équation de l'orbite, en coordonnées polaires, devient donc :
2
r=
p
.
1 + cos θ
Cette équation est celle d'une parabole.
39 Orbites hyperboliques
Il nous reste à étudier le cas où E > 1. D'après les égalités r1 + r2 ≈
et r1 r2 ≈
2
µ
2
1−E
2k
2
1−E
, on voit que l'un des deux nombres r1 et r2 doit être négatif.
p
2
k2 −µ2 (1−E )
p
2
2
2
k −µ (1−E )
Les égalités : r1 ≈
et r2 ≈
montrent que c'est
2
2
1−E
1−E
r1 qui devient négatif (et, également, que la somme r1 + r2 est négative). Ceci
nous pose un problème d'interprétation : le nombre r1 (négatif) ne désigne plus
k+
k−
92
l'aphélie (point de l'orbite qui est le plus éloigné du Soleil) ; d'ailleurs il n'y a
plus d'aphélie ! Mais peu importe : ce nombre r1 peut toujours être
p déni, d'une
2
2
2
−µ (1−E )
,
manière purement formelle, par l'égalité (approximative) r1 ≈ k+ k1−E
2
ou, de manière plus rigoureuse, par les formules vues dans la section sur les
orbites elliptiques. Ce qui est important, c'est le fait que tous les calculs faits
dans cette section restent valables, y compris l'équation polaire à laquelle nous
avions abouti :
r=
p
.
1 + e cos θ
1
La seule chose qui va changer, c'est l'excentricité : e = uu22 −u
+u1 ; en eet, on
peut vérier facilement que cette excentricité est supérieure à 1 (en remarquant
2
que le nombre u1 + u2 = r11 + r12 = rr11+r
.r2 est positif) ; or, dans ce cas où l'ex1
centricité est
supérieure à 1, l'équation ci-dessus (avec −Arccos − e < θ <
1
Arccos − e ) est celle d'une branche d'hyperbole.
40 Précession du périhélie
Revenons aux orbites elliptiques ; nous avons dit que la métrique triviale de
Ni permet de retrouver, en première approximation, les lois de Képler. Nous
allons nous intéresser ici à l'écart par rapport aux lois de Képler. Nous allons
voir que l'axe de l'orbite n'est pas stable, comme le croyaient Képler et Newton,
mais tourne lentement. C'est ce qu'on appelle la précession du périhélie (ou du
périastre).
Nous avons vu que e =
1 − e2 =
a(1 − e2 ) =
r1 −r2
r1 +r2
, donc e2 =
(r1 −r2 )2
(r1 +r2 )2
, et :
(r1 + r2 )2 − (r1 − r2 )2
4r1 r2
=
;
2
(r1 + r2 )
(r1 + r2 )2
r1 + r2
4r1 r2
2r1 r2
=
=
2
2
(r1 + r2 )
r1 + r2
1
r2
2
+
1
r1
;
2
=p;
u2 + u1
u1 + u2
1
1
= =
.
2
p
a(1 − e2 )
a(1 − e2 ) =
h
i
Reprenons l'équation : dθ ≈ 1 + k 3(u12+u2 ) dψ , mais, cette fois-ci, au lieu
de supprimer le terme k 3(u12+u2 ) , remplaçons-le (selon la formule ci-dessus) par
93
3k
a(1−e2 )
. L'équation du mouvement devient :
dθ ≈ 1 +
3k
a(1 − e2 )
dψ.
Le terme que nous avons réintroduit est responsable de la précession du
périhélie. Sur un tour d'orbite (du périhélie au périhélie), la variation de ψ est :
∆ψ = 2π ; celle de θ est :
∆θ = 2π
1+
6πk
6πGM
3k
= 2π +
= 2π + 2
.
a(1 − e2 )
a(1 − e2 )
c a(1 − e2 )
La précession du périhélie est donc, pour chaque tour d'orbite :
6πGM
.
− e2 )
c2 a(1
C'est précisément la formule à laquelle conduisent la relativité générale et la
métrique de Schwarzschild.
Dans le cas de Mercure, on savait (depuis Le Verrier) que les perturbations
dues aux autres planètes devaient produire une précession de 53200 par siècle ;
mais l'observation donnait 57500 (soit 4300 de trop). Cette diérence de 4300 par
siècle a pu être expliquée grâce à la relativité générale. Le calcul a été fait
par Einstein lui-même, qui a considéré ce résultat comme un test majeur de sa
théorie. Une autre explication a été proposée, basée sur l'aplatissement (hypothétique) du Soleil ; mais des mesures récentes l'ont exclue : l'aplatissement est
trop faible. D'autre part, la précession des autres planètes (beaucoup plus faible
que celle de Mercure) a pu être mesurée, et la formule ci-dessus a été conrmée. Mais c'est surtout l'étude du pulsar binaire PSR 1913+16 qui a apporté
une conrmation spectaculaire ; en eet, dans ce système double très serré, la
précession du périastre est de 4, 2o par an, soit 4100 par jour ; presque autant
que la précession du périhélie de Mercure en un siècle ! D'autres pulsars binaires,
actuellement en cours d'étude, conrment cette précession d'une manière encore
plus précise.
41 Déexion de la lumière
Dans cette partie, nous allons chercher à savoir comment un rayon lumineux
est dévié lorsqu'il passe à proximité du Soleil (ou de tout autre corps massif).
Cette déviation est liée au fait que les distances locales, par rapport à l'évaluation de l'observateur distant, sont de plus en plus importantes quand on se
rapproche du Soleil, ce qui équivaut à une courbure de l'espace : en chaque
94
point, les observateurs locaux voient passer la lumière en ligne droite, mais l'observateur distant va voir une ligne courbe.
Nous supposons qu'un rayon lumineux arrive de l'inni, passe à la distance
r0 du Soleil, et repart vers l'inni. L'angle polaire θ s'annule quand r = r0 .
Dans un premier temps, nous n'étudierons qu'une demi-trajectoire (de r = r0
à r = ∞).
Nous partons des deux équations suivantes (voir la partie "géodésiques") :
a) ds2 = c2 e−
2k
r
dt2 − e
4k
r
b) r2 e
2k
r
dr2 − r2 e
2k
r
dθ2 ;
dθ
= K.
dt
Nous allons écrire que ds2 = 0 (particularité des rayons lumineux), préciser
la constante K , et éliminer dt pour exprimer dθ en fonction de dr.
Puisque ds2 = 0, on tire de l'équation a) :
c2 dt2 = e
4k
r
dr2 + r2 e
4k
r
dθ2 .
L'équation b) nous donne :
8k
c2 dt2 =
c2 r4 e r dθ2
.
K2
Les deux réunies conduisent à :
8k
e
4k
r
4k
c2 r4 e r dθ2
− r2 e r dθ2 ;
2
K
"
#
2 2 4k
r
2
2 c r e
dr = r
− 1 dθ2 .
K2
dr2 =
Pour r = r0 , dr s'annule, donc le crochet aussi, ce qui nous donne :
2k
K = cr0 e r0 .
Donc :
"
dr2 = r2
r2 e
4k
r
4k
r02 e r0
95
#
− 1 dθ2 .
Posons encore u = 1r ; on a : du2 =
"
2
du =
e
4k
r
r02 e
4k
r0
dr 2
r4
; donc :
#
−
h
i
1
2
2 4k(u−u0 )
2
dθ
=
u
e
−
u
dθ2 = e4ku u20 e−4ku0 − u2 e−4ku dθ2 ;
0
r2
dθ
du
2
=
e−4ku
.
− u2 e−4ku
u20 e−4ku0
A partir d'ici, nous allons supposer r susamment grand par rapport à
k pour autoriser un développement limité à l'ordre un en ku. On écrit que
e−4ku ≈ 1 − 4ku.
2
dθ
1 − 4ku
1 − 4ku
≈ 2
= 2
;
du
u0 (1 − 4ku0 ) − u2 (1 − 4ku)
(u0 − u2 ) − 4k(u30 − u3 )
dθ
du
2
≈
(u20
1 − 4ku
;
u3 −u3
− u2 ) 1 − 4k u02 −u2
0
96
dθ
du
2
≈
1 − 4ku
;
u2 +u u+u2
(u20 − u2 ) 1 − 4k 0 u00+u
2
1
u20 + u0 u + u2
dθ
≈ 2
(1 − 4ku) 1 + 4k
;
du
(u0 − u2 )
u0 + u
2
2
dθ
1
u0 + u0 u + u2
≈ 2
1
+
4k
−
u
;
du
(u0 − u2 )
u0 + u
2
2
1
u0 + u0 u + u2
u0 u + u2
dθ
≈ 2
1
+
4k
−
;
du
(u0 − u2 )
u0 + u
u0 + u
2
dθ
1
u20
≈ 2
1 + 4k
;
du
(u0 − u2 )
u0 + u
!
±du
1
;
dθ ≈ p 2
1 + 2ku0
1 + uu0
u0 − u2
!
±d uu0
1
dθ ≈ r
2 1 + 2ku0 1 + u .
u0
1 − uu0
Posons :
u
u0
= cos φ. Notre équation devient :
±d (cos φ)
dθ ≈ q
2
1 − (cos φ)
1 + 2ku0
1
1 + cos φ
=
±sin φ dφ
sin φ
1+
2ku0
1 + cos φ
.
Choisissons le signe + (simple convention sur le sens de déplacement).
dθ ≈ dφ + 2ku0
dφ
.
1 + cos φ
φ
d2
dφ
φ
On sait que cos φ = 2cos2 φ − 1 ; donc 1+cos
φ = cos2 φ = d tan 2 .
2
Sur une demi-trajectoire du rayon lumineux, la variation de l'angle θ est donnée
par :
∆θ ≈ ∆φ + 2ku0 ∆ tan
φ
2
.
Sur cette demi-trajectoire, r varie de r0 à l'inni, u varie de u0 à 0, cos φ
varie de 1 à 0, φ varie de 0 à π2 , φ2 varie de 0 à π4 , tan φ2 varie de 0 à 1 ; donc :
φ
π
= + 2ku0 ,
∆θ ≈ ∆φ + 2ku0 ∆ tan
2
2
97
et, sur la trajectoire complète :
∆θ ≈ π + 4ku0 ≈ π +
4k
4GM
.
=≈ π +
r0
r0 c2
La déexion de la lumière est donnée par le terme :
4GM
.
r0 c2
C'est exactement la formule à laquelle conduit la relativité générale.
Elle a été conrmée par Eddington, par la mesure directe sur des étoiles occultées par le Soleil. Ces mesures, peu précises à l'époque, ont été anées depuis,
et sont maintenant vraiment convaincantes. D'autre part, les observations de
mirages gravitationnels par les astronomes se sont multipliées, et la déviation
de la lumière par les corps massifs ne fait plus de doute.
42 Eet Shapiro
Lorsqu'un rayon lumineux passe à proximité du Soleil (ou de tout autre
corps massif), il semble prendre du retard par rapport à ce que prévoyaient les
calculs classiques. Ce retard (appelé "retard Shapiro") est dû à la fois au fait
que la distance à parcourir est plus grande (les distances locales sont supérieures
à l'évaluation de l'observateur distant), et au fait que le temps (local) s'écoule
plus lentement. Ces deux raisons réunies entraînent que la vitesse apparente de
la lumière (évaluée par l'observateur distant) est inférieure à c.
Pour étudier l'eet Shapiro, nous allons commencer, comme pour la déexion
de la lumière, avec les équations suivantes :
a) ds2 = c2 e−
2k
r
b) r2 e
dt2 − e
4k
r
2k
r
dr2 − r2 e
2k
r
dθ2 = 0 ;
2k
dθ
= K = cr0 e r0 .
dt
En eet, nous nous intéressons toujours à un rayon lumineux passant près du
Soleil (à la distance r0 ). Mais cette fois-ci, au lieu d'éliminer dt, nous allons
éliminer dθ, an d'étudier le temps que met la lumière pour nous parvenir, en
passant très près du Soleil.
L'idée originale de Shapiro est de mesurer le temps mis par un rayonnement
électromagnétique pour faire l'aller-retour Terre-Mercure-Terre par exemple lorsque
la planète est sur le point de passer derrière le Soleil. On s'aperçoit alors que la
durée de cet aller-retour augmente brutalement juste avant l'occultation.
98
On va voir que cette variation est calculable avec la métrique de Ni, aussi
bien qu'avec celle de Schwarzschild.
D'après b) :
2k
c r 0 e r0
dθ =
r2 e
On fait la substitution dans a) :
4k
r
dt.
4k
2
− 2k
r
c e
2
dt − e
2k
r
2
2
dr − r e
2k
r
c2 r02 e r0
r4 e
8k
r
dt2 = 0 ;
4k
2k
c2 r02 e r0 2
dt2 − e r dr2 −
dt = 0 ;
6k
r2 e r
"
#
4k
2k
r02 e r0
2 − 2k
2
c e r dt 1 −
= e r dr2 ;
4k
r2 e r
c2 e−
2k
r
e
c2 dt2 =
e
1−
4k
r
4k
r02 e r0
4k
r2 e r
dr2 =
r02
1
4k
r02 e r0
4k
r
4k
e r0
−
dr2 =
1
r2 e
4k
r
u20
u20 e4k(u−u0 )
dr2 .
e−4ku0 − u2 e−4ku
Nous supposons que k est petit par rapport à r (donc ku et ku0 très petits
aussi), et nous développons les exponentielles à l'ordre un en k :
c2 dt2 ≈
u20 (1
u20 [1 + 4k(u − u0 )]
u20 [1 + 4k(u − u0 )]
2
dr
=
dr2 ;
2
− 4ku0 ) − u2 (1 − 4ku)
(u0 − u2 ) − 4k(u30 − u3 )
99
u20 [1 + 4k(u − u0 )]
u20 [1 + 4k(u − u0 )]
i dr2 =
h
h
i dr2 ;
3
3
u0 −u
u20 +u0 u+u2
2
2
2
2
(u0 − u ) 1 − 4k u2 −u2
(u0 − u ) 1 − 4k u0 +u
0
i
h
u2 +u u+u2
u20 [1 + 4k(u − u0 )] 1 + 4k 0 u00+u
c2 dt2 ≈
dr2 ;
(u20 − u2 )
u2 + u0 u + u2
u2
dr2 ;
c2 dt2 ≈ 2 0 2 1 + 4k(u − u0 ) + 4k 0
(u0 − u )
u0 + u
u2
u2 − u20
u2 + u0 u + u2
c2 dt2 ≈ 2 0 2 1 + 4k
+ 4k 0
dr2 ;
(u0 − u )
u0 + u
u0 + u
u0 u + u2
u2
u20
2 2
1 + 4k
+ 4k
dr2 ;
c dt ≈ 2
(u0 − u2 )
u0 + u
u0 + u
u0
u2
p
cdt ≈
dr.
1 + 2ku + 2k
u0 + u
u20 − u2
c2 dt2 ≈
Nous allons passer maintenant à l'intégration, que nous allons fractionner en
trois parties :
2
A = √u02 dr 2 , B = 2k u0u+u √u02 dr 2 , et C = 2ku √u02 dr 2 .
u0 −u
u0 −u
u0 −u
On posera : uu0 = cos φ.
u0 dr
A= p 2
=−
u0 − u2
r
u2
du
u0 sin φ dφ
2 = u2 cos2 φ p1 − cos2 φ ;
0
1 − uu0
sin φ dφ
dφ
dφ
=
= r0
= r0 d(tan φ).
u0 cos2 φ sin phi
u0 cos2 φ
cos2 φ
p
q
2
r
2
1−( r0 )
Remarquons que cos φ = uu0 = rr0 , sin φ = 1 − rr0 , tan φ =
=
r0
A=
√
r
r 2 −r02
r0
. On a donc :
A = r0 d(tan φ) = d
q
r2
−
r02
.
Si on néglige les termes B et C , on trouve donc que le temps nécessaire au
rayon lumineux pour aller de r0 √
(point de sa trajectoire le plus proche du Soleil)
r 2 −r 2
à r (ou inversement) est : ∆t ≈ c 0 , ce qui correspond p
exactement au résultat qu'on obtiendrait dans un espace-temps euclidien (car r2 − r02 correspond
alors à la distance parcourue, calculée par le théorème de Pythagore classique).
Mais dans notre espace-temps courbe, la distance va être plus grande, et le
temps de parcours aussi : les termes B et C vont nous le montrer.
100
u0 − du
u2
1
u0 dr
−du
u2
u2
p
p
r
= 2k
= 2k
B = 2k
2 ;
2
2
2
2
u0 + u
u
+
u
u
+
u
0
0
u0 − u
u0 − u
1 − uu0
1
u0 sin φ dφ
dφ
= 2k
.
u0 (1 + cos φ)
sin φ
1 + cos φ
2d( φ
dφ
φ
2)
=
=
d
tan
Comme cos φ = 2cos2 φ2 − 1, on a : 1+cos
φ
2
φ
2 , on obtient :
2cos
B = 2k
2
φ
B = 2k d tan
.
2
Mais on sait que tan
φ
B = 2k d tan
2
φ
2
=
q
1−cos φ
1+cos φ
s
= 2k
, et que cos φ =
1 − cos φ
= 2k
1 + cos φ
s
1−
1+
r0
r
r0
r
r0
r
, donc :
r
= 2k
r − r0
.
r + r0
Au temps de parcours de la lumière,
q de r0 à r (ou inversement), nous devons
r−r0
2k
donc ajouter un correctif égal à c
r+r0 ; ce correctif est compris entre 0 et
2k
2k
2GM
quand r est grand par rapport à r0 .
c : il est proche de c = c3
Etudions maintenant le troisième terme (C ) :
u − du
−du
u0 dr
u2
= 2k r
C = 2ku p 2
= 2k r
2 ;
2
2
u0 − u
u
1 − u0
u 1 − uu0
C = 2k
u0 sin φ dφ
dφ
= 2k
.
u0 cos φ sin φ
cos φ
= dLog tan φ2 + π4 ; de plus :
p r−r
√
√
0
π
1+
tan φ
1+tan φ
r+r0
r+r0 +√r−r0
φ
π
2 +tan 4
2
tan 2 + 4 = 1−tan φ tan π = 1−tan φ = p r−r
= √r+r
;
−
r−r0
0
0
1−
2
4
2
r+r0
√
√
√
√
2
r+ r 2 −r02
r+r0 +2 (r+r0 )(r−r0 )+r−r0
( r+r0 + r−r0 )
tan φ2 + π4 = (r+r0 )−(r−r0 ) =
=
;
2r0
r0
q
2
tan φ2 + π4 = rr0 1 + 1 − rr0
, donc :
On sait que
dφ
cos φ
"
C = 2k d Log
r
r0
r
1+
101
1−
r 2
0
r
!!#
.
Pour r = r0 , le crochet s'annule ; pour r très grand par rapport à r0 , il est
voisin de 2 rr0 . Donc au temps de parcours de la lumière entre r0 et r (r >> r0 ),
nous devons ajouter un nouveau correctif proche de 2kc Log 2 rr0 .
C'est ce terme correctif C qui est "l'eet Shapiro principal", et je réserverai le
nom d'"eet Shapiro secondaire" au terme B .
En pratique, l'eet Shapiro se mesure de la façon suivante : au moment
ou une sonde spatiale, ou une planète (par exemple Mercure), va être occultée
par le Soleil, on envoie un faisceau radar vers la cible, et on mesure le temps
d'aller-retour. Notons par exemple rm la distance de Mercure au Soleil, et rt la
distance de la Terre au Soleil ; au moment de l'occultation, on a : r0 = rs (rayon
du Soleil). Le parcours de la lumière se décompose en quatre parties : TerreSoleil, Soleil-Mercure, Mercure-Soleil, Soleil-Terre ; donc l'anomalie du temps de
parcours doit être :
4k
rt
rm
rt rm
4GM
rt rm
4k
4k
Log 2
Log 2
Log 4 2
=
Log 4 2
+
=
c
rs
c
rs
c
rs
c3
rs
(où M est la masse du Soleil).
8GM
Pour l'eet Shapiro secondaire, on obtient : 4. 2GM
c3 = c3 .
En regroupant les eets Shapiro principal et secondaire, on trouve un retard de
l'écho radar de l'ordre de :
∆T =
4GM
c3
rt rm
Log 4 2
+2 .
rs
Cette formule est la même qu'en relativité générale.
On peut, bien sûr, remplacer Mercure par une sonde spatiale ; c'est ainsi que
l'eet Shapiro a pu être vérié avec une bonne précision, en 1975, par la sonde
Viking. Mais c'est aujourd'hui l'étude des pulsars binaires qui fournit la conrmation la plus précise (et de loin).
Remarquons une chose étrange : si nous faisons tendre rs vers 0 dans la
formule ci-dessus, il est clair que ∆T tend vers l'inni. Ceci signie que, si nous
remplaçons le Soleil par une particule de rayon nul et de masse non nulle, le
temps mis par la lumière pour nous en parvenir sera inni. On peut se demander si cette "absurdité" vient du fait que nous avons fait des approximations
dans notre calcul ; mais ce n'est pas le cas ! Ceci est vrai, d'ailleurs, aussi bien
en relativité générale que dans le modèle proposé ici.
Examinons cette curiosité d'un peu plus près. Considérons une sphère de
rayon r, au centre de laquelle se trouve une masse M ponctuelle. Rappelons
102
que r est le rayon estimé par l'observateur distant. Pour celui-ci, l'aire de
cette sphère est : 4πr2 ; pour des observateurs locaux (situés sur la sphère)
Φ
GM
k
les distances élémentaires sont multipliées par le coecient e r = e rc2 = e− c2 ,
donc l'aire élémentaire est multipliée par le carré de ce coecient. L'aire totale (obtenue en sommant les mesures locales des observateurs locaux) est
2GM
donc : A = 4πr2 e rc2 . Evaluons maintenant le volume innitésimal compris entre les sphères de rayons r et r + dr ; pour l'observateur local, la difGM
férence des rayons n'est pas dr, mais e rc2 dr ; donc le volume innitésimal est :
GM
3GM
2GM
dV = 4πr2 e rc2 e rc2 dr = 4πr2 e rc2 dr. Mais on s'aperçoit que la quantité
3GM
3Φ
r2 e rc2 = r2 e− c2 tend vers l'inni quand r tend vers 0 ! Ceci signie que l'aire
d'une sphère (évaluée en sommant les observations locales) ayant en son centre
une particule massive ponctuelle tend vers l'inni quand son rayon tend vers
0 ! Ceci serait extrêmement troublant... si les particules massives et ponctuelles
existaient ! Mais tout nous porte à croire que les densités innies n'existent pas...
43 La "création d'espace"
Comme nous venons de le voir, l'eet Shapiro permet de prendre sur le fait
un phénomène très curieux : lorsque la lumière passe à proximité d'un corps
massif, elle a un excédent de distance à parcourir, comme si la présence de matière produisait une dilatation de l'espace dans son voisinage.
Bien entendu, au lieu de dire que l'espace se dilate (c'est le point de vue de
l'observateur local), on pourrait dire que les objets qu'il contient rétrécissent
(c'est le point de vue de l'observateur distant). Ces deux points de vue sont
complémentaires.
Ce phénomème que j'appelle "création d'espace" n'est pas un rêve : il existe
bel et bien, et a été vérié avec une grande précision, en particulier grâce à
l'étude des pulsars binaires. C'est l'extrapolation à des corps beaucoup plus
compacts qui reste à étudier : dans ce cas, la métrique de Ni et celle de Schwarzschild divergent, ce qui a de profondes répercussions sur la conception des trous
noirs, par exemple.
44 Modèle newtonien des systèmes binaires
Ici commence l'étude des systèmes binaires (plus particulièrement des pulsars
binaires), systèmes qui constituent d'extraordinaires laboratoires où sont testées
avec une précision inégalée les diérentes théories de la gravitation. Nous nous
contenterons, dans cette section, de rappeler quelques généralités classiques, établies par Newton.
103
Un système binaire est formé de deux corps célestes tournant autour de leur
centre de gravité commun. Ce système peut être composé de deux étoiles quelconques (étoile double), d'un pulsar et d'une autre étoile (pulsar binaire), de
deux pulsars (pulsar double)...
Nous considèrerons deux étoiles M1 et M2 , de masses m1 et m2 , liées gravitationnellement (et supposées isolées dans l'espace).
La première idée de Newton est de se placer dans un repère lié à leur centre
m2
1
de gravité O. Ce point, situé sur la droite (M1 M2 ), est tel que OM
OM2 = m1 , ou,
r1
m2
en posant r1 = OM1 et r2 = OM2 : r2 = m1 .
De plus, si on note ~vO la vitesse de O, ~v1 celle de M1 , ~v2 celle de M2 , alors :
(m1 + m2 ).~vO = m1 .~v1 + m2 .~v2 ; puisque nous avons choisi un repère lié à O,
nous aurons : ~vO = ~0, donc m1 .~v1 = −m2 .~v2 .
Les vecteurs ~v1 et ~v2 sont donc parallèles, de sens contraire, et leurs modules
r1
2
v1 et v2 vérient : vv21 = m
m 1 = r2 .
Notons F~1 la force gravitationnelle exercée par M2 sur M1 , et F~2 la force gravitationnelle exercée par M1 sur M2 ; ces forces sont parallèles, de sens contraire,
1 .m2
et de même module : F1 = F2 = G.m
(r1 +r2 )2 ; elles transmettent aux deux mobiles
104
les accélérations ~γ1 et ~γ2 (parallèles et de sens contraire), qui ont pour modules :
F1
F2
2
1
γ1 = m
= (rG.m
= (rG.m
2 et γ2 = m
2.
1
1 +r2 )
2
1 +r2 )
On en déduit que
γ1
γ2
=
m2
m1
, et, par suite :
γ1
γ2
=
v1
v2
=
r1
r2
=
m2
m1
.
Ceci sut à prouver que les trajectoires des deux mobiles sont homothém2
tiques ; le centre de l'homothétie est O, et son rapport est − m
= − rr12 (ou
1
r2
m1
− m2 = − r1 ).
r1
r
Si nous posons r = r1 + r2 et m = m1 + m2 , il est facile de vérier que
m2
r2
m1
m et que r = m . En eet :
=
r1
1
m2
r1
1
m2
=
.
=
=
r2 =
m1 =
r
r1 + r2
1 + r1
1 + m2
m2 + m1
m
La seconde idée de Newton est d'imaginer un troisième mobile (ctif) M
(de masse quelconque), situé par exemple sur la demi-droite [OM2 ), tel que
OM = r1 + r2 = r, et se déplaçant à la vitesse ~v = ~v2 − ~v1 (de module :
v = v1 + v2 ). Nous voulons que la trajectoire de M soit homothétique aux deux
précédentes ; pour cela, il faut que l'accélération de M soit : ~γ = ~γ2 − ~γ1 , ou,
plus simplement, de module :
γ = γ1 + γ2 =
G.m2
G.m1
G.(m1 + m2 )
G.m
+
=
= 2 .
2
2
2
(r1 + r2 )
(r1 + r2 )
(r1 + r2 )
r
Ce mobile ctif va donc se déplacer exactement comme s'il subissait l'attraction d'une masse m = m1 + m2 immobile, située au point O. Or il est facile
d'étudier la trajectoire de ce mobile, sur le modèle du système solaire (car seule
l'attraction du corps central immobile est prise en compte) ; ensuite, les trajectoires de M1 et M2 se déduisent de la précédente par deux homothéties de
rapports : ± rr1 = ± mm2 et ± rr2 = ± mm1 .
2
2
G.m2 r1
G.m2 m2
2
On peut aussi remarquer que γ1 = G.m
r 2 = r12 . r 2 = r12 . m2 . Ceci montre
que le premier mobile se comporte comme s'il était attiré par un corps de masse
m2
m2 . m22 , immobile au point O. De même, le second mobile se comporte comme
m21
s'il était attiré par un corps de masse m1 . m
2 , immobile au point O .
On peut remarquer que l'étude du mouvement du mobile ctif M dans un
repère immobile lié au centre de gravité O équivaut rigoureusement à l'étude du
mouvement de M2 dans un repère mobile lié à M1 , ou à l'étude du mouvement
de M1 dans un repère mobile lié à M2 . Comme ces repères mobiles sont aussi
accélérés, on comprend facilement que, selon la règle de composition des accélérations, l'accélération de M2 (resp. M1 ) dans le repère lié à M1 (resp. M2 ) est
γ = γ1 + γ2 . C'est aussi l'accélération du mobile ctif dans le repère lié à O.
105
Calculons les énergies cinétiques (newtoniennes) Ec1 et Ec2 des deux étoiles :
m 2
1 m2 m1 .m2 2
1
1
m2
1
2
.m1 .v12 = .m1 .
.v = .m1 . 22 .v 2 = .
.
.v ;
2
2
m
2
m
2 m
m
m 2
1
1 m1 m1 .m2 2
1
m2
1
1
Ec2 = .m2 .v22 = .m2 .
.v = .m2 . 12 .v 2 = .
.
.v .
2
2
m
2
m
2 m
m
Notons Ec l'énergie cinétique totale du système :
Ec1 =
1 m2 m1 .m2 2 1 m1 m1 .m2 2
.
.
.v + .
.
.v ;
2 m
m
2 m
m
1 m1
m2 m1 .m2 2
1 m1 .m2 2
Ec = .
.
+
.v = .
.v .
2
m
m
m
2
m
Ec = Ec1 + Ec2 =
On pourra considérer que c'est l'énergie cinétique du mobile ctif, à condition de lui attribuer une masse ctive : m0 = m1m.m2 (appelée : masse réduite).
C'est ce que nous ferons : nous admettrons que le mobile ctif a pour masse
m1 .m2
(vériant donc : m10 = m11 + m12 ), et subit l'attraction
m0 = m1m.m2 = m
1 +m2
d'un corps immobile de masse m = m1 + m2 , situé au point O.
On aura remarqué que Ec1 =
m2
m .Ec
et que Ec2 =
m1
m .Ec
.
Calculons les énergies potentielles Ep1 et Ep2 des deux étoiles :
Z
∞
Z
∞
−F1 .dx =
Ep1 =
r1
−
r1
G.m1 .m2
.dx,
r2
où dx représente un déplacement élémentaire de l'étoile M1 sur l'axe (OM1 ) :
m2
2
x = OM1 = m
m .M1 M2 = m .r . Nous faisons varier x de r1 à l'inni (où l'énergie
potentielle est censée s'annuler).
Z
∞
Z
r1
Ep1
∞
−F1 .dx = −
Ep1 =
r1
m2
= − 22 .G.m1 .m2 .
m
Z
∞
r1
Ep1 = −
G.m1 .m2
2 .dx = −
m
.x
m2
Z
∞
r1
m22 G.m1 .m2
.
.dx ;
m2
x2
∞
dx
m22
1
m22
1
=
−
.G.m
.m
.
−
=
−
.G.m1 .m2 . ;
1
2
x2
m2
x r1
m2
r1
m22
1
m2 G.m1 .m2
.G.m1 .m2 . m2 = −
.
.
m2
.r
m
r
m
De même, pour la seconde étoile :
Ep2 = −
m1 G.m1 .m2
.
.
m
r
Pour le mobile ctif, le calcul est plus facile (et nous ramène à notre étude
préliminaire) :
Ep = −
G.m. m1m.m2
G.m.m0
G.m1 .m2
=−
=−
.
r
r
r
106
Comme on le voit, Ep = Ep1 + Ep2 ; de plus : Ep1 =
m2
m .Ep
et Ep2 =
m1
m .Ep
.
Si on le désire, on peut poser : G1 = mm2 .G et G2 = mm1 .G. On a alors :
G1 + G2 = G, Ep1 = − G1 .mr1 .m2 , Ep2 = − G2 .mr1 .m2 , Ep = − G.mr1 .m2 .
Calculons les moments cinétiques µ1 et µ2 des deux étoiles par rapport au
point O ; nous notons α l'angle formé par le vecteur vitesse ~v avec la normale
au rayon vecteur ~r :
m2 m2
m2 m1 .m2
.v.
.r.cosα =
.
.v.r.cosα ;
m
m
m
m
m2 0
.m .v.r.cosα.
µ1 =
m
µ1 = m1 .v1 .r1 .cosα = m1 .
De même :
µ2 =
m1 0
.m .v.r.cosα.
m
Bien sûr, le moment cinétique du mobile ctif est :
µ = m0 .v.r.cosα.
On voit que µ = µ1 + µ2 ; de plus : µ1 =
m2
m .µ
et µ2 =
.
m1
m .µ
La troisième loi de Kepler : T 2 = 4πGma , appliquée au mobile ctif M (masse
centrale : m = m1 + m2 , demi-grand-axe de l'orbite : a = a1 + a2 ) permet
en principe de calculer m connaissant a. En pratique, l'étude spectrale permet
souvent de connaître la variation des vitesses radiales des deux étoiles, donc, en
intégrant, la variation de leurs distances par rapport à l'observateur. On peut en
m1
déduire le quotient m
, mais il faudrait connaître l'angle i (inclinaison de l'axe
2
de l'orbite par rapport à la ligne de visée) pour en déduire la valeur de a1 et de
a2 de manière certaine. Cet angle i est généralement mal connu ; les binaires à
éclipses font exception : dans ce cas, on a i = 90o , ce qui permet de calculer a
m1
et m avec précision ; connaissant m
et m1 + m2 , on a alors accès aux masses
2
individuelles des deux étoiles.
2 3
Dans le cas des pulsars binaires, l'une des deux étoiles est une étoile à neutrons visible comme pulsar, c'est-à-dire qu'elle émet un faisceau de lumière qui
vient balayer la Terre à chaque tour de l'étoile sur son axe. Ces pulsations, d'une
très grande régularité, peuvent être exploitées pour obtenir un grand nombre
d'informations encore plus pointues, et pour tester la relativité générale et les
autres théories de la gravitation.
Remarquons que, dans ces calculs, r1 et r2 peuvent être constants (orbites
circulaires) ou variables (orbites elliptiques).
Examinons d'un peu plus près le cas particulier des orbites circulaires (en
utilisant toujours les idées de Newton, dans un cadre non relativiste). Commençons par le mobile ctif. On vient de voir que son accélération est : γ = G.m
r2 ;
107
on sait que, dans la cas d'un mouvement circulaire uniforme : γ =
G.m
déduit que vc2 = γ.r = G.m
r 2 .r = r , donc la vitesse circulaire est :
r
vc =
vc2
r
. On en
G.m
.
r
Nous en déduisons les vitesses circulaires individuelles des deux étoiles par
homothétie :
r
G.m
;
r
r
m1
m1
G.m
r2
.vc =
.
.
= .vc =
r
m
m
r
vc1 =
vc2
m2
m2
r1
.vc =
.vc =
.
r
m
m
Remarquons que, dans le cas des orbites circulaires, l'énergie cinétique est :
Ec =
1 m1 .m2 G.m
1 G.m1 .m2
1
1 0 2
.m .vc = .
.
= .
= .|Ep |.
2
2
m
r
2
r
2
Après la vitesse circulaire, calculons la vitesse de libération. On doit avoir :
E = Ec + Ep =
1 m1 .m2 2 G.m1 .m2
.
.vl −
= 0 (donc Ec = |Ep |) ;
2
m
r
vl2 =
G.m
2.m G.m1 .m2
= 2.
;
.
m1 .m2
r
r
r
G.m
vl = 2.
;
r
r
G.m
m2
vl1 =
. 2.
;
m
r
r
m1
G.m
. 2.
.
vl2 =
m
r
Supposons maintenant que m1 = m2 (ce qui entraîne : r1 = r2 et v1 = v2 ).
.m2
m1 .m2
Les égalités E = 21 . mm11+m
.v 2 − G.mr1 .m2 et µ = m
.v.r.cosα (sachant que
2
1 +m2
v = v1 + v2 = 2.v1 , r = r1 + r2 = 2.r1 , et α = 0, puisque les deux orbites sont
maintenant circulaires et de même rayon) deviennent :

 E = m1 .v12 −

G.m21
2.r1
µ = 2.m1 .v1 .r1 .
108
;
Nous pouvons exprimer la vitesse circulaire du mobile ctif en fonction du
rayon :
r
r
r
vc =
Gm
=
r
Gm1
=
r1
Gm2
,
r2
donc les vitesses individuelles des deux étoiles s'écrivent :
v1 = v2 =
r
r
1
1
1
Gm1
1
Gm2
1p
.vc = .
= .
= . Gm1 .(r1 )− 2 .
2
2
r1
2
r2
2
Exprimons aussi l'énergie, le moment cinétique et la période en fonction de r1 :
G.m21
G.m21
G.m21
G.m21
G.m21
=
−
=−
=−
.(r1 )−1 ;
2.r1
4r1
2.r1
4r1
4
r
p
p
1
Gm1
µ = 2.m1 .v1 .r1 = m1 .
.r1 = m1 . G.m1 .r1 = m1 . G.m1 .(r1 ) 2 ;
r1
r
3
2πr1
r1
4π
T =
= 4πr1 .
=√
.(r1 ) 2 .
v1
G.m1
G.m1
E = m1 .v12 −
Imaginons maintenant qu'il soit possible de faire varier r1 , tout en conservant une orbite circulaire.
Nous savons qu'une égalité de la forme a = K.bn (où a et b sont deux variables, et K une constante) donne, par diérentiation (en passant, par exemple,
par le logarithme) :
db
da
= n. .
a
b
En appliquant cette règle aux égalités ci-dessus, nous obtenons :





















De plus, il est clair que
dr1
et r1 = drr22 = drr .
dv1
v1
dv1
v1
1
= − 21 . dr
r1 ;
dE
E
1
= − dr
r1 ;
dµ
µ
1
= 12 . dr
r1 ;
dT
T
1
= 32 . dr
r1 .
=
dv2
v2
=
dv
v
,
dE1
E1
=
dE2
E2
=
dE
E
,
dµ1
µ1
=
dµ2
µ2
=
dµ
µ
Lorsque r décroît (dr < 0), alors v croît (dv > 0), E décroît (dE < 0, car E
est l'énergie newtonienne, négative), µ décroît (dµ < 0), T décroît (dT < 0).
Remarquons encore que
dT
T
= 3. dµ
µ .
109
Les égalités que nous venons de voir sont encore valables dans le cas d'une
orbite elliptique d'excentricité (e) constante et de demi-grand axe (a) variable.
Vérions-le rapidement.
La troisième loi de Képler indique que T 2 est proportionnel à a3 ; donc
dT
da
= 3. da
a , autrement dit : T = 1, 5. a .
2. dT
T
dA
A
D'après la seconde loi de Képler (loi des aires) : µ = r2 . dθ
dt = 2. dt = 2. T , où
dA désigne l'aire balayée par le rayon vecteur pendant le temps dt, et A l'aire
dA
dT
2
totale de l'ellipse. Donc dµ
µ = A − T . Comme A est proportionnel à a , on a :
dµ
dA
da
da
dT
da
da
da
A = 2. a ; par conséquent : µ = 2. a − T = 2. a − 1, 5. a = 0, 5. a .
Donc on a bien
dT
T
= 3. dµ
µ , dans ce cas aussi.
Nous en reparlerons quand nous étudierons l'accélération séculaire des pulsars binaires.
Nous admettrons que ces conclusions (non relativistes) sont valables lorsque
les vitesses des deux étoiles sont faibles par rapport à c. C'est bien le cas pour
les pulsars binaires ; nous les étudierons donc en nous appuyant sur cette approximation newtonienne, même si nous ne sommes pas en mesure de prouver
sa validité de manière rigoureuse.
45 Modèle relativiste des systèmes binaires
Comme on va le voir par la suite, l'étude des pulsars binaires, basée d'une
part sur un modèle relativiste simple de type "système solaire" (celui que nous
avons ébauché dans la première partie de ce travail), d'autre part sur le modèle
newtonien des systèmes doubles, est validée par un grand nombre d'observations. Par conséquent, l'idée de construire un modèle relativiste des systèmes
doubles sur ces bases simples s'en trouve confortée.
On peut supposer (mais ce n'est qu'une hypothèse) que les pseudo-accélérations
sont (au moins en première approximation, dans le cas d'un champ lentement
variable) additives comme les accélérations ; il en résulte que l'étude du mouvement de M2 (resp. M1 ) dans un repère mobile lié à M1 (resp. M2 ) équivaut à
l'étude du mouvement du mobile ctif dans un repère immobile lié à O, et que la
pseudo-accélération à prendre en compte est la somme des pseudo-accélérations
G.m2
1
partielles : G.m
= G.m
r2 + r2
r 2 . Ce raisonnement suppose que le système est
isolé dans l'espace, et que l'inuence du reste de l'univers est négligeable. Au
point où se situe M2 , l'immobilité gravitationnelle est dénie par le champ de
M1 , et réciproquement.
110
On pourrait dire aussi (pour éviter de faire des hypothèses hasardeuses sur
les pseudo-accélérations) que le mouvement de M2 , dans un repère lié à M1 , est
1
régi par l'action gravitationnelle de M1 sur M2 , donc par le potentiel − G.m
r .
Ceci signie que, du point de vue de M1 , la trajectoire de M2 s'explique par la
G.m1
contraction de ses règles (coecient : e− r ) et le ralentissement de ses horloges
G.m1
(coecient : e r ). Mais le point de vue de M1 est biaisé, car il juge par comparaison avec ses propres règles et horloges, qui, pour un observateur distant,
semblent elles-mêmes modiées par l'action de M2 : ses règles sont contractées
G.m2
G.m2
(coecient : e− r ) et ses horloges ralenties (coecient : e r ). En dénitive, ces homothéties se composent, donc leurs coecients se multiplient, ce qui
G.m1
G.m2
G.m1
G.m
G.m
G.m
donne : e− r .e− r = e− r pour les règles, et e r .e r = e r pour les
horloges.
Pour étudier le mouvement du mobile ctif, nous reprenons les équations du
mouvement d'une planète autour du Soleil, avec une pseudo-accélération égale
G.m
à G.m
r 2 , et un potentiel ctif égal à − r .
L'énergie et le moment cinétique du mobile ctif seront alors données par
les formules :

− G.m

 1) E = m0 .c2 .e r.c2 .ch wc ;

 2) µ = m0 .c.e G.m
w
r.c2 .r.sh
c .sinα.
Il faut considérer que w représente la vitesse relative des deux mobiles, évaluée par un observateur situé dans le potentiel Φ = − G.m
r .
Vérions que ces équations sont cohérentes avec celles de Newton, en supposant G.m << r.c2 et w << c :
G.m
1 v2
G.m 1 v 2
0 2
E ≈ m0 .c2 . 1 −
.
1
+
.
≈
m
.c
.
1
−
+
.
;
r.c2
2 c2
r.c2
2 c2
E ≈ m0 .c2 −
G.m.m0
1
+ .m0 .v 2 .
r
2
Le premier terme : m0 .c2 , correspond à l'énergie de masse du mobile ctif ; bien
0
sûr, il ne gure pas dans les équations de Newton. Le second terme : − G.m.m
,
r
1
0 2
correspond à son énergie potentielle ; et le troisième : 2 .m .v , s'identie à son
énergie cinétique newtonienne.
Pour le moment cinétique, nous obtenons :
v
µ ≈ m0 .c.r. .sinα ≈ m0 .v.r.sinα.
c
111
Cette formule est bien celle de Newton.
Comme nous parlons ici du mobile ctif, sa masse m0 est également ctive,
et nous pouvons l'éliminer : elle n'intervient pas dans le calcul de l'orbite. On
utilisera donc les équations suivantes :

− G.m

 1) E = e r.c2 .ch wc = cte ;

 2) µ = e G.m
w
te
r.c2 .r.sh
c .sinα = c .
Après avoir calculé l'orbite du mobile ctif, on déduit celles des deux étoiles
par des homothéties de rapports ± mm2 et ∓ mm1 .
Cette façon d'aborder le problème des systèmes doubles en gravitation relativiste est proposée ici comme hypothèse de travail. Elle pourra être discutée et
approfondie. Nous admettons volontiers qu'il s'agit d'un modèle imparfait, pour
plusieurs raisons ; en particulier, nous avons négligé le temps de propagation de
la gravité. Dans le cas des pulsars binaires, on peut estimer que la vitesse des
deux étoiles reste négligeable par rapport à celle de la lumière, et que le temps
de propagation de la gravité d'une étoile à l'autre est négligeable par rapport à
la période orbitale ; ceci nous autorise à tester notre modèle, considéré comme
une première approximation.
Remarquons que la notion de potentiel gravitationnel, qui joue un rôle fondamental dans notre étude du système solaire, se trouve ici marginalisée, au prot
de la notion de pseudo-accélération. Eectivement, le potentiel Φ = − G.m
qui
r
intervient dans le calcul ci-dessus est purement virtuel. Son introduction résulte
de l'eet d'une pseudo-accélération égale à G.m
r 2 , mais ce potentiel virtuel n'est
pas plus localisé en M qu'en M1 ou en M2 . On pourrait le considérer comme
un paramètre abstrait qui caractérise l'interaction gravitationnelle entre M1 et
M2 . Plutôt que de dire que les règles et les horloges des deux mobiles sont modiées par ce potentiel, on pourrait dire que c'est l'interaction gravitationnelle
qui modie (de manière identique) les règles et horloges des deux mobiles, et
que le potentiel Φ ne sert qu'à évaluer cette modication.
46 Précession du périastre des pulsars binaires
La précession du périastre existe en principe dans tous les systèmes binaires,
mais c'est dans le cas des pulsars binaires qu'elle prend des proportions particulièrement remarquables, ce qui permet de la mesurer assez facilement. Ceci vient
du fait que ces pulsars binaires forment des couples très serrés, qui tournent très
vite.
112
Dans la section sur la précession, nous avons vu la formule qui donne l'angle
de précession (pour un tour d'orbite) : ∆θ = c26πGm
a(1−e2 ) ; nous appliquons cette
formule au mobile ctif M (m = m1 + m2 et a = a1 + a2 ). D'autre part, la
2 3
troisième loi de Kepler nous dit que T 2 = 4πGma , ce qui va nous permettre d'éli4π
miner a dans la formule précédente : a13 = GmT
2 , donc
substituant dans la formule de la précession, il vient :
2
6πGm
∆θ = 2
.
c (1 − e2 )
4π 2
Gm
13
2
.T − 3 =
1
a
=
4π 2
Gm
13
.T − 3 . En
2
5
2
2
3
.(2π) 3 .(Gm) 3 .T − 3 .
c2 (1 − e2 )
Divisons par T pour obtenir la précession par unité de temps (notée ω̇ ) :
2
2
ω̇ ≈
3G 3 (m1 + m2 ) 3
.
c2 (1 − e2 )
2π
T
35
.
Les astronomes savent mesurer la période T , l'excentricité e, et la précession
ω̇ , si son amplitude est susante (comme c'est le cas chez les pulsars binaires) ;
ceci leur permet alors de calculer la somme des masses des deux étoiles.
Un tel calcul ne permet pas, à lui seul, de tester les théories de la gravitation,
pour plusieurs raisons : d'abord, il faut évaluer la somme des masses m1 + m2
par d'autres méthodes, pour croiser les résultats et vérier leur cohérence ; ensuite, plusieurs théories peuvent conduire aux mêmes formules ; par exemple, la
métrique de Ni et celle de Schwarzschild, comme nous l'avons vu, donnent une
seule et même formule pour la précession du périastre.
47 Décalage gravitationnel des pulsars binaires
Une seconde technique permet d'évaluer indirectement les masses m1 et m2
(ou du moins d'établir une contrainte très stricte sur leurs valeurs possibles) :
elle utilise le décalage gravitationnel, c'est-à-dire l'eet Einstein. Elle se base
sur le fait que le rythme de l'écoulement du temps dépend du potentiel gravitationnel. Elle ne s'applique qu'aux pulsars binaires (ou aux pulsars doubles), car
c'est seulement dans ce cas qu'on dispose d'un "chronomètre embarqué" susamment précis. Nous supposerons que le pulsar est M1 , l'autre étoile étant M2 .
C'est le champ gravitationnel de M2 qui perturbe la fréquence apparente des
pulsations du pulsar M1 : le "chronomètre" ralentit quand les deux étoiles se rapprochent (parce-que le champ gravitationnel est plus fort), et il accélère quand
elles s'éloignent. On va donc comparer la fréquence des pulsations à l'apoastre
et au périastre. Mais il faut se rappeler que cette fréquence apparente dépend
aussi de la vitesse, d'après la relativité restreinte : au périastre, le déplacement
du pulsar étant plus rapide qu'à l'apoastre, le chronomètre semble ralentir ; cet
113
eet s'ajoute à l'eet Einstein.
Etudions d'abord l'eet Einstein proprement dit. C'est la distance entre le
pulsar et l'autre étoile qui va intervenir ici ; donc il est pratique de supposer
que cette autre étoile est xe, et que le pulsar décrit autour d'elle une ellipse
de demi-grand axe a = a1 + a2 (identique à l'orbite décrite par le mobile ctif
M ). Appelons b la distance maximale (apoastre) et d la distance minimale (périastre). On a donc : a = b+d
2 , ou b+d = 2a. L'excentricité e de l'orbite est donnée
2b
2b
par : e = b−d
;
par
conséquent
: b − d = (b + d)e = 2ae, 1 + e = b+d
= 2a
= ab ,
b+d
2d
2d
1 − e = b+d
= 2a
= ad , 1 − e2 = (1 + e)(1 − e) = ab . ad = abd2 .
D'après la formule : dtdist = e r dtloc = e rc2 dtloc , calculons, pour une même
valeur de dtloc (par exemple la période de pulsation du pulsar), le quotient des
périodes apparentes (évaluées par un observateur terrestre) au périastre et à
l'apoastre :
Gm
k
e
Gm2
dc2
e
Gm2
bc2
dtloc
dtloc
Gm2
Gm2 Gm2
Gm2 1 1
Gm2
. 1−
≈ 1+ 2 − 2 ≈ 1+ 2
−
;
≈ 1+
dc2
bc2
dc
bc
c
d b
Gm2
dc2
Gm2 b − d
Gm2
2ae
2Gm2 e
.
=1+ 2 2
=1+ 2
.
2
2)
c
bd
c
a
(1
−
e
c
a(1 − e2 )
e
2 31
2
2
1
4π
T −3
Nous avons vu précédemment que a1 = Gm
.T − 3 = (Gm)− 3 . 2π
(où
m = m1 + m2 ) ; nous pouvons donc écrire :
e
Gm2
bc2
≈1+
e
Gm2
dc2
e
Gm2
bc2
1
1
2Gm2 e
.G− 3 .m− 3 .
≈1+ 2
2
c (1 − e )
T
2π
− 32
.
On peut encore remarquer que l'excentricité e est généralement assez proche de
e
2
3
0, donc 1−e
2 ≈ e.(1 + e ) ≈ e + e ; il n'est pas question de négliger e (qui est au
centre de notre calcul), mais on pourra généralement négliger e3 , ce qui revient
à supprimer le facteur (1 − e2 ) du dénominateur.
e
Gm2
dc2
e
Gm2
bc2
≈1+
2e 2 m2
.G 3 . 1 .
c2
m3
T
2π
− 23
.
Nous allons maintenant étudier le ralentissement du chronomètre lié à la
vitesse, selon la transformation de Lorentz, qu'on pourra résumer, dans le cas
présent, par : dtdist = ch wc .dtloc = p 1 v2 .dtloc . Calculons une nouvelle fois
1−
c2
le quotient des périodes apparentes, évaluées par un observateur terrestre, au
périastre et à l'apoastre :
114
q
w
1−
ch cd1 .dtloc
=q
wb1
ch c .dtloc
1−
vb2
1
c2
vd2
≈
1
v2
1 − b12
2c
!
v2
. 1 + d12
2c
!
≈1+
vd21 − vb21
.
2c2
c2
On aura compris que vb1 et vd1 désignent la vitesse du pulsar à l'apoastre et
au périastre ; on considère cette fois-ci l'orbite du pulsar autour du centre de
gravité O (orbite dont le demi-grand-axe est a1 ; b1 correspond à son apoastre
et d1 à son périastre) ; nous allons calculer vb1 et vd1 grâce à la seconde loi de
Kepler (loi des aires). L'aire totale de l'orbite (balayée pendant le temps T )
2
2
)
est égale à πa21 (1 − e2 ) ; on a donc : b1 v2b1 = d1 v2d1 = πa1 (1−e
, d'où on tire :
T
vd21 − vb21 =
2πa21 (1−e2 )
T
2 . d11 2 −
1
b1
2
.
w
ch cd1
4π 2 a41 (1 − e2 )2 b21 − d21
. 2 2 .
wb1 ≈ 1 +
2c2 T 2
b1 d1
ch c
Nous avons vu que b1 = a1 (1 + e), que d1 = a1 (1 − e), et que b1 d1 = a21 (1 − e2 ) ;
2
2
a21 [(1+e)2 −(1−e)2 ]
4e
1
donc : bb12−d
=
= a2 (1−e
2
2 )2 ;
d
a4 (1−e2 )2
1 1
1
w
ch cd1
w
ch cb1
1
−2
4e
T
2e
4π 2 a41 (1 − e2 )2
.
.
.a21 .
=
1
+
2
2
2
2
2
2
2c T
a1 (1 − e )
c
2π
2
2 3
Nous savons que aa1 = mm2 ; donc a21 = a2 . mm2 . D'autre part, T 2 = 4πGma
4
4
2
2 m2
T 3
T 3
(troisième loi de Kepler), donc a2 = 2π
.(Gm) 3 , et a21 = 2π
.(Gm) 3 . m22 .
≈1+
w
ch cd1
2e
wb1 ≈ 1+ 2 .
c
ch c
T
2π
−2 34
− 23
2
2
2 m
2 m
T
2e
T
2
.
.(Gm) 3 . 2 = 1+ 2 .
.(Gm) 3 . 22 ;
2π
m
c
2π
m
w
ch cd1
2e
wb1 ≈ 1 + 2 .
c
ch c
T
2π
− 23
m22
2
.G 3 .
4
m3
.
Combinons maintenant les deux eets, en multipliant les deux coecients
de ralentissement du "chronomètre" (le coecient dû à l'eet Einstein, et le
coecient justié par la relativité restreinte) ; nous obtenons :
e
Gm2
dc2
e
Gm2
bc2
w
ch d1
. wcb1 ≈
ch c
e
Gm2
dc2
e
Gm2
bc2
2e 2 m2
1 + 2 .G 3 . 1 .
c
m3
w
T
2π
ch d1
2e 2 m2
. wcb1 ≈ 1 + 2 .G 3 . 1 .
c
ch c
m3
e
Gm2
dc2
e
Gm2
bc2
w
− 23 !
T
2π
ch d1
2e 2
. wcb1 ≈ 1 + 2 .G 3 .
c
ch c
115
2e
. 1+ 2.
c
− 32
T
2π
2e
+ 2.
c
− 32 m2
1
m3
T
2π
T
2π
− 32
.G .
− 32
+
2
.G 3 .
m22
4
m3
.
m22
2
3
4
m3
m22
4
m3
;
!
;
Comme m12 +
m3
nalement :
m22
4
m3
e
Gm2
dc2
e
Gm2
bc2
=
m2 .m+m22
4
m3
=
m2 .(m1 +m2 )+m22
w
.
4
(m1 +m2 ) 3
ch cd1
2e 2
≈ 1 + 2 .G 3 .
w
c
ch cb1
T
2π
− 32
.
=
m2 .(m1 +2m2 )
4
(m1 +m2 ) 3
m2 .(m1 + 2m2 )
4
(m1 + m2 ) 3
, on obtient,
.
Par conséquent, la mesure du retard gravitationnel entre l'apoastre et le périastre (et de la période T ) permet de calculer la quantité m2 .(m1 +2m42 ) , ce qui
(m1 +m2 ) 3
est un renseignement précieux, surtout si on connaît déjà m1 + m2 grâce à la
précession du périastre (voir section précédente) : on peut alors calculer individuellement la masse du pulsar (m1 ) et celle de l'autre étoile (m2 ).
48 Eet Einstein à la surface des étoiles à neutrons
Comme nous l'avons vu précédemment, à la surface d'une étoile à neutrons
telle que M = 1, 4 M et r = 14 km, l'eet Einstein, calculé selon les métriques
de Ni et de Schwarzschild, donne des résultats qui dièrent de 17% ; un tel
écart pourrait en principe être mis en évidence, ce qui permettrait de départager au moins ces deux théories. Malheureusement, la technique dont nous avons
parlé dans la section précédente, appliquée aux pulsars binaires actuellement
étudiés, permet de mesurer l'eet Einstein à une distance largement supérieure
à 100 000 km, ce qui est beaucoup trop loin.
Si nous désirons départager vraiment les métriques de Ni et de Schwarzschild
(ou seulement tester cette dernière dans le domaine des champs forts, ce qui est
absolument indispensable), c'est directement à la surface des étoiles à neutrons
qu'il faut mesurer l'eet Einstein. Cette expérience a été réalisée par le satellite
XMM-Newton, qui a mesuré, sur le spectre d'une étoile à neutrons, un décalage
vers le rouge des raies du fer et de l'oxygène : z = ∆λ
λ = 0, 35, soit un quotient
λréception
λ+∆λ
= 1 + z = 1, 35 (ce qui correspond au coecient de dilatation
λémission =
λ
du temps à la surface de l'astre, si on admet que le redshift dû à la vitesse radiale est négligeable). Bien que la masse et le rayon exacts de cette étoile soient
inconnus, on peut essayer d'interpréter ce résultat.
Selon la métrique de Schwarzschild, le coecient de dilatation du temps est
éception
donné par la formule : λλrémission
= √ 1 2k = 1, 35 ; dans le cas présent, le calcul
1−
r
donne :
k
r
= 12 . 1 −
1
1,352
≈ 0, 225.
Selon la métrique de Ni, ce coecient est donné par :
d'où on tire : kr = Log 1, 35 ≈ 0, 300.
116
λréception
λémission
= e r = 1, 35,
k
q
D'autre part, on peut évaluer M et r par la formule : r ≈ 16. 3 MM . Il s'agit
d'une formule approximative et provisoire, basée sur l'étude théorique (très difcile) de l'état de la matière à l'intérieur des étoiles à neutrons.
Remarquons au passage que, lorsque M augmente, r diminue : ce phénomène
paradoxal est bien établi, et concerne aussi bien les étoiles à neutrons que les
naines blanches.
Amusons-nous à calculer la masse approximative de cette étoile, dans le
cadre de la métrique de Ni. Nous utiliserons les deux égalités suivantes, dans
lesquelles r = rdist et x = MM :
r
3
rloc ≈ 16.
k
k
r
rloc = r.e = k.
r
M
3 1
= 16.
;
M
x
k
er
k
k
k
er
M
er
er
=
.k . k ≈
.1, 47. k = 1, 47.x. k .
k
M
r
r
r
k
r
Ces deux égalités permettent d'éliminer rloc :
k
er
1, 47.x.
k
r
r
≈ 16.
3
1
;
x
k
r
r
16 3 1
3 1
.
≈ 10, 88.
;
x. k ≈
1, 47
x
x
r
!3
k
er
1
3
x . k
≈ 10, 883 . ;
x
r
!3
!3
er
k
r
x4 ≈ 10, 883 .
e
x≈
k
r
≈
10, 88.
10, 88.
k
r
k
er
k
r
! 43
.
Dans le cas de l'étoile à neutrons étudiée, on a vu que
x≈
0, 3
10, 88. 0,3
e
34
;
k
er
k
r
≈ 0, 3, donc :
3
0, 3 4
≈ 10, 88.
≈ 1, 9.
1, 35
Si ce résultat (M ≈ 1, 9.M ) était conrmé, cette étoile à neutrons se situerait
dans la partie haute de la fourchette des masses observées (qui sont comprises
entre 1.M et 2.M ).
Dans cet exemple, les métriques de Ni et de Schwarzschild donnent, l'une
comme l'autre, une valeur vraisemblable pour la masse de l'étoile. Pour arriver
117
à un résultat réellement discriminant, il serait bon d'étudier des étoiles plus
massives, car, au-delà de deux masses solaires, les deux métriques divergent fortement ; mais les étoiles à neutrons dépassent rarement 2.M ... Il serait utile
aussi (cela va de soi) d'étudier prioritairemant les étoiles dont la masse est bien
établie, c'est-à-dire celles qui appartiennent à des systèmes binaires comportant
une étoile à neutrons (pas nécessairement visible comme pulsar) et une étoile
"banale", ce couple devant être aussi proche de nous que possible (pour que les
raies spectrales soient identiables), mais pas nécessairement très serré, et d'inclinaison i proche de 90o (pour que les masses puissent être déterminées avec la
meilleure précision). Quant à l'évaluation du rayon, elle risque de rester longtemps entachée d'erreur, même s'il est possible d'améliorer un peu la formule
qui donne le rayon en fonction de la masse.
Encore une remarque concernant cette formule. Nous allons réutiliser l'égak
34
lité x ≈ 10, 88. rk , dans deux cas particuliers : kr = 21 (soit r = 2.k=rayon
er
de Schwarzschild) et kr = 1 (soit r = k=demi-rayon de Schwarzschild).
- Premier cas (rayon de Schwarzschild) :
x ≈ 10, 88.
1
2
1
e2
34
34
0,5
≈ 10, 88. 1,648
≈ 2, 45, donc M ≈ 2, 45.M .
- Deuxième cas (demi-rayon de Schwarzschild) :
x ≈ 10, 88. e11
43
34
1
≈ 10, 88. 2,718
≈ 2, 83, donc M ≈ 2, 83.M .
Nous voyons donc qu'une petite augmentation de la masse peut conduire
très vite les étoiles à neutrons dans la "zone de turbulence", à l'approche
du
q
3 M
rayon de Schwarzschild. Mais il faut savoir que la formule rloc ≈ 16. M n'est
plus valable lorsque la matière est trop chaude, car une température trop élevée entraîne une augmentation de la pression, qui modie son équilibre interne.
C'est précisément ce qui arrive au voisinage du rayon de Schwarzschild, car
l'énergie cinétique tend à l'emporter sur l'énergie de masse. Une perte de chaleur est nécessaire pour que l'étoile revienne vers l'équilibre précédent, ce qui
s'accompagne d'une perte de masse. Nous en reparlerons au sujet des trous noirs.
Actuellement, la plupart des pulsars connus ont une masse proche de 1, 44.M ;
quelques-uns ont une masse supérieure, jusqu'à 2.M environ. La recherche et
l'étude d'étoiles à neutrons encore plus massives, proches de la limite de formation des trous noirs (vers 2, 8.M ) pourrait fournir des données essentielles.
49 Eet Shapiro chez les pulsars binaires
Nous considérons, ici encore, un système double formé d'un pulsar (M1 ) et
d'une autre étoile (M2 ) ; nous supposons, pour simplier, que l'orbite est circulaire ; nous appelons i l'angle formé par la normale au plan de l'orbite avec la
118
ligne de visée. Si l'angle i était rigoureusement égal à 90o , le pulsar serait éclipsé
par l'étoile à chaque révolution, donnant lieu à un eet Shapiro maximal : le
temps de parcours de la lumière, du pulsar jusqu'à nous, serait fortement augmenté, juste avant et juste après l'éclipse. Si i est proche de 90o , l'eet Shapiro,
sans être maximal, pourra cependant être observé. Si i est proche de 0o , il n'y
aura pas d'eet observable. Ce phénomène existe chez tous les systèmes binaires,
mais dans le cas d'un pulsar, le "chronomètre embarqué" permet une mesure
beaucoup plus précise.
Nous appellerons "moitié distale de l'orbite" la moitié de l'orbite qui est la
plus éloignée de l'observateur, et "moitié proximale" celle qui est la plus proche.
La position du pulsar sur son orbite (circulaire) sera repérée par un angle ωt,
l'origine étant le milieu de la moitié distale de l'orbite (point où le plan déni
par la normale à l'orbite et la ligne de visée, coupe l'orbite). Lorsque le pulsar se trouve dans la moitié distale de l'orbite, sa lumière met plus de temps
pour nous parvenir, pour deux raisons : d'abord, le pulsar étant plus loin de
nous, sa lumière a naturellement une distance plus grande à parcourir, ce qui va
prendre plus de temps (c'est le "retard normal", tel qu'on pourrait le calculer
en mécanique newtonienne, en se basant sur la géométrie d'Euclide) ; ensuite,
l'autre étoile "crée de l'espace" dans son voisinage (d'où un "retard anormal",
qui correspond à l'eet Shapiro proprement dit.
Etudions d'abordhl'eet Shapiro proprement dit.
i Nous avions obtenu la forrm
rt
4GM
2 + Log4 + Log rs + Log rs , pour un aller-retour Terremule : ∆T = c3
Mercure-Terre (en passant au ras de la surface solaire) ; rt était la distance
Terre-Soleil, rm la distance Mercure-Soleil, rs le rayon du Soleil. Maintenant
nous envisageons un aller simple pulsar-Terre, en passant près de l'étoile M2 .
Notons dt la distance de la Terre par rapport à l'étoile M2 , r = r1 + r2 la distance entre le pulsar et l'étoile M2 , et dmin la distance minimale entre le rayon
lumineux (pulsar → Terre) et l'étoile M2 .
Lorsque le pulsar se trouve dans la moitié distale de l'orbite, le retard Shapiro est donné par :
∆tdist =
2Gm2
c3
r
2Gm2
dt
dt .r
2 + Log4 + Log
+ Log
=
2
+
Log4
+
Log
.
2
rmin
rmin
c3
rmin
Lorsqu'il se trouve dans la moitié proximale, la formule devient :
∆tprox
2Gm2
=
c3
dt
r
2Gm2
dt
2 + Log4 + Log
− Log
=
2 + Log4 + Log
.
rmin
rmin
c3
r
2
On peut montrer assez facilement que rmin
= r2 (cos2 ωt.cos2 i + sin2 ωt) ; ce
qui nous donne :
∆tdist
2Gm2
=
c3
2 + Log4 + Log
dt .r
r2 (cos2 ωt.cos2 i + sin2 ωt)
119
;
∆tdist =
2Gm2
c3
dt
2 + Log4 + Log − Log(cos2 ωt.cos2 i + sin2 ωt) ;
r
∆tdist = ∆tprox −
2Gm2
Log(cos2 ωt.cos2 i + sin2 ωt).
c3
Mais les astronomes ne mesurent pas un retard Shapiro absolu : il n'ont accès qu'à un retard relatif, c'est-à-dire aux variations de ∆T d'un point de
l'orbite à l'autre ; ce retard est déni à une constante près. Le quotient drt
n'est pas constant, puisqu'il sagit de la distance de la Terre à l'étoile M2 , qui
tourne autour du centre de gravité du système ; les variations de dt , au cours
r
dt (1± d2 )
dt ±r2
t
=
Log
=
d'une révolution,
sont
de
l'ordre
de
r
;
comme
Log
2
r
r
dt
r2
dt
r2
dt
Log r + Log 1 ± dt ≈ Log r ± dt ≈ Log r (car r2 << dt ), on pourra admettre que Log drt est constant, ce qui nous autorise à poser :
∆tprox = 0 ;
∆tdist = −
2Gm2
Log(cos2 ωt.cos2 i + sin2 ωt).
c3
Voyons maintenant le retard normal. Le pulsar tourne autour du centre de
gravité O du système sur une orbite circulaire de rayon r1 , d'inclinaison i, donc
son excès de distance (par rapport à la distance O → Terre, prise comme référence) est r1 .cosωt.sin i, donc le retard normal est :
δt =
Nous savons que
r1 .cosωt.sin i
.
c
m2
m .r ; d'autre part,
h
2 i 31
2 3
T
d'après la troisième loi de Kepler : T 2 = 4πGmr , donc r = Gm 2π
.
r1
m2
=
r2
m1
=
r1 +r2
m1 +m2
=
r
m
, donc r1 =
"
2 # 13
23
23
T
T
m2 1
T
m2
m2 1 1
r1 =
. Gm
=
.G 3 .m 3 .
= 2 .G 3 .
.
m
2π
m
2π
2π
m3
La formule du retard normal s'écrit donc :
δt =
m2
m
2
3
1
3
.G .
T
2π
32
.
cosωt.sin i
.
c
Pour les astronomes, il est facile de distinguer le retard Shapiro du retard
normal : le retard Shapiro s'annule sur la moitié proximale de l'orbite, et a une
courbe caractéristique sur la moitié distale ; le retard normal, quant à lui, est
une courbe sinusoïdale parfaite.
120
m2
Le retard normal permet de déterminer la quantité
2 .sin i, ce qui
(m1 +m2 ) 3
serait peu utilisable, si on ne connaissait pas la valeur de i.
Heureusement, le retard Shapiro peut permettre de déterminer i, à condition
que cet angle ne soit pas trop fermé ; pour cela, il faut examiner le prol de la
courbe, qui forme un pic d'autant plus étroit que i est plus proche de 90o .
Dans la gure ci-dessous, nous avons représenté (pour la moitié distale de
l'orbite : − π2 < ωt < π2 ) la fonction suivante : −Log(cos2 ωt.cos2 i + sin2 ωt).
2
pour obtenir le retard Shapiro. Chaque courbe
Il reste à la multiplier par 2Gm
c3
correspond à une valeur de l'inclinaison i. De haut en bas : i = 89o , i = 85o ,
i = 81o , i = 77o , i = 73o , etc. On peut voir que la largeur du pic à mi-hauteur
croît quand i décroît : c'est ce qui permet de déterminer l'inclinaison de l'orbite.
Une fois l'angle i déterminé, l'eet Shapiro permet de calculer m2 (d'après
la hauteur du pic). Donc, dans le meilleur des cas, le retard Shapiro combiné
au retard normal, permet de déterminer l'inclinaison de l'orbite, et les masses
individuelles des deux étoiles. Il reste alors à recouper ces résultats avec ceux
qui ont été obtenus par les autres techniques, pour tester les diérentes théories.
On peut remarquer que la formule de l'eet Shapiro obtenue avec la métrique
triviale de Ni ne dière pas de celle qui est obtenue grâce à la relativité générale.
50 Précession géodétique des pulsars binaires
Soit S~ le moment cinétique d'un corps. La précession (évolution du vecteur
~ ∧S
~ . Pour
~ dans le temps) est "gérée" par un vecteur noté Ω
~ , tel que : dS~ = Ω
S
dt
121
~.
étudier la précession, il faut calculer ce vecteur Ω
Dans le cas de la Terre, la précession des équinoxes est due au couple exercé
par les forces de marées du Soleil et de la Lune sur le renement équatorial de
la Terre. Ce mécanisme est négligeable chez les pulsars, car ce sont des astres
très compacts. Mais deux autres mécanismes entrent en jeu : la précession de
Thomas et la précession de de Sitter.
La précession de Thomas est un phénomène lié à la relativité restreinte.
Elle concerne les objets qui subissent une accélération ~γ non gravitationnelle, et
s'écrit :
~ = 1 ~γ ∧ ~v .
Ω
2 c2
Si les vecteurs ~γ et ~v sont perpendiculaires, cette formule devient (sous forme
scalaire) :
Ω=
γ.v
.
2c2
La précession de de Sitter est un phénomène lié à la gravitation : lorsqu'un
mobile en chute libre (se déplaçant sur une géodésique) subit une "accélération"
(ou pseudo-accélération) gravitationnelle, cette accélération produit une précession diérente de celle de Thomas : en eet, elle est causée par la déformation
de l'espace-temps ; elle est liée au potentiel gravitationnel Φ, et n'a rien à voir
avec la relativité restreinte. Elle se calcule à l'aide de la formule suivante (dans
~ désigne le gradient du potentiel) :
laquelle 5Φ
~
~ = − 3 5Φ ∧ ~v .
Ω
2 c2
Si les vecteurs ~γ et ~v sont perpendiculaires, cette formule devient (sous forme
scalaire) :
Ω=
3 γ.v
.
2c2
Voici quelques explications sur ces deux phénomènes.
Considérons un mobile M en mouvement sur une orbite circulaire de centre O
et de rayon r. Plaçons, sur la demi-droite [OM ), un point A tel que OA = r + dr
(et M A = dr). Lorsque le point M tourne d'un angle dα autour de O, le point
A tourne du même angle, et le segment [M A] également. C'est, du moins, le
point de vue d'un observateur lié à O. Mais qu'en est-il pour un observateur lié
122
àM?
En mécanique Galiléenne, l'observateur lié au mobile M va calculer l'angle
de rotation dαM du segment [M A] par la procédure suivante : il va mesurer
M M 0 (déplacement élémentaire de M ) et AA0 (déplacement élémentaire de A),
puis il va calculer la diérence et la diviser par dr :
AA0 − M M 0
(r + dr)dα − rdα
dr.dα
=
=
= dα.
dr
dr
dr
Pas de surprise : pour l'observateur mobile, le segment [M A] semble tourner de
dαM =
la même façon que pour l'observateur immobile.
Que se passe-t-il en relativité restreinte ? Les mesures de M M 0 et AA0 vont
être biaisées, car l'observateur mobile utilise des règles raccourcies
dans le sens
q
2
du déplacement : la longueur des règles étant multipliée par 1 − vc2 , le résultat de ces deux mesures sera divisé par
inchangée. Donc :
dα
dαM = q
1−
v2
c2
q
1−
v2
c2
. La mesure de dr, elle, sera
1 v2
≈ 1+
.dα.
2 c2
Quand l'observateur immobile (ou non accéléré) estime que le segment [M A] a
fait un tour sur lui-même, l'observateur mobile (lié à M ) estime qu'il a fait un
peu plus d'un tour ; ceci signie que les axes de référence utilisés par l'observateur mobile ont légèrement tourné en sens inverse. Pour un tour d'orbite, un
gyroscope transporté par M va dériver, par rapport à un gyroscope immobile,
2
d'un angle proche de −π vc2 . Ce décalage correspond à la précession de Thomas.
Remarquons que c'est le mobile M qui subit la précession, et non O, car c'est
M qui est accéléré, et non O : la notion d'accélération, en relativité restreinte,
n'est pas relative. En relativité générale non plus.
La valeur de cette précession peut s'écrire :
123
Ω=−
dαM − dα
1 v 2 dα
1 v2
=− 2
=− 2ω
dt
2 c dt
2c
Dans le cas d'un mouvement circulaire, on a : v = rω et γ = rω 2 , donc
γv = r2 ω 3 ; par conséquent :
Ω=−
r2 ω3
γ.v
v2 ω
=
−
=− 2 ,
2c2
2c2
2c
ce qui est la forme scalaire de la formule de la précession de Thomas, que nous
avons utilisée précédemment.
Etudions maintenant la précession de de Sitter, qui se produit lorsque l'espacetemps est déformé par la gravité. On va supposer qu'au point O se trouve une
masse m ; posons : k = Gm
c2 . D'après ce que nous avons vu dans la première partie de cette étude, en raison du champ gravitationnel produit par cette masse,
un observateur local (immobile par rapport à O) situé en M n'appréciera pas
les distances M M 0 , AA0 et dr de la même façon que l'observateur distant (également immobile par rapport à O) ; en eet, toutes ses mesures de distances
k
(locales) seront multipliées par le coecient de dilatation de l'espace : e− r . On
aura donc :
dαloc =
k
k
k
d(re− r dα)
=
k
e− r dr
r. rk2 e− r dr + e− r dr
k
e− r dr
Dans le cas d'une orbite circulaire, on a :
orbites circulaires), donc :
2
v
c2
≈
k
r
v
c
=
dα =
q
k
r−k
k
1+
r
.dα.
(voir section sur les
; par conséquent : dαloc ≈ 1 + vc2 .dα.
2
Mais, attention : l'observateur mobile lié à M ne se confond pas avec l'observateur local (qui est immobile) ; en eet, le premier utilise des règles raccourcies.
Pour passer de l'observateur local à l'observateur mobile, on procède comme
pour la précession de Thomas :
dαloc
≈
dαM = q
2
1 − vc2
1+
v2
c2
1 v2
3 v2
. 1+
.dα
≈
1
+
.dα.
2 c2
2 c2
Pour un tour d'orbite, un gyroscope transporté par M va dériver, par rapport
2
à un gyroscope immobile, d'un angle égal à −3π vc2 . Ce décalage correspond à
124
la précession de de Sitter ; c'est le triple de la précession de Thomas. On a donc
(en valeur scalaire) : Ω = − 3γ.v
2c2 .
Voyons maintenant comment ces deux formules s'appliquent dans le cas des
pulsars binaires.
Considérons, une fois encore, le pulsar M1 et l'étoile M2 tournant sur des
orbites circulaires autour du centre de gravité O. Nous voulons évaluer la pré~ du pulsar, causée par le champ gravitationnel de l'étoile et par le
cession Ω
mouvement orbital.
Dans un repère lié à O, M1 , qui a pour vitesse v1 , subit une force F1 = Gmr12m2
2
(où r = r1 + r2 ), ce qui produit une accélération centripète γ1 = Gm
r 2 ; M2 , qui
Gm1 m2
a pour vitesse v2 , subit une force F2 = r2 = F1 (de sens contraire), ce qui
1
produit une accélération centripète γ2 = Gm
r2 .
Calculer la précession du pulsar M1 revient à calculer comment tournent ses
axes de coordonnées, par rapport à ceux de O (observateur de référence, supposé
immobile, ou, en tout cas, non accéléré). Pour cela, nous allons procéder en deux
temps : tout d'abord, nous allons nous placer dans un repère lié à l'étoile M2
pour calculer la précession du pulsar M1 ; il s'agit d'une précession de de Sitter, puisque l'orbite du pulsar est dictée par le champ gravitationnel de l'étoile ;
ensuite nous ferons un changement de repère pour nous placer dans un repère
immobile lié à O (ce qui fait intervenir une précession de Thomas, puisque le
nouveau repère est accéléré par rapport au précédent, cette accélération étant
non gravitationnelle). Remarquons tout d'abord que ces deux précessions sont
de même sens : si le pulsar et l'étoile orbitent dans le sens direct, alors les deux
précessions sont rétrogrades, et réciproquement. Il sut donc de calculer leurs
modules et de les additionner.
Si l'étoile M2 était immobile, elle produirait sur le pulsar M1 , en orbite au~ 1 ) facile à calculer. En eet, M2 exerce
tour d'elle, une précession de de Sitter (Ω
Gm2
sur M1 une accélération : γ1 = r2 , et M1 se déplace (par rapport à M2 ) à la
vitesse v = v1 + v2 . Comme ~v est perpendiculairement à γ~1 , la précession de de
Sitter (en module) s'écrit :
Ω1 =
3 Gm2
.
.v.
2c2 r2
Mais c'est le point O qui est supposé immobile, et non M2 ; nous allons
donc eectuer un changement de repère : nous passons du repère lié à M2
au repère lié à O. Ces deux repères sont accélérés l'un par rapport à l'autre,
cette accélération ayant pour module γ2 . Ce changement de repère équivaut à
appliquer à tous les mobiles (y compris M1 ) une accélération complémentaire
~ 2 . Dans
−γ~2 , non gravitationnelle, ce qui produit la précession de Thomas Ω
125
le nouveau repère, M1 subit donc cette accélération −γ~2 , et sa vitesse est v~1
(perpendiculaire à γ~2 ), donc la précession complémentaire se calcule ainsi :
Ω2 =
1 γ2 .v1
1 Gm1
= 2 . 2 .v1 .
2
2 c
2c
r
Comme m1 .r1 = m2 .r2 , on pourra écrire : Ω2 =
1 Gm2
2c2 . r 2 .v2 .
Compte-tenu du fait que ces deux précessions sont de même sens, la précession totale du pulsar M1 sera donc (en module) :
3 Gm2
1 Gm2
. 2 .v + 2 . 2 .v2 ;
2
2c
r
2c
r
Gm2
Gm2 r2 Gm2
.
3
+
.ω.
Ω = 2 2 .(3v + v2 ) = 2 2 .(3r.ω + r2 .ω) =
2r c
2r c
2r.c2
r
Ω = Ω1 + Ω2 =
Comme
m1
r2
Ω=
=
m2
r1
=
m
r
, on a
r2
r
=
m1
m
, et par suite :
m1 Gm2 4m1 + 3m2
Gm2 Gm2 3m + m1
.
3
+
.
.ω =
.
.ω.
.ω =
2
2
2r.c
m
2r.c
m
2r.c2
m
Remplaçons ω par
2π
T
, puis r par
2
2π − 3
T
.(Gm) 3 (troisième loi de Kepler) :
1
Gm2 4m1 + 3m2 2π
G 2π m2 (3m + m1 )
.
. .
.
=
;
2r.c2
m
T
2rc2 T
m
2
1
G 2π m2 (3m + m1 ) 2π 3
Ω = 2. .
.
.(Gm)− 3 ;
2c T
m
T
5
2 G3
2π 3 m2 (4m1 + 3m2 )
Ω = 2.
.
.
4
2c
T
m3
Ω=
Chez les pulsars, la précession modie lentement la direction du faisceau
lumineux qui balaie la Terre comme un phare ; il en résulte que l'intensité apparente de ce faisceau évolue dans le temps. Actuellement, la précession géodétique
de plusieurs pulsars binaires a pu être évaluée (de manière encore approximative), ce qui permet de calculer la quantité m2 (4m14+3m2 ) . L'accord avec les vam3
leurs de m1 et m2 , obtenues par d'autres techniques, semble satisfaisant. Ce
résultat, bien entendu, ne permet pas de départager les métriques de Ni et de
Schwarzschild.
Une autre façon d'accéder à la précession géodétique consiste à placer des
gyroscopes dans des satellites en orbite terrestre. Cette expérience a été réalisée
avec succès, avec une précision nettement meilleure, grâce au satellite Gravity
126
Probe B.
Le fait que l'expérience conrme le calcul de de Sitter a une très grande
importance théorique : c'est la preuve que l'"accélération" gravitationnelle est
profondément diérente de toutes les autres accélérations, ce qui jutie le terme
de "pseudo-accélération" que nous avons introduit. On est dans l'obligation
d'admettre soit que la gravité déforme la géométrie de l'espace-temps, soit (ce
qui, mathématiquement, revient au même) qu'elle modie les règles et les horloges que les observateurs locaux utilisent pour eectuer leurs mesures. Il n'est
plus permis de considérer le champ gravitationnel, à la manière de Newton,
comme un simple champ d'accélérations, car un champ d'accélérations (au sens
strict du terme) ne peut pas produire de précession de de Sitter.
51 Eet Nordtvedt
Vous ne connaissez pas l'eet Nordtvedt ? Pas d'aolement : cet eet n'existe
pas ! Il a été imaginé par le physicien Nordtvedt pour mettre en évidence une
diérence éventuelle entre masse inerte et masse pesante, par l'observation de
l'orbite de la Lune. C'est en quelque sorte la contrepartie astronomique des expériences d'Eötvös, dont nous avons déjà parlé. Mais les expériences d'Eötvös
avaient pour but de détecter des diérences liées à la composition chimique des
corps, tandis que l'eet Nordtvedt est censé détecter des diérences liées à leur
énergie gravitationnelle propre.
Nous avons vu que, pour un observateur distant, la masse d'une particule, inΦ
tervenant dans tout problème de mécanique, est : mdist = m0 ch wc e c2 , puisque
c'est elle qui permet d'évaluer l'énergie d'un mobile : Edist = mdist c2 . Nous la
noterons simplement m.
On pourra
suivante :
utiliser2 l'approximation
2
1v
Φ
m ≈ m0 . 1 + 2 c2 . 1 + c2 ≈ m0 + 21 vc2 .m0 + cΦ2 .m0 (avec Φ < 0).
Si v << c : m ≈ m0 + cΦ2 .m0 , avec cΦ2 .m0 < 0.
L'énergie gravitationnelle (négative) de cette particule est :
Eg = (m − m0 )c2 ≈ Φ.m0 .
Dans le cas d'un corps non ponctuel (que nous supposerons immobile), Eg
est l'énergie de liaison gravitationnelle (négative) des diérentes particules qui
le composent.
Le calcul de Eg n'a pas une importance essentielle ici, mais nous le proposons quand même, car il permet de bien comprendre cette notion d'énergie
gravitationnelle propre. Imaginons la formation d'une planète par accrétion de
particules. Appelons M0 la somme des masses au repos des particules accrétées
(masse ne prenant pas en compte la perte d'énergie due aux liaisons gravitation127
nelles), et M la masse dénitive de la planète, incluant l'énergie gravitationnelle
(M < M0 , puisque Eg < 0). Nous supposons que toutes les particules perdent
leur énergie cinétique au cours de l'accrétion. Nous appelons R le rayon dénitif
de la planète, et ρ sa densité (supposée uniforme). Reconstituons, pas à pas, la
formation de la planète, par accrétion de particules de masse dm0 : la masse m
augmente chaque fois d'une quantité dm, inférieure à dm0 , en raison de l'éner0
(ou Gm0rdm0 , car m0 ≈ m). Le rayon r va
gie gravitationnelle libérée : Gmdm
r
croître de 0 à R, la masse m0 de 0 à M0 , la masse totale m de 0 à M .
G 4 3
≈ dm0
≈ 4πr ρdr 1 − 2 . πr ρ ;
dm ≈ dm0
rc 3
3
16
G 4
r
G
− π 2 ρ2 2 r4 dr ;
dm ≈ 4πr2 ρdr − 4πr2 ρ. 2 . πr3 ρdr ≈ 4πρd
rc 3
3
3
c
5
3
16 2 2 G
r
r
− π ρ 2d
;
dm ≈ 4πρd
3
3
c
5
Gm
1− 2
rc
Gm0
1−
rc2
2
...d'où, en intégrant :
M≈
4 3
16
3 G
G R5
πR ρ − π 2 ρ2 2
≈ M0 − . 2 .
3
3
c 5
5 Rc
16 2 2 6
π ρ R
9
3 G
≈ M0 − . 2 .M02 ;
5 Rc
3 GM02
M ≈ M0 − .
.
5 Rc2
2
3 GM
0
On a donc : Eg ≈ − 35 . GM
R ≈ −5. R .
2
3 GM
M
3 GM0
≈1− . 2.
≈1− .
2
M0
5 Rc
5 Rc
3 GM
24
−10
Pour
laTerre : M ≈ 5, 97.10 kg , R ≈ 6 370 000 m, donc 5 . Rc2 ≈ 4, 6.10 ,
M
donc M
≈ 1 − 4, 6.10−10 ;
0
T erre
3 GM
22
−11
pour la Lune
: M ≈ 7, 35.10 kg , R ≈ 1 736 000 m, donc 5 . Rc2 ≈ 2.10 ,
M
donc M
≈ 1 − 2.10−11 .
0
Lune
La diérence entre ces deux quotients
4, 4.10−10 .
M
M0
T erre
et
M
M0
Lune
est de l'ordre de
Considérons maintenant un corps céleste (par exemple une planète) de masse
pesante Mp et de masse inerte Mi . Selon la théorie de Newton, la force exercée
par le Soleil sur ce corps est proportionnelle à Mp , et l'accélération qui en rép
sulte est donc proportionnelle à M
Mi . L'idée de Nordtvedt est que, si la Terre et la
p
Lune ne possèdent pas le même rapport M
Mi , alors elles ne répondront pas de la
même façon à l'attraction du Soleil, comme si elles subissaient des accélérations
légèrement diérentes. C'est cette diérence de comportement qui devrait, selon
Nordtvedt, entraîner une modication de la forme de l'orbite de la Lune autour
128
de la Terre. Cette déformation de l'orbite a pu être calculée avec précision.
L'intérêt de la Lune, dans le cas présent, est que sa distance par rapport à
la Terre (et donc la forme exacte de son orbite) sont mesurables, en utilisant
des radars (situés sur Terre) et des miroirs, placés à la surface de la Lune par
les missions Apollo, avec une précision de l'ordre de 2 cm sur une distance de
385 000 km (soit une précision relative de l'ordre de 5.10−11 ).
Les mesures eectuées n'ont détecté aucune modication de l'orbite de la
Lune, et n'ont donc pas conrmé le calcul de Nordtvedt ; on en conclut que le
p
quotient M
Mi est le même pour les deux astres, avec une très bonne précision.
Mais quel rapport y a-t-il entre les masses Mp et Mi (masse pesante et masse
inerte) d'une part, M et M0 (masses incluant, et n'incluant pas, l'énergie gravitationnelle) d'autre part ? C'est simple : si la masse pesante
M0 et
s'identiait
à
M
M
la masse inerte à M (ou l'inverse !), alors les quotients M0
et M0
T erre
Lune
ne seraient pas égaux, et la précision des mesures aurait permis de s'en rendre
compte, ce qui n'est pas le cas. On en déduit que les masses pesante et inerte
sont toutes les deux égales à M , ou toutes les deux égales à M0 .
Dans l'approche de la gravitation que nous exposons ici, la masse pesante et
la masse inerte sont toutes les deux égales à M . En eet, lorsqu'une particule
Φ
se déplace sur une géodésique, sa masse m = mdist = m0 ch wc e c2 ne varie pas,
Φ
son énergie totale étant constante ; le produit ch wc e c2 est constant, donc quand
l'un des facteurs augmente, l'autre diminue ; quand l'énergie cinétique augmente,
l'énergie potentielle diminue (et réciproquement). Imaginons maintenant la formation d'une planète par accrétion. Chaque fois qu'une nouvelle particule est
capturée et tombe sur la planète, elle commence par gagner de l'énergie cinétique tout en perdant de l'énergie potentielle, jusqu'à la chute nale. C'est à ce
moment que l'équilibre est rompu : l'énergie cinétique de la particule est nécessairement évacuée, d'une manière ou d'une autre, par exemple sous forme de
chaleur, puis de rayonnement (du moins pour des corps froids comme le Terre
et la Lune), mais l'énergie potentielle perdue n'est pas récupérée. C'est lorsque
la chaleur due à l'impact est rayonnée qu'il y a une perte d'énergie (donc de
masse). La masse nale est donc M , et non M0 .
Encore une précision : quelle est la masse au repos de la planète ? Rappelons
que M0 est la somme des masses au repos des particules qui la composent. Mais
la masse au repos d'un corps n'est pas égale à la somme des masses au repos de
ses composants ! (Voir les explications partielles dans le document Les vitesses
en Relativité restreinte.pdf, p. 52-53). Elle dépend de la rapidité relative de
ces composants (donc de l'énergie cinétique de l'ensemble), mais aussi de leur
énergie potentielle (puisque l'énergie cinétique peut se transformer en énergie
potentielle, et réciproquement). Il en résulte que la quantité M0 , que nous avons
fait intervenir dans notre calcul, n'a aucune signication physique : la masse au
129
repos de la planète (pour un observateur distant) est égale à M , et non à M0 . Il
n'existe en fait qu'une sorte de masse (pour cet observateur) : Mp = Mi = M ,
qu'on peut appeler, au choix, masse pesante, masse inerte ou masse au repos.
52 Les trous noirs en métrique de Ni
On lit couramment que l'existence des trous noirs est une certitude, que de
nouveaux trous noirs ont été découverts, etc...
Les trous noirs stellaires, prévus par la théorie, n'ont pas encore été mis en
évidence de manière directe : la plupart des candidats pourraient être des étoiles
à neutrons. Dans certains cas, on a cependant la preuve qu'il ne peut pas s'agir
d'étoiles à neutrons. Citons par exemple le cas de Cygnus X-1 : dans ce système
double, une étoile est en rotation autour d'une source de rayons X. L'étude du
mouvement de l'étoile a permis d'évaluer la masse de cette source : elle est supérieure à 6 masses solaires (probablement comprise entre 7 et 13 masses solaires),
ce qui est très supérieur à la masse maximale d'une étoile à neutrons, qui serait
de l'ordre de 3, 3 masses solaires (selon les calculs d'Oppenheimer et Volko).
D'après la théorie, une étoile ayant une telle masse est une géante, qui doit s'effondrer en trou noir une fois ses réserves de combustible épuisées, car aucune
force connue ne peut alors résister à la gravité. Ceci est vrai, du moins, dans
une théorie basée sur la métrique de Schwarzschild ; mais c'est assez diérent
avec la métrique de Ni, comme nous le verrons un peu plus loin.
Actuellement, on connaît un bon nombre de binaires X apparentées à Cygnus X-1 ; mais c'est surtout l'étude des sursauts gamma qui apporte un indice
intéressant en faveur de l'existence des trous noirs stellaires : on suppose qu'ils
trahissent l'eondrement d'étoiles situées dans des galaxies lointaines. Lors de
tels événements, une étoile massive se transformerait en trou noir. Trou noir au
sens de Schwarzschild ou de Ni ?
Quant aux trous noirs supermassifs, on estime qu'ils sont présents au centre
de la plupart des galaxies spirales. Dans le cas de la Voie Lactée, on a pu mettre
en évidence une concentration impressionnante de matière dans un volume très
réduit : c'est l'étude des orbites des étoiles autour de ce grumeau central qui
a permis de déterminer sa masse de manière précise : 3, 6 millions de masses
solaires ! Pour qu'une telle masse forme un trou noir, il faudrait qu'elle soit
concentrée dans une sphère de rayon inférieur à 16 rayons solaires, c'est-à-dire
dans un volume équivalent à celui d'une étoile géante (nettement plus grosse
qu'une naine comme le Soleil, mais beaucoup plus petite qu'une supergéante).
En ce qui concerne les quasars, ces galaxies primitives très lointaines et exceptionnellement lumineuses, ils sont interprétés comme des trous noirs géants,
de plusieurs millions (ou centaines de millions ?) de masses solaires. Mais ils sont
130
aussi considérés comme les ancêtres des galaxies évoluées comme la nôtre.
La seule chose qu'on puisse armer aujourd'hui, c'est qu'il existe des "astres
compacts" : quasars, c÷urs de galaxies, ou étoiles. Le mot "compact" signie
c2
que le quotient Mr se rapproche de la limite de Schwarzschild : 2G
. Ne confonM
dons pas la "compacité" (dénie par ce quotient r ) avec la densité, qui est
proportionnelle à M
r 3 : si r est très grand, la compacité peut être élevée et la
densité très faible...
Rappelons que le rayon de Schwarzschild d'un corps massif se calcule facilement, connaissant sa masse : rs = 2.k = 2.G.M
c2 . Si sa dimension apparente
semble inférieure à son rayon de Schwarzschild, on en déduit, d'après la relativité
générale, qu'il s'agit d'un trou noir, limité par un horizon ; mais, bien entendu,
on n'a jamais observé directement cet "horizon"...
A quoi correspond exactement cette notion d'horizon au sens de Schwarzschild ? Imaginons une masse M comprimée dans une sphère de rayon inférieur
= rs (limite de Schwarzschild) ; par exemple, une étoile de même
à 2.k = 2.G.M
c2
masse que le Soleil, dans une sphère de moins de 3 km de rayon. Pour l'observateur distant, c'est cette sphère de Schwarzschild, de rayon rs = 2.k, qui
va constituer un horizon au-delà duquel son regard n'aura pas accès : aucune
information provenant de l'intérieur de cette sphère ne peut lui parvenir. Si un
vaisseau spatial, par exemple, est happé par le trou noir, l'observateur distant
le verra ralentir à l'approche de l'horizon, car le coecient de ralentissement du
temps tend alors vers 0 ; et il ne le verra jamais franchir l'horizon. Mais si nous
adoptons le point de vue des astronautes embarqués dans le vaisseau, qui vivent
en temps local, alors ce ralentissement n'existe pas.
Pour expliquer ce curieux phénomène, imaginons un rayon lumineux se dirigeant radialement vers un trou noir. Pour décrire sa trajectoire, utilisons la
métrique de Schwarzschild, avec dθ = dφ = 0, et aussi ds2 = 0 (puisqu'il s'agit
de lumière). Il vient :
2.k
1
ds = 1 −
.c2 .dt2 −
.dr2 = 0 ;
r
1 − 2.k
r
2
1
c2 .dt2 =
1−
c.dt = −
.dr
2.k 2
r
2
;
1
.dr.
1 − 2.k
r
Dans cette expression, t est le temps évalué par l'observateur distant : t = tdist .
Le signe négatif se justie par le sens de parcours que nous avons choisi.
r
(r − 2.k) + 2.k
2.k
c.dt = −
.dr = −
.dr = − 1 +
.dr ;
r − 2.k
r − 2.k
r − 2.k
131
c.dt = −dr − 2.k.
d(r − 2.k)
= −d (r + 2.k.Log(r − 2.k)) .
r − 2.k
Quand le rayonnement se déplace de r1 à r2 (r1 > r2 > 2.k), il s'écoule une
durée ∆t telle que :
c.∆t = r1 + 2.k.Log(r1 − 2.k) − r2 − 2.k.Log(r2 − 2.k).
Si nous faisons tendre r2 vers 2.k, ∆t tend vers l'inni.
Reprenons ce calcul en temps local ; sachant que dtloc =
on tire :
ds2 = c2 .dt2loc −
q
1−
2.k
r .c.dtdist
,
1
.dr2 = 0 ;
1 − 2.k
r
1
.dr2 ;
1 − 2.k
r
p r
√
r
r.dr
2.k .d 2.k
= −√
= −2.k. p r
.
r − 2.k
2.k − 1
c2 .dt2loc =
c.dtloc = − q
Posons x = Argch
p
r
2.k
dr
1−
2.k
r
, ce qui signie que ch2 x =
r
2.k
et sh2 x =
r
2.k
− 1.
c.dtloc = −2.k.
ch x.d ch2 x
ch x.2.ch x.sh x.dx
= −2.k.
= −4.k.ch2 x.dx ;
sh x
sh x
ch (2.x) − 1
.dx = −2.k. (ch (2.x) − 1) .dx.
2
Cette quantité ne diverge pas quand r → 2.k (autrement dit quand ch x → 1).
c.dtloc = −4.k.
Dans notre approche, basée sur la métrique de Ni, le coecient de ralentissement du temps ne tend pas vers 0 quand on s'approche de la sphère de
Schwarzschild ; pour qu'il tende vers 0, il faudrait que la masse M (non nulle)
soit concentrée dans un volume nul. Cette sphère constitue cependant une limite de stabilité des orbites, puisqu'aucune orbite circulaire (ou elliptique) ne
peut exister à l'intérieur de celle-ci. Si on imagine la masse M concentrée dans
un volume nul (singularité centrale), alors toutes les orbites pénétrant dans la
sphère de Schwarzschild plongeront vers la singularité, et il n'y aura plus de
force centrifuge pour les retenir. Pour l'observateur distant, ce plongeon durera
un temps inni : le phénomène situé à l'horizon de Schwarzschild par la relativité générale est donc repoussé jusqu'à la singularité centrale. Mais on se doute
bien que les singularités (masses non nulles concentrées dans un volume nul)
n'existent pas !
Est-il possible de sortir de la sphère de Schwarzschild ? Avec la métrique de
la relativité générale (c'est-à-dire celle de Schwarzschild), c'est impossible, car,
du point de vue d'un observateur distant, le temps nécessaire pour que le mobile
132
entre dans le trou noir (ou en sorte) est inni ! En métrique de Ni, l'impossibilité rencontrée en relativité générale n'a plus de signication : un mobile pourra
franchir la limite, de l'extérieur vers l'intérieur, en un temps ni ; il sura alors
de "passer le lm à l'envers" (ou d'inverser le sens du vecteur vitesse) pour le
voir ressortir. Un mobile pourra donc ressortir de la sphère de Schwarzschild,
mais pour cela il devra changer d'orbite (car une orbite qui entre dans cette
sphère n'en ressort pas spontanément) ; ceci nécessitera un échange d'énergie,
dont la probabilité sera d'autant plus faible que le puits de potentiel sera plus
profond. Mais il n'est plus question d'une durée innie ! Les "trous noirs" ne
sont peut-être pas aussi noirs qu'on le dit !
Rappelons que la notion de trou noir découle tout naturellement de la gravitation
cette théorie, la vitesse de libération est :
q newtonienne. En eet, dans
2.G.M
r.c2
; donc, pour M > 2.G , la vitesse de la lumière est insusante pour
vl =
r
permettre aux rayonnements d'échapper à la gravité de l'astre, comme l'avait
déjà remarqué Laplace.
On peut présenter ce raisonnement d'une autre façon, toujours en s'appuyant
sur la théorie de Newton : imaginons un corps dont la masse M (masse évaluée
par un observateur distant) n'est pas concentrée en un point, mais répartie à
l'intérieur d'une sphère de rayon r. Nous supposerons, de plus, que la matière,
libre de se déplacer à l'intérieur de la sphère sous l'eet des forces gravitationnelles, trouve un équilibre ; cet équilibre est atteint lorsque les forces s'annulent,
c'est-à-dire lorsque le potentiel gravitationnel est constant à l'intérieur de la
sphère ; il est alors égal à : Φ = − GM
r . Quand on se rapproche de la surface du
corps (en venant de l'"inni"), le champ gravitationnel décroît de 0 à − GM
r ;
puis, quand on pénètre à l'intérieur, il se stabilise.
Nous allons récupérer une masse innitésimale dm "à l'inni", puis nous allons la déposer délicatement (à vitesse nulle, c'est-à-dire en prélevant la totalité
de son énergie cinétique) dans la sphère en question. Au départ, la masse totale
du système est M + dm, mais en se rapprochant, les deux corps perdent de
l'énergie potentielle, donc de la masse.
Je précise ce que j'entends par "prélever l'énergie cinétique". Lorsqu'un mobile se déplace librement sur son orbite, l'énergie newtonienne totale (comprenant l'énergie cinétique et l'énergie potentielle) est constante : lorsque Φ
augmente, v diminue, et réciproquement ; quand l'énergie potentielle augmente,
l'énergie cinétique diminue (et inversement). Ce phénomène de balancier, parfaitement réversible, conserve l'énergie totale. Un prélèvement d'énergie cinétique
suppose une intervention extérieure : freinage faisant intervenir des collisions ou
des frottements avec dégagement de chaleur, ou une émission de rayonnements
emportant de l'énergie. De tels phénomènes physiques brisent l'équilibre entre
Φ et v , et modient l'énergie du mobile. Si l'énergie cinétique est prélevée en
totalité, on peut considérer, selon l'équivalence relativiste entre masse et éner133
gie, que la masse au repos du mobile a été réduite. Elle était égale à m0 avant le
prélèvement, elle est égale à m0 + c12 .∆Ep après. Bien sûr, ∆Ep est la variation
. On a donc :
de l'énergie potentielle. Dans le cas présent : ∆Ep = − G.M.dm
r
G.M.dm
;
M + dM = M + dm −
r.c2
G.M
dM = 1 −
.dm ;
r.c2
dM
= dm ;
1 − G.M
r.c2
d G.M
G.m
r.c2
=
d
;
r.c2
1 − G.M
r.c2
d 1 − G.M
G.m
r.c2
= −d
;
r.c2
1 − G.M
r.c2
G.M
G.m
d Log 1 −
=d − 2
;
r.c2
r.c
G.M
G.m
Log 1 −
= − 2 + constante ;
r.c2
r.c
G.m
G.M
= K.e− r.c2 .
2
r.c
La constante K doit être égale à 1, pour que M s'annule lorsque m = 0 ; donc :
1−
G.m
G.M
= 1 − e− r.c2 .
2
r.c
Si nous faisons tendre m vers l'inni, alors G.M
r.c2 tend vers 1.
Nous voyons donc apparaître une limite pour la masse M (incluse dans la sphère
2
de rayon r) : r.c
G . Lorsque la masse M approche de cette limite, elle augmente
de moins en moins vite pour un même apport dm de matière extérieure.
Ce raisonnement se base sur les équations de Newton ; nous allons maintenant les abandonner, pour reprendre le calcul avec les équations relativistes
inspirées par la métrique triviale de Ni. Nous pouvons utiliser l'égalité mt ≈
G.M
M + m2 .e− r.c2 que nous avons vue dans la section "Vers un modèle relativiste
des systèmes binaires" ; dans le cas présent, cette égalité s'écrit :
M + dM ≈ M + e− r.c2 .dm, ou :
G.M
G.M
dM ≈ e− r.c2 .dm.
134
Cette formule semble presque identique à celle que nous venons d'utiliser ci− G.M
r.c2 au premier ordre ;
dessus, puique 1 − G.M
r.c2 est le développement limité de e
pourtant, la conclusion va être diérente :
G.M
e r.c2 .dM ≈ dm ;
G.M
G.M
G.m
≈
d
;
e r.c2 .d
r.c2
r.c2
G.M G.m
2
d e r.c
;
≈d
r.c2
G.m
+ constante.
r.c2
La constante doit être égale à 1, pour que M s'annule lorsque m = 0 ; donc :
G.M
G.m
≈
Log
1
+
;
r.c2
r.c2
G.m
r.c2
.Log 1 +
.
M≈
G
r.c2
G.M
e r.c2 ≈
Si nous faisons tendre m vers l'inni, M tend aussi vers l'inni ; donc, à priori,
en métrique de Ni, il ne semble pas impossible de faire pénétrer une masse quelconque dans une sphère de rayon donné.
Cependant, le curieux phénomène de "création d'espace" peut alors jouer un
rôle important. Voyons comment.
Imaginons une masse M répartie de manière équilibrée dans une sphère de
rayon r ; ce qui signie que le potentiel gravitationnel est supposé constant à
l'intérieur de celle-ci. Faisons ensuite varier r pour observer les variations de la
densité ρ.
Nous admettrons que les volumes élémentaires mesurés par les observateurs
3Φ
3GM
locaux (à l'intérieur de la sphère) sont multipliés par le coecient e− c2 = e rc2
(en eet, le potentiel étant constant, toutes les mesures de distance sont multiGM
pliées par le même coecient de dilatation de l'espace : e rc2 ) ; le volume total
inclus dans la sphère (obtenu en sommant les mesures locales des observateurs
3GM
locaux) est donc : V = 34 π r3 e rc2 . La masse M est évaluée par un observateur
distant ; nous supposons qu'elle ne varie pas quand r diminue, ce qui signie
que son énergie cinétique augmente, tandis que son énergie potentielle diminue.
Notons bien que dans ce calcul, contrairement au précédent, il n'est pas question
de "prélever l'énergie cinétique" : les variations de r se font à énergie constante,
donc à masse constante. La densité moyenne (évaluée par un observateur local)
− 3GM
M
3M
rc2 .
est donc : ρ = M
3GM = 4πr 3 e
V = 4
3π
r3 e
rc2
135
La masse M est supposée xée ; faisons varier le rayon r (évalué, lui aussi,
par l'observateur distant). Si on fait tendre r vers l'inni, ρ tend vers 0, comme
on pouvait s'y attendre. Mais lorsqu'on fait tendre r vers 0, alors ρ tend encore
vers 0, ce qui est plus surprenant ! La densité admet un maximum ρmax , facile
à calculer en étudiant la dérivée de la fonction ρ = f (r) :
− 3GM
2
3M r3 . 3GM
dρ
r 2 c2 .e
=
.
dr
4π
rc
− 3r2 .e−
r6
9M
dρ
=
dr
4πr4
La dérivée s'annule pour
pression de ρ, on obtient :
ρmax =
3GM
rc2
GM
rc2
3M
=
4πr4
3GM
3GM
− 3 e− rc2 ;
2
rc
3GM
GM
−
1
e− rc2 .
2
rc
= 1, soit r =
GM
c2
. En substituant dans l'ex-
3M − 3GM
3M
3c6
3.1079
−3
rc2 =
e
e
=
≈
kg/m3 .
3
4πr3
4πG3 e3 M 2
M2
4π GM
2
c
Cette formule montre que la densité maximale diminue rapidement lorsque
la masse augmente !
Comment interpréter ce résultat ?
Partons d'une sphère de grand rayon ( GM
rc2 << 1), et supposons qu'elle se
contracte, la masse M restant constante et répartie de manière équilibrée. Tant
que le rayon r est susamment grand par rapport à la valeur limite GM
c2 , la
densité moyenne ρ croît sensiblement comme en gravitation newtonienne, car
GM
Φ
k
le coecient de dilatation des distances e r = e rc2 = e− c2 reste très proche
de 1, donc négligeable (de même que le coecient de dilatation des volumes :
3GM
e rc2 ) ; mais à l'approche de la valeur critique, ce coecient se met à augmenter
brusquement : on pourrait dire que "la matière se met à fabriquer de l'espace" !
Et lorsque r atteint la valeur critique, cette "création d'espace" contrebalance
exactement l'accroissement de la densité !
Je vais préciser la valeur de cette densité maximale, dans quelques cas particuliers, car je crois que cette notion permet de bien comprendre la diérence
de comportement des objets compacts, en métrique de Schwarzschild et en métrique de Ni.
Pour une étoile de même masse que le Soleil, le rayon critique GM
c2 est de
l'ordre de 1, 47 km (et le rayon de Schwarzschild est donc 2, 94 km) ; s'il était
possible de comprimer le Soleil jusqu'à cette limite, sa densité (mesurée locale-
136
ment) serait :
ρmax =
3.1079
3.1079
=
≈ 7, 5.1018 kg/m3 .
2
M
4.1060
C'est une densité prodigieuse, qui dépasse, de beaucoup, tout ce que les astronomes ont pu observer jusqu'ici (presque 10 fois la densité d'une étoile à
neutrons) ; les théories actuelles peinent à calculer le comportement de la matière à une telle densité ; mais c'est une densité nie. Bien entendu, cette limite est purement théorique : les physiciens ont calculé qu'une étoile comme
le Soleil peut se transformer en naine blanche ; mais la pression de la matière
dégénérée est alors susante pour arrêter l'eondrement, et le stade d'étoile
à neutrons n'est jamais atteint. On considère qu'une étoile peut s'eondrer et
se transformer en étoile à neutrons si sa masse est comprise entre la limite de
Chandrasekhar, soit environ 1, 4 M , et la limite d'Oppenheimer-Volko, souvent évaluée à 3, 3 M (mais nous préfèrerons l'estimer à 2, 8 M , pour une
raison que nous allons voir tout de suite). Calculons la densité maximale (qui
est inversement proportionnelle au carré de la masse), à la limite de Chandrase18
≈ 3, 8.1018 kg/m3 . Nous avons calculé
khar (M = 1, 4 M ) ; on trouve : 7,5.10
1,42
qu'une étoile à neutrons atteint la limite de Schwarzschild pour M ≈ 2, 4.M ,
et la limite critique (demi-rayon de Schwarzschild) pour M ≈ 2, 8.M . Dans le
18
≈ 1, 35.1018 kg/m3 , et, dans le
premier cas, la densité maximale est : 7,5.10
2,42
18
second cas : 7,5.10
≈ 0, 96.1018 kg/m3 . Or, la densité des étoiles à neutrons,
2,82
d'après les calculs des spécialistes, doit être de l'ordre de 1018 kg/m3 . Lorsque la
masse dépasse 2, 8.M , la densité maximale descend au-dessous de 1018 kg/m3 ,
ce qui est insusant pour permettre la formation d'une étoile à neutrons : les
protons et les électrons restent libres, et ne fusionnent pas pour former des neutrons.
Considérons maintenant une étoile de masse nettement supérieure ; choisissons comme exemple Cygnus X-1, dont la masse serait comprise entre 7 et 13
masses solaires. Son rayon critique est compris entre 10 et 20 km, et la densité maximale entre 1, 5.1017 et 4, 4.1016 kg/m3 , donc bien inférieure à celle
d'une étoile à neutrons. Ce type d'étoile illustre bien ce qu'on a pris l'habitude
d'appeller un trou noir stellaire. Le rayonnement X est émis par des nuages
de gaz spiralant à très grande vitesse dans un champ gravitationnel extrême.
Si l'étoile entière pouvait se contracter jusqu'à pénétrer complètement dans sa
sphère critique, la "création d'espace" serait telle que sa densité maximale (mesurée localement) serait très insusante pour produire une étoile à neutrons ;
par conséquent, lorsqu'on dit : "une étoile à neutrons dont la masse dépasse la
limite d'Oppenheimer-Volko se transforme en trou noir parce-que sa densité
devient trop forte", c'est inexact ; au contraire, sa densité est trop faible ! Mais
alors, comment peut-on se représenter l'étoile Cygnus X-1 ? Comme on vient de
le voir, sa densité est nécessairement faible ; les tourbillons de gaz qui l'entourent
doivent atteindre des vitesses relativistes. L'énergie cinétique (vitesse de rotation, chaleur) doit l'emporter de beaucoup sur l'énergie de masse. Pour que cette
137
étoile puisse se contracter, il faudrait que cette énergie cinétique soit rayonnée,
et, bien entendu, la masse totale diminuerait d'autant ; il faudrait que la masse
restante descende au-dessous de 2, 8.M pour qu'elle puisse se transformer en
étoile à neutrons. Ceci nous conduit à penser qu'une étoile très massive comme
Cygnus X-1 n'a peut-être rien à voir avec les "trous noirs de Schwarzschild",
tels qu'ils ont été décrits, sur la base de la relativité générale... Ce serait plutôt
un "trou noir de Ni" !
Changeons d'échelle, et considérons maintenant un "trou noir supermassif"
de 3, 6 millions de masses solaires (comparable à celui qui est décrit au centre
de notre galaxie). Sa densité maximale sera beaucoup plus faible. On obtient :
ρmax ≈ 5, 8 . 105 kg/m3 .
C'est à peu près 4 fois la densité qui règne au centre du Soleil, mais c'est très
loin de la densité d'une étoile à neutrons. Le comportement de la matière, à ce
niveau de densité, peut être déduit de l'étude du plasma qui constitue les étoiles.
Mais n'oublions pas qu'il s'agit ici de la densité maximale, atteinte lorsque le
rayon r (évalué par l'observateur distant) est égal à GM
c2 , soit, dans ce cas, 5, 3
1
millions de km (un peu moins de 8 fois le rayon du Soleil, ou 80
de celui de
Bételgeuse). En supposant que le rayon r puisse décroître encore au-dessous de
ce seuil, alors la densité (mesurée localement) se mettrait à décroître elle aussi !
Mais rien ne nous permet d'armer qu'une telle compacité soit atteinte, ou
seulement approchée...
Considérons enn une masse d'un milliard de soleils (comme les trous noirs
dont la présence a été imaginée au c÷ur des quasars). On obtient alors :
ρmax ≈ 7, 5 kg/m3 .
Ceci correspond à 7, 5 millièmes de la densité de l'eau sur Terre ! On peut donc
estimer que le c÷ur actif des quasars (en supposant que ce soit un plasma comparable à celui qui constitue les étoiles) ne devrait pas dépasser quelques dizaines
de millions de masses solaires.
Essayons de préciser ce que nous entendons par "trou noir de Ni". Pour cela,
laissons un instant la place à l'imagination. Considérons une étoile géante en
n de vie : son carburant commence à s'épuiser, et la pression de radiation,
qui jusque-là équilibrait la gravité, faiblit. L'étoile se contracte et tourne de
plus en plus vite. De manière progressive (ou catastrophique ?), c'est la force
centrifuge qui va s'imposer comme le dernier recours pour lutter contre l'eondrement. L'énergie restante décroît lentement, dissipée par rayonnement. Ceci
a plusieurs conséquences : l'étoile se contracte encore, et sa vitesse angulaire
augmente toujours ; selon le principe d'équivalence entre masse et énergie, la
masse de l'étoile diminue aussi ; on pourrait dire qu'elle s'évapore. L'essentiel
de l'énergie (donc de la masse) est maintenant cinétique. Les paticules se déplaçant à des vitesses relativistes tendent à se regrouper sur des orbites d'énergie
138
minimale√(voir la section sur les orbites circulaires), c'est-à-dire au voisinage de
r = (3+ 5).k ≈ 5, 236. G.M
c2 , formant ainsi un tore. Ce rayon r constitue une position d'équilibre stable. Ce tore accapare sinon la totalité, du moins une grande
partie de la masse de l'étoile. Mais, puisque la masse diminue, r décroît aussi ;
le tore se contracte. Comment nit l'histoire ? On peut penser que, la gravité
se faisant de plus en plus faible, les forces de liaison entre atomes deviennent
capables de la contrebalancer ; la force centrifuge perd alors son hégémonie, et
on revient à une situation plus classique (naine noire ?). Mais tout ceci n'a pas
encore été étudié.
Toutes ces remarques nous conduisent à une conception des trous noirs profondément diérente de celle qui résulte de la relativité générale. Si je conserve
le nom de "trous noirs", c'est parce-que la lumière qui nous en provient est
nécessairement aaiblie, pour deux raisons principales : les photons perdent de
l'énergie (apparente) en luttant contre la gravité, et le ralentissement du temps
a pour conséquence qu'ils semblent émis en moins grand nombre par unité de
temps. Mais, en toute rigueur, on pourrait parler d'objets compacts plutôt que
de trous noirs...
Voyons maintenant les raisons qui justient les réticences de certains physiciens vis-à-vis des trous noirs au sens de Schwarzschild.
La première raison est que cette conception du trou noir semble contredire
le principe de conservation de Lavoisier, qu'on résume par la formule : "rien ne
se perd, rien ne se crée, tout se transforme". En eet, si la matière et la lumière
pouvaient pénétrer dans un trou noir (en franchissant son horizon), alors, pour
l'observateur distant, cette matière et cette lumière disparaîtraient de manière
irréversible. Il n'y aurait pas, à proprement parler, de perte d'énergie (puisque la
masse du trou noir augmente en fonction de ce qu'il avale), mais, au minimum,
une perte d'information.
On pourra répondre (à juste titre) que, pour l'observateur distant, le temps
mis par la matière (ou la lumière) pour pénétrer dans le trou noir est inni,
comme nous l'avons expliqué précédemment ; autrement dit, rien ne peut pénétrer dans le trou noir. On pourrait dire que, pour l'observateur distant, l'intérieur
du trou noir n'a pas de réalité physique : c'est une sorte de bulle vide, ou, mieux,
une illusion ; toute la masse se trouve à l'extérieur de l'horizon. Celui-ci n'est
alors qu'une limite (par nature infranchissable) de l'espace-temps, car il se situe,
pour ainsi dire, à l'inni dans le temps.
Mais alors comment peut-on concevoir la formation d'un trou noir de Schwarzschild ? La théorie en vigueur prévoit, en eet, qu'une étoile massive peut s'effondrer, en un temps ni, sous forme de trou noir. C'est cette possibilité qui est
contestée par certains théoriciens ("Observation of incipient black holes and the
information loss problem", T. Vachaspati, D. Stojkovic, L.M. Krauss, Physical
Review D). Avec la métrique de Ni, ce problème ne se pose pas.
139
La deuxième raison, c'est que les physiciens (contrairement aux mathématiciens) considèrent généralement que les quantités innies qui apparaissent dans
leurs calculs sont dues à des erreurs, à des interprétations erronées, ou à des
extrapolations hâtives...
Troisième raison : imaginons qu'il puisse exister de la matière à l'intérieur
de l'horizon, et que cette matière soit la cause de la courbure de l'espace-temps
à l'extérieur du trou noir (cette courbure étant donc sa conséquence). Dans ce
cas, comment cette cause pourrait-elle être responsable de cette conséquence,
sachant qu'aucun message ne peut sortir du trou noir ? Cest ce que j'appelle le
paradoxe de l'interaction entre objets compacts.
Plusieurs théoriciens ont pensé que l'horizon des trous noirs était un artefact mathématique dû à un mauvais choix des variables, et ils ont essayé de le
faire disparaître, avec un succès mitigé, grâce à des changement de variables
astucieux, mais articiels. Il n'en demeure pas moins que, pour l'observateur
distant, les paradoxes que nous venons d'évoquer sont irréductibles. A moins de
remplacer la métrique de Schwarzschild par celle de Ni... Il est bien probable que
l'horizon des trous noirs soit un artefact ; mais il ne provient pas d'un mauvais
choix des variables : il provient, évidemment, du pari d'Einstein.
En résumé, le concept de trou noir limité par un horizon trouve son origine
dans la gravitation de Newton ; une synthèse élémentaire de la théorie newtonienne avec la relativité restreinte conduit à l'eacement de cet horizon. Einstein
aurait très bien pu concevoir la relativité générale comme un simple prolongement de la relativité restreinte ; au lieu de cela, il s'est passionné pour les espaces
courbes de Riemann et de Gauss, et son pari l'a entraîné dans une toute autre direction. Ce qui a eu une conséquence qu'il n'avait pas prévue : le retour des trous
noirs ! Car, rappelons-le, Einstein lui-même estimait, paradoxalement, que les
discontinuités de Schwarzschild ne devaient pas exister dans la réalité physique...
Ceci ne minimise pas l'intérêt des études menées par les astronomes sur les
"trous noirs stellaires" et les "trous noirs géants" : ces travaux sont passionnants, même s'il s'agit d'"objets très compacts" et non de véritables trous noirs
au sens de Laplace et de Schwarzschild !
53 Les ondes gravitationnelles en métrique de Ni
Dans la théorie de Newton, la gravité se transmet de manière instantanée.
Pourtant, Newton lui-même considérait cette situation comme une anomalie : la
transmission d'information à vitesse innie ne correspondait pas à sa conception
de la physique. Laplace s'était aussi penché sur ce problème, et avait montré
que, si la vitesse de propagation de la gravité n'était pas innie, elle devait être
140
en tout cas considérable. Pour Einstein, la transmission d'information à vitesse
innie est tout simplement un non-sens, car elle impliquerait la simultanéité
absolue entre l'émission et la réception du message ; or la simultanéité absolue
n'existe pas en relativité.
Les équations de la relativité générale ont fait apparaître des ondes géométriques, appelées ondes gravitationnelles ; Einstein s'en est rendu compte très
rapidement, en étudiant le problème du quadrupôle. Une question fondamentale s'est alors posée : ces ondes sont-elles porteuses d'énergie ? Ce sujet a été
longuement débattu, et Einstein lui-même était hésitant au début. Mais la cohérence de la relativité générale impose d'attribuer une énergie à ces ondes,
car cette théorie identie, mathématiquement, courbure géométrique et énergieimpulsion. Nous en reparlerons.
Ces ondes, prédites par Einstein en 1918, ont été traquées longtemps par
les physiciens. En 1968, Joseph Weber, utilisant un dispositif de son invention
(barres de Weber), n'avait aucune chance de les débusquer... Au début des
années 2000, avec la mise en service des détecteurs Ligo, Virgo, Geo600, on s'attendait à une détection directe rapide, ce qui n'a pas été le cas. L'amélioration
de la technologie (projets Advanced Ligo et Advanced Virgo) a permis un bond
en avant de la sensibilité des détecteurs, à partir de n 2015 - début 2016. Et
c'est en février 2016 qu'est arrivée la nouvelle tant attendue : la première détection directe d'une onde gravitationnelle a été réalisée en septembre 2015 par
Ligo (événement GW150914).
Ni.
Nous allons voir comment ces ondes peuvent être introduites en métrique de
Sans nous préoccuper des calculs très sophistiqués qui ont été publiés sur ce
sujet, abordons-le à notre façon. Imaginons un système double formé de deux
étoiles de masses m1 et m2 tournant autour de leur centre de gravité commun
O, et un observateur immobile par rapport à ce centre de gravité, situé à grande
distance. Pour cet observateur, les impulsions des deux étoiles sembleront opposées, et le champ se réduira, à peu de choses près, au champ newtonien produit
par une masse m1 + m2 située en O. Mais ce n'est qu'une approximation. Le
calcul de la diérence entre le champ réel et cette approximation newtonienne
fait intervenir le "quadrupôle d'Einstein". C'est ce calcul qui fait apparaître une
structure particulière qui est à l'origine de la théorie des ondes gravitationnelles.
Nous souhaitons illustrer cette problématique, de manière visuelle, en sacriant la rigueur pour privilégier la simplicité et la clarté. Il n'est pas question
de traiter toutes les composantes du champ : nous nous contenterons pour le
moment de parler du potentiel newtonien. Nous allons nous placer dans un cas
particulièrement simple, et faire intervenir uniquement la relativité restreinte,
en négligeant la courbure de l'espace. Nous savons d'avance que cette simplication ne sera pas sans conséquence, et qu'une correction sera nécessaire.
141
Nous imaginerons que les deux étoiles A et B sont de même masse, et
tournent à vitesse constante sur une orbite circulaire autour de leur centre de
gravité O, et nous supposerons que la vitesse de propagation du potentiel gravitationnel, évaluée par l'observateur distant, est égale à la vitesse de la lumière.
Ce potentiel, en un point de l'espace-temps, sera supposé indépendant de l'observateur ; il sera entièrement déterminé par la distance spatiale par rapport à
l'émetteur, distance évaluée dans le repère galiléen qui était celui de l'émetteur,
au moment de l'émission.
Dans la gure ci-dessous, établie par un observateur distant immobile par
rapport au centre de gravité O, le point P représente un point quelconque de
l'espace-temps à l'instant t. On suppose qu'à cet instant arrive en P un message
gravitationnel provenant de l'étoile A, émis à l'instant te (instant de l'émission).
Le point A de la gure indique le lieu où se trouvait l'étoile A à l'instant te . On
a donc : AP = c(t − te ). Supposons que le but soit de déterminer le potentiel
gravitationnel en P à l'instant t ; pour cela, il faudrait calculer la distance ρ du
point P par rapport à A, évaluée dans un repère mobile lié à A, à l'instant te :
ρ = c(t − te )0 (où le "prime" désigne le changement d'observateur, qui s'eectue
par la transformation de Lorentz). En fait, notre but est de tracer les lignes
équipotentielles, c'est-à-dire de déterminer les coordonnées de P pour une valeur xée de ρ.
142
Notons (x, y) les coordonnées spatiales de P dans le repère (O, x, y) et (X, Y )
ses coordonnées dans le repère (A, X, Y ) (repères liés au centre de gravité O).
X
cos φ
cos φ
= AP
= c(t − te )
;
Y
sin φ
sin φ
x
cos α
cos α −sin α
X
=r
+
.
;
y
sin α
sin α cos α
Y
x
y
=r
x
y
cos α
sin α
=r
+ c(t − te )
cos α
sin α
cos α
sin α
+ c(t − te )
−sin α
cos α
cos φ
.
;
sin φ
cos (α + φ)
sin (α + φ)
.
D'après la transformation de Lorentz :
ρ = c(t − te )0 =
c(t − te ) − v cY
c(t − te ) − v(t − te ) sin φ
q
q
=
;
2
v2
1 − c2
1 − vc2
c(t − te ) v
ρ= q
1 − sin φ ;
2
c
1 − vc2
q
2
ρ. 1 − vc2
c(t − te ) =
;
1 − vc sin φ
q
2
ρ. 1 − vc2
cte = ct −
;
1 − vc sin φ
q


2
ρ.
1 − vc2
v 
vte
.
=
ct −
αe =
r
cr
1 − vc sin φ
On aura compris que αe représente la valeur de l'angle α à l'instant de l'émission (te ).
Pour construire une ligne équipotentielle à un instant donné (t xé), on xe
une valeur de ρ (puisque toute valeur du potentiel Φ correspond à une valeur de
ρ), puis on fait varier l'angle φ de 0 à 2 π ; pour chaque valeur de φ, on calcule
les valeurs correspondantes, d'abord de αe , ensuite de x et y .
143
Plus explicitement, en posant t = 0 :
q
ρ. 1 −
cte = −
v2
c2
;
sin φ
q
2
1 − vc2
vte
v ρ
αe =
=− . .
;
r
c r 1 − vc sin φ

q
1−
v ρ
x = r.cos − . .
c r 1−

q
v ρ
y = r.sin − . .
c r 1−
v
c
sin φ
1−
v
c
v2
c2
v2
c2
sin φ

+

+
1−
v
c
q
ρ. 1 −
1−
ρ.
v
c
q
1−
1−

q

q

2
1 − vc2
v
ρ
.cos − . .
+ φ ;
sin φ
c r 1 − vc sin φ
v
c
v2
c2

2
1 − vc2
v
ρ
.sin − . .
+ φ .
sin φ
c r 1 − vc sin φ
v2
c2
Dans la gure ci-dessus, nous avons représenté la structure du champ généré
par les deux étoiles, pour des valeurs de la vitesse et du rayon choisies arbitrairement. Plus précisément, nous avons tracé les courbes équipotentielles du champ
de l'étoile A, et celles du champ de l'étoile B , en utilisant les calculs précédents.
Cette gure est extraite d'une applet interactive que nous avons placée à la n
de ce document, dans laquelle il est possible de faire varier deux paramètres :
144
la vitesse et le rayon orbital.
Nous voyons apparaître une structure spiralée du champ, qui évoque irrésistiblement les ondes gravitationnelles de la relativité générale. Ceci pourrait
sembler satisfaisant, mais en observant plus attentivement cette gure, nous
voyons qu'elle soulève un problème embarrassant.
Rappelons-nous les résultats obtenus dans la section sur les géodésiques,
version cartésienne :
v2
∂Φ
E
dE
= 2. 1 + 2 .
, et :
c.dt
c
c
c∂t
E
v2 ~
d~
p
= − 2 . 1 + 2 .5
Φ.
dt
c
c
Si nous observons les lignes équipotentielles produites par l'une des deux
étoiles (A), dans le voisinage de l'autre étoile (B ), nous voyons qu'elles ne sont
pas rigoureusement tangentes à l'orbite, ce qui a deux conséquences. Si nous
visualisons le vecteur accélération (perpendiculaire à la ligne équipotentielle)
nous voyons qu'il n'est pas perpendiculaire au vecteur vitesse, mais légèrement
prograde (dirigé vers l'avant), ce qui entraîne que le module de l'impulsion de
l'étoile B va croître. D'autre part, si nous xons l'un des points bleus (par
exemple celui où se trouve l'étoile B à l'instant présent) et laissons tourner les
lignes équipotentielles de A, nous remarquons qu'en ce point le potentiel va
croître. Rappelons que les lignes équipotentielles les plus éloignées de A ont un
potentiel plus élevé. La conséquence est qu'au point considéré ∂Φ
∂t est positif,
ce qui signie que l'énergie de l'étoile B doit croître. Et, par symétrie, il en est
de même pour A. Cette conclusion est évidemment absurde. Il s'agit là d'un
problème fondamental, lié à la propagation de l'information gravitationnelle à
vitesse nie.
Pour résoudre ce paradoxe, on peut choisir des options radicalement diérentes.
Première option : on peut penser que cet accroissement de l'énergie et de
l'impulsion est annulé par un autre phénomène que nous n'avons pas pris en
compte. Et une hypothèse sur ce phénomène s'impose tout naturellement : la
production d'ondes gravitationnelles pourrait être énergivore. Bien que notre
façon d'introduire ces ondes n'en dise rien, il n'est pas exclu qu'elles puissent
avoir des propriétés physiques permettant des interactions mettant en jeu des
échanges d'énergie : action des corps massifs sur les ondes, rétroaction des ondes
sur les corps massifs, interaction des ondes entre elles - le bilan énergétique étant
localement nul. Nous n'avons aucun élément solide pour étayer (et chirer) cette
hypothèse, à part l'analogie (très hasardeuse) avec d'autres types d'ondes. Cette
option permet de rétablir l'équilibre énergétique du système, mais pas l'équilibre
145
global : l'onde emporte une énergie créée ex nihilo ! Ce n'est pas la solution...
Deuxième option : c'est l'hypothèse du champ tournant. Si nos deux étoiles
tournent à la vitesse angulaire ω , on peut imaginer que les messages gravitationnels (gravitons) circulant entre A et B se déplacent en ligne droite dans
un repère tournant, lui aussi, à la vitesse angulaire ω , ce repère pouvant être
assimilé à une plate-forme tournante. Les messages gravitationnels se déplaceraient alors comme s'ils étaient guidés par une bre optique tendue entre A et
B . Pour un observateur immobile, ces gravitons sembleraint se déplacer selon
des arcs de cercle. On trouvera des explications mathématiques sur la page Les
vitesses en Relativité restreinte, section "Aberration de la lumière sur une plateforme tournante". Cette option pourrait nous conduire à réviser et à enrichir
notre conception du quadrivecteur d'entraînement : en lui adjoignant les composantes nécessaires à la prise en compte des rotations, nous transformerions
alors ce quadrivecteur en tenseur, comme nous l'avions envisagé dans la section
sur l'entraînement. La transmission de l'information gravitationnelle serait donc
aectée par cet entraînement particulier.
Troisième option : c'est l'hypothèse des surfaces équipotentielles sphériques
concentriques. Elle suppose que, pour un observateur lié à une étoile A, les
surfaces équipotentielles produites pas cette étoile seront toujours des sphères
concentriques de centre A, à la seule condition que A se déplace sur une géodésique. Ceci semble évident lorsque l'étoile est "immobile". Lorsqu'elle se déplace
en ligne droite à vitesse constante, on peut montrer facilement grâce à un changement de repère galiléen, faisant intervenir la transformation de Lorentz dans
le cadre de la relativité restreinte, que ces surfaces équipotentielles, vue par
un observateur distant, s'apparenteront à des ellipsoïdes. Mais que se passet-il lorsque l'étoile se déplace, par exemple, sur une orbite circulaire ? Il faut
alors dépasser le cadre de la relativité restreinte, et admettre qu'en gravitation
relativiste tout repère se déplaçant sur une géodésique possède des propriétés
analogues à celles des repères galiléens en relativité restreinte. Notre étude sur
les ondes gravitationnelles en métrique de Ni serait alors totalement fausse, à
partir du moment où nous avons imaginé un message gravitationnel se déplaçant
"en ligne droite" dans une espace-temps euclidien absolu, qui n'existe pas. Nous
aurions dû utiliser des surfaces équipotentielles sphériques, éventuellement un
peu déformées par changement de repère.
Quatrième option : c'est l'hypothèse de la gravitodynamique quantique, tentative d'intégration de la gravitation dans le cercle des autres forces fondamentales, dans un cadre quantique. C'est plus particulièrement l'électrodynamique
quantique qui peut guider notre réexion. De même que la théorie de l'électromagnétisme peut être expliquée intégralement par des échanges de photons
virtuels entre particules chargées, on peut essayer de se représenter la gravitation sur la base d'échanges de quanta d'énergie-impulsion par l'intermédiaire de
gravitons virtuels.
146
Que sont ces échanges de photons virtuels entre particules chargées ? Voici
d'abord ce qu'ils ne sont pas. Imaginons deux particules chargées, chacune émettant, dans toutes les directions, un ux de photons porteurs d'énergie. Lorsque,
par hasard, l'un de ces photons atteint l'autre particule, il est capté et son énergie est récupérée. Mais la grande majorité des photons manquent la cible et leur
énergie se perd dans l'espace.
Il est certain que ce scénario est faux : les deux particules perdraient constamment de l'énergie, dispersée dans l'espace. Ceci est contraire aux observations !
En réalité, les photons qui se perdent dans l'espace n'existent pas. Ils sont virtuels, et ne sont pas élus pour devenir réels ! Ce privilège est réservé à ceux
qui atteignent leur cible. Ceux-ci ont une trajectoire dénie par : leur point de
départ, leur point d'arrivée et le temps de parcours.
Imaginons que la gravitation, comme les trois autres forces fondamentales,
respecte ces lois quantiques. Supposons que, pour un observateur distant gravitationnellement immobile, deux particules soient situées, à l'instant t, aux points
A et B . A cet intant arrive en B un message gravitationnel (graviton) émis un
peu plus tôt par la première particule, quand elle était en A1 . Au même instant
t, la seconde particule (en B ) émet un message (graviton) qui sera réceptionné
par la première particule, quelques instants plus tard, quand elle sera en A2 .
147
On peut donc dire que la particule située en B subit simultanément deux interactions : l'une avec A1 (dans le passé) et l'autre avec A2 (dans le futur). Cette
situation, totalement contre-intuitive, établit une symétrie entre le passé et le
futur. Cette symétrie, appelée symétrie T , est respectée par toutes les forces
fondamentales, mais aussi par la gravitation newtonienne. En eet, si on étudie
les trajectoires des corps célestes à l'aide des équations de Newton, on voit que
l'inversion du sens du temps (remplacement de la variable t par −t) ne modie pas la forme des orbites, mais seulement leur sens de parcours. Mais cette
symétrie T n'est pas respectée dans la présentation des ondes gravitationnelles
que nous avons proposée : l'observation du sens d'enroulement spatial des spires
permet immédiatement de déterminer dans quel sens tournent les deux étoiles ;
si on inverse le sens du temps, il faut modier la gure pour rétablir l'enroulement correct.
En pratique, l'échange d'énergie-impulsion entre A1 et B pourra s'exprimer
par un couple de forces opposées. De même entre B et A2 .
Dans le cas d'un couple d'étoiles A et B de même masse tournant sur une
même orbite circulaire, deux forces vont s'exercer sur B , l'une dirigée vers A1 ,
l'autre vers A2 ; la résultante pointera vers A. Il s'ensuit que la conservation de
l'énergie du système va être assurée.
Cinquième option : on peut penser que le principe de l'alignement de la
pseudo-accélération avec le gradient du potentiel, qui se vérie bien dans le cas
du système solaire, est pris en défaut dans le cas des champs variables, et doit
alors s'éclipser au prot de la notion de géodésique ou de trajectoire respectant
la conservation de l'énergie.
Nous laisserons ce problème en suspens.
54 La détection des ondes gravitationnelles
Notre applet met en évidence une structure qui évoque des ondes gravitationnelles ; mais notre raisonnement ne dit rien d'une éventuelle énergie transportée
par ces ondes. De plus, si nous reprenons nos équations hypothétiques censées
décrire le mouvement d'un système binaire :

− G.m

 1) E = e r.c2 .ch wc = cte

 2) µ = e G.m
w
te
r.c2 .r.sh
c .sinα = c ,
elles ne prévoient évidemment aucune décroissance de l'énergie ou du moment
cinétique du système.
148
Mais c'est, pour le moment, une autre question que nous désirons soulever :
des détecteurs tels que Ligo ou Virgo seront-ils sensibles à de telles ondes ?
Il faut rappeler le principe de ces détecteurs : ils sont composés de deux
bras perpendiculaires, de même longueur (plusieurs kilomètres), dans lesquels
circulent des faisceaux lumineux. Le passage d'une onde gravitationnelle, entraînant une variation du potentiel, est susceptible de modier la longueur de l'un
des bras, par eet de "création d'espace". Une variation de la longueur relative
des deux bras peut être détectée par interférométrie, mais si les deux bras subissent simultanément des variations identiques, la détection est impossible. Or
il semble, à première vue, que le passage d'une onde gravitationnelle "de Ni"
devrait aecter les deux bras de la même façon, quelle que soit leur orientation.
Mais le calcul qui précède est trompeur, car il passe sous silence un élément
important : le phénomène de "dilatation de l'espace" est lié au repère de l'émetteur du signal gravitationnel, et non au repère du récepteur. Si le potentiel était
scalaire, comme nous l'avons supposé dans notre applet, Ligo et Virgo seraient
incapables de détecter ces ondes ! Mais nous avons expliqué précédemment la
nécessité de concevoir le potentiel comme orienté : c'est un quadrivecteur (ou
éventuellement un tenseur à 16 composantes, mais nous allons voir que la notion
de quadrivecteur est susante pour traiter notre problème).
Si un observateur subit l'inuence gravitationnelle d'un corps de masse m
situé à la distance d et immobile par rapport à lui, son appréciation du temps
et de l'espace est altérée ; la modication se résume ainsi :
  −k
e d
dt0
 dx0  = 
 0
dy 0
0

Nous avons posé, bien sûr : k =
0
k
ed
0
G.m
c2
 

0
dt

0  .  dx  .
k
dy
ed
.
Nous avons supprimé la troisième coordonnée spatiale pour alléger l'écriture.
Supposons maintenant que le corps massif se déplace à la vitesse ~v selon
l'axe des x (par rapport à l'observateur). La formule ci-dessus doit alors être
adaptée : il faut d'abord attribuer (virtuellement) à l'observateur une vitesse
égale à ~v avant de pouvoir l'utiliser ; après quoi il faudra revenir dans le repère
initial. On va donc composer la matrice de Lorentz, la matrice de changement
de potentiel, et la matrice de Lorentz inverse ; ce qui donne :
 
ch wc
dt0
 dx0  =  sh w
c
0
dy 0

sh wc
ch wc
0
  −k
e d
0

0 . 0
1
0
149
0
k
ed
0
 
0
ch wc
 
−sh wc
0 .
k
0
ed
−sh wc
ch wc
0
 

0
dt
0  .  dx  ;
1
dy
  −k
e d .ch wc
dt0
k
 dx0  = 
 e− d .sh wc
dy 0
0

 
0
ch wc
 
−sh wc
0 .
k
0
ed
k
e d .sh wc
k
e d .ch wc
0

k
k
e− d .ch2 wc − e d .sh2 wc
dt
k

 dx0  =  e− d − e kd .ch w .sh w

c
c
dy 0
0

0

−sh wc
ch wc
0
 

0
dt
0  .  dx  ;
1
dy
k
k
e d − e− d .ch wc .sh wc
k
k
e d .ch2 wc − e− d .sh2 wc
0
0



dt

 dx  .
0 
.
dy
k
ed
A un instant donné (dt0 = 0) on aura :
k
k
k
k
w
w
w
w
.dt + e d − e− d .ch .sh .dx = 0 ;
dt0 = e− d .ch2 − e d .sh2
c
c
c
c
k
k
e− d − e d .ch wc .sh wc
dt =
.dx.
k
k
e− d .ch2 wc − e d .sh2 wc
Cette condition étant réalisée, calculons dx0 et dy 0 en fonction de dx et dy :
k
k
k
k
w
w
w
w
dx0 = e− d − e d .ch .sh .dt + e d .ch2 − e− d .sh2
.dx ;
c
c
c
c
k
k
−d
d
k
k
−
e
e
.ch wc .sh wc
k
w
w
w
w
0
−d
−k
d
d .ch2
d .sh2
dx = e
.dx+
e
−
e
.dx ;
− e .ch .sh .
k
k
c
c e− d .ch2 w − e d .sh2 w
c
c
c
dx0 =
k
2
k
k
k
k
.ch2 wc .sh2 wc + e d .ch2 wc − e− d .sh2 wc . e− d .ch2 wc − e d .sh2 wc
k
k
e− d .ch2 wc − e d .sh2 wc
dx0 =
k
e− d − e d
c
e−
2.k
d
−2+e
2.k
d
2.k
2.k
.ch2 wc .sh2 wc − e− d + e d .ch2 wc .sh2 wc + ch4 wc + sh4 wc
k
k
e− d .ch2 wc − e d .sh2 wc
0
dx =
ch4 wc − 2.ch2 wc .sh2 wc + sh4 wc
k
k
e− d .ch2 wc − e d .sh2 wc
dx0 =
D'autre part :
.dx =
ch2 wc − sh2 wc
e− d .ch2 wc − e d .sh2 wc
dx
k
k
e− d .ch2 wc − e d .sh2 wc
k
dy 0 = e d .dy.
150
k
k
2
.
.dx ;
.dx ;
.dx ;
Imaginons maintenant que dx et dy soient les longueurs des deux bras d'un
interféromètre, initialement égales : dx = dy . Le corps massif de vitesse ~v (parallèle au premier bras de l'interféromètre, perpendiculaire au second) modie
inégalement les longueurs des deux bras ; en eet, les longueurs modiées dx0 et
dy 0 vérieront :
k
k
e− d .ch2 wc − e d .sh2 wc
k
2.k
w
dy 0
w
d .dy.
=
e
= ch2 − e d .sh2 ;
dx0
dx
c
c
2.k
2.k
w
w
dy 0
2w
d .sh2
d
=
1
+
sh
.sh2 ;
−
e
=
1
+
1
−
e
dx0
c
c
c
2.k
w
2
0
0
0
dy = dx + 1 − e d .sh .dx .
c
La diérence relative de la longueur des deux bras est donc :
2.k
w
dy 0 − dx0
d
=
1
−
e
.sh2 .
0
dx
c
On remarque que le bras parallèle à ~v est légèrement plus long que celui qui
est perpendiculaire.
Pour d >> k, on écrira :
2
v
dx0 − dy 0
2.k
c2
.
≈
.
0
dx
d 1 − vc22
Supposons maintenant que le corps massif tourne sur une orbite circulaire,
que la direction de l'observateur terrestre soit perpendiculaire au plan de l'orbite, et que les deux bras de l'interféromètre soient situés dans un plan parallèle à celui de l'orbite. Dans ce cas, pour cet observateur, le vecteur ~v sera
tournant, de période T , et aectera alternativement les deux bras de l'interféromètre, qui sembleront se dilater et se contracter alternativement avec une
période T 0 = T2 . Si la direction de la Terre n'est pas perpendiculaire au plan de
l'orbite, la conclusion est presque identique, à condition que le temps mis par
le message gravitationnel pour parcourir le diamètre de l'orbite soit négligeable
par rapport à T , ce qui est vrai pour v << c. Mais l'angle formé par chacun des
bras de l'interféromètre avec le plan de l'orbite détermine sa réaction par rapport au signal (celle-ci étant proportionnelle au cosinus de l'angle). Il est donc
souhaitable d'utiliser simultanément deux ou plusieurs interféromètres orientés
de manière diérente, pour pouvoir reconstituer l'amplitude réelle du signal.
Si nous considérons maintenant deux corps tournant autour de leur centre
de gravité commun, leurs eets vont se cumuler, car le sens du vecteur vitesse
n'intervient pas.
Supposons que ces deux corps soient de même masse m2 , et tournent sur une
orbite circulaire de rayon 2r , à la vitesse v (évaluation de l'observateur distant).
151
On a toujours
v2
dx0 −dy 0
dx0
≈
2.k
c2
d . 1− v2
, avec k =
c2
G.m
c2
(m étant la masse totale).
Le mobile ctif (voir section sur les systèmes doubles) tourne sur une orbite de
rayon r, à la vitesse vc = 2.v (évaluation de l'observateur distant). La période
se calcule ainsi :
T =
2.π.r
.
vc(dist)
Nous avions montré que :
vc
=
c
r
2.k
k
.e− r , ce qui entraîne :
r−k
r
2.π.r
r − k 2.k
T =
.
.e r .
c
k
En posant x = kr , on pourra écrire :
vc(loc)
1
=√
;
c
x−1
vc(dist)
1
=√
2 ;
c
x − 1.e x
2
2.π.k.x √
. x − 1.e x .
Tdist =
c
En remarquant que
k
k
=
m
M
, et que k ≈ 1, 47 km, on écrira :
Tdist ≈
2
2, 94.π √
m
. x − 1.e x .x.
.
c
M
Nous allons maintenant évaluer l'amplitude du signal en fonction de la distance. On suppose que l'information se transmet sous forme quadrivectorielle,
et le quadrivecteur en question, comme tout quadrivecteur lorentzien, conserve
"en mémoire" une information de type rapidité, en l'occurence la rapidité de
l'émetteur au moment de l'émission. La vitesse v qui va intervenir dans le calcul
est la vitesse circulaire de l'étoile émettrice évaluée par l'observateur distant ;
ce qu'on peut écrire ainsi :
v=
On a donc :
vc(dist)
.
2
v2
1
=
2 ;
c2
4.(x − 1).e x
v2
c2
1−
v2
c2
=
1
2
4.(x − 1).e x − 1
;
dx0 − dy 0
2.k
1
≈
.
;
0
dx
d 4.(x − 1).e x2 − 1
152
dx0 − dy 0
2, 94
m
1
≈
.
.
.
dx0
d 4.(x − 1).e x2 − 1 M
Soulignons que la notion d'immobilité gravitationnelle joue un rôle essentiel
dans notre raisonnement : c'est le changement de repère que nous avons eectué
pour nous placer dans un repère immobile par rapport à l'une ou à l'autre des
deux étoiles qui fait apparaître une distorsion, qui dépend de l'orientation du
vecteur vitesse par rapport aux deux bras de l'interféromètre. Insistons sur le
fait que ces calculs ne font pas intervenir la vitesse de propagation de la gravité,
ni la nature ondulatoire du champ. On pourrait dire que les détecteurs d'ondes
gravitationnelles ne sont pas conçus pour détecter des ondes, mais de brusques
changements d'orientation du champ quadrivectoriel. Ils peuvent donc fonctionner ecacement même si les ondes, telles qu'elles sont prévues par la relativité
générale, n'existent pas !
55 L'événement GW150914
Appliquons maintenant ce qui vient d'être dit à l'événement GW150914 (première détection d'une onde gravitationnelle). Nous supposerons qu'il s'agit de
la coalescence de deux astres de même masse.
Tdist ≈
2
m
2, 94.π √
. x − 1.e x .x.
≈ 0, 015 s ;
c
M
2, 94
dx0 − dy 0
1
m
≈
.
.
≈ 1, 0.10−21 .
2
0
dx
d 4.(x − 1).e x − 1 M
Examinons la courbe de la vibration captée par Ligo, et évaluons l'écart
temporel entre les deux derniers maxima, juste avant la décroissance du signal.
Nous obtenons, très approximativement : T 0 ≈ 0, 0075 s. Il faut multiplier par
2 pour obtenir la période de rotation du système : T ≈ 0, 015 s.
Quant à l'amplitude 0maximale
du signal, elle atteint, selon l'article publié
−dy 0
−21
par l'équipe de Ligo : dxdx
≈
1,
0.10
à l'instant de la coalescence.
0
Nous admettrons donc les deux égalités suivantes :
La première de ces deux égalités nous donne :
m
0, 015.300000
1
487
≈
.√
≈√
.
2
2
M
2, 94.3, 14
x − 1.e x .x
x − 1.e x .x
Après avoir calculé
d≈
m
M
, on calcule d grâce à la seconde égalité :
2, 94
1
m
2, 94
m
.
.
≈
.
.1021 km.
2
1, 0.10−21 4.(x − 1).e x2 − 1 M
4.(x − 1).e x − 1 M
153
Divisons par 3, 086.1019 pour convertir en mégaparsecs (M pc) :
d≈
95
m
M pc.
4.(x − 1).e − 1 M
2
x
.
Pour quelques valeurs de x = kr , nous avons calculé, à l'aide des égalités cidessus, les valeurs de m (masse totale du système, exprimée en masses solaires),
de d (distance en mégaparsecs), de k (demi-rayon de Schwarzschild du système,
en km), de r (distance séparant les centres des deux étoiles à l'instant de la
coalescence, en km), et de v/c (v étant la vitesse relative des deux étoiles au
même instant, évaluée localement, dans le potentiel kr ).
x
m
d
k
r
v/c
2
89,6
862
132
263
1
2,5
71,5
550
105
263
0,82
3
58,9
384
87
260
0,71
3,5
49,7
283
73
256
0,63
4
42,6
216
63
251
0,58
4,5
37,1
169
55
245
0,53
5
32,6
136
48
240
0,50
5,5
29,0
111
43
235
0,47
6
26,0
92
38
229
0,45
6,5
23,5
77
35
224
0,43
7
21,3
66
31
220
0,41
x
m
d
k
r
v/c
8
17,9
48,7
26,3
210
0,38
12
10,4
19,3
15,2
183
0,30
16
6,9
9,8
10,2
163
0,26
20
5,1
5,8
7,4
149
0,23
24
3,9
3,7
5,7
137
0,21
28
3,1
2,6
4,6
128
0,19
32
2,6
1,9
3,8
121
0,18
36
2,2
1,4
3,2
114
0,17
40
1,9
1,1
2,7
109
0,16
44
1,6
0,9
2,4
104
0,15
48
1,4
0,7
2,1
100
0,15
Il est clair que l'événement GW150914 ne peut pas être associé à une coalescence d'étoiles de type solaire : dans ce cas, on aurait m ≈ 2, et, d'après le
tableau, la distance r serait peu supérieure à 100 km, ce qui est très loin du
diamètre d'une étoile de type solaire. Il ne peut pas s'agir non plus d'une coalescence d'étoiles à neutrons : ces étoiles ont généralement une masse de l'ordre
de 1, 4 M , on devrait donc avoir m ≈ 2, 8, ce qui, selon le tableau, donnerait
une distance r supérieure à 100 km au moment de la coalescence, ce qui est impossible car le diamètre des étoiles à neutrons est largement inférieur à 100 km.
Il reste l'hypothèse d'une coalescence de deux trous noirs.
Supposons qu'il s'agisse de trous noirs tels qu'ils ont été modélisés sur la base
de la relativité générale et de la métrique de Schwarzschild. Les deux sphères de
1
2
et r2 = 2.k2 = 2. G.m
Schwarzschild ont pour rayons r1 = 2.k1 = 2. G.m
c2
c2 ;
on pourrait penser que la coalescence va se produire pour r = r1 + r2 =
2. G.(mc12+m2 ) = 2. G.m
= 2.k , donc pour x = kr = 2. En réalité, les modèles
c2
numériques basés sur la relativité générale montrent que ces sphères doivent se
déformer sous l'eet de la gravité, comme si elles s'aspiraient mutuellement ;
154
elles commencent à fusionner alors que x est encore légèrement supérieur à 2.
L'étude de l'événement GW150914 publiée par l'équipe de Ligo situe la coalescence à x ≈ 1, 5 rs ≈ 3.k, et donne : m ≈ 65 M (57 M < m < 74 M ) et
d ≈ 410 M pc (230 M pc < d < 570 M pc).
Si nous admettons que la fusion se produit pour 2, 5 < x < 3, notre tableau
donne les encadrements : 58, 9 M < m < 71, 5 M et 384 M pc < d < 550 M pc.
On peut voir que les valeurs sélectionnées comme les plus probables par l'équipe
Ligo se situent bien dans ces deux fourchettes, aussi bien pour la masse que pour
la distance ! Je dois dire que j'ai été très surpris de constater que le raisonnement simpliste que j'ai proposé ici pouvait rejoindre les calculs extrêmement
complexes de la relativité générale. S'agit-il d'une coïncidence fortuite ? Je dois
reconnaître que je ne le sais pas.
Imaginons maintenant que nos deux trous noirs soient des trous noirs sans
horizon, obéissant à la métrique de Ni. Rappelons-nous la section sur les orbites
circulaires : nous avions vu que l'énergie d'un mobile tournant sur une
√ telle
orbite, évaluée par l'observateur distant, est minimale pour r = (3 + 5).k ≈
5, 236.k . Nous ne savons pas à quoi ressemble un trou noir de Ni ; mais il est
à peu près certain qu'une composante essentielle de tous les trous noirs est le
tourbillon qui les entoure (tourbillon appelé "tore d'accrétion" dans le cas des
trous noirs de Schwarzschild). Dans le cas des trous noirs de Ni, nous ne savons pas s'il y a accrétion, ni s'il existe autre chose que ce tourbillon. On peut
penser que les orbites vont s'accumuler autour du rayon d'énergie minimale :
r ≈ 5, 236.k . Si c'est le cas, la fusion de deux trous noirs devrait se produire
pour x ≈ 5, 236.
Reprenons notre tableau. Pour 5 < x < 5, 5, nous avons : 29 M < m <
32, 6 M et 111 M pc < d < 136 M pc.
Entre ces deux hypothèses (trous noirs de Schwarzschild ou de Ni), laquelle
est la plus vraisemblable ? La première possède un atout qui peut sembler décisif : la courbe du signal capté par Ligo correspond très bien à la courbe calculée
selon la relativité générale. Mais la seconde en possède un, elle aussi : l'existence
de trous noirs stellaires d'une quinzaine de masses solaires cadre bien avec le
schéma de l'évolution des étoiles géantes, tel qu'il a été élaboré par les astronomes ; ils pourraient même être assez fréquents. Au contraire, l'existence de
trous noirs stellaires de plus de 30 M serait une surprise qui nécessiterait des
explications.
Mais on peut proposer encore une troisième interprétation de l'événement
GW150914. Dans le document "Métriques de Schwarzschild et de Ni", section
"Orbites circulaires en métrique de Schwarzschild", nous avons vu que la métrique de Schwarzschild, comme celle de Ni, implique √
l'existence d'une orbite
circulaire d'énergie minimale. Son rayon n'est pas (3 + 5).k, mais 6.k. Reprenons donc le tableau ci-dessus. Pour x = 6, nous voyons que m ≈ 26 M et
155
d ≈ 92 M pc. Cette conclusion est parfaitement vraisemblable : des étoiles compactes ("trous noirs stellaires") de 13 masses solaires ont été répertoriés par les
astronomes.
Cette interprétation basée sur la métrique de Schwarzschild, comme la précédente (basée sur la métrique de Ni), suppose une décroissance de l'énergie
orbitale du système (due soit à l'émission d'ondes gravitationnelles, soit à un
autre phénomène dont nous parlerons plus loin). Mais cette décroissance de
l'énergie conduit à une orbite d'énergie minimale.
Quoi qu'il en soit, on peut penser que cette première détection d'une "onde
gravitationnelle" (ou plus exactement d'un changement brusque de potentiel)
ouvrira la voie à une longue série d'observations, qui permettront (entre autres)
de tester les diérentes théories de la gravitation.
56 Les ondes gravitationnelles dissipent-elles de
l'énergie ?
Rappelons que l'étude détaillée du pulsar binaire P SR 1913 + 16, constitué
de deux étoiles à neutrons (l'une étant un pulsar radio, l'autre invisible) très rapprochées, en rotation rapide autour du centre de gravité du système (période :
7,75 h), a permis de déceler une accélération faible mais régulière, qui a pu
être interprétée, indirectement, comme la signature des ondes gravitationnelles.
En eet, cette accélération révèle un rapprochement progressif des deux étoiles,
qu'on interprète comme une perte d'énergie, correspondant à l'énergie rayonnée
sous forme d'ondes gravitationnelles, d'après la théorie d'Einstein. Cette découverte a valu le prix Nobel à Hulse et Taylor en 1993.
Le graphique ci-dessous est présenté comme preuve de cette perte d'énergie.
Sur ce graphique se superposent, d'une part, la courbe observée, montrant
l'avance (au sens où on parle de l'avance d'une horloge) du système P SR 1913+
16 en fonction du temps (telle qu'elle a été établie à partir des mesures eectuées), et, d'autre part, la parabole théorique, calculée sur la base de l'émission
d'ondes gravitationnelles : les deux courbes coïncident d'une manière absolument parfaite !
Cette coïncidence parfaite est de nature à frapper les esprits ; mais n'oublions
pas, d'une part, que la forme parabolique de la courbe signie simplement que
la dérivée dT
dt est constante (autrement dit que la représentation graphique de
la fonction T = f (t) est une droite), et, d'autre part, que la pente de cette
droite peut résulter de plusieurs causes : non seulement l'émission d'ondes gravitationnelles, mais aussi les forces de marées ou l'eet Shklovski, par exemple.
156
Rappelons ce qu'est l'eet Shklovski : c'est une variation de la période apparente
d'un système dont l'accélération radiale (projection du vecteur accélération sur
la ligne de visée) est non nulle. Or il est possible d'estimer l'accélération radiale
galactique d'une étoile ou d'un système, connaissant sa position dans la galaxie,
ainsi que celle de l'observateur. Le calcul utilise la courbe donnant la vitesse
de rotation des étoiles de la galaxie en fonction de la distance au centre, d'où
on déduit le vecteur accélération, qui est en principe dirigé vers le centre. Mais
la densité de matière étant irrégulière, certaines étoiles peuvent subir un eet
Shklovski anormal dû à l'attraction exercée par une structure particulière (bras
galactique par exemple).
Ajoutons que l'observation de la coalescence d'étoiles implique que ces étoiles
se sont rapprochées avant de fusionner, ce qui suppose une perte d'énergie du
système, qui s'explique tout naturellement par l'émission d'ondes gravitationnelles.
Nous voudrions quand même poser cette question (que certains jugeront
dépassée) : n'est-il pas possible d'expliquer l'accélération séculaire des pulsars
binaires sans faire appel à cette dissipation d'énergie par des ondes gravitationnelles ? Plusieurs pistes sont en cours d'étude.
157
57 L'hypothèse du transfert de moment cinétique
Voici donc l'hypothèse que nous avons sélectionnée. Notre calcul va se baser
sur la mécanique newtonienne.
Dans un premier temps, nous allons imaginer, comme dans la section sur les
systèmes doubles dans le cadre newtonien, deux étoiles de centres A et B et de
masses m1 et m2 , tournant autour de leur centre de gravité O sur des orbites
circulaires de rayons r1 et r2 , à la vitesse angulaire ω . On notera r = r1 + r2
la distance qui sépare les deux étoiles ; c'est aussi le rayon de l'orbite du mobile
ctif. Nous notons m la somme des masses : m = m1 + m2 , et m0 la masse du
.m2
. De plus, nous notons R1 et R2 les rayons des deux
mobile ctif : m0 = mm11+m
2
étoiles.
Nous supposons qu'à un instant donné s'exerce au point B une force (vecteur bleu) dirigée vers le point A (donc vers O). Nous justions cette direction
centripète par la conservation de l'énergie.
Dans la gure ci-dessus, les deux étoiles sont supposées ponctuelles, mais
dans la gure suivante nous allons prendre en compte le rayon R2 non nul de
l'étoile de centre B .
On doit comprendre qu'à l'instant où arrive au point B (centre de la seconde
étoile) un message émis par la première étoile (en A), les autres points de la
seconde étoile reçoivent eux aussi des messages ; mais ceux-ci n'ont pas été émis
158
simultanément : les points qui sont plus proches de A reçoivent un message qui
a voyagé un peu moins longtemps, donc qui a été émis un peu plus tard, et ceux
qui sont plus loin de A reçoivent un message qui a voyagé un peu plus longtemps, donc qui a été émis un peu plus tôt. Il en résulte que les points qui sont
plus proches de A vont subir une force qui ne va pas pointer exactement vers
A, mais un peu "à gauche" (les orbites étant parcourues dans le sens direct) ;
les points qui sont plus loin de A vont subir une force qui va pointer un peu "à
droite". Ces forces vont exercer sur la seconde étoile un couple qui va tendre à la
faire tourner sur elle-même, de plus en plus vite, dans le sens direct (donc dans
le même sens que le mouvement orbital). Par conservation du moment cinétique
total, l'accélération du "spin" (rotation de l'étoile sur elle-même) s'accompagne
d'une décélération du mouvement orbital.
Formalisons ce qui vient d'être dit. Soit un point M de la seconde étoile,
situé à la distance AB − x = r − x de A. Par rapport au point B , il reçoit
un message émis un peu plus tard, l'intervalle de temps étant : xc . Pendant ce
temps, le centre des cercles équipotentiels de la première étoile s'est déplacé de
A en Ax , avec AAx = v1 . xc . La force qui s'exerce en M va donc faire avec [BA]
AAx
v1 .x
r1 .ω.x
x
un angle dont la tangente est de l'ordre de : AA
M A ≈ BA ≈ c.r = c.r .
Pour une masse innitésimale dm, le module de cette force est de l'ordre de
, et sa composante tangentielle (perpendiculaire à [BA]) est donc :
G.m1 .dm
r2
G.m1 .dm r1 .ω.x
G.m1 .r1 .ω.x
.
=
.dm.
r2
c.r
c.r3
159
Le moment de cette force tangentielle par rapport à B s'obtient en la multipliant par x, ce qui donne :
G.m1 .r1 .ω.x2
.dm.
c.r3
L'ensemble des points correspondant à une même valeur de x (−R2 < x <
R2 ) est un disque obtenu
en coupant l'étoile par un plan perpendiculaire à
p
[BA] ; son rayon est R22 − x2 , et son aire est π.(R22 − x2 ). Nous allons donc
faire une intégration en découpant l'étoile en tranches d'épaisseur innitésimale
dx et d'aire π.(R22 − x2 ), donc de volume innitésimal : dV = π.(R22 − x2 ).dx.
Nous allons supposer que notre étoile est homogène (de densité constante, du
centre jusqu'à la surface). Si nous notons dm la masse de la tranche de volume
m2
m2
dV , nous pouvons écrire : dm
dV = V = 4 .π.R3 , donc :
3
dm =
2
3.m2 .dV
m2 .dV
m2 .dV
3.m2 .π.(R22 − x2 )
=
= 4
=
.dx ;
3
3
V
4.π.R2
4.π.R23
3 .π.R2
dm =
3.m2 .(R22 − x2 )
.dx.
4.R23
Le moment global des forces qui s'exercent sur cette tranche d'épaisseur dx
est donc :
G.m1 .r1 .ω.x2
G.m1 .r1 .ω.x2 3.m2 .(R22 − x2 )
.dm
=
.
.dx.
c.r3
c.r3
4.R23
Le moment total des forces s'exerçant sur toutes les tranches s'obtient par intégration sur la variable x, variant de −R2 à R2 :
3.G.m1 .m2 .r1 .ω
.
4.c.r3 .R23
Z
R2
−R2
(R22
R
x5 2
3.G.m1 .m2 .r1 .ω R22 .x3
.
−
;
− x ).x .dx =
4.c.r3 .R23
3
5 −R2
2
2
ou encore :
3.G.m1 .m2 .r1 .ω
R25
R25
3.G.m1 .m2 .r1 .ω 4 5
G.m1 .m2 .r1 .R22 .ω
.
2.
=
.
.
−
2.
.R
=
4.c.r3 .R23
3
5
4.c.r3 .R23
15 2
5.c.r3
Appelons µ2 le moment cinétique de l'étoile B (c'est-à-dire de son spin). Sa
dérivée par rapport au temps est égale au moment des forces que nous venons
de calculer :
3.G.m1 .m2 .r1 .ω 4 5
G.m1 .m2 .r1 .R22 .ω
dµ2
=
.
.R
=
.
2
dt
4.c.r3 .R23
15
5.c.r3
Dans la section sur les systèmes binaires en gravitation newtonienne, nous
avons rappelé que rr1 = mm2 , ce qui entraîne :
m1 .r1 =
m1 .m2 .r
= m0 .r.
m
160
La formule précédente devient donc :
dµ2
1 ω G.m2 .m0 2
.R2 .
≈ . .
dt
5 c
r2
De même, pour la première étoile :
dµ1
1 ω G.m1 .m0 2
.R1 .
≈ . .
dt
5 c
r2
Appelons µ le moment cinétique orbital du système, autrement dit le moment
cinétique orbital du mobile ctif ; la conservation du moment cinétique total
impose que :
dµ
=−
dt
dµ1
dµ2
+
dt
dt
1 ω G.m0
≈ − . . 2 .(m1 .R12 + m2 .R22 ).
5 c r
Comme nous souhaitons tester notre formule dans des situations où les orbites sont elliptiques, nous allons compliquer un peu le problème : nous supposons maintenant que r varie, et nous allons reprendre les formules vues dans la
section sur les orbites elliptiques et les lois de Képler.
Sachant que ω =
dθ
dt
, on peut écrire :
1 1 G.m0
dµ ≈ − . . 2 .(m1 .R12 + m2 .R22 ).dθ.
5 c r
p
, où p est le paraRappelons-nous que, pour une orbite elliptique, r = 1+e.cosθ
mètre de l'ellipse, et e son excentricité ; on écrira donc :
1 G.m0
(1 + e.cosθ)2
dµ ≈ − .
.(m1 .R12 + m2 .R22 ).
.dθ.
5 c
p2
Pour un tour d'orbite, on aura :
1 G.m0
∆µ ≈ − .
.(m1 .R12 + m2 .R22 ).
5 c.p2
Z
2π
(1 + e.cosθ)2 .dθ.
θ=0
Comme (1 + e.cosθ)2 = 1 + 2.e.cosθ + e2 .cos2 θ = 1 + 2.e.cosθ + e2 .
on a (1 + e.cosθ) = 1 +
2
Z
2π
2
(1+e.cosθ) .dθ =
θ=0
e2
2
+ 2.e.cosθ +
e2
1+
2
e2
2 cos(2θ)
1+cos(2θ)
2
,
; par conséquent :
2π
2π
e2 1
e2
2π
.θ
+2.e. [sinθ]θ=0 + . .sin(2θ)
= 2π. 1 +
,
2 2
2
θ=0
θ=0
ce qui entraîne :
1 G.m0
e2
2
2
∆µ ≈ − .
.(m1 .R1 + m2 .R2 ).2π. 1 +
.
5 c.p2
2
161
Si on néglige les variations pendant un tour d'orbite, on peut considérer que, à
long terme (sur un nombre susant de tours), µ décroît linéairement en fonction
du temps ; on écrira :
dµ
∆µ
=
;
dt
T
1 G.m0
e2 dt
2
2
.(m
.R
dµ ≈ − .
+
m
.R
).2π.
1
+
. .
1
2
1
2
5 c.p2
2
T
D'autre part, en appliquant la loi des aires à l'orbite du mobile ctif (de masse
m0 ), en notant dA l'aire balayée par le rayon vecteur pendant le temps dt, A
l'aire totale de l'ellipse, a son demi-grand axe, évaluons le moment cinétique µ :
√
2
2
dθ
0 dA
0 A
0 π.a . 1 − e
= 2.m .
= 2.m . = 2.m .
;
µ = m .r .
dt
dt
T
T
1 G.m0
dt
e2
T
dµ
2
2
√
≈− .
. ;
.(m
.R
+
m
.R
).2π.
1
+
.
1
2
1
2
µ
5 c.p2
2
2.m0 .π.a2 . 1 − e2 T
dµ
e2
1 G.(m1 .R12 + m2 .R22 )
√
. 1+
≈− .
.dt.
µ
5
2
c.p2 .a2 . 1 − e2
0
2
Nous savons que p = a.(1 − e2 ) ; on a donc :
2
1 G.(m1 .R12 + m2 .R22 ) 1 + e2
dµ
≈− .
.
5 .dt.
µ
5
c.a4
(1 − e2 ) 2
Nous avons vu, dans la section sur les systèmes doubles en théorie newtonienne,
dµ
que dT
T = 3. µ ; par conséquent :
2
dT
3 G.(m1 .R12 + m2 .R22 ) 1 + e2
≈− .
.
5 .dt,
T
5
c.a4
(1 − e2 ) 2
ou encore :
2
1 + e2 G.T
dT
3
≈ − .(m1 .R12 + m2 .R22 ).
.
5 .
dt
5.c
(1 − e2 ) 2 a4
Dans cette formule, il est possible d'éliminer a, qui est relié à T , m1 et m2 par
2 3
.a
la troisième loi de Képler, appliquée à l'orbite du mobile ctif : T 2 = 4.π
G.m =
1
1
2
4
4
8
2 3
4.π .a
G 3 .m 3 .T 3
, ou encore a4 = G 3 .m 3 8.T 3 , ce qui entraîne :
2
G.(m1 +m2 ) , ou a =
(2.π) 3
(2.π) 3
8
3
8
1
4
5
G.T
(2.π) .G.T
= 4 4 8 = (2.π) 3 .G− 3 .m− 3 .T − 3 .
a4
3
3
3
G .m .T
On a donc :
2
1 + e2
8
4
5
dT
3
− 31
3
≈ − .(m1 .R12 + m2 .R22 ).
.m− 3 .T − 3 ;
5 .(2.π) .G
dt
5.c
(1 − e2 ) 2
162
8
2
1
2
2
dT
3 (2.π) 3 .G− 3 1 + e2
− 31
− 53 m1 .R1 + m2 .R2
≈− .
.
.m
.T
.
.
5
dt
5
c
m1 + m2
(1 − e2 ) 2
On peut écrire aussi :
1
5
1
5 dT
5 c.G 3 (1 − e2 ) 2
m1 .R12 + m2 .R22
≈− .
.
.(m1 + m2 ) 3 .T 3 . .
m1 + m2
3 (2.π) 83 1 + e22
dt
Sachant que c ≈ 3.108 m/s et que G ≈ 6, 67.10−11 m3 .kg −1 .s−2 , on en tire :
5
5 dT
1
m1 .R12 + m2 .R22
(1 − e2 ) 2
.(m1 + m2 ) 3 .T 3 . .
≈ −1510.
e2
m1 + m2
dt
1+ 2
Les masses sont exprimées ici en kg ; mais on peut aussi les exprimer en
masses solaires (M ≈ 2.1030 kg) ; on obtient alors :
5
1
5 dT
(1 − e2 ) 2 1 10
m1 .R12 + m2 .R22
.2 3 .10 .(m1 + m2 ) 3 .T 3 .
;
≈ −1510.
e2
m1 + m2
dt
1+ 2
5
5 dT
1
m1 .R12 + m2 .R22
(1 − e2 ) 2
.(m1 + m2 ) 3 .T 3 . .
≈ −19, 02.1012 .
2
e
m1 + m2
dt
1+ 2
Rappelons que nous avons supposé que la matière était répartie uniformément à l'intérieur des étoiles, ce qui est faux : en réalité, la densité est plus
forte vers le centre. On peut donc dire que nous avons raisonné sur un rayon
ctif : c'est le rayon de la sphère dans laquelle il faudrait répartir la matière
uniformément pour obtenir la même accélération séculaire. Ce rayon ctif est
inférieur au rayon réel.
2
2
1 +m2 .R2
Appelons "rayon caractéristique" le nombre Rc déni par Rc2 = m1 .R
;
m1 +m2
c'est la moyenne quadratique pondérée des deux rayons ctifs. Ce rayon caractéristique détermine l'ecacité du ralentissement séculaire du système.
On a alors :
21
5
1
5
(1 − e2 ) 4
12 dT
6
6
Rc ≈ 4, 36.
. −10 .
.
1 .(m1 + m2 ) .T
2
dt
1 + e2 2
Prenons le problème à l'envers, et utilisons cette formule pour calculer Rc
dans le cas de quelques systèmes binaires.
Dans le tableau qui suit, les quatre premiers systèmes sont composés de deux
étoiles à neutrons (visibles ou non comme pulsars), le cinquième et le sixième
comprennent une étoile à neutrons et une naine blanche, le dernier est composé
de deux naines blanches.
163
système
PSR B1913+16
PSR B1534+12
PSR J0737-3039
PSR J1141-6545
PSR J0348+0432
PSR J0751+1807
WD J0651+2844
m1 (M )
1,44
1,33
1,34
1,30
2,03
1,34
0,26
m2 (M )
1,39
1,35
1,25
0,99
0,172
0,138
0,5
e
0,6
0,27
0
0,2
0
0
0
T (s)
27900
36300
8820
17040
8856
21600
765
−1012 . dT
dt
2,4
0,137
1,25
0,4
0,26
0,033
9,8
Rc (km)
21,3
12
11
10,6
4,9
3,4
3,25
On estime généralement que le rayon des étoiles à neutrons est de l'ordre de
10 à 20 km ; en supposant que la gravité soit équilibrée par la pression d'un gaz
parfait de neutrons dégénérés, on propose parfois
q la formule approximative suivante, pour une étoile de masse m : R ≈ 16. 3 Mm (en km). Pour m = 1, 4.M ,
on obtient : R ≈ 14, 3 km. Un calcul plus sophistiqué (mais peu able, car
l'équation d'état du gaz de neutrons est encore mal connue) suggère un rayon
équatorial compris entre 12, 5 et 17 km environ, selon la vitesse de rotation de
l'étoile. Pour comparaison, remarquons que, selon les estimations les plus récentes, le pulsar qui se trouve dans le système P SR J0348 + 0432 aurait une
masse de 2.M et un rayon de 13 ± 2 km ; en admettant que le rayon soit bien
inversement proportionnel à la racine cubique de la masse, on retrouve, pour
une masse de 1, 4.M , l'encadrement 12, 5 km < R < 17 km. Mais, comptetenu du fait que la densité des étoiles à neutrons est plus forte vers le centre
qu'à la surface, nous nous attendons à obtenir un rayon caractéristique un peu
inférieur au rayon réel. Les résultats obtenus pour le deuxième, le troisième et le
quatrième couples (12 km, 11 km, 10, 6 km) correspondent bien à notre attente,
tandis que le premier (21, 3 km) est nettement trop élevé, ce qui nous incite à
poser la question : l'accélération du système P SR B1913 + 16 ne serait-elle pas
brouillée par un eet Shklovski galactique anormal ? Or il se trouve qu'une cause
possible de cette anomalie peut être facilement identiée : il s'agit d'une importante concentration de matière interstellaire (le bras d'Ophiucus) située juste
derrière le pulsar binaire, selon la ligne de visée. Il est malheureusement très
dicile d'évaluer les forces gravitationnelles éventuelles qui pourraient s'exercer
sur le pulsar.
Pour les spécialistes, c'est plutôt l'avant-dernier couple (P SR J0751 + 1807)
qui serait aecté par l'eet Shklovski. Laissons donc ce système de côté.
Intéressons-nous plutôt au dernier couple : W D J0651 + 2844, formé de
deux naines blanches très rapprochées et tournant autour de leur centre de
gravité commun à plus de 600 km.s−1 , en s'éclipsant mutuellement à intervalles réguliers. Les astronomes ont pu évaluer les rayons de ces deux étoiles :
R1 ≈ 26 000 km et R2 ≈ 9 700 km. Notre modèle, qui annonce un rayon caractéristique de l'ordre de 2 à 3 km, est donc pris en défaut ! En eet, il prévoit,
164
semble-t-il, une accélération du système beaucoup plus importante que celle qui
a été mesurée. Pourquoi notre calcul donne-t-il un rayon caractéristique raisonnable pour les couples formés de deux étoiles à neutrons, et beaucoup trop
faible pour les couples comprenant des naines blanches ? Une explication peut
être proposée : l'eet de marée, négligeable dans le cas des étoiles à neutrons,
devient prépondérant chez les naines blanches, ce qui fait que le spin ne peut
pas accélérer librement. On peut préciser ce phénomène : les astrophysiciens admettent que les naines blanches tournant sur des orbites serrées calent leur spin
sur leur période orbitale, de sorte qu'elles présentent toujours la même face l'une
à l'autre, comme la Lune par rapport à la Terre. Elles sont fortement déformées
par deux bourrelets de marée opposés. Si l'axe de ces bourrelets forme un angle
avec l'axe AB joignant les centres des deux étoiles, l'attraction exercée par
chaque étoiles sur les bourrelets de l'autre va générer un couple proportionnel
à sin . Il existe une valeur précise de pour laquelle ce couple annule exactement le couple décrit précédemment (le couple d'attraction diérentielle dû à la
vitesse nie de propagation de la gravité). L'angle va donc se caler sur cette
position d'équilibre. Chez les étoiles à neutrons, au contraire, les bourrelets de
marée sont à peu près nuls, de sorte que, quel que soit , le couple qui leur est
associé ne pourra jamais équilibrer le couple d'attraction diérentielle que nous
venons de décrire.
Cette hypothèse, basée sur le couple d'attraction diérentielle dû à la vitesse
nie de propagation de la gravité, est fragile, car elle se base sur un comportement bien particulier de la force d'attraction. Malgré cette incertitude sur des
options fondamentales, nous avons choisi de présenter quand même ce calcul,
car les rayons caractéristiques obtenus par cette méthode se rapprochent de manière frappante des valeurs attendues.
Pour le moment, il semble dicile de proposer une explication solide et chiffrée de l'accélération séculaire des pulsars et des naines blanches binaires, pouvant rivaliser avec l'explication classique. Pour la majorité des astronophysiciens,
l'interprétation la plus vraisemblable, et la mieux documentée, de l'accélération
séculaire, reste celle qui se base sur des ondes gravitationnelles consommatrices
d'énergie. Au cas ou les observations futures conrmeraient cette interprétation, il resterait à déterminer sous quelle forme cette énergie est stockée ; car,
pour la physique moderne (centrée sur la physique quantique), toutes les formes
d'énergie s'insèrent dans le cadre déterminé par les particules élémentaires et
leurs relations par l'intermédiaire des forces fondamentales ; mais la déformation
d'une entité abstraite appelée espace-temps n'entre pas, pour le moment, dans
ce cadre. Les ondes gravitationnelles sont un sujet sensible sur lequel l'accord
entre les idées classiques d'Einstein et celles de la mécanique quantique est loin
d'être réalisé.
Inversement, au cas où les observations futures s'écarteraient des prévisions
basées sur la relativité générale, il serait intéressant d'explorer de manière plus
approfondie la piste que nous venons de proposer. Rappelons qu'elle se base sur
165
l'hypothèse des surfaces équipotentielles sphériques concentriques, avec transmission du message gravitationnel à la vitesse de la lumière.
58 Qu'est-ce que l'eet Lense-Thirring ?
L'eet Lense-Thirring (entraînement des référentiels, "frame-dragging" en
Anglais) est un phénomène encore mal connu, qui découle, mathématiquement,
de la relativité générale, même s'il semble, à première vue, contredire les principes qui ont présidé à son élaboration.
Cet eet me semble plus facile à comprendre grâce à l'éclairage apporté par
la métrique de Ni, et surtout par la notion d'"immobilité gravitationnelle", telle
que nous l'avons dénie précédemment. Pour un observateur gravitationnellement immobile, le champ (en termes de quadrivecteurs d'entraînement) produit
par l'ensemble de l'univers est de la forme a.e~0 (a > 0) ; le quadrivecteur produit
w
~
par un corps M donné est b.e c , avec b = Gm
r 2 . En supposant que ces quadrivec~
W
w
~
teurs soient additifs, la résultante sera a.e~0 + b.e c = A.e c . On peut facilement
~
~
~ , puisque A.ch W = a + b.ch w~ et A.sh W = b.sh w~ :
calculer A et W
c
c
c
c
2
A =
~
W
A.ch
c
!2
−
~
W
A.sh
c
!2
=
a + b.ch
w
~
c
2
2
w
~
− b.sh
;
c
w
~
A2 = a2 + b2 + 2ab.ch ;
c
r
w
~
A = a2 + b2 + 2ab.ch ;
c
~
~
~
sh W
b.sh w~c
V
W
c
= th
=
=
.
~
c
c
a + b.ch w~c
ch W
c
Ce vecteur V~ correspond à l'entraînement des référentiels par le corps M considéré.
w
~
w
~
~
v
c
Si |b| >> |a|, on a : V~c ≈ b.sh
~ = th c = c . Ceci signie que, si le corps
b.ch w
c
M est isolé dans l'univers (a = 0), alors tous les repères inertiels subissent un
entraînement égal à la vitesse ~v du corps M ; autrement dit, ce corps, à lui
seul, dénit l'immobilité gravitationnelle dans l'ensemble de l'univers. Ceci est
conforme au principe de Mach, selon lequel un corps isolé dans l'univers est
nécessairement immobile.
Si, au contraire, a 6= 0, on aura (pour r assez grand) : |b| = Gm
r 2 << |a|,
~
~
~
b.sh w
Gm sh w
V
c
c
donc c ≈ a = r2 .|a| . L'entraînement tend très vite vers ~0 quand r croît.
166
(Bien sûr, quand r tend vers 0, |b| devient supérieur à |a|, donc, comme précédemment, V~ tend vers ~v .)
Un cas particulièrement intéressant à étudier est celui où |b| n'est pas négligeable par rapport à |a|. Ceci pourra se produire soit près de la surface d'un
astre particulièrement compact ("trou noir", étoile à neutrons), soit à l'intérieur
d'une galaxie ou d'un amas globulaire, où l'action gravitationnelle des étoiles
"proches" peut éventuellement égaler ou dépasser celle de l'ensemble des astres
lointains (autres galaxies).
Récemment (en mai 2011), après des mois de travail, destinés à identier et
à éliminer les bruits parasites, ont été publiés les résultats de l'expérience Gravity Probe B, qui semblent mettre en évidence (sous réserve de conrmation,
car les discussions ne sont pas closes) l'eet Lense-Thirring, dans un cas un peu
particulier : il s'agit d'un "eet Lense-Thirring diérentiel". Cette expérience
était basée sur l'idée suivante : lorsqu'un satellite (comme Gravity Probe B)
tourne autour de la Terre, à une altitude modérée, la face de la Terre tournée
vers le satellite est nettement plus proche que la face opposée, et son attraction est donc beaucoup plus forte. Donc il n'est plus possible de considérer la
totalité de la masse terrestre concentrée en un point, comme nous l'avons fait
dans le cas du Soleil et de son système planétaire : il faut considérer que chaque
partie élémentaire (dm) de la masse terrestre produit à la fois un potentiel gravitationnel et un entraînement du référentiel. On fait appel au calcul intégral
pour reconstituer l'eet global. L'entraînement dû aux parties les plus proches
(à l'aplomb, sous le satellite) l'emporte sur l'entraînement dû aux parties les
plus éloignées (aux antipodes). L'entraînement résultant se fait dans le sens de
la rotation de la Terre ; mais il décroît très vite avec la distance, et s'annule à
l'inni. L'entraînement diérentiel (qui s'exerce plus fortement sur la partie du
satellite qui est la plus proche du sol) produit un couple qui est susceptible de
faire tourner un gyroscope (l'eet étant proportionnel à la dérivée de l'entraînement par rapport à la distance). C'est de cette façon que l'eet Lense-Thirring
a été testé par Gravity Probe B. Mais on pourrait imaginer de le tester plus
directement, par exemple par une étude ne de l'eet Shapiro, qui doit être
légèrement dissymétrique dans le cas d'un corps en rotation rapide.
Retenons que la notion d'entraînement des référentiels découle très naturellement des idées qui sont à l'origine de notre étude ; notre façon de la présenter
laisse entendre qu'il pourrait exister non seulement un "eet Lense-Thirring
diérentiel" (celui qui a été testé par Gravity Probe B), mais aussi un "eet
Lense-Thirring intégral", dont nous allons reparler au sujet de la rotation des
galaxies.
L'eet Lense-Thirring se situe à la limite des possibilités techniques actuelles,
mais on peut penser que, dans l'avenir, il sera une clé essentielle dans l'étude
de la gravitation.
167
59 La matière noire existe-t-elle ?
A l'origine, le problème de la matière noire a été soulevé par l'étude de la
courbe de rotation des galaxies. On peut, en première approximation, modéliser
une galaxie spirale comme un disque en rotation, formé d'étoiles tournant toutes
sur des orbites circulaires, à une vitesse variable selon la distance au centre. La
mesure de la vitesse des étoiles se fait par eet Doppler. On s'aperçoit que la
vitesse angulaire est constante (donc que la vitesse linéaire est proportionnelle à
la distance au centre), à partir du centre de la galaxie jusqu'à une distance critique. On peut donc dire qu'une grande partie de la galaxie tourne à la manière
d'un solide. Au-delà de la distance critique, la vitesse angulaire décroît, mais
la vitesse linéaire, elle, décroît très peu, et se stabilise. D'autre part, l'étude du
nombre, de la nature et de la répartition des étoiles visibles permet une première
évaluation de la masse en fonction de la distance au centre. Cette évaluation
est ensuite anée en prenant en compte le "trou noir" central de la galaxie,
les nuages de gaz et de poussières, les étoiles mortes, planètes, corps de toutes
sortes, pour la plupart invisibles, dont la présence est certaine, mais dont l'abondance est dicile à estimer. Ensuite, on calcule, selon les lois de la gravitation,
la courbe de rotation théorique de la galaxie, puis on la compare à la courbe
mesurée. On constate alors que les deux courbes sont bien diérentes ; entre
autres diérences, la courbe calculée montre une décroissance très rapide de la
vitesse linéaire au-delà de la distance critique. Et lorsqu'on cherche à expliquer
ce décalage, une remarque s'impose tout naturellement : la courbe calculée se
rapprocherait beaucoup plus de la courbe mesurée si on supposait que la masse
évaluée a été très fortement sous-estimée. Et la même conclusion revient pour
toutes les galaxies étudiées ! Et pas seulement pour les galaxies : l'étude des
amas globulaires montre aussi des anomalies de même nature.
Les astronomes ont passé en revue et estimé le plus précisément possible tous
les oublis pouvant expliquer cette sous-évaluation de la masse totale, et, tous
les calculs ayant été refaits, ils ont été obligés de conrmer qu'il y a bien une
masse manquante, actuellement évaluée à 80% de la masse totale de l'univers
(soit quatre fois plus que la matière "conventionnelle") !
De nombreuses hypothèses ont été formulées pour expliquer cette masse manquante, par exemple l'existence de particules massives inconnues interagissant
peu avec la matière ordinaire (WIMP : weakly interacting massive particles).
La théorie MOND a également été imaginée pour résoudre ce problème : cette
théorie de la gravitation suppose que l'attraction est en r12 pour des distances
modérées (dans le système solaire par exemple), en 1r au-delà.
La rotation des galaxies est un phénomène complexe : il est possible que des
explications très diverses contiennent une part de vérité. Mais, dans le cadre du
168
travail qui nous occupe, il y en a une qu'il me semble intéressant de mettre en
avant : c'est le rôle de l'entraînement des référentiels (eet Lense-Thirring).
Dans la partie centrale de la galaxie, qui tourne comme un solide, les référentiels inertiels ("gravitationnellement immobiles") doivent tourner aussi !
Pourquoi ? L'explication est simple. Plaçons-nous en un point P quelconque à
l'intérieur d'une galaxie. En ce point s'exerce l'inuence d'un grand nombre
d'étoiles
ei , dont la résultante est le quadrivecteur
d'entraînement global :
P
w
~i
w
~i
w
~
w
~
x
.
ch
+
sh
=
x.
ch
+
sh
.
Précisons
que
x.ch w~c est la compoi
i
c
c
c
c
w
~
sante "énergie" (scalaire) de ce quadrivecteur, et x.sh c sa composante "impulsion" (vecteur à 3 dimensions). On peut penser que c'est la contribution gravitationnelle des étoiles proches qui doit être dominante au point P . Si les positions
et les vitesses de ces étoiles étaient réparties aléatoirement par rapport à P , la
somme vectorielle ("impulsion") x.sh w~c devrait s'annuler. Mais les mouvements
des étoiles dans la galaxie sont ordonnés, et les vitesses des étoiles proches sont
orientées sensiblement dans la même direction. Pour cette raison, au point P ,
la composante "impulsion" du quadrivecteur d'entraînement ne s'annule pas :
les repères dits "gravitationnellement immobiles" tournent dans le même sens
que les étoiles proches, mais moins vite, en raison du "contre-entraînement" dû
aux étoiles lointaines et, plus particulièrement, à celles du bulbe galactique.
Il en résulte que, par rapport à leurs repères inertiels locaux, les étoiles
tournent moins vite que ne pourrait le croire un observateur situé loin de cette
galaxie ! Si cette déduction est exacte, alors la force centrifuge générée par leur
mouvement orbital autour du centre galactique pourrait avoir été surestimée par
les observateurs distants (car le calcul des orbites doit se faire dans un repère
inertiel local, et non dans un repère inertiel lié à l'observateur) ; par conséquent,
la force centripète due à la gravité (qui est équivalente à la précédente, mais
de sens contraire) a dû être sous-estimée dans les mêmes proportions. On peut
remarquer aussi que la période T est sous-estimée par l'observateur distant :
quand il croit qu'une étoile a fait un tour complet, les observateurs locaux, qui
sont aectés par l'entraînement des référentiels, estiment qu'elle n'en a parcouru
2 3
.a
qu'une fraction. D'après la formule keplerienne T 2 = 4.π
G.M , on voit clairement
que le fait de sous-estimer la période T équivaut à surestimer la masse M . Il se
pourrait donc que la masse manquante, invoquée pour expliquer les orbites des
étoiles à l'intérieur des galaxies, ne soit plus nécessaire...
Résumons la situation actuelle, concernant le problème de la matière noire :
de très nombreuses observations concordantes montrent que les mouvements des
astres ne peuvent pas s'expliquer, dans le cadre xé par la relativité générale,
sans faire appel à une "masse manquante" considérable. Mais les recherches
n'ont pas permis d'identier cette masse manquante. En particulier, l'hypothèse de particules inconnues très massives et peu interactives (WIMP) semble
de moins en moins vraisemblable : des programmes de recherche ciblée, menés
dans les grands accélérateurs de particules, sont restés sans résultat. D'autre
169
part, la conrmation de la loi empirique de Tully-Fisher, étendue à des classes
très diverses de galaxies, semble contredire l'existence de cette masse manquante.
Bien sûr, il est possible d'adapter la relativité générale de manière ad hoc pour
résoudre ce problème, partiellement ou totalement : c'est ce que fait la théorie
MOND, qui se base sur une loi d'attracion modiée. Mais il se pourrait que la
prise en compte du quadrivecteur d'entraînement, que j'ai introduit pour des
raisons qui sont loin d'être gratuites, suse à apporter un éclairage nouveau sur
la rotation des galaxies, et donc sur la matière noire.
60 La gravitation est-elle la clé de la cosmologie ?
Après avoir publié les équations de la relativité générale, Einstein a tenté de
les utiliser pour décrire la structure globale de l'univers, supposé homogène et
isotrope. Comme il croyait que l'univers était statique, il avait cru bon d'introduire sa fameuse constante cosmologique pour garantir cette stabilité.
D'autre part, De Sitter, travaillant sur un modèle d'univers vide, remarque
qu'il est nécessairement instable.
La découverte de la fuite des galaxies, par Hubble, intervient à cette époque.
Einstein comprend alors que l'invention de la constante cosmologique n'était
pas utile : "c'est la plus grande erreur de ma vie", dira-t-il. Avant même d'être
découverte, l'expansion de l'univers était déjà potentiellement présente dans les
équations de la relativité générale !
Enn, Friedmann, Robertson et Walker, s'inspirant de la théorie de l'atome
primitif de Georges Lemaître, mettent au point le modèle standard homogène,
qui a longtemps fait référence en tant que modèle cosmologique basé sur la relativité générale. Son postulat fondamental est l'homogénéité : l'univers doit être
globalement identique, quel que soit l'observateur choisi.
Selon ce modèle, les galaxies sont immobiles (on pourrait dire : gravitationnellement immobiles - tiens, la relativité générale, elle aussi, admet cette notion...), et l'expansion de l'univers résulte d'une dilatation continue de l'espace
(on pourrait dire, en utilisant notre vocabulaire, qu'il y a une création continue
d'espace). Donc la vitesse de récession des galaxies n'est pas une vraie vitesse :
la vitesse locale de chaque galaxie est supposée nulle ; il en résulte que cette
vitesse de récession peut très bien dépasser la vitesse de la lumière, sans qu'il y
ait violation de la relativité restreinte. Cette expansion n'est pas expliquée (en
tant que phénomène physique), mais son évolution est calculée, en fonction de
la densité de matière (supposée identique en tout point) ; car la gravité freine
l'expansion. Quelle que soit la valeur attribuée à cette densité, l'expansion débute par une phase ponctuelle (le big bang) ; à cet instant, le taux d'expansion
est inni. Ensuite, il diminue. Si la densité de matière est susante, l'expan170
sion nit par s'arrêter, et l'univers commence alors à se contracter, jusqu'au big
crunch. Si elle est insusante, l'expansion est innie.
Cette théorie a remporté des succès retentissants, dont les plus connus sont
la découverte du fond dius à 2, 7 K , ou rayonnement cosmologique fossile
(datant, selon la théorie, de l'époque où les particules se sont combinées en
atomes), et l'explication de la nucléosynthèse primordiale. Mais je voudrais rappeler quelques problèmes majeurs.
Ce modèle du big bang peut s'étudier de deux façons : la première consiste à
observer l'univers qui nous entoure, tel qu'il est, et à essayer de reconstituer son
histoire, en remontant dans le passé, de proche en proche, en se basant sur les
lois connues de la physique ; la seconde consiste à partir de l'instant zéro, et à
imaginer le scénario qui a pu conduire à l'univers que nous voyons aujourd'hui.
Le problème essentiel, c'est que ces deux approches ne se rencontrent pas. Plus
exactement, si on veut les obliger à se rencontrer, il faut imaginer une astuce
ad hoc ; cette astuce s'appelle : l'ination. L'ination est une phase très courte
de l'expansion de l'univers, peu après le big bang, pendant laquelle son rayon
aurait été multiplié brutalement par un facteur considérable : 1026 selon certains
théoriciens, 101 000 000 pour d'autres... Cette ination se serait même propagée
à une vitesse supérieure à celle de la lumière ! La nécessité de faire appel à
cette notion a considérablement aaibli la pertinence du modèle de FriedmannRobertson-Walker, qui avait été considéré un peu vite comme l'explication de
tout...
Voyons d'un peu plus près où se situe l'origine du problème. Le modèle standard homogène prévoit l'existence d'un horizon des événements : les galaxies situées au-delà ne sont pas visibles, car leur lumière, en principe, n'a pas encore eu
le temps de nous parvenir. Autrement dit, les premiers âges de l'univers doivent
être masqués. Cet horizon recule, c'est-à-dire que la partie visible de l'univers
(en pourcentage) augmente au cours du temps, de 0% au moment du big bang,
jusqu'à 100% à la "maturité" ; d'autre part, le taux d'expansion de l'univers,
inni au début, s'annule à la maturité. Mais les astronomes ont pu observer
des galaxies vieilles de près de 13 milliards d'années, alors que l'âge de l'univers
prévu par la théorie est 13, 7 milliards d'années. De plus, nous recevons actuellement le rayonnement dit cosmologique (fond dius à 2, 7 K ), émis, en principe,
en l'an 380 000, ce qui signie que le pourcentage de l'univers qui est aujourd'hui
accessible à l'observation serait supérieur à 99, 997%. Nous serions donc très près
de l'âge de maturité, et pourtant l'expansion continue ! Ceci conduit à douter de
l'existence de cet horizon prévu par la théorie ! (Au sujet de l'horizon, on pourra
lire la page de Christian Magnan : http://www.lacosmo.com/horizon.fr.html.)
De plus, dans ce modèle, le taux d'expansion étant inni à l'instant du big
bang, deux points quelconques A et B , même très proches, ne peuvent pas communiquer : un message (rayon lumineux par exemple) envoyé par A en direction
de B ne pourra atteindre son but que très longtemps après ; ceci vient du fait que
171
le taux d'expansion, dans les premiers temps, était si élevé que même la lumière
ne pouvait pas lutter "contre le courant" ! Par conséquent, ces deux points sont
causalement déconnectés à l'origine : ils s'ignorent ; ils se reconnectent lorsque
la lumière émise par A nit par atteindre B , et réciproquement ; autrement dit,
lorsque l'horizon de A rattrape B , et réciproquement ; ce qui suppose un ralentissement susant du taux d'expansion. Ceci a pour conséquence que l'univers,
dans sa jeunesse, n'a pas pu s'homogénéiser, car les échanges étaient impossibles.
Or, l'observation de l'univers lointain (galaxies primitives) et du rayonnement
cosmologique à 2, 7 K montrent, au contraire, que l'univers observable était très
homogène, il y a plus 13 milliards d'années... Pour cette raison, les astronomes
ont récusé l'idée d'un taux d'expansion inni à l'origine : ce taux aurait été
nul ou très faible au moment du big bang, permettant l'homogénéisation de
l'ensemble ; mais alors il a fallu ensuite une phase d'expansion très rapide pour
rattraper le retard et recoller au scénario mis au point par les astronomes...
C'est cette phase qu'on nomme l'ination.
On dit souvent que l'observation des galaxies lointaines, et du rayonnement
cosmologique, conrme l'ination : il serait plus exact de dire qu'elle inrme
le modèle homogène standard de Friedmann, Robertson et Walker ! En eet,
lorsqu'on étudie les premiers instants de l'histoire de l'univers, peu après le big
bang, ce modèle n'est plus du tout pertinent, comme si ces premiers instants
obéissaient à la mécanique quantique, et non à la gravitation.
La relativité générale est impuissante à décrire les premiers instants de l'univers, mais explique-t-elle correctement la suite des événements ? Il se trouve que,
là encore, elle est en diculté, pour plusieurs raisons ; je vais en développer deux.
61 Pourquoi l'univers est-il globalement plat ?
Selon le modèle de Friedman, basé sur les équations de la relativité générale,
la courbure de l'univers (supposé homogène et isotrope) est directement déterminée par la densité de la matière (ou de l'énergie) qu'il contient. Pendant une
grande partie du vingtième siècle, on a fait une conance totale à ce modèle,
considéré comme la seule cosmologie relativiste possible. Il est instructif de relire
ce qu'écrivaient les astronomes et cosmologistes dans les années 1960-1970 : ils
étaient certains que la mesure de cette densité allait permettre assez rapidement
de déterminer les caractéristiques essentielles de l'univers.
Plus récemment, l'étude globale de l'univers visible, à très grande échelle, a
fait des progrès considérables. Les évaluations de la courbure de l'univers s'entêtent à converger de plus en plus vers une courbure nulle. Ceci ne contredit
pas la relativité générale, mais contribue à la marginaliser. En eet, pour le
modèle de Friedmann, Robertson et Walker, un univers plat est possible, mais
hautement improbable : la densité de matière doit être rigoureusement égale
172
à une valeur critique, au-delà de laquelle l'univers est sphérique, et en-deçà de
laquelle il est hyperbolique. Malheureusement, la densité de matière conventionnelle ("matière baryonique"), mesurée, elle aussi, avec une précision croissante,
est très inférieure à cette valeur critique, ce qui ne conduit pas, à priori, à un
univers plat ! Si on prend en compte l'hypothétique "matière noire" (voir la section sur ce sujet), alors, au contraire, on dépasse de beaucoup cette valeur ! Et
plus encore si on fait intervenir l'"énergie sombre", ou l'"énergie du vide"... A
l'heure actuelle, le fait que l'univers soit plat à grande échelle reste incompréhensible dans le cadre de la relativité générale.
En métrique de Ni, au contraire, l'explication est évidente. A partir du moment où on admet que la courbure est régie par un quadrivecteur ayant une
signication physique (le quadrivecteur d'entraînement, dont découle la pseudoaccélération), il est clair qu'une répartition uniforme de la matière annule ce
quadrivecteur, et donc aussi la courbure. Ceci résulte des règles élémentaires de
composition des (quadri-)vecteurs. On pourrait dire aussi que le potentiel est
identique en tout point ; comme ce sont les diérences de potentiel qui créent
des distorsions, un potentiel constant annule toute distorsion.
La particularité de la relativité générale, c'est que la courbure intrinsèque
est régie directement par la densité de matière, et non par l'intermédiaire d'un
(quadri-)vecteur. Si l'univers est homogène, la densité est identique en tout
point, et donc la courbure aussi, ce qui conduit naturellement à un univers
sphérique ou hyperbolique.
62 L'énergie sombre existe-t-elle ?
Rappelons l'origine de l'idée d'une "énergie sombre" : les supernovæ de type
Ia sont considérées comme des chandelles standards, car leur luminosité absolue, d'après la théorie en vigueur, est constante ; la mesure de leur luminosité
apparente permet donc d'évaluer leur distance, et par suite, celle des galaxies
dans lesquelles elles apparaissent. Par ailleurs, la distance de ces galaxies peut
être évaluée par leur décalage vers le rouge, en s'appuyant sur la loi de Hubble,
qui dit que la vitesse de récession des galaxies est proportionnelle à leur distance. Mais lorsqu'on compare les distances galactiques évaluées par ces deux
méthodes, on constate une diérence, petite mais systématique.
Pour résoudre ce problème, il a fallu corriger la loi de Hubble : la vitesse de
récession des galaxies n'est pas proportionnelle à leur distance, donc la vitesse
d'expansion de l'univers n'est pas rigoureusement constante.
La théorie du big bang , sous la forme du modèle standard homogène, prévoyait un ralentissement de cette expansion : en eet, les forces gravitationnelles,
tout naturellement, doivent la freiner. Mais l'observation a prouvé le contraire :
173
l'expansion semble accélérer. Il a fallu alors imaginer un "moteur" responsable
de cette accélération : c'est l'énergie sombre, qui représenterait 74% de l'énergie présente dans l'univers ... Ce qui signie que les trois-quarts de l'énergie de
l'univers seraient de nature complètement inconnue ! C'est un véritable séisme
pour les tenants du modèle standard homogène ! Mais nous allons voir un peu
plus loin qu'il est possible d'interpréter ces observations de diérentes manières...
Le modèle idéal de Friedmann-Lemaître-Robertson-Walker, basé intégralement sur la relativité générale, est évidemment faux : ceci est prouvé d'abord
par la nécessité de faire appel au phénomène d'ination (qui contredit la régularité de l'expansion, qui est la base du modèle), ensuite par le fait que l'expansion semble accélérer (alors que le modèle prévoyait un ralentissement). Qu'un
modèle mathématique idéal décrive mal la réalité, quoi de plus normal ? Des
tentatives ont été faites pour le corriger. D'une part, les physiciens relativistes
se déclarent incompétents pour décrire l'instant du big bang et la phase d'ination, et se tournent vers les physiciens des quanta pour les charger de cette
question ; ceux-ci s'adressent aux théoriciens des cordes pour leur demander de
faire un eort... D'autre part, en réintroduisant une constante cosmologique ad
hoc, ils tentent de justier l'accélération de l'expansion, sans l'expliquer vraiment : ce retour de la constante cosmologique d'Einstein semble signier que
le comportement de l'univers à grande échelle n'est pas dicté uniquement par
la gravitation... On avait cru d'abord que l'expansion de l'univers pouvait être
expliquée intégralement par la relativité générale ; on comprend aujourd'hui que
cette théorie n'explique pas les phénomènes essentiels.
Reprenons ces questions avec l'éclairage que nous fournissent les sections
précédentes ; amusons-nous (comme ils l'ont fait avant nous) à inventer un modèle mathématique simple et "homogène" basé sur cette idée (dans le cadre de
la métrique de Ni, bien sûr). Tous les observateurs considérés seront supposés
gravitationnellement immobiles, et situés dans un même potentiel ; leurs règles
et leurs horloges ne subiront aucune distorsion gravitationnelle.
Dans un premier temps, nous allons partir de la loi de Hubble usuelle, que
nous écrirons sous la forme :
~v = H.~l.
On pourra imaginer que l'observateur se trouve dans une galaxie A, et observe
~ ; bien sûr, ~v est la vitesse de récession de B ,
une galaxie B telle que : ~l = AB
mesurée par A.
Comme la galaxie B est gravitationnellement immobile, il va de soi que la
vitesse ~v ne peut pas être considérée comme une constante liée à cette galaxie ;
elle ne peut être liée qu'à la distance ; et puisque la distance de la galaxie varie,
sa vitesse de récession varie aussi. En module, on aura donc :
v=
dl
= H.l ;
dt
174
dl
= H.dt ;
l
d (Log l) = H.dt ;
Log l − Log l0 = H.(t − t0 ) (où l0 est la distance à un instant t0 donné) ;
l
= eH(t−t0 ) ;
l0
l = l0 .eH(t−t0 ) .
Nous obtenons, évidemment, une croissance exponentielle de la distance de la
galaxie en fonction du temps ; ce qui est bien normal, puisque nous avons supposé que "l'espace crée de l'espace", et ceci à un taux constant, comme le montre
dl
= H.l ; pendant une durée donnée dt, l'accroissement dl d'une
bien l'égalité : dt
longueur quelconque l est proportionnel à l.
Par conséquent, la galaxie B va s'éloigner de plus en plus vite ; ceci ne
contredit pas ce qui a été dit auparavant, puisque :
d eH(t−t0 )
dl
v=
=
= H.eH(t−t0 ) = H.l.
dt
dt
Si nous remontons dans le passé, il faudra faire tendre t vers −∞ pour que
la distance tende vers 0. Ceci signie qu'il n'y a pas d'instant origine : le big
bang est rejeté, pour ainsi dire, à l'inni dans le passé ; il n'y a plus de singularité. Les explications usuelles de la nucléosynthèse primordiale et du fond dius
cosmologique restent valables. De plus, l'univers, ayant passé un temps "inni"
(peut-être seulement : long ?) dans un état très condensé, a eu tout le temps
nécessaire pour s'homogénéiser.
Dans un tel modèle d'univers, un observateur pourra voir toutes les galaxies
jusqu'à ce qu'elles franchissent un horizon sphérique et immobile ; au-delà, elles
fuient trop vite pour que leur lumière puisse lui parvenir.
Sous cette forme, ce modèle est nécessairement faux, puisque, par hypothèse,
il prévoit une vitesse de récession rigoureusement proportionnelle à la distance :
dv
dl = H , quelle que soit la distance. Nous savons que ceci n'est pas conrmé par
les supernovæ de type Ia : elles montrent que la loi de Hubble n'est pas suivie
de manière aussi stricte dans la réalité.
Mais il y a une autre diculté, qui se manifeste lorsqu'on veut changer de
repère. En eet, nous venons d'utiliser la loi de Hubble sous sa forme usuelle :
~v = H.~l ; pour l'observateur A, cette formule décrit un champ de vitesses, de
structure particulièrement simple. Mais, si nous changeons de repère (en changeant de galaxie de référence), cette structure ne se conserve pas, car les vitesses
ne sont pas additives en relativité restreinte, et se transforment selon la règle
(complexe) de la composition des vitesses, qui n'est pas une addition vectorielle.
175
Si toutes les galaxies respectaient strictement la loi de Hubble usuelle, du point
de vue d'un observateur situé dans une galaxie A, alors elles ne la respecteraient
pas, pour un observateur situé dans une autre galaxie B ! Nous ne sommes donc
pas satisfait par un tel modèle : il n'est pas homogène.
Dans un second temps, nous allons donc, pour pallier cet inconvénient, homogénéiser la loi de Hubble : pour cela, il sut de remplacer la vitesse ~v par la
rapidité w
~ . La loi de Hubble homogénéisée est donc :
w
~ = H.~l.
La structure du champ de rapidités sera conservée par changement de galaxie
de référence, car les rapidités, contrairement aux vitesses, ont la propriété d'être
additives (on pourra trouver des explications dans mon étude : Les vitesses en
Relativité restreinte.pdf). Un changement de galaxie de référence équivaut à un
simple changement d'origine dans l'espace des rapidités. Nous écrirons donc :
w
H.l
v
= th = th
.
c
c
c
Sous cette forme, la loi de Hubble revue et corrigée respecte la condition d'"homogénéité"
que recherchaient les auteurs du modèle standard.
On a :
sh H.l
dl
v
w
H.l
c
= = th = th
=
;
c dt
c
c
c
ch H.l
c
sh H.l
H.dl
c
=
.H.dt ;
c
ch H.l
c
H.dl
ch H.l
c . c
sh H.l
c
d sh H.l
c
= H.dt ;
= H.dt ;
sh H.l
c
H.l
d Log sh
= H.dt ;
c
H.l0
H.l
−Log sh
= H.(t−t0 ) (où l0 est la distance à un instant t0 donné) ;
Log sh
c
c
sh H.l
c
0
sh H.l
c
= eH.(t−t0 ) ;
H.l0 H.(t−t0 )
H.l
= Argsh sh
.e
.
c
c
176
Cette formule a des points communs avec celle que nous avions obtenue précédemment ; par exemple, quand t tend vers −∞, l tend toujours vers 0, et
quand t tend vers +∞, l tend toujours vers +∞.
Mais il y a une diérence importante : quand l tend vers l'inni, v ne tend
pas vers l'inni, mais vers c. Il en résulte qu'il n'y a plus d'horizon : tout l'univers
est, en principe, accessible à l'observation. Tous les problèmes liés à l'horizon
disparaissent !
H.dl
dv
H.l
= ch2cH.l ,
D'autre part, puisque vc = th H.l
c , on déduit que c = d th c
c
H
donc : dv
; ce qui signie que le taux d'expansion apparent n'est pas
dl = ch2 H.l
c
constant : il est égal à ch2HH.l , et semble donc diminuer quand la distance augc
mente, autrement dit quand on recule dans le passé ; ou, si on préfère, il semble
plus élevé aujourd'hui qu'autrefois. Ceci est conforme aux observations.
Le redshift (décalage vers le rouge) des galaxies est donné par la formule :
∆λ
z=
=
λ
r
c+v
−1=
c−v
s
v
c
v
c
1+
1−
− 1.
Si on travaille avec la loi de Hubble usuelle : v = H.l, alors on utilisera le
redshift usuel :
s
s
1+
1−
z1 =
v
c
v
c
−1=
1+
1−
H.l
c
H.l
c
− 1.
Si on adopte la loi de Hubble homogénéisée : w = H.l, alors on utilisera le
redshift homogénéisé :
s
z2 =
1+
1−
v
c
v
c
s
−1=
1 + th wc
−1=
1 − th wc
s
1 + th H.l
c
1 − th H.l
c
−1 ;
ce qui donne, en appelant λe la longueur d'onde à l'émission, et λr la longueur
d'onde à la réception :
λr
λe + ∆λ
=
= 1 + z2 =
λe
λe
v w
u e c +e− wc
u
+
λr
= t w 2 −w
c
c
e
+e
λe
−
2
w
c
w
−e− c
2
w
w
e c −e− c
2
e
s
1 + th wc
=
1 − th wc
s
s
ch wc + sh wc
;
ch wc − sh wc
w
p
w
H.l
ec
2w
e c =ec =e c ;
w =
−
c
e
c
λr
l = .Log
.
H
λe
=
Supposons qu'un rayonnement passe successivement par trois points alignés
A, B , C , de rapidités wA , wB , wC ; sa longueur d'onde est λA quand il passe en
177
A, λB quand il passe en B , λC quand il passe en C . On doit avoir :
ce qui est bien le cas, car :
e
wC −wB
c
.e
wB −wA
c
=e
wC −wA
c
λC λB
λB . λA
=
λC
λA
,
.
Le redshift du modèle standard est, bien sûr, le redshift usuel z1 ; c'est celui
qui est utilisé dans tous les calculs basés sur ce modèle. Mais il se pourrait bien
que le véritable redshift (celui qui est mesuré par les astronomes) soit le redshift
homogénéisé z2 . L'erreur serait tout simplement une confusion entre z1 et z2 !
Pour corriger les calculs, il surait alors de rétablir le véritable redshift z2 , sans
changer la distance (car la distance de luminosité, calculée d'après l'éclat des
supernovæ, est bien leur vraie distance).
Pour une distance d (ou une longueur l) xée, on a : 1 + z1 =
qui entraîne :
(1 + z1 )2 =
H.l
1−
c
1+
1−
H.l
c
H.l
c
r
1+ H.l
c
1− H.l
c
, ce
;
.(1 + z1 )2 = 1 +
H.l
;
c
H.l
. (1 + z1 )2 + 1 = (1 + z1 )2 − 1 ;
c
H.l
(1 + z1 )2 − 1
=
.
c
(1 + z1 )2 + 1
Comme 1 + z2 = e
H.l
c
, on déduit que :
(1+z1 )2 −1
z2 = e (1+z1 )2 +1 − 1.
Le graphique qui suit est à l'origine des questions sur l'énergie sombre. Il
concerne les supernovæ Ia ; le logarithme de la distance, établie d'après la luminosité des supernovæ mesurée par les astronomes, gure en abscisse, et le
redshift (également mesuré) en ordonnée. Bien sûr, z = z1 (redshift classique).
La courbe en trait plein, qui se base sur les observations, ne coïncide pas
avec la courbe en pointillé, qui a été calculée à l'aide du modèle standard (sans
énergie sombre). On peut penser que ce modèle standard contient une erreur
systématique.
178
Cette erreur systématique provient-elle d'une confusion entre le redshift classique z1 et le redshift homogénéisé z2 ? Pour tester cette hypothèse, choisissons
trois points A1 , B1 et C1 de la courbe théorique pointillée, et corrigeons leurs
redshifts.
Pour le point A1, le redshift
calculé par le modèle standard est z1 = 1 ; son
3
redshift corrigé est : z2 = e 5 − 1 ≈ 0, 82, donc le point corrigé est en A2.
Pour le point B1, le redshift5 calculé par le modèle standard est z1 = 0, 5 ;
son redshift corrigé est : z2 = e 13 − 1 ≈ 0, 47, donc le point corrigé est en B2.
Pour le point C1, le redshift69calculé par le modèle standard est z1 = 0, 3 ;
son redshift corrigé est : z2 = e 269 − 1 ≈ 0, 29, donc le point corrigé est en C2.
179
Curieusement, les points corrigés tombent sur la courbe réellement observée !
Nous voyons donc qu'un modèle mathématique d'une simplicité extrême
permet de modéliser l'expansion de l'univers (ou sa phase actuelle ?), sans faire
apparaître ces "artefacts" que sont (ou semblent être ?) la singularité initiale,
et l'horizon des événements ; des artefacts qui pourraient bien résulter du pari
d'Einstein...
Dans le modèle standard, le redshift (z1 ) tend vers +∞
rquand la distance l
tend vers
c
H
, comme le montre bien la formule 1 + z1 =
1+ H.l
c
1− H.l
c
6
. Si on prend
H ≈ 71, 4 km.s−1 .M pc−1 , sachant que 1M pc ≈ 3, 26.10 AL, on trouve :
180
c
H
≈ 4200 M pc ≈ 13, 7.109 AL (distance de l'"horizon"). Dans la gure ci-
dessus, la courbe en pointillé (calculée selon ce modèle) admet une asymptote
verticale pour l ≈ 13, 7.109 AL. Mais en est-il de même de la courbe réelle
(en trait plein) ? Il est permis d'en douter. Si nous prenons comme hypothèse
de travail la formule w = H.l (formule de Hubble homogénéisée), alors, pour
l = Hc ≈ 13, 7.109 AL, nous trouvons : z2 = e1 − 1 ≈ 1, 718... seulement !
La plus lointaine galaxie actuellement connue (janvier 2013) est MACS1149JD, dont le redshift est 9, 6 ; sa distance serait alors : l = Hc .Log 9, 6 ≈ 2, 26 Hc ≈
31.109 AL, alors que le calcul basé sur le modèle standard donne une distance
de 13, 2.109 AL.
Quant au fonds dius cosmologique, son redshift est estimé à 1100 environ ; d'après notre formule (basée sur le redshift corrigé) : l = Hc .Log 1100 ≈
7 Hc ≈ 95, 9.109 AL. Selon l'interprétation classique, ce rayonnement de corps
noir aurait été émis à l'époque de la recombinaison, lorsque le gaz qui rempissait l'univers est devenu transparent pour la lumière. Si nous admettons cette
interprétation, notre calcul signie que les astronomes devraient rencontrer le
"mur de l'opacité" (opacité pour la lumière, pas pour les neutrinos !) à une distance de 96.109 AL environ. La galaxie MACS1149-JD serait donc située à peu
près au tiers de cette distance. Le calcul classique, basé sur le modèle standard,
donne, pour cette galaxie, une distance supérieure à 96% de la distance du mur
de l'opacité ; ce qui soulève la question délicate de la vitesse de formation des
galaxies, immédiatement après l'époque de la recombinaison : les gaxies lointaines, comme MACS1149-JD, auraient dû se former en moins de 500 millions
d'années, ce que les théoriciens ont du mal à expliquer... Dans le modèle du
redshift corrigé, au contraire, elles seraient le résultat d'une très longue évolution, de 65 milliards d'années (à partir de la recombinaison) ! Ce qui laisse une
appréciable marge de man÷uvre aux théoriciens...
Amusons-nous à examiner l'éclairage apporté par la formule w = H.l (formule de Hubble homogénéisée) au paradoxe d'Olbers : pourquoi le ciel est-il
noir la nuit ? Imaginons un univers euclidien (inni), peuplé de galaxies réparties uniformément, de manière homogène. Notons nl le nombre de photons nous
parvenant, pendant une unité de temps, d'une distance inférieure à l, et dnl
le nombre de photons nous parvenant, pendant le même temps, d'une distance
comprise entre l et l + dl. Si l'univers était statique, le nombre de galaxies dont
la distance est comprise entre l et l + dl serait proportionnel à l2 , et la probabilité pour qu'un photon émis par l'une de ces galaxies nous parvienne serait
inversement proportionnelle à l2 ; on aurait donc : dnl = K.dl, où K est une
constante (qui dépend du nombre de galaxies par unité de volume, et de leur luminosité moyenne), et, par suite, nl = K.l. Ces hypothèses impliquent donc que
le nombre de photons reçus pendant une unité de temps tend vers l'inni quand
l tend vers l'inni : c'est le fameux paradoxe d'Olbers. Supposons maintenant
que les galaxies s'éloignent selon la loi ci-dessus (loi de Hubble homogénéisée).
Entre l'émission et la réception, la longueur d'onde d'un rayonnement est modi181
ée selon la loi : λr = e c .λH.l
e , ce qui donne, pour la période : Tr = e c .Te , et,
pour la fréquence : νr = e− c .νe . Ceci signie non seulement que les photons
provenant d'une distance l auront une fréquence d'oscillation réduite, mais aussi
qu'ils seront plus espacés, comme si le temps s'écoulait plus lentement pour les
galaxies les plus lointaines. On aura donc :
H.l
H.l
dnl = K.e−
H.l
c
.dl ;
h c
i
H.l l
H.l
c H.l
c nl = K. − .e− c
= −K. . e− c − 1 = K. . 1 − e− c .
H
H
H
l=0
Cette formule montre clairement que nl est borné : sa limite, quand l tend vers
l'inni, est K. Hc .
On voit donc que la formule de Hubble homogénéisée permet de résoudre le
paradoxe d'Olbers d'une manière particulièrement simple. On pourrait améliorer le calcul en faisant intervenir non seulement le nombre de photons reçus,
mais aussi leur énergie (qui décroît selon la même courbe). Un autre élément à
prendre en compte est l'existence (supposée) du "mur de l'opacité".
Nous allons maintenant ouvrir une courte parenthèse, car nous remarquons
que la formule de Hubble homogénéisée (w = H.l) entraîne une conséquence inattendue, qui nous éloigne peut-être de notre sujet, mais qui est assez amusante
pour être signalée : dans un tel univers en expansion, le nombre d'oscillations
d'une onde lumineuse se déplaçant en ligne droite est nécessairement ni.
Considérons un rayon lumineux quelconque, appelons λ0 sa longueur d'onde
initiale, T0 sa période, ν0 sa fréquence, E0 son énergie (toutes initiales, évaluées
par un observateur immobile) ; ces quantités varient sur son parcours : après un
déplacement sur une distance l (correspondant à une récession w), la longueur
d'onde (évaluée par un observateur local) sera λ. On note N le nombre
d'osw
c
cillations de l'onde sur ce parcours. On a : dN = dlλ , dl = dw
H et λ = λ0 .e , donc :
dN =
w
w
dw
1
c
dl
=
.e− c .dw = −
.d e− c .
w =
λ
H.λ0
H.λ0
H.λ0 .e c
Intégrons sur un parcours allant de l'origine (l = 0, w = 0) jusqu'à un point
quelconque (distance : l, vitesse de récession : w) ; il vient :
N =−
w
c −w
c . e c −1 =
. 1 − e− c .
H.λ0
H.λ0
Si nous faisons tendre l vers l'inni (donc w aussi), nous obtenons :
N=
c
1
ν0
E0
=
=
=
.
H.λ0
H.T0
2πH
2π.h.H
Ceci signie qu'un rayon lumineux d'énergie E possède un "capital d'oscilE
lations" : N = 2π.h.H
; ce capital étant limité ! Lorsque l'onde "dépense" ∆N
oscillations, son énergie diminue : ∆E = −2π.h.H.∆N .
182
Si on prend Hc ≈ 4200 M pc ≈ 13, 7.109 AL ≈ 1, 3.1026 m, pour λ0 = 1 m, on
obtient : N ≈ 1, 3.1026 oscillations ; pour λ0 = 1 cm, on obtient : N ≈ 1, 3.1028
oscillations, et ainsi de suite.
Pendant une durée innitésimale dt, le nombre d'oscillations est
dN =
ν
E
dt
=
.dt =
.dt
T
2π
2π.h
et la variation d'énergie est donc :
dE = −2π.h.H.dN = −2π.h.H
E
.dt = −H.E.dt ,
2π.h
ce qui entraîne :
dE
= −H.dt
E
ou encore, pour un corps de masse m = cE2 :
dm
= −H.dt.
m
Chacun pourra rééchir à cette étrange conclusion...
Aucune théorie ne donne, pour le moment, d'explication claire de l'expansion de l'univers basée sur des lois physiques connues : le modèle relativiste de
Friedmann-Robertson-Walker, chacun le sait aujourd'hui, ne correspond pas à
la réalité. On pourrait même aller jusqu'à douter d'un big bang issu d'une phase
ponctuelle : l'étude ne du fond dius cosmologique (grâce aux satellites WMAP
et, surtout, Planck) permet de mieux comprendre la nature de la "soupe" qui
emplissait l'univers à l'époque où les particules se sont combinées en atomes ;
mais, lors de cette phase, l'univers était-il ni ou inni ? Rien ne permet de le
dire, puisque les mesures de la courbure globale de l'univers observable donnent,
avec une très bonne précision, un résultat nul... On ne sait pas non plus si son âge
était ni ou inni ! En dénitive, la relativité générale ne peut plus être considérée comme le cadre indispensable à l'élaboration d'une cosmologie scientique :
l'expansion de l'univers semble bien régie des deux phénomènes totalement incompris, l'"ination" et l'"énergie sombre" (deux formules destinées à cacher
notre ignorance), qui échappent complètement au cadre imaginé par Einstein ;
de plus, la relativité générale repose entièrement sur la notion de courbure, et,
jusqu'à présent, l'observation nous montre que l'univers, globalement, n'est pas
courbé ! Ce qui remet en cause, bien évidemment, l'intuition fondatrice d'Einstein...
Mais le but de la gravitation relativiste n'est pas d'expliquer la loi de Hubble :
nous ne savons pas si elle est régie par la gravitation ! Nous sommes peut-être
hors sujet, lorsque nous incluons une discussion de l'expansion de l'univers dans
un travail sur la gravitation... Fermons donc cette parenthèse au plus vite, et
laissons ces questions en suspens.
183
63 Pour terminer ...
J'espère que cette étude aura oert à quelques amateurs de physique ou
d'astronomie, étudiants ou autodidactes, un marche-pied vers la gravitation relativiste. J'ai essayé de leur présenter cette discipline de la manière la moins
dogmatique possible : moins dicile qu'on ne le dit, plus ouverte, et inachevée.
S'ils en retirent une vision claire des points forts et, éventuellement, des limites
de la relativité générale, et surtout l'envie d'approfondir un sujet que je crois
très riche, j'aurai atteint mon but.
64 Liens
Voici les adresses de quelques sites où on pourra trouver des informations
sur la relativité générale, et sur tous les sujets que nous avons évoqués :
Le site Sciences.ch est un monde à lui seul :
Sciences.ch - Relativité Générale
On trouvera toute une série d'études dans ce site de la commission cosmologie de la SAF :
Cosmologie - Société Astronomique de France
Je me suis inspiré des pages de Christian Magnan sur la précession du périhélie de Mercure et sur la déexion de la lumière, mais son site contient bien
d'autres choses à découvrir :
La cosmologie
Déviation de la lumière
Précession de Mercure
Horizon
Plusieurs articles de de Loïc Villain (dans Futura-Sciences) :
Relativité restreinte et naissance de l'espace-temps
Relativité générale - Comment l'espace-temps devint dynamique
Des cours en ligne (Nicolas Cubaynes) :
184
Physique et Astrophysique
Gravitation relativiste, ondes gravitationnelles, trous noirs, par Eric Gourgoulhon (LUTH) :
La gravitation relativiste
Sur les astres compacts (même auteur) :
Etoiles à neutrons et trous noirs
Un article de Blanchet (CNRS) sur les pulsars binaires (surtout PSR 1913+16) :
Spirale infernale
Un autre de T. Damour :
Le pulsar binaire
Sur le pulsar binaire PSR 1913+16 :
PSR 1913+16
Encore sur le pulsar binaire PSR 1913+16 :
PSR 1913+16
Sur le pulsar binaire PSR B1534+12 :
PSR B1534+12
Sur le pulsar binaire PSR J0437-4715 :
PSR J0437-4715
Sur le système PSR J0348-0432 (pulsar+naine blanche) :
PSR J0348-0432
Sur les naines blanches binaires :
Naines blanches binaires
Un bilan sur les observations de systèmes binaires :
185
Systèmes binaires
Sur le pulsar binaire PSR J0348+0432 comme test des théories f(R) :
Test des théories f(R)
Sur les étoiles à neutrons (dossier Astroles) :
Etoiles à neutrons
Un dossier de l'Internaute sur les trous noirs :
Trous noirs
Une présentation critique des diérentes théories de la gravitation :
Théories de la gravitation
Une autre étude critique des théories de la gravitation :
Théories de la gravitation
Dans la version anglophone de Wikipedia, une étude détaillée sur les théories
concurrentes de la relativité générale :
Alternatives to general relativity
... et sur les tests de la relativité générale :
Tests of general relativity
Egalement sur les tests de la relativité générale :
Spacetime
Une étude très approfondie sur les théories de la gravitation :
Relativity - livingreviews
Sur l'anomalie Pioneer :
Pioneer
Sur le principe de Mach et l'eet Lense-Thirring :
186
Mach
Un document sur les supernovæ et l'énergie noire, Regnault & coll. :
Les supernovæ et l'énergie noire
Les travaux de Mac Gaugh sur la loi de Tully-Fischer :
Loi de Tully-Fisher
Exposé des idées d'Erik Verlinde :
On the Origin of Gravity and the Laws of Newton
Emergent Gravity and the Dark Universe
Recherche des ondes gravitationnelles, bilan 2012 :
Nouveaux détecteurs
Sur le projet Advanced Virgo :
Advanced Virgo
Première détection directe d'une onde gravitationnelle :
Première détection
Voici maintenant l'applet que nous avions annoncée dans la partie sur la
propagation du champ gravitationnel. On pourra faire varier le rayon de l'orbite
et la vitesse des deux étoiles.
Attention : depuis janvier 2014, pour des raisons de sécurité, les applets
non signées sont bloquées par les navigateurs. Compte-tenu du prix des certicats ociels, j'ai choisi, pour le moment, de ne pas signer cette applet. Aux
internautes qui désirent la visionner, je propose la solution suivante : ouvrez
le Panneau de conguration de votre ordinateur, puis cliquez sur l'icône de
Java, si elle est présente ; sinon, appelez-la en saisissant "java" dans la zone
"rechercher". Sous Windows 10, faire un clic droit sur l'icône "Démarrer", choisir "Executer", saisir "c ://Program Files (x86)/Java/jre7/bin/javacpl.exe". Ne
pas utiliser le navigateur Microsoft Edge, qui ne prend pas en charge les applets java. En cas de problème, on trouvera des explications ici. Une fois que
le panneau de conguration de Java est ouvert, ouvrez l'onglet "sécurité", puis,
dans "sites bénéciant d'une exception", cliquez sur "ajouter", puis saisissez :
"http ://jeanpierre.chabert.free.fr".
187
Cliquez ensuite sur le lien :
Applet interactive
188
Téléchargement