Principes variationnels et Mécanique analytique

publicité
promotion 2011
Année 2
Enseignement diversifié 1
PHY431
Principes variationnels
et
Mécanique analytique
Christoph Kopper
Édition 2012
1
Table des matières
Préface 2012 . . . . . . . . . . . . . . . . . . . . . . . . . . .
0 Avant-propos
1
L’esthétique et la physique . . . . . . . . . . . . . . . . . .
2
La métaphysique et la science . . . . . . . . . . . . . . . .
3
Les nombres, la musique et la physique quantique . . . . .
4
La philosophie des lumières et le principe du meilleur . . .
5
Le principe de Fermat et ses conséquences . . . . . . . . .
6
Les principes variationnels . . . . . . . . . . . . . . . . . .
7
La période moderne, de Lagrange à Einstein et à Feynman
1 Principes variationnels
1
Principe de Fermat . . . .
1.1
Réfraction . . . . .
1.2
Rayons courbes . .
1.3
Mirages . . . . . .
2
Principe de Maupertuis . .
3
Principe de moindre action
2
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
5
5
7
8
13
14
15
19
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
31
31
35
37
40
42
Mécanique analytique et calcul variationnel
1
Le calcul variationnel d’Euler et Lagrange . . . . . . . .
2
Le lagrangien . . . . . . . . . . . . . . . . . . . . . . . .
3
Invariances et lois de conservation . . . . . . . . . . . . .
3.1
Moments conjugués, impulsions généralisées . . .
3.2
Changement de coordonnées, variables cycliques. .
3.3
Energie et translation dans le temps . . . . . . . .
3.4
Impulsion et translations dans l’espace . . . . . .
3.5
Moment cinétique et rotations . . . . . . . . . . .
3.6
Symétries dynamiques . . . . . . . . . . . . . . .
4
Multiplicateurs de Lagrange . . . . . . . . . . . . . . . .
5
Exemples . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Rayons courbes . . . . . . . . . . . . . . . . . . .
5.2
Forme d’une corde pesante . . . . . . . . . . . . .
5.3
Lois de Kirchhoff . . . . . . . . . . . . . . . . . .
5.4
Potentiel électrostatique . . . . . . . . . . . . . .
5.5
Bulles de savon . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
46
48
51
52
52
53
54
54
55
56
58
58
59
62
63
64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
Exercices
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3 Théorie lagrangienne de l’électromagnétisme
1
Lagrangien d’une particule relativiste . . . . . . . . . . .
1.1
Particule libre . . . . . . . . . . . . . . . . . . . . .
1.2
Impulsion et énergie d’une particule libre . . . . . .
1.3
Particule chargée dans un champ électromagnétique
2
Théorie lagrangienne des champs . . . . . . . . . . . . . .
2.1
Corde vibrante . . . . . . . . . . . . . . . . . . . .
2.2
Equations d’Euler-Lagrange généralisées . . . . . .
2.3
Champ électromagnétique . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
71
74
74
75
76
81
82
84
86
89
4 Formalisme canonique de Hamilton
1
Equations canoniques . . . . . . . . . . . . . . . . . . . . . . .
2
Crochets de Poisson ; Espace des phases . . . . . . . . . . . . .
2.1
Evolution temporelle, constantes du mouvement . . . .
2.2
Transformations canoniques . . . . . . . . . . . . . . .
2.3
Théorème de Liouville . . . . . . . . . . . . . . . . . .
2.4
Flot hamiltonien . . . . . . . . . . . . . . . . . . . . .
2.5
Mécanique analytique et mécanique quantique . . . . .
3
Systèmes dynamiques . . . . . . . . . . . . . . . . . . . . . . .
3.1
Poincaré et le chaos dans le système solaire . . . . . . .
3.2
L’effet aile de papillon ; l’attracteur de Lorenz . . . . .
4
L’action et l’équation de Hamilton-Jacobi . . . . . . . . . . . .
4.1
L’action comme fonction des coordonnées et du temps .
4.2
Equation de Hamilton-Jacobi . . . . . . . . . . . . . .
4.3
Limite géométrique de l’optique ondulatoire. . . . . . .
4.4
Approximation semi-classique en mécanique quantique.
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
95
98
99
100
104
106
106
107
108
110
113
113
115
120
123
124
Solution des exercices
138
Bibliographie
163
Index
165
.
.
.
.
.
.
.
.
.
3
Préface au Cours 2012
Les principes variationnels et la mécanique analytique sont enseignés à l’Ecole
Polytechnique depuis la réforme X 2000 dans le cadre du cours PHY 431.
Parmi les neuf blocs de ce cours trois blocs ont été dédiés à ce sujet. JeanLouis Basdevant, qui est le fondateur de cet enseignement à l’Ecole, les a
enseignés trois fois de suite. Il a élaboré un cours original dont la dernière
version écrite a paru aux éditions Vuibert [1].
Ce polycopié se base sur celui de Jean-Louis Basdevant, qui a mis à ma
disposition les sources de son manuscrit. Il a été réaménagé à plusieurs reprises dans le but de le faire suivre les évolutions du cours enseigné. Nous
commençons par décrire les origines des principes variationnels et en donner
quelques exemples typiques et classiques. Ensuite nous passsons à la mécanique analytique de Lagrange, qui nous sert de cadre pour l’analyse de systèmes simples en mécanique des points, mais aussi pour la théorie du champ
électromagnétique. Le dernier chapitre est dédié au formalisme canonique de
Hamilton, qui donne accès à une approche geométrique aux systèmes dynamiques, là où les méthodes de solution explicites ont trouvé leurs limites.
Dans le cours de Jean-Louis Basdevant se trouvent en outre un exposé
sur la description de l’équilibre thermodynamique en physique statistique,
un chapitre sur le mouvement dans un espace courbe avec applications en
relativité générale et illustrations en l’astrophysique, et un chapitre sur les
intégrales des chemins de Feynman. Nous espérons que cette première introduction donnera envie au lecteur de consulter l’œuvre plus complet «Le
principe de moindre action et les principes variationnels en physique» de
Jean-Louis Basdevant. Dans ce but nous reproduisons ici son magnifique
avant-propos, chef-d’œuvre dans son genre, même si c’est l’avant-propos du
livre [1] et non pas à ce cours.
C’est évidemment à Jean-Louis Basdevant que s’adressent mes profonds
remerciements pour son soutien constant et indispensable dans la préparation
de cet enseignement, qui restera dans les traces qu’il a dessinées. Je voudrais
également remercier mes collègues Denis Bernard, Francis Bernardeau, Adel
Bilal, Cédric Deffayet, David Langlois, Roland Lehoucq, Marios Petropoulos,
André Rougé, Jean-François Roussel, avec qui j’avais le privilège de pouvoir
travailler pour ce cours dans une atmosphère toujours amicale et fructueuse.
Finalement je remercie Dorian Nogneng (X2010) pour une lecture attentive
du manuscrit qui a mené à quelques améliorations du texte.
Palaiseau, au mois d’octobre 2012
Christoph Kopper
4
Avant-propos
Puisque les mystères nous dépassent,
feignons d’en être les organisateurs.
Jean Cocteau
L’art est indissociable de la métaphysique et de la philosophie. Dans ses
Leçons sur l’esthétique, en réponse à la question : « Quel besoin l’homme
a-t-il de produire des œuvres d’art ? », Hegel dit que : « Le besoin général
d’art est [...] le besoin rationnel qui pousse l’homme à prendre conscience du
monde intérieur et extérieur et à en faire un objet dans lequel il se reconnaisse
lui-même. »
0.1
L’esthétique et la physique
Ce même besoin explique que l’esthétique imprègne aussi profondément
la physique. De fait, la beauté d’une théorie a souvent été considérée comme
déterminante dans son acceptation. La relativité générale d’Einstein en donne
un exemple célèbre. Enoncée en 1916, elle n’a commencé de recevoir ses
premières vérifications expérimentales authentiques que 70 ans plus tard. 1
Pourtant, on peut affirmer que personne ne pensait sérieusement que cette
théorie pourrait être remise en cause. 2 En effet, comme le dit Landau « [Elle]
est vraisemblablement la plus belle des théories physiques existantes. Il est
remarquable qu’Einstein l’ait construite par voie purement déductive et que
1. On a coutume de distinguer les vérifications du principe d’équivalence (voir la référence [3], Chapitre 8), comme la déviation des rayons lumineux par le champ gravitationnel,
la variation de la marche d’une horloge en fonction de la pesanteur, ou la précession du périhélie des astres, des véritables prévisions de la relativité générale, comme le rayonnement
d’ondes gravitationnelles.
2. Ce qui n’est évidemment pas une raison pour renoncer aux vérifications expérimentales.
5
6
Avant-Propos
c’est seulement par la suite qu’elle ait été confirmée par des observations
astronomiques. »
Les éléments de l’esthétique sont de nature diverse. Il y a, bien entendu, la
beauté d’une idée en soi, difficile voire impossible à définir de façon générale.
Mais deux facteurs sont plus facilement identifiables : la simplicité d’une
théorie et sa nature unificatrice. Ces deux facteurs n’ont de sens que parce que
la physique s’exprime sous forme mathématique. Nous parlerons ci-dessous
de l’archétype qu’est la gamme pythagoricienne, les exemples abondent, bien
entendu.
A l’issue d’un travail considérable, tant sur le plan observationnel 3 que
sur celui du calcul 4 , Kepler parvient à ses célèbres lois sur le mouvement
des planètes du système solaire. Découvrir, dans une vision copernicienne du
système solaire, que les orbites sont des ellipses, ces courbes pures et légendaires de la géométrie d’Apollonius, Euclide et Archimède, est d’une beauté
et d’une simplicité auxquelles Kepler ne peut résister. Il ne peut qu’être
amené à concevoir l’univers comme inspiré par une esthétique mathématique
qui montre la pureté et l’unité. Il exprime son émotion dans sa phrase : « la
nature aime la simplicité » 5 . Ce sera un triomphe et un émerveillement pour
Newton que de déduire mathématiquement les lois de Kepler dans le cadre
de ses Principia.
De même, l’unification de l’électricité et du magnétisme par Ampère, puis
celle de l’électromagnétisme et de la lumière par Maxwell est une prodigieuse
aventure du 19e siècle qui se poursuivra longtemps. La structure mathématique des équations de Maxwell dévoilera la relativité. L’unification des
interactions électro-faibles par Glashow, Weinberg et Salam dans les années
1960 sera saluée comme l’étape suivante de cette aventure exaltante. Elle
est à l’origine d’un fabuleux effort qui perdure pour unifier l’ensemble des
interactions fondamentales, y compris la gravitation. On y retrouve à chaque
étape le souci de l’esthétique comme celui de la simplicité et de l’unité.
La simplicité ne signifie pas que les choses deviennent abordables au
tout venant, bien au contraire. Cette simplicité vaut dans le langage mathématique. Galilée est le premier à l’énoncer : « La philosophie est écrite dans ce
livre immense perpétuellement ouvert devant nos yeux (je veux dire : l’Uni3. La lunette de Galilée ne fut inventée qu’en 1609, plus de dix ans après les travaux
de Kepler.
4. Kepler dédia son mémoire Mysterium cosmographicum à Napier, inventeur des logarithmes, sans qui, disait-il, il n’aurait jamais pu mener à bien son entreprise.
5. Natura simplicitatem amat
0.2. LA MÉTAPHYSIQUE ET LA SCIENCE
7
vers), mais on ne peut le comprendre si l’on n’apprend pas d’abord à connaître
la langue et les caractères dans lesquels il est écrit. Il est écrit en langue mathématique, et ses caractères sont des triangles, des cercles et d’autres figures
géométriques sans l’intermédiaire desquelles il est humainement impossible
d’en comprendre un seul mot. » Il est difficile de ne pas rapprocher de ces
mots ceux de Léonard de Vinci dans son Traité de la Peinture : « Non mi
legga chi non è matematico, nelli mia principi » 6 . La simplicité réside dans
la possibilité – mystérieuse – de représenter les phénomènes naturels par
des structures mathématiques de plus en plus générales. Si je peux dire que
la structure mathématique la plus fondamentale de la mécanique quantique
est la première des quatre opérations, l’addition 7 , c’est la conséquence de
l’immense effort de synthèse mené par les physiciens et mathématiciens des
années 1920-1930. Le principe de superposition, pont aux ânes de celui qui
aborde la mécanique quantique, est ce qui heurte le plus l’intuition physique
première. Mais si son expression se réduit à peu de choses, cette simplicité
ne peut être véritablement savourée qu’au bout d’un long et incontournable
parcours mathématique.
0.2
La métaphysique et la science
La réflexion philosophique accompagne couramment le progrès scientifique, cela se comprend. Mais il est intéressant de constater que les considérations véritablement métaphysiques ont constamment frôlé, voire épousé,
les chemins de la physique. En étudiant la trajectoire de la comète de 1682,
et signalée dès 240 avant J.-C., Halley montre que son orbite est elliptique
et, appliquant pour la première fois les lois de Newton sur le mouvement,
prévoit avec succès sa réapparition pour 1758. Le mouvement céleste, totalement imbriqué dans la notion de temps, le plus mystérieux des concepts
physiques 8 hantait les hommes depuis qu’ils observaient le ciel. Avec les lois
de Newton, l’homme était devenu capable de prédire l’état du ciel avec parfaite précision ! Newton, émerveillé par cette précision, y avait trouvé une
6. Ne lise pas mes principes qui n’est pas mathématicien.
7. Voir par exemple J-L. Basdevant, La Mécanique quantique, dogme ou humanisme ?
Découverte, Revue du Palais de la Découverte, numéro 288, Mai 2001.
8. « Qu’est-ce donc que le temps ? Si personne ne me le demande, je le sais. Si quelqu’un pose la question et que je veuille l’expliquer, je ne sais plus. » Saint Augustin, Les
Confessions Livre XI, XIV, 17.
8
Avant-Propos
preuve de l’existence de Dieu. Puisque le système était si parfaitement réglé,
puisque l’on pouvait prédire l’état futur du ciel, puisque l’on pouvait, par
les équations, remonter le temps et retrouver l’état des planètes à n’importe
quelle date antérieure, il fallait admettre que le système solaire, comme tout
le cosmos, avait été conçu et installé par une puissance supérieure. « L’ordre
qui règne dans les choses matérielles indique assez qu’elles ont été créées par
une volonté pleine d’intelligence » écrit-il dans son Traité d’Optique.
A l’apogée de la découverte d’une théorie physique, il n’est pas inhabituel
de voir invoquer une « puissance supérieure ». Ce peut être, comme dans le
cas de Newton, un véritable argument théologique. C’est souvent une interrogation par rapport à cet « organisme » structuré que constitue l’ensemble
des phénomènes naturels. Kepler et les orbites planétaires en donnent un
exemple. On ne peut évidemment pas manquer de rappeler les phrases légendaires d’Einstein, comme « le Seigneur n’est pas méchant, il est subtil » ou
« Dieu ne joue pas aux dés ». Toutefois, au delà de ces interrogations ou affirmations, peut-être marquées par la culture judéo-chrétienne, on retrouve en
permanence, dans la progression de la physique, une quête métaphysique, une
recherche des causes du monde et des principes mêmes de la connaissance.
Cette quête se transforme souvent en celle d’une véritable « méta-théorie ».
Le nom même de « M-théorie » né depuis 1995 avec la démonstration de
l’équivalence de l’ensemble des théories de super-cordes, et qui a provoqué
un regain d’intérêt complètement inattendu dans le domaine des interactions
fondamentales, est révélateur à cet égard.
0.3
Les nombres, la musique et la physique quantique.
On convient de situer la naissance de la physique moderne au 17e siècle
avec Galilée. Il lui revient en effet d’avoir posé les deux principes fondateurs
de cette science : la méthode expérimentale et la formulation de la théorie
dans le langage mathématique.
Mais le point de départ de la physique expérimentale et théorique se
situe il y a 2500 ans. En effet, le théorème de Pythagore occulte ce qui, au
sens de Galilée, constitue la première découverte moderne en physique : la
théorie des sons et la gamme musicale. Moderne, car la découverte possède
ces deux vertus d’avoir un fondement expérimental et d’être exprimée de
0.3. LES NOMBRES, LA MUSIQUE ET LA PHYSIQUE QUANTIQUE
9
Figure 1 – Sylvano Bussotti, « Pièces de piano pour David Tudor # 4 » extrait de
c Casa Ricordi-BMG Ricordi Milan ; tous droits réservés.
« Pièces de Chair II », façon mathématique.
La musique est le premier art abstrait. Elle fascine parce qu’elle atteint
directement l’inconscient. Elle échappe à toute tentative de verbalisation.
Hormis les discussion techniques ponctuelles que peuvent entretenir des initiés, on ne raconte pas la musique. L’écriture musicale est un sujet d’émerveillement inépuisable, on en voit un exemple sur la figure 1.
On ne peut dater la naissance de cet art, mais il est certain que, très tôt,
les humains, dans leurs chants, ont compris l’harmonie. L’octave, qui en est
le plus simple exemple, est la découverte étonnante qu’un même son puisse
se reproduire à l’aigu comme au grave.
La tradition veut que Pythagore, en passant quotidiennement devant
l’atelier d’un forgeron, dans son île natale de Samos, 9 ait compris que la
hauteur des sons est directement reliée aux dimensions des objets qui les produisent. Il avait remarqué que des barres de longueur différente produisaient
des sons différents lorsqu’elles étaient percutées par le marteau du forgeron.
Comme le dit Arthur Koestler (réf.[4], chapitres V et VII), « Depuis que
9. Peu importe, à vrai dire, que l’anecdote soit vraie, que ce soit Pythagore lui-même
qui ait fait la découverte. Dans tous les cas, on ne peut nier ni la profondeur de l’idée,
ni l’observation expérimentale qu’elle provoque, ni la théorie en nombres entiers qu’elle
engendre et qui nous est parvenue.
10
Avant-Propos
l’âge de bronze avait fait place à l’âge de fer, les martèlements assourdissants
avaient été considérés par les mortels ordinaires comme une simple nuisance.
Pythagore avait ainsi transformé du bruit en de l’information ». De retour
chez lui, il procède à une expérimentation sur des objets musicaux, notamment sur les cordes vibrantes d’une lyre. Il comprend que diviser une corde
par un nombre entier appartenant à la tetraktys de la décade, la progression
des nombres 1,2,3,4 dont la somme est le nombre « parfait » 10, produit ce
que l’on nomme depuis longtemps l’harmonie, à savoir l’octave, la quinte et
la quarte.
Laissons la parole à Diderot 10 : La musique est un concert de plusieurs
discordants. Il ne faut pas borner son idée aux sons seulement. L’objet de
l’harmonie est plus général. L’harmonie a ses règles invariables. [...]
L’octave, la quinte et la quarte sont les bases de l’arithmétique harmonique.
La manière dont Pythagore découvrit les rapports en nombres de ces intervalles de sons marque que ce fut un homme de génie.
Il entendit des forgerons qui travaillaient ; les sons de leurs marteaux rendaient l’octave, la quarte et la quinte : il entra dans leur atelier. Il fit peser
les marteaux. De retour chez lui, il appliqua aux cordes tendues par des poids
l’expérience qu’il avait faite ; et il forma la gamme du genre diatonique, d’où
il déduisit ensuite celles des genres chromatique et enharmonique ; et il dit :
Il y a trois genres de musique : le diatonique, le chromatique et l’enharmonique.
Chacun a son progrès et ses degrés. Le diatonique procède du semi-ton au
ton, etc.
C’est par le nombre et non par le sens qu’il faut estimer la sublimité de la
musique. Etudiez le monocorde.
Il y a des chants propres à chaque passion, soit qu’il s’agisse de les tempérer,
soit qu’il s’agisse de les exciter.
La flûte est molle. Le philosophe prendra la lyre : il en jouera matin et soir.
Après une étude que l’on peut imaginer sur les harmoniques d’un son, et
sur la façon de les ramener dans l’intervalle d’une même octave en divisant
par des puissances de 2, Pythagore parvient à ces gammes, notamment celle
qui porte son nom et qui est représentée dans la table ci-dessous. Les nombres
désignent ici des rapports de fréquence (les modes grecs étaient énoncés sous
la forme descendante en fonction de la longueur).
10. dans l’article Pythagorisme de l’Encyclopédie, édition critique de J. Assézat, Garnier
Frères, Paris, 1876.
11
0.3. LES NOMBRES, LA MUSIQUE ET LA PHYSIQUE QUANTIQUE
note
do ré
rapport de fréquence
1
9
8
mi
fa sol
la
si
do
81
64
4
3
27
16
243
128
2
3
2
Rapports de fréquences dans la gamme pythagoricienne .
Dans cette gamme, les intervalles séparant deux notes voisines ne prennent
que deux valeurs : le ton (rapport 9/8) et le demi-ton (rapport 256/243). Pythagore voit une importance particulière à ce que les numérateurs et dénominateurs de ces fractions soient des puissances des éléments de la tetraktys
(en l’occurrence de 2 et 3). Pour lui, la gamme ci-dessus a une esthétique
infiniment supérieure à celle des autres. Nous devons, en effet, compléter le
texte de Diderot par sa dernière phrase :
Le mouvement des orbites célestes, qui emporte les sept planètes, forme un
concert parfait.
Un mérite de Pythagore est, comme le soulignait Aristoxène, d’avoir
« élevé l’arithmétique au-dessus des besoins des marchands ». Il a transformé
un ensemble de recettes empiriques utilitaires, notamment dans le commerce,
en une science démonstrative. Il est probable que c’est à Pythagore lui-même
que l’on doit l’affirmation, rapportée par Aristote, selon laquelle toutes choses
sont des nombres. Mais, partant de son analyse de l’harmonie musicale, qui
se laisse ramener à des nombres entiers, il ne peut résister à l’idée que les
nombres sont le principe, la source et la racine de toutes choses. Nous voilà
donc dans la métaphysique. Sur ce principe, les pythagoriciens élaborent une
arithmologie mystique, en assignant aux nombres des propriétés qualitatives.
Ils en arrivent à concevoir et décrire ainsi le cosmos et son origine grâce à
l’harmonie des sphères. Le principe d’harmonie envahit ainsi toute la philosophie des pythagoriciens : ils conçoivent l’univers tout entier comme régi
par les nombres entiers et par l’harmonie qui en résulte.
Pythagore lui-même est l’une des personnalités les plus mystérieuses de
l’antiquité. On ne lui connaît aucun écrit. Longtemps, sa pensée ne fut connue
que par la tradition orale. Aristote évite le plus souvent de prononcer son
nom, pour ne parler que des pythagoriciens, coutume qui subsiste de nos
jours.
Né au VIe siècle avant J.-C. à Samos en Asie Mineure, il émigra vers l’âge
12
Avant-Propos
de quarante à Crotone, en Italie. Il y fonda une communauté (ou secte) à la
fois religieuse et politique, qui fut massacrée lors d’une révolte populaire.
Il porta les nombres entiers comme un fondement du monde. √
On dit qu’il
se suicida le jour où il comprit qu’il venait de démontrer que 2 était irrationnel, qu’il ne pouvait pas s’écrire comme le rapport de deux entiers.
Autrement dit, la diagonale d’un carré ne se rapporte pas à son côté par une
fraction entière !
La numérologie a joué un rôle considérable dans le développement de la
science au XIXe siècle. La loi des proportions définies ramenait les réactions
chimiques à des jeux de nombres entiers. La classification et l’évolution des
espèces en zoologie et en botanique reposait sur des nombres (pétales, cotylédons, dents, doigts etc.). La phénoménologie des spectres atomiques faisait
intervenir des fractions entières. Cette dernière aventure débouchera sur une
des percées les plus étonnantes, celle de la formule en nombres entiers de
Balmer et son rôle dans la naissance de la mécanique quantique.
C’est tout à fait par hasard qu’en 1885, Balmer, professeur de lycée à Bâle
et passionné de numérologie, fut mis en présence du spectre de l’hydrogène.
Il constata que les longueurs d’onde des raies d’émission de l’hydrogène dans
le visible pouvaient se représenter, au millième près, par une formule faisant
intervenir des nombres entiers : 1/λ ∝ (n2 − 4)/n2 , n ≥ 3. Bien qu’il ne
fût pas physicien, frappé par la simplicité et l’esthétique de cette formule,
il écrivit dans son article de 1885 : « Il m’apparaît que l’hydrogène,..., plus
que toute autre substance, est destiné à nous ouvrir de nouvelles voies dans
la connaissance de la matière, de sa structure et de ses propriétés », paroles
prophétiques.
En effet, lorsqu’en 1912, Niels Bohr, âgé de 27 ans, travaillait chez Rutherford sur un modèle de l’atome, il ignorait totalement la formule de Balmer, et
celles, analogues, de Rydberg pour les alcalins. Quand, par hasard, il apprit
l’existence de la formule de Balmer, il ne fallut que quelques semaines à Bohr
pour construire son célèbre modèle de l’atome d’hydrogène, un des tournants
de la physique quantique.
Une énigme amusante demeure : la loi empirique de Titius en 1772, reprise par Bode en 1778. Cette loi établit une relation entre la distance a des
planètes au Soleil (plus précisément le grand axe de leur orbite), exprimée en
unités astronomiques (1 U.A. = 150 millions de km.), et leur rang n, compté
à partir du Soleil. Elle s’écrit :
a = 0, 4 + 0, 3 × 2n−1
0.4. LA PHILOSOPHIE DES LUMIÈRES ET LE PRINCIPE DU MEILLEUR
13
où a est la distance planète-Soleil . Pour Mercure, n = −∞ et a=0,4 ; n = 1
pour Vénus ; n = 2 pour la Terre ; n = 3 pour Mars ; n = 5 pour Jupiter.
La « lacune » observée pour n = 4 a permis la découverte de la ceinture des
astéroïdes en incitant les astronomes à rechercher une planète à la distance de
2,8 U.A. La loi de Titius-Bode, assez exacte jusqu’à Uranus devient inexacte
pour des distances plus grandes (elle donne a=77,2 U.A. pour Pluton dont la
distance réelle est de 39,2 U.A.). On spécule actuellement sur le fait qu’elle
soit ou non valable dans les systèmes planétaires extra-solaires découverts
ces dernières années. Aucun calcul dynamique n’a jamais été en mesure de
la retrouver par la théorie.
0.4
La philosophie des lumières et le principe
du meilleur
La notion d’équilibre était chère aux penseurs du 18e siècle. Citons, ne
serait-ce que par sa consonnance d’actualité, une phrase de Montesquieu dans
De l’esprit des lois : « Dans toute magistrature, il faut compenser la grandeur
de la puissance par la brièveté de sa durée ».
Avec la philosophie de Leibniz, (1646-1716) on voit se dessiner une reconnaissance de conditions optimales dans la nature. Retournons vers Diderot
et l’article Leibnizianisme dans l’Encyclopédie.
Il avait encore sur la physique générale une idée particulière : c’est que
Dieu a fait avec la plus grande économie possible ce qu’il y avait de plus
parfait et de meilleur ; il est le fondateur de l’optimisme, ou de ce système
qui semble faire de Dieu un automate dans ses décrets et dans ses actions,
et ramener sous un autre nom et sous une forme spirituelle le fatum des
Anciens, ou cette nécessité aux choses d’être ce qu’elles sont.
Cependant, comme il y a une infinité de combinaisons et de mondes possibles
dans les idées de Dieu, et que de ces mondes il n’en peut exister qu’un, il faut
qu’il y ait une certaine raison suffisante de son choix : or cette raison ne peut
être que dans le différent degré de perfection ; d’où il s’ensuit que le monde
qui est, est le plus parfait. Dieu l’a choisi dans sa sagesse, connu dans sa
bonté, produit dans la plénitude de sa puissance.
Dans ses Nouveaux essais sur l’entendement humain Leibniz écrit : « Mon
système prend le meilleur de tous côtés ». Chez lui, Dieu est conçu comme
un mathématicien. Nous revoilà dans la métaphysique.
14
Avant-Propos
Il faut, bien entendu, tempérer cette impression d’enthousiasme. Il n’y
avait unanimité pas plus sur Leibniz que sur tout autre penseur. Voltaire
dans Candide, se complaît à ridiculiser les idées de Leibniz : « Tout est pour
le mieux dans le meilleur des mondes ».
Il est démontré, disait-il, que les choses ne peuvent être autrement : car
tout étant fait pour une fin, tout est nécessaire pour la meilleure fin. Remarquez bien que les nez ont été faits pour porter des lunettes. (Chap. 1).
Pangloss les consola, en les assurant que les choses ne pouvaient être autrement : « Car, dit-il, tout ceci est ce qu’il y a de mieux ; car s’il y a un volcan
à Lisbonne, il ne pouvait être ailleurs ; car il est impossible que les choses ne
soient pas où elles sont ; car tout est bien. » (Chap. 4).
0.5
Le principe de Fermat et ses conséquences
Le coup de tonnerre scientifique, c’est-à-dire la formalisation mathématique de telles idées, nous est d’abord venue de Pierre de Fermat (1601-1665),
comme nous le verrons au chapitre 1. L’idée fondatrice est le principe de
l’optique géométrique qui porte son nom et qui est un principe de temps
minimum.
De fait, tout a démarré vers 1637 dans une vive critique adressée à Descartes par Fermat à propos de la notion de démonstration. L’irritation de Fermat faisait suite à la publication de la Dioptrique dans le Discours de la Méthode. Fermat, magistrat toulousain, était mathématicien, mais pas physicien.
Il s’intéressait cependant à la structure des lois physiques 11 et notamment
aux lois de l’optique. Le manque de rigueur de la « pseudo-démonstration »
de Descartes, irritait Fermat. Celui-ci était convaincu que l’on pouvait faire
les choses correctement : « Il me semble qu’un peu de géométrie pourra nous
tirer d’affaire ». Quand il parvint à démontrer géométriquement la loi de la
réfraction n1 sin i1 = n2 sin i2 , Fermat fut littéralement fasciné : Le fruit de
mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux
qui fût jamais. Car [...] j’ai trouvé que mon principe donnait justement et
précisément la même proportion des réfractions que M. Descartes a établie.
A la fin de 1661, Fermat écrivit son principe de moindre temps, qui déclencha
tout.
11. Il avait notamment entretenu une correspondance avec Etienne Pascal, père de
Blaise, et Roberval sur l’équilibre mécanique.
0.6. LES PRINCIPES VARIATIONNELS
15
En 1744, Maupertuis énonça pour la première fois le principe de la moindre
quantité d’action pour la mécanique. Pierre-Louis Moreau de Maupertuis
(1698-1759) avait introduit en 1730 les idées de Newton en France. Même si
l’énoncé et la justification proposés initialement par Maupertuis sont confus,
il s’agit d’une date historique dans l’évolution des idées en physique et, à
l’époque, dans la philosophie. Poursuivant les travaux de Fermat, Maupertuis comprit que, dans des conditions bien déterminées, les équations de
Newton sont équivalentes au fait qu’une quantité, qu’il nomma l’action, soit
minimale. Selon ses propre termes :
« L’Action est proportionnelle au produit de la masse par la vitesse et par
l’espace. Maintenant, voici ce principe, si sage, si digne de l’être suprême :
Lorsqu’il arrive quelque changement dans la Nature, la quantité d’Action
employée pour ce changement est toujours la plus petite qu’il soit possible. »
Pour une particule de masse m, de vitesse v, l’action de Maupertuis est
donc le produit de trois facteurs, la masse, la vitesse, et la distance parcourue,
ou encore
la circulation de la quantité de mouvement le long de la trajectoire :
R
A = mv dl. La formulation et la démonstration du principe de Maupertuis
furent données peu après par Euler, son ami.
Ces principes eurent un grand retentissement au XVIIIe siècle. Que les
lois de la nature puissent se déduire de principes d’optimisation, c’est-àdire d’équilibre entre causes en conflit, ne pouvait que frapper les esprits
au siècle des lumières. Ce Principe d’économie naturelle fascinait. Il réalisait le meilleur accord entre différentes lois de la nature qui semblaient en
opposition, voire incompatibles. On le rattachait volontiers au principe du
« meilleur » de Leibniz.
0.6
Les principes variationnels
Les principes variationnels sont la forme mathématique du superlatif.
Cette formulation se fait en demandant que la valeur d’une quantité typique
du système, soit optimale pour la performance effectivement réalisée par le
système par rapport à ce qu’elle vaudrait si l’on imaginait une performance
différente.
Dans une certaine mesure, les principes variationnels, par leur universalité
dans le monde des choses, peuvent apparaître comme une « méta-théorie »
générale de la physique, voire, un jour peut-être, des autres sciences naturelles
comme la biologie, la psychologie ou les phénomènes sociaux. Ils jouent un
16
Avant-Propos
rôle en économie.
La forme première d’une théorie physique explique un phénomène par
une loi locale. Telles sont les lois de la dynamique de Newton, les lois de
Snell-Descartes, et les lois différentielles de l’électromagnétisme ou de la thermodynamique. Une fois la première pierre de la théorie mise à jour, et après
les premières exploitations de la découverte, on en recherche les principes
sous-jacents et leurs liens avec d’autres schémas.
Les « Principes variationnels » permettent d’exprimer les lois physiques
sous une forme globale. Cette forme permet, bien entendu, de retrouver les lois
locales, mais on découvre qu’elle est plus riche et puissante. Elle permet de
dégager les principes fondamentaux des lois qu’elle manipule. Cela donne une
vision plus féconde au plan des fondements comme à celui des applications.
On retrace cette façon de concevoir les processus et structures physiques
chez les mathématiciens et philosophes grecs. Les Grecs caractérisaient un
segment de droite comme la ligne de plus petite longueur joignant ses extrémités. Héron d’Alexandrie (au 1er siècle avant notre ère) avait démontré
que l’égalité des angles d’incidence et de réflexion en optique géométrique
se ramène au fait que la longueur du chemin parcouru par la lumière entre
la source et l’oeil de l’observateur est la plus courte possible. Dans la même
ligne de pensée, les Aristotéliciens pensaient pouvoir « justifier » que les orbites célestes soient circulaires par le fait qu’à périmètre donné, de toutes les
courbes planes fermées, le cercle est celle qui entoure l’aire la plus grande
(problème dit de l’isopérimètre). 12 Dire que la ligne droite est le chemin le
plus court entre deux points ou que le cercle est la ligne la plus courte qui
entoure une aire plane donnée sont des façons simples de définir ces êtres
géométriques.
De la même façon, en physique, dire que le courant électrique se distribue
dans un réseau de façon telle que la puissance convertie en chaleur est la
plus petite possible est une description de la circulation directe du courant
qui recouvre quantité de cas particuliers sans faire usage de mathématiques
compliquées (bien entendu, les calculs réapparaissent dès que l’on applique
le principe à un cas particulier). La proposition qu’un système physique agit
(ou évolue) de façon telle qu’une certaine fonction qui lui est reliée soit minimum ou maximum, est souvent le point de départ de la recherche théorique
12. La légende dit que Didon, lorsqu’elle fonda Carthage, avait reçu pour condition que
sa ville tienne à l’intérieur d’une peau de taureau. Elle découpa des fines lanières dans la
peau de façon à en faire un énorme cercle.
0.6. LES PRINCIPES VARIATIONNELS
17
et de l’expression ultime des relations entre les faits physiques. Ainsi, les principes variationnels présentent les phénomènes naturels comme des problèmes
d’optimisation sous contraintes. Ils sont présents dans tous les domaines de
la physique (on pourra lire à ce propos les chapitres I,26 et II,19 du cours de
Feynman réf.[5] et le livre de Yourgrau et Mandelstam réf.[6]).
En mécanique, première des sciences physiques si l’on y inclut l’acoustique de Pythagore, on reconnaît que la grande percée physique et philosophique qui mène aux idées actuelles provient de la remise en cause des idées
d’Aristote sur le mouvement 13 . Pour expliquer le mouvement et son évolution, Aristote peuplait l’espace de moteurs. Jean Philopon, philosophe et
grammairien grec (490-566) fut le premier à réfuter les conceptions aristotéliciennes du mouvement. Au travers d’une série passionnante d’observations et
de leur analyse critique, relevons deux questions d’une étonnante modernité.
Lorsque deux corps en mouvement entrent en collision, leur trajectoire est déviée ; comment se fait-il que s’ils se frôlent sans se toucher, leur trajectoire ne
soit pas affectée ? Autrement dit, comment ces « moteurs », qui remplissent
le milieu ambiant, peuvent-ils agir de façon discontinue et imprévisible ? Par
ailleurs, pourquoi est-il plus facile de lancer un objet léger plus haut qu’un
objet lourd ? Philoppon entrevoyait qu’un élan est donné à l’objet lancé par
celui qui le lance.
Il fut suivi 800 ans plus tard par Jean de Buridan (1300-1358). Comme
Philopon, Buridan avait une vision du mouvement comme résultant d’un
équilibre entre des causes en conflit. Ce cadre de pensée est la première
conception moderne de la mécanique. Buridan, Recteur de l’Université de
Paris de 1328 à 1340 était un logicien commentateur d’Aristote. On lui doit
le concept de base, celui « d’impetus » ou d’élan comme source du mouvement, en opposition avec les « moteurs » dont Aristote peuplait l’espace.
Pour Buridan, la nature du mouvement résulte de la mise en oeuvre d’un ensemble d’impetus et de leurs conflits, les lois du mouvement résultant d’une
optimisation de cet ensemble de conflits. Buridan avait, dans la même ligne
de pensée, donné un argument célèbre sur le problème du libre arbitre. Un
âne affamé est à égale distance de deux tas de foin, personne, même pas Dieu
ne peut savoir celui qu’il choisira. Il fallait du courage, de l’autorité et de
l’habileté pour dire cela à la Sorbonne à cette époque.
En balistique au XVIe siècle les artilleurs calculaient le mouvement des
13. On pourra se référer à l’article de Luca Bianchi La flèche d’Aristote : la physique du
mouvement, page 44, Dossier Pour la Science, octobre 2002
18
Avant-Propos
Figure 2 – Extrait d’un manuel d’artillerie polonais Ars Magnae Artilleriae - Pars
prima : Dell’Aqua Praxis, XVIe siècle : exemples de tirs. (Il est permis d’y voir les
prémisses des collisionneurs de particules de la fin du XXe siècle.) Archives de
Casimir Siemienowicz, général d’artillerie de la couronne polonaise et lithuanienne
c
Richard
Orli 2001.
boulets de canon en utilisant le concept d’impetus de Buridan, comme on
peut le voir sur la figure 2. Dans le mouvement du projectile, trois phases
étaient distinguées, qui sont représentées sur la figure 3. Lors de la première,
appelée mouvement violent, la trajectoire est rectiligne et le mouvement se
développe sous l’action de l’impetus fourni par le canon. Dans la troisième,
appelée mouvement naturel, la trajectoire est encore rectiligne, l’impetus
cause du mouvement est celui de la pesanteur, impetus naturel, et le boulet
retombé 14 .
La phase intermédiaire correspond à l’affaiblissement de l’impetus violent
sous l’action de l’impetus naturel et aboutit à une sorte de repos, le media
quies. Cette phase était conçue comme une transition, un compromis, entre
deux états de mouvement contradictoires où le projectile a un mouvement
grosso modo horizontal et uniforme. L’impetus était très en vogue au XVIe
siècle. Leonard de Vinci expliquait qualitativement le mouvement de la toupie
par un conflit d’impetus axiaux.
14. Davantage à la verticale que lors de l’impetus violent. Heureuse coincidence que le
frottement de l’air produise cet effet !
0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 19
Fig. 3 : Phases successives du mouvement d’un boulet de canon dans la théorie de
l’impetus.
0.7
La période moderne, de Lagrange à Einstein et à Feynman
L’enthousiasme métaphysique ne dura guère. Ce n’était pas faute de richesse ou d’esthétisme intellectuel. C’est parce que les principes variationnels
n’ont cessé, depuis, de produire des résultats physiques de plus en plus riches.
C’est l’ambition de ce texte d’en décrire quelques uns.
Leonhard Euler (1707-1783) et Joseph-Louis Lagrange (1736-1813), dont
les travaux furent poursuivis par William R. Hamilton (1805-1865) en posèrent les fondements mathématiques. Ils sont les pères de l’une des pierres
angulaires de la physique théorique contemporaine.
Les conséquences de cette vision de la physique se retrouvent aux sources
de la relativité générale d’Einstein aussi bien que des théories modernes des
interactions fondamentales, les théories de jauge. L’outil mathématique central en est le calcul variationnel. On le doit à Euler qui en avait compris le
fonctionnement et à Lagrange qui, en 1766, apporta une contribution décisive. 15 Le calcul variationnel est un pan étonnant des mathématiques, tant
par son côté fédérateur que par le nombre de questions auxquelles il a permis
de répondre.
15. Euler, qui était malvoyant depuis l’âge de 28 ans, devint complètement aveugle en
cette même année 1766. Il reçut, en 1754, la visite du jeune Lagrange qui lui exposa ses
travaux. Emerveillé par le talent de ce jeune homme, il dissimula un temps ses propres
résultats, pour que le mérite en revienne au seul Lagrange. C’est un exemple, à peu près
unique et maintenant disparu, de courtoisie humaine et de passion pour la science.
20
Avant-Propos
Euler publia en 1744 son traité Methodus inveniendi lineas curvas maximi
minimive proprietate gaudens, qui fondait le calcul des variations, dans la
lignée des travaux de Jacques et Jean Bernoulli (l’ouvrage eut une influence
considérable sur Lagrange). C’est dans ce travail qu’Euler justifia a posteriori
le principe de moindre action de son ami Maupertuis.
Lagrange appartenait à une famille turinoise. Il était particulièrement
doué et précoce. La réaction favorable d’Euler à ses travaux l’encouragea et,
en 1756, il appliqua ses techniques au principe de moindre action, fondement
de la mécanique moderne. Une des contributions majeures de Lagrange est sa
Mécanique analytique où il effectue la synthèse de l’ensemble des méthodes de
statique et de dynamique qu’il avait développées antérieurement. L’ouvrage,
achevé en 1782, ne parut qu’en 1788 à Paris. Lagrange consacra les dernières
années de sa vie à une seconde édition revue et considérablement augmentée
dont le premier volume parut en 1811. La mécanique de Lagrange est aussi
importante dans l’histoire de la Physique, de la Mécanique et des Mathématiques que la mécanique céleste de Newton. Elle sera le point de départ de
toutes les recherches ultérieures, notamment des travaux de Hamilton, qui la
qualifiera de « poème scientifique par le Shakespeare des mathématiques ».
Hamilton, né à Dublin, avait été, lui aussi, un enfant prodige. A l’âge de
dix-neuf ans, il écrivit un travail remarquable sur l’optique. A vingt-trois ans,
il devint professeur d’astronomie à Dublin et astronome royal à l’observatoire
de Dunsink. Il resta toute sa vie fidèle à Dublin et à son observatoire. L’intérêt de Hamilton pour l’optique venait des instruments de son observatoire.
Son mémoire, On caustics (Des caustiques), écrit en 1824, fait date. C’est
peu après qu’il développa et amplifia la mécanique analytique de Lagrange,
en lui donnant sa forme actuelle. Fasciné par les principes variationnels, et
en particulier par la similitude entre le principe de Maupertuis en mécanique
et le principe de Fermat en optique géométrique, il fit en 1830 la remarque
étonnante que les formalismes de l’optique et de la mécanique pouvaient être
unifiés, et que la mécanique newtonienne correspondait à la même limite ou
approximation, que l’optique géométrique par rapport à l’optique ondulatoire ! Cette remarque fut ignorée par ses contemporains ce que déplora en
1891 le célèbre mathématicien Felix Klein. Il est vrai qu’en 1830 aucune expérience ne mettait en évidence le rôle de la constante de Planck. Néanmoins,
à bien des égards, Hamilton peut être considéré comme un précurseur de la
mécanique quantique.
L’objectif central de ce livre est de fournir une description aussi instructive que possible de la mécanique analytique de Lagrange et Hamilton. Ce
0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 21
sont là des pans essentiels de la culture de tout physicien. Mais nous verrons,
au passage, la multitude de leur retombées dans d’autres secteurs. Nous montrerons notamment les liens intimes de la mécanique analytique avec l’optique
et avec la mécanique quantique.
Dans le premier chapitre, nous commencerons par rappeler le principe de
Fermat. Les lois de Descartes prévoient quel sera le chemin suivi par un rayon
lumineux initial donné. Fermat adopte un point de vue plus général. Il se pose
la question de déterminer le chemin effectivement suivi par la lumière pour
aller d’un point à un autre. Ce point de vue permet, on le sait, d’expliquer
les rayons courbes et les mirages, ce que les lois de Descartes ne peuvent pas
faire. Fermat énonça à la fin de 1661 son principe de moindre temps. Cela
nous amènera naturellement au coeur mathématique de notre propos : le
Calcul variationnel d’Euler et Lagrange. C’est un chapitre très riche des mathématiques, mais délibérément nous n’avons pas souhaité l’aborder dans ses
détails mathématiques, amplement traités dans la littérature. Nous souhaitons ici aboutir rapidement aux applications et résultats physiques. D’abord
nous présentons le « Principe de la moindre quantité d’action » de Maupertuis. Ensuite nous passerons en revue quelques applications pour camper le
décor. Nous verrons quelques applications mécaniques simples, ainsi que des
exemples plus originaux comme les lois de Kirchhoff ou l’équation de Poisson
en électrostatique.
Finalement, nous nous tournerons vers un cas complètement analogue
dans son esprit, mais qui fascine par la quantité et la puissance de ses conséquences, en comparaison de la simplicité de l’hypothèse de départ. Il s’agit du
fondement de la thermodynamique statistique 16 En introduisant la technique
des multiplicateurs de Lagrange, et le Principe d’équiprobabilité des configurations, nous verrons émerger une définition étonnamment simple de la notion
de température, accompagnée de sa propriété première qu’est l’égalisation
des températures de systèmes en contact thermique. Puis, nous aboutirons à
la définition statistique et absolue de l’entropie, due à Boltzmann. Cela nous
mènera au principe étonnamment simple : L’équilibre thermodynamique correspond à une situation qui maximise l’entropie compte tenu des contraintes,
c’est à dire qui maximise le désordre compte tenu des contraintes. Sa portée dépasse largement le cadre de la physique. Il a notamment constitué,
on peut le comprendre, une des pierres angulaires dans la construction de
16. Cette section n’est pas reproduite dans le présent polycopié.
22
Avant-Propos
modèles économiques. 17
Le chapitre 2 est consacré à la mécanique analytique de Lagrange. La
fin du XVIIe siècle avait vu le triomphe de la mécanique de Newton, posée
en 1687 dans les "Philosophiae Naturalis Principia Mathematica". Newton
ayant formulé, par ailleurs, la loi universelle d’attraction gravitationnelle,
pouvait expliquer le mouvement des corps célestes. Ce mouvement céleste,
complètement imbriqué dans la notion de temps, hantait les hommes depuis
qu’ils observaient le ciel. L’homme savait maintenant prédire l’état du ciel
avec une précision vertigineuse ! Mais on n’en resta pas là. A la suite de la
synthèse newtonienne, le XVIIIe et le XIXe siècle furent marqués par une
aventure étonnante où l’on découvrit la véritable structure de la mécanique :
une structure géométrique. Une large classe de problèmes peuvent être ramenés à de purs problèmes de géométrie.
Le couronnement de ces idées vint avec Lagrange en 1788, un siècle après
les Principia. Lagrange publia, dans sa « Méchanique Analitique », une nouvelle formulation de la mécanique où il mit en relief cette structure globale
et géométrique. La mécanique analytique de Lagrange repose sur le principe
de moindre action. Lagrange adopte une façon nouvelle de considérer les problèmes de mécanique. Au lieu de déterminer la position et la vitesse d’une
particule à un instant quelconque connaissant son état initial, il se pose la
question de déterminer la trajectoire effectivement suivie par la particule si,
partant d’un point donné à l’instant initial, elle arrive en un certain point à
l’instant final. C’est la même démarche que celle de Fermat pour les rayons
lumineux.
Le formalisme lagrangien est particulièrement bien adapté pour traiter
des lois d’invariance des phénomènes physiques et des lois de conservation qui
en découlent. Cette question est fondamentale, les symétries et invariances
forment l’ensemble de ce que l’on sait a priori sur la physique d’un problème.
Nous verrons évidemment comment la conservation de l’énergie est liée à
l’homogénéité du temps, celle de l’impulsion à l’homogénéité de l’espace, celle
du moment cinétique à l’isotropie de l’espace. Au cours de cette discussion,
nous introduirons la notion fondamentale de moment conjugué de Lagrange
ou encore d’impulsion généralisée, qui joue un rôle central dans toute la suite.
Au chapitre 3, nous présenterons la formulation lagrangienne de l’électromagnétisme. D’abord, nous étendrons nos considérations au cas d’une
17. Voir, par exemple, Jean-Michel Grandmont, Introduction à l’analyse microéconomique, Cours de l’Ecole Polytechnique, Edition 2002.
0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 23
particule relativiste, soit libre soit dans un champ électromagnétique. Le
fondement de notre propos sera précisément l’invariance relativiste. Le principe de moindre action ne peut avoir de sens que s’il détermine le mouvement
d’une particule de la même façon, quel que soit l’état de mouvement relatif de l’observateur. Cela nous permettra de construire le lagrangien. Nous
verrons comment l’impulsion et l’énergie d’une particule libre sont reliées
à sa masse et sa vitesse. Nous démontrerons ainsi que l’ensemble (E/c, p)
forme un quadrivecteur de l’espace-temps en relativité. Ensuite nous passerons à la théorie des champs, vaste problème en lui-même, qui ne peut être
véritablement couvert qu’en un traité spécialement conçu pour lui. En effet, le formalisme lagrangien trouve sa pleine puissance lorsque l’on traite
de systèmes ayant un nombre de degrés de liberté très grand, voire infini.
Nous donnerons les principes de la théorie lagrangienne des champs et son
application au champ électromagnétique. Nous déduirons l’action complète
de l’électromagnétisme.
Le chapitre 4, nous mènera à la formulation dite canonique de la mécanique analytique due à Hamilton. Ce formalisme canonique date de 1834. Il
est plus commode pour un certain nombre de problèmes, notamment la mécanique du point ou d’ensembles de points. Mais il est surtout d’une richesse
impressionnante par ses développements tant mathématiques que physiques.
Ce texte est avant tout orienté vers les applications à la mécanique, mais
nous ferons allusion à quantité d’autres retombées des travaux de Hamilton.
Après avoir décrit le formalisme canonique, qui consiste à décrire l’état d’un
système par les variables conjuguées que sont les positions et les moments
conjugués de Lagrange, et non par les positions et les vitesses, nous présenterons quelques aspects des systèmes dynamiques. Ce type de problème
physique a, en effet, été une extraordinaire source de découvertes tant en
mathématiques qu’en physique. Le fondateur de ce champ d’étude est Henri
Poincaré, en 1885, notamment quand il a étudié le problème des 3 corps. Cela
mène à des problèmes fascinants : les problèmes limites à t = ∞, les attracteurs et les attracteurs étranges, les bifurcations, le chaos etc. L’attracteur
étrange le plus célèbre est sans doute l’attracteur de Lorenz, du nom de son
inventeur Edward N. Lorenz qui le découvrit en 1963 à partir d’un modèle
mathématique de l’atmosphère, et relança de façon spectaculaire, avec l’effet « aile de papillon » en météorologie, l’intérêt pour le chaos, inventé par
Poincaré 80 ans plus tôt.
Nous abordons ensuite, avec les crochets de Poisson, une structure mathématique, beaucoup plus proche de notre propos. Jacobi considérait que c’était
24
Avant-Propos
la plus grande découverte de Poisson, qui, pourtant, avait fait des contributions considérables aux mathématiques, aux probabilités, à la mécanique
analytique et à l’électrostatique. Nous parviendrons ensuite naturellement à
l’étonnante découverte faite par Dirac en 1925. Il y a une parfaite symétrie
entre mécanique analytique et mécanique quantique si l’on fait correspondre
aux crochets de Poisson classiques les commutateurs des observables quantiques (divisés par i~).
La dernière partie de ce chapitre est consacrée à l’équation de HamiltonJacobi, où l’on choisit d’énoncer les lois de la physique directement à partir de
l’action et non plus du lagrangien ou du hamiltonien. Nous verrons comment,
pour les systèmes conservatifs, le flot des trajectoires est orthogonal aux surfaces d’action constante. Cela nous fera redécouvrir le Principe de Maupertuis
sous une forme parfaitement géométrique. Nous verrons alors comment l’optique géométrique apparaît comme limite de l’optique ondulatoire, ainsi que
l’avait découvert Hamilton. Cette démonstration fait intervenir ce que l’on
⊃ ′
nomme l’eikonal (du grec εικ ων
, image) qui est l’analogue optique de l’action. Dans l’approximation des faibles longueurs d’onde dite approximation
eikonale, l’onde se propage avec un vecteur d’onde localement perpendiculaire
aux surfaces sur lesquelles l’eikonal est constant. Ces surfaces sont les fronts
d’ondes géométriques. L’approximation eikonale correspond exactement au
principe de Fermat. L’interprétation géométrique n’est autre que le Principe de Huygens-Fresnel. Finalement, nous montrerons comment le même
cadre de pensée peut être appliqué à la mécanique ondulatoire et à l’équation de Schrödinger. Cela constitue la célèbre approximation semi-classique
de Brillouin, Kramers et Wentzel.
Au chapitre 5 18 , nous formalisons le problème du mouvement d’une particule libre dans un espace courbe. Le chef-d’oeuvre d’Einstein qu’est la
Relativité générale repose sur l’observation étonnante que deux grandeurs
physiques qui n’ont a priori aucun rapport, sont égales (ou strictement proportionnelles). Il s’agit, on le sait, des deux acceptions du concept de masse.
L’une est celle de coefficient d’inertie ou de résistance à l’accélération d’un
corps dans les lois de la dynamique, l’autre est celle de coefficient de couplage
au champ de gravitation. Il n’existe aucun argument a priori qui explique
le pourquoi de cette égalité. Le mouvement d’une particule chargée dans
un champ électromagnétique dépend des deux paramètres indépendants que
sont la masse, coefficient d’inertie, et la charge de la particule, coefficient
18. Ce chapitre n’est pas reproduit dans le présent polycopié.
0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 25
de couplage au champ. Dans un champ gravitationnel, l’égalité de la masse
inertielle et de la masse pesante élimine la masse d’un corps des équations
du mouvement. Deux corps placés dans les mêmes conditions initiales ont
le même mouvement, quelle que soit leur masse. La prise de conscience de
la profondeur de cette constatation a été relativement tardive. L’expérience
historique d’Eötvös en 1890 a été reprise systématiquement depuis. Elle l’est
encore à l’heure actuelle avec des techniques de plus en plus sophistiquées.
L’idée qui sous-tend la Relativité générale est que cette égalité devient naturelle si le mouvement que nous nommons « gravitationnel » est, de fait, un
mouvement libre dans un espace-temps courbe. Einstein racontait qu’en 1907,
alors qu’il travaillait sur la façon d’incorporer la gravitation newtonienne dans
la relativité (celle de l’électromagnétisme ne posant par construction aucun
problème) il eut l’idée la plus « heureuse » de sa vie (« glücklichster Gedanke
meines Lebens »). Il s’était mis à penser aux impressions de quelqu’un qui
tomberait d’un toit ! Pour un tel « observateur » (et, bien entendu, tant qu’il
ne rencontre pas d’autre objet) il n’existe pas de champ gravitationnel (les
italiques sont d’Einstein). S’il « laisse tomber » des objets de ses poches,
ceux-ci restent au repos, ou sont en mouvement uniforme par rapport à lui,
quelle que soit leur nature physique ou chimique. Nous verrons l’idée de base
du « Principe d’équivalence » et quelques unes de ses conséquences, le but
de ce chapitre étant d’utiliser le formalisme lagrangien pour montrer comment l’idée de mouvement dans un espace courbe fournit des éléments pour
construire une théorie où l’égalité des « deux » masses est réalisée de façon
naturelle.
Après avoir défini ce qu’on nomme espace courbe et introduit la notion
fondamentale de métrique de l’espace, nous écrirons le mouvement d’une particule libre dans un tel espace. Cette étude débouchera sur un résultat fondamental : les trajectoires physiques sont les géodésiques de l’espace, c’est-àdire les courbes de longueur minimale (extrémale). C’est là que nous verrons
comment le mouvement d’une particule soumise à un potentiel indépendant
du temps, d’énergie constante, dans l’espace euclidien peut être transformé
dans le mouvement libre de cette particule dans un espace courbe, ce qui
équivaut au Principe de Maupertuis. Ces développements nous permettront
de comprendre la démarche d’Einstein lorsqu’il construisit la relativité générale, ainsi que certaines conséquences de cette théorie. Nous montrerons
trois exemples historiques : la variation de la marche d’une horloge dans un
champ gravitationnel, les corrections à la mécanique céleste newtonienne et
la déviation de la lumière par le champ gravitationnel.
26
Avant-Propos
Ces exemples sont historiques, ils sont également d’une grande actualité.
Comme nous le verrons, la déflexion de la lumière par un champ de pesanteur
joue un rôle considérable en Astrophysique et en Cosmologie au travers de
l’effet de lentille gravitationnelle. Une application est la recherche de la distribution d’une composante baryonique dans la « masse cachée » ou matière
noire de l’univers. Une autre provient de ce que la distribution de masse dans
l’univers, masse des galaxies mais aussi la matière noire, agit comme un instrument d’optique permettant d’observer des objets lointains, donc beaucoup
plus jeunes. Cet effet est celui d’un télescope cosmique naturel, et l’univers
apparaît ainsi comme une galerie de mirages sans fin.
Nous avons, enfin, consacré le chapitre 6 19 à la formulation variationnelle
de la mécanique quantique de Feynman. Richard P. Feynman est peut-être
le physicien théoricien le plus brillant de la seconde moitié du 20e siècle.
Dans son travail de thèse, soutenu en mai 1942 à Princeton, Feynman cherchait à résoudre le problème des corrections de l’électrodynamique quantique
à la masse de l’électron. Ces corrections sont infinies dans une théorie des
champs où l’électron est considéré comme une particule ponctuelle. L’énergie électrostatique ∼ e2 /(4πε0 r0 ) d’une distribution d’extension r0 nulle est,
en effet, infinie. La théorie de la renormalisation consiste à incorporer cette
quantité infinie en redéfinissant la masse « nue » de l’électron (en l’absence
de champ) comme un paramètre non-physique lui-même infini, les deux infinis se compensant l’un l’autre. Feynman découvrit un "principe de moindre
action" qui lui permettait de résoudre le problème en utilisant des potentiels
pour moitié avancés et pour moitié retardés. A cette fin, il avait introduit le
concept mathématique des intégrales de chemins, qui n’a cessé d’être développé depuis. Cette méthode connut un premier triomphe lorsqu’elle permit
de calculer le déplacement de Lamb des niveaux de l’atome d’hydrogène sans
introduire de paramètres de régularisation arbitraires, mais, au contraire,
de gérer les termes infinis d’une manière systématique et bien définie. Bien
loin d’un simple outil technique, le Groupe de renormalisation a révélé, depuis, une profondeur qui le mettent au premier plan de la physique théorique
contemporaine.
Ce n’est que quelques années plus tard que Feynman comprit qu’il pouvait
appliquer ses idées à une formulation variationnelle de la mécanique quantique non relativiste. Il y a deux piliers dans cette approche. Tout d’abord,
Feynman s’intéresse non pas à l’état des systèmes mais à l’amplitude des pro19. Ce chapitre n’est pas reproduit dans le présent polycopié.
0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 27
cessus. C’est une attitude plus réaliste dans la mesure où tout phénomène,
toute expérience, consiste en un processus. Ensuite, Feynman pose le problème de la mécanique quantique dans l’espace-temps. Le principe de Feynman consiste à poser que, de façon générale, dans un dispositif quelconque,
la phase de l’amplitude correspondant à un chemin donné est l’action classique le long de ce chemin divisée par la constante de Planck ~. La somme
de toutes les amplitudes réalisant le processus considéré est un objet mathématique compliqué que l’on nomme une intégrale de chemins, sur laquelle
repose tout le formalisme. Feynman montre que l’on obtient ainsi les relations
d’Einstein et de Broglie, ainsi que l’équation de Schrödinger, les observables
et toute la mécanique quantique usuelle. La physique statistique a profité,
elle aussi, du concept d’intégrale de chemins. D’innombrables résultats ont
été obtenus, et cet outil joue un rôle central dans la théorie quantique des
champs contemporaine.
Si l’on considère des systèmes et processus où l’action S(b, a) classique
est macroscopique, c’est-à-dire beaucoup plus grande que la constante de
Planck ~, la contribution de chemins qui peuvent paraître très proches l’un
de l’autre au sens classique, mais tels que la différence de l’action calculée
sur ces chemins soit, elle aussi, beaucoup plus grande que ~, va être, avec une
forte probabilité, en interférence destructive. La contribution de l’ensemble
de tels chemins à l’intégrale sera par conséquent nulle, chacun annulant la
contribution d’un autre.
Mais, bien entendu, au voisinage de la trajectoire classique xcl (t), l’action
Scl (b, a) est stationnaire. Par conséquent, seuls contribuent de façon appréciable les chemins le long desquels l’action S(b, a) est suffisamment proche de
l’action classique Scl (b, a), la différence étant nettement inférieure à l’unité
~. Autrement dit, dans ces conditions, seul contribue un voisinage infinitésimal de la trajectoire classique, impossible à résoudre expérimentalement
dans ses détails. La « probabilité » de la trajectoire classique est par conséquent égale à un, celle de toute autre trajectoire imaginable et distinguable
expérimentalement de la trajectoire classique est nulle. On voit ainsi la mécanique classique apparaître comme la limite de la mécanique quantique,
pour des actions macroscopiques. En outre, nous verrons que l’amplitude satisfait identiquement l’expression (moderne) du principe de Huygens-Fresnel
en optique.
Par conséquent, le principe de Feynman porte en lui une esthétique unificatrice étonnante après les 5 chapitres précédents. Il consiste à prendre
en compte, dans le calcul de l’amplitude d’un processus quelconque, le plus
28
Avant-Propos
grand « nombre » de chemins possibles, avec la contrainte que des chemins
trop éloignés donnent des interférences destructives. On peut se représenter
cela comme le fait qu’une amplitude est d’autant plus importante que le « volume » de l’ensemble des voies qui y contribuent en cohérence de phase, est
grand. De ce point de vue, la phase d’une amplitude prend un sens physique
et une importance substantielle qu’on ne mesure peut-être pas suffisamment.
***
Jean-Louis Basdevant
Paris, mai 2004
Chapitre 1
Principes variationnels
La nature agit toujours par les voies les plus courtes.
Pierre de Fermat
Ce qui est remarquable dans les principes variationnels est double. D’une
part, ils présentent les structures et processus naturels comme résultant d’un
principe d’optimalité, de l’autre, ils sont universels . Toutes les lois physiques
peuvent s’exprimer sous cette forme globale. Elle permet de retrouver les lois
locales, mais, plus riche et plus puissante, elle dégage les principes fondamentaux des lois qu’elle manipule. Les principes variationnels ont en commun de
présenter les phénomènes naturels comme des problèmes d’optimisation sous
contraintes. L’idée fondatrice dans la physique moderne et sa formalisation,
proviennent de Fermat et du principe qu’on lui doit en optique géométrique.
Fermat lui-même l’appelle principe d’économie naturelle. Le principe de Maupertuis nous apparaît comme une prolongation du principe de Fermat vers
la mécanique. Sa généralisation sous la forme du principe de moindre action
par Euler, Lagrange et ensuite Hamilton lui a donné sa forme définitive sous
laquelle il régit de nos jours toute la physique fondamentale.
La mise à jour des concepts et principes fondamentaux de la mécanique
s’est effectuée au 17e siècle. Copernic ayant donné la notion de repère en 1543,
Galilée énonce le principe d’inertie en 1638 dans son grand ouvrage Discorsi
e dimostrazioni mathematiche intorno a due nove scienze. 1 Un corps soumis
à aucune force a une vitesse constante. Le mouvement rectiligne uniforme est
un état relatif à l’observateur, et non un processus. C’est la variation de la
vitesse qui est un processus résultant d’une action extérieure. Nombreux sont
1. Discours et démonstrations mathématiques concernant deux sciences nouvelles.
29
30
Principes variationnels
ceux qui participèrent à cette évolution : Tycho Brahe, Kepler, Descartes, le
Père Mersenne, Roberval, Huygens, Varignon etc.
Le couronnement vint avec la synthèse de Newton, en 1687, les "Philosophiae Naturalis Principia Mathematica". Newton y posa ses 4 lois : principe
d’inertie, loi de composition des forces, proportionnalité de l’accélération et
de la force, principe de l’action et de la réaction. Il formula, par ailleurs, la
loi universelle d’attraction gravitationnelle qui lui permettait d’expliquer les
lois de Kepler et le mouvement des corps célestes. Ce mouvement céleste,
complètement imbriqué dans la notion de temps, hantait les hommes depuis
qu’ils observaient le ciel. L’homme savait maintenant prédire l’état du ciel
avec une précision vertigineuse !
Mais on n’en resta pas là. A la suite de la synthèse newtonienne, le XVIIIe
et le XIXe siècle furent marqués par une aventure étonnante. Sous l’impulsion de d’Alembert, de Maupertuis, des frères Bernoulli (notamment Daniel),
d’Euler et de Lagrange, puis de Hamilton, on découvrit la véritable structure
de la mécanique gouvernée par un principe variationnel global.
D’Alembert, qui le premier avait compris l’importance du concept abstrait de masse au travers de la quantité de mouvement et de sa conservation,
s’attaqua au concept abstrait de force introduit par Newton. Pour lui, le
mouvement est le seul phénomène observable, tandis que la « causalité motrice » reste une abstraction. D’où l’idée d’étudier non pas telle trajectoire
particulière de la théorie mais l’ensemble des mouvements qu’elle prévoit
(conception tout à fait moderne des forces, ou interactions).
Le « Principe de la moindre quantité d’action », énonçé en 1744 par
Maupertuis pour la mécanique marque une date historique dans l’évolution
de ces idées en physique et, à l’époque, dans la philosophie. Le couronnement
vint avec Lagrange en 1788, un siècle après les Principia. Lagrange publia,
dans sa « Méchanique Analitique », une nouvelle formulation de la mécanique
où il mit en relief cette structure globale. 2
«On ne trouvera point de Figures dans cet ouvrage. Les méthodes que j’y
expose ne demandent ni constructions, ni raisonnements géométriques ou
méchaniques, mais seulement des opérations algébriques, assujetties à une
marche régulière & uniforme. Ceux qui aiment l’Analyse, verront avec plaisir
la Méchanique en devenir une nouvelle branche, & me sauront gré d’en avoir
2. Il y a de nombreux livres sur la mécanique analytique. Nous recommandons, bien
entendu, le « grand classique » de Landau et Lifshitz [9], le remarquable ouvrage de
Herbert Goldstein Classical Mechanics [10] aussi clair que complet, et l’ouvrage moderne
en langue française de Guignoux et Silvestre-Brac [11].
1.1. PRINCIPE DE FERMAT
31
étendu ainsi le domaine. » écrivait M. de La Grange dans sa Méchanique
Analitique.
Dans la partie 1 de ce chapitre, nous reprenons le principe de Fermat, et
notamment la démonstration par ce dernier des lois de la réfraction. Fermat
ne connaissait pas la vitesse de la lumière et les indices de réfraction. En
supposant que le temps mis par la lumière à parcourir une certaine distance
dans un milieu est proportionnel à la « résistance » de ce milieu au passage
de la lumière, Fermat énonça à la fin de 1661 son principe de moindre temps.
Il l’appella « principe d’économie naturelle ». On sait que ce principe explique les rayons courbes, responsables des mirages, qui ne peuvent pas être
expliqués par les lois de Snell-Descartes. Nous passons en revue qualitative
quelques exemples.
Dans la partie 2, nous exposerons le « Principe de la moindre quantité
d’action », énonçé en 1744 par Maupertuis pour la mécanique qui caractérise une trajectoire physique par le fait que la circulation de la quantité
de mouvement le long d’une trajectoire physique est minimale. Le principe
s’applique au cas où l’énergie est conservée.
La partie 3 expose finalement le principe de moindre action de Lagrange
et Hamilton comme principe fondateur de la mécanique analytique. Sous sa
forme généralisée à la théorie des champs ce principe est même devenu un
principe fondamental de toute la physique ! Lagrange propose de déterminer
la trajectoire effectivement suivie par la particule si, partant de r1 , à l’instant
t1 , elle arrive en r2 à t2 , au lieu de déterminer sa position r(t) et sa vitesse v(t)
à l’instant t connaissant son état initial {r(0), v(0)}. C’est la même démarche
que celle de Fermat pour les rayons lumineux. Le principe qui est à l’origine
de la réponse à cette question est celui de moindre action. L’introduction à
ce nouveau concept d’action est donc un des objectifs principaux de ce cours.
1.1
Principe de Fermat
Comme nous l’avons dit, tout est né vers 1637 d’une dispute entre Descartes et Fermat à propos de la notion de démonstration, à la suite de la
publication de la Dioptrique dans le Discours de la Méthode. Les lois de
Descartes prévoient quel sera le chemin suivi par un rayon lumineux initial
donné. Fermat adopte un point de vue plus général. Il se pose la question
de déterminer le chemin effectivement suivi par la lumière pour aller de A à
B. Ce point de vue permet, on le sait, d’expliquer les rayons courbes et les
32
Principes variationnels
mirages, ce que les lois de Descartes ne peuvent pas faire.
Fermat comprend (comme l’avait fait Héron d’Alexandrie) que la loi de
la réflexion est une propriété géométrique de la longueur optique des rayons.
La démonstration est schématisée sur la figure 1.1.
Figure 1.1 – Rayons lumineux possibles entre l’émetteur A et l’observateur B
lorsqu’il y a réflexion sur un plan. B’ étant le symétrique de B par rapport au
miroir, la longueur AOB’ est la même que la longuer de AOB. Le chemin le plus
court entre A et B’ est une ligne droite. Un chemin AFB est plus long quel que
soit F6=O.
Soit un émetteur A et observateur B. On suppose que la lumière émise par
A est réfléchie par un miroir plan avant d’atteindre B. Soit B’ le symétrique
de B par rapport au miroir, et O l’intersection du miroir et de la droite AB’
(figure 1.1). La longueur AOB’ est la même que la longuer de AOB. Le chemin
le plus court entre A et B’ est bien évidemment une ligne droite. Un chemin
AFB où F6=O est tel que par inégalité triangulaire (ou par définition d’une
ligne droite) AF+FB’>AB’, et cela quelque soit F. La géométrie élémentaire
montre alors que les angles d’incidence i et de réflexion r sont égaux pour le
chemin AOB.
33
1.1. PRINCIPE DE FERMAT
1.1.1
Réfraction
Concernant les lois de la réfraction, Descartes avait été obligé de supposer
que la vitesse de la lumière dans la matière (dans un milieu dense) était
supérieure à celle dans le vide (ou dans un milieu dilué) 3 . C’est cela, tout
autant que le manque de rigueur de la « démonstration » de Descartes, qui
avait fâché Fermat. Celui-ci était convaincu que l’on pouvait faire les choses
correctement : « Il me semble qu’un peu de géométrie pourra nous tirer
d’affaire ».
Poussé par les critiques des partisans de Descartes, Fermat ne résolut le
problème de la réfraction que beaucoup plus tard, en 1661. L’essentiel de
son raisonnement tient dans l’hypothèse que la vitesse de la lumière dans un
milieu dense est, au contraire, inférieure à celle dans un milieu dilué.
Soit (xOy) le plan séparant les deux milieux, d’indices n1 et n2 4 . La
source est en A, l’observateur en B, comme représenté sur la figure (1.2).
Soient H et H ′ les projections de A et B sur l’axe x. On note h la distance
de A à la surface et h′ celle de B. La distance HH ′ est l. On considère un
chemin AOB et on note x la distance HO. Il s’agit de minimiser le chemin
optique n1 AO + n2 OB. Par le théorème de Pythagore, on a
AO 2 = h2 + x2 ,
OB 2 = h′2 + (l − x)2
.
Le temps T mis par la lumière pour parcourir ce chemin est
T = (n1 AO + n2 OB)/c .
(1.1)
Fermat, dans sa preuve, démontre que pour tout chemin voisin AO ′ B, qui
s’obtient de AOB par un déplacement O → O ′ sur l’axe horizontal, le temps
de parcours T ′ ne diffère de T que par une quantité de deuxième ordre dans
la distance OO ′ [6]. Pour nous, connaissant le calcul différentiel, il est plus
simple à chercher x tel que (1.1) soit minimal. En dérivant cette expression
3. Cette idée provient vraisemblablement du fait que beaucoup de dioptres étudiés
étaient des liquides dont la surface est horizontale, c’est-à-dire perpendiculaire à la direction de la gravité. Comme le rayon lumineux se rapproche de la verticale lorsqu’il passe,
par exemple, de l’air dans l’eau, il semblait intuitif de supposer qu’il « tombait » plus vite.
4. Fermat ne connaissait la vitesse de la lumière ni les indices de réfraction ; il parlait
seulement de la « résistance » d’un milieu dense au passage de la lumière. Il supposait que
le temps mis à parcourir une distance L dans le milieu est proportionnel à cette résistance
ce qui lui paraissait plus conforme au bon sens que l’inverse.
34
Principes variationnels
A
h
φ1
i1
n1
H’
O
x
H
φ2
i2
n2
h’
B
Figure 1.2 – Rayon lumineux possible entre l’émetteur A et l’observateur B
lorsqu’il y a réfraction par une surface plane séparant deux milieux d’indices n1
et n2 . H et H ′ sont les projections de A et B sur cette surface. On note h la
distance de A à la surface et h′ celle de B. La distance HH ′ est l. On considère un
chemin AOB et on note x la distance HO. Il s’agit de minimiser le chemin optique
n1 AO + n2 OB.
par rapport à x, et en écrivant que la dérivée dT /dx est nulle, on obtient
√
Mais, bien évidemment,
√
n2 (l − x)
n1 x
=p
h2 + x2
h′2 + (l − x)2
x
= cos φ1 = sin i1 ,
h2 + x2
et
.
(l − x)
p
= cos φ2 = sin i2
h′2 + (l − x)2
(1.2)
,
(1.3)
où les angles φ1 et φ2 sont indiqués sur la figure, et i1 et i2 sont les angles
d’incidence et de réfraction. Par conséquent, on obtient la loi de DescartesSnell
n1 sin i1 = n2 sin i2 .
(1.4)
En outre, on voit que cet extremum est bien un minimum : d2 T /dx2 > 0.
Ce résultat fascine Fermat : Le fruit de mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux qui fût jamais. Car [...] j’ai trouvé
que mon principe donnait justement et précisément la même proportion des
réfractions que M. Descartes a établie. A la fin de 1661, Fermat écrit son
1.1. PRINCIPE DE FERMAT
35
principe de moindre temps, qui déclenche tout. Il l’appelle « principe d’économie naturelle » en ajoutant « la nature agit toujours par les voies les plus
courtes ». Comme nous l’avons dit, ce principe aura un grand retentissement
au 18e siècle. Il sera repris par Maupertuis en mécanique.
Sauvetage en mer
Le résultat ci-dessus se transpose à quantité de situations. Un exemple,
parmi d’autres, est celui du trajet optimal que doit suivre un sauveteur, sur
une plage puis dans l’eau, pour aller secourir un baigneur en difficulté. La
vitesse du sauveteur sur terre, v1 , et dans l’eau, v2 , ne sont pas les mêmes.
La trajectoire correspondante, qui se schématise comme en figure 1.2, obéit
à
sin i1 /v1 = sin i2 /v2 .
1.1.2
Rayons courbes
Considérons un problème bidimensionnel (xOz) , comme la propagation
de la lumière dans une atmosphère fixe, mais de densité variable, si bien que
l’indice de réfraction varie continûment d’un point à un autre. Le schéma est
représenté sur la figure 1.3.
Les rayons se propagent selon des courbes et non des droites, et la position
angulaire optique d’un objet ne correspond pas à sa position angulaire géométrique. Ces rayons courbes, qui sont responsables des mirages, ne peuvent pas
s’expliquer par les lois de Snell-Descartes. Du point de vue mathématique, il
s’agit de trouver la trajectoire z = Z(x) d’un rayon lumineux se propageant
dans un milieu d’indice n(z, x) , ou encore n(z) si le système est invariant
par translation selon Ox , et allant d’un point d’émission A en (z0 , x0 ) à un
observateur B en (z1 , x1 ). Le temps dτ mis par la lumière pour aller de [x, z]
à [x + dx, z + dz] est
√
dℓ
dz 2 + dx2
dτ = n(z) = n(z)
.
c
c
Nous devons trouver la fonction Z(x) qui minimise le temps passé sur la
trajectoire, c’est-à-dire, qui minimise l’intégrale
Z
Z
p
1 B
1 B
(1.5)
T =
n dℓ =
n(z) 1 + z ′ (x)2 dx
c A
c A
36
Principes variationnels
Figure 1.3 – Rayon lumineux entre l’émetteur A et l’observateur B dans un
milieu d’indice de réfraction variable. La coordonnée z est la hauteur, x la distance
horizontale. On suppose le problème invariant par translation dans la direction y
perpendiculaire à la figure. La direction apparente du point A vu par B est celle
de la tangente du rayon arrivant en B.
compte tenu des contraintes : z(x = x0 ) = z0 et z(x = x1 ) = z1 . Nous avons
posé z ′ (x) = (dz/dx)(x) .
Au chapitre 2 nous déduirons une équation différentielle pour la trajectoire temporelle du rayon lumineux à partir de (1.5) qu’on sait résoudre
explicitement dans des cas particuliers. Mais qualitativement, ce qui va se
passer est déjà évident. Si n(z) augmente avec z le rayon aura une courbure
positive comme indiqué sur la figure 1.3. Pour n(z) diminuant avec z ce sera
le contraire. Et l’effet sera plus prononcé pour un gradient important de n(z) .
1.1.3
Mirages
C’est dans ce type de situation que l’on observe des mirages. On sait
qu’une route fortement chauffée l’été peut apparaître par endroits comme
un lac. C’est un mirage du type schématisé sur la figure 1.3. L’indice de
réfraction est faible au niveau de la route où l’air est moins dense. Il est plus
élevé en hauteur où la température est plus faible. Le « lac » est le reflet
du ciel. Dans ce cas de figure, on dit qu’il y a un mirage inférieur . L’image
1.1. PRINCIPE DE FERMAT
37
Figure 1.4 – Schémas de mirages inférieur (haut) et supérieur (bas).
apparente est au dessous de l’objet. Cela est décrit sur la figure 1.4.
Comme on le comprend sur l’exemple simple ci-dessus, une dépendance
de l’indice de réfraction n(z) plus complexe donnera lieu à des phénomènes
variés. Des variations d’indice peuvent se produire dans le sens inverse lorsque
la température en altitude est supérieure à la température à un niveau inférieur. Ce type de situation, qui se présente par exemple pour des rayons
lumineux passant au voisinage du sommet d’une colline chauffée, provoque
des mirages supérieurs. On peut alors voir un objet caché (au sens géométrique) derrière une colline.
On voit le soleil se coucher bien après qu’il ait franchi l’horizon géographique. En effet, comme le montre la figure 1.5, lorsque le soleil est au voisi-
38
Principes variationnels
Direction apparente
du soleil
Atmosphère
Terre
Rayon lumineux
Direction du soleil
Figure 1.5 – Directions réelle et apparente du soleil au voisinage de l’horizon.
Elles diffèrent d’environ un demi degré.
nage de l’horizon, ses rayons traversent un milieu d’indice fortement variable,
plus dense au sol qu’en altitude, avec en outre de possibles fluctuations atmosphériques en fonction de l’altitude et du lieu. Au coucher du soleil, l’angle
entre la direction optique du soleil et sa direction géométrique est d’environ
un demi degré. Sa direction géométrique est bien au dessous de l’horizon
(voir la référence [5] pour d’autres exemples).
Les mirages sont particulièrement nombreux dans l’arctique et dans l’antarctique où pendant une durée très longue, la ligne de visée traverse une épaisseur d’atmosphère considérable. Sur cette distance, la densité, la composition
et la température de l’atmosphère peuvent varier énormément. Il en résulte
des effets spectaculaires. La figure 1.6 est une image prise lors d’une expédition allemande du Germania dans l’arctique en 1888. Elle est très riche
car, pour chacun des deux bateaux, il y a deux mirages supérieurs, inversés
l’un par rapport à l’autre. Entre les deux bateaux, on distingue un iceberg.
Cette image fait évidemment penser à la légende du Hollandais volant (ou
du Vaisseau fantôme) des marins du Cap de Bonne espérance (à l’autre bout
du monde) 5 . La figure 1.7 montre deux mirages supérieurs photographiés en
Scandinavie par Pekka Parviainen, un mirage du soleil et un mirage d’un
cargo.
Les variations d’indice de l’atmosphère ne sont pas seulement à l’origine
5. Le « Hollandais volant » était un navigateur prestigieux. Il prétendait pouvoir doubler le Cap de Bonne Espérance quelles que fussent les conditions météorologiques. Pendant
des années après sa disparition dans une tempête épouvantable, d’innombrables navigateurs affirmèrent avoir revu son navire, notamment dans le ciel, preuve que les éléments
n’avaient rien pu contre lui.
1.1. PRINCIPE DE FERMAT
39
Figure 1.6 – Mirages supérieurs dédoublés observés par des marins du Germania
pendant une expédition dans l’arctique en 1888. Avec l’aimable autorisation de
Roger Lapthorn ; tous droits réservés.
des mirages. Ils provoquent aussi des effets de lentille qui entraînent des
grandissements apparents considérables. On peut ainsi voir des îles, bateaux,
rivages distants de plusieurs centaines de kilomètres. Finalement l’indice varie
avec la fréquence de la lumière de façon que les effets sont différents selon la
décomposition spectrale de la lumière. Cet effet ajouté à la diffusion de la
lumière dans l’atmosphère terrestre est à l’origine du quasi-mythique « rayon
vert » au coucher du soleil [1] qu’on peut observer et photographier (voir
Pekka Parviainen dans http ://virtual.finland.fi/finfo/english/mirage2.html).
40
Principes variationnels
Figure 1.7 – Mirages supérieurs du soleil au couchant et d’un
cargo dans l’arctique. Avec l’aimable autorisation de Pekka Parviainen
<[email protected]> ; tous droits réservés. Voir aussi le site
http ://virtual.finland.fi/finfo/english/mirage2.html
1.2
Principe de Maupertuis
C’est en 1744 que Maupertuis énonça pour la première fois le principe
de la moindre quantité d’action pour la mécanique. Même si l’énoncé et la
justification proposés initialement par Maupertuis sont confus, il s’agit là
d’une date historique dans l’évolution des idées en physique et, à l’époque,
dans la philosophie. Pour une particule de masse m, de vitesse v, l’action de
Maupertuis est le produit de trois facteurs, la masse, la vitesse, et la distance
parcourue. En fait, il s’agit de
R la circulation de la quantité de mouvement le
long de la trajectoire : A = mv dl. La formulation et la démonstration du
principe de Maupertuis furent données peu après par Euler.
En termes actuels on peut considérer le principe de Maupertuis comme
un cas particulier du principe de moindre action, qui sera exposé au para-
41
1.3. LE PRINCIPE DE MOINDRE ACTION
graphe suivant. On se limite aux systèmes conservatifs (c’est à dire les forces
dérivent d’un potentiel), et on demande que l’énergie soit une constante du
mouvement, c’est à dire conservée. Pour un seul point matériel de masse m
placé dans un potentiel V (r) on note v la vitesse et v sa norme. Si son énergie
est une constante du mouvement notée E, sa valeur est
1
E = mv 2 + V (r) .
2
L’action de Maupertuis est alors
Aa,b =
Z
b
a
mv dl ≡
Z bp
a
2m(E − V ) dl ,
(1.6)
où dl est l’élément de longueur sur la trajectoire. Le principe de Maupertuis
dit que la trajectoire effectivement suivie par la particule pour aller de a à b
avec une énergie E fixée est celle qui rend (1.6) minimum.
Dans le chapitre 2 nous verrons que les équations de mouvement de Newton sont en accord avec ce résultat. Ici nous pouvons déjà constater la parfaite analogie de (1.6) et de (1.5) qui se transforment l’une dans l’autre par
le remplacement
p
2m(E − V ) ↔ n/c .
Ceci veut dire que la trajectoire sélectionée par le principe de Maupertuis
est une trajectoire minimale
par rapport à une échelle de longueur qui varie
p
localement comme 2m(E − V ), de la même manière que la trajectoire de
Fermat minimise la longueur en unités proportionnelles à l’indice n . Dans
les deux cas on peut donc décrire les trajectoires sélectionnées comme trajectoires minimales par rapport à une métrique qui varie localement selon
les propriétés physiques du système considéré. On entrevoit ainsi que le problème mécanique est ramené à un problème géométrique : le mouvement
d’une particule, soumise à des forces dérivant d’un potentiel, dans un espace plat euclidien, peut être considéré comme un mouvement libre d’une
particule dans un espace courbe (elle suit alors des trajectoires de longueur
minimale ou «géodésiques»). Einstein avait cette idée en tête dès 1908 lorsqu’il construisait la Relativité Générale. Pour plus d’explications sur ce point
on peut se référer à [1].
42
Principes variationnels
trajectoire réelle X(t)
x2 , t2
x1 , t1
trajectoire possible x(t)
Figure 1.8 – Exemples de trajectoires partant de x1 à l’instant t1 et aboutissant
en x2 à l’instant t2 . Parmi toutes ces trajectoires, la trajectoire physique effectivement suivie par la particule est celle qui rend l’action S extrémale.
1.3
Principe de moindre action
Dans sa Méchanique Analitique, Lagrange propose de considérer les problèmes de mécanique de la façon suivante. Au lieu de déterminer la position
r(t) et la vitesse v(t) d’une particule à l’instant t connaissant son état initial
r(0), v(0), il pose la question : quelle est la trajectoire effectivement suivie
par la particule si, partant de r1 , à l’instant t1 , elle arrive en r2 à t2 ?
Pour simplifier, considérons d’abord le cas d’une seule dimension d’espace.
Parmi l’infinité de trajectoires possibles (voir figure 1.8), quelle est la loi qui
détermine la bonne ? Lagrange sait qu’on peut répondre à cette question par
le « principe d’économie naturelle » de Fermat, repris par Maupertuis.
Le principe variationnel comme nous le présentons ici n’a pas la forme utilisée par Lagrange 6 . Il a été reformulé par Hamilton en 1834. Nous l’exposons
sous cette forme, plus générale que celle proposée par Lagrange.
On pose
1. Tout système mécanique est caractérisé par une fonction de Lagrange
ou lagrangien L(x, ẋ; t), dépendant de la coordonnée x, de sa dérivée
par rapport au temps ẋ = dx/dt, et éventuellement du temps 7 . Les
6. le principe variationnel de Lagrange s’applique aux systèmes conservatifs, et porte
sur l’action réduite (voir ch. 4.4.2)
7. pour s degrés de liberté nous avons évidemment L(x1 , . . . , xs , ẋ1 , . . . , ẋs ; t)
43
1.3. LE PRINCIPE DE MOINDRE ACTION
quantités x et ẋ sont appelées variables d’état. Par exemple, pour le
mouvement unidimensionnel d’une particule dans un potentiel V (x, t),
nous verrons que le lagrangien vaut
1
L = mẋ2 − V (x, t) .
2
(1.7)
2. Pour toute trajectoire x(t), partant de x1 à l’instant t1 et allant vers x2
à l’instant t2 on définit l’action S par l’intégrale
S=
Z
t2
t1
L(x, ẋ; t) dt
.
(1.8)
Le principe de moindre action dit que la trajectoire physique effectivement suivie X(t) est telle que S est minimale, ou, plus généralement, extrémale.
44
Principes variationnels
Chapitre 2
Mécanique analytique et calcul
variationnel
Au commencement était l’action.
Johann Wolfgang von Goethe
Nous avons établi le principe de base de la mécanique analytique. Il nous
faut maintenant analyser ses conséquences. Cela nous amènera naturellement
au coeur mathématique de notre propos : le Calcul variationnel d’Euler et
Lagrange qui sera présenté en partie 1. C’est un pan étonnant des mathématiques, tant par son côté fédérateur que par le nombre de questions auxquelles
il a permis de répondre. Nous en déduirons les équations d’Euler-Lagrange qui
sont les équations de mouvement de la mécanique analytique. Nous n’aborderons pas les détails mathématiques du calcul variationnel, amplement traités
dans la littérature [7], mais passerons rapidement aux résultats physiques.
Dans la partie 2 nous analysons la forme du lagrangien dans les situations le plus simples. Elle se déduit largement de concepts de symétrie et
d’invariance.
La partie 3 est consacrée aux lois d’invariance des phénomènes physiques
et aux lois de conservation qui en découlent. Le formalisme lagrangien est
particulièrement bien adapté pour traiter de cette question. Nous verrons
comment la conservation de l’énergie est liée à l’homogénéité du temps, celle
de l’impulsion à l’homogénéité de l’espace, celle du moment cinétique à son
isotropie. Au cours de cette discussion, nous introduirons la notion fondamentale de moment conjugué de Lagrange ou encore d’impulsion généralisée, qui
joue un rôle central dans toute la suite.
45
46
Mécanique analytique et calcul variationnel
Ensuite nous introduirons dans la partie 4 un outil technique important,
dû lui aussi à Lagrange, les multiplicateurs dits de Lagrange.
Puis dans la partie 5, nous passerons en revue quelques applications.
D’abord, nous revenons - muni du calcul variationnel - aux rayons courbes.
Ensuite nous regardons la forme d’une corde pesante, les lois de Kirchhoff,
l’équation de Poisson en électrostatique et les bulles de savon.
2.1
Le calcul variationnel d’Euler et Lagrange
Considérons d’abord un système uni-dimensionnel. Le principe de moindre
action d’Euler et Lagrange prétend d’abord que la dynamique du système est
déterminée par un lagrangien L(x, ẋ; t) dépendant de la position, de la vitesse et (éventuellement) explicitement du
La trajectoire physique est
R ttemps.
2
sélectionnée par le fait que l’action S = t1 L(x, ẋ; t) dt soit extrémale.
Le problème posé est donc de trouver une fonction, ou une famille de fonctions, qui minimise une certaine intégrale. Sa résolution se fait par le calcul
des variations ou encore le Calcul variationnel. On le doit à Euler qui en avait
compris le fonctionnement et à Lagrange qui apporta d’importantes contributions. Le lecteur pourra consulter le cours de Jean-Pierre Bourguignon [7]
comme traité mathématique du calcul variationnel.
Nous cherchons donc la fonction x(t) d’une variable réelle t qui minimise
(ou maximise) l’intégrale
S=
Z
t2
t1
(2.1)
L(x(t), ẋ(t); t) dt ,
où les extrémités t1 et t2 sont fixes, où ẋ(t) ≡ dx/dt et où le lagrangien L est
une fonction connue 1 . Supposons qu’il existe une solution, la vraie trajectoire, que nous notons x = X(t). Considérons une trajectoire x(t) infiniment
voisine de X(t), partant elle aussi de x1 à t1 , et aboutissant en x2 à t2
x(t) = X(t) + δx(t) ,
ẋ(t) = Ẋ(t) + δ ẋ(t) ,
δ ẋ(t) =
d
δx(t)
dt
(2.2)
1. C’est exactement, faut-il le préciser, le type de problème posé dans l’équation 1.5,
sachant qu’en (1.5) la variable p
x prend le rôle de t et la variable z prend le rôle de x . On
remarque que la fonction n(z) 1 + z ′ (x)2 en (1.5) ne dépend pas de x qu’implicitement
à travers de z(x) , et non pas explicitement, comme il serait le cas, par exemple, si n était
fonction de x et de z en même temps.
47
2.1. LE CALCUL VARIATIONNEL D’EULER ET LAGRANGE
avec par hypothèse
(2.3)
δx(t1 ) = δx(t2 ) = 0 .
Au premier ordre en δx, la variation de S est
Z t2 ∂L
∂L
δx(t) +
δ ẋ(t) dt .
δS =
∂x
∂ ẋ
t1
(2.4)
Le second terme peut être intégré par parties puisque par définition δ ẋ =
(d/dt)δx. Les termes tout intégrés ne contribuent pas, car δx(t1 ) = δx(t2 ) =
0. Par conséquent, la variation δS s’écrit :
Z t2 ∂L
d ∂L
δx(t) dt .
(2.5)
−
δS =
∂x
dt ∂ ẋ
t1
Le principe de moindre action affirme que δS doit être nul quelle que soit la
variation infinitésimale δx(t). Par conséquent, l’équation du mouvement qui
détermine la trajectoire effectivement suivie, est l’équation différentielle du
second ordre appelée
Equation d’Euler-Lagrange :
d ∂L
∂L
( )=
dt ∂ ẋ
∂x
.
(2.6)
On vérifiera sans peine sur le cas simple (1.7) que l’on retrouve bien l’équation
du mouvement habituelle
∂V
mẍ = −
≡f
∂x
où f est la force.
La généralisation à s degrés de liberté (xi , ẋi ), i = 1, . . . , s est immédiate.
Le lagrangien est une fonction L({xi }, {ẋi }; t) des variables {xi } et {ẋi } et
(éventuellement) du temps t, et les équations du mouvement sont données
par l’ensemble des équations de Euler-Lagrange
d ∂L
∂L
(2.7)
=
i = 1, . . . , s .
dt ∂ ẋi
∂xi
Pour une particle dans l’espace R3 nous employons la notation
 ∂L 

 
x
∂x
∂L
∂L

~ rL = 
~ vL = 
, où r =  y  ,
≡∇
≡∇
 ∂L

∂y 
∂r
∂v
∂L
z
∂z
∂L
∂vx
∂L
∂vy
∂L
∂vz


 (2.8)
48
Mécanique analytique et calcul variationnel
de façon que l’équation (2.7) s’écrit
∂L
d ∂L
=
dt ∂v
∂r
2.2
(2.9)
.
Le lagrangien
Non-unicité du Lagrangien
Pour savoir utiliser le principe de moindre action il faut évidemment comprendre quel lagrangien s’associe à quel système. La première remarque à faire
est peut-être décourageante, puisque le lagrangien d’un système donné n’est
pas unique. On vérifiera notamment que si on lui ajoute une dérivée totale
par rapport au temps d’une fonction quelconque f ({xi }, t),
L′ = L +
d
f ({xi }, t)
dt
(2.10)
les équations du mouvement demeurent inchangées. Ceci suit directement du
fait que l’intégrale du terme ajouté ne change pas dans une variation des
xi (t) qui satisfait δxi (t1 ) = δxi (t2 ) = 0 2 .
Rappelons qu’il est important de distinguer la signification des derivées
totale d/dt et partielle ∂/∂t par rapport au temps. La dervivée totale d/dt
tient compte aussi de la dépendance en temps due à l’évolution temporelle
des coordonnées et vitesses le long de la trajectoire. Pour une seule variable
x
d
∂L
∂L
∂L
L(x, ẋ; t) =
ẋ +
ẍ +
.
dt
∂x
∂ ẋ
∂t
6= 0 on parle d’un lagrangien qui dépend explicitement du
Au cas où ∂L
∂t
temps. On appelle «système isolé» un système lagrangien avec ∂L
= 0.
∂t
Forme du Lagrangien
Cherchons donc le lagrangien le plus simple associé à un système physique
donné. Commençons par le cas le plus élémentaire, celui d’une particule libre
dans l’espace R3 . Son lagrangien provient du principe d’inertie, ou encore de
l’invariance sous les transformations de Galilée (voir réf [9]) :
2. D’ailleurs on se convainc facilement de l’identité
constat explicitement.
d ∂ df
dt ∂ ẋi dt
=
∂ df
∂xi dt ,
pour vérifier ce
49
2.2. LE LAGRANGIEN
1. Il n’y a pas d’origine des temps privilégiée, par conséquent ∂L/∂t = 0 .
2. Il n’y a pas d’origine d’espace privilégiée, par conséquent ∂L/∂xi = 0 .
3. Il n’y a pas de direction dans l’espace privilégiée ; cette invariance par
rotation implique que L ne dépend que du carré de la vitesse, soit
L(v 2 ).
Le forme la plus simple du lagrangien d’une particule libre est alors
L = Kv 2 où K est une constante qu’on choisira comme étant égale à
m/2. On obtient donc pour une particule libre
Le lagrangien d’une particule libre L =
m 2
v
2
.
(2.11)
On voit facilement qu’un choix plus général, sous la forme de L =
f (v 2 ) , (f différentiable), mène à la même équation du mouvement 3 .
4. Dans ces conditions, dans un référentiel animé d’une vitesse constante
V par rapport au premier, le lagrangien devient
L′ =
d
m
(v + V)2 = L + (mr · V + mV 2 t/2) ,
2
dt
et les équations du mouvement sont les mêmes dans les deux référentiels
d’après le paragraphe précédent, voir (2.10). On peut donc revenir à
(2.11).
5. Revenant au cas d’une particule soumise à un champ de force, on voit
que le terme d’énergie potentielle dans (1.7) n’est qu’une définition de
la force. Nous souhaitons, bien entendu, retrouver la loi fondamentale
de Newton, et ce choix nous le garantit lorsque les forces dérivent de
potentiels.
6. Généralisation
Le lagrangien d’un ensemble de N points matériels dans un référentiel
inertiel, exposés au potentiel V (r1 , . . . , rN ; t) - qui inclut les potentiels
d’interaction entre particules - est
N
L=
3. on excluera f (x) =
√
x
1X
mi ṙ2i − V (r1 , . . . , rN ; t)
2 i=1
.
(2.12)
50
Mécanique analytique et calcul variationnel
Fonctionnement du principe d’optimisation
Il est remarquable que les lois de la mécanique se déduisent d’un principe
variationnel . La trajectoire physique est celle qui minimise ou optimise l’action. Cette optimisation apparaît ici comme réalisant un «compromis» entre
l’effet de diverses contributions en «conflit» . En effet, en l’absence de force
(V = cte dans (1.7)), S est minimum pour ẋ =cte, c’est-à-dire que le mouvement est rectiligne uniforme. En l’absence d’inertie, au contraire, la particule
se logera au maximum du potentiel à l’instant de départ pour en «revenir» à
l’instant d’arrivée. La présence du potentiel peut être considérée comme une
propriété de l’espace qui courbe la trajectoire. Force et inertie apparaissent
comme étant en conflit. La particule suit un chemin de «longueur» minimum,
cette longueur étant mesurée par l’action S.
Calcul variationnel et principe de Maupertuis
Nous verrons en 4.4.2 que le principe de Maupertuis se comprend comme
un cas particulier du principe de moindre action. Ici nous voulons montrer
que l’équation pour la trajectoire que nous en déduisons, est la même que
celle qu’on obtient de l’équation de Newton.
Regardons donc un système conservatif d’énergie conservée et revenons à
(1.6) qui est l’analogue de (1.5). Supposons, pour simplifier les notations, que
la trajectoire se situe dans le plan (xOz) , et qu’elle puisse être paramétrée
par la coordonnée x . Dans ce cas la trajectoire s’obtient à l’aide du calcul
variationnel, à partir du «lagrangien»
p
1
L(z(x), z ′ (x); x) = 2m(E − V (z(x), x)) (1 + z ′2 ) 2 ,
où nous avons utilisé
dℓ =
√
dx2 + dz 2 =
√
1 + z ′2 dx .
L’équation d’Euler-Lagrange
d ∂L
∂L
=
dx ∂z ′
∂z
nous donne après simplification 4
(−
z ′′
∂V
∂V ′
) z + 2(E − V )
= −
′2
∂x
1+z
∂z
4. On se souvient que la dérivée totale d/dx du potentiel donne
(2.13)
.
dV
dx
=
∂V
∂z
z′ +
∂V
∂x
.
2.3. INVARIANCES ET LOIS DE CONSERVATION
51
Pour vérifier que les équations de Newton
∂V
∂V
, mz̈ = −
∂x
∂z
définissent la même trajectoire, il faut éliminer le paramètre temps dans ces
équations : pour une courbe qui peut être paramétrée par la coordonnée x
nous avons
ż = z ′ ẋ , z̈ = z ′′ ẋ2 + z ′ ẍ .
mẍ = −
Les équations de Newton permettent d’éliminer ẍ et z̈, la conservation de
l’énergie ż 2 + ẋ2 = m2 (E − V ) et la première des équations précédentes permettent d’éliminer ẋ et ż, de façon que la deuxième de ces équations peut
finalement se récrire sous la forme
2(E − V )
∂V
∂V
= z ′′
+
(−
) z′
(2.14)
−
∂z
1 + z ′2
∂x
qui n’est autre que (2.13).
2.3
Invariances et lois de conservation
Les lois d’invariance des phénomènes physiques sont fondamentales. Elles
forment l’ensemble de ce que l’on sait a priori sur la physique d’un problème.
Elles impliquent des lois de conservation, qui jouent un rôle fondamental en
mécanique au travers des intégrales premières correspondantes. Dans des
problèmes plus élaborés que ceux que nous avons considérés jusqu’ici, elles
constituent le corpus de base pour construire le lagrangien d’un système
(nous en avons donné un aperçu en discutant la forme du lagrangien libre
ci-dessus).
Un système à s degrés de liberté possède, a priori, 2s intégrales premières.
En effet, l’évolution du système est complètement déterminée par la connaissance des 2s conditions initiales {xi (0), ẋi (0)}. Il y a donc, en principe, 2s
relations entre les variables {xi (t), ẋi (t)} qui, à tout instant, permettent de
recalculer {xi (0), ẋi (0)}. De manière générale seul un sous-ensemble de ces
relations sont utiles en pratique.
2.3.1
Moments conjugués, impulsions généralisées
Afin de discuter les lois de conservation, nous introduisons la notion fondamentale de moment conjugué de Lagrange. Pour un lagrangien donné les
52
Mécanique analytique et calcul variationnel
quantités
pi =
∂L
∂ ẋi
(2.15)
s’appellent moments conjugués des variables xi , ou encore impulsions généralisées . Dans le cas simple (2.12), pi = mẋi , mais cela cesse d’être vrai
dans des coordonnées non cartésiennes ou, comme nous le verrons, lorsque
les forces dépendent de la vitesse. On note que, d’après (2.7), l’évolution
temporelle du moment conjugué pi est donné par
ṗi =
∂L
∂xi
,
(2.16)
que l’on peut considérer comme la forme généralisée de la loi de Newton. Au
cas où ri décrit la position de la particle i dans l’espace R3 nous employons
la notation (2.8) pour écrire
ṗi =
2.3.2
∂L
∂ri
.
(2.17)
Changement de coordonnées, variables cycliques
Dans le formalisme lagrangien, on peut évidemment faire tout changement
de variables
(x1 , x2 , . . . , xN ) → (q1 , q2 , . . . , qN ) ,
soit
L({xi }, {ẋi }; t) → L′ ({qi }, {q̇i }; t) := L({xi }({qi }), {ẋi }({qi }, {q̇i }); t) .
Dans un changement de variables, les équations d’Euler-Lagrange
gardent la même forme, et l’on définit le moment conjugué pi d’une variable qi par la relation
∂L′
pi =
(2.18)
∂ q̇i
qui obéit à la même équation que (2.16) c’est-à-dire ṗi = ∂L′ /∂qi . On appelle
coordonnées généralisées un ensemble quelconque de coordonnées qi . Pour
l’exemple (x, y, z) → (r, θ, ϕ) , voir l’exercice 2.7.
De façon générale, on nomme variable cyclique une variable qi qui ne
figure pas explicitement dans le lagrangien L′ , c’est-à-dire que
∂L′
=0 .
∂qi
53
2.3. INVARIANCES ET LOIS DE CONSERVATION
Dans ce cas, le moment conjugué pi = ∂L′ /∂ q̇i est conservé pi = Cte. La
recherche de variables cycliques joue un rôle important dans la résolution des
problèmes de mécanique, en raison des lois de conservation qui en découlent.
2.3.3
Énergie et translation dans le temps
Supposons le système isolé, c’est-à-dire ∂L/∂t = 0. Une autre façon
d’énoncer cette hypothèse est de dire que le problème est invariant par translation dans le temps, ou encore que le temps est homogène. Evaluons l’évolution de L(x, ẋ) le long de la trajectoire x(t) effectivement suivie
∂L
∂L
d
dL
(x, ẋ) = ẋ(t)
+ ẍ(t)
=
dt
∂x
∂ ẋ
dt
∂L
ẋ(t)
∂ ẋ
(2.19)
où nous avons transformé le premier terme en tenant compte de l’équation
d’Euler-Lagrange (2.6). On en déduit
d
∂L
ẋ(t)
−L =0 .
dt
∂ ẋ
(2.20)
On appelle énergie E la valeur de la quantité
∂L
−L
ẋ(t)
∂ ẋ
resp.
s
X
i=1
ẋi (t)
∂L
−L
∂ ẋi
(2.21)
le long de la trajectoire physique. Par conséquent, pour un système isolé, ou
encore lorsqu’il y a invariance par translation dans le temps, l’énergie est
conservée. C’est une intégrale première du mouvement. Dans le cas (2.12),
l’énergie est bien la somme de l’énergie cinétique et de l’énergie potentielle
E=
N
X
mi ṙ2
i
i=1
2
+ V (r1 , . . . , rN ; t) .
(2.22)
En utilisant les moments conjugués de Lagrange, la définition de l’énergie
s’écrit
X
E=
pi ẋi − L .
(2.23)
i
54
2.3.4
Mécanique analytique et calcul variationnel
Impulsion et translations dans l’espace
Supposons que le problème est invariant par translation dans l’espace.
C’est le cas d’une particule libre, mais c’est également le cas d’un système de
particules dont les interactions ne dépendent que des coordonnées relatives :
V ({ri − rj }). Dans cette hypothèse, pour toute transformation infinitésimale
ri → ri + ~ε le lagrangien est invariant
δL =
X ∂L
i
∂ri
· ~ε = 0
∀~ε ,
soit
X ∂L
∂ri
i
=0.
(2.24)
Pour un système dont le lagrangien est de la forme (2.12) avec un potentiel
V ({ri − rj }) , la relation (2.24) n’est autre que le principe de l’action et de la
réaction de Newton. Soit, en effet, un système de deux particules interagissant
au travers d’un potentiel V (r1 − r2 ), on obtient
~ 1 V = +∇
~ 2 V = −f2
f1 = −∇
(2.25)
.
Cependant, le résultat (2.24) a une autre interprétation. Utilisant les définitions (2.15) des impulsions généralisées et les équations du mouvement, cette
relation s’écrit en effet
N
d
d X
pi ≡ P = 0
(2.26)
dt i=1
dt
P
où P est l’impulsion totale P = N
i=1 pi .
L’invariance par translation dans l’espace implique la conservation de l’impulsion totale d’un système de particules.
On voit de la même manière que l’invariance par translations en direction
x implique la conservation de Px , la composante selon x de P etc. de façon
que la conservation P est correspond à 3 quantités conservées simultanément.
2.3.5
Moment cinétique et rotations
Considérons maintenant les rotations. Une rotation infinitésimale d’un
angle δφ autour d’un axe porté par le vecteur unitaire û transforme les positions et vitesses comme
ri → ri + δφ û × ri ,
ṙi → ṙi + δφ û × ṙi
.
55
2.3. INVARIANCES ET LOIS DE CONSERVATION
Dans cette transformation, la variation du lagrangien est
δL =
ou encore
X ∂L
∂L
(
· (δφ û × ri ) +
· (δφ û × ṙi ))
∂r
∂
ṙ
i
i
i
δL =
X
i
∂L
∂L
+ ṙi ×
ri ×
∂ri
∂ ṙi
!
(2.27)
· û δφ .
S’il y a invariance par rotation, alors δL = 0 quel que soit δφ û. En revenant
à la définition des moments conjugués et de leurs dérivées, on obtient en
utilisant les équations du mouvement
X
(ri × ṗi + ṙi × pi ) = 0
i
soit
d X
d X
d
ri × pi ≡
Li = L = 0 ,
dt i
dt i
dt
(2.28)
où le moment cinétique (généralisé) Li de chaque particule et le moment
cinétique (généralisé) total L sont définis par
X
Li = ri × pi ,
L=
Li .
(2.29)
i
Nous avons donc montré :
A l’invariance par rotation d’un système correspond la conservation du moment cinétique total.
2.3.6
Symétries dynamiques
Un problème peut avoir des symétries, plus ou moins cachées, d’origine
dynamique. Nous verrons, au chapitre 4, les symétries multiples de l’oscillateur harmonique. Une symétrie bien connue dans le problème de Kepler
V (r) = −g 2 /r, soit L = mv 2 /2 + g 2/r, provient de la conservation du vecteur de Runge-Lenz
p×L
r
A=
− g2
(2.30)
m
r
où p est l’impulsion et L = r × p le moment cinétique de la particule en
orbite. Dans le problème de Kepler, on doit déterminer six grandeurs à tout
56
Mécanique analytique et calcul variationnel
instant : r(t), ṙ(t). La conservation du moment cinétique et de l’énergie fixe 4
de ces grandeurs. La conservation de la direction du vecteur de Runge-Lenz
fixe une grandeur restante, voir l’exercice 4.8. Par conséquent la résolution du
problème ne nécessite pas de «quadrature» (ou intégration). Une conséquence
est que les trajectoires compactes sont fermées, ce qui est exceptionnel : seuls
les potentiels harmonique (∝ r 2 ) et newtonien (∝ 1/r) conduisent à cette
propriété.
2.4
Multiplicateurs de Lagrange
A ce stade nous rappelons rapidement un outil technique presqu’omniprésent dans le contexte de problèmes d’optimisation. De manière générale
la quantitié qu’on cherche à optimiser est soumise à des contraintes qu’il faut
respecter 5 . Une manière souvent commode de tenir compte des contraintes
est d’introduire des multiplicateurs de Lagrange.
Un exemple simple serait de trouver le point le plus haut non pas d’une
montagne mais d’un chemin dessiné sur cette montagne. Mathématiquement
ce problème revient à trouver le maximum d’une fonction f (x, y) sous une
contrainte g(x, y) = 0 (qui détermine le chemin). Supposons que la contrainte
peut s’écrire sous forme explicite y − y0 (x) = 0 (au moins localement). Bien
entendu, on peut injecter l’équation du chemin dans f et calculer x tel que
∂f
∂f d
d
f (x, y0(x)) =
+
(y0 (x)) = 0 .
dx
∂x ∂y dx
(2.31)
La méthode de Lagrange consiste par contre à introduire un nouveau paramètre λ appelé multiplicateur de Lagrange et à chercher l’extrémum de la
fonction
f (x, y) + λ g(x, y) .
(2.32)
L’annulation des dérivées par rapport à x, y donne les équations
∂f
∂g
+λ
= 0,
∂x
∂x
∂f
∂g
+λ
=0.
∂y
∂y
(2.33)
5. Un exemple important d’une telle situation est le principe de base de la thermodynamique à l’équilibre : l’équilibre thermique correspond à une situation qui maximise
l’entropie compte tenu des contraintes qu’on impose sur l’énergie, le volume ... de l’échantillon considéré. Ce principe sera analysé en physique statistique.
57
2.4. MULTIPLICATEURS DE LAGRANGE
Pour les solutions (x(λ), y(λ)) de ces équations on fixe λ de façon que la
contrainte soit respectée : g(x(λ), y(λ)) = 0 .
Dans ce cas simple l’équivalence des deux méthodes se voit facilement :
puisque (localement) g(x, y) = 0 ⇔ y − y0 (x) = 0, on obtient pour (2.33)
dy0
∂f
−λ
= 0 (1) ,
∂x
dx
∂f
+ λ = 0 (2) ,
∂y
(2.34)
et l’élimination de λ entre (1) et (2) revient à l’équation de départ (2.31).
L’avantage de la méthode de Lagrange consiste dans le fait qu’elle ne
demande pas d’exprimer la contrainte sous forme explicite, ce qui peut être
difficile (voir l’exemple de la corde pesante ci-dessous), surtout pour des
problèmes à plusieurs variables. Cette forme explicite est indispensable dans
le procédé pédestre (2.31).
La méthode de Lagrange se généralise à une fonction f ({xi }) d’un nombre
quelconque de variables xi , i = 1, . . . , n reliées par un nombre quelconque p
de contraintes indépendantes gk ({xi }) = 0, k = 1, . . . , p avec p < n . Elle se
résume comme suit :
i) On pose
F (x1 , . . . , xn , λ1 , . . . , λp ) = f ({xi }) + λ1 g1 ({xi }) + . . . + λp gp ({xi }) ,
et on cherche les extrema de F en supposant les {xi } indépendantes. On
cherche donc les solutions du système à n équations ∂F/∂xi = 0 . Ces solutions sont fonctions des p multiplicateurs λk .
ii) Pour déterminer les valeurs de ces multiplicateurs on reporte la solution
{x∗i (λ1 , . . . , λp )} dans les p contraintes gk ({x∗i }) = 0 . Ce sont p équations
pour les p multiplicateurs.
iii) Après résolution de ces p équations on reporte le résultat dans les x∗i . On
obtient alors un extremum de f , tenant compte des contraintes gk = 0 .
Pour se convaincre de l’équivalence de la méthode de Lagrange avec la procédure explicite,
on pourra procéder comme suit :
Supposons que f ({xi }) soit extrémale en un point {x∗i } qui respecte les contraintes :
gk ({x∗i }) = 0, k = 1, . . . , p. Si les contraintes sont mutuellement indépendantes, on peut
les paramétrer localement en terme de n − p coordonnées y1 , . . . , yn−p , et on trouve
∂gk
~ ~x gk ) · ∂~x = 0 ,
= (∇
∂yj
∂yj
puisque
gk (~x(~y )) ≡ 0 ,
(2.35)
où nous avons noté ~x = (x1 , . . . , xn ) et ~y = (y1 , . . . , yn−p ) . D’autre part nous avons aussi
∂f
~ ~x f ) · ∂~x = 0
= (∇
∂yj
∂yj
58
Mécanique analytique et calcul variationnel
pour un point extrémal {x∗i } ≡ ~x∗ = ~x(~y ∗ ) . On en déduit que, dans un point extrémal,
~ ~x f est orthogonal (au plan tangentiel) à la surface décrite par les contraintes
le vecteur ∇
gk , et il peut donc s’écrire sous forme de combinaison linéaire
~ ~x f = −
∇
p
X
k=1
~ ~x gk .
λk ∇
D’où le résultat recherché : il existe des nombres réels λk , k = 1, . . . , p , tel que
!
p
X
∂
λk gk = 0 au point extrémal ~x∗ .
f+
∂xi
(2.36)
k=1
Inversement considérons les solutions de la relation (2.36) en fonction des paramètres λk .
Si, pour un choix approprié des λk , une solution ~x∗ (λ1 , . . . , λp ) vérifie les contraintes
~ ~x f à la surface des contraintes en
gk (~x∗ ) = 0 , alors (2.36) implique l’orthogonalité de ∇
∗
ce point (de coordonnées locales ~y ), voir ci-dessus (2.35), et on a donc
∂f
~ ~x f ) · ∂~x = 0
= (∇
∂yj
∂yj
en ~x∗ = ~x(~y ∗ ) ,
de façon que ~x∗ = ~x(~y ∗ ) est un point extrémal de f respectant les contraintes.
2.5
2.5.1
Exemples
Rayons courbes
Reprenons le cas des rayons courbes de (1.1.2) muni de nos connaissances
du calcul variationnel. Considérons l’intégrale (1.5) et supposons que l’indice
de réfraction varie avec la hauteur comme n(z) = 1+νz avec ν > 0 (cette formule ne s’appliquant que pour des valeurs limitées de z) et que les extrémités
A et B correspondent à la même altitude : z(x = 0) = h et z(x = l) = h. La
fonction de Lagrange L(z(x), z ′ (x), x) est alors
√
1
L = (1 + νz) 1 + z ′ 2
c
,
d’où l’on déduit - de la même façon que nous avons obtenu (2.13) - l’équation
d’Euler-Lagrange
(1 + νz) z ′′ = ν(1 + z ′ 2 ) .
(2.37)
En effectuant le changement de fonction u = z + 1/ν et en reportant dans
(2.37) on obtient
u u′′ = 1 + u′ 2
(2.38)
59
2.5. EXEMPLES
dont la solution générale est
u = d cosh((x − b)/d)
(2.39)
où b et d sont des constantes. Une façon d’aboutir à ce résultat consiste
à dériver (2.38) une fois. On obtient u′′′ /u′′ = u′ /u dont la «solution» est
u′′ = Cu, où C est une constante arbitraire. La solution de cette dernière
équation est u = a cosh((x − b)/d), où d2 = 1/C, et en reportant dans (2.38)
on trouve a = d. 6 . En imposant les conditions aux limites z(x = 0) = h et
z(x = l) = h, on obtient donc le résultat
z = a cosh(
x − l/2
) − 1/ν
a
avec a cosh(
l
) − 1/ν = h .
2a
(2.40)
Dans ce modèle ultra-simple, le chemin du rayon lumineux est une chaînette
de hauteur minimale en x = l/2 (symétrie du problème).
2.5.2
Forme d’une corde pesante
Soit une corde massive de masse linéique constante µ et de longueur L
dans le plan (xOz), placée dans le champ de pesanteur constant dirigé suivant
la verticale z. La corde est fixée à ses extrémités, en A, choisi comme l’origine
(x = 0, z = 0), et en B (x = a, z = z1 ). On se pose le problème de déterminer
la forme de la corde à l’équilibre. On suppose bien entendu que a2 + z12 ≤ L2 .
L’équilibre correspond à la configuration où l’énergie potentielle gravitationnelle de la corde est minimale. Soit z(x) une forme quelconque de la
corde. Un élément de la corde dans l’intervalle [x, x + dx] est de longueur
dl2 = dx2 + dz 2 = (1 + z ′ (x)2 ) dx2 et son énergie potentielle est dV = µg z dl
(g est l’accélération de la pesanteur). Il s’agit donc de minimiser l’intégrale
Z a
p
(2.41)
V =
µg z(x) 1 + z ′ (x)2 dx
0
sous la contrainte 7
L=
Z
0
a
p
1 + z ′ (x)2 dx .
(2.42)
6. On obtient le résultat (2.39) de façon plus élégante en utilisant une loi de conservation, voir (2.5.2)
7. La contrainte apparaît ici sous forme d’intégrale. Là encore on peut en tenir compte
à l’aide d’un paramètre de Lagrange, comme on le voit par un argument de discrétisation
[11], ch.3.2.2.
60
Mécanique analytique et calcul variationnel
Il est convenable de tenir compte de cette contrainte en introduisant un
multiplicateur de Lagrange λ (voir 2.4), donc de minimiser la quantité
Z a
√
V + λL =
µg(z − zλ ) 1 + z ′ 2 dx ,
(2.43)
0
où nous avons écrit λ = −µgzλ . L’équation d’Euler-Lagrange donne
(z − zλ ) z ′′ = 1 + z ′ 2
(2.44)
qui ressemble à (2.38) et dont la solution est une chaînette
x − x0
).
(2.45)
c
Elle dépend de 3 paramètres zλ , c, et x0 , qu’on peut exprimer en terme des
conditions aux limites et de la contrainte sur la longueur L
x0
z(0) = 0 ⇒ zλ = −c cosh( )
c
a − x0
x0 z(a) = z1 ⇒ z1 = c cosh(
) − cosh( ) ,
c
c
Z a
Z ap
a − x0
x0 x − x0
) dx = c sinh(
)+sinh( ) .
1 + z ′ (x)2 dx =
cosh(
L=
c
c
c
0
0
Dans la solution on voit une symétrie par dilatations : si l’on multiplie toutes
les quantités homogènes à une longueur par le même facteur κ on obtient
une solution pour une corde de longueur κ L qui passe par les points (0, 0) et
(κa, κz1 ) . Dans ce cas c est remplacé par κ c . C’est donc c qui caractérise les
unités de longueur choisies. Cette symétrie est due au fait que le lagrangien
de départ ne dépend pas d’une échelle de longueur explicite. Nous trouvons
pour le rapport de z1 et de L
z(x) = zλ + c cosh(
0
cosh( a−x
) − cosh( xc0 )
z1
a − 2x0
c
=
).
= tanh(
a−x0
x0
L
2c
sinh( c ) + sinh( c )
(2.46)
Le minimum de la chaînette est situé au point x0 qui peut ou non se trouver
dans l’intervalle [0, a]. De (2.46) nous tirons (pour c = 1)
x0 = a/2 − arth(z1 /L) ,
(2.47)
ce qui implique x0 → −∞ pour z1 /L → 1 (corde verticale orientée vers
le haut), x0 = a/2 pour z1 = 0 (corde symétrique par rapport à a/2 ), et
x0 → ∞ pour z1 /L → −1 (corde verticale orientée vers le bas).
61
2.5. EXEMPLES
Utilisation d’une loi de conservation
Revenons à l’équation (2.43). Le lagrangien est (à des constantes multiplicatives près)
p
L ∝ (z(x) − zλ ) 1 + z ′ (x)2 .
L ne dépend pas explicitement de la variable x. Par conséquent, la quantité pz ′ − L, où p est le moment conjugué de z, est une intégrale première,
constante le long de la courbe, donc une quantité « conservée ». On obtient
sans difficulté
√
p = (z − zλ )z ′ / 1 + z ′ 2 , et donc
√
√
pz ′ − L = −(z − zλ )/ 1 + z ′ 2 = −c ⇒ z − zλ = c 1 + z ′ 2 ,
où c est une constante. Posons, par définition de φ(x), z ′ (x) = sinh φ(x) . Il
vient
z(x) − zλ = c cosh φ(x) soit z ′ = cφ′ sinh φ ,
d’où évidemment cφ′ (x) = 1 et la solution z(x) − zλ = c cosh((x − x0 )/c)
donnée en (2.45). L’utilisation de cette intégrale première a ramené l’équation
différentielle à résoudre du deuxième au premier ordre.
De façon générale, si l’on considère un lagrangien de la forme
√
(2.48)
L(z, ż; t) = f (z) 1 + ż 2 ,
le moment conjugué de z est
f (z)ż
p= √
1 + ż 2
(2.49)
.
Puisque le lagrangien ne dépend pas explicitement de la variable t, il y a
conservation de la quantité
f (z)
A = pż − L = − √
1 + ż 2
,
dont la valeur est fixée par les conditions initiales. On obtient donc
r
f (z) 2
2
2
2
A (1 + ż ) = f (z)
soit
ż = ± (
) −1 .
A
(2.50)
(2.51)
La solution générale se ramène donc à une simple quadrature (ou intégration)
Z z
dz
q
= t − t0 .
(2.52)
±
f (z) 2
z0
( A ) −1
62
Mécanique analytique et calcul variationnel
C’est l’analogue de la méthode usuelle d’intégration de l’équation du mouvement lorsqu’il y a conservation de l’énergie.
2.5.3
Lois de Kirchhoff
Soit à déterminer les intensités respectives I1 et I2 du courant dans les
deux branches, de résistance R1 et R2 du circuit représenté sur la figure 2.1.
Le courant entrant a une intensité I. Le résultat s’obtient aisément par les
lois d’Ohm-Kirchhoff.
Le principe variationnel consiste ici à supposer que les pertes par effet
Joule sont les plus petites possibles. Autrement dit trouver le minimum de
W = R1 I12 + R2 I22
avec la contrainte I1 + I2 = I
(qu’on pourra s’exercer à exprimer par l’introduction d’un multiplicateur de
Lagrange). En dérivant l’expression W = R1 I12 +R2 (I −I1 )2 par rapport à I1 ,
on obtient sans difficulté R1 I1 = R2 I2 c’est-à-dire le résultat obtenu en posant
que le potentiel V entre les deux noeuds est donné. Remarquons que nous
nous sommes affranchis de la notion de potentiel. Nous avons remplacé la
notion locale de différence de potentiel par une condition énergétique globale,
et un principe plus simple.
I
I1 R 1
I2 R 2
I
Figure 2.1 – Elément simple de circuit électrique avec bifurcation.
Pour
quelconque, le principe est que la perte globale par effet
P un circuit
2
Joule k Rk Ik est minimum. On retrouve, bien entendu, les lois de Kirchhoff.
Pour un circuit relativement simple les deux approches sont équivalentes.
Elles le sont moins en pratique pour un réseau de transport d’électricité
comportant, par exemple, dix millions d’éléments. Inverser en temps réel
une matrice 107 × 107 est irréaliste, alors que les méthodes mathématiques
d’optimisation sont infiniment plus commodes à utiliser.
63
2.5. EXEMPLES
2.5.4
Potentiel électrostatique
Considérons maintenant un problème un peu plus compliqué. Il s’agit
de déterminer le potentiel électrostatique φ(r) créé par une distribution de
charges donnée ρ(r). On sait que la forme cherchée est la loi de Poisson
∆φ = −
ρ
ε0
(2.53)
.
Elle se déduit du principe variationnel suivant que l’on peut retrouver comme
cas particulier d’un principe plus général concernant les équations de Maxwell, voir 3.2.3. Le champ électrostatique s’exprime
R 2 à3 partir du potentiel par
ε0
~
E = −∇φ et l’énergie du champ est EE = 2 E d r. L’énergie potentielle
électrostatique
de la distribution de charges ρ(r) dans le potentiel φ(r) est
R
Eρ = ρ(r) φ(r) d3r. Le principe variationnel est que le potentiel φ(r) recherché rend minimale la différence de ces deux énergies. Considérons l’intégrale
Z
~ 2 − ρ(r)φ] d3 r .
U = [(ε0 /2)(∇φ)
(2.54)
Le problème posé est de trouver le potentiel φ(r) qui minimise cette expression.
Notons les points suivants :
1. Nous supposons qu’il n’y a pas de charges à l’infini, si bien que φ peut
être choisi comme nul à l’infini. Les intégrales portent sur tout l’espace.
2. Puisque le premier terme est positif, s’il existe un minimum de cette
expression pour une fonction φ(r), ce minimum correspond à une situation d’équilibre entre deux contributions à l’énergie totale en « compétition ». Tout « excès » d’une de ces deux formes de l’énergie électrique
correspond à une situation instable.
3. Par comparaison au problèmes du rayon courbe 2.5.1 ou de la corde
2.5.2, c’est ici le champ φ et son gradient ∇φ qui jouent les rôles précédemment tenus par la variable z et sa dérivée z ′ . La variable x des
problèmes simples précédents est maintenant r ∈ R3 .
Soit φ la solution recherchée, et η(r) une variation infinitésimale de ce
potentiel. Dans la variation φ → φ + η on a, au premier ordre,
~ 2 → (∇φ)
~ 2 + 2∇φ
~ · ∇η
~
(∇φ)
.
64
Mécanique analytique et calcul variationnel
Par conséquent, la variation de (2.54) est
Z
~ · ∇η)
~ − ρ η ] d3 r .
δU = [ε0 (∇φ
(2.55)
En intégrant le premier terme par parties et en tenant compte de l’annulation
de φ à l’infini, on obtient
Z
Z
3
~ · ∇η)
~ d r = − ∆φ η d3 r
(∇φ
soit
δU =
Z
[−ε0 ∆φ − ρ ] η d3 r .
(2.56)
Le fait que δU = 0 quel que soit η(r) infinitésimal, entraîne la loi de Poisson
(2.53).
Un cas particulier est celui où la densité de charge est nulle. Nous entendons
par là qu’il y a un certain nombre de conducteurs chargés chacun porté à
un potentiel donné V1 , V2 , · · · , Vn . Il y a certes une densité de charge surfacique mais la charge volumique ρ est partout nulle. Soient Σ1 , Σ2 , · · · , Σn les
surfaces des conducteurs, l’équation (2.56) se ramène à
∆φ = 0
avec les n contraintes φ = Vi sur Σi .
2.5.5
Bulles de savon
Figure 2.2 – Bulle de savon tendue sur deux cercles.
L’énergie potentielle d’une bulle de savon d’aire A est V = σA où σ est la
constante de tension superficielle du savon. On tend une bulle de savon entre
65
2.5. EXEMPLES
deux cercles coaxiaux de même rayon R, comme schématisé sur la figure 2.2.
L’axe Oz est l’axe commun perpendiculaire aux deux cercles, qui sont centrés
en z = −h et z = h respectivement. Le problème est de trouver la surface
d’aire minimale tendue entre les deux cercles en fonction de leur distance
d = 2h.
Considérons l’intervalle [z, z +dz] et r(z) le rayon d’une section transverse
de la surface symétrique de révolution. Il s’agit de minimiser l’énergie
Z h
q
σA = σ
2π r(z) 1 + r ′ (z)2 dz
−h
avec les conditions aux limites r(−h) = r(h) = R. Le problème est semblable
à celui de la corde (2.41). La solution est
r = a cosh(z/a),
avec
R = a cosh(h/a) .
Cette surface de révolution autour de Oz , engendrée par un chaînette, porte
le doux nom de caténoïde.
On pourra s’exercer à trouver les formes prises par de bulles tendues sur
des supports plus compliqués. Le fait que les exemples précédents aboutissent
tous à des chaînettes est dû à la simplicité de leur résolution mathématique.
Exercices
2.1 Intégrale première
Dans le calcul
p de rayons courbes 2.5.1, montrer par un calcule direct que
Γ(x) = z(x)/ 1 + z ′ (x)2 est une constante le long de la courbe. En déduire
la solution.
2.2 Brachistochrone
Un des problèmes favoris des mathématiciens et mécaniciens est celui du
brachistochrone. On considère deux points O et A dans un plan vertical, et
une courbe C les joignant. On lâche en O, sans vitesse initiale, une masse
qui glisse sans frottement sur la courbe sous l’effet de la pesanteur. On veut
déterminer la courbe C telle que le temps nécessaire à la masse pour aller de
O en A, soit minimum. (Cet exercice n’est pas facile. Une version «guidée»
se trouve dans le recueil des contrôles antérieurs sous le titre «Gagner un
slalom».)
66
Mécanique analytique et calcul variationnel
Historiquement l’énoncé du problème brachistochrone en 1696 peut être considéré comme le vrai acte de naissance du calcul des variations. Il suscite la
recherche de méthodes générales progressivement élaborées au cours d’une
véritable compétition. La première solution vient de Jean Bernoulli en 1697.
Il part de son analogie au principe de Fermat et résout le problème par discrétisation.
2.3 Rayons courbes et super-réfraction d’ondes radio
1. On s’intéresse à la propagation d’un rayon lumineux dans un milieu
d’indice de réfraction variable n(x, y) ≥ 1 dans le plan xOy . Ecrire
l’intégrale qui donne de le temps de propagation TAB de la lumière
pour aller du point A au point B .
2. Le plan peut être paramétré en coordonnées polaires x = r cos φ , y =
r sin φ . On suppose que l’indice n n’est fonction que de la variable
radiale r : n = n(r) , et que le rayon lumineux allant de A(r1 , φ1 ) à
B(r2 , φ2 ) peut être paramétré par la variable φ. Réécrire le temps TAB
sous forme d’une intégrale portant sur la variable φ, dont l’intégrant est
fonction de r(φ) et de ṙ(φ) , où ṙ = dr/dφ . On appellera cette fonction
lagrangien L .
3. Le lagrangien L ne dépend pas explicitement de la variable φ . En déduire l’existence d’une quantité conservée le long du rayon lumineux,
et donner son expression. On appellera E cette quantité conservée.
4. Utiliser E pour exprimer ṙ(φ) en fonction de r, n, E .
5. Dans quelle condition l’expression précédente décrit-elle une trajectoire
circulaire ? On se placera dans une situation proche de celle-ci par la
suite.
6. Déduire de l’expression pour ṙ(φ) la relation
r̈ = r (1 +
r dn
),
n dr
dans la situation où
n2 r 2
≃ E2 .
c2
(2.57)
Indication : dériver la relation pour ṙ par rapport à φ, éliminer ṙ grâce
2 2
à la relation trouvée en 4., et prendre la limite nc2r → E 2 à la fin.
7. Une valeur moyenne de
(
dn
dr
dans les basses couches atmosphériques est
dn
)moy = −0, 39 · 10−4 km−1 ,
dr
67
2.5. EXEMPLES
Figure 2.3 – Sous-réfraction et super-réfraction d’une onde radar émise par
une antenne dans l’atmosphère terrestre
ce qui correspond au régime standard dans la Fig. 2.3. Comment se
situent les valeurs de dn
dans les régimes de sous-réfraction et de superdr
réfraction par rapport à cette valeur ?
8. Pour une onde radio émise par une antenne tel que r(0) = R et ṙ(0) =
0 (donc horizontalement), donner la valeur de dn/dr en km−1 , pour
laquelle l’onde radio suit un grand cercle autour de la terre.
On peut approcher n(r) pour l’air - qui vaut ≃ 1, 0003 - par 1 . Le
rayon de la terre R est de 6370 km.
2.4 Stratégie d’une régate.
Un voilier avance à la vitesse v(θ) qui est fonction de l’angle θ entre la vitesse
du vent et celle du bateau, et de la norme w de la vitesse du vent. On suppose
que la vitesse du bateau v est proportionnelle à celle du vent w, mais dépend
de l’angle θ, choisi par le capitaine du bateau. On écrit cette vitesse sous la
forme
v(θ) =
w
,
cos(θ) h(tan θ)
1
1
avec h(u) = (u + ) .
2
u
(2.58)
On s’intéresse à la stratégie de "remontée au vent" du bateau, c’est-à-dire
θ ≤ π/2, comme on le représente sur la figure (2.5.5). La vitesse vx du bateau
le long de Ox est opposée à celle du vent, et sa coordonnée x augmente
toujours en fonction du temps. On suppose une côte linéaire (terre = demiplan z < 0, mer = demi-plan z > 0).
On suppose que le vent est parallèle à la côte, de direction opposé à l’axe
68
Mécanique analytique et calcul variationnel
vitesse du bateau de norme v
v
θ
w
vitesse du vent de norme w
z
z=z 2
L x
Terre
Figure 2.4 – Plan d’eau et schéma de la direction du bateau par rapport à
celle du vent.
Ox, et que la norme de sa vitesse w(z) ne dépend que de l’éloignement à la
côte z.
La vitesse du vent a la forme :
w(z) = w0 − w1
z0
,
z + z0
(2.59)
où w0 est la vitesse du vent loin de la côte, qui est supérieure à la vitesse
(w0 − w1 ) ≥ 0 au bord de la côte z = 0.
1. On note :
dx
,
dt
Montrer que z ′ = tan θ.
ẋ =
ż =
dz
,
dt
z′ =
dz
dx
.
2. On suppose d’abord le vent uniforme (w = constante, w1 = 0). Ecrire
la vitesse du bateau suivant l’axe du vent vx = ẋ en fonction de w et
h(tanθ). Pour quelle valeur de θ et de z ′ cette vitesse est-elle maximum ?
Quelle est alors sa valeur ?
3. On suppose maintenant que w1 6= 0. Le bateau va du point de départ,
l’origine (x = 0, z = 0), à un point d’arrivée au large (x = L, z = z1 ).
On suppose que z ′ ≥ 0 pour tout t (c’est-à-dire que le bateau ne vire
jamais de bord). On veut déterminer la trajectoire z(x) la plus rapide.
Ecrire le temps dt mis, sur cette trajectoire, pour aller de x à x + dx
en terme des fonctions w et h. Ecrire la valeur du temps total T pour
aller du départ à l’arrivée.
69
2.5. EXEMPLES
4. En déduire l’équation qui détermine la trajectoire optimale.
5. Montrer que l’invariance du problème par translation suivant Ox entraîne
h′ (z ′ )z ′ − h(z ′ )
=A
w(z)
où A est une constante.
6. Utiliser le résultat précédent pour calculer la trajectoire sous la forme
d’une fonction x(z) (et non pas d’une fonction z(x)). Fixer la valeur de
la constante A.
7. Calculer la valeur de z ′ = dz/dx en fonction de z. On suppose que
z1 ≪ L et z1 ≪ z0 . Pensez-vous que le résultat obtenu corresponde
effectivement à la meilleure stratégie ? Sinon, quelle modification doiton apporter ?
2.5 Pendule mobile
On considère un pendule de longueur l et de masse m2 suspendu à un point
de masse m1 qui se déplace horizontalement sur un rail (sans frottement).
On note x l’abscisse de m1 et φ l’angle du pendule avec la verticale. Ecrire
le lagrangien de ce système.
2.6 Propriétés de l’action
a) Calculer l’action le long de la trajectoire physique en fonction des positions
et instants de départ x1 , t1 et d’arrivée x2 , t2
1. pour une particule libre, de lagrangien L = mẋ2 /2
2. pour un oscillateur harmonique L = mẋ2 /2 −
3. pour une force constante L = mẋ2 /2 − F x.
mω 2
2
x2
b) Montrer que le moment conjugué p2 = ( ∂L
)|
au point d’arrivée x2
∂ ẋ x=x2
vaut
∂S12
.
p2 =
∂x2
c) Montrer que l’énergie E = pẋ − L au point d’arrivée x2 est donnée par
E2 = −
∂S12
∂t2
.
70
Mécanique analytique et calcul variationnel
2.7 Moments conjugués en coordonnées sphériques.
On considère une particulepnon-relativiste de masse m placée dans un potentiel central V (r) où r = x2 + y 2 + z 2 . On note v ≡ ṙ la vitesse et v 2 son
carré. On étudie le problème en coordonnées sphériques (r, θ, φ) définies par
x = r sin θ cos φ ,
y = r sin θ sin φ ,
z = r cos θ
(2.60)
.
Le carré de la vitesse est alors v 2 = ṙ 2 + r 2 θ̇2 + r 2 sin2 θ φ̇2
.
(2.61)
1. Ecrire le lagrangien de la particule en coordonnées sphériques.
2. Calculer les moments conjugués pr , pθ et pφ .
3. Montrer que le moment pφ est égal au moment cinétique Lz dont l’expression en coordonnées cartésiennes est Lz = xpy − ypx .
4. A quelle loi d’invariance correspond la conservation de Lz ?
5. Si la particule est chargée et que l’on plonge le système dans un champ
~ parallèle à Oz, la composante Lz est-elle conservée ?
magnétique B
Chapitre 3
Théorie lagrangienne de
l’électromagnétisme
Si tous disent que tu es un âne,
il est temps de braire.
Le Talmud, Baba Kamma.
Les exemples de systèmes physiques que nous avons traités jusqu’ici en
formalisme lagrangien, ont été des systèmes de particules non-relativistes, en
interaction mutuelle et/ou dans un champ de force dérivant d’un potentiel
externe. Il est évident que l’électromagnétisme sort de ce cadre pour plusieurs
raisons.
Tout d’abord, même si l’on ne considère qu’une seule particule chargée
non-relativiste dans l’approximation où le champ électromagnétique est traité
comme un champ externe fixé, nous savons bien qu’elle subit la force de
Lorentz
f = q (E + v × B) .
(3.1)
Cette force dépend de la vitesse et ne dérive pas d’un potentiel. La force
magnétique q v × B ne travaille pas.
Ensuite l’électromagnétisme est une théorie invariante de Lorentz. L’invariance relativiste devrait donc se manifester dans la description lagrangienne
dès le départ. En effet, ce sera le principe de l’invariance relativiste qui nous
servira de guide pour proposer une expression, d’abord pour le lagrangien
d’une particule libre, ensuite pour celui d’une particule chargée placée dans
un champ électromagnétique. Nous vérifierons, bien sûr, que la limite nonrelativiste nous rendra la force de Lorentz.
71
72
Théorie lagrangienne de l’électromagnétisme
Enfin une théorie complète de l’électromagnétisme requiert d’intégrer les
champs électromagnétiques eux-mêmes dans le formalisme lagrangien. Un
champ qui peut prendre des valeurs a priori arbitraires dans tous les points
de l’espace est évidemment un système à un nombre de degrés de liberté infini.
Le formalisme lagrangien trouve sa pleine puissance dans ces cas. La mécanique des milieux continus peut servir d’un autre exemple de tels systèmes.
Nous allons voir comment le formalisme lagrangien se prête à la théorie des
champs. En soi, la théorie des champs est un vaste domaine qui atteint sa
plénitude lorsque l’on aborde la quantification des champs et les théories des
interactions fondamentales [16]. Dans ce chapitre nous ne souhaitons donner
que les principes de la théorie lagrangienne des champs et son application au
champ électromagnétique.
Dans la partie 1, nous commençons par traiter du cas d’une particule
relativiste libre. Nous nous restreindrons au cas d’une particule massive. Le
fondement de notre propos sera alors l’invariance de Lorentz. Le principe
de moindre action ne peut avoir de sens que si il détermine le mouvement
de la particule de la même façon, quel que soit le référentiel inertiel choisi.
Cela nous permettra de construire un lagrangien pour la particule. Nous
verrons comment l’impulsion et l’énergie d’une particule libre sont reliées à
sa masse et sa vitesse. Le formalisme lagrangien permet ainsi de démontrer
que l’ensemble {E/c, p} forme un quadrivecteur de l’espace-temps en relativité, alors que ni l’énergie E ni l’impulsion p ne sont définies a priori. Leur
forme est dictée par le formalisme lagrangien à partir des variables cinématiques position et vitesse. Ensuite nous verrons que le lagrangien d’interaction d’une particule chargée avec le champ électromagnétique se déduit de
l’invariance relativiste, de la connaissance du lagrangien d’interaction d’une
particule chargée avec un champ électrostatique, et du fait que le potentiel électrostatique constitue la composante genre temps du quadrivecteur
potentiel électromagnétique. Nous découvrirons que le moment conjugué diffère alors radicalement de l’impulsion ou de la quantité de mouvement, qui
dans la limite non-relativiste, est donnée par le produit de la masse par la vitesse. Ce fait, intimément associé à l’invariance de jauge, a des répercussions
considérables en mécanique quantique et, plus généralement, dans toutes les
théories actuelles des interactions fondamentales. Nous allons analyser les
équations du mouvement qui en découlent, leur limite non-relativiste, aussi
bien que leur invariance de jauge.
Dans la partie 2 nous comprendrons le principe de la forme lagrangienne
de la théorie des champs en commençant par la physique d’une corde vi-
Théorie lagrangienne de l’électromagnétisme
73
brante. La démarche est relativement simple : on commence par discrétiser
la corde en éléments finis en interaction auxquels on applique la théorie de
Lagrange. On passe ensuite à la limite du continu, ce qui fait apparaître
une densité spatiale de lagrangien à partir de laquelle on obtient naturellement l’équation d’ondes. C’est dans cette extension à la limite du continu,
donc d’un nombre infini de degrés de liberté, que l’on mesure combien le
formalisme lagrangien est adapté à ce problème. Ensuite nous passons à trois
dimensions ainsi qu’à plusieurs champs. On y entrevoit facilement l’extension
dans l’espace-temps. Finalement nous traiterons du champ vecteur électromagnétique et des équations de Maxwell. Dans cette partie nous donnerons
aussi le lagrangien complet de l’électromagnétisme qui comprend la partie
particules (ou sources des champs), la partie champs et l’interaction des deux.
74
3.1
Théorie lagrangienne de l’électromagnétisme
Lagrangien d’une particule relativiste
Nous nous restreignons au cas d’une particule massive soit libre, soit
placée dans un champ électromagnétique. Le fondement de notre propos sera
l’invariance de Lorentz. Le principe de moindre action ne peut avoir de sens
que si il détermine le mouvement de la particule de la même façon, quel
que soit le référentiel inertiel choisi. Nous souhaitons procéder comme en
section 1.3. Nous nous proposons de déterminer le trajet parcouru pour aller
de (t1 , r1 ) à (t2 , r2 ) en minimisant l’action
S=
3.1.1
Z
t2
t1
(3.2)
L(r, ṙ; t) dt .
Particule libre
Nous avons vu en 2.2, par des arguments de symétrie, que le lagrangien
d’une particule libre de masse m ne devrait être fonction que de la vitesse au
carré v 2 de la particule. Cherchons donc cette fonction sous une forme qui
rende l’action S qui s’y associe, invariante de Lorentz. En relativité, voir réf.
[2], nous avons vu un invariant de Lorentz, sous forme d’une intégrale paramétré par le temps et portant sur une fonction de v 2 . On l’a appelé le temps
propre τ . Il représente le temps qui s’écoule sur une montre rattachée au
point mobile. D’ailleurs, en traitant du «paradoxe des jumeaux», nous avons
vu que parmi tous les chemins possibles, celui associé au mouvement libre
a pour caractéristique que le temps propre est le plus long. Ceci correspond
bien à un principe d’optimisation comme nous le cherchons. Rappelons les
formules :
Nous avons c dτ = ds où ds2 = c2 dt2 − dx2 est l’élément de longueur infinitésimal invariant de Lorentz. Par construction, τ est donc un invariant
de Lorentz. Si dt est un interval de temps observé par un observateur de
vitesse relative
v par rapport à la particule, le temps propre de celle-ci est
p
2
dτ = dt 1 − v /c2 .
Le mouvement libre maximise donc la quantité τ =
Z
t2
t1
p
1 − v 2 /c2 dt .
75
3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE
Pour obtenir un lagrangien homogène à une énergie, et afin de retrouver un
principe de minimisation plutôt que de maximisation, nous posons finalement
Z t2 p
2
1 − v 2 /c2 dt .
(3.3)
S = −mc
t1
Cette action nous fournit le lagrangien d’une particule relativiste libre
p
L = −mc2 1 − v 2 /c2 .
(3.4)
p
L’expression 1 − v 2 /c2 dt est invariante de Lorentz alors que le lagrangien
(3.4) ne l’est pas. Cela provient de ce que nous avons gardé une approche qui
confère un rôle particulier à la variable temps sur laquelle porte l’intégration.
On peut s’affranchir de ce problème, voir (3.16)
qu’à la
p en bas. On remarque
2
2
2
2
limite des faibles vitesses, (3.4) donne −mc 1 − v /c = −mc + m v 2 /2 ,
et on retrouve donc, à la constante −mc2 près, le lagrangien non-relativiste
L = mv 2 /2.
3.1.2
Impulsion et énergie d’une particule libre
L’impulsion et l’énergie se déduisent de cette forme par les mêmes démarches qu’en section 2.3. Ces deux quantités nous intéressent particulièrement car ce sont les grandeurs conservées de façon générale s’il y a homogénéité de l’espace et du temps, et cela quel que soit le référentiel. Le moment
conjugué est 1
mv
∂L
,
(3.5)
=p
plib =
∂v
1 − v 2 /c2
l’énergie
Elib
= plib · v − L = p
mc2
1 − v 2 /c2
ou encore Elib =
q
p2lib c2 + m2 c4 . (3.6)
L’énergie et l’impulsion satisfont la relation
(Elib/c)2 − p2lib = m2 c2 .
(3.7)
Si nous supposons que l’ensemble (Elib /c, plib ) ≡ P lib soit un quadrivecteur,
nous voyons donc que son carré au sens de Minkowski est un invariant relativiste, proportionnel à la masse au carré de la particule, en accord avec
1. Nous écrivons Elib , plib pour indiquer que les expressions changent si la particule
est exposée à un champ électromagnétique.
76
Théorie lagrangienne de l’électromagnétisme
l’hypothèse. Pour la confirmer nous nous souvenons du fait que L dt est un
invariant relativiste, que nous pouvons récrire sous la forme :
−L dt = plib · v − L dt − plib · dx = Elib dt − plib · dx = P lib · dX . (3.8)
Le produit scalaire de Minkowski de P lib avec un quadrivecteur arbitraire
(genre temps, infinitésimal) dX = (c dt, dx) forme donc un invariant, ce qui
montre que P lib est un quadrivecteur, du genre temps d’après (3.7) 2 .
Einstein a déduit les équations (3.6), (3.7) - qui sont parmi les plus connues
de toute la physique - par un raisonnement concernant le bilan energétique
d’un corps en mouvement, émettant du rayonnement électromagnétique 3 .
Ici le formalisme lagrangien nous les fournit automatiquement, révélant ainsi
toute sa puissance. Il nous dit aussi que l’ensemble (Elib/c, plib ) forme un
quadrivecteur de l’espace-temps en relativité, alors que ni l’énergie ni l’impulsion ne sont définies a priori et que seules les variables cinématiques position
et vitesse interviennent. Cette propriété découle de l’hypothèse de départ
(3.3) dont le fondement est l’invariance relativiste. La vitesse observée de la
particule est reliée à son impulsion et à son énergie par
v=
3.1.3
c2 plib
Elib
.
(3.9)
Particule chargée dans un champ électromagnétique
Interaction avec un champ électromagnétique
Considérons maintenant une particule chargée, de charge q et de masse
m, placée dans un champ électromagnétique. Nous connaissons le lagrangien
d’une particule libre relativiste et celui d’une particule non-relativiste exposée
à un champ purement électrostatique qui dérive du potentiel qφ . Dans ce
dernier cas nous avons
L = mv 2 /2 − q φ .
(3.10)
Cette forme nous indique qu’il faut chercher le lagrangien complet sous la
forme d’une somme Llibre + LI , où le lagrangien d’interaction LI décrit
2. D’ailleurs, nous avons déjà vu ce quadrivecteur en relativité [2] : à la constante m
près c’est le quadrivecteur quadrivitesse U .
3. A. Einstein : Ist die Trägheit eines Körpers von seinem Energieinhalt abhängig ?,
Ann. d. Phys. 18, 639-641 (1905).
3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE
77
l’interaction de la particule et du champ. Pour retrouver une action S, invariante de Lorentz, comme dans le cas d’une particule libre, nous remplaçons
q φ dt → q A · dX ,
(3.11)
en nous souvenant que le produit scalaire invariant des deux quadrivecteurs
A = (φ/c, A) et dX = (cdt, dx) se réduit à l’expression φ dt dans la condition
que le potentiel vecteur A soit nul. Notre proposition pour l’action d’une
particule relativiste dans un champ électromagnétique est donc
Z t2
Z t2 p
dx
2
2
2
, (3.12)
1 − v /c dt −
q (φ − v · A) dt , v =
S = −mc
dt
t1
t1
et le lagrangien correspondant s’écrit alors
p
L = −mc2 1 − v 2 /c2 − q (φ − v · A) .
(3.13)
Moment conjugué et énergie
Pour le lagrangien (3.13) le moment conjugué p = ∂L/∂v est relié à
l’impulsion plib = √ mv2 2 par
1−v /c
p=
∂L
= plib + q A .
∂v
(3.14)
Le moment conjugué p est donc différent de la quantité de mouvement relativiste plib . L’énergie E totale de la particule est donnée par
E =v·
∂L
− L = Elib + q φ .
∂v
(3.15)
Interaction minimale
Nous pouvons écrire l’action de la particule d’une manière manifestement
covariante. Pour une particule libre, d’après (3.8), son action entre deux
événements A et B dans l’espace-temps - séparés par un quadrivecteur genre
temps - se récrit de façon manifestement invariante de Lorentz
Z B
Slib = −
P lib · dX ,
(3.16)
A
expression qui fait intervenir le quadrivecteur P lib = (Elib /c , plib) .
78
Théorie lagrangienne de l’électromagnétisme
Pour une particule chargée dans un champ électromagnétique on obtiendra de la même façon
Z B
S= −
(3.17)
P · dX ,
A
c’est à dire l’action s’exprime en terme du quadrivecteur P qu’on obtient à
partir de (3.14) et de (3.15)
(3.18)
P = (E/c, p) .
P s’exprime en partant de P lib par la substitution dite minimale
P lib → P = P lib + q A .
(3.19)
De ce point de vue la nouvelle action s’obtient donc par une simple redéfinition du moment conjugué qui, effectivement, est la plus simple à faire apparaître le potentiel électromagnétique et à maintenir l’invariance de Lorentz.
L’interaction correspondante est appelée « interaction minimale » entre une
particule chargée et le champ électromagnétique.
Equation du mouvement
L’équation du mouvement s’obtient à partir des équations d’Euler-Lagrange
∂L
d ∂L
=
.
(3.20)
dt ∂v
∂r
Le lagrangien (3.13) donne
∂L
~ r L = q (∇(v
~ · A) − ∇φ)
~
=∇
,
∂r
(3.21)
d’où, en utilisant (3.20) et (3.14),
dp
d(plib + qA)
~ · A) − ∇φ))
~
=
= q (∇(v
.
dt
dt
(3.22)
Les dérivées totales des composantes A par rapport au temps s’expriment
sous la forme
∂Ax (r, t)
∂Ax (r, t)
∂Ax (r, t)
∂Ax (r, t)
dAx (r, t)
=
+ ẋ
+ ẏ
+ ż
dt
∂t
∂x
∂y
∂z
etc. (3.23)
79
3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE
ou en notation vectorielle
dA
∂A
∂A
∂A
∂A
∂A
~
=
+ (ẋ
+ ẏ
+ ż
)=
+ (v · ∇)A
.
dt
∂t
∂x
∂y
∂z
∂t
(3.24)
D’autre part on a la relation
~ · A) = (v · ∇)A
~
~ × A) .
∇(v
+ v × (∇
En reportant dans (3.22) il vient
∂A
dplib
~ × A) −
~
= q v × (∇
− ∇φ
dt
∂t
(3.25)
.
(3.26)
Les équations de Maxwell, et plus précisément le couple d’équations
~ ·B=0,
∇
~ × E = − ∂B
∇
∂t
(3.27)
permettent d’exprimer les champs E et B à partir des potentiels scalaire et
vecteur Φ et A
~ ×A,
B=∇
E=−
∂A ~
− ∇Φ .
∂t
(3.28)
Cela mène à l’équation du mouvement
dplib
= q(E + v × B) ,
dt
(3.29)
où l’impulsion plib et la vitesse v sont reliés par (3.5). Nous avons donc
retrouvé l’équation de Lorentz (3.1), à la modification près que l’impulsion
non-relativiste a été remplacée par sa version relativiste (3.5).
En dérivant (3.6) par rapport au temps on obtient à l’aide de (3.9)
dplib
dElib
=v·
dt
dt
.
(3.30)
Reportant l’équation du mouvement (3.29) et utilisant l’égalité v · (v × B) =
0, on obtient
dElib
= qv·E ,
(3.31)
dt
où E est le champ électrique : seul le champ électrique travaille et modifie
l’énergie cinétique Elib , donc la norme de la vitesse.
80
Théorie lagrangienne de l’électromagnétisme
Equation du mouvement sous forme covariante de Lorentz
Nous avons vu en (3.1.2) que les quantités (Elib /c, plib ) forment un quadrivecteur P lib . Par conséquent il devrait être possible de ramener les équations
(3.30) et (3.29) sous une forme covariante de Lorentz qui ne fasse apparaître
que des quantités covariantes de Lorentz, c’est à dire des quadri-vecteurs,
tenseurs et scalaires lorentziens. Ceci nous garantit qu’elle gardera la même
forme dans tous les référentiels. On voit bien qu’on peut exprimer (3.30)
et (3.29) sous forme d’une équation différentielle pour un quadri-vecteur,
sous condition de remplacer le différentiel dt au dénominateur par l’élément
différentiel de l’invariant relativiste temps propre vu en (3.1.1), donc par
dτ . Car dτd (Elib /c, plib ) se transformera alors comme un quadri-vecteur. Ce
passage s’effectue en multipliant ces équations par un facteur γ = √ 1 2 2 .
1−v /c
Ce facteur peut être absorbé côté droit en faisant apparaître le quadrivecteur
quadrivitesse U = m1 P lib , dont les composantes spatiales sont liés à celles de
v par
ui = γv i .
Finalement les composantes des champs électrique et magnétique forment un
tenseur - le tenseur champ électro-magnétique F µν donné en (3.64), et nos
équations (3.30) et (3.29) s’écrivent sous la forme covariante
µ
dPlib
= qF µν uν ,
dτ
comme le lecteur le vérifiera sans peine après ces explications.
(3.32)
Limite non-relativiste
On peut passer à la limite non-relativiste dans chacune des expressions
relativistes précédentes. La forme non-relativiste du lagrangien (3.13) s’écrit
1
L = −m c2 + m v 2 − q φ(r, t) + q v · A(r, t) ,
(3.33)
2
où le premier terme est une constante qu’on supprimera. Le même calcul
que celui du cas relativiste nous donne l’équation du mouvement de Lorentz
non-relativiste
mr̈ = q (E + v × B) .
(3.34)
Le moment conjugué prend la forme
p = mv + q A(r, t) .
(3.35)
81
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
On constate encore une fois que dans un champ magnétique, le moment conjugué p ne coïncide pas avec la quantité de mouvement mv. De la même façon, le moment cinétique L = r × p ne coïncide pas avec le moment de la
quantité de mouvement r × mv. Pour l’énergie non-relativiste on retrouve
E = m v 2 /2 + q Φ comme il se doit.
Invariance de jauge
Une chose, cependant, paraît surprenante. Nous exprimons le lagrangien
toujours en fonction des potentiels A et Φ, et non des champs E et B. Or les
potentiels ne sont pas uniques : les champs E et B demeurent invariants par
les transformations de jauge,
~
A → A′ = A + ∇χ(r,
t) ,
Φ → Φ′ = Φ −
∂χ
∂t
,
(3.36)
où χ(r, t) est une fonction arbitraire. La vitesse v de la particule est une
une grandeur physique, mesurable, indépendante de la jauge. En revanche,
la variable moment conjugué p = mv + qA dépend de la jauge choisie.
Pour analyser le comportement du lagrangien dans les transformations
(3.36) on porte cette transformation dans l’expression (3.12) ou dans (3.33),
et on obtient
∂χ
~
).
(3.37)
L′ = L + q (v · ∇χ(r,
t) +
∂t
La différence est une dérivée totale par rapport au temps
L′ = L + q
d
χ(r, t) ,
dt
(3.38)
dont nous avons vu en 2.2 qu’elle n’affecte pas les équations du mouvement.
Une transformation de jauge n’affecte donc pas la physique du problème.
Remarquons que l’invariance de jauge a joué un rôle clé dans la découverte du modèle standard de la physique des particules, qui est une théorie
quantique de champs de jauge nonabéliens [16].
3.2
Théorie lagrangienne des champs
Pour obtenir le lagrangien complet de l’électromagnétisme il nous faut
étendre le formalisme lagrangien aux systèmes continus, donc aux systèmes
82
Théorie lagrangienne de l’électromagnétisme
à un nombre infini de degrés de liberté. Le prototype de système physique
qui permet d’étudier la transition vers le continu en mécanique est la corde
vibrante.
3.2.1
Corde vibrante
x=0
x=l
ψ(x,t)
Figure 3.1 – La corde discrétisée ; ψ(x, t) est l’élongation par rapport à la position d’équilibre à l’instant t .
On considère une corde élastique tendue horizontalement entre les points
x = 0 et x = l. Sa masse linéique ρ est uniforme. On ne tient pas compte de
la pesanteur, et on ne considère que les déformations de la corde dans le plan
transverse (ondes transversales). On note ψ(x, t) l’élongation transverse du
point d’abscisse x par rapport à sa position d’équilibre à l’instant t. On suppose, pour simplifier, que cette élongation se produit dans une seule direction
(l’axe vertical). On peut, par la pensée, considérer la corde comme l’ensemble
d’un grand nombre d’éléments de longueur individuelle dx obéissant chacun
aux lois de la dynamique. A la limite, cela se transforme en un système à
nombre infini de degrés de liberté.
Soit un élément de la corde de longueur dx, l’énergie cinétique de cet
élément est
1
∂ψ
dEc = (ρ dx)( )2 .
(3.39)
2
∂t
Soit T la tension de la corde. Si l’élongation de deux éléments centrés en x
et x + dx, varie par rapport à l’élongation au repos, l’énergie potentielle V ,
correspondant à la loi de Hooke, varie d’après Pythagore de
!
r
p
∂ψ
(ψ(x + dx) − ψ(x))2 + dx2 − dx = T
1 + ( )2 − 1 dx
dV = T
∂x
83
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
où, bien évidemment, (∂ψ/∂x)2 ≪ 1. L’énergie potentielle V de la corde due
à la déformation est, par conséquent,
Z l
∂ψ
1
(3.40)
( )2 dx .
V = T
2
0 ∂x
Le lagrangien de la corde entière est la somme des lagrangiens élémentaires
dL = dEc − dV , soit
Z
1 l
∂ψ
∂ψ
L=
[ ρ ( )2 − T ( )2 ] dx .
(3.41)
2 0
∂t
∂x
Si l’on considère la corde comme un ensemble d’éléments matériels de longueur dx, chacun a un lagrangien élémentaire
dL = L(ψ,
1
∂ψ
∂ψ
∂ψ ∂ψ
,
) dx = [ ρ ( )2 − T ( )2 ] dx .
∂t ∂x
2
∂t
∂x
(3.42)
La quantité L qui apparaît dans cette expression est appelée la densité de
lagrangien de la corde. Dans notre cas, L ne dépend pas de ψ , mais seulement
de ∂ψ
et de ∂ψ
. L’action de la corde est en effet
∂t
∂x
S=
Z
1
L dx dt =
2
Z
t2
dt
t1
Z
0
l
dx [ρ (
∂ψ 2
∂ψ
) − T ( )2 ] .
∂t
∂x
(3.43)
Nous avons affaire à un problème à deux variables (x, t) dont dépend la
variable dynamique ψ(x, t). Dans un procédé analogue à celui du chapitre
précédent nous nous donnons l’état initial ψ(x, t1 ) et l’état final ψ(x, t2 )
de la corde. D’après le principe de moindre action, il faut alors minimiser
l’intégrale (3.43) avec les conditions aux bords
δψ(0, t) = 0 ,
δψ(l, t) = 0 ,
δψ(x, t1 ) = 0 ,
δψ(x, t2 ) = 0 .
(3.44)
Les deux premières de ces équations correspondent au fait que la corde est
fixée à x = 0 et à x = l. Les deux autres expriment le fait que les variations
considérées sont toujours telles qu’elles laissent inchangés l’état initial et
∂
∂
l’état final du système (de la corde). En faisant varier ψ, ∂t
ψ et ∂x
ψ on
obtient
"
#
Z
∂L
∂L
∂ψ
∂L
∂ψ
δS = dx dt
δψ + ∂ψ δ( ) + ∂ψ δ( )
.
∂ψ
∂t
∂( ∂t )
∂( ∂x ) ∂x
84
Théorie lagrangienne de l’électromagnétisme
Ensuite on effectue les intégrations par parties usuelles en utilisant (3.44)
"
#
Z
∂ ∂L
∂ ∂L
∂L
δS = dx dt
δψ .
−
−
∂ψ
∂ψ ∂t ∂( ∂ψ
∂x
)
∂(
)
∂t
∂x
Vu que δψ est une fonction arbitraire de x et de t , la condition δS = 0 nous
donne l’équation d’Euler-Lagrange
∂L
∂
∂L
∂L
∂
+
=
.
(3.45)
∂t ∂(∂ψ/∂t)
∂x ∂(∂ψ/∂x)
∂ψ
Dans notre cas,
par
∂L
∂ψ
= 0 si bien qu’en définissant la vitesse de propagation c
T
(3.46)
ρ
nous aboutissons à l’équation de propagation des vibrations de la corde
c2 =
2
∂2ψ
2 ∂ ψ
−c
=0 .
∂t2
∂x2
(3.47)
On voit ainsi comment une équation d’ondes se déduit d’un principe variationnel. Il faut, ici, que la différence entre l’énergie cinétique totale de la
corde et son énergie potentielle soit la plus faible possible.
On peut ajouter à la densité de lagrangien L un terme linéaire en ψ
provenant d’une force extérieure F (x) dx appliquée sur chaque élément de la
corde
1
∂ψ
∂ψ
L = [ ρ ( )2 − T ( )2 ] + F ψ ,
(3.48)
2
∂t
∂x
ce qui mène à l’équation du mouvement inhomogène
2
∂2ψ
2 ∂ ψ
−
c
= F/ρ .
∂t2
∂x2
3.2.2
(3.49)
Equations d’Euler-Lagrange généralisées
Le cas précédent nous a fait aborder un problème plus complexe que les
équations vues en (2.6) et (2.7). En effet, s’agissant d’un champ, la variable
dynamique ψ dépend de plusieurs variables : dans l’exemple (3.47) le champ
ψ dépend des deux variables t et x. Considérons, de manière générale, n
variables dynamiques ψk , k = 1, . . . , n, qui, elles-mêmes, dépendent de m
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
85
variables xs , s = 1, . . . , m (y compris le temps), soit ψk (xs ) . Posons par
définition
∂ψk
,
(3.50)
ψk,s ≡
∂xs
et notons [ψk,s ] l’ensemble des dérivées partielles de ψk (x1 , . . . , xm ). La densité
de lagrangien est de la forme L(ψ1 , [ψ1,s ], . . . , ψn , [ψn,s ]) et l’action
Z
S = L(ψ1 , [ψ1,s ], . . . , ψn , [ψn,s ]) dx1 . . . dxm .
On se convaincra que la détermination de l’extrémum de l’action S sous
l’ensemble des variations infinitésimales ψk → ψk + δψk , k = 1, . . . , n qui
s’annulent au bord du volume d’intégration, mène, après avoir effectué toutes
les intégrations par parties, aux équations d’Euler-Lagrange généralisées
m
X
∂
∂L
∂L
=
, k = 1, . . . , n .
(3.51)
s
∂x ∂ψk,s
∂ψk
s=1
En théorie des champs relativistes, il est naturel d’englober le temps t dans les
variables (t, x, y, z) dont dépendent les champs ψk . Dans beaucoup d’autres
problèmes, il est commode de singulariser la variable temps. En définissant
∂ψk
,
ψ̇k ≡
∂t
on obtient
m−1
X ∂ ∂L ∂L
∂
∂L
,
(3.52)
−
=
∂t ∂ ψ̇k
∂ψk
∂xs ∂ψk,s
s=1
dont (3.45) est un cas particulier.
Champ scalaire
Les résultats précédents nous font entrevoir le lagrangien d’un champ
scalaire à 3 dimensions, par exemple les ondes sonores dans un fluide compressible non-visqueux. En appelant ψ(r, t) la compression du fluide, et c la
vitesse du son dans le fluide, la densité de lagrangien a la forme
1
1 ∂ψ
~ 2] .
L = ρ [ 2 ( )2 − (∇ψ)
(3.53)
2 c ∂t
On obtient sans difficulté, à partir de la densité de lagrangien (3.53), l’équation de propagation
1 ∂2ψ
− ∆ψ = 0 .
(3.54)
c2 ∂t2
86
3.2.3
Théorie lagrangienne de l’électromagnétisme
Champ électromagnétique
Le cas du champ électromagnétique est plus complexe. Il faut tenir compte
de la nature vectorielle de ces champs, et surtout prendre en compte l’invariance relativiste, propriété fondamentale des équations de Maxwell. Le
champ électromagnétique est inséparable des particules chargées qui en sont
les sources et sur lesquelles il agit. Nous avons vu en (3.12) que l’action
d’un point matériel chargé dans un champ électromagnétique s’écrit comme
Slibre + Sint où
Z
Z Sint =
Lint dt =
q v · A(r, t) − q Φ(r, t) dt .
(3.55)
Nous voulons généraliser (3.55) à une distribution de charge ρ(x, t) . Rappelons le quadrivecteur courant [2]
(3.56)
J = (cρ, j) ,
où ρ et j sont respectivement la densité de charge et la densité de courant.
L’interaction avec un champ électromagnétique s’exprime en terme du quadrivecteur potentiel
A = (Φ/c, A) .
(3.57)
Le produit scalaire 4 J · A ≡ jµ Aµ au sens de Minkowski est un invariant
relativiste homogène à une densité de lagrangien. Posons donc
Z
(3.58)
Sint = (−J · A) d3 x dt
Sint est un invariant relativiste, car J·A et d3 x dt (voir [3], chapitre 2) le sont.
Pour un point matériel de charge q, de trajectoire
~x(t) et de vitesse ~v (t) , on
trouve (cρ, ~j) = q c δ 3 (~x − ~x(t)), ~v δ 3 (~x − ~x(t)) , où δ 3 (~x) est la distribution
de Dirac dans l’espace à trois dimensions (pour ceux qui la connaissent), et
dans ce cas on récupère (3.55) de (3.58). La quantité
(3.59)
Lint = −J · A
est une densité de lagrangien de façon que Sint =
R
Lint d3 x dt .
4. Dans cette section nous utilisons la convention d’Einstein de sommation sur les
indices répétés.
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
87
Cherchons maintenant l’action totale d’un système de particules chargées
dans un
électromagnétique. Il nous manque encore la contribution
R champ
3
Sch = Lch d x dt dont se déduisent les équations du champ électromagnétique en l’absence de sources. Dans l’hypothèse la plus simple l’action totale
sera alors de la forme
S = Spart + Sint + Sch .
(3.60)
Connaissant la forme de Lint nous partons de l’hypothèse que les variables dynamiques dont dépend la partie Sch de l’action sont toujours les composantes
du quadrivecteur potentiel A . Dans ce cas les équations d’Euler-Lagrange généralisées (3.51) s’écrivent
!
∂
∂L
∂L
=
, µ = 0, 1, 2, 3 .
(3.61)
∂Aµ
ν
∂x
∂Aµ
∂( ν )
∂x
La partie Lint (3.59) du lagrangien, que nous connaissons déjà, va contribuer
un terme −j µ au membre de droite de cette équation.
Pour continuer jetons encore un coup d’œil sur la forme covariante des
équations de Maxwell ([2], ch. 7.3 ou [3], ch. 6). Les champs s’expriment à
partir des potentiels Φ et A par
~ ×A,
B=∇
~ − ∂A .
E = −∇Φ
∂t
(3.62)
En utilisant la notation ∂µ = ∂/∂xµ et ∂ µ = η µν ∂ν , on exprime le tenseur
champ électromagnétique par
F µν = ∂ µ Aν − ∂ ν Aµ .
En notation matricielle ce tenseur antisymétrique s’écrit


0
−Ex /c −Ey /c −Ez /c
 Ex /c
0
−Bz
By 

(F ) = 
 Ey /c
Bz
0
−Bx 
Ez /c −By
Bx
0
(3.63)
(3.64)
en accord avec (3.62). Le couple d’équations de Maxwell homogènes (3.27)
découle de la structure du tenseur F µν , qui assure les équations (ou identités)
∂ µ F νρ + ∂ ν F ρµ + ∂ ρ F µν = 0 .
(3.65)
88
Théorie lagrangienne de l’électromagnétisme
On vérifiera qu’elles se réduisent pour µ, ν, ρ mutuellement différents 5 à
~ × E = − ∂B ,
∇
∂t
~ ·B=0 .
∇
Les deux équations de Maxwell inhomogènes relient les champs aux densités
de charge et de courant. Elles s’écrivent
∂ν F νµ = µ0 j µ ,
(3.66)
et elles se ramènent bien à
~ ·E = ρ ,
∇
ε0
~ × B = µ0 j + 1 ∂E .
∇
c2 ∂t
Au vu de (3.61) et de (3.59), les équations (3.66) nous font chercher Lch sous
une forme qui donne
∂
1
∂Lch
∂Lch
≡ − ∂ν F νµ ,
= 0.
(3.67)
ν
∂x
∂(∂ν Aµ )
µ0
∂Aµ
Pour satisfaire à cette identité l’expression pour Lch devrait donc être bilinéaire dans les variables ∂ν Aµ . Nous la voulons aussi invariante relativiste
ce qui nous limite aux trois expressions (voir aussi [2], ch. 7.3) 6
Fµν F µν = −2(
E2
− B2 ) ,
c2
∗
Fµν F µν = 4
E·B
,
c
(∂µ Aµ )2 .
(3.68)
Nous vérifions qu’en retenant le premier terme et en posant
Lch = −
1
Fµν F µν
4µ0
(3.69)
on trouve la relation recherchée (3.67). En revenant à (3.68) nous constatons
d’ailleurs que le troisième terme (∂µ Aµ )2 n’est pas invariant de jauge, et que
le deuxième terme ∗ F µν Fµν n’est pas invariant dans les transformations de
Lorentz de déterminant -1 (ce qui implique une brisure de la symétrie parité,
symétrie pourtant respectée par l’électromagnétisme).
5. si au moins 2 indices sont égaux le membre de gauche est identiquement nul
6. Nous utilisons la définition ∗ Fµν = 12 εµνρσ F ρσ , qui fait apparaître le tenseur εµνρσ .
Il est complètement antisymétrique dans une permutation de ses 4 indices et il satisfait à
ε0123 = 1 .
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
89
Nous avons donc trouvé une expression pour l’action totale de l’électromagnétisme. En ajoutant (3.69), (3.58), et (3.3) adaptée à une densité continue de la masse ρm (x, t) , on obtient
Z p
1
µν
2
2
2
Fµν F − J · A − ρm c
1 − v /c
d3 x dt .
(3.70)
S=
−
4µ0
On voit à partir de (3.68), (3.69) que le champ électromagnétique physique
dans le vide, en dehors des charges, est celui qui rend extrémale la différence
E 2 /c2 −B 2 , compte tenu des contraintes imposées par la présence des sources
et aux limites. Pour une onde plane cette différence s’annule. La contrainte
était explicite dans le cas simple du champ électrostatique traité en 2.5.4.
Exercices
3.1 Repère tournant et pendule de Foucault
Le lagrangien d’une particule libre nonrelativiste de masse m prend la forme
L=
m 2
v0
2
où v0 est la vitesse de la particule dans un référentiel inertiel S0 .
1. On se place dans un référentiel S qui est en rotation uniforme par
rapport à S0 à la vitesse angulaire Ω . Quelle est la forme du lagrangien
dans S ?
2. Ecrire les équations d’Euler-Lagrange dans S .
3. En partant du lagrangien déduire le moment p conjugué à r dans S .
Comparer au cas d’une particule dans un champ magnétique. Montrer
que l’énergie E est conservée.
4. On considère un pendule de longueur l , dans un référentiel en rotation lente. Dans ce cas on peut négliger le terme d’ordre Ω2 dans le
90
Théorie lagrangienne de l’électromagnétisme
z
Ω
θ
Ωz
Ωx
r
φ
x
Figure 3.2 – Pendule pesant de longueur l .
lagrangien. On passe en coordonnées sphériques. Le vecteur position ~r
du pendule s’écrit alors comme
~r = l (sin θ cos φ, sin θ sin φ, − cos θ) ,
voir Fig. 3.2.
On choisira les axes tels que
~ = (Ωx , 0, Ωz ) .
Ω
On se limite aux petites oscillations du pendule. Dans ce cas, montrer
~ × ~r) du lagrangien L dans S prend la forme
que le terme m ~v · (Ω
2
2
ml Ωz θ φ̇ + Ωx (θ̇ sin φ + θ cos φ φ̇) .
5. Le pendule est soumis au champ gravitationnel de la Terre, orienté
selon l’axe z, voir Fig.3.2. Exprimer l’énergie potentielle du pendule en
fonction de l’angle θ pour θ ≪ 1 .
6. En ajoutant le terme m2 v 2 , le lagrangien du pendule pesant dans le
repère tournant s’écrit en coordonnées sphériques comme
θ2
m 2 2
l θ̇ + θ2 φ̇2 + 2 Ωz θ2 φ̇ + 2 Ωx (θ̇ sin φ + θ cos φ φ̇) −m g l
Lp =
2
2
2
3
où nous avons négligé les termes d’ordre Ω ou d’ordre θ . Pourquoi le
lagrangien simplifié
m 2 2
θ2
Ls =
l θ̇ + θ2 φ̇2 + 2 Ωz θ2 φ̇ − m g l
2
2
donne-t-il les mêmes équations du mouvement que le lagrangien Lp ?
91
3.2. THÉORIE LAGRANGIENNE DES CHAMPS
7. Déduire de Ls les moments conjugués pθ et pφ , des variables angulaires
θ et φ .
8. Ecrire les équations du mouvement et montrer que pφ est conservé.
9. On choisit pφ ≡ 0 . Comment peut-on réaliser cette condition expérimentalement ?
10. Pour pφ ≡ 0 , donner la solution pour φ(t) .
Pour le pendule de Foucault au Panthéon, voir Fig.3.3, la Terre constitue un référentiel tournant, dont l’axe de rotation ne passe pas par le
~ × ~r) du lapoint ~r = 0 . Comment doit-on modifier le terme m ~v · (Ω
grangien dans ce cas ? Expliquer pourquoi cette modification ne change
pas les équations du mouvement du pendule.
A quelle vitesse angulaire, en degrés par heure, le plan des oscillations
du pendule de Foucault tourne-t-il (toujours pour pφ ≡ 0 ), sachant
que la latitude de Paris est de 49o ?
z
Ω
Paris
49
o
Figure 3.3 – Rappel géographique
3.2 Le lagrangien de Proca
Nous considérons la densité de lagrangien
µ2
1
Aµ Aµ − µ0 jµ Aµ .
Lproca = − F µν Fµν +
4
2
2
L’essentielle modification par rapport à (3.70) est le terme µ2 Aµ Aµ . (Nous
avons supprimé la contribution Lpart qui ne nous intéresse pas ici, et nous
avons introduit un facteur multiplicatif global sans importance, pour simplifier la notation). Ecrire l’équation d’onde pour Aµ qui se déduit de ce
lagrangien. On utilisera la jauge de Lorentz ∂µ Aµ = 0 . Pour J = 0 on trouve
92
Théorie lagrangienne de l’électromagnétisme
des ondes planes comme solutions de cette équation. Quelle est la relation
entre la pulsation ω et le vecteur d’onde k de ces ondes ? En utilisant les
relations, de Planck-Einstein E = ~ω , et d’Einstein-de Broglie p = ~k , pour
le photon, donner l’interprétation physique de la quantité ~µ/c.
Chapitre 4
Formalisme canonique de
Hamilton
C’est dans le silence des lois
que naissent les grandes actions.
Donatien, Alphonse, Marquis de Sade
Le travail de Lagrange avait été suivi par le monumental Traité de Mécanique Céleste en 5 volumes de Laplace, publié entre 1799 et 1825. Ce traité
se révéla d’une importance décisive pour l’astronomie aussi bien que pour la
philosophie. Cela nous mène à la formulation dite canonique de la mécanique
analytique due à Hamilton 1 qui date de 1834. Elle est plus commode pour
un certain nombre de problèmes, notamment la mécanique d’ensembles de
points. Mais elle est surtout d’une richesse impressionnante tant par ses développements mathématiques que physiques. Ce texte est avant tout orienté
vers les applications à la mécanique, mais nous ferons allusions à quantité
d’autres retombées des travaux de Hamilton. Dans la partie 1, nous exposerons ce formalisme qui consiste à décrire l’état d’un système par les variables
conjuguées que sont les positions {x} et les moments conjugués de Lagrange
{p}, et non par les positions et les vitesses. Autrement dit, on décrit cet
état par un point dans l’espace des phases, un système étant caractérisé par
un hamiltonien dérivé du lagrangien par une transformation de Legendre.
Par ce nouveau regard sur le problème qui rend les variables dans l’espace
des phases complètement indépendantes, l’étude de systèmes hamiltoniens
1. Comme au chapitre 2 on pourra se référer à Landau et Lifshitz [9], à Herbert Goldstein [10] et à Guignoux et Silvestre-Brac [11] pour tout complément.
93
94
Formalisme canonique de Hamilton
en mécanique, devient une étude géométrique : c’est le hamiltonien qui régit
les propriétés géométriques de l’ensemble des trajectoires dans l’espace des
phases.
Après avoir établi les équations canoniques de Hamilton, qui sont des
équations différentielles couplées du premier ordre en temps pour les variables d’état, nous abordons, dans la partie 2, avec les crochets de Poisson,
une structure mathématique naturellement liée à la géométrie hamiltonienne.
Les crochets de Poisson ont été inventés en 1809. Carl Gustav Jacob Jacobi
considérait que c’était la plus grande découverte de Poisson, qui, pourtant,
avait fait des contributions importantes aux mathématiques, aux probabilités, à la mécanique analytique, à l’électricité (sans compter ses nombreuses
fonctions officielles). Cette étude nous permettra de voir les lois de conservation sous un angle nouveau. Elle nous permettra d’analyser les transformations canoniques, qui ont de multiples applications, et qui font apparaître
une parfaite équivalence entre les variables d’état {x} et {p}. L’espace des
phases est, du point de vue mathématique, le véritable espace approprié à la
description de l’évolution d’un système de points, contrairement à l’espace
« empirique » des variables position. Nous établirons notamment le théorème
de Liouville, propriété géométrique remarquable de l’évolution d’un système
dans l’espace des phases. Nous parviendrons ensuite naturellement à l’étonnante découverte faite par Dirac en 1925. Il y a une symétrie entre mécanique
analytique et mécanique quantique si l’on fait correspondre aux crochets de
Poisson classiques les commutateurs des observables quantiques.
Dans la partie 3, nous présentons quelques aspects des systèmes dynamiques. Ce type de problème physique a, en effet, été une extraordinaire
source de découvertes tant en mathématiques qu’en physique. Le fondateur
de ce champ d’étude est Henri Poincaré, dès 1885, notamment quand il a
étudié le problème des 3 corps. Cela mène à des problèmes fascinants : les
problèmes limites à t = ∞, les attracteurs et les attracteurs étranges, les
bifurcations, le chaos etc. L’attracteur étrange le plus célèbre est sans doute
l’attracteur de Lorenz, du nom de son inventeur Edward N. Lorenz qui le
découvrit en 1963 à partir d’un modèle mathématique de l’atmosphère, et
relança de façon spectaculaire avec l’effet « aile de papillon » en météorologie, l’intérêt pour le chaos, inventé par Poincaré 80 ans plus tôt.
La partie 4 est consacrée à l’équation de Hamilton-Jacobi, où l’on travaille
directement avec l’action et non plus le lagrangien ou le hamiltonien. Après
avoir établi l’équation de Hamilton-Jacobi, nous découvrirons une série impressionnante de résultats. Nous verrons comment, pour les systèmes conser-
4.1. EQUATIONS CANONIQUES
95
vatifs, le flot des trajectoires est orthogonal aux surfaces d’action constante.
Cela nous fera redécouvrir le Principe de Maupertuis sous une forme géométrique. Nous verrons alors comment l’optique géométrique apparaît comme
limite de l’optique ondulatoire, comme l’avait découvert Hamilton. Cette démonstration fait intervenir ce que l’on nomme l’eikonal qui est l’analogue
optique de l’action. Dans l’approximation des faibles longueurs d’onde dite
approximation eikonale, l’onde se propage avec un vecteur d’onde localement
perpendiculaire aux surfaces sur lesquelles l’eikonal est constant. Ces surfaces sont les fronts d’ondes géométriques. L’approximation eikonale correspond exactement au principe de Fermat. L’interprétation géométrique n’est
autre que le Principe de Huygens-Fresnel. Enfin, nous montrerons comment
le même cadre de pensée peut être appliqué à la mécanique ondulatoire et
à l’équation de Schrödinger. Cela constitue la célèbre approximation semiclassique de Brillouin, Kramers et Wentzel.
Remarquons que le formalisme hamiltonien se prête moins aux problèmes
relativistes que le formalisme lagrangien. Car le hamiltonien, étant lié à l’énergie qui est la composante genre temps d’un quadrivecteur, n’est pas un invariant relativiste. Nous nous limiterons donc essentiellement à des illustrations
non-relativistes du formalisme canonique.
4.1
Equations canoniques
De fait, la formulation (1.8) du principe de moindre action n’est pas celle
de Lagrange (plus complexe). Elle est due à Hamilton, un des plus grands
génies de la science, parfois ignoré par les mécaniciens français, qui était
fasciné par Lagrange et par cette Mécanique analytique, qu’il qualifiait de
« poème scientifique par le Shakespeare des Mathématiques ». Le formalisme
canonique de Hamilton date de 1834. Il est plus commode pour un certain
nombre de problèmes, et contient le germe d’une structure mathématique
particulièrement féconde qui mènera aux groupes de Lie, aux systèmes dynamiques et à quantité d’autres développements. Hamilton se propose de
décrire l’état d’un système par les variables xi et pi , moments conjugués, au
lieu de xi et ẋi .
Supposons que l’on sache inverser l’équation (2.15) et calculer {ẋi } en
fonction de {xi } et {pi }, que nous prenons comme nouvelles variables d’état 2 .
2. Ici nous nous limitons aux cas suivants : soit il n’existe pas de contrainte entre les xi ,
soit ces contraintes ont été exprimées par des multiplicateurs de Lagrange. Dans ces cas le
96
Formalisme canonique de Hamilton
Le problème posé est d’obtenir les équations du mouvement de {xi } et {pi }
en termes de ces mêmes variables, en éliminant les {ẋi }. La solution consiste
à effectuer ce qu’on appelle une transformation de Legendre 3 . Introduisons
la fonction de Hamilton, ou hamiltonien
X
H({xi }, {pi }; t) =
pi ẋi − L .
(4.1)
i
Considérons un problème à une dimension et écrivons la différentielle totale
dH = p dẋ + ẋ dp −
∂L
∂L
∂L
dx −
dẋ −
dt .
∂x
∂ ẋ
∂t
(4.2)
Si nous tenons compte de (2.15), le premier et le quatrième terme se compensent, et le long de la trajectoire physique, le troisième n’est autre que
−ṗ dx d’après (2.16), d’où
dH = ẋ dp − ṗ dx −
∂L
dt
∂t
(4.3)
∂H
∂x
(4.4)
ce qui donne les équations du mouvement
ẋ =
∂H
,
∂p
ṗ = −
qu’on appelle équations canoniques de Hamilton. Pour un nombre quelconque
de degrés de liberté on trouve
ẋi =
∂H
,
∂pi
ṗi = −
∂H
∂xi
.
(4.5)
Les équations de Hamilton (4.5) constituent un système différentiel couplé
du premier ordre dans le temps. Elles sont symétriques en x et p (au signe −
moment conjugué de xi «existe» toujours puisque le lagrangien contient un terme cinétique
qui est fonction nonlinéaire de ẋi . Dans le deuxième cas les moments conjugués pourraient
faire apparaître les multiplicateurs de Lagrange, qui généralement peuvent dépendre du
temps.
3. Les transformations de Legendre sont d’un usage courant lorsque l’on souhaite faire
des changements de variables. On choisit tel ou tel couple (ou ensemble) de variables
par commodité suivant le problème considéré. Un exemple simple est celui des fonctions
ou potentiels thermodynamiques. A partir de l’énergie interne U qui est commode si
l’on travaille avec le volume et l’entropie dU = −P dV + T dS, on passe à l’énergie libre
F = U − T S si l’on travaille avec le volume et la température dF = −P dV − SdT etc.
97
4.1. EQUATIONS CANONIQUES
près, sur lequel nous reviendrons). Elles présentent le gros avantage technique
d’exprimer directement l’évolution dans le temps des variables d’état comme
fonction de ces mêmes variables.
La valeur de la fonction de Hamilton le long de la trajectoire physique est
tout simplement l’énergie (2.23). Si le lagrangien ne dépend pas explicitement
du temps : ∂L/∂t = 0 , on a d’après (4.2) ∂H/∂t = 0 , et par conséquent
l’énergie est conservée :
d
∂H
= 0 =⇒
H=0
∂t
dt
.
(4.6)
Exemple : Hamiltonien d’une particule en champ électromagnétique
Dans le cas non-relativiste nous partons du lagrangien (3.33) et de l’expression du moment conjugué (3.35). La transformation de Legendre donne
le hamiltonien non-relativiste. A l’aide de (3.35) on l’exprime en fonction de
p et de r :
H =
1
∂L
·v−L =
(p − q A(r, t))2 + q Φ(r, t) .
∂v
2m
(4.7)
En partant du lagrangien relativiste (3.13) et de l’expression du moment
conjugué (3.14) on obtient de la même manière le hamiltonien relativiste
p
H =
m2 c4 + c2 (p − q A)2 + q Φ ,
(4.8)
où l’on retrouve encore une «prescription minimale» pour introduire l’interaction électromagnétique : on part de l’expression (3.6) pour l’énergie d’une
particule libre relativiste, on exprime plib comme p − q A , et on remplace
l’énergie Elib par Elib + q φ . Le long de la trajectoire physique H prend donc
la valeur Elib + q φ .
C’est cette prescription que Schrödinger appliquait à l’équation d’onde
libre des ondes de de Broglie pour calculer les niveaux de l’atome d’hydrogène. Après quelques méandres imprévus, cela le fit aboutir à sa célèbrissime
équation.
On retrouve (4.7) aussi, à la constante mc2 près, par la limite nonrelativiste de (4.8). Et (4.7) s’obtient encore par la règle de substitution
1
minimale, en partant du hamiltonien nonrelativiste libre Hlib = 2m
p2lib .
98
Formalisme canonique de Hamilton
Nous avons constaté en 3.1.3 que les équations du mouvement sont invariantes de jauge (voir aussi l’exercice 4.1), même si le hamiltonien en dépend.
Ce point est moins évident lorsque l’on considère la transposition quantique
du résultat 4 . Dans l’expérience d’Aharonov et Bohm 5 on peut mettre en
évidence que le hamiltonien s’exprime à partir des potentiels, et non pas des
champs.
4.2
Crochets de Poisson ; Espace des phases
Pour un système à N degrés de liberté l’espace des phases est défini
comme l’espace à dimension 2N qui est donné par l’ensemble des points
(x1 , . . . , xN , p1 , . . . , pN ) . Considérons deux grandeurs physiques f et g, fonctions des variables d’état (xi , pi ), i = 1, . . . , N et éventuellement du temps.
On appelle crochet de Poisson de f et g la quantité
N X
∂f ∂g
∂f ∂g
−
{f, g} =
∂xi ∂pi
∂pi ∂xi
i=1
(4.9)
.
Les crochets de Poisson ont les propriétés suivantes, que l’on établit directement
{f, g} = −{g, f } ,
(4.10)
{f1 + f2 , g} = {f1 , g} + {f2 , g}
{f1 f2 , g} = f1 {f2 , g} + {f1 , g}f2
(4.11)
.
Pour les variables d’état (xi , pi ) on a les relations importantes
{xi , xj } = 0 ,
et
{xi , f } =
{pi , pj } = 0 ,
∂f
∂pi
{xi , pj } = δij
{pi , f } = −
∂f
∂xi
.
,
(4.12)
(4.13)
On établira sans difficulté l’identité de Jacobi
{f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0 .
(4.14)
4. Voir J.-L. Basdevant et Jean Dalibard, Mécanique quantique Edition 2001, Chapitre
15, § 5.3.
5. A. Tonomura et al., Phys. Rev. Lett. 56, 792, (1986).
4.2. CROCHETS DE POISSON, ESPACE DES PHASES
4.2.1
99
Evolution temporelle, constantes du mouvement
Calculons maintenant l’évolution temporelle d’une quantité physique quelconque f (x1 , . . . , xN , p1 , . . . , pN ; t) . On a
X ∂f
∂f
∂f
df
ẋi +
ṗi ) +
=
(
.
(4.15)
f˙ =
dt
∂xi
∂pi
∂t
i
En utilisant les équations de Hamilton (4.5), on obtient
∂f
f˙ = {f, H} +
∂t
.
(4.16)
En particulier, les équations canoniques (4.5) s’écrivent de façon symétrique
ẋi = {xi , H} ,
ṗi = {pi , H} .
(4.17)
Dans le formalisme canonique, le hamiltonien gouverne l’évolution dans le
temps du système. Si une grandeur physique f ne dépend pas explicitement
du temps, c’est-à-dire ∂f /∂t = 0, alors son évolution dans le temps est
obtenue à partir du crochet de Poisson de f et du hamiltonien
f˙ = {f, H} .
(4.18)
Nous avons donc établi le résultat : Si le crochet de Poisson avec le hamiltonien d’une fonction f (x1 , . . . , xN , p1 , . . . , pN ) s’annule, alors f est une
constante du mouvement.
Plus précisément une grandeur f (x1 , . . . , xN , p1 , . . . , pN ; t) est nommée intégrale première si elle satisfait {f, H} = 0 . On l’appelle constante du mouvement si df /dt = 0 . Les deux notions sont équivalentes si ∂f /∂t = 0 .
Théorème de Poisson : Si f et g sont deux intégrales premières, alors leur
crochet de Poisson est aussi une intégrale première.
Ce théorème, dû à Poisson, découle de l’identité de Jacobi (4.14)
{H, {f, g}} + {f, {g, H}} + {g, {H, f }} = 0 .
(4.19)
Par hypothèse {g, H} = 0 et {H, f } = 0. Par conséquent,
{H, {f, g}} = 0 ,
et {f, g} est une intégrales première.
Ce théorème peut permettre de trouver de nouvelles constantes du mouvement.
100
4.2.2
Formalisme canonique de Hamilton
Transformations canoniques
Dans le formalisme lagrangien, les équations d’Euler-Lagrange gardent
la même forme dans tout changement de coordonnées xi −→ Xi (x1 , . . . , xn )
(par exemple dans le passage de coordonnées cartésiennes (x, y, z) en coordonnées polaires (r, θ, φ)). Ces changements de coordonnées dans l’espace des
configurations sont appelés des transformations ponctuelles. Dans le formalisme hamiltonien, il existe une classe encore plus large de transformations qui
laissent invariantes les équations du mouvement. On peut, en effet, mélanger
les variables d’état que sont les positions {xi } et les moments conjugués {pi } .
On appelle transformation canonique une transformation de coordonnées
Xi (x1 , . . . , xN , p1 , . . . , pN ) ,
Pi (x1 , . . . , xN , p1 , . . . , pN )
(4.20)
telle que les équations de Hamilton gardent la même forme dans ces nouvelles
variables. Elle préserve donc les équations du mouvement :
Soit H ′ (X1 , . . . , XN , P1 , . . . , PN ) la fonction de Hamilton exprimée dans les
variables {Xi }, {Pi } , alors, dans une transformation canonique,
Ẋi =
∂H ′
,
∂Pi
Ṗi = −
∂H ′
∂Xi
(4.21)
.
Le théorème suivant est d’une grande importance pratique.
Théorème : Une transformation (x1 , . . . , pN ) → (X1 , . . . , PN ) qui préserve les
crochets de Poisson des variables canoniques (4.12), est une transformation
canonique. Une transformation canonique préserve les crochets de Poisson.
Le critère du théorème signifie que les crochets de Poisson exprimés dans
les nouvelles variables soient les mêmes que ceux exprimés dans les variables
initiales, c’est-à-dire
{Xi , Xj } = 0 ,
{Pi , Pj } = 0 ,
{Xi , Pj } = δij
.
(4.22)
Donnons une démonstration directe. Pour la simplifier, considérons un seul
couple de variables (x, p) et une transformation (x, p) → (X(x, p), P (x, p)),
tel que {X, P } = 1 . Notons H(x, p) et H ′(X, P ) l’expression de la fonction
de Hamilton dans ces deux systèmes de variables. L’évolution temporelle de
X et P s’écrit dans les variables (x, p) comme Ẋ = {X, H} et Ṗ = {P, H}
soit, par exemple,
∂X ∂H
∂X ∂H
−
.
(4.23)
Ẋ =
∂x ∂p
∂p ∂x
101
4.2. CROCHETS DE POISSON, ESPACE DES PHASES
La fonction de Hamilton s’exprime dans les nouvelles variables comme
H ′ (X, P ) = H (x(X, P ), p(X, P ))
(4.24)
,
et son inverse
H(x, p) = H ′ (X(x, p), P (x, p)) .
(4.25)
Si l’on différencie H par rapport à x et à p dans l’expression précédente, on
obtient
∂H ′ ∂X ∂H ′ ∂P
∂H
=
+
∂x
∂X ∂x
∂P ∂x
∂H
∂H ′ ∂X ∂H ′ ∂P
=
+
∂p
∂X ∂p
∂P ∂p
;
.
(4.26)
En reportant dans (4.23), on obtient sans difficulté
∂X ∂P ∂H ′
∂H ′
∂X ∂P
Ẋ =
−
≡ {X, P }
,
∂x ∂p
∂p ∂x ∂P
∂P
∂P ∂X
∂P ∂X ∂H ′
∂H ′
Ṗ =
−
≡ −{X, P }
.
∂x ∂p
∂p ∂x ∂X
∂X
Puisque, par hypothèse, {X, P } = 1, on obtient bien les équations canoniques
Ẋ =
∂H ′
∂P
,
Ṗ = −
∂H ′
∂X
.
(4.27)
Pour l’opposé, c’est à dire qu’une transformation canonique préserve les crochets de Poisson entre les Xi et les Pj , nous nous limitons encore à un sys′
tème à un degré de liberté. Dans ce cas l’équation ci-dessus Ẋ = {X, P } ∂H
∂P
montre que {X, P } = 1 , vu que pour une transformation canonique Ẋ =
∂H ′
.
∂P
(a) Remarques
1. L’extension à un nombre quelconque N de variables
(x1 , . . . , xN , p1 , . . . , pN ) → (X1 , . . . , XN , P1 , . . . , PN )
ne pose pas de problème.
Il est même possible d’élargir la notion de transformation canonique en
incluant des transformations (4.20) dépendant explicitement du temps :
Xi (x1 , . . . , xN , p1 , . . . , pN ; t) ,
Pi (x1 , . . . , xN , p1 , . . . , pN ; t) .
102
Formalisme canonique de Hamilton
Dans ce cas le théorème précédent reste vrai, sous condition d’ajouter
le terme
N X
∂Pi
∂Xi
− Xi
Pi
∂t
∂t
i=1
au hamiltonien H ′ (X1 , . . . , XN , P1 , . . . , PN ) .
2. On voit que puisque les transformations canoniques mélangent coordonnées et impulsions, il n’y a pas de différence fondamentale entre ces variables d’état. Dans le formalisme hamiltonien, les notions de coordonnées d’espace et d’impulsions (assimilée à une quantité de mouvement)
perdent de leur sens intuitif premier. Pour cette raison, on a coutume
d’appeler ces variables des variables canoniquement conjuguées que l’on
note (qi , pi ) avec les relations {qi , pj } = δij , {qi , qj } = {pi , pj } = 0.
La transformation canonique très simple ( X = p, P = −x ) montre
"l’interchangeabilité" de ces variables en ce sens. Les variables canoniquement conjuguées caractérisent l’état du système par un point dans
l’espace des phases.
3. Pour tout point (x1 , . . . , xn , p1 , . . . , pn ) de l’espace des phases on peut
considérer son évolution temporelle entre les temps t et t′ sous l’influence du hamiltonien H. Ceci définit une transformation dans l’espace
des phases qu’on écrit sous la forme
(x1 (t), . . . , pN (t)) → (x1 (t′ ), . . . , pN (t′ )) .
On se convainc 6 qu’il s’agit bien d’une transformation canonique, sachant que les équations de Hamilton gardent leur forme sous une translation dans le temps. Le mouvement hamiltonien apparaît donc comme
réalisant à chaque instant une transformation canonique des variables
d’état.
4. Plus généralement, on nomme grandeurs canoniquement conjuguées q
et p deux grandeurs physiques telles que {q, p} = 1. Un exemple est, en
coordonnées sphériques, l’angle azimutal φ et la projection du moment
cinétique suivant l’axe polaire Lz (voir l’exercice 2.7 du chapitre 2).
6. Tout point (x1 , . . . , pN ) dans l’espace des phases peut être vu comme un point d’une
trajectoire hamiltonienne au moment initial t. La transformation lui associe alors le point
(x′1 , . . . , p′N ) par lequel passe la même trajectoire au moment t′ . Evidemment les équations
de Hamilton sont valables aux deux moments t et t′ .
103
4.2. CROCHETS DE POISSON, ESPACE DES PHASES
(b) Exemple : oscillateur harmonique à une dimension, variables
angle-action.
Soit un oscillateur harmonique à une dimension de hamiltonien
H=
1 2 mω 2 2
p +
x ,
2m
2
où, bien entendu, x et p sont canoniquement conjugués. La transformation
√
√
x = X/ mω , p = P mω
est une transformation canonique : {X, P } = 1 , et le hamiltonien s’écrit avec
ces variables
H = ω(P 2 + X 2 )/2 .
La rotation dans l’espace des phases
ξ = X cos θ + P sin θ ,
Π = P cos θ − X sin θ
,
(4.28)
où θ est un angle fixe quelconque, est encore une transformation canonique :
{ξ, Π} = {X, P } = 1 .
L’expression de la fonction de Hamilton reste de même forme :
H = ω(Π2 + ξ 2 )/2 .
Il s’agit là d’un exemple important de symétrie dynamique d’un système.
C’est, en l’occurrence, une des nombreuses symétries de l’oscillateur harmonique. Cet argument s’étend à N degrés de liberté. La méthode de Dirac
des opérateurs de création et d’annihilation en mécanique quantique 7 repose
directement sur cette symétrie.
Cette symétrie peut être exploitée de façon plus poussée. Dans l’espace
des phases, ici à deux dimensions (X, P ), passons en coordonnées polaires en
introduisant des variables (A, ϕ) définies par
√
√
(4.29)
X = 2A cos ϕ , P = 2A sin ϕ ,
soit
A=
X2 + P 2
2
,
ϕ = arctan(
P
) .
X
(4.30)
7. Voir J.L. Basdevant et J. Dalibard, Mécanique quantique chapitre 7, section 5.
104
Formalisme canonique de Hamilton
Les variables (A, ϕ) sont canoniquement conjuguées, comme on le vérifiera
sans difficulté :
{A, ϕ} = X
1
P
1
1
−P
(− 2 ) = 1 .
P 2
P 2
X
1 + (X ) X
1 + (X )
Dans ces variables, le hamiltonien s’écrit simplement
H = ωA ,
d’où les équations du mouvement
H = ωA ,
{A, ϕ} = 1
⇒
Ȧ = 0 ,
ϕ̇ = − ω
,
(4.31)
dont la solution est évidente
A = E/ω = Cte
,
ϕ = − ωt + ϕ0 ,
(4.32)
où E est l’énergie de l’oscillateur (constante du mouvement). L’intérêt de
cette opération est de ramener le problème à une seule variable dépendant du
temps, l’angle ϕ. Puisque l’énergie, proportionnelle à l’action A, est conservée, seule la variable angulaire ϕ évolue. La variable ϕ est une variable cyclique 8 . Elle ne figure pas dans la fonction de Hamilton, ce qui entraîne la
conservation de la variable conjuguée A.
L’interprétation géométrique dans l’espace (X, P ), qui ici est l’espace des
phases, est simple. Le mouvement se fait sur un cercle de rayon A = E/ω qui
dépend de l’énergie E, constante du mouvement. Sur ce cercle, le mouvement
du point (X, P ) est uniforme, de vitesse angulaire ω : ϕ = − ωt + ϕ0 .
Nous avons évoqué les variable cycliques au 2.3.2. La recherche de variables cycliques, c’est-à-dire de variables qui ne figurent pas explicitement
dans la fonction de Hamilton ou de Lagrange, joue un rôle important, notamment dans l’investigation des systèmes intégrables.
4.2.3
Théorème de Liouville
L’évolution dans l’espace des phases (x1 , . . . , xN , p1 , . . . , pN ) donne une
représentation géométrique particulièrement utile en mécanique. Un point
de l’espace des phases correspond à un état du système. Lorsque le système
8. La notion de variable cyclique s’applique de la même manière au formalisme hamiltonien que dans le formailsme lagrangien.
105
4.2. CROCHETS DE POISSON, ESPACE DES PHASES
évolue, ce point se déplace dans l’espace des phases. On définit l’élément de
volume dans l’espace des phases par
dΩ = dx1 . . . dxN dp1 . . . dpN
(4.33)
.
R
Soit un volume quelconque Ω de l’espace des phases, Ω = dΩ, nous affirmons que ce volume est invariant par rapport aux transformations canoniques
Z
Z
dx1 . . . dxN dp1 . . . dpN = dX1 . . . dXN dP1 . . . dPN .
(4.34)
En effet, dans le changement de variables, on a
Z
Z
dX1 . . . dXN dP1 . . . dPN = |J| dx1 . . . dxN dp1 . . . dpN
où J est le jacobien de la transformation. Or, le jacobien d’une transformation
canonique est égal à un.
C’est évident sur le petit exemple 4.2.2 (b) ci-dessus. Si l’on considère le
cas simple d’un seul couple de variables canoniquement conjuguées (x, p) →
(X, P ) comme en 4.2.2, la démonstration est simple. En effet, le jacobien
n’est autre que le crochet de Poisson {X, P }
J=
∂X ∂P
∂X ∂P
−
= {X, P } = 1
∂x ∂p
∂p ∂x
(4.35)
égal à un, pour une transformation canonique, comme nous l’avons vu en
4.2.2. Pour N variables canoniquement conjuguées x1 . . . xN , p1 . . . pN l’argument devient techniquement plus lourd, tout en se basant toujours sur les
crochets de Poisson.
Considérons maintenant un volume Ω de l’espace des phases. Chaque
point de ce volume se déplace suivant les équations de Hamilton. Le mouvement peut se comprendre, nous venons de le dire, comme réalisant à chaque
instant une transformation canonique des variables d’état dans l’espace des
phases. Nous aboutissons ainsi à un résultat important, notamment en physique statistique :
Théorème de Liouville : Un volume de l’espace des phases reste inchangé lors
d’une évolution hamiltonienne.
Cette propriété géométrique remarquable est indépendante de la forme
particulière du hamiltonien. Elle découle de la structure des équations de
Hamilton.
106
4.2.4
Formalisme canonique de Hamilton
Flot hamiltonien
Une autre propriété géométrique intéressante est la suivante. La fonction
de Hamilton H(x, p) est définie dans l’espace des phases. Considérons, dans
cet espace, le champ de vecteurs de composantes (ẋ, ṗ) c’est-à-dire
ẋ =
∂H
,
∂p
ṗ = −
∂H
∂x
.
On appelle flot de ce champ de vecteurs l’ensemble des courbes dont la tan, − ∂H
) en ce point. On
gente en chaque point est colinéaire au vecteur ( ∂H
∂p
∂x
remarque que le flot de (ẋ, ṗ), encore appelé flot hamiltonien, est en chaque
point orthogonal au gradient du hamiltonien en ce point
∂H ∂H
~
∇H =
.
,
∂x ∂p
Dans l’exemple 4.2.2 (b) ci-dessus, le résultat est tout simple : les trajectoires
dans le plan (X, P ) sont des cercles centrés à l’origine et le gradient de
H = (P 2 + X 2 )/2 est porté par les droites passant par l’origine. Cela peut
être énoncé réciproquement : le gradient de H = (P 2 + X 2 )/2 est porté par
les droites passant par l’origine, les trajectoires sont donc des cercles centrés
à l’origine.
Ce résultat se généralise à un nombre quelconque de variables (x, p), dans
le sens que le mouvement reste limité au surfaces H = cste, orthogonales en
~ = (∇
~ x H, ∇
~ p H) . On peut ramener les lois de conservation
tout point à ∇H
de l’impulsion et du moment cinétique à des considérations géométriques du
même type .
4.2.5
Lien entre mécanique analytique et mécanique quantique
Les formules ci-dessus nous font entrevoir une chose étonnante : il y a
une forte analogie de structure entre la mécanique analytique, et la mécanique quantique. On démontre en mécanique quantique 9 ce qu’on appelle le
théorème d’Ehrenfest : la dérivée temporelle de la valeur moyenne hai d’une
9. Voir par exemple J.L. Basdevant et J. Dalibard, Mécanique quantique chapitre 7,
Section 3.
4.3. SYSTÈMES DYNAMIQUES
107
grandeur A est reliée au commutateur de l’observable  et du hamiltonien
Ĥ par la relation
d
1
∂ Â
hai = h[Â, Ĥ]i + h
i .
(4.36)
dt
i~
∂t
Mis à part le fait qu’en mécanique quantique on considère des valeurs moyennes
dans un état donné, (4.36) a la même structure que (4.16) si l’on remplace
les crochets de Poisson par les commutateurs, divisés par i~, des observables
quantiques. Cette même remarque s’applique aux relations de commutation
canoniques de Heisenberg des observables conjuguées de position x̂ et d’impulsion p̂
[x̂j , p̂k ] = i~δjk ,
(4.37)
que l’on rapprochera de (4.12). En effet Heisenberg avait introduit ces relations en 1925 pour rendre compte des niveaux d’énergie discrets des atomes,
et Dirac quelques semaines plus tard, à la suite d’une conférence de Heisenberg, avait découvert cette identité de structure des deux mécaniques. Tous
les deux avaient 23 ans. Bien entendu, la nature mathématique et l’interprétation physique des êtres manipulés sont différentes dans les deux cas, mais les
équations qui les relient sont les mêmes à condition de faire la correspondance
entre les crochets de Poisson en mécanique analytique et les commutateurs divisés par i~ - en mécanique quantique 10 . Dans des problèmes complexes en
mécanique quantique la relation entre crochets de Poisson et commutateurs
peut servir de guide pour la quantification du système.
4.3
Systèmes dynamiques
Considérons un système dans l’espace des phases à 6N dimensions. Si
l’on note X(t) = ({ri (t)}, {pi (t)}) la position du système dans l’espace des
phases à l’instant t, les équations de Hamilton sont de la forme Ẋ = F(X),
10. Cependant, en mécanique quantique, il faut faire attention à ce que les relations
(4.37), valables pour des coordonnées cartésiennes, ne conservent pas toujours leur forme
dans un changement de variables canonique. Par exemple l’énergie cinétique à deux dimensions p2 /2m s’exprime en terme des moments pr et pϕ , conjugués aux coordonnées polaires
r, ϕ comme p2r /2m + p2ϕ/(2mr2 ) où pr = mṙ et pϕ = mr2 ϕ̇. Le hamiltonien correspondant
en mécanique quantique s’écrit −~2 /2m[∂ 2 /∂r2 + (1/r)∂/∂r + (1/r2 ) ∂ 2 /∂ϕ2 ] . Au vu du
terme (1/r)∂/∂r , ceci montre qu’on ne peut pas simplement remplacer pr → (~/i)∂/∂r
pour maintenir (4.37) entre r et pr . Par contre le remplacement pϕ → (~/i)∂/∂ϕ est le
bon, voir J.L. Basdevant et J. Dalibard, Mécanique quantique, chapitre 7, Section 4.
108
Formalisme canonique de Hamilton
c’est-à-dire une équation différentielle du premier ordre pour l’évolution du
vecteur à 6N composantes X(t), ce que l’on nomme un système dynamique.
Ce type de problème a été une extraordinaire source de découvertes tant en
mathématiques qu’en physique ; on pourra se référer à [11], [12], [13]. Le fondateur de ce champ d’étude est Henri Poincaré, en 1885, quand il a étudié
le problème des 3 corps. Une pléiade de mathématiciens célèbres ont étudié
ce problème, qui est toujours un sujet d’étude de premier plan en mathématiques : J.-C. Yoccoz a obtenu la médaille Fields en 1994 pour ses travaux
sur le sujet, qu’il avait abordé avec Michael Herman, au Centre de Mathématiques de l’Ecole Polytechnique. On étudie l’ensemble des mouvements
possibles, ce qu’on appelle le flot de ces vecteurs. Cela mène à des problèmes
fascinants : les problèmes limites à t = ∞, les attracteurs et les attracteurs
étranges ; les bifurcations, changements brusques de la nature de ces flots à
certaines valeurs des paramètres de F(X), et les comportements chaotiques.
4.3.1
Poincaré et le chaos dans le système solaire
Poincaré avait démontré que, dans un système gravitationnel impliquant
plus de deux astres, il existe des régions dans l’espace des phases, où des trajectoires aussi proches que l’on veut initialement, s’éloignent l’une de l’autre
de façon exponentielle avec le temps. 11 . Cet effet est ce que l’on appelle le
chaos. Il se rencontre dans quantité d’autres problèmes physiques. Suivant
le système considéré, le temps caractéristique est très variable. Le système
solaire est donc un système dynamique très compliqué où ces comportements
chaotiques existent. Il semble que pour certains aspects concernant la terre,
l’échelle de temps pour la multiplication par e de l’incertitude sur les conditions initiales est de l’ordre de 10 millions d’années, de façon que la dynamique devient impredictible à partir de la centaine de millions d’années. Ceci
est à mettre en relation avec l’âge du système solaire d’environ cinq milliards
d’années [13].
Un exemple simple de système chaotique est le jeu de dés. En poussant les
choses a l’extrême, dans le cadre de la mécanique classique, si l’on connaissait
très précisément toutes les données du problème (conditions initiales, façon
de lancer le dé, géométrie de celui-ci, etc...), on pourrait en principe prévoir
11. Au XIXe siècle, sous l’impulsion de Laplace, le développement en série des perturbations avait donné des résultats extraordinairement précis en mécanique céleste. Au
passage, Poincaré montrait que ce développement ne convergeait pas ! Ce n’était qu’un
développement asymptotique.
109
4.3. SYSTÈMES DYNAMIQUES
le résultat (la face sur laquelle il va retomber), et le phénomène n’aurait pas
de caractère probabiliste. Toutefois, il est bien évident qu’à des conditions
initiales extrêmement voisines correspondront des résultats d’expérience différents, et qu’il nous faudrait donc posséder une information considérable sur
le système pour effectuer cette prévision. Typiquement on se limite donc à
une description probabiliste du phénomène, dans laquelle on s’impose une
certaine ignorance des conditions initiales, qui sont choisies «au hasard». Ce
phénomène se retrouve dans la mécanique céleste, et bien d’autres problèmes,
pour des conditions initiales qui sont voisines sans l’être de façon infinitésimale, pourvu que le temps d’évolution soit suffisamment long.
Le cas de 3 planètes de masses inégales gravitant autour d’un «Soleil» en
tenant compte de leurs interactions mutuelles est montré sur la figure 4.1. On
voit que, si au début de l’évolution, tout se passe de façon relativement douce,
la plus légère des planètes est tout simplement éjectée au bout d’un certain
temps. En faisant tourner l’ordinateur suffisamment longtemps, on s’aperçoit
que l’ensemble des 2 autres, qui semble tout à fait tranquille après l’expulsion
de la troisième, adopte des configurations elles-mêmes inattendues.
4.3.2
L’effet aile de papillon ; l’attracteur de Lorenz
On considère l’évolution d’une tranche d’air rectangulaire chauffée par
dessous et refroidie par dessus. Les variables sont au nombre de trois : x est
proportionnel à l’intensité du mouvement de convection, y est proportionnel
à la différence de température entre les courants ascendants et les courants
descendants, et z est proportionnel à la distortion du profil du gradient de
température par rapport à la linéarité. Peu nous importe le détail de la
physique du problème. Dans le modèle de Lorenz, l’évolution temporelle est
donnée par le système différentiel non-linéaire à 3 variables
dx
= σ(y − x) ,
dt
dy
= ρx − y − xz
dt
,
dz
= xy − βz
dt
,
(4.38)
où σ est la constante de Prandtl, qui caractérise la viscosité et la conductivité thermique du fluide, ρ est un paramètre de contrôle, qui représente la
différence de température entre le bas et le haut du réservoir, et β mesure le
rapport entre hauteur et largeur du système de convection.
Lorenz résolvait ces équations pendant la nuit avec des heures et des heures
d’ordinateur, par la méthode de pas discrets (xi , yi , zi ) → (xi+1 , yi+1 , zi+1 ).
Cela générait, à l’époque, des kilogrammes de papier (appelés «listings»).
110
Formalisme canonique de Hamilton
Figure 4.1 – Evolution de 3 planètes, autour d’un soleil, en tenant compte de leurs
interactions mutuelles. Le déroulement temporel des images doit se lire de gauche
à droite et de bas en haut. L’intervalle de temps entre deux images est constant.
On voit qu’à la onzième étape, la troisième planète, plus légère et initialement
proche de la deuxième, est expulsée du système. Image due à Jean-François Colonna, [email protected], http ://www.lactamme.polytechnique.fr ;
tous droits réservés.
4.3. SYSTÈMES DYNAMIQUES
111
A titre d’exemple des performances informatiques du début des années 60,
son premier ordinateur, nommé Royal McBee, était capable de faire 60 multiplications par seconde. Un jour, il eut l’idée de refaire un calcul dont il
avait la solution en prenant comme point de départ une valeur intermédiaire
(xi , yi , zi ) obtenue dans son calcul de la veille. A sa stupéfaction, les valeurs
suivantes devenaient, après un nombre relativement faible d’itérations, complètement différentes de celles de la veille. Il venait de redécouvrir le chaos,
dû, en l’occurrence, aux erreurs d’arrondi des nombres manipulés : la sensibilité des résultats aux conditions initiales provoque l’écart considérable de
deux solutions initialement voisines. Lorenz appela cela l’effet «aile de papillon». En fait le titre d’une de ses conférences était : Le battement d’une aile
de papillon au Brésil peut-il déclencher une tornade au Texas ? Coïncidence
ou non, l’«attracteur de Lorenz» a une forme d’ailes de papillon.
On peut voir sur les figures 4.2 et 4.3 le résultat d’une itération des
équations (4.38). On voit que l’évolution du point (x, y, z) en fonction du
temps a un aspect tout à fait tranquille : le point tourne sur une des nappes
de l’attracteur, sauf que, de façon imprévue, à certains instants il «saute»
d’une nappe (ou d’une aile) à l’autre. C’est imprévu dans le temps, c’est
également imprévu dans l’espace dans le sens où les trajectoires de deux
points initialement très proches dans l’espace des phases peuvent devenir
complètement différentes à un instant ultérieur. Les deux positions peuvent
notamment se retrouver, à un instant donné, sur deux nappes différentes de
l’attracteur.
Soulignons en concluant que le système de Lorenz est du type le plus
simple qui montre ce comportement chaotique : un système dynamique chaotique doit être non-linéaire et comporter au moins 3 variables. Un théorème
célèbre de Poincaré et Bendixson interdit ce genre de comportement aux systèmes à seulement 2 variables indépendantes, comme par exemple un système
hamiltonien dans un espace des phases à 2 dimensions. Ce théorème interdit
également le comportement chaotique de systèmes dynamiques dans un espace des phases à N dimensions, si il existe en même temps N − 2 quantités
conservées indépendantes, qui limitent le mouvement à un espace des phases
«effectif» bi-dimensionnel 12 .
12. L’interdiction d’un comportement chaotique dans un espace des phases bidimensionnel est liée au fait topologique, qu’une courbe fermée dans un espace bidimensionnel sépare l’espace en deux parties disjointes d’une part, et d’autre part au fait
que deux trajectoires distinctes dans l’espace des phases ne se croisent jamais (pourquoi
d’ailleurs ?).
112
Formalisme canonique de Hamilton
Figure 4.2 – Attracteur de Lorenz vu sous deux angles différents. Les points
correpondent à une résolution de (4.38) par une méthode de discrétisation. On
peut suivre ces points et voir la transition, imprévisible une quasi-période plus tôt,
d’une nappe vers l’autre de l’attracteur.
Figure 4.3 – Projection de l’attracteur de Lorenz sur le plan (x,z). Images dues
à Jean-François Colonna, tous droits réservés.
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
4.4
113
L’action et l’équation de Hamilton-Jacobi
Le principe de moindre action consiste à trouver les équations du mouvement en minimisant l’action définie en fonction du lagrangien et des points
de départ et d’arrivée par (1.8). L’action elle-même doit donc déterminer
les trajectoires physiques. En quelles variables doit-on l’exprimer ? Il semble
naturel, à un degré de liberté, de calculer les valeurs de S le long de l’ensemble des trajectoires physiques, c’est-à-dire comme une fonction du point
et de l’instant d’arrivée (x, t) , le point et l’instant de départ étant fixés. De
façon équivalente, nous voulons caractériser les diverses trajectoires issues de
(x1 , t1 ) et arrivant en (x, t) par la valeur de l’action S(x, t; x1 , t1 ). L’action
est définie par
Z
t
S=
t1
L(x, ẋ; t′ ) dt′
,
(4.39)
les variables (x(t), ẋ(t)) prenant par hypothèse dans cette expression leurs
valeurs physiques, qui satisfont les équations d’Euler-Lagrange.
4.4.1
L’action comme fonction des coordonnées et du
temps
Reprenons la variation de l’action écrite en (2.4)
Z t
∂L
∂L
δS =
δx(t) +
δ ẋ(t) dt .
∂x
∂ ẋ
t1
(4.40)
Nous intégrons le deuxième terme par parties, mais nous n’imposons plus
d’arriver au même point x(t) mais en un point voisin x(t) + δx(t) (en maintenant δx(t1 ) = 0). Le terme tout intégré ne s’élimine donc plus, et l’on
obtient
Z t
∂L
d ∂L
∂L
δS =
δx(t) dt = p δx(t)
(4.41)
δx(t) +
−
∂ ẋ
∂x
dt ∂ ẋ
t1
car, par hypothèse, la trajectoire est physique, si bien que l’intégrale s’annule.
De façon plus générale, on a pour N variables
δS =
N
X
i=1
pi δxi
.
(4.42)
114
Formalisme canonique de Hamilton
Par conséquent, les dérivées partielles de l’action par rapport aux coordonnées sont tout simplement les moments conjugués
∂S
= pi , soit encore
∂xi
∂S
= pi
∂qi
(4.43)
si l’on travaille avec un ensemble quelconque [qi , pi ] de variables canoniquement conjuguées. De même, on peut calculer la variation de l’action si l’on
varie l’instant d’arrivée t. On a, de façon évidente,
dS
=L .
dt
(4.44)
Mais, si nous considérons l’action comme fonction des coordonnées et du
temps, on a
N
N
∂S X ∂S
∂S X
dS
=
+
ẋi =
+
pi ẋi .
(4.45)
dt
∂t
∂x
∂t
i
i=1
i=1
En réunissant ces deux égalités, on obtient que la dérivée partielle de l’action
par rapport au temps est, au signe près, le hamiltonien
N
X
∂S
=L−
pi ẋi = −H
∂t
i=1
,
(4.46)
et la différentielle totale de l’action s’écrit en fonction des coordonnées et du
temps
N
X
pi dxi − H dt .
(4.47)
dS =
i=1
On obtient alors l’expression suivante pour l’action
!
Z X
N
S=
pi dxi − H dt
(4.48)
i=1
où l’intégrale est évaluée le long de la trajectoire physique à x1 , t1 fixés.
Le principe de moindre action, sous la forme exprimé par Hamilton, s’écrit
δS = 0 à x1 , t1 et x2 , t2 fixés, et (4.48) donne alors
!
Z
Z X
N
dxi
− H dt ≡ δ L dt = 0 ,
(4.49)
δS = δ
pi
dt
i=1
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
115
qui est bien la forme (1.8) qui nous a servi de point de départ au chapitres
précédents. Si nous travaillons avec les variables conjuguées (x, p) et non
les variables (x, ẋ) du chapitre 2, les équations canoniques de Hamilton se
déduisent directement de l’expression (4.48) de l’action. En effet, considérons
les variables x et p comme indépendantes, et prenons le cas simple d’un seul
degré de liberté, l’action est
Z (2)
S=
(p dx − H dt) .
(4.50)
(1)
Si l’on fait varier x de δx et p de δp , en imposant comme au chapitre 2,
δx(2) = δx(1) = 0, la variation de S est
Z (2) ∂H
∂H
δS =
δp ẋ + p δ ẋ −
δx −
δp dt .
(4.51)
∂x
∂p
(1)
où l’on a choisi de paramétrer l’intégrale par le temps. Le deuxième terme
dans l’intégrale peut être intégré par parties. Le terme tout intégré (p δx)
s’annule puisque par hypothèse δx(2) = δx(1) = 0, et l’on obtient
Z (2) ∂H
∂H
] − δx [ṗ +
] dt ,
(4.52)
δS =
δp [ ẋ −
∂p
∂x
(1)
qui s’annule pour toute variation (δx, δp) si et seulement si les intégrants sont
identiquement nuls soit
ẋ =
∂H
,
∂p
ṗ =
∂H
∂x
,
où l’on reconnaît les équations canoniques de Hamilton.
En résumé on obtient le hamiltonien aussi bien que les équations hamiltoniennes directement de l’action.
4.4.2
Equation de Hamilton-Jacobi
L’équation de Hamilton-Jacobi se lit sur (4.46) et (4.43). Nous pouvons
remplacer dans la fonction de Hamilton les moments pi par les dérivées partielles de l’action, pour aboutir à
∂S
∂S
∂S
+ H(x1 , . . . , xN ,
,...,
; t) = 0 .
∂t
∂x1
∂xN
(4.53)
116
Formalisme canonique de Hamilton
L’équation de Hamilton-Jacobi est une équation aux dérivées partielles nonlinéaire, du premier ordre. Elle permet de calculer le mouvement de la même
façon que les équations d’Euler-Lagrange ou les équations canoniques. L’emploi de tel ou tel de ces formalismes est une affaire de commodité ou de structure mathématique du problème. L’équation de Hamilton-Jacobi est particulièrement adaptée à la séparation des variables et au choix de variables
appropriées à la symétrie d’un problème.
(a) Action réduite
Par la suite de 4.4.2 nous supposons que la fonction de Hamilton H ne
dépend pas explicitement du temps. Alors, l’énergie est conservée. Soit E la
valeur de l’énergie du problème considéré, l’équation (4.46) se traduit par
∂S
= −E
∂t
(4.54)
,
soit
(4.55)
S = −Et + S0 (x1 , . . . , xN ) .
La quantité S0 est appelée l’action réduite. Elle satisfait l’équation
H(x1 , . . . , xN ,
∂S0
∂S0
,...,
)=E
∂x1
∂xN
.
(4.56)
De façon générale, en se reportant à (4.48) on définit l’action réduite S0 par
S0 =
Z
N
X
i=1
pi dxi
!
,
(4.57)
et, pour un système isolé, en se limitant aux variations qui laissent invariante
l’énergie E , on voit que le principe variationnel porte sur cette quantité S0 :
δS0 = 0 .
(b) Interprétation géométrique
Dans ce cas la relation (4.43) peut également s’écrire en fonction de l’action réduite
∂S0
= pi .
(4.58)
∂xi
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
117
Cette forme fait apparaître une propriété géométrique simple qui nous sera
utile pour faire le lien avec l’optique. Plaçons nous en coordonnées cartésiennes pour plus de clarté et considérons le cas simple où les impulsions se
confondent avec les quantités de mouvement pi = mi ẋi . Considérons dans
l’espace des coordonnées (x1 , x2 , . . . , xN ), les surfaces sur lesquelles l’action
réduite est constante S0 = Cte. La relation (4.58) signifie que le vecteur
P ≡ (p1 , p2 , . . . , pN ) est en tout point orthogonal à ces surfaces. En d’autres
termes, le flot des trajectoires est orthogonal aux surfaces S0 = Cte. A un
instant donné, cette propriété vaut également pour l’action S.
Dans le cas simple d’une particule dans l’espace à 3 dimensions, on voit
donc que la trajectoire est en tout point de l’espace orthogonale à la surface
S0 = Cte passant par ce point : si l’on note dr un vecteur élémentaire tangent
à la surface S0 = Cte au point r, on a par définition
~ 0 · dr = p · dr = 0 .
∇S
(4.59)
(c) Principe de Maupertuis
Pour une particule de masse m dans un potentiel V (r), l’équation (4.56)
s’écrit
1 ~
(∇S0 )2 + V (r) = E
2m
,
~ 0 )2 = 2m(E − V (r)) . (4.60)
ou encore (∇S
Dans ce problème, le moment conjugué est simplement égal à la quantité de
mouvement p = m ṙ . L’action réduite (4.57) s’écrit donc
Z
Z
S0 = p · dr = m ṙ · dr .
(4.61)
2
2
2
2
2
Nous avons
q (dr) = dx + dy + dz = (dℓ) d’où ṙ · dr = ℓ̇ dℓ . D’autre part
)
ℓ̇ = v = 2(E−V
. En reportant dans (4.61) on obtient donc
m
S0 =
Z p
2m(E − V ) dℓ .
D’où la forme simple du principe de Maupertuis donnée en 1.2
Z p
2m(E − V ) dℓ = 0 .
δ
(4.62)
(4.63)
118
Formalisme canonique de Hamilton
(d) Exemple : potentiel à symétrie sphérique
Contentons-nous ici, à titre d’exemple de l’utilisation de l’équation de
Hamilton-Jacobi, d’un problème qui englobe le problème de Kepler 13 . En
coordonnées sphériques (r, θ, φ) le hamiltonien s’écrit
1
H=
2m
p2φ
p2θ
2
pr + 2 + 2 2
+ V (r, θ, φ) .
r
r sin θ
(4.64)
On peut séparer les variables si le potentiel est de la forme
V = V0 (r) +
f (θ)
r2
(4.65)
(en toute généralité on peut ajouter un terme en g(φ)/r 2 sin2 θ). L’équation
de Hamilton-Jacobi s’écrit alors
"
2
2
2 #
∂S0
1
∂S0
∂S0
1
1
=E
+ V0 (r) +
+ 2mf (θ) +
2m ∂r
2mr 2
∂θ
sin2 θ ∂φ
(4.66)
où E est la valeur constante de l’énergie. La variable φ est cyclique, notons
ℓ = Lz la valeur constante de pφ . Autrement dit,
∂S0
∂φ
2
= ℓ2
.
En portant cela dans (4.66) on réduit le problème à
"
#
2
2
1
∂S0
∂S0
1
ℓ2
+ V0 (r) +
+ 2mf (θ) +
=E
2m ∂r
2mr 2
∂θ
sin2 θ
(4.67)
. (4.68)
En multipliant par 2mr 2 on constate que cette équation se sépare en la somme
de deux termes, l’un portant sur la variable θ, l’autre sur la variable r. On
recherche par conséquent une solution de la forme
S0 = ℓ φ + S1 (θ) + S2 (r) .
(4.69)
13. Pour d’autres exemples on pourra se référer au livre réf.[9] Mécanique Chapitre VII,
§ 48.
119
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
On obtient
2
ℓ2
dS1
= a
+ 2mf (θ) +
dθ
sin2 θ
2
dS2
1
a
= E
+ V0 (r) +
2m dr
2mr 2
(4.70)
(4.71)
,
où a est, comme E et ℓ, une constante du mouvement, déterminée par les
conditions initiales. L’intégration de ces équations donne
S = −Et + ℓ φ+
+
Z r
2m(E − V0 (r)) −
a
r2
Z s
a − 2mf (θ) −
dr +
ℓ2
sin2 θ
dθ
.
(4.72)
Ici, (E, ℓ, a) sont des constantes d’intégration arbitraires.
Pour obtenir les équations du mouvement, on utilise le Théorème de Jacobi, que nous allons expliquer sur le cas le plus simple à une dimension.
Théorème : Soit a une constante d’intégration, et supposons que nous connaissons l’action S(q, t; a) 14. Alors β = ∂S/∂a est une constante du mouvement.
Démonstration : On a par définition
β=
∂S
∂a
soit
d
∂ ∂S
∂2S
β=
+ q̇
dt
∂t ∂a
∂q ∂a
(4.73)
.
Or, q̇ est, par définition, la dérivée de q le long de la trajectoire physique, par
conséquent
q̇ =
∂H
∂p
,
et
d
∂ ∂S ∂H ∂ 2 S
β=
+
dt
∂t ∂a
∂p ∂q ∂a
.
Par ailleurs, on a
∂
∂S(q, t; a)
∂H ∂ 2 S
H(q,
)=
∂a
∂q
∂p ∂a∂q
.
(4.74)
14. On se souvient que nous considérons S à positions et temps initiaux fixés. Ces données peuvent s’exprimer à travers des constantes d’intégration a.
120
Formalisme canonique de Hamilton
En reportant dans (4.73), on obtient le résultat souhaité
d
∂ ∂S
∂S(q, t; a)
β=
+ H(q,
) =0 ,
dt
∂a ∂t
∂q
en raison de l’équation de Hamilton-Jacobi (4.53).
(4.75)
CQFD
Reprenons le résultat (4.72) et considérons les trois constantes d’intégration (E, ℓ, a). A partir de l’expression (4.72) de l’action, on définit les trois
constantes βE , βℓ , βa par
βE =
∂S
∂E
,
βℓ =
∂S
∂ℓ
,
βa =
∂S
∂a
.
La valeur de ces constantes est fixée par les conditions initiales du problème.
On obtient donc la trajectoire à partir des trois équations obtenues en dérivant (4.72) par rapport à E, ℓ et a.
4.4.3
Limite géométrique de l’optique ondulatoire.
Les considérations précédentes permettent de comprendre comment l’optique géométrique se présente comme la limite à petites longueurs d’onde de
l’optique ondulatoire.
(a) Onde scalaire
Considérons l’équation de propagation d’une onde scalaire Φ dans un
milieu d’indice de réfraction variable n(r). On suppose que le milieu est
inhomogène, mais isotrope : l’indice n dépend du point considéré mais pas
de la direction de propagation.
Le cas général de la propagation des ondes électromagnétiques dans un
milieu non-conducteur de susceptibilités électrique et magnétique ε et µ,
en tenant compte d’éventuelles discontinuités entre deux milieux et de la
polarisation, est traité dans le livre de Born et Wolf Principles of Optics
réf.[14], Chapitre III et Appendice I. Il suffit pour notre propos de considérer
un milieu isotrope non-magnétique.
L’équation de propagation d’une onde scalaire Φ(r, t) est
n2 ∂ 2 Φ
− ∆Φ = 0 .
c2 ∂t2
(4.76)
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
121
On étudie une onde périodique en temps de pulsation ω soit Φ(r, t) =
ϕ(r)e−iωt , ce qui, reporté dans l’équation précédente mène à
n2 ω 2
ϕ + ∆ϕ = 0 .
c2
(4.77)
Cherchons une solution de cette équation de la forme 15
ϕ = ϕ0 (r)eik0 S(r)
,
(4.78)
où
2π
ω
=
(4.79)
c
λ
est le module du vecteur d’onde. La quantité S dans (4.78) est appelée l’ei⊃ ′
konal (du grec εικ ων
image). Reportons (4.78) dans (4.77), nous obtenons,
après simplification par eik0 S(r) et en divisant par (−k02 ),
~ 2 − i 2∇ϕ
~ 0 · ∇S
~ + ϕ0 ∆S − 1 (∆ϕ0 ) = n2 ϕ0 .
ϕ0 (∇S)
(4.80)
k0
k02
k0 =
Dans cette équation, le terme imaginaire proportionnel à 1/k0 peut s’écrire,
en multipliant par ϕ0 ,
~ · (ϕ2 ∇S)
~
∇
= 0.
(4.81)
0
C’est là une équation de conservation, en l’occurrence liée à la conservation
~ et la densité d’énergie
de l’énergie. L’onde se propage dans la direction de ∇S
2
est proportionnelle à ϕ0 . On trouvera l’interprétation complète en termes du
vecteur de Poynting dans le livre de Born et Wolf réf.[14].
Considérons maintenant la partie réelle. Supposons que la longueur d’onde
soit très petite, c’est à dire que l’indice n ne varie pas sur une longueur d’onde
et que la taille d’instruments (par exemple des diaphragmes) soit beaucoup
plus grande que λ défini en (4.79). Cette hypothèse peut également s’exprimer
sous la forme λ → 0 par conséquent k0 → ∞ et s’appelle l’approximation
eikonale. Nous négligeons alors le terme en 1/k02 ce qui mène à l’équation de
l’eikonal
~ 2 = n2
(∇S)
(4.82)
qui est l’équation fondamentale de l’optique géométrique. Dans cette approximation, l’onde
Φ(r, t) = ϕ0 (r)ei(k0 S(r)−ωt) ,
(4.83)
15. l’idée étant que le premier facteur ne que varie faiblement dans l’espace par rapport
au deuxième
122
Formalisme canonique de Hamilton
se propage avec un vecteur d’onde localement perpendiculaire aux surfaces
S(r) = Cte , définies par (4.82). Ces surfaces sont les fronts d’ondes géométriques.
(b) Optique géométrique et mécanique classique
Bien entendu, on note l’extrême similitude de l’équation de l’eikonal (4.82)
et de l’équation de Hamilton-Jacobi (4.60) pour un point matériel. L’action
réduite S0 de ce dernier et l’eikonal S pour une onde lumineuse suivent la
même loi si l’on fait la correspondance
n(r) ⇐⇒
p
2m(E − V (r)) .
(4.84)
Nous avons vu que (4.60) mène au principe de Maupertuis pour un point
matériel
Z p
δ
2m(E − V (r)) dℓ = 0 .
De la même manière l’equation de l’eikonal (4.82) mènera alors à la relation
Z
Z
n(r)
dℓ = 0
(4.85)
δ n(r) dℓ = 0 ou aussi δT = δ
c
qui n’est autre que le principe de Fermat !
C’est Hamilton qui fit cette découverte autour de 1830. Il avait compris
comment et dans quelle limite l’optique géométrique était une approximation de l’optique ondulatoire. Fasciné par les principes variationnels, et en
particulier par la similitude entre le principe de Maupertuis en mécanique
et le principe de Fermat en optique géométrique, il remarqua que les formalismes de l’optique et de la mécanique pouvaient être unifiés, et (vision
prophétique !) que la mécanique newtonienne correspondait à la même limite
ou approximation, que l’optique géométrique par rapport à l’optique ondulatoire.
Cette remarque fut ignorée par ses contemporains ce que déplora en 1891
le célèbre mathématicien Felix Klein. Il est vrai qu’en 1830 aucune expérience
ne mettait en évidence le rôle de la constante de Planck.
Remarquons, finalement, que l’interprétation géométrique (4.59) qui, dans
ce cas revient à (4.83), n’est rien d’autre que le Principe de Huygens .
Ce principe, première théorie ondulatoire de la lumière, consiste à dire que
la lumière se propage comme un front d’onde. A chaque instant t, chaque
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
123
point du front d’onde peut être considéré comme une source ponctuelle. A
l’instant suivant t + δt le nouveau front d’onde est l’enveloppe des sphères de
rayon δr = (c/n)δt centrées en chaque point du front d’onde précédent. Ce
principe est équivalent à l’approximation eikonale : les enveloppes constituent
les surfaces d’eikonal S constant, et il est alors, comme on a vu, équivalent
au principe de Fermat. L’approche de Huygens fut vivement combattue par
Newton, promoteur acharné du concept corpusculaire. Toutefois, Huygens fut
le premier à obtenir grâce à ce principe, une théorie de la double réfraction
par les cristaux anisotropes comme le spath d’Islande.
4.4.4
Approximation semi-classique en mécanique quantique.
Le même cadre de pensée peut être appliqué à la mécanique ondulatoire
et à l’équation de Schrödinger, où on l’appelle l’approximation semi-classique
de Brillouin, Kramers et Wentzel (BKW). On se reportera par exemple au
livre de Messiah réf.[15] Mécanique quantique, tome 1, chapitre VI pour tout
détail, notamment dans l’application pratique de cette méthode.
Considérons l’équation de Schrödinger
i~
~2
∂
ψ(r, t) = −
∆ψ(r, t) + V (r) ψ(r, t) .
∂t
2m
(4.86)
Nous séparons dans la fonction d’onde le module et la phase suivant
i
ψ(r, t) = A(r, t) exp
S(r, t)
.
(4.87)
~
En substituant dans (4.86) et en séparant partie réelle et partie imaginaire,
on obtient
1 ~ 2
~2 ∆A
∂S
+
(∇S) + V =
∂t
2m
2m A
∂A ~
1
~ + A ∆S = 0 .
m
+ ∇A · ∇S
∂t
2
(4.88)
(4.89)
La seconde équation exprime la conservation de la probabilité. Si l’on introduit les densités de probabilité ρ et de courant de probabilité J comme
ρ(r, t) = ψ ∗ (r, t)ψ(r, t)
,
J(r, t) =
~
~ − ψ ∇ψ
~ ∗) ,
(ψ ∗ ∇ψ
2im
(4.90)
124
Formalisme canonique de Hamilton
la conservation de la probabilité s’écrit sous forme locale
∂
~ · J(r, t) = 0 .
ρ(r, t) + ∇
∂t
(4.91)
Avec la forme (4.87), cette équation revient à
m
∂ 2 ~
~
A + ∇ · (A2 ∇S)
=0
∂t
(4.92)
ce qui est équivalent à (4.89). On rapprochera cette équation de l’équation
(4.81). L’approximation classique consiste à prendre la limite ~ → 0 dans
l’équation (4.88) soit
1 ~ 2
∂S
+
(∇S) + V = 0 ,
∂t
2m
(4.93)
qui n’est autre que l’équation de Hamilton-Jacobi classique (4.53). Par conséquent, dans la limite classique, la fonction d’onde peut être considérée comme
décrivant un fluide de particules classiques sans interactions mutuelles, soumises au potentiel V . La densité et la densité de courant de ces particules
sont à tout instant égales à la densité de probabilité ρ et à la densité de
courant de probabilité J quantiques.
Exercices
4.1 Vérifier à partir du hamiltonien (4.7) que les équations de Hamilton
donnent bien l’équation du mouvement attendue.
4.2 Oscillateurs couplés
On considère deux oscillateurs harmoniques couplés de hamiltonien
H=
p2
mω 2 x21 mω 2 x22 mΩ2 (x1 − x2 )2
p21
+ 2 +
+
+
2m 2m
2
2
4
1. Montrer que la transformation
X=
x1 + x2
√
,
2
P =
p1 + p2
√
2
.
125
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
p1 − p2
x1 − x2
√
, Q= √
2
2
est une transformation canonique et exprimer le hamiltonien dans ces
nouvelles variables.
2. Trouver les fréquences propres du système.
Y =
3. Ecrire la forme générale du mouvement (x1 (t), x2 (t)).
4.3 Système hamiltonien unidimensionnel
On considère le mouvement unidimensionnel d’un point matériel de hamiltonien
p2
1
H =
− 2 .
2m 2q
1. Pourquoi l’énergie E du système est-elle conservée ? En utilisant les
équations du mouvement, montrer que la quantité
D=
pq
− Ht
2
est conservée aussi. On supposera D > 0 par la suite.
2. Exprimer la vitesse q̇ du point matériel en faisant apparaître ces deux
quantités conservées.
3. Résoudre l’équation différentielle pour q̇ . Quel est le comportement
asymptotique du point matériel pour E > 0 ? Que se passe-t-il pour
E < 0 ? Interpréter.
4.4 Oscillations forcées
On considère un oscillateur harmonique à une dimension de hamiltonien
p2
1
H=
+ mω 2 x2
2m 2
(4.94)
où x et p sont des variables conjuguées de Lagrange.
√
√
1. On pose x = X/ mω et p = P mω.
Ecrire l’expression du hamiltonien (4.94) en fonction de X et P , et
calculer le crochet de Poisson {X, P }.
2. On introduit les fonctions a et a∗ , complexe conjuguée de a, definies
par
X − iP
X + iP
,
a∗ = √
.
a= √
2
2
Ecrire le hamiltonien en fonction de a et a∗ et ω.
126
Formalisme canonique de Hamilton
3. Calculer le crochet de Poisson {a, a∗ }.
4. Ecrire l’équation de l’évolution dans le temps de a et donner sa solution
générale.
Exprimer l’énergie E de l’oscillateur à partir des paramètres de cette
solution et de ω.
5. On suppose que l’énergie de l’oscillateur est nulle pour t ≤ 0, E(t ≤
0) = 0. Entre t = 0 et t = T on applique
à l’oscillateur une force
√
dérivant de l’énergie potentielle Hpot = b 2X sin (Ωt) (Hpot = 0 si t ≤ 0
ou t > T ) où b est un paramètre. Calculer l’énergie E ′ de l’oscillateur
pour t > T .
6. Discuter la variation de E ′ en fonction de la pulsation excitatrice Ω.
4.5 Chaîne fermée d’oscillateurs couplés
On rappelle que pour 1 ≤ n ≤ N et 1 ≤ n′ ≤ N
N
1 X
2ik(n − n′ )π
exp (
) = δnn′
N k=1
N
(δ de Kronecker).
On considère une chaîne fermée de N particules de même masse m disposées régulièrement sur un cercle plan (voir figure). Ces particules ont chacune
un mouvement unidimensionnel suivant la normale (Ox) au plan. On désigne
par xn , n = 1, . . . , N l’abscisse de la particule n le long de cet axe.
127
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
Ces particules forment un ensemble d’oscillateurs harmoniques couplés à
leurs plus proches voisins. Le hamiltonien est
N
X
p2
1
1
[ n + mω 2 x2n + mΩ2 (xn − xn+1 )2 ]
H=
2m 2
2
n=1
(4.95)
où pn est le moment conjugué de xn et où nous adoptons la convention
cyclique xN +1 ≡ x1 .
1. On définit les variables complexes suivantes
N
1 X 2iknπ/N
e
xn ,
yk = √
N n=1
N
1 X −2iknπ/N
qk = √
e
pn
N n=1
(4.96)
dont les relations inverses sont
N
1 X −2iknπ/N
xn = √
e
yk ,
N k=1
N
1 X 2iknπ/N
pn = √
e
qk
N k=1
.
(4.97)
(a) Montrer que
∗
yk = yN
−k ,
∗
qk = qN
−k
N
X
N
X
.
(b) Montrer que
N
X
yk yk∗
k=1
=
x2n
et
n=1
qk qk∗
=
N
X
p2n
(4.98)
n=1
k=1
(c) Montrer que
N
X
n=1
(xn − xn+1 )2 =
N
X
4 sin2 (
k=1
kπ
)yk yk∗
N
(4.99)
2. Equations du mouvement et leur solution.
(a) Ecrire le hamiltonien (4.95) en fonction de {yk , yk∗, qk , qk∗ }.
(b) Calculer les crochets de Poisson suivants
{yj , qk } ,
{yj∗, qk∗ } ,
∗
{yj , qN
−k } ,
{yj∗, qN −k } .
(4.100)
(c) Ecrire les équations différentielles satisfaites par les {yk , yk∗ , qk , qk∗ }.
128
Formalisme canonique de Hamilton
(d) Ecrire l’expression générale de {yk (t)} ; en déduire celle de {xn (t)}.
3. On suppose qu’à l’instant t = 0 on a yN (0) = 1, ẏN (0) = 0 et {yn (0) =
0, ẏn (0) = 0, ∀n 6= N}. Calculer {xn (t)} et interpréter le résultat.
4. Propagation d’ondes.
On suppose maintenant, pour simplifier, que ω = 0. On suppose aussi
que N ≫ 1, si bien que sin(kπ/N) ≃ (kπ/N) pour k ≪ N. On suppose
qu’à l’instant t = 0 on a yN −1 = 1, y1 = 1, yn = 0 si n 6= (1 ou N − 1),
et ẏn = 0 ∀n.
(a) Calculer xn (t) et xN −n (t).
(b) Interpréter physiquement le résultat.
(c) On suppose que la distance entre deux oscillateurs adjacents est a.
En posant que xn (t) est la valeur en y = na d’une fonction f (t, y),
écrire l’équation de propagation (équation aux dérivées partielles
du second ordre) satisfaite par la fonction f .
4.6 Théorème du viriel
On considère, à 3 dimensions, une particule de masse m placée dans un
potentiel V (r), de hamiltonien H = p2 /2m + V (r). On suppose que cette
particule est dans un état lié d’énergie E donnée.
1. Soit la grandeur physique A = r · p ≡ xpx + ypy + zpz . Calculer le crochet de Poisson {A, H}. En déduire la forme de l’évolution temporelle
de A en fonction des variables r et p.
2. On suppose que la particule a un mouvement périodique, de période
T . Soit f (r, p) une grandeur physique, on définit sa moyenne hf i par
Z
1 T
f (t) dt
(4.101)
hf i =
T 0
En considérant la valeur moyenne de Ȧ ≡ dA/dt, montrer que l’on a
p2
~ i
2h
i = hr · ∇V
2m
(4.102)
3. Que devient cette égalité si V est un potentiel central en puissances
V = g r n avec r = |r| ?
4. Dans le cas ci-dessus, quelle est la relation entre l’énergie totale E, la
moyenne de l’énergie cinétique hEc i et la moyenne de l’énergie potentielle hV i pour
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
129
a) un oscillateur harmonique n = 2, et pour
b) un potentiel newtonien (ou coulombien) n = −1 ?
5. En général, pour un potentiel quelconque, les orbites des états liés ne
sont pas fermées, mais elles restent confinées dans l’espace. A tout
instant |r| ≤ r0 et |p| ≤ p0 où r0 et p0 sont fixes. Pouvez-vous trouver
une généralisation de la définition (4.101) telle que le résultat (4.102)
reste valable ?
4.7 Calculer les crochets de Poisson des trois composantes du moment cinétique L = r × p entr’elles.
4.8 Du problème de Kepler à la précession du périhélie de Mercure
I. On considère le mouvement non-relativiste d’un objet ponctuel de masse
m dans un potentiel coulombien V (r) = − kr , k > 0 .
1. Ecrire le lagrangien L du système.
2. En déduire l’équation du mouvement du point matériel.
3. Ecrire le hamiltonien H. En déduire que l’énergie E du point matériel
est conservée le long de la trajectoire.
4. Ecrire les équations de Hamilton pour le point matériel.
5. Evaluer les crochets de Poisson {r, H} et {p, H} du vecteur position
r et du vecteur impulsion p avec le hamiltonien. Confirmer ainsi le
résultat de la question précédente.
6. Démontrer, toujours en utilisant les crochets de Poisson, que le vecteur moment cinétique L = r × p est conservé. En déduire que le
mouvement du point matériel est planaire.
7. Le vecteur de Runge-Lenz est défini comme
A=
r
p×L
−k .
m
r
Utiliser les crochets de Poisson pour vérifier que ce vecteur est aussi
une quantité conservée.
8. Calculer A2 et vérifier que A2 s’exprime en termes d’autres quantités
conservées déjà introduites.
130
Formalisme canonique de Hamilton
9. Montrer que le vecteur A est situé dans le plan du mouvement paramétré par coordonnées polaires r , ϕ . On supposera que A et r sont
parallèles pour ϕ = 0 (choix de l’origine des ϕ). Exprimer la quantité
A · r en terme de L2 et de r . En déduire la forme géométrique de la
trajectoire. Quelle est cette trajectoire pour
A
< 1,
k
pour
A
= 1,
k
et pour
A
>1?
k
10. Quelle est la signification géométrique de l’orientation du vecteur A ?
On considère Ak < 1 . Que peut-on conclure pour la trajectoire du fait
que A soit conservé ?
II. On considère la planète Mercure, prise comme objet ponctuel de masse m,
dans le champ gravitationnel du soleil. La théorie actuelle de la gravitation
prédit de faibles corrections au potentiel V (r) = − kr , qui mènent à une
modification du hamiltonien de la partie I. Le hamiltonien corrigé H ′ s’écrit
H ′ = H + δH =
p2
k
3
β4 ε2
−
+ mc2
− β2 ε −
2m
r
2
2
8
où les quantités sans dimension
β2 = (
p 2
)
mc
et
ε=
M⊙ G 1
c2 r
sont petits et du même ordre de grandeur. Le paramètre k de la partie I
prend la valeur
k = m M⊙ G .
Données numériques :
M⊙ = 2 · 1030 kg , masse du soleil.
3
G = 6, 67 · 10−11 kgms2 , constante gravitationnelle.
c = 3 · 108 m/s , vitesse de la lumière.
r = 55 · 106 km , distance moyenne de la planéte Mercure au soleil. Cette
distance ne varie que très faiblement au cours d’une révolution.
1. Calculer
et petit.
M⊙ G 1
c2 r
et vérifier qu’ ε est bien un paramètre sans dimension
2. Pour le système de hamiltonien H ′ , les quantités E et L sont toujours
conservées. Pourquoi ?
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
131
3. On définit ∆ comme l’angle de rotation de l’orientation du périhélie
de la trajectoire de la planète par révolution. Exprimer ∆ sous forme
d’une intégrale portant sur la variable temps. On se souviendra de la
signification géométrique de A, et on fera intervenir les crochets de
Poisson de A et H ′ , en utilisant le fait que δH est une perturbation
faible.
4. Le calcul du crochet de Poisson {A, δH} est élémentaire mais un peu
long. On admettra donc le résultat de ce calcul sous la forme suivante :
Pour la composante A⊥ perpendiculaire à la direction de A(t = 0) =
A(ϕ = 0) dans le plan du mouvement on trouve
dA⊥
1 dA⊥
M⊙ G
=
= 6 A(0) 2 cos2 ϕ + C1 cos ϕ + C2 sin2 ϕ cos ϕ
dϕ
ϕ̇ dt
cr
où C1 et C2 sont des constantes. En déduire l’angle ∆ et la précession
du périhélie de Mercure par siècle, en secondes d’arc.
Donnée numérique : Le période de révolution pour Mercure est de T =
0, 24 ans.
4.9 Le bétatron
Dans un bétatron des électrons sont accélérés sur une trajectoire circulaire
fixée. L’adaptation du champ magnétique aux énergies des électrons est fondée sur la loi d’induction de Faraday . Nous allons étudier le mouvement des
électrons dans le bétatron dans le formalisme hamiltonien.
1. On considère une particule non-relativiste de masse m et de charge q
(par exemple un électron) dans un champ électromagnétique. Ecrire
l’expression du lagrangien L de la particule. Dans toute la suite on
supposera que le potentiel scalaire est nul : φ(x, y, z, t) = 0 .
2. L’espace peut être paramétré en coordonnées cylindriques (r, ϕ, z) ,
qui sont liées aux coordonnées cartésiennes par x = r cos ϕ , y =
r sin ϕ , z = z . Exprimer la vitesse au carré v 2 de la particule et le
~ en coordonnées cylindriques. Montrer que le laproduit scalaire ~v · A
grangien L en coordonnées cylindriques peut s’écrire sous la forme
L =
m 2
(ṙ + r 2 ϕ̇2 + ż 2 ) + q (ṙ Ar + ϕ̇ Aϕ + ż Az ) .
2
Déterminer le champ radial Ar et le champ tangentiel Aϕ en terme
~ , de r et de ϕ .
des composantes cartésiennes de A
132
Formalisme canonique de Hamilton
Figure 4.4 – Schéma d’un bétatron
3. Calculer les moments conjugués aux vitesses généralisées ṙ , ϕ̇ , ż .
4. En déduire l’expression du hamiltonien H(pr , pϕ , pz , r, ϕ, z) de la particule.
~ qui dépend du temps, mais qui ne
5. On considère un champ vecteur A
~ = A(r,
~ t) . En déduire l’existence de
dépend pas de ϕ ni de z : A
deux quantités conservées.
Dans toute la suite on supposera que les champs radial et vertical sont
nuls :
Ar (r, t) = 0 , Az (r, t) = 0 .
6. On suppose qu’à t = 0 on a pϕ = 0 , pz = 0 . En utilisant ces conditions, écrire explicitement les équations du mouvement canoniques de
Hamilton pour ϕ , pϕ et pour r , pr ; en fonction de r , de pr et de
Aϕ .
7. Dans quelles conditions les équations du mouvement précédentes admettentelles une solution qui décrit un mouvement circulaire de la particule ?
8. On étudiera par la suite un champ vecteur tangentiel Aϕ de la forme
p
(ν, µ, a > 0) .
Aϕ (r, t) = r µ2 (r − a)2 + ν 2 t2
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
133
Montrer que, dans ce potentiel, la particule peut suivre une trajectoire
circulaire et donner son rayon. Quelle est la vitesse angulaire ϕ̇(t) de
la particule sur cette trajectoire circulaire ?
La vitesse de la particule est en augmentation constante, et en pratique les électrons dans le bétatron atteignent rapidement des vitesses
proches de la vitesse de la lumière c . Dans ce cas il faut passer à la
description relativiste.
9. Rappeler le hamiltonien d’une particule relativiste de masse m et de
~ . En reprenant l’excharge q dans un un potentiel vecteur A = (0, A)
~ 2 en coordonnées cylindriques de la question 4.,
pression pour (~p − q A)
écrire le hamiltonien relativiste en coordonnées cylindriques, toujours
~ = A(r,
~ t) avec Ar (r, t) = 0 , Az (r, t) = 0 . Les quandans le cas A
tités pϕ et pz sont-elles toujours conservées ? Ecrire les équations du
mouvement de Hamilton pour ϕ , et pour r , pr .
10. On revient au champ tangentiel Aϕ (r, t) du 8. Ecrire le hamiltonien relativiste H pour ce champ dans le cas pϕ = 0 , pz = 0 . Ce hamiltonien
dépend explicitement du temps. Soit H0 la fonction dans l’espace des
phases obtenue en remplaçant dans H : Aϕ (r, t) → Aϕ (r, 0) . Montrer
que H0 est une quantité conservée le long de la trajectoire.
On pourra utiliser les crochets de Poisson pour la démonstration. On
posera pϕ = 0 , pz = 0 dès le départ.
11. Pour pϕ = 0 , pz = 0 écrire les équations du mouvement de Hamilton pour ϕ , et pour r , pr pour le potentiel du 8. Pour résoudre ces
équations, on introduit un paramètre s(t) qui est fonction monotone
du temps t d’après la loi
s(0) = 0 ,
ds
c2
,
=√
dt
H0 + b2 t2
b := c q ν .
On supposera que |r − a| ≪ a le long de la trajectoire de façon qu’on
peut approcher r par a dans l’équation pour ϕ . Dans cette approximation, écrire l’expression pour dϕ
. Ecrire aussi les expressions pour
ds
dpr
dr
et ds , et donner la solution r(s) de l’équation du mouvement.
ds
Dans le bétatron on veut accélérer des particules sur des trajectoires
circulaires. A quoi doit-on faire attention pour assurer cette condition
expérimentalement avec bonne précision ? Expliquer le terme "oscillations de bétatron" en partant de la solution trouvée.
134
Formalisme canonique de Hamilton
12. Exprimer le temps t en fonction du paramètre s et vérifier que la vitesse
de la particule reste toujours inférieure à la vitesse de la lumière c .
On négligera les petites oscillations autour de la trajectoire circulaire.
4.10 Les points de Lagrange
Considérons deux astres de masses M1 et M2 qui, sous l’effet de leur attraction gravitationnelle tournent l’un autour de l’autre en gardant une distance
fixe R . On se placera toujours dans un référentiel où le centre de masse
des deux astres est au repos et qui est centré au centre de masse. Dans la
première partie - questions (a) à (e) - nous choisirons un référentiel inertiel
qui satisfait à cette condition. Les deux astres évoluent alors sur des orbites
circulaires. On posera M = M1 + M2 pour la masse totale des deux astres,
en supposant M1 ≥ M2 .
1. Expliquer pourquoi le mouvement relatif des deux astres est un mouvement planaire.
2. Donner les distances r1 et r2 des astres à leur centre de masse noté
O , en fonction de leur distance R et de leurs masses. Montrer que la
pulsation de rotation ω des deux astres satisfait
ω2 =
GM
,
R3
(4.103)
où G est la constante de la gravitation.
Pour le mouvement circulaire considéré, on trouve ω de la façon la plus
simple en égalisant la force centrifuge et la force gravitationnelle, pour
l’un ou l’autre des deux astres.
Considérons aussi un astéroïde (ou un satellite), de masse m , si faible
qu’il n’influence pas le mouvement des deux astres.
3. En admettant cette approximation, dans quelle mesure la valeur de la
masse de l’astéroïde est-elle déterminante pour son mouvement ?
4. On note ~r˜ la position et ~p˜ le moment conjugué (ou l’impulsion) de
l’astéroïde dans le référentiel inertiel considéré. On suppose qu’à un
moment t donné ~r˜ et p~˜ se trouvent dans le plan déterminé par le
mouvement des deux astres. Pourquoi ~r˜ et p~˜ vont-ils rester dans ce
plan à tout temps t′ ≥ t ?
Par la suite nous considérerons toujours le mouvement de l’astéroïde
restreint à ce plan.
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
135
5. Ecrire explicitement le lagrangien L̃ et le hamiltonien H̃ de l’astéroïde
qui régissent son mouvement en fonction de la position des deux astres.
Dans le référentiel inertiel considéré on choisira comme variables canoniques les coordonnées cartésiennes x̃, ỹ de l’astéroïde dans le plan du
mouvement, et leurs moments conjugués p̃x , p̃y . Le lagrangien et le
hamiltonien dépendent explicitement du temps. Pourquoi ?
6. On veut passer à un référentiel tournant à la vitesse angulaire ω donnée
en (4.103), qui suit le mouvement rotationnel des deux astres. Comment
obtient-on le lagrangien de l’astéroïde dans ce nouveau référentiel, en
partant du lagrangien L̃ dans le référentiel inertiel ? Montrer que le
hamiltonien H dans le référentiel tournant peut s’écrire
p~ 2
GmM1
GmM2
H=
− ω (xpy − ypx ) −
−
.
2m
|~r − ~r1 |
|~r − ~r2 |
(4.104)
Ici p~ = (px , py ) , et px , py sont les moments conjugués aux coordonnées
cartésiennes x, y dans le nouveau référentiel ; ~r1 , ~r2 sont les vecteurs
position des astres dans ce référentiel.
Par la suite on choisira comme l’axe des x , la droite qui relie les deux
astres dans ce référentiel.
7. Donner une quantité conservée pour le système planaire (à deux degrés
de liberté) régi par le hamiltonien H . Tenant compte de cette loi de
conservation, peut-on exclure à priori un comportement chaotique de
la trajectoire de l’astéroïde ?
8. Ecrire les équations du mouvement hamiltoniennes pour les variables
x, y et px , py du système régi par H .
9. Le mouvement de l’astéroïde est stationnaire dans l’espace des phases,
si il existe des solutions x, y, px , py des équations du mouvement,
constants dans le temps (dans le référentiel tournant choisi). Montrer graphiquement qu’il existe 3 solutions stationnaires pour lesquelles
l’astéroïde se trouve sur la droite déterminée par la position des deux
astres. Caractériser le mouvement de l’astéroïde pour ce type de solution dans le référentiel inertiel de départ.
10. Montrer aussi qu’il existe deux autres solutions stationnaires pour lesquelles l’astéroïde et les deux astres forment un triangle équilatéral.
On appelle points de Lagrange les 5 points stationnaires dans l’espace
des phases, trouvés dans les deux questions précédentes.
136
Formalisme canonique de Hamilton
11. Pour étudier la stabilité d’un point de Lagrange, on peut regarder de
faibles déviations de ~r et de ~p autour de leurs valeurs en ce point de Lagrange. A l’ordre dominant on obtient alors une équation différentielle
linéarisée pour ces petites déviations de la forme
δ~r δ~r˙ .
=M
˙
δ~p
δ ~p
M est une matrice 4×4, qu’on ne calculera pas. Elle dépend des dérivées
du hamiltonien par rapport aux variables canoniques, évaluées au point
de Lagrange considéré. Quelle est la condition aux valeurs propres de
la matrice M , pour que le point de Lagrange considéré soit stable ?
Figure 4.5 – Schéma des 5 points de Lagrange L1 à L5 pour le système
Soleil-Terre
12. Il s’avère que les 3 configurations correspondant aux points de Lagrange, situés sur la droite joignant les deux astres sont instables.
D’autre part les deux configurations équilatérales sont stables à la
M2
condition que M
≤ 0, 04 . Cette condition est vérifiée pour tous les
1
systèmes Soleil-planète dans le système solaire. Le rapport vaut 1/1000
pour le système Soleil-Jupiter.
Au vu de ces faits et de la figure expliquer :
a) pourquoi on ne trouve pas d’objet naturel situé aux points L1 , L2 , L3
dans aucun système Soleil-planète.
b) le fait que plusieurs milliers d’astéroïdes, appelés Troyens, se trouvent
près des points L4 , L5 du système Soleil-Jupiter.
4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI
137
c) pourquoi on a envoyé plusieurs satellites destinés à l’observation du
cosmos vers le point de Lagrange L2 (WMAP en 2001, Herschel et
Planck en 2009).
d) Application numérique : Donner (à 10% près) la distance à la Terre
des trois points de Lagrange instables L1 à L3 pour le système SoleilTerre. On donne :
la distance Terre - Soleil : R = 150·106km, et le rapport de leurs masses
MS /MT = 300 000 .
138
Solution des exercices
Solution des exercices
Chapitre 2
2.1 Intégrale première
On a directement dΓ/dx = z ′ (1 + z ′2 − z z ′′ )/(1 + z ′2 )3/2 , l’équation de la
courbe est 1 + z ′2 − z z ′′ = 0 d’où le résultat. On en déduit
p
z(x) = a 1 + z ′2 (x) ,
où a est un constante. En posant z ′ (x) = sinh(φ(x)), il vient
z(x) = a cosh(φ(x))
soit z ′ = aφ′ (x) sinh(φ(x))
d’où évidemment aφ′ (x) = 1 et la solution z(x) = a cosh((x − x0 )/a).
2.2 Brachistochrone
y
O
A
x
Figure 6 – Trajectoire optimale de O à A.
Le temps de parcours dans le plan (xOy) est donné par
Z A
ds
T12 =
O v
139
Solution des exercices
où ds2 = dx2 + dy 2 . La condition
initiale sur v et la conservation de l’énergie
√
totale impliquent v(x) = 2gx , où on a posé (sans limiter la généralité)
O = (0, 0) . Donc
Z As
1 + y ′2
T12 =
dx ,
2gx
O
où l’on a pris x comme variable indépendante. Le lagrangien associé L =
q
1+y ′2
ne dépend pas explicitement de la variable y. Les équations d’Euler2gx
Lagrange donnent alors
On en tire
y′
∂L
1
p
√
=
= C = cste .
∂y ′
1 + y ′2 2gx
ẏ 2 =
où w = 2γ x − 1 , ẏ =
dy
dw
1 1+w
,
4γ 2 1 − w
, et γ = 2g C 2 . En posant w = − cos θ on arrive à
1
dy
=
(1 − cos θ)
dθ
2γ
et finalement, en tenant compte du choix O = (0, 0) :
y(θ) =
1
(θ − sin θ) ,
2γ
x(θ) =
1
(1 − cos θ) .
2γ
Il s’agit donc d’un arc de cycloïde (voir figure 6)
(y −
1
1
θ 2
) + (x − )2 = ( )2
2γ
2γ
2γ
dont le sommet est situé en O. On voit bien qu’au point d’arrivée A = (x2 , y2 )
on a
θ2 − sin θ2
y2 /x2 =
,
1 − cos θ2
de façon que θ2 → 0 si y2 /x2 → 0 , et θ2 → 2π si y2 /x2 → ∞ . Le cas
limite y ≡ 0 correspond à C = 0.
140
Solution des exercices
2.3 Rayons courbes et super-réfraction d’ondes radio
RB
dℓ .
1. TAB = A n(x,y)
c
2
2
2
2. dℓ = dx + dy = dr 2 + r 2 dφ2 = (ṙ 2 + r 2 ) dφ2 , d’où
Z B
n(r) √ 2
ṙ + r 2 dφ .
TAB =
c
A
3. Si L ne dépend pas de φ la quantité E ≡ ṙ ∂L
− L est conservée.
∂ ṙ
On trouve
n(r) r 2
E=− √
.
c r 2 + ṙ 2
4. On obtient
r
n2 r 2
−1 .
ṙ = ±r
c2 E 2
5. Pour une trajectoire circulaire r ≡ cste , d’où ṙ ≡ 0 . La condition est
2 2
donc nc2r ≡ E 2 .
6. En dérivant la relation pour ṙ
 r

2
2
2
2
n
r
nr
1
dn
1
r̈ = ± ṙ
− 1 + r2 q
ṙ + r q
n ṙ 
2
2
2
2
2
2
2
2
2
2
c E
n r
n r
−1c E
− 1 c E dr
c2 E 2
c2 E 2
r dn
r 2 dn
n2 r 2
n2 r 2
≃r 1+
.
= r ( 2 2 − 1) + 2 2 r +
cE
cE
n dr
n dr
7. En cas de sous-réfraction la courbure est plus grande que dans le régime
standard, on a donc
dn
dn
> ( )moy .
dr
dr
En cas de super-réfraction on a
dn
dn
< ( )moy .
dr
dr
= −1 , car r est constant
8. La condition pour un grand cercle est r dn
dr
dans cette condition. Pour r = R on trouve dn
= −1, 57 · 10−4 km−1 .
dr
En accord avec la figure on est dans le régime de super-réfraction.
La réfraction d’ondes radio en fonction des conditions météorologiques et atmosphériques est évidemment d’une grande importance pour la transmission
d’ondes radio entre stations terrestres. Voir par exemple le site
http ://perso.wanadoo.fr/f6crp/ba/propavu.htm, conçu par Denis Auquebon
141
Solution des exercices
z
x=L
z=z 2
X
z1
L
Terre
x
Figure 7 – Chemin du bateau avec un virement de bord en x = L/2.
2.4 Stratégie d’une régate.
1. On a par définition ẋ = vx = v cos θ, ż = vz = v sin θ, par conséquent
z ′ = dz/dx = tan θ.
2. On a vx = v cos θ = w/h. Cette vitesse est maximum lorsque h(z ′ ) est
minimum, c’est-à-dire pour z ′ = 1, soit θ = π/4. On a alors vx = w/2.
En fait, il suffit de multiplier h par une constante pour se mettre dans
la situation appropriée à un bateau donné, pour lequel vx,max = λw.
3. On a dt = dx/vx = h′ (z ′ ) dx/w(z), d’où
T =
Z
L
dx
0
h′ (z ′ )
w(z)
(105)
.
4. Posons Φ = h′ (z ′ )/w(z). L’équation de Euler-Lagrange qui optimise le
temps total T est
d ∂Φ
∂Φ
=
(
) .
∂z
dx ∂z ′
5. La fonction Φ ne dépend pas explicitement de x. Par conséquent, on a
∂Φ
∂Φ
d
Φ = z′
+ z ′′ ′
dx
∂z
∂z
.
142
Solution des exercices
Par conséquent
∂Φ
d
(Φ − z ′ ′ ) = 0 ,
dx
∂z
ce qui donne (h′ (z ′ )z ′ − h(z ′ ))/w(z) = constante.
6. On a z ′ h′ −h = −2/z ′ . On obtient donc, pour la fonction x(z), l’équation
différentielle du premier ordre (−2/A)dx/dz = w(z). D’où le résultat :
x=L
w0 z − w1 z0 ln(1 + (z/z0 ))
w0 z1 − w1 z0 ln(1 + (z1 /z0 ))
(106)
,
où nous avons incorporé les conditions aux limites : (x = 0, z = 0) et
(x = L, z = z1 ).
7. On obtient
z′ =
w0 z1 − w1 z0 ln(1 + (z1 /z0 ))
dz
=
dx
w0 L − w1 Lz0 /(z + z0 )
.
Si z1 ≪ L et z1 ≪ z0 , la vitesse du vent ne varie pas beaucoup sur le
trajet, et on aura z ′ ∼ z1 /L ≪ 1.
Or, à la deuxième question, nous avons vu que la vitesse optimale pour
un vent constant est atteinte pour z ′ = 1. La configuration envisagée
ne correspond certainement pas à la meilleure stratégie. Il faut virer de
bord en un point (x1 , Z) avec 0 < x1 < L et Z ≫ z1 , comme représenté
sur la figure (7) pour bénéficier de façon optimale de la puissance du
vent (cette hypothèse était exclue par l’énoncé).
La trajectoire représentée, avec un angle de θ = 45 degrés (|z ′ | = 1
et√un virement de bord θ → −θ en x = L/2 a une longueur totale
L 2 et √
une vitesse supérieure à (w0 − w1 )/2. Le temps sur ce chemin
Tv = 2L 2/(w0 − w1 ) est, à l’évidence plus court que le temps le long
de la trajectoire sans virement de bord T ∼ 2L(z1 /L)/(w0 − w1 ) =
2z1 /(w0 − w1 ) .
Commentaire hors problème : on voit combien dans des régates comme
la Course de l’America, la présence et le talent d’un bon tacticien est
utile. Il doit notamment juger, et préjuger, de la vitesse du vent sur
tout le plan d’eau. Dans des cas plus réalistes que celui envisagé ici
dans l’équation (2.59), par exemple v = w(1 − cos θ)/2, on pourra
se convaincre que le problème devient très vite compliqué à résoudre,
il faut le faire numériquement. Si les règlements ne permettent pas
143
Solution des exercices
d’entrer la distribution du vent automatiquement dans un ordinateur
(ce qui est permis dans les courses au large), l’expérience de l’équipage
est primordiale.
2.5 Pendule mobile
L=
m1 + m2 2 m2 2 2
ẋ +
(l φ̇ + 2lẋφ̇ cos φ) + m2 gl cos φ .
2
2
2.6 Propriétés de l’action
a)
1. Particule libre
S=
m (x2 − x1 )2
2 t2 − t1
2. Oscillateur harmonique
S=
mω
(x22 + x21 ) cos ω(t2 − t1 ) − 2x2 x1
2 sin ω(t2 − t1 )
3. Force constante
S=
m
F
1 F2
(v0 + (t2 − t1 ))2 (t2 − t1 ) + F x1 (t2 − t1 ) −
(t2 − t1 )3
2
m
6 m
où v0 = (x2 − x1 )/(t2 − t1 ) − (1/2)(F/m)(t2 − t1 ) est la vitesse initiale
de la particule.
b) Nous partons de la variation de l’action écrite en (2.4)
δS12 =
Z
t2
t1
∂L
∂L
δx(t) +
δ ẋ(t)
∂x
∂ ẋ
dt .
Nous intégrons le deuxième terme par parties, mais nous n’imposons plus
d’arriver au même point x2 mais en un point voisin x2 + δx2 . Le terme tout
intégré ne s’élimine donc plus, et l’on obtient
Z t2 ∂L
∂L
d ∂L
δx(t) dt .
δS12 =
δx2 +
−
∂ ẋ
∂x
dt ∂ ẋ
t1
144
Solution des exercices
Par hypothèse, la trajectoire est physique, si bien que l’intégrale de droite
s’annule. On obtient donc une variation de l’action
δS12 =
∂L
|x=x2 δx2 = p2 δx2 et donc
∂ ẋ
∂S
|x=x2 = p2 .
∂x
c) Nous considérons l’action comme fonction de la coordonnée d’arrivée x
= L , et aussi d’après
et du temps d’arrivée t. On a, de façon évidente, dS
dt
∂S
∂S
∂S
le résultat précédent dS
=
+
ẋ
=
+
p
ẋ
.
En
réunissant ces deux
dt
∂t
∂x
∂t
∂S
égalités, on obtient ∂t = L − p ẋ = −H , donc au signe près l’énergie au
point d’arrivée E2 .
2.7 Moments conjugués en coordonnées sphériques.
1. Le lagrangien est L = 21 m(ṙ 2 + r 2 θ̇2 + r 2 sin2 θ φ̇2 ) − V (r).
2. Les moments conjugués sont
pr =
∂L
= mṙ ,
∂ ṙ
pθ =
∂L
= mr 2 θ̇ ,
∂ θ̇
pφ =
∂L
= mr 2 sin2 θ φ̇ .
∂ φ̇
3. En dérivant (2.60) par rapport au temps, et en tenant compte du fait
qu’en coordonnées cartésiennes p = mv, on obtient directement le
résultat Lz = mr 2 sin2 θφ̇ = pφ .
4. La conservation de pφ , ou de Lz , correspond à l’invariance par translation en φ, c’est-à-dire à l’invariance par rotation autour de Oz.
~ pa5. Si la particule chargée est plongée dans un champ magnétique B
rallèle à Oz, il y a invariance du problème par rotation autour de Oz
et la composante Lz est conservée.
En effet on ajoute à L un terme ∼ ṙ · (B × r) ∼ Lz · B qui est indépendant de φ (se rappeler (3.33) et noter que pour un champ magnétique
constant on peut choisir A = 12 B × r).
Chapitre 3
3.1 Repère tournant et pendule de Foucault
1. La vitesse dans le repère tournant s’obtient de v0 par
v0 = v + Ω × r
145
Solution des exercices
où l’origine r = 0 se trouve sur l’axe de rotation. Le lagrangien est
un invariant qui détermine la trajectoire physique indépendamment du
repère. Dans le repère tournant il prend donc la forme
L=
m 2
m
v + m v · (Ω × r) +
(Ω × r)2 ,
2
2
qui s’obtient en remplaçant v0 .
2. On trouve
∂L
= m (v + Ω × r) ,
∂v
∂L
= m (v × Ω) + m Ω2 r − m (Ω · r) Ω .
∂r
On en déduit l’équation du mouvement
mv̇ = 2m (v × Ω) + m Ω2 r⊥ .
On reconnaît la force de Coriolis et la force centrifuge.
3. Nous avons trouvé en 2.
p = m (v + Ω × r) .
Le moment conjugué contient un terme supplémentaire qui ressemble
au terme qA = 2q B × r apparaissant dans un champ magnétique homogène, voir (3.35). L’énergie est conservée puisque le lagrangien ne
dépend pas explicitement du temps.
4. Pour θ ≪ 1 on trouve
~r = l (θ cos φ, θ sin φ, −1) ,
~v = l (cos φ, sin φ, 0) θ̇ + l (−θ sin φ, θ cos φ, 0) φ̇ ,
~ × ~r = l (−Ωz θ sin φ, Ωz θ cos φ + Ωx , Ωx θ sin φ) ,
Ω
~ × ~r) = l2 (Ωx sin φ θ̇ + Ωz θ2 φ̇ + Ωx θ cos φ φ̇) .
~v · (Ω
5.
V (θ) = −mgl cos θ =
mgl 2
θ + O(θ4 ) + cste .
2
146
Solution des exercices
6. On a
θ̇ sin φ + θ cos φ φ̇ =
d
(θ sin φ) .
dt
Les équations du mouvement restent inchangées si l’on ajoute au lagrangien la dérivée totale par rapport au temps d’une fonction quelconque des variables position (et du temps).
7.
pθ =
∂L
= ml2 θ̇ ,
∂ θ̇
pφ =
∂L
= ml2 θ2 (φ̇ + Ωz ) .
∂ φ̇
8. Ls ne dépend pas de φ ; nous déduisons donc des équations d’EulerLagrange que ṗφ = 0 , c’est à dire, pφ est conservé.
Nous avons aussi
d ∂Ls
= ml2 θ̈ ,
dt ∂ θ̇
∂Ls
= ml2 Ωz θ φ̇ − mgl θ
∂θ
Donc
θ̈ = Ωz θ φ̇ −
g
θ.
l
9. Pour réaliser cette condition on s’assure que le pendule passe (de façon
régulière) par la position θ = 0 , car pφ = ml2 θ2 (φ̇ + Ωz ) d’après 7.
10. Si pφ ≡ 0 , on trouve φ̇ = −Ωz , φ(t) = φ(0) − Ωz t .
Dans le cas où l’axe de rotation du repère tournant ne passe pas par
~ × ~r) en
l’origine ~r = 0 , on doit modifier le terme de Coriolis m ~v · (Ω
~
m ~v · [Ω × (~r − ~r0 )] , où ~r0 est un vecteur qui relie l’origine à un point
de l’axe de rotation. La modification du lagrangien
~ × ~r0 ) = −m
−m ~v · (Ω
d ~ × ~r0 )
~r · (Ω
dt
est une dérivée totale par rapport au temps qui n’affecte pas les équations du mouvement du pendule. La rotation du plan des oscillations
s’obtient comme
Ωz · 1h = (360o /24) · sin(49o) = 11, 3o .
147
Solution des exercices
3.2 Lagrangien de Proca
L’équation d’onde pour A en se servant de (3.61, 3.67). Dans la jauge de
Lorenz elle s’écrit
( + µ2 )Aµ = µ0 j µ ,
équation qui fait apparaître un terme supplémentaire en µ2 par rapport à
l’équation d’onde de l’électromagnétisme (voir [2], chapitre 7.3)
Aµ = µ0 j µ .
Pour j µ = 0 on trouve comme solutions des ondes planes ∼ exp{iωt − k · x} ,
où
ω 2 /c2 = µ2 + k 2 .
En portant les relations E = ~ω et p = ~k ceci donne
E 2 = ~ 2 µ 2 c2 + p 2 c2 .
En comparant à
E 2 = m2 c4 + p2 c2
on voit que la quantité ~µ/c a l’interprétation d’une masse du photon. Actuellement les bornes expérimentales supérieures pour cette masse sont de
l’ordre de 10−51 kg .
Chapitre 4
4.1
Les équations de Hamilton s’écrivent
ṙ =
∂H
1
dA
=
(p − qA) ⇒ mv̇ = ṗ − q
,
∂p
m
dt
∂H
~ · A(r, t)) − q ∇Φ
~ .
= q ∇(v
∂r
En utilisant (3.24), (3.25) et (3.28) on trouve alors
ṗ = −
mv̇ = q (v × B + E) .
148
Solution des exercices
4.2 Oscillateurs couplés
1. On obtient sans difficulté
{X, P } = 1
H=
{X, Q} = 0
{Y, P } = 0
{Y, Q} = 1
P2
mω 2 X 2
Q2
m(ω 2 + Ω2 )Y 2
+
+
+
2m
2
2m
2
.
√
2. Les fréquences propres du système sont donc ω1 = ω et ω2 = ω 2 + Ω2
.
3. La forme générale du mouvement se déduit immédiatement de
X = A cos(ω1 t + φ) ,
Y = B cos(ω2 t + ψ) .
4.3 Système hamiltonien unidimensionnel
1. Le hamiltonien ne dépend pas explicitement du temps. L’énergie est
donc conservée. On a Ḋ = 21 ṗ q + 12 q̇ p − H = 0 , en utilisant les
équations du mouvement ṗ = − q13 et q̇ = mp .
2.
p
2
q̇ =
=
(D + E t) .
m
mq
3. L’équation précédente donne q dq = m2 (D + E t) dt , d’où
q 2 − q02 = m2 (2 D t + E t2 ) . Ceci donne pour q0 > 0
r
2
4
q(t) =
Dt +
E t2 .
q02 +
m
m
Pour E > 0 nous trouvons
q(t) ≃
r
2E
t
m
à t grand, ce qui correspond au mouvement libre loin de l’origine.
Pour E < 0 l’expression de q s’annule pour
s
D2
D
m q02
t0 =
+
+
|E|
E2
2|E|
et devient imaginaire pure pour des temps t > t0 . La non-existence
d’une solution pour t > t0 reflète la singularité du potentiel à l’origine.
149
Solution des exercices
4.4 Oscillations forcées.
1. On obtient sans difficulté H = ω2 (X 2 + P 2 ) ,
{X, P } = 1 .
2. Dans ces variables, qui sont celles utilisées par Dirac dans la quantification de l’oscillateur harmonique, H = ω(a∗ a) .
3. On obtient évidemment {a, a∗ } = −i.
4. L’équation de l’évolution dans le temps de a est ȧ = {a, H} = −iωa
dont on note que c’est une équation du premier ordre. La solution
générale est
a(t) = a0 exp (−iωt)
où a0 est une constante complexe. L’énergie de l’oscillateur est E =
ω|a0 |2 .
5. Pour t ≤ 0 on a donc a0 = 0. En présence de Hpot le hamiltonien
devient
H = ω(a∗ a) + b(a + a∗ ) sin Ωt .
On a donc ȧ = {a, H} = −iωa − ib sin Ωt .
Cette équation inhomogène se résout par "variation des constantes".
On obtient, en tenant compte de la condition E(t < 0) = 0,
E(t > T ) = ωb2 |
e−i(Ω−ω)T − 1 e−i(Ω+ω)T − 1 2
+
|
2i(Ω − ω)
2i(Ω + ω)
.
6. On se trouve en présence d’un phénomène de résonance à Ω = ω ( ou
à Ω = −ω ce qui est équivalent). Au voisinage de Ω = ω, l’énergie
acquise par l’oscillateur est de la forme
E(t > T ) = ωb2
sin2 (Ω − ω)T /2
(Ω − ω)2
qui présente un pic de hauteur ωb2 T 2 /4 à Ω = ω.
4.5 Chaîne fermée d’oscillateurs couplés.
1. (a) Il est évident, sur la définition, que
∗
yk = yN
−k ,
∗
qk = qN
−k
.
150
Solution des exercices
(b) On a
N
X
yk yk∗ =
k=1
N
N
1 X −2ikn′ π/N ′
1 X 2iknπ/N
e
xn )( √
e
xn )
(√
N n=1
N n′ =1
k=1
N
X
(107)
La somme sur k nous donne δnn′ , d’où le résultat
N
X
qk qk∗
k=1
=
N
X
p2n
.
(108)
n=1
De même
N
X
qk qk∗ =
k=1
N
X
N
N
1 X −2iknπ/N
1 X 2ikn′ π/N ′
(√
e
pn )( √
e
pn ) (109)
N
N
′
n=1
k=1
n =1
La somme sur k nous donne δnn′ , d’où le résultat.
(c) Par ailleurs
N
X
n=1
(xn − xn+1 )2 =
(110)
N
N
N
X
1 X X −2iknπ/N
−2ikπ/N
(
e
(1 − e
)yk )(
e2iknπ/N (1 − e2ikπ/N )yk∗)
N n=1 k=1
k=1
La somme sur n nous donne δkk′ , d’où le résultat.
2. Equations du mouvement et leur solution.
(a) On a donc
N
X
kπ
qk q ∗ 1
2
2
H=
[ k + mΩ′ k yk yk∗ ] avec Ω′ k = ω 2 + 4Ω2 sin2 ( ) .
2m
2
N
k=1
(b)
∗
∗
On a : {yj , qk } = {yj∗, qk∗ } = {yj , qN
−k } = {yj , qN −k } = δjk .
151
Solution des exercices
(c) On obtient :
m ∗
(qk + qN −k ) = mqk∗
2
m
∗
ẏk∗ = {yk∗, H} = (qk + qN
−k ) = mqk
2
mΩ′ 2k (yk∗ + yN −k )
2
q̇k = {qk , H} = −
= mΩ′ k yk∗
2
∗
mΩ′ 2k (yk + yN
2
−k )
q̇k∗ = {qk∗ , H} = −
= mΩ′ k yk
2
(d) On a donc {yk (t)} = ak cos(Ω′ k t + φk ), d’où {xn (t)}.
3. Si à l’instant t = 0 on a yN (0) = 1, ẏN (0) = 0 et {yn (0) = 0, ẏn (0) =
0, ∀n 6= N,√alors yN (t) = cos(ωt) et yn (t) = 0 , ∀n 6= N. On a alors
xn (t) = (1/ N ) cos(ωt). Les oscillateurs, de même élongation à chaque
instant, sont toujours en phase et seul le mouvement global de rappel
par rapport au plan x = 0, à la pulsation ω se manifeste.
4. Propagation d’ondes.
Si ω = 0, les fréquences propres sont Ω′k = 2Ω sin(kπ/N) ∼ 2Ω(kπ/N)
pour k ≪ N. Les conditions aux limites donnent y1 = cos 2Ωπt/N ,
yN −1 = cos 2Ωπt/N et yn = 0 autrement.
(a) Par conséquent, on obtient :
ẏk = {yk , H} =
2nπ
2Ωπt
2
) cos(
)
(111)
xn = xN −n = √ cos(
N
N
N
1
2Ωπt − 2nπ
2Ωπt + 2nπ
= √ [cos(
) + cos(
)] (112)
N
N
N
(b) On voit un phénomène de propagation en sens inverse de deux
ondes puisque xn+m (t) = xn (t ± m/Ω) dans les termes ci-dessus.
le point xn+m a la même amplitude à l’instant t + m/Ω que le
point xn à l’instant t.
(c) En écrivant que xn (t) = f (t, y = na) la fonction f est f (t, y) =
2Ωπt+2yπ/a
√1 [cos(
)+ cos( 2Ωπt−2yπ/a
)] . Elle satisfait l’équation d’ondes
N
N
N
1 ∂2f
∂2f
−
= 0 .
Ω2 a2 ∂t2
∂x2
Dans cette chaîne d’oscillateurs couplés une onde progressive de
vitesse Ωa se propage.
152
Solution des exercices
4.6 Théorème du viriel.
2
~ . L’évolution temporelle
1. On trouve sans difficulté {A, H} = pm −r· ∇V
2
~ .
de A est tout simplement dA
= {A, H} = pm − r · ∇V
dt
2. On a évidemment hȦi = (A(T ) − A(0))/T = 0. Par conséquent, en
reportant le résultat précédent, on obtient l’égalité recherchée.
~ = r ∂V = nV . On obtient donc 2hEc i = nhV i .
3. Si V = g r n , on a r · ∇V
∂r
4. L’énergie totale est E = Ec + V . On obtient donc :
a) pour un oscillateur harmonique E = 2hEc i = 2hV i, résultat bien
connu ;
b) Pour un potentiel newtonien E = −hEc i = (1/2)hV i, résultat facile à obtenir pour une orbite circulaire, mais général pour une orbite
elliptique quelconque.
5. En général, pour un potentiel quelconque, les orbites des états liés ne
sont pas fermées, mais restent confinées dans l’espace. La généralisation
de la définition (4.101) de la moyenne est
1
hf i = lim
T →∞ T
Z
T
f (t) dt .
0
Avec cette définition, on a hȦi = lim (A(T ) − A(0))/T = 0 puisque
T →∞
A(t) est borné quelque soit t. Avec cette définition de la moyenne, la
relation reste valable.
4.7
{Lx , Ly } = {ypz − zpy , zpx − xpz }
= {ypz , zpx }−{zpy , zpx }−{ypz , xpz }+{zpy , xpz } = −ypx −0−0+py x = Lz .
De la même façon on montre
{Ly , Lz } = Lx ,
{Lz , Lx } = Ly .
4.8 Du problème de Kepler à la précession du périhélie de Mercure
1. L = T − V =
mv2
2
+
k
r
.
153
Solution des exercices
2. L’équation d’ Euler-Lagrange mène à l’équation de Newton bien connue
~ (r) = −k
m r̈ = −∇V
r
.
r3
3. On a par définition
H = p · ṙ − L =
p2
k
−
2m
r
avec p = ∂L
. La conservation de l’énergie suit du fait que H ne dépende
∂ ṙ
pas explicitement du temps.
4. On a
ṙ =
p
∂H
=
,
∂p
m
ṗ = −
∂H
r
= −k 3 .
∂r
r
5. On déduit de la définition des crochets de Poisson
{r, H} =
∂H
∂p
et
{p, H} = −
∂H
.
∂r
On trouve donc pour ṙ = {r, H} et pour ṗ = {p, H} les mêmes
résulats qu’en 4.
6. On a
dL
r
= {L, H} = {r, H} × p + r × {p, H} = ṙ × p + r × (−k 3 ) = 0
dt
r
parce que, dans les deux cas, les vecteurs figurant dans le produit vectoriel sont parallèles.
Pour L 6= 0 les vecteurs r et p , et donc aussi v , sont dans le plan
perpendiculaire à L . Si L est constant, ce plan est toujours le même.
Si L = 0 le mouvement est rectiligne.
7. On calcule
{p × L, H} = {p, H} × L + p × {L, H} = −k
r
×L + 0 ,
r3
r
k
k
k p
k r·p
{k , H} =
{r, H} + r { , H} =
+ r (−
).
r
r
r
r m
m r3
En développant le produit vectoriel de la première ligne on déduit que
{A, H} = {
r
p×L
− k , H} = 0 .
m
r
154
Solution des exercices
8. On trouve
2k 1
p2 L2
2k 2
1
2
2
(p × L) −
r · (p × L) + k =
−
L + k2
A =
2
2
m
m r
m
mr
2
2L2
E + k2 .
m
2
La quantité A est donc entièrement déterminée par les quantités conservées L2 et E .
9. Le vecteur A est perpendiculaire à L et donc dans le plan du mouvement. On a
=
A·r =
donc
1
1 2
(p × L) · r − k r =
L − kr ,
m
m
A r cos ϕ + k r =
L2
L2
1
d’où r(ϕ) =
.
m
1 + Ak cos ϕ km
La trajectoire est donc une conique ; une ellipse pour
rabole pour Ak = 1 , et une hyperbole pour Ak > 1 .
A
k
< 1 , une pa-
10. Nous avons choisi l’origine des ϕ tel que ϕ = 0 correspond à la direction
de A . C’est la position où la distance du point matériel au centre
du potentiel est minimale. La direction de A correspond donc à la
position du périhélie de la trajectoire. Le fait que cette direction soit
fixée implique dans le cas Ak < 1 que la trajectoire est périodique ou
fermée.
II.
1. On trouve
M⊙ G
c2 r
= 2, 7 · 10−8 ≪ 1 .
2. H ′ ne dépend pas explicitement du temps t , et H ′ est invariant par
rotations. E et L sont donc conservés.
3. Dans l’approximation où ce changement est petit on a
∆ =
où
A⊥
A(0)
A(0) = |A(0)| , et A(2π) = A|| + A⊥ , A⊥ = |A⊥ | .
{A, H} = 0 , d’où
dA
= {A, δH} ,
dt
dA⊥
= {A, δH}⊥ ,
dt
155
Solution des exercices
1
∆ =
A(0)
4. Avec les données on trouve
Z 2π
dA⊥
M⊙ G
= 6π A(0) 2
,
dt
c r
0
Z
T
0
{A, δH}⊥ dt .
∆ = 6π
M⊙ G
= 2π · 8, 4 · 10−8 .
c2 r
Pour passer en secondes d’arc on multiplie par 360 · 60 · 60 et on divise par 2π . Pour passer à la révoultion par siècle on multiplie aussi
par 100/0, 24 ≃ 415 . De cette manière on obtient une précession du
périhélie de Mercure par siècle de 43, 5′′ .
Les astronomes savaient dès le XIXe siècle que la théorie newtonienne était en
désaccord avec les observations de la précession du périhélie de Mercure. Le
désaccord était de 35′′ d’après les calculs de Jean-Joseph Le Verrier en 1845
et de 43′′ d’après les nouveaux calculs de Simon Newcomb en 1883 (qui a
pu se baser aussi sur des observations plus précises). On a essayé d’expliquer
ce désaccord par la présence d’autres masses dans le système solaire -qu’on
n’a pas su trouver-, et/ou par une modification ad hoc de la loi de Newton.
Einstein avait trouvé en 1915 que la relativité générale pouvait expliquer
cet écart quantitativement, d’après le résultat du calcul précédent. Pendant
plusieurs décennies ce résulat a été la confirmation observationnelle la plus
importante de la nouvelle théorie de la gravitation d’Einstein.
4.9 Le bétatron
1. On a d’après le cours
L=
m 2
v + qv·A − qφ
2
2. On a
v · A = (ṙ cos ϕ − ϕ̇ r sin ϕ) Ax + (ṙ sin ϕ + ϕ̇ r cos ϕ) Ay + ż Az
= ṙ (Ax cos ϕ + Ay sin ϕ) + ϕ̇ r (Ay cos ϕ − Ax sin ϕ) + ż Az
donc
Ar = Ax cos ϕ + Ay sin ϕ ,
Aϕ = r (Ay cos ϕ − Ax sin ϕ) .
156
Solution des exercices
3.
pr =
∂L
= m ṙ + qAr ,
∂ ṙ
pϕ =
∂L
= m r 2 ϕ̇ + qAϕ ,
∂ ϕ̇
pz =
∂L
= m ż + qAz .
∂ ż
4. On obtient
H(pr , pϕ , pz , r, ϕ, z) = (m ṙ+q Ar )ṙ+(m r 2 ϕ̇+q Aϕ ) ϕ̇+(m ż+q Az )ż−L =
=
1
1
1
(pr − q Ar )2 +
(pϕ − q Aϕ )2 +
(pz − q Az )2 .
2
2m
2mr
2m
5. Dans ces conditions le hamiltonien ne dépend pas de ϕ ni de z . On
déduit des équations de mouvement de Hamilton que pϕ et pz se
conservent.
6. Le hamiltonien se simplifie pour Ar = 0 , Az = 0 :
H(pr , pϕ , pz , r, ϕ, z) =
p2r
1
1 2
2
+
(p
−
q
A
)
+
p .
ϕ
ϕ
2m 2mr 2
2m z
Pour pϕ = 0 , pz = 0 les équations du mouvement de Hamilton
peuvent s’écrire
ϕ̇ = −
q Aϕ
,
mr 2
ṙ =
pr
,
m
ṗr = −
∂ (q Aϕ )2
.
∂r 2mr 2
7. Les deux dernières relations donnent
r̈ = −
∂ (q Aϕ )2
.
∂r 2m2 r 2
Les conditions se résument donc à
∂ A2ϕ
|r=r0 = 0 et pr (0) = 0
∂r r 2
pour une trajectoire circulaire de rayon r0 .
8. On vérifie que
2
∂ Aϕ
|
2
∂r r r=a
= 0 , et on trouve
ϕ̇(t) =
−q ν t
.
ma
157
Solution des exercices
9. D’après (4.8) on a H =
H =
r
q
~ 2 ce qui se traduit en
m2 c4 + c2 (~p − q A)
m2 c4 + c2 [p2r +
1
(pϕ − qAϕ )2 + p2z ]
r2
en coordonnées cylindriques. Le hamiltonien relativiste ne dépend ni
de ϕ ni de z , pϕ et pz sont donc toujours conservées. Les équations
de Hamilton prennent la forme
ϕ̇ =
c2 1
(pϕ − qAϕ ) ,
H r2
ṙ =
c2
pr ,
H
ṗr = −
c2 ∂ 1
( 2 (pϕ − qAϕ )2 ) .
H ∂r r
10. On obtient
H(t) =
On a
11. On a
p
m2 c4 + c2 [p2r + q 2 {µ2 (r − a)2 + ν 2 t2 }] .
dH0
∂H0 ∂H(t)
∂H0 ∂H(t)
= {H0 , H(t)} =
−
dt
∂r ∂pr
∂pr ∂r
4
c
q 2 µ2 (r − a) pr − pr q 2 µ2 (r − a) = 0 .
=
H0 H
c2 q
1
(−
ϕ̇ = √
H0 + b2 t2
p
µ2 (r − a)2 + ν 2 t2
),
r
ṙ = √
c2 p r
,
H0 + b2 t2
q 2 µ2 c2 (r − a)
ṗr = − √
.
H0 + b2 t2
On en déduit dans l’approximation indiquée
dϕ
νt
= −q
,
ds
a
dr
= pr ,
ds
dpr
= − q 2 µ2 (r − a) .
ds
La solution pour r(s) donne un mouvement harmonique autour de a :
r(s) = a + δr sin ωs ,
ω = qµ ,
|δr| ≪ a (par hypothèse) .
C’est un mouvement oscillatoire autour de la trajectoire circulaire. Pour
obtenir de petites osillations il faut injecter les particules avec pr ≃ 0 ,
donc en direction tangentielle.
158
Solution des exercices
12. On trouve
c2
s(t) = √
H0
Z
t
0
et donc
dt′
q
1+
b2 ′2
t
H0
=
b
c
arsh( √ t)
qν
H0
√
H0
qν
sinh( s) .
b
c
En négligeant les petites oscillations la vitesse s’écrit
t(s) =
v(t) = a
dϕ
= a
dt
dϕ
ds
dt
ds
.
Ceci donne une vitesse inférieure à c :
v(t) = −c tanh(
t
qν
s) = −c q
c
t2 +
H0
b2
.
Le premier bétatron a été construit en 1940 à l’université d’Illinois par D.W.
Kerst. L’énergie des électrons a rapidement dépassé les 10 MeV. Il a d’abord
été un outil de la recherche fondamentale. Plus tard et jusqu’à présent les
bétratrons ont servi de source d’électrons et de rayons X pour le traitement
des cancers.
4.10 Les points de Lagrange
1. Il s’agit d’un mouvement keplérien. L’invariance par rotations limite le
mouvement au plan perpendiculaire au moment cinétique conservé.
2. En égalisant les deux forces on obtient M1 ω 2r1 = GMR12M2 , M2 ω 2 r2 =
GM1 M2
2
1
. On a aussi r1 + r2 = R , et r1 = M
R , r2 = M
R par définition
R2
M
M
GM
2
du centre de masse. D’où ω = R3 .
3. En vue de l’égalité des masses gravitationnelle et inertielle, la masse
de l’astéroïde apparaît comme facteur multiplicatif des deux côtés de
l’équation du mouvement et ne joue donc aucun rôle.
Remarque : ceci n’est vrai que dans l’approximation considérée où l’on
néglige l’influence de l’astéroïde sur les deux astres de façon que les
positions des deux astres sont données indépendamment de l’astéroïde.
159
Solution des exercices
4. La force exercée par les astres est somme de deux vecteurs dirigés de la
position de l’astéroïde vers l’un ou l’autre des astres. Le vecteur force est
donc dans le plan du mouvement. Par conséquent la dérivée temporelle
du vecteur impulsion est dans ce plan, et le vecteur impulsion reste
alors dans ce plan. Ensuite le même argument s’applique au vecteur
position.
5. Il s’agit de décrire le mouvement non-relativiste d’une particule dans
un potentiel gravitationnel qui s’obtient en fonction des positions des
deux autres particules. Le lagrangien/le hamiltonien s’obtiennent donc
de la façon usuelle comme différence/somme des énergies cinétique et
potentielle. On obtient donc
L̃ =
GmM2
GmM1
GmM2
GmM1
p~˜ 2
m ˜2
+
, H̃ =
−
−
.
~v +
˜
˜
˜
˜
˜
˜
˜
2
2m |~r − ~r1 (t)| |~r − ~r˜2 (t)|
|~r − ~r1 (t)| |~r − ~r2 (t)|
Ici ~v˜ = (ṽx , ṽy ) , ~p˜ = (p̃x , p̃y ) = m~v˜ , ~r˜ = (x̃, ỹ) ~r˜1 = (x̃1 , ỹ1 ) ,
~r˜2 = (x̃2 , ỹ2 ) .
L̃ et H̃ ne décrivent que la dynamique de l’astéroïde. Celle-ci dépend
des positions des astres ~r˜1 (t) et ~r˜2 (t) , L̃ et H̃ dépendent donc explicitement du temps.
6. En effet le lagrangien dans le repère tournant reste le même - par universalité du principe de moindre action ; cependant il faut remplacer la
variable ~v˜ par ~v + ~ω ×~r . En trouve alors pour le moment conjugué dans
le repère tournant p~ = m(~v + ~ω × ~r). En exprimant H qui s’obtient du
lagrangien par transformation de Legendre, on trouve (4.104). On peut
résumer le résultat par le fait que le hamiltonien dans le repère tournant
s’obtient de celui dans le référentiel inertiel par la transformation
~ ,
H = H̃ − ~ω · L
~ est le moment cinétique du point matériel (de l’astéroïde).
où L
7. Dans le référentiel tournant le hamiltonien H ne dépend plus explicitement du temps, vu que ~r1 et ~r2 sont constants par choix du référentiel.
Par conséquent H est conservé. Cette loi de conservation restreint l’espace des phases accessible à une variété tri-dimensionnelle. Ceci autorise toujours des comportements chaotiques qui ne sont a priori exclus
qu’en deux dimensions (d’après le théorème de Poincaré-Bendixson).
160
Solution des exercices
8. On obtient de (4.104)
ẋ =
px
+ ωy ,
m
ṗx = ω py − (x − x1 )
ẏ =
py
− ωx ,
m
GmM2
GmM1
−
(x
−
x
)
,
2
|~r − ~r1 |3
|~r − ~r2 |3
ṗy = −ω px − (y − y1 )
GmM1
GmM2
− (y − y2 )
.
3
|~r − ~r1 |
|~r − ~r2 |3
9. Le système d’équations précédent donne :
ẋ = 0 ⇒ px = −mωy ,
ṗx = 0 ⇒ py =
ẏ = 0 ⇒ py = mωx ,
GmM1 x − x1
GmM2 x − x2
+
,
3
ω |~r − ~r1 |
ω |~r − ~r2 |3
ṗy = 0 ⇒ px = −
GmM2 y − y2
GmM1 y − y1
−
.
3
ω |~r − ~r1 |
ω |~r − ~r2 |3
(113)
(114)
Si les trois objets se trouvent sur une droite, et avec notre choix de
l’axe des x , on trouve comme solution
y = 0 ⇒ px = 0 ,
et py = mωx implique
x =
=
GM2 x − x2
GM1 x − x1
+
2
3
ω |~r − ~r1 |
ω 2 |~r − ~r2 |3
R3 M1 x − x1
R3 M2 x − x2
+
,
M |x − x1 |3
M |x − x2 |3
(115)
où nous avons reporté la valeur de ω . Graphiquement on voit facilement
que cette équation possède 3 solutions différentes, voir Fig. 8.
Pour chacune de ces solutions, l’astéroïde suit le mouvement circulaire
des deux astres, tout en restant sur la droite les reliant et à distance
constante de chacun d’eux.
10. Pour y 6= 0 nous avons à satisfaire l’équation (115) et l’équation analogue provenant de (114)
y =
R3 M1
y
R3 M2
y
+
.
3
M |~r − ~r1 |
M |~r − ~r2 |3
(116)
161
Solution des exercices
f(x)
x1
x2
x
Figure 8 – Les 3 points de Lagrange linéaires s’obtiennent par intersection de la
courbe donnée par le côté droit de (115) avec la diagonale f (x) = x .
En reportant (116) dans (115) on obtient après simplification
0 =
M2 x2 R3 M1 x1
+
.
M |~r − ~r1 |3
|~r − ~r2 |3
(117)
Vu que M1 x1 + M2 x2 = 0 (définition du c.d.m.) ceci implique
1
1
=
⇒ |~r − ~r1 |2 = |~r − ~r2 |2 .
3
|~r − ~r1 |
|~r − ~r2 |3
(118)
R
.
2
(119)
On a |~r − ~ri |2 = (x − xi )2 + y 2 , et on en tire donc
x − x1 = ±(x − x2 ) ⇒ x =
x1 + x2
,
2
|x − xi | =
La relation (116) donne alors
2
2
(x − xi ) + y = R
2
⇒ y=±
√
3
R
2
(120)
d’où
|~r − ~r1 | = |~r − ~r2 | = |~r1 − ~r2 | ,
(121)
ce qui prouve que les deux configurations (119), (120) des trois corps
correspondent bien à un triangle équilatéral.
162
Solution des exercices
11. Une fois la matrice M diagonalisée, on obtient des solutions du système
d’équations du type
fi (t) = eλi t fi (0) ,
où les fi (t) sont des combinaisons linéaires des quantités δx(t), δy(t),
δpx (t) , δpy (t) . Pour rester proche des valeurs d’équilibre il faut donc
que la partie réelle de λi satisfasse à la condition
Reλi ≤ 0 .
pour toutes les valeurs propres λi .
12. a) s’explique par l’instabilité de L1 à L3 .
b) est une conséquence de la stabilité de L4 , L5 .
c) un satellite positionné sur un point de Lagrange demande moins
d’approvisionnement en énergie que si il se trouve sur un endroit où il
n’y a pas de compensation des forces. L’instablilité est moins gênante
pour un satellite, vu qu’il est possible de corriger sa position à partir
de la Terre. Le point L2 est beaucoup plus proche que L3 . Par rapport
à L1 il a l’avantage d’être écranté du Soleil par la Terre.
d) Application numérique : L’équation (115) réécrite en unités de R
donne pour le système Terre-Soleil
x = (1 − ε)
x+ε
x−1+ε
+ε
,
3
|x + ε|
|x − 1 + ε|3
ε = 0, 33 · 10−5 .
(122)
On voit que x ≃ −1 est solution à des corrections d’ordre ε près. La
distance de L3 à la Terre est donc de l’ordre de 3·108km . Pour x proche
de x2 = 1 − ε on pose x = 1 − ε + δ . On obtient alors pour δ
1 − ε + δ = (1 − ε)
1
ε
1+δ
2
±
ε
=
1
−
ε
−
2δ
+
O(δ
,
εδ)
±
(123)
|1 + δ|3
δ2
δ2
en fonction du signe de δ , et donc
δ ≃ ±(ε/3)1/3 ,
ce qui donne une distance de l’ordre de 1, 5 · 106 km , c.a.d. 1% de la
distance Terre-Soleil.
Bibliographie
[1] Jean-Louis Basdevant, Le principe de moindre action et les
principes variationnels en physique, Editions Vuibert (2010).
[2] David Langlois, Introduction à la Relativité, Ecole polytechnique (2009).
[3] André Rougé, Introduction à la Relativité, Editions de l’Ecole
polytechnique (2004).
[4] Arthur Koestler, The Act of Creation, Hutchinson & Co.
(1964).
[5] R.P. Feynman, R.B. Leighton et M. Sands, The Feynman
Lectures on Physics, Addison-Wesley (1964).
[6] Wolfgang Yourgrau et Stanley Mandelstam, Variational
Principles in Dynamics and Quantum Theory, Dover Publications (1979).
[7] Jean-Pierre Bourguignon, Calcul Variationnel, Editions de
l’Ecole Polytechnique (2007).
[8] Erwin Schrödinger, Statistical thermodynamics, Dover Publications (1989).
[9] L. Landau et E. Lifshitz, Mécanique, Editions Mir (1970).
[10] Herbert Goldstein, Charles Poole et John Safko, Classical
Mechanics, Addison Wesley, Boston (2002).
[11] Claude Gignoux et Bernard Silvestre-Brac, Mécanique De la formulation lagrangienne au chaos hamiltonien, EDP
Sciences, Grenoble (2002).
[12] Ian Percival et Derek Richards, Introduction to Dynamics,
Cambridge University Press, (1982).
163
164
Bibliographie
[13] K. Alligood, T. Sauer et J. Yorke CHAOS - An introduction
to dynamical systems, Springer Verlag, Heidelberg (1996).
[14] Max Born et Emil Wolf, Principles of Optics, Pergamon
Press, Oxford (1964).
[15] Albert Messiah, Mécanique quantique, nouvelle édition, Dunod, Paris (1995).
[16] Pierre Fayet, Introduction à la théorie relativiste des champs,
Ecole Polytechnique (2011).
Index
action, 15, 40, 42, 113
action réduite, 116
approximation BKW, 123
approximation eikonale, 121
approximation semi-classique, 123
attracteur, 110-112
théorème de, 106
eikonal, 121
équation de, 121
Einstein, A., 25, 41
énergie, 53, 97
énergie-impulsion, 75-80
équation des champs, 86-88
brachistochrone, 65
équations canoniques, 95-96
bulle de savon, 63
équations d’Euler-Lagrange, 47, 48, 78,
Buridan, Jean de, 17
84-85
généralisées,
84-85
calcul variationnel, 45-50
équations de Maxwell, 78, 79, 87
caténoïde, 64
champ électromagnétique, 76-81, 85- espace courbe, 41
espace des phases, 98-107
88
Euler, L., 30, 40
champ scalaire, 85
chaos, 107-112
Fermat, P. de, 14, 31-34
commutateur, 106
Fermat,
constante du mouvement, 99
principe de, 14, 31-34
corde pesante, 58
flot,
94, 105, 107
corde vibrante, 82
flot hamiltonien, 105, 107
crochets de Poisson, 98-105
force de Lorentz, 71
cyclique,
formalisme canonique, 95-97
variable, 52, 103-104
densité de lagrangien, 83
Descartes, R., 14, 31, 32
Descartes-Snell,
loi de, 32, 34
Dirac, P.A.M., 24, 94, 106
Ehrenfest
Galilée, G., 29
Galilée,
transformation de, 48
gamme pythagoricienne, 8-9
Héron d’Alexandrie, 16
Hamilton, W.R., 20, 42, 93, 95, 122
165
166
Hamilton-Jacobi,
équation de, 113, 115-120
hamiltonien, 96
Heisenberg, W. 106-107
Huygens,
principe de, 24, 122
identité de Jacobi, 98
impetus, 17-18
impulsion généralisée, 51-52
intégrale première, 51, 53, 95
interaction minimale, 77
invariance de jauge, 80, 88
invariance de Lorentz, 74, 75, 77
invariant de Lorentz, 74, 75, 77
INDEX
Maupertuis,
principe de, 15, 30, 34, 40-41, 50,
117
Maxwell,
équations de, 78, 79, 87
mirage, 36-40
inférieur, 36
supérieur, 37
modèles économiques, 22
moment cinétique, 54-55
et rotations, 54-55
moment conjugué, 51-52
multiplicateurs de Lagrange, 56-57
Newton, I., 22, 30
Jacobi,
identité de, 98
théorème de, 119
optimisation sous contraintes, 16, 29
optique géométrique
et optique ondulatoire, 120-122
Klein, Felix, 20, 122
paradoxe des jumeaux, 74
particule relativiste, 74-81
Philopon, Jean, 17
Poincaré, H., 23, 94
Poincaré,
théorème de Poincaré-Bendixson,
111
Poisson, S. D., 94
Poisson,
crochets de, 98-104
loi de, 62
théorème de, 99
principe
de moindre action, 15, 20, 30, 42,
46
de moindre temps, 14, 21, 31-34
du meilleur, 15
variationnel, 15-18
d’économie naturelle, 29, 33
Lagrange,
fonction de, 42
Lagrange, J.-L., 20, 30, 42, 46
lagrangien, 42, 48-51
densité de, 83
Laplace, P. S. de, 93
Legendre,
transformation de, 96
Leibniz, G. W., 14
Liouville
théorème de,104-105
loi de conservation, 51-55
loi de Snell-Descartes, 31, 34
Lorenz,
attracteur de, 109-112
Maupertuis, P. L. de, 15, 30, 40
INDEX
de Fermat, 14, 31-34, 122
de Maupertuis, 15, 30, 34, 40-41,
50, 117
quadri-vecteur, énergie-impulsion, 7580
quadri-vitesse, 80
réfraction, 32-34
rayons courbes, 35-36, 57-58
relations de commutation canoniques,
106
relativité générale, 25, 41
sauvetage en mer, 35
Schrödinger
équation de, 123
symétrie dynamique, 55, 103
systèmes conservatifs, 41
systèmes dynamiques, 107-112
temps propre, 74
théorème d’Ehrenfest, 106
théorème de Liouville, 104-105
théorème de Poincaré-Bendixson, 111
théorème de Poisson, 99
théorie des champs, 81-88
Titius Bode, loi de, 12-13
transformation canonique, 100-104, 124
transformation ponctuelle, 100
transformations de jauge, 80
translation dans le temps, 53
translations dans l’espace, 53-54
variable cyclique, 52, 103-104
variables d’état, 42
variables angle-action, 102-103
variables canoniquement conjuguées,
102-103
167
Téléchargement