promotion 2011 Année 2 Enseignement diversifié 1 PHY431 Principes variationnels et Mécanique analytique Christoph Kopper Édition 2012 1 Table des matières Préface 2012 . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 Avant-propos 1 L’esthétique et la physique . . . . . . . . . . . . . . . . . . 2 La métaphysique et la science . . . . . . . . . . . . . . . . 3 Les nombres, la musique et la physique quantique . . . . . 4 La philosophie des lumières et le principe du meilleur . . . 5 Le principe de Fermat et ses conséquences . . . . . . . . . 6 Les principes variationnels . . . . . . . . . . . . . . . . . . 7 La période moderne, de Lagrange à Einstein et à Feynman 1 Principes variationnels 1 Principe de Fermat . . . . 1.1 Réfraction . . . . . 1.2 Rayons courbes . . 1.3 Mirages . . . . . . 2 Principe de Maupertuis . . 3 Principe de moindre action 2 . . . . . . . 3 . . . . . . . 5 5 7 8 13 14 15 19 . . . . . . . . . . . . . . . . . . . . . . . . 29 31 31 35 37 40 42 Mécanique analytique et calcul variationnel 1 Le calcul variationnel d’Euler et Lagrange . . . . . . . . 2 Le lagrangien . . . . . . . . . . . . . . . . . . . . . . . . 3 Invariances et lois de conservation . . . . . . . . . . . . . 3.1 Moments conjugués, impulsions généralisées . . . 3.2 Changement de coordonnées, variables cycliques. . 3.3 Energie et translation dans le temps . . . . . . . . 3.4 Impulsion et translations dans l’espace . . . . . . 3.5 Moment cinétique et rotations . . . . . . . . . . . 3.6 Symétries dynamiques . . . . . . . . . . . . . . . 4 Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . 5 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Rayons courbes . . . . . . . . . . . . . . . . . . . 5.2 Forme d’une corde pesante . . . . . . . . . . . . . 5.3 Lois de Kirchhoff . . . . . . . . . . . . . . . . . . 5.4 Potentiel électrostatique . . . . . . . . . . . . . . 5.5 Bulles de savon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 46 48 51 52 52 53 54 54 55 56 58 58 59 62 63 64 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3 Théorie lagrangienne de l’électromagnétisme 1 Lagrangien d’une particule relativiste . . . . . . . . . . . 1.1 Particule libre . . . . . . . . . . . . . . . . . . . . . 1.2 Impulsion et énergie d’une particule libre . . . . . . 1.3 Particule chargée dans un champ électromagnétique 2 Théorie lagrangienne des champs . . . . . . . . . . . . . . 2.1 Corde vibrante . . . . . . . . . . . . . . . . . . . . 2.2 Equations d’Euler-Lagrange généralisées . . . . . . 2.3 Champ électromagnétique . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 74 74 75 76 81 82 84 86 89 4 Formalisme canonique de Hamilton 1 Equations canoniques . . . . . . . . . . . . . . . . . . . . . . . 2 Crochets de Poisson ; Espace des phases . . . . . . . . . . . . . 2.1 Evolution temporelle, constantes du mouvement . . . . 2.2 Transformations canoniques . . . . . . . . . . . . . . . 2.3 Théorème de Liouville . . . . . . . . . . . . . . . . . . 2.4 Flot hamiltonien . . . . . . . . . . . . . . . . . . . . . 2.5 Mécanique analytique et mécanique quantique . . . . . 3 Systèmes dynamiques . . . . . . . . . . . . . . . . . . . . . . . 3.1 Poincaré et le chaos dans le système solaire . . . . . . . 3.2 L’effet aile de papillon ; l’attracteur de Lorenz . . . . . 4 L’action et l’équation de Hamilton-Jacobi . . . . . . . . . . . . 4.1 L’action comme fonction des coordonnées et du temps . 4.2 Equation de Hamilton-Jacobi . . . . . . . . . . . . . . 4.3 Limite géométrique de l’optique ondulatoire. . . . . . . 4.4 Approximation semi-classique en mécanique quantique. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 95 98 99 100 104 106 106 107 108 110 113 113 115 120 123 124 Solution des exercices 138 Bibliographie 163 Index 165 . . . . . . . . . 3 Préface au Cours 2012 Les principes variationnels et la mécanique analytique sont enseignés à l’Ecole Polytechnique depuis la réforme X 2000 dans le cadre du cours PHY 431. Parmi les neuf blocs de ce cours trois blocs ont été dédiés à ce sujet. JeanLouis Basdevant, qui est le fondateur de cet enseignement à l’Ecole, les a enseignés trois fois de suite. Il a élaboré un cours original dont la dernière version écrite a paru aux éditions Vuibert [1]. Ce polycopié se base sur celui de Jean-Louis Basdevant, qui a mis à ma disposition les sources de son manuscrit. Il a été réaménagé à plusieurs reprises dans le but de le faire suivre les évolutions du cours enseigné. Nous commençons par décrire les origines des principes variationnels et en donner quelques exemples typiques et classiques. Ensuite nous passsons à la mécanique analytique de Lagrange, qui nous sert de cadre pour l’analyse de systèmes simples en mécanique des points, mais aussi pour la théorie du champ électromagnétique. Le dernier chapitre est dédié au formalisme canonique de Hamilton, qui donne accès à une approche geométrique aux systèmes dynamiques, là où les méthodes de solution explicites ont trouvé leurs limites. Dans le cours de Jean-Louis Basdevant se trouvent en outre un exposé sur la description de l’équilibre thermodynamique en physique statistique, un chapitre sur le mouvement dans un espace courbe avec applications en relativité générale et illustrations en l’astrophysique, et un chapitre sur les intégrales des chemins de Feynman. Nous espérons que cette première introduction donnera envie au lecteur de consulter l’œuvre plus complet «Le principe de moindre action et les principes variationnels en physique» de Jean-Louis Basdevant. Dans ce but nous reproduisons ici son magnifique avant-propos, chef-d’œuvre dans son genre, même si c’est l’avant-propos du livre [1] et non pas à ce cours. C’est évidemment à Jean-Louis Basdevant que s’adressent mes profonds remerciements pour son soutien constant et indispensable dans la préparation de cet enseignement, qui restera dans les traces qu’il a dessinées. Je voudrais également remercier mes collègues Denis Bernard, Francis Bernardeau, Adel Bilal, Cédric Deffayet, David Langlois, Roland Lehoucq, Marios Petropoulos, André Rougé, Jean-François Roussel, avec qui j’avais le privilège de pouvoir travailler pour ce cours dans une atmosphère toujours amicale et fructueuse. Finalement je remercie Dorian Nogneng (X2010) pour une lecture attentive du manuscrit qui a mené à quelques améliorations du texte. Palaiseau, au mois d’octobre 2012 Christoph Kopper 4 Avant-propos Puisque les mystères nous dépassent, feignons d’en être les organisateurs. Jean Cocteau L’art est indissociable de la métaphysique et de la philosophie. Dans ses Leçons sur l’esthétique, en réponse à la question : « Quel besoin l’homme a-t-il de produire des œuvres d’art ? », Hegel dit que : « Le besoin général d’art est [...] le besoin rationnel qui pousse l’homme à prendre conscience du monde intérieur et extérieur et à en faire un objet dans lequel il se reconnaisse lui-même. » 0.1 L’esthétique et la physique Ce même besoin explique que l’esthétique imprègne aussi profondément la physique. De fait, la beauté d’une théorie a souvent été considérée comme déterminante dans son acceptation. La relativité générale d’Einstein en donne un exemple célèbre. Enoncée en 1916, elle n’a commencé de recevoir ses premières vérifications expérimentales authentiques que 70 ans plus tard. 1 Pourtant, on peut affirmer que personne ne pensait sérieusement que cette théorie pourrait être remise en cause. 2 En effet, comme le dit Landau « [Elle] est vraisemblablement la plus belle des théories physiques existantes. Il est remarquable qu’Einstein l’ait construite par voie purement déductive et que 1. On a coutume de distinguer les vérifications du principe d’équivalence (voir la référence [3], Chapitre 8), comme la déviation des rayons lumineux par le champ gravitationnel, la variation de la marche d’une horloge en fonction de la pesanteur, ou la précession du périhélie des astres, des véritables prévisions de la relativité générale, comme le rayonnement d’ondes gravitationnelles. 2. Ce qui n’est évidemment pas une raison pour renoncer aux vérifications expérimentales. 5 6 Avant-Propos c’est seulement par la suite qu’elle ait été confirmée par des observations astronomiques. » Les éléments de l’esthétique sont de nature diverse. Il y a, bien entendu, la beauté d’une idée en soi, difficile voire impossible à définir de façon générale. Mais deux facteurs sont plus facilement identifiables : la simplicité d’une théorie et sa nature unificatrice. Ces deux facteurs n’ont de sens que parce que la physique s’exprime sous forme mathématique. Nous parlerons ci-dessous de l’archétype qu’est la gamme pythagoricienne, les exemples abondent, bien entendu. A l’issue d’un travail considérable, tant sur le plan observationnel 3 que sur celui du calcul 4 , Kepler parvient à ses célèbres lois sur le mouvement des planètes du système solaire. Découvrir, dans une vision copernicienne du système solaire, que les orbites sont des ellipses, ces courbes pures et légendaires de la géométrie d’Apollonius, Euclide et Archimède, est d’une beauté et d’une simplicité auxquelles Kepler ne peut résister. Il ne peut qu’être amené à concevoir l’univers comme inspiré par une esthétique mathématique qui montre la pureté et l’unité. Il exprime son émotion dans sa phrase : « la nature aime la simplicité » 5 . Ce sera un triomphe et un émerveillement pour Newton que de déduire mathématiquement les lois de Kepler dans le cadre de ses Principia. De même, l’unification de l’électricité et du magnétisme par Ampère, puis celle de l’électromagnétisme et de la lumière par Maxwell est une prodigieuse aventure du 19e siècle qui se poursuivra longtemps. La structure mathématique des équations de Maxwell dévoilera la relativité. L’unification des interactions électro-faibles par Glashow, Weinberg et Salam dans les années 1960 sera saluée comme l’étape suivante de cette aventure exaltante. Elle est à l’origine d’un fabuleux effort qui perdure pour unifier l’ensemble des interactions fondamentales, y compris la gravitation. On y retrouve à chaque étape le souci de l’esthétique comme celui de la simplicité et de l’unité. La simplicité ne signifie pas que les choses deviennent abordables au tout venant, bien au contraire. Cette simplicité vaut dans le langage mathématique. Galilée est le premier à l’énoncer : « La philosophie est écrite dans ce livre immense perpétuellement ouvert devant nos yeux (je veux dire : l’Uni3. La lunette de Galilée ne fut inventée qu’en 1609, plus de dix ans après les travaux de Kepler. 4. Kepler dédia son mémoire Mysterium cosmographicum à Napier, inventeur des logarithmes, sans qui, disait-il, il n’aurait jamais pu mener à bien son entreprise. 5. Natura simplicitatem amat 0.2. LA MÉTAPHYSIQUE ET LA SCIENCE 7 vers), mais on ne peut le comprendre si l’on n’apprend pas d’abord à connaître la langue et les caractères dans lesquels il est écrit. Il est écrit en langue mathématique, et ses caractères sont des triangles, des cercles et d’autres figures géométriques sans l’intermédiaire desquelles il est humainement impossible d’en comprendre un seul mot. » Il est difficile de ne pas rapprocher de ces mots ceux de Léonard de Vinci dans son Traité de la Peinture : « Non mi legga chi non è matematico, nelli mia principi » 6 . La simplicité réside dans la possibilité – mystérieuse – de représenter les phénomènes naturels par des structures mathématiques de plus en plus générales. Si je peux dire que la structure mathématique la plus fondamentale de la mécanique quantique est la première des quatre opérations, l’addition 7 , c’est la conséquence de l’immense effort de synthèse mené par les physiciens et mathématiciens des années 1920-1930. Le principe de superposition, pont aux ânes de celui qui aborde la mécanique quantique, est ce qui heurte le plus l’intuition physique première. Mais si son expression se réduit à peu de choses, cette simplicité ne peut être véritablement savourée qu’au bout d’un long et incontournable parcours mathématique. 0.2 La métaphysique et la science La réflexion philosophique accompagne couramment le progrès scientifique, cela se comprend. Mais il est intéressant de constater que les considérations véritablement métaphysiques ont constamment frôlé, voire épousé, les chemins de la physique. En étudiant la trajectoire de la comète de 1682, et signalée dès 240 avant J.-C., Halley montre que son orbite est elliptique et, appliquant pour la première fois les lois de Newton sur le mouvement, prévoit avec succès sa réapparition pour 1758. Le mouvement céleste, totalement imbriqué dans la notion de temps, le plus mystérieux des concepts physiques 8 hantait les hommes depuis qu’ils observaient le ciel. Avec les lois de Newton, l’homme était devenu capable de prédire l’état du ciel avec parfaite précision ! Newton, émerveillé par cette précision, y avait trouvé une 6. Ne lise pas mes principes qui n’est pas mathématicien. 7. Voir par exemple J-L. Basdevant, La Mécanique quantique, dogme ou humanisme ? Découverte, Revue du Palais de la Découverte, numéro 288, Mai 2001. 8. « Qu’est-ce donc que le temps ? Si personne ne me le demande, je le sais. Si quelqu’un pose la question et que je veuille l’expliquer, je ne sais plus. » Saint Augustin, Les Confessions Livre XI, XIV, 17. 8 Avant-Propos preuve de l’existence de Dieu. Puisque le système était si parfaitement réglé, puisque l’on pouvait prédire l’état futur du ciel, puisque l’on pouvait, par les équations, remonter le temps et retrouver l’état des planètes à n’importe quelle date antérieure, il fallait admettre que le système solaire, comme tout le cosmos, avait été conçu et installé par une puissance supérieure. « L’ordre qui règne dans les choses matérielles indique assez qu’elles ont été créées par une volonté pleine d’intelligence » écrit-il dans son Traité d’Optique. A l’apogée de la découverte d’une théorie physique, il n’est pas inhabituel de voir invoquer une « puissance supérieure ». Ce peut être, comme dans le cas de Newton, un véritable argument théologique. C’est souvent une interrogation par rapport à cet « organisme » structuré que constitue l’ensemble des phénomènes naturels. Kepler et les orbites planétaires en donnent un exemple. On ne peut évidemment pas manquer de rappeler les phrases légendaires d’Einstein, comme « le Seigneur n’est pas méchant, il est subtil » ou « Dieu ne joue pas aux dés ». Toutefois, au delà de ces interrogations ou affirmations, peut-être marquées par la culture judéo-chrétienne, on retrouve en permanence, dans la progression de la physique, une quête métaphysique, une recherche des causes du monde et des principes mêmes de la connaissance. Cette quête se transforme souvent en celle d’une véritable « méta-théorie ». Le nom même de « M-théorie » né depuis 1995 avec la démonstration de l’équivalence de l’ensemble des théories de super-cordes, et qui a provoqué un regain d’intérêt complètement inattendu dans le domaine des interactions fondamentales, est révélateur à cet égard. 0.3 Les nombres, la musique et la physique quantique. On convient de situer la naissance de la physique moderne au 17e siècle avec Galilée. Il lui revient en effet d’avoir posé les deux principes fondateurs de cette science : la méthode expérimentale et la formulation de la théorie dans le langage mathématique. Mais le point de départ de la physique expérimentale et théorique se situe il y a 2500 ans. En effet, le théorème de Pythagore occulte ce qui, au sens de Galilée, constitue la première découverte moderne en physique : la théorie des sons et la gamme musicale. Moderne, car la découverte possède ces deux vertus d’avoir un fondement expérimental et d’être exprimée de 0.3. LES NOMBRES, LA MUSIQUE ET LA PHYSIQUE QUANTIQUE 9 Figure 1 – Sylvano Bussotti, « Pièces de piano pour David Tudor # 4 » extrait de c Casa Ricordi-BMG Ricordi Milan ; tous droits réservés. « Pièces de Chair II », façon mathématique. La musique est le premier art abstrait. Elle fascine parce qu’elle atteint directement l’inconscient. Elle échappe à toute tentative de verbalisation. Hormis les discussion techniques ponctuelles que peuvent entretenir des initiés, on ne raconte pas la musique. L’écriture musicale est un sujet d’émerveillement inépuisable, on en voit un exemple sur la figure 1. On ne peut dater la naissance de cet art, mais il est certain que, très tôt, les humains, dans leurs chants, ont compris l’harmonie. L’octave, qui en est le plus simple exemple, est la découverte étonnante qu’un même son puisse se reproduire à l’aigu comme au grave. La tradition veut que Pythagore, en passant quotidiennement devant l’atelier d’un forgeron, dans son île natale de Samos, 9 ait compris que la hauteur des sons est directement reliée aux dimensions des objets qui les produisent. Il avait remarqué que des barres de longueur différente produisaient des sons différents lorsqu’elles étaient percutées par le marteau du forgeron. Comme le dit Arthur Koestler (réf.[4], chapitres V et VII), « Depuis que 9. Peu importe, à vrai dire, que l’anecdote soit vraie, que ce soit Pythagore lui-même qui ait fait la découverte. Dans tous les cas, on ne peut nier ni la profondeur de l’idée, ni l’observation expérimentale qu’elle provoque, ni la théorie en nombres entiers qu’elle engendre et qui nous est parvenue. 10 Avant-Propos l’âge de bronze avait fait place à l’âge de fer, les martèlements assourdissants avaient été considérés par les mortels ordinaires comme une simple nuisance. Pythagore avait ainsi transformé du bruit en de l’information ». De retour chez lui, il procède à une expérimentation sur des objets musicaux, notamment sur les cordes vibrantes d’une lyre. Il comprend que diviser une corde par un nombre entier appartenant à la tetraktys de la décade, la progression des nombres 1,2,3,4 dont la somme est le nombre « parfait » 10, produit ce que l’on nomme depuis longtemps l’harmonie, à savoir l’octave, la quinte et la quarte. Laissons la parole à Diderot 10 : La musique est un concert de plusieurs discordants. Il ne faut pas borner son idée aux sons seulement. L’objet de l’harmonie est plus général. L’harmonie a ses règles invariables. [...] L’octave, la quinte et la quarte sont les bases de l’arithmétique harmonique. La manière dont Pythagore découvrit les rapports en nombres de ces intervalles de sons marque que ce fut un homme de génie. Il entendit des forgerons qui travaillaient ; les sons de leurs marteaux rendaient l’octave, la quarte et la quinte : il entra dans leur atelier. Il fit peser les marteaux. De retour chez lui, il appliqua aux cordes tendues par des poids l’expérience qu’il avait faite ; et il forma la gamme du genre diatonique, d’où il déduisit ensuite celles des genres chromatique et enharmonique ; et il dit : Il y a trois genres de musique : le diatonique, le chromatique et l’enharmonique. Chacun a son progrès et ses degrés. Le diatonique procède du semi-ton au ton, etc. C’est par le nombre et non par le sens qu’il faut estimer la sublimité de la musique. Etudiez le monocorde. Il y a des chants propres à chaque passion, soit qu’il s’agisse de les tempérer, soit qu’il s’agisse de les exciter. La flûte est molle. Le philosophe prendra la lyre : il en jouera matin et soir. Après une étude que l’on peut imaginer sur les harmoniques d’un son, et sur la façon de les ramener dans l’intervalle d’une même octave en divisant par des puissances de 2, Pythagore parvient à ces gammes, notamment celle qui porte son nom et qui est représentée dans la table ci-dessous. Les nombres désignent ici des rapports de fréquence (les modes grecs étaient énoncés sous la forme descendante en fonction de la longueur). 10. dans l’article Pythagorisme de l’Encyclopédie, édition critique de J. Assézat, Garnier Frères, Paris, 1876. 11 0.3. LES NOMBRES, LA MUSIQUE ET LA PHYSIQUE QUANTIQUE note do ré rapport de fréquence 1 9 8 mi fa sol la si do 81 64 4 3 27 16 243 128 2 3 2 Rapports de fréquences dans la gamme pythagoricienne . Dans cette gamme, les intervalles séparant deux notes voisines ne prennent que deux valeurs : le ton (rapport 9/8) et le demi-ton (rapport 256/243). Pythagore voit une importance particulière à ce que les numérateurs et dénominateurs de ces fractions soient des puissances des éléments de la tetraktys (en l’occurrence de 2 et 3). Pour lui, la gamme ci-dessus a une esthétique infiniment supérieure à celle des autres. Nous devons, en effet, compléter le texte de Diderot par sa dernière phrase : Le mouvement des orbites célestes, qui emporte les sept planètes, forme un concert parfait. Un mérite de Pythagore est, comme le soulignait Aristoxène, d’avoir « élevé l’arithmétique au-dessus des besoins des marchands ». Il a transformé un ensemble de recettes empiriques utilitaires, notamment dans le commerce, en une science démonstrative. Il est probable que c’est à Pythagore lui-même que l’on doit l’affirmation, rapportée par Aristote, selon laquelle toutes choses sont des nombres. Mais, partant de son analyse de l’harmonie musicale, qui se laisse ramener à des nombres entiers, il ne peut résister à l’idée que les nombres sont le principe, la source et la racine de toutes choses. Nous voilà donc dans la métaphysique. Sur ce principe, les pythagoriciens élaborent une arithmologie mystique, en assignant aux nombres des propriétés qualitatives. Ils en arrivent à concevoir et décrire ainsi le cosmos et son origine grâce à l’harmonie des sphères. Le principe d’harmonie envahit ainsi toute la philosophie des pythagoriciens : ils conçoivent l’univers tout entier comme régi par les nombres entiers et par l’harmonie qui en résulte. Pythagore lui-même est l’une des personnalités les plus mystérieuses de l’antiquité. On ne lui connaît aucun écrit. Longtemps, sa pensée ne fut connue que par la tradition orale. Aristote évite le plus souvent de prononcer son nom, pour ne parler que des pythagoriciens, coutume qui subsiste de nos jours. Né au VIe siècle avant J.-C. à Samos en Asie Mineure, il émigra vers l’âge 12 Avant-Propos de quarante à Crotone, en Italie. Il y fonda une communauté (ou secte) à la fois religieuse et politique, qui fut massacrée lors d’une révolte populaire. Il porta les nombres entiers comme un fondement du monde. √ On dit qu’il se suicida le jour où il comprit qu’il venait de démontrer que 2 était irrationnel, qu’il ne pouvait pas s’écrire comme le rapport de deux entiers. Autrement dit, la diagonale d’un carré ne se rapporte pas à son côté par une fraction entière ! La numérologie a joué un rôle considérable dans le développement de la science au XIXe siècle. La loi des proportions définies ramenait les réactions chimiques à des jeux de nombres entiers. La classification et l’évolution des espèces en zoologie et en botanique reposait sur des nombres (pétales, cotylédons, dents, doigts etc.). La phénoménologie des spectres atomiques faisait intervenir des fractions entières. Cette dernière aventure débouchera sur une des percées les plus étonnantes, celle de la formule en nombres entiers de Balmer et son rôle dans la naissance de la mécanique quantique. C’est tout à fait par hasard qu’en 1885, Balmer, professeur de lycée à Bâle et passionné de numérologie, fut mis en présence du spectre de l’hydrogène. Il constata que les longueurs d’onde des raies d’émission de l’hydrogène dans le visible pouvaient se représenter, au millième près, par une formule faisant intervenir des nombres entiers : 1/λ ∝ (n2 − 4)/n2 , n ≥ 3. Bien qu’il ne fût pas physicien, frappé par la simplicité et l’esthétique de cette formule, il écrivit dans son article de 1885 : « Il m’apparaît que l’hydrogène,..., plus que toute autre substance, est destiné à nous ouvrir de nouvelles voies dans la connaissance de la matière, de sa structure et de ses propriétés », paroles prophétiques. En effet, lorsqu’en 1912, Niels Bohr, âgé de 27 ans, travaillait chez Rutherford sur un modèle de l’atome, il ignorait totalement la formule de Balmer, et celles, analogues, de Rydberg pour les alcalins. Quand, par hasard, il apprit l’existence de la formule de Balmer, il ne fallut que quelques semaines à Bohr pour construire son célèbre modèle de l’atome d’hydrogène, un des tournants de la physique quantique. Une énigme amusante demeure : la loi empirique de Titius en 1772, reprise par Bode en 1778. Cette loi établit une relation entre la distance a des planètes au Soleil (plus précisément le grand axe de leur orbite), exprimée en unités astronomiques (1 U.A. = 150 millions de km.), et leur rang n, compté à partir du Soleil. Elle s’écrit : a = 0, 4 + 0, 3 × 2n−1 0.4. LA PHILOSOPHIE DES LUMIÈRES ET LE PRINCIPE DU MEILLEUR 13 où a est la distance planète-Soleil . Pour Mercure, n = −∞ et a=0,4 ; n = 1 pour Vénus ; n = 2 pour la Terre ; n = 3 pour Mars ; n = 5 pour Jupiter. La « lacune » observée pour n = 4 a permis la découverte de la ceinture des astéroïdes en incitant les astronomes à rechercher une planète à la distance de 2,8 U.A. La loi de Titius-Bode, assez exacte jusqu’à Uranus devient inexacte pour des distances plus grandes (elle donne a=77,2 U.A. pour Pluton dont la distance réelle est de 39,2 U.A.). On spécule actuellement sur le fait qu’elle soit ou non valable dans les systèmes planétaires extra-solaires découverts ces dernières années. Aucun calcul dynamique n’a jamais été en mesure de la retrouver par la théorie. 0.4 La philosophie des lumières et le principe du meilleur La notion d’équilibre était chère aux penseurs du 18e siècle. Citons, ne serait-ce que par sa consonnance d’actualité, une phrase de Montesquieu dans De l’esprit des lois : « Dans toute magistrature, il faut compenser la grandeur de la puissance par la brièveté de sa durée ». Avec la philosophie de Leibniz, (1646-1716) on voit se dessiner une reconnaissance de conditions optimales dans la nature. Retournons vers Diderot et l’article Leibnizianisme dans l’Encyclopédie. Il avait encore sur la physique générale une idée particulière : c’est que Dieu a fait avec la plus grande économie possible ce qu’il y avait de plus parfait et de meilleur ; il est le fondateur de l’optimisme, ou de ce système qui semble faire de Dieu un automate dans ses décrets et dans ses actions, et ramener sous un autre nom et sous une forme spirituelle le fatum des Anciens, ou cette nécessité aux choses d’être ce qu’elles sont. Cependant, comme il y a une infinité de combinaisons et de mondes possibles dans les idées de Dieu, et que de ces mondes il n’en peut exister qu’un, il faut qu’il y ait une certaine raison suffisante de son choix : or cette raison ne peut être que dans le différent degré de perfection ; d’où il s’ensuit que le monde qui est, est le plus parfait. Dieu l’a choisi dans sa sagesse, connu dans sa bonté, produit dans la plénitude de sa puissance. Dans ses Nouveaux essais sur l’entendement humain Leibniz écrit : « Mon système prend le meilleur de tous côtés ». Chez lui, Dieu est conçu comme un mathématicien. Nous revoilà dans la métaphysique. 14 Avant-Propos Il faut, bien entendu, tempérer cette impression d’enthousiasme. Il n’y avait unanimité pas plus sur Leibniz que sur tout autre penseur. Voltaire dans Candide, se complaît à ridiculiser les idées de Leibniz : « Tout est pour le mieux dans le meilleur des mondes ». Il est démontré, disait-il, que les choses ne peuvent être autrement : car tout étant fait pour une fin, tout est nécessaire pour la meilleure fin. Remarquez bien que les nez ont été faits pour porter des lunettes. (Chap. 1). Pangloss les consola, en les assurant que les choses ne pouvaient être autrement : « Car, dit-il, tout ceci est ce qu’il y a de mieux ; car s’il y a un volcan à Lisbonne, il ne pouvait être ailleurs ; car il est impossible que les choses ne soient pas où elles sont ; car tout est bien. » (Chap. 4). 0.5 Le principe de Fermat et ses conséquences Le coup de tonnerre scientifique, c’est-à-dire la formalisation mathématique de telles idées, nous est d’abord venue de Pierre de Fermat (1601-1665), comme nous le verrons au chapitre 1. L’idée fondatrice est le principe de l’optique géométrique qui porte son nom et qui est un principe de temps minimum. De fait, tout a démarré vers 1637 dans une vive critique adressée à Descartes par Fermat à propos de la notion de démonstration. L’irritation de Fermat faisait suite à la publication de la Dioptrique dans le Discours de la Méthode. Fermat, magistrat toulousain, était mathématicien, mais pas physicien. Il s’intéressait cependant à la structure des lois physiques 11 et notamment aux lois de l’optique. Le manque de rigueur de la « pseudo-démonstration » de Descartes, irritait Fermat. Celui-ci était convaincu que l’on pouvait faire les choses correctement : « Il me semble qu’un peu de géométrie pourra nous tirer d’affaire ». Quand il parvint à démontrer géométriquement la loi de la réfraction n1 sin i1 = n2 sin i2 , Fermat fut littéralement fasciné : Le fruit de mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux qui fût jamais. Car [...] j’ai trouvé que mon principe donnait justement et précisément la même proportion des réfractions que M. Descartes a établie. A la fin de 1661, Fermat écrivit son principe de moindre temps, qui déclencha tout. 11. Il avait notamment entretenu une correspondance avec Etienne Pascal, père de Blaise, et Roberval sur l’équilibre mécanique. 0.6. LES PRINCIPES VARIATIONNELS 15 En 1744, Maupertuis énonça pour la première fois le principe de la moindre quantité d’action pour la mécanique. Pierre-Louis Moreau de Maupertuis (1698-1759) avait introduit en 1730 les idées de Newton en France. Même si l’énoncé et la justification proposés initialement par Maupertuis sont confus, il s’agit d’une date historique dans l’évolution des idées en physique et, à l’époque, dans la philosophie. Poursuivant les travaux de Fermat, Maupertuis comprit que, dans des conditions bien déterminées, les équations de Newton sont équivalentes au fait qu’une quantité, qu’il nomma l’action, soit minimale. Selon ses propre termes : « L’Action est proportionnelle au produit de la masse par la vitesse et par l’espace. Maintenant, voici ce principe, si sage, si digne de l’être suprême : Lorsqu’il arrive quelque changement dans la Nature, la quantité d’Action employée pour ce changement est toujours la plus petite qu’il soit possible. » Pour une particule de masse m, de vitesse v, l’action de Maupertuis est donc le produit de trois facteurs, la masse, la vitesse, et la distance parcourue, ou encore la circulation de la quantité de mouvement le long de la trajectoire : R A = mv dl. La formulation et la démonstration du principe de Maupertuis furent données peu après par Euler, son ami. Ces principes eurent un grand retentissement au XVIIIe siècle. Que les lois de la nature puissent se déduire de principes d’optimisation, c’est-àdire d’équilibre entre causes en conflit, ne pouvait que frapper les esprits au siècle des lumières. Ce Principe d’économie naturelle fascinait. Il réalisait le meilleur accord entre différentes lois de la nature qui semblaient en opposition, voire incompatibles. On le rattachait volontiers au principe du « meilleur » de Leibniz. 0.6 Les principes variationnels Les principes variationnels sont la forme mathématique du superlatif. Cette formulation se fait en demandant que la valeur d’une quantité typique du système, soit optimale pour la performance effectivement réalisée par le système par rapport à ce qu’elle vaudrait si l’on imaginait une performance différente. Dans une certaine mesure, les principes variationnels, par leur universalité dans le monde des choses, peuvent apparaître comme une « méta-théorie » générale de la physique, voire, un jour peut-être, des autres sciences naturelles comme la biologie, la psychologie ou les phénomènes sociaux. Ils jouent un 16 Avant-Propos rôle en économie. La forme première d’une théorie physique explique un phénomène par une loi locale. Telles sont les lois de la dynamique de Newton, les lois de Snell-Descartes, et les lois différentielles de l’électromagnétisme ou de la thermodynamique. Une fois la première pierre de la théorie mise à jour, et après les premières exploitations de la découverte, on en recherche les principes sous-jacents et leurs liens avec d’autres schémas. Les « Principes variationnels » permettent d’exprimer les lois physiques sous une forme globale. Cette forme permet, bien entendu, de retrouver les lois locales, mais on découvre qu’elle est plus riche et puissante. Elle permet de dégager les principes fondamentaux des lois qu’elle manipule. Cela donne une vision plus féconde au plan des fondements comme à celui des applications. On retrace cette façon de concevoir les processus et structures physiques chez les mathématiciens et philosophes grecs. Les Grecs caractérisaient un segment de droite comme la ligne de plus petite longueur joignant ses extrémités. Héron d’Alexandrie (au 1er siècle avant notre ère) avait démontré que l’égalité des angles d’incidence et de réflexion en optique géométrique se ramène au fait que la longueur du chemin parcouru par la lumière entre la source et l’oeil de l’observateur est la plus courte possible. Dans la même ligne de pensée, les Aristotéliciens pensaient pouvoir « justifier » que les orbites célestes soient circulaires par le fait qu’à périmètre donné, de toutes les courbes planes fermées, le cercle est celle qui entoure l’aire la plus grande (problème dit de l’isopérimètre). 12 Dire que la ligne droite est le chemin le plus court entre deux points ou que le cercle est la ligne la plus courte qui entoure une aire plane donnée sont des façons simples de définir ces êtres géométriques. De la même façon, en physique, dire que le courant électrique se distribue dans un réseau de façon telle que la puissance convertie en chaleur est la plus petite possible est une description de la circulation directe du courant qui recouvre quantité de cas particuliers sans faire usage de mathématiques compliquées (bien entendu, les calculs réapparaissent dès que l’on applique le principe à un cas particulier). La proposition qu’un système physique agit (ou évolue) de façon telle qu’une certaine fonction qui lui est reliée soit minimum ou maximum, est souvent le point de départ de la recherche théorique 12. La légende dit que Didon, lorsqu’elle fonda Carthage, avait reçu pour condition que sa ville tienne à l’intérieur d’une peau de taureau. Elle découpa des fines lanières dans la peau de façon à en faire un énorme cercle. 0.6. LES PRINCIPES VARIATIONNELS 17 et de l’expression ultime des relations entre les faits physiques. Ainsi, les principes variationnels présentent les phénomènes naturels comme des problèmes d’optimisation sous contraintes. Ils sont présents dans tous les domaines de la physique (on pourra lire à ce propos les chapitres I,26 et II,19 du cours de Feynman réf.[5] et le livre de Yourgrau et Mandelstam réf.[6]). En mécanique, première des sciences physiques si l’on y inclut l’acoustique de Pythagore, on reconnaît que la grande percée physique et philosophique qui mène aux idées actuelles provient de la remise en cause des idées d’Aristote sur le mouvement 13 . Pour expliquer le mouvement et son évolution, Aristote peuplait l’espace de moteurs. Jean Philopon, philosophe et grammairien grec (490-566) fut le premier à réfuter les conceptions aristotéliciennes du mouvement. Au travers d’une série passionnante d’observations et de leur analyse critique, relevons deux questions d’une étonnante modernité. Lorsque deux corps en mouvement entrent en collision, leur trajectoire est déviée ; comment se fait-il que s’ils se frôlent sans se toucher, leur trajectoire ne soit pas affectée ? Autrement dit, comment ces « moteurs », qui remplissent le milieu ambiant, peuvent-ils agir de façon discontinue et imprévisible ? Par ailleurs, pourquoi est-il plus facile de lancer un objet léger plus haut qu’un objet lourd ? Philoppon entrevoyait qu’un élan est donné à l’objet lancé par celui qui le lance. Il fut suivi 800 ans plus tard par Jean de Buridan (1300-1358). Comme Philopon, Buridan avait une vision du mouvement comme résultant d’un équilibre entre des causes en conflit. Ce cadre de pensée est la première conception moderne de la mécanique. Buridan, Recteur de l’Université de Paris de 1328 à 1340 était un logicien commentateur d’Aristote. On lui doit le concept de base, celui « d’impetus » ou d’élan comme source du mouvement, en opposition avec les « moteurs » dont Aristote peuplait l’espace. Pour Buridan, la nature du mouvement résulte de la mise en oeuvre d’un ensemble d’impetus et de leurs conflits, les lois du mouvement résultant d’une optimisation de cet ensemble de conflits. Buridan avait, dans la même ligne de pensée, donné un argument célèbre sur le problème du libre arbitre. Un âne affamé est à égale distance de deux tas de foin, personne, même pas Dieu ne peut savoir celui qu’il choisira. Il fallait du courage, de l’autorité et de l’habileté pour dire cela à la Sorbonne à cette époque. En balistique au XVIe siècle les artilleurs calculaient le mouvement des 13. On pourra se référer à l’article de Luca Bianchi La flèche d’Aristote : la physique du mouvement, page 44, Dossier Pour la Science, octobre 2002 18 Avant-Propos Figure 2 – Extrait d’un manuel d’artillerie polonais Ars Magnae Artilleriae - Pars prima : Dell’Aqua Praxis, XVIe siècle : exemples de tirs. (Il est permis d’y voir les prémisses des collisionneurs de particules de la fin du XXe siècle.) Archives de Casimir Siemienowicz, général d’artillerie de la couronne polonaise et lithuanienne c Richard Orli 2001. boulets de canon en utilisant le concept d’impetus de Buridan, comme on peut le voir sur la figure 2. Dans le mouvement du projectile, trois phases étaient distinguées, qui sont représentées sur la figure 3. Lors de la première, appelée mouvement violent, la trajectoire est rectiligne et le mouvement se développe sous l’action de l’impetus fourni par le canon. Dans la troisième, appelée mouvement naturel, la trajectoire est encore rectiligne, l’impetus cause du mouvement est celui de la pesanteur, impetus naturel, et le boulet retombé 14 . La phase intermédiaire correspond à l’affaiblissement de l’impetus violent sous l’action de l’impetus naturel et aboutit à une sorte de repos, le media quies. Cette phase était conçue comme une transition, un compromis, entre deux états de mouvement contradictoires où le projectile a un mouvement grosso modo horizontal et uniforme. L’impetus était très en vogue au XVIe siècle. Leonard de Vinci expliquait qualitativement le mouvement de la toupie par un conflit d’impetus axiaux. 14. Davantage à la verticale que lors de l’impetus violent. Heureuse coincidence que le frottement de l’air produise cet effet ! 0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 19 Fig. 3 : Phases successives du mouvement d’un boulet de canon dans la théorie de l’impetus. 0.7 La période moderne, de Lagrange à Einstein et à Feynman L’enthousiasme métaphysique ne dura guère. Ce n’était pas faute de richesse ou d’esthétisme intellectuel. C’est parce que les principes variationnels n’ont cessé, depuis, de produire des résultats physiques de plus en plus riches. C’est l’ambition de ce texte d’en décrire quelques uns. Leonhard Euler (1707-1783) et Joseph-Louis Lagrange (1736-1813), dont les travaux furent poursuivis par William R. Hamilton (1805-1865) en posèrent les fondements mathématiques. Ils sont les pères de l’une des pierres angulaires de la physique théorique contemporaine. Les conséquences de cette vision de la physique se retrouvent aux sources de la relativité générale d’Einstein aussi bien que des théories modernes des interactions fondamentales, les théories de jauge. L’outil mathématique central en est le calcul variationnel. On le doit à Euler qui en avait compris le fonctionnement et à Lagrange qui, en 1766, apporta une contribution décisive. 15 Le calcul variationnel est un pan étonnant des mathématiques, tant par son côté fédérateur que par le nombre de questions auxquelles il a permis de répondre. 15. Euler, qui était malvoyant depuis l’âge de 28 ans, devint complètement aveugle en cette même année 1766. Il reçut, en 1754, la visite du jeune Lagrange qui lui exposa ses travaux. Emerveillé par le talent de ce jeune homme, il dissimula un temps ses propres résultats, pour que le mérite en revienne au seul Lagrange. C’est un exemple, à peu près unique et maintenant disparu, de courtoisie humaine et de passion pour la science. 20 Avant-Propos Euler publia en 1744 son traité Methodus inveniendi lineas curvas maximi minimive proprietate gaudens, qui fondait le calcul des variations, dans la lignée des travaux de Jacques et Jean Bernoulli (l’ouvrage eut une influence considérable sur Lagrange). C’est dans ce travail qu’Euler justifia a posteriori le principe de moindre action de son ami Maupertuis. Lagrange appartenait à une famille turinoise. Il était particulièrement doué et précoce. La réaction favorable d’Euler à ses travaux l’encouragea et, en 1756, il appliqua ses techniques au principe de moindre action, fondement de la mécanique moderne. Une des contributions majeures de Lagrange est sa Mécanique analytique où il effectue la synthèse de l’ensemble des méthodes de statique et de dynamique qu’il avait développées antérieurement. L’ouvrage, achevé en 1782, ne parut qu’en 1788 à Paris. Lagrange consacra les dernières années de sa vie à une seconde édition revue et considérablement augmentée dont le premier volume parut en 1811. La mécanique de Lagrange est aussi importante dans l’histoire de la Physique, de la Mécanique et des Mathématiques que la mécanique céleste de Newton. Elle sera le point de départ de toutes les recherches ultérieures, notamment des travaux de Hamilton, qui la qualifiera de « poème scientifique par le Shakespeare des mathématiques ». Hamilton, né à Dublin, avait été, lui aussi, un enfant prodige. A l’âge de dix-neuf ans, il écrivit un travail remarquable sur l’optique. A vingt-trois ans, il devint professeur d’astronomie à Dublin et astronome royal à l’observatoire de Dunsink. Il resta toute sa vie fidèle à Dublin et à son observatoire. L’intérêt de Hamilton pour l’optique venait des instruments de son observatoire. Son mémoire, On caustics (Des caustiques), écrit en 1824, fait date. C’est peu après qu’il développa et amplifia la mécanique analytique de Lagrange, en lui donnant sa forme actuelle. Fasciné par les principes variationnels, et en particulier par la similitude entre le principe de Maupertuis en mécanique et le principe de Fermat en optique géométrique, il fit en 1830 la remarque étonnante que les formalismes de l’optique et de la mécanique pouvaient être unifiés, et que la mécanique newtonienne correspondait à la même limite ou approximation, que l’optique géométrique par rapport à l’optique ondulatoire ! Cette remarque fut ignorée par ses contemporains ce que déplora en 1891 le célèbre mathématicien Felix Klein. Il est vrai qu’en 1830 aucune expérience ne mettait en évidence le rôle de la constante de Planck. Néanmoins, à bien des égards, Hamilton peut être considéré comme un précurseur de la mécanique quantique. L’objectif central de ce livre est de fournir une description aussi instructive que possible de la mécanique analytique de Lagrange et Hamilton. Ce 0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 21 sont là des pans essentiels de la culture de tout physicien. Mais nous verrons, au passage, la multitude de leur retombées dans d’autres secteurs. Nous montrerons notamment les liens intimes de la mécanique analytique avec l’optique et avec la mécanique quantique. Dans le premier chapitre, nous commencerons par rappeler le principe de Fermat. Les lois de Descartes prévoient quel sera le chemin suivi par un rayon lumineux initial donné. Fermat adopte un point de vue plus général. Il se pose la question de déterminer le chemin effectivement suivi par la lumière pour aller d’un point à un autre. Ce point de vue permet, on le sait, d’expliquer les rayons courbes et les mirages, ce que les lois de Descartes ne peuvent pas faire. Fermat énonça à la fin de 1661 son principe de moindre temps. Cela nous amènera naturellement au coeur mathématique de notre propos : le Calcul variationnel d’Euler et Lagrange. C’est un chapitre très riche des mathématiques, mais délibérément nous n’avons pas souhaité l’aborder dans ses détails mathématiques, amplement traités dans la littérature. Nous souhaitons ici aboutir rapidement aux applications et résultats physiques. D’abord nous présentons le « Principe de la moindre quantité d’action » de Maupertuis. Ensuite nous passerons en revue quelques applications pour camper le décor. Nous verrons quelques applications mécaniques simples, ainsi que des exemples plus originaux comme les lois de Kirchhoff ou l’équation de Poisson en électrostatique. Finalement, nous nous tournerons vers un cas complètement analogue dans son esprit, mais qui fascine par la quantité et la puissance de ses conséquences, en comparaison de la simplicité de l’hypothèse de départ. Il s’agit du fondement de la thermodynamique statistique 16 En introduisant la technique des multiplicateurs de Lagrange, et le Principe d’équiprobabilité des configurations, nous verrons émerger une définition étonnamment simple de la notion de température, accompagnée de sa propriété première qu’est l’égalisation des températures de systèmes en contact thermique. Puis, nous aboutirons à la définition statistique et absolue de l’entropie, due à Boltzmann. Cela nous mènera au principe étonnamment simple : L’équilibre thermodynamique correspond à une situation qui maximise l’entropie compte tenu des contraintes, c’est à dire qui maximise le désordre compte tenu des contraintes. Sa portée dépasse largement le cadre de la physique. Il a notamment constitué, on peut le comprendre, une des pierres angulaires dans la construction de 16. Cette section n’est pas reproduite dans le présent polycopié. 22 Avant-Propos modèles économiques. 17 Le chapitre 2 est consacré à la mécanique analytique de Lagrange. La fin du XVIIe siècle avait vu le triomphe de la mécanique de Newton, posée en 1687 dans les "Philosophiae Naturalis Principia Mathematica". Newton ayant formulé, par ailleurs, la loi universelle d’attraction gravitationnelle, pouvait expliquer le mouvement des corps célestes. Ce mouvement céleste, complètement imbriqué dans la notion de temps, hantait les hommes depuis qu’ils observaient le ciel. L’homme savait maintenant prédire l’état du ciel avec une précision vertigineuse ! Mais on n’en resta pas là. A la suite de la synthèse newtonienne, le XVIIIe et le XIXe siècle furent marqués par une aventure étonnante où l’on découvrit la véritable structure de la mécanique : une structure géométrique. Une large classe de problèmes peuvent être ramenés à de purs problèmes de géométrie. Le couronnement de ces idées vint avec Lagrange en 1788, un siècle après les Principia. Lagrange publia, dans sa « Méchanique Analitique », une nouvelle formulation de la mécanique où il mit en relief cette structure globale et géométrique. La mécanique analytique de Lagrange repose sur le principe de moindre action. Lagrange adopte une façon nouvelle de considérer les problèmes de mécanique. Au lieu de déterminer la position et la vitesse d’une particule à un instant quelconque connaissant son état initial, il se pose la question de déterminer la trajectoire effectivement suivie par la particule si, partant d’un point donné à l’instant initial, elle arrive en un certain point à l’instant final. C’est la même démarche que celle de Fermat pour les rayons lumineux. Le formalisme lagrangien est particulièrement bien adapté pour traiter des lois d’invariance des phénomènes physiques et des lois de conservation qui en découlent. Cette question est fondamentale, les symétries et invariances forment l’ensemble de ce que l’on sait a priori sur la physique d’un problème. Nous verrons évidemment comment la conservation de l’énergie est liée à l’homogénéité du temps, celle de l’impulsion à l’homogénéité de l’espace, celle du moment cinétique à l’isotropie de l’espace. Au cours de cette discussion, nous introduirons la notion fondamentale de moment conjugué de Lagrange ou encore d’impulsion généralisée, qui joue un rôle central dans toute la suite. Au chapitre 3, nous présenterons la formulation lagrangienne de l’électromagnétisme. D’abord, nous étendrons nos considérations au cas d’une 17. Voir, par exemple, Jean-Michel Grandmont, Introduction à l’analyse microéconomique, Cours de l’Ecole Polytechnique, Edition 2002. 0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 23 particule relativiste, soit libre soit dans un champ électromagnétique. Le fondement de notre propos sera précisément l’invariance relativiste. Le principe de moindre action ne peut avoir de sens que s’il détermine le mouvement d’une particule de la même façon, quel que soit l’état de mouvement relatif de l’observateur. Cela nous permettra de construire le lagrangien. Nous verrons comment l’impulsion et l’énergie d’une particule libre sont reliées à sa masse et sa vitesse. Nous démontrerons ainsi que l’ensemble (E/c, p) forme un quadrivecteur de l’espace-temps en relativité. Ensuite nous passerons à la théorie des champs, vaste problème en lui-même, qui ne peut être véritablement couvert qu’en un traité spécialement conçu pour lui. En effet, le formalisme lagrangien trouve sa pleine puissance lorsque l’on traite de systèmes ayant un nombre de degrés de liberté très grand, voire infini. Nous donnerons les principes de la théorie lagrangienne des champs et son application au champ électromagnétique. Nous déduirons l’action complète de l’électromagnétisme. Le chapitre 4, nous mènera à la formulation dite canonique de la mécanique analytique due à Hamilton. Ce formalisme canonique date de 1834. Il est plus commode pour un certain nombre de problèmes, notamment la mécanique du point ou d’ensembles de points. Mais il est surtout d’une richesse impressionnante par ses développements tant mathématiques que physiques. Ce texte est avant tout orienté vers les applications à la mécanique, mais nous ferons allusion à quantité d’autres retombées des travaux de Hamilton. Après avoir décrit le formalisme canonique, qui consiste à décrire l’état d’un système par les variables conjuguées que sont les positions et les moments conjugués de Lagrange, et non par les positions et les vitesses, nous présenterons quelques aspects des systèmes dynamiques. Ce type de problème physique a, en effet, été une extraordinaire source de découvertes tant en mathématiques qu’en physique. Le fondateur de ce champ d’étude est Henri Poincaré, en 1885, notamment quand il a étudié le problème des 3 corps. Cela mène à des problèmes fascinants : les problèmes limites à t = ∞, les attracteurs et les attracteurs étranges, les bifurcations, le chaos etc. L’attracteur étrange le plus célèbre est sans doute l’attracteur de Lorenz, du nom de son inventeur Edward N. Lorenz qui le découvrit en 1963 à partir d’un modèle mathématique de l’atmosphère, et relança de façon spectaculaire, avec l’effet « aile de papillon » en météorologie, l’intérêt pour le chaos, inventé par Poincaré 80 ans plus tôt. Nous abordons ensuite, avec les crochets de Poisson, une structure mathématique, beaucoup plus proche de notre propos. Jacobi considérait que c’était 24 Avant-Propos la plus grande découverte de Poisson, qui, pourtant, avait fait des contributions considérables aux mathématiques, aux probabilités, à la mécanique analytique et à l’électrostatique. Nous parviendrons ensuite naturellement à l’étonnante découverte faite par Dirac en 1925. Il y a une parfaite symétrie entre mécanique analytique et mécanique quantique si l’on fait correspondre aux crochets de Poisson classiques les commutateurs des observables quantiques (divisés par i~). La dernière partie de ce chapitre est consacrée à l’équation de HamiltonJacobi, où l’on choisit d’énoncer les lois de la physique directement à partir de l’action et non plus du lagrangien ou du hamiltonien. Nous verrons comment, pour les systèmes conservatifs, le flot des trajectoires est orthogonal aux surfaces d’action constante. Cela nous fera redécouvrir le Principe de Maupertuis sous une forme parfaitement géométrique. Nous verrons alors comment l’optique géométrique apparaît comme limite de l’optique ondulatoire, ainsi que l’avait découvert Hamilton. Cette démonstration fait intervenir ce que l’on ⊃ ′ nomme l’eikonal (du grec εικ ων , image) qui est l’analogue optique de l’action. Dans l’approximation des faibles longueurs d’onde dite approximation eikonale, l’onde se propage avec un vecteur d’onde localement perpendiculaire aux surfaces sur lesquelles l’eikonal est constant. Ces surfaces sont les fronts d’ondes géométriques. L’approximation eikonale correspond exactement au principe de Fermat. L’interprétation géométrique n’est autre que le Principe de Huygens-Fresnel. Finalement, nous montrerons comment le même cadre de pensée peut être appliqué à la mécanique ondulatoire et à l’équation de Schrödinger. Cela constitue la célèbre approximation semi-classique de Brillouin, Kramers et Wentzel. Au chapitre 5 18 , nous formalisons le problème du mouvement d’une particule libre dans un espace courbe. Le chef-d’oeuvre d’Einstein qu’est la Relativité générale repose sur l’observation étonnante que deux grandeurs physiques qui n’ont a priori aucun rapport, sont égales (ou strictement proportionnelles). Il s’agit, on le sait, des deux acceptions du concept de masse. L’une est celle de coefficient d’inertie ou de résistance à l’accélération d’un corps dans les lois de la dynamique, l’autre est celle de coefficient de couplage au champ de gravitation. Il n’existe aucun argument a priori qui explique le pourquoi de cette égalité. Le mouvement d’une particule chargée dans un champ électromagnétique dépend des deux paramètres indépendants que sont la masse, coefficient d’inertie, et la charge de la particule, coefficient 18. Ce chapitre n’est pas reproduit dans le présent polycopié. 0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 25 de couplage au champ. Dans un champ gravitationnel, l’égalité de la masse inertielle et de la masse pesante élimine la masse d’un corps des équations du mouvement. Deux corps placés dans les mêmes conditions initiales ont le même mouvement, quelle que soit leur masse. La prise de conscience de la profondeur de cette constatation a été relativement tardive. L’expérience historique d’Eötvös en 1890 a été reprise systématiquement depuis. Elle l’est encore à l’heure actuelle avec des techniques de plus en plus sophistiquées. L’idée qui sous-tend la Relativité générale est que cette égalité devient naturelle si le mouvement que nous nommons « gravitationnel » est, de fait, un mouvement libre dans un espace-temps courbe. Einstein racontait qu’en 1907, alors qu’il travaillait sur la façon d’incorporer la gravitation newtonienne dans la relativité (celle de l’électromagnétisme ne posant par construction aucun problème) il eut l’idée la plus « heureuse » de sa vie (« glücklichster Gedanke meines Lebens »). Il s’était mis à penser aux impressions de quelqu’un qui tomberait d’un toit ! Pour un tel « observateur » (et, bien entendu, tant qu’il ne rencontre pas d’autre objet) il n’existe pas de champ gravitationnel (les italiques sont d’Einstein). S’il « laisse tomber » des objets de ses poches, ceux-ci restent au repos, ou sont en mouvement uniforme par rapport à lui, quelle que soit leur nature physique ou chimique. Nous verrons l’idée de base du « Principe d’équivalence » et quelques unes de ses conséquences, le but de ce chapitre étant d’utiliser le formalisme lagrangien pour montrer comment l’idée de mouvement dans un espace courbe fournit des éléments pour construire une théorie où l’égalité des « deux » masses est réalisée de façon naturelle. Après avoir défini ce qu’on nomme espace courbe et introduit la notion fondamentale de métrique de l’espace, nous écrirons le mouvement d’une particule libre dans un tel espace. Cette étude débouchera sur un résultat fondamental : les trajectoires physiques sont les géodésiques de l’espace, c’est-àdire les courbes de longueur minimale (extrémale). C’est là que nous verrons comment le mouvement d’une particule soumise à un potentiel indépendant du temps, d’énergie constante, dans l’espace euclidien peut être transformé dans le mouvement libre de cette particule dans un espace courbe, ce qui équivaut au Principe de Maupertuis. Ces développements nous permettront de comprendre la démarche d’Einstein lorsqu’il construisit la relativité générale, ainsi que certaines conséquences de cette théorie. Nous montrerons trois exemples historiques : la variation de la marche d’une horloge dans un champ gravitationnel, les corrections à la mécanique céleste newtonienne et la déviation de la lumière par le champ gravitationnel. 26 Avant-Propos Ces exemples sont historiques, ils sont également d’une grande actualité. Comme nous le verrons, la déflexion de la lumière par un champ de pesanteur joue un rôle considérable en Astrophysique et en Cosmologie au travers de l’effet de lentille gravitationnelle. Une application est la recherche de la distribution d’une composante baryonique dans la « masse cachée » ou matière noire de l’univers. Une autre provient de ce que la distribution de masse dans l’univers, masse des galaxies mais aussi la matière noire, agit comme un instrument d’optique permettant d’observer des objets lointains, donc beaucoup plus jeunes. Cet effet est celui d’un télescope cosmique naturel, et l’univers apparaît ainsi comme une galerie de mirages sans fin. Nous avons, enfin, consacré le chapitre 6 19 à la formulation variationnelle de la mécanique quantique de Feynman. Richard P. Feynman est peut-être le physicien théoricien le plus brillant de la seconde moitié du 20e siècle. Dans son travail de thèse, soutenu en mai 1942 à Princeton, Feynman cherchait à résoudre le problème des corrections de l’électrodynamique quantique à la masse de l’électron. Ces corrections sont infinies dans une théorie des champs où l’électron est considéré comme une particule ponctuelle. L’énergie électrostatique ∼ e2 /(4πε0 r0 ) d’une distribution d’extension r0 nulle est, en effet, infinie. La théorie de la renormalisation consiste à incorporer cette quantité infinie en redéfinissant la masse « nue » de l’électron (en l’absence de champ) comme un paramètre non-physique lui-même infini, les deux infinis se compensant l’un l’autre. Feynman découvrit un "principe de moindre action" qui lui permettait de résoudre le problème en utilisant des potentiels pour moitié avancés et pour moitié retardés. A cette fin, il avait introduit le concept mathématique des intégrales de chemins, qui n’a cessé d’être développé depuis. Cette méthode connut un premier triomphe lorsqu’elle permit de calculer le déplacement de Lamb des niveaux de l’atome d’hydrogène sans introduire de paramètres de régularisation arbitraires, mais, au contraire, de gérer les termes infinis d’une manière systématique et bien définie. Bien loin d’un simple outil technique, le Groupe de renormalisation a révélé, depuis, une profondeur qui le mettent au premier plan de la physique théorique contemporaine. Ce n’est que quelques années plus tard que Feynman comprit qu’il pouvait appliquer ses idées à une formulation variationnelle de la mécanique quantique non relativiste. Il y a deux piliers dans cette approche. Tout d’abord, Feynman s’intéresse non pas à l’état des systèmes mais à l’amplitude des pro19. Ce chapitre n’est pas reproduit dans le présent polycopié. 0.7. LA PÉRIODE MODERNE, DE LAGRANGE À EINSTEIN ET À FEYNMAN 27 cessus. C’est une attitude plus réaliste dans la mesure où tout phénomène, toute expérience, consiste en un processus. Ensuite, Feynman pose le problème de la mécanique quantique dans l’espace-temps. Le principe de Feynman consiste à poser que, de façon générale, dans un dispositif quelconque, la phase de l’amplitude correspondant à un chemin donné est l’action classique le long de ce chemin divisée par la constante de Planck ~. La somme de toutes les amplitudes réalisant le processus considéré est un objet mathématique compliqué que l’on nomme une intégrale de chemins, sur laquelle repose tout le formalisme. Feynman montre que l’on obtient ainsi les relations d’Einstein et de Broglie, ainsi que l’équation de Schrödinger, les observables et toute la mécanique quantique usuelle. La physique statistique a profité, elle aussi, du concept d’intégrale de chemins. D’innombrables résultats ont été obtenus, et cet outil joue un rôle central dans la théorie quantique des champs contemporaine. Si l’on considère des systèmes et processus où l’action S(b, a) classique est macroscopique, c’est-à-dire beaucoup plus grande que la constante de Planck ~, la contribution de chemins qui peuvent paraître très proches l’un de l’autre au sens classique, mais tels que la différence de l’action calculée sur ces chemins soit, elle aussi, beaucoup plus grande que ~, va être, avec une forte probabilité, en interférence destructive. La contribution de l’ensemble de tels chemins à l’intégrale sera par conséquent nulle, chacun annulant la contribution d’un autre. Mais, bien entendu, au voisinage de la trajectoire classique xcl (t), l’action Scl (b, a) est stationnaire. Par conséquent, seuls contribuent de façon appréciable les chemins le long desquels l’action S(b, a) est suffisamment proche de l’action classique Scl (b, a), la différence étant nettement inférieure à l’unité ~. Autrement dit, dans ces conditions, seul contribue un voisinage infinitésimal de la trajectoire classique, impossible à résoudre expérimentalement dans ses détails. La « probabilité » de la trajectoire classique est par conséquent égale à un, celle de toute autre trajectoire imaginable et distinguable expérimentalement de la trajectoire classique est nulle. On voit ainsi la mécanique classique apparaître comme la limite de la mécanique quantique, pour des actions macroscopiques. En outre, nous verrons que l’amplitude satisfait identiquement l’expression (moderne) du principe de Huygens-Fresnel en optique. Par conséquent, le principe de Feynman porte en lui une esthétique unificatrice étonnante après les 5 chapitres précédents. Il consiste à prendre en compte, dans le calcul de l’amplitude d’un processus quelconque, le plus 28 Avant-Propos grand « nombre » de chemins possibles, avec la contrainte que des chemins trop éloignés donnent des interférences destructives. On peut se représenter cela comme le fait qu’une amplitude est d’autant plus importante que le « volume » de l’ensemble des voies qui y contribuent en cohérence de phase, est grand. De ce point de vue, la phase d’une amplitude prend un sens physique et une importance substantielle qu’on ne mesure peut-être pas suffisamment. *** Jean-Louis Basdevant Paris, mai 2004 Chapitre 1 Principes variationnels La nature agit toujours par les voies les plus courtes. Pierre de Fermat Ce qui est remarquable dans les principes variationnels est double. D’une part, ils présentent les structures et processus naturels comme résultant d’un principe d’optimalité, de l’autre, ils sont universels . Toutes les lois physiques peuvent s’exprimer sous cette forme globale. Elle permet de retrouver les lois locales, mais, plus riche et plus puissante, elle dégage les principes fondamentaux des lois qu’elle manipule. Les principes variationnels ont en commun de présenter les phénomènes naturels comme des problèmes d’optimisation sous contraintes. L’idée fondatrice dans la physique moderne et sa formalisation, proviennent de Fermat et du principe qu’on lui doit en optique géométrique. Fermat lui-même l’appelle principe d’économie naturelle. Le principe de Maupertuis nous apparaît comme une prolongation du principe de Fermat vers la mécanique. Sa généralisation sous la forme du principe de moindre action par Euler, Lagrange et ensuite Hamilton lui a donné sa forme définitive sous laquelle il régit de nos jours toute la physique fondamentale. La mise à jour des concepts et principes fondamentaux de la mécanique s’est effectuée au 17e siècle. Copernic ayant donné la notion de repère en 1543, Galilée énonce le principe d’inertie en 1638 dans son grand ouvrage Discorsi e dimostrazioni mathematiche intorno a due nove scienze. 1 Un corps soumis à aucune force a une vitesse constante. Le mouvement rectiligne uniforme est un état relatif à l’observateur, et non un processus. C’est la variation de la vitesse qui est un processus résultant d’une action extérieure. Nombreux sont 1. Discours et démonstrations mathématiques concernant deux sciences nouvelles. 29 30 Principes variationnels ceux qui participèrent à cette évolution : Tycho Brahe, Kepler, Descartes, le Père Mersenne, Roberval, Huygens, Varignon etc. Le couronnement vint avec la synthèse de Newton, en 1687, les "Philosophiae Naturalis Principia Mathematica". Newton y posa ses 4 lois : principe d’inertie, loi de composition des forces, proportionnalité de l’accélération et de la force, principe de l’action et de la réaction. Il formula, par ailleurs, la loi universelle d’attraction gravitationnelle qui lui permettait d’expliquer les lois de Kepler et le mouvement des corps célestes. Ce mouvement céleste, complètement imbriqué dans la notion de temps, hantait les hommes depuis qu’ils observaient le ciel. L’homme savait maintenant prédire l’état du ciel avec une précision vertigineuse ! Mais on n’en resta pas là. A la suite de la synthèse newtonienne, le XVIIIe et le XIXe siècle furent marqués par une aventure étonnante. Sous l’impulsion de d’Alembert, de Maupertuis, des frères Bernoulli (notamment Daniel), d’Euler et de Lagrange, puis de Hamilton, on découvrit la véritable structure de la mécanique gouvernée par un principe variationnel global. D’Alembert, qui le premier avait compris l’importance du concept abstrait de masse au travers de la quantité de mouvement et de sa conservation, s’attaqua au concept abstrait de force introduit par Newton. Pour lui, le mouvement est le seul phénomène observable, tandis que la « causalité motrice » reste une abstraction. D’où l’idée d’étudier non pas telle trajectoire particulière de la théorie mais l’ensemble des mouvements qu’elle prévoit (conception tout à fait moderne des forces, ou interactions). Le « Principe de la moindre quantité d’action », énonçé en 1744 par Maupertuis pour la mécanique marque une date historique dans l’évolution de ces idées en physique et, à l’époque, dans la philosophie. Le couronnement vint avec Lagrange en 1788, un siècle après les Principia. Lagrange publia, dans sa « Méchanique Analitique », une nouvelle formulation de la mécanique où il mit en relief cette structure globale. 2 «On ne trouvera point de Figures dans cet ouvrage. Les méthodes que j’y expose ne demandent ni constructions, ni raisonnements géométriques ou méchaniques, mais seulement des opérations algébriques, assujetties à une marche régulière & uniforme. Ceux qui aiment l’Analyse, verront avec plaisir la Méchanique en devenir une nouvelle branche, & me sauront gré d’en avoir 2. Il y a de nombreux livres sur la mécanique analytique. Nous recommandons, bien entendu, le « grand classique » de Landau et Lifshitz [9], le remarquable ouvrage de Herbert Goldstein Classical Mechanics [10] aussi clair que complet, et l’ouvrage moderne en langue française de Guignoux et Silvestre-Brac [11]. 1.1. PRINCIPE DE FERMAT 31 étendu ainsi le domaine. » écrivait M. de La Grange dans sa Méchanique Analitique. Dans la partie 1 de ce chapitre, nous reprenons le principe de Fermat, et notamment la démonstration par ce dernier des lois de la réfraction. Fermat ne connaissait pas la vitesse de la lumière et les indices de réfraction. En supposant que le temps mis par la lumière à parcourir une certaine distance dans un milieu est proportionnel à la « résistance » de ce milieu au passage de la lumière, Fermat énonça à la fin de 1661 son principe de moindre temps. Il l’appella « principe d’économie naturelle ». On sait que ce principe explique les rayons courbes, responsables des mirages, qui ne peuvent pas être expliqués par les lois de Snell-Descartes. Nous passons en revue qualitative quelques exemples. Dans la partie 2, nous exposerons le « Principe de la moindre quantité d’action », énonçé en 1744 par Maupertuis pour la mécanique qui caractérise une trajectoire physique par le fait que la circulation de la quantité de mouvement le long d’une trajectoire physique est minimale. Le principe s’applique au cas où l’énergie est conservée. La partie 3 expose finalement le principe de moindre action de Lagrange et Hamilton comme principe fondateur de la mécanique analytique. Sous sa forme généralisée à la théorie des champs ce principe est même devenu un principe fondamental de toute la physique ! Lagrange propose de déterminer la trajectoire effectivement suivie par la particule si, partant de r1 , à l’instant t1 , elle arrive en r2 à t2 , au lieu de déterminer sa position r(t) et sa vitesse v(t) à l’instant t connaissant son état initial {r(0), v(0)}. C’est la même démarche que celle de Fermat pour les rayons lumineux. Le principe qui est à l’origine de la réponse à cette question est celui de moindre action. L’introduction à ce nouveau concept d’action est donc un des objectifs principaux de ce cours. 1.1 Principe de Fermat Comme nous l’avons dit, tout est né vers 1637 d’une dispute entre Descartes et Fermat à propos de la notion de démonstration, à la suite de la publication de la Dioptrique dans le Discours de la Méthode. Les lois de Descartes prévoient quel sera le chemin suivi par un rayon lumineux initial donné. Fermat adopte un point de vue plus général. Il se pose la question de déterminer le chemin effectivement suivi par la lumière pour aller de A à B. Ce point de vue permet, on le sait, d’expliquer les rayons courbes et les 32 Principes variationnels mirages, ce que les lois de Descartes ne peuvent pas faire. Fermat comprend (comme l’avait fait Héron d’Alexandrie) que la loi de la réflexion est une propriété géométrique de la longueur optique des rayons. La démonstration est schématisée sur la figure 1.1. Figure 1.1 – Rayons lumineux possibles entre l’émetteur A et l’observateur B lorsqu’il y a réflexion sur un plan. B’ étant le symétrique de B par rapport au miroir, la longueur AOB’ est la même que la longuer de AOB. Le chemin le plus court entre A et B’ est une ligne droite. Un chemin AFB est plus long quel que soit F6=O. Soit un émetteur A et observateur B. On suppose que la lumière émise par A est réfléchie par un miroir plan avant d’atteindre B. Soit B’ le symétrique de B par rapport au miroir, et O l’intersection du miroir et de la droite AB’ (figure 1.1). La longueur AOB’ est la même que la longuer de AOB. Le chemin le plus court entre A et B’ est bien évidemment une ligne droite. Un chemin AFB où F6=O est tel que par inégalité triangulaire (ou par définition d’une ligne droite) AF+FB’>AB’, et cela quelque soit F. La géométrie élémentaire montre alors que les angles d’incidence i et de réflexion r sont égaux pour le chemin AOB. 33 1.1. PRINCIPE DE FERMAT 1.1.1 Réfraction Concernant les lois de la réfraction, Descartes avait été obligé de supposer que la vitesse de la lumière dans la matière (dans un milieu dense) était supérieure à celle dans le vide (ou dans un milieu dilué) 3 . C’est cela, tout autant que le manque de rigueur de la « démonstration » de Descartes, qui avait fâché Fermat. Celui-ci était convaincu que l’on pouvait faire les choses correctement : « Il me semble qu’un peu de géométrie pourra nous tirer d’affaire ». Poussé par les critiques des partisans de Descartes, Fermat ne résolut le problème de la réfraction que beaucoup plus tard, en 1661. L’essentiel de son raisonnement tient dans l’hypothèse que la vitesse de la lumière dans un milieu dense est, au contraire, inférieure à celle dans un milieu dilué. Soit (xOy) le plan séparant les deux milieux, d’indices n1 et n2 4 . La source est en A, l’observateur en B, comme représenté sur la figure (1.2). Soient H et H ′ les projections de A et B sur l’axe x. On note h la distance de A à la surface et h′ celle de B. La distance HH ′ est l. On considère un chemin AOB et on note x la distance HO. Il s’agit de minimiser le chemin optique n1 AO + n2 OB. Par le théorème de Pythagore, on a AO 2 = h2 + x2 , OB 2 = h′2 + (l − x)2 . Le temps T mis par la lumière pour parcourir ce chemin est T = (n1 AO + n2 OB)/c . (1.1) Fermat, dans sa preuve, démontre que pour tout chemin voisin AO ′ B, qui s’obtient de AOB par un déplacement O → O ′ sur l’axe horizontal, le temps de parcours T ′ ne diffère de T que par une quantité de deuxième ordre dans la distance OO ′ [6]. Pour nous, connaissant le calcul différentiel, il est plus simple à chercher x tel que (1.1) soit minimal. En dérivant cette expression 3. Cette idée provient vraisemblablement du fait que beaucoup de dioptres étudiés étaient des liquides dont la surface est horizontale, c’est-à-dire perpendiculaire à la direction de la gravité. Comme le rayon lumineux se rapproche de la verticale lorsqu’il passe, par exemple, de l’air dans l’eau, il semblait intuitif de supposer qu’il « tombait » plus vite. 4. Fermat ne connaissait la vitesse de la lumière ni les indices de réfraction ; il parlait seulement de la « résistance » d’un milieu dense au passage de la lumière. Il supposait que le temps mis à parcourir une distance L dans le milieu est proportionnel à cette résistance ce qui lui paraissait plus conforme au bon sens que l’inverse. 34 Principes variationnels A h φ1 i1 n1 H’ O x H φ2 i2 n2 h’ B Figure 1.2 – Rayon lumineux possible entre l’émetteur A et l’observateur B lorsqu’il y a réfraction par une surface plane séparant deux milieux d’indices n1 et n2 . H et H ′ sont les projections de A et B sur cette surface. On note h la distance de A à la surface et h′ celle de B. La distance HH ′ est l. On considère un chemin AOB et on note x la distance HO. Il s’agit de minimiser le chemin optique n1 AO + n2 OB. par rapport à x, et en écrivant que la dérivée dT /dx est nulle, on obtient √ Mais, bien évidemment, √ n2 (l − x) n1 x =p h2 + x2 h′2 + (l − x)2 x = cos φ1 = sin i1 , h2 + x2 et . (l − x) p = cos φ2 = sin i2 h′2 + (l − x)2 (1.2) , (1.3) où les angles φ1 et φ2 sont indiqués sur la figure, et i1 et i2 sont les angles d’incidence et de réfraction. Par conséquent, on obtient la loi de DescartesSnell n1 sin i1 = n2 sin i2 . (1.4) En outre, on voit que cet extremum est bien un minimum : d2 T /dx2 > 0. Ce résultat fascine Fermat : Le fruit de mon travail a été le plus extraordinaire, le plus imprévu et le plus heureux qui fût jamais. Car [...] j’ai trouvé que mon principe donnait justement et précisément la même proportion des réfractions que M. Descartes a établie. A la fin de 1661, Fermat écrit son 1.1. PRINCIPE DE FERMAT 35 principe de moindre temps, qui déclenche tout. Il l’appelle « principe d’économie naturelle » en ajoutant « la nature agit toujours par les voies les plus courtes ». Comme nous l’avons dit, ce principe aura un grand retentissement au 18e siècle. Il sera repris par Maupertuis en mécanique. Sauvetage en mer Le résultat ci-dessus se transpose à quantité de situations. Un exemple, parmi d’autres, est celui du trajet optimal que doit suivre un sauveteur, sur une plage puis dans l’eau, pour aller secourir un baigneur en difficulté. La vitesse du sauveteur sur terre, v1 , et dans l’eau, v2 , ne sont pas les mêmes. La trajectoire correspondante, qui se schématise comme en figure 1.2, obéit à sin i1 /v1 = sin i2 /v2 . 1.1.2 Rayons courbes Considérons un problème bidimensionnel (xOz) , comme la propagation de la lumière dans une atmosphère fixe, mais de densité variable, si bien que l’indice de réfraction varie continûment d’un point à un autre. Le schéma est représenté sur la figure 1.3. Les rayons se propagent selon des courbes et non des droites, et la position angulaire optique d’un objet ne correspond pas à sa position angulaire géométrique. Ces rayons courbes, qui sont responsables des mirages, ne peuvent pas s’expliquer par les lois de Snell-Descartes. Du point de vue mathématique, il s’agit de trouver la trajectoire z = Z(x) d’un rayon lumineux se propageant dans un milieu d’indice n(z, x) , ou encore n(z) si le système est invariant par translation selon Ox , et allant d’un point d’émission A en (z0 , x0 ) à un observateur B en (z1 , x1 ). Le temps dτ mis par la lumière pour aller de [x, z] à [x + dx, z + dz] est √ dℓ dz 2 + dx2 dτ = n(z) = n(z) . c c Nous devons trouver la fonction Z(x) qui minimise le temps passé sur la trajectoire, c’est-à-dire, qui minimise l’intégrale Z Z p 1 B 1 B (1.5) T = n dℓ = n(z) 1 + z ′ (x)2 dx c A c A 36 Principes variationnels Figure 1.3 – Rayon lumineux entre l’émetteur A et l’observateur B dans un milieu d’indice de réfraction variable. La coordonnée z est la hauteur, x la distance horizontale. On suppose le problème invariant par translation dans la direction y perpendiculaire à la figure. La direction apparente du point A vu par B est celle de la tangente du rayon arrivant en B. compte tenu des contraintes : z(x = x0 ) = z0 et z(x = x1 ) = z1 . Nous avons posé z ′ (x) = (dz/dx)(x) . Au chapitre 2 nous déduirons une équation différentielle pour la trajectoire temporelle du rayon lumineux à partir de (1.5) qu’on sait résoudre explicitement dans des cas particuliers. Mais qualitativement, ce qui va se passer est déjà évident. Si n(z) augmente avec z le rayon aura une courbure positive comme indiqué sur la figure 1.3. Pour n(z) diminuant avec z ce sera le contraire. Et l’effet sera plus prononcé pour un gradient important de n(z) . 1.1.3 Mirages C’est dans ce type de situation que l’on observe des mirages. On sait qu’une route fortement chauffée l’été peut apparaître par endroits comme un lac. C’est un mirage du type schématisé sur la figure 1.3. L’indice de réfraction est faible au niveau de la route où l’air est moins dense. Il est plus élevé en hauteur où la température est plus faible. Le « lac » est le reflet du ciel. Dans ce cas de figure, on dit qu’il y a un mirage inférieur . L’image 1.1. PRINCIPE DE FERMAT 37 Figure 1.4 – Schémas de mirages inférieur (haut) et supérieur (bas). apparente est au dessous de l’objet. Cela est décrit sur la figure 1.4. Comme on le comprend sur l’exemple simple ci-dessus, une dépendance de l’indice de réfraction n(z) plus complexe donnera lieu à des phénomènes variés. Des variations d’indice peuvent se produire dans le sens inverse lorsque la température en altitude est supérieure à la température à un niveau inférieur. Ce type de situation, qui se présente par exemple pour des rayons lumineux passant au voisinage du sommet d’une colline chauffée, provoque des mirages supérieurs. On peut alors voir un objet caché (au sens géométrique) derrière une colline. On voit le soleil se coucher bien après qu’il ait franchi l’horizon géographique. En effet, comme le montre la figure 1.5, lorsque le soleil est au voisi- 38 Principes variationnels Direction apparente du soleil Atmosphère Terre Rayon lumineux Direction du soleil Figure 1.5 – Directions réelle et apparente du soleil au voisinage de l’horizon. Elles diffèrent d’environ un demi degré. nage de l’horizon, ses rayons traversent un milieu d’indice fortement variable, plus dense au sol qu’en altitude, avec en outre de possibles fluctuations atmosphériques en fonction de l’altitude et du lieu. Au coucher du soleil, l’angle entre la direction optique du soleil et sa direction géométrique est d’environ un demi degré. Sa direction géométrique est bien au dessous de l’horizon (voir la référence [5] pour d’autres exemples). Les mirages sont particulièrement nombreux dans l’arctique et dans l’antarctique où pendant une durée très longue, la ligne de visée traverse une épaisseur d’atmosphère considérable. Sur cette distance, la densité, la composition et la température de l’atmosphère peuvent varier énormément. Il en résulte des effets spectaculaires. La figure 1.6 est une image prise lors d’une expédition allemande du Germania dans l’arctique en 1888. Elle est très riche car, pour chacun des deux bateaux, il y a deux mirages supérieurs, inversés l’un par rapport à l’autre. Entre les deux bateaux, on distingue un iceberg. Cette image fait évidemment penser à la légende du Hollandais volant (ou du Vaisseau fantôme) des marins du Cap de Bonne espérance (à l’autre bout du monde) 5 . La figure 1.7 montre deux mirages supérieurs photographiés en Scandinavie par Pekka Parviainen, un mirage du soleil et un mirage d’un cargo. Les variations d’indice de l’atmosphère ne sont pas seulement à l’origine 5. Le « Hollandais volant » était un navigateur prestigieux. Il prétendait pouvoir doubler le Cap de Bonne Espérance quelles que fussent les conditions météorologiques. Pendant des années après sa disparition dans une tempête épouvantable, d’innombrables navigateurs affirmèrent avoir revu son navire, notamment dans le ciel, preuve que les éléments n’avaient rien pu contre lui. 1.1. PRINCIPE DE FERMAT 39 Figure 1.6 – Mirages supérieurs dédoublés observés par des marins du Germania pendant une expédition dans l’arctique en 1888. Avec l’aimable autorisation de Roger Lapthorn ; tous droits réservés. des mirages. Ils provoquent aussi des effets de lentille qui entraînent des grandissements apparents considérables. On peut ainsi voir des îles, bateaux, rivages distants de plusieurs centaines de kilomètres. Finalement l’indice varie avec la fréquence de la lumière de façon que les effets sont différents selon la décomposition spectrale de la lumière. Cet effet ajouté à la diffusion de la lumière dans l’atmosphère terrestre est à l’origine du quasi-mythique « rayon vert » au coucher du soleil [1] qu’on peut observer et photographier (voir Pekka Parviainen dans http ://virtual.finland.fi/finfo/english/mirage2.html). 40 Principes variationnels Figure 1.7 – Mirages supérieurs du soleil au couchant et d’un cargo dans l’arctique. Avec l’aimable autorisation de Pekka Parviainen <[email protected]> ; tous droits réservés. Voir aussi le site http ://virtual.finland.fi/finfo/english/mirage2.html 1.2 Principe de Maupertuis C’est en 1744 que Maupertuis énonça pour la première fois le principe de la moindre quantité d’action pour la mécanique. Même si l’énoncé et la justification proposés initialement par Maupertuis sont confus, il s’agit là d’une date historique dans l’évolution des idées en physique et, à l’époque, dans la philosophie. Pour une particule de masse m, de vitesse v, l’action de Maupertuis est le produit de trois facteurs, la masse, la vitesse, et la distance parcourue. En fait, il s’agit de R la circulation de la quantité de mouvement le long de la trajectoire : A = mv dl. La formulation et la démonstration du principe de Maupertuis furent données peu après par Euler. En termes actuels on peut considérer le principe de Maupertuis comme un cas particulier du principe de moindre action, qui sera exposé au para- 41 1.3. LE PRINCIPE DE MOINDRE ACTION graphe suivant. On se limite aux systèmes conservatifs (c’est à dire les forces dérivent d’un potentiel), et on demande que l’énergie soit une constante du mouvement, c’est à dire conservée. Pour un seul point matériel de masse m placé dans un potentiel V (r) on note v la vitesse et v sa norme. Si son énergie est une constante du mouvement notée E, sa valeur est 1 E = mv 2 + V (r) . 2 L’action de Maupertuis est alors Aa,b = Z b a mv dl ≡ Z bp a 2m(E − V ) dl , (1.6) où dl est l’élément de longueur sur la trajectoire. Le principe de Maupertuis dit que la trajectoire effectivement suivie par la particule pour aller de a à b avec une énergie E fixée est celle qui rend (1.6) minimum. Dans le chapitre 2 nous verrons que les équations de mouvement de Newton sont en accord avec ce résultat. Ici nous pouvons déjà constater la parfaite analogie de (1.6) et de (1.5) qui se transforment l’une dans l’autre par le remplacement p 2m(E − V ) ↔ n/c . Ceci veut dire que la trajectoire sélectionée par le principe de Maupertuis est une trajectoire minimale par rapport à une échelle de longueur qui varie p localement comme 2m(E − V ), de la même manière que la trajectoire de Fermat minimise la longueur en unités proportionnelles à l’indice n . Dans les deux cas on peut donc décrire les trajectoires sélectionnées comme trajectoires minimales par rapport à une métrique qui varie localement selon les propriétés physiques du système considéré. On entrevoit ainsi que le problème mécanique est ramené à un problème géométrique : le mouvement d’une particule, soumise à des forces dérivant d’un potentiel, dans un espace plat euclidien, peut être considéré comme un mouvement libre d’une particule dans un espace courbe (elle suit alors des trajectoires de longueur minimale ou «géodésiques»). Einstein avait cette idée en tête dès 1908 lorsqu’il construisait la Relativité Générale. Pour plus d’explications sur ce point on peut se référer à [1]. 42 Principes variationnels trajectoire réelle X(t) x2 , t2 x1 , t1 trajectoire possible x(t) Figure 1.8 – Exemples de trajectoires partant de x1 à l’instant t1 et aboutissant en x2 à l’instant t2 . Parmi toutes ces trajectoires, la trajectoire physique effectivement suivie par la particule est celle qui rend l’action S extrémale. 1.3 Principe de moindre action Dans sa Méchanique Analitique, Lagrange propose de considérer les problèmes de mécanique de la façon suivante. Au lieu de déterminer la position r(t) et la vitesse v(t) d’une particule à l’instant t connaissant son état initial r(0), v(0), il pose la question : quelle est la trajectoire effectivement suivie par la particule si, partant de r1 , à l’instant t1 , elle arrive en r2 à t2 ? Pour simplifier, considérons d’abord le cas d’une seule dimension d’espace. Parmi l’infinité de trajectoires possibles (voir figure 1.8), quelle est la loi qui détermine la bonne ? Lagrange sait qu’on peut répondre à cette question par le « principe d’économie naturelle » de Fermat, repris par Maupertuis. Le principe variationnel comme nous le présentons ici n’a pas la forme utilisée par Lagrange 6 . Il a été reformulé par Hamilton en 1834. Nous l’exposons sous cette forme, plus générale que celle proposée par Lagrange. On pose 1. Tout système mécanique est caractérisé par une fonction de Lagrange ou lagrangien L(x, ẋ; t), dépendant de la coordonnée x, de sa dérivée par rapport au temps ẋ = dx/dt, et éventuellement du temps 7 . Les 6. le principe variationnel de Lagrange s’applique aux systèmes conservatifs, et porte sur l’action réduite (voir ch. 4.4.2) 7. pour s degrés de liberté nous avons évidemment L(x1 , . . . , xs , ẋ1 , . . . , ẋs ; t) 43 1.3. LE PRINCIPE DE MOINDRE ACTION quantités x et ẋ sont appelées variables d’état. Par exemple, pour le mouvement unidimensionnel d’une particule dans un potentiel V (x, t), nous verrons que le lagrangien vaut 1 L = mẋ2 − V (x, t) . 2 (1.7) 2. Pour toute trajectoire x(t), partant de x1 à l’instant t1 et allant vers x2 à l’instant t2 on définit l’action S par l’intégrale S= Z t2 t1 L(x, ẋ; t) dt . (1.8) Le principe de moindre action dit que la trajectoire physique effectivement suivie X(t) est telle que S est minimale, ou, plus généralement, extrémale. 44 Principes variationnels Chapitre 2 Mécanique analytique et calcul variationnel Au commencement était l’action. Johann Wolfgang von Goethe Nous avons établi le principe de base de la mécanique analytique. Il nous faut maintenant analyser ses conséquences. Cela nous amènera naturellement au coeur mathématique de notre propos : le Calcul variationnel d’Euler et Lagrange qui sera présenté en partie 1. C’est un pan étonnant des mathématiques, tant par son côté fédérateur que par le nombre de questions auxquelles il a permis de répondre. Nous en déduirons les équations d’Euler-Lagrange qui sont les équations de mouvement de la mécanique analytique. Nous n’aborderons pas les détails mathématiques du calcul variationnel, amplement traités dans la littérature [7], mais passerons rapidement aux résultats physiques. Dans la partie 2 nous analysons la forme du lagrangien dans les situations le plus simples. Elle se déduit largement de concepts de symétrie et d’invariance. La partie 3 est consacrée aux lois d’invariance des phénomènes physiques et aux lois de conservation qui en découlent. Le formalisme lagrangien est particulièrement bien adapté pour traiter de cette question. Nous verrons comment la conservation de l’énergie est liée à l’homogénéité du temps, celle de l’impulsion à l’homogénéité de l’espace, celle du moment cinétique à son isotropie. Au cours de cette discussion, nous introduirons la notion fondamentale de moment conjugué de Lagrange ou encore d’impulsion généralisée, qui joue un rôle central dans toute la suite. 45 46 Mécanique analytique et calcul variationnel Ensuite nous introduirons dans la partie 4 un outil technique important, dû lui aussi à Lagrange, les multiplicateurs dits de Lagrange. Puis dans la partie 5, nous passerons en revue quelques applications. D’abord, nous revenons - muni du calcul variationnel - aux rayons courbes. Ensuite nous regardons la forme d’une corde pesante, les lois de Kirchhoff, l’équation de Poisson en électrostatique et les bulles de savon. 2.1 Le calcul variationnel d’Euler et Lagrange Considérons d’abord un système uni-dimensionnel. Le principe de moindre action d’Euler et Lagrange prétend d’abord que la dynamique du système est déterminée par un lagrangien L(x, ẋ; t) dépendant de la position, de la vitesse et (éventuellement) explicitement du La trajectoire physique est R ttemps. 2 sélectionnée par le fait que l’action S = t1 L(x, ẋ; t) dt soit extrémale. Le problème posé est donc de trouver une fonction, ou une famille de fonctions, qui minimise une certaine intégrale. Sa résolution se fait par le calcul des variations ou encore le Calcul variationnel. On le doit à Euler qui en avait compris le fonctionnement et à Lagrange qui apporta d’importantes contributions. Le lecteur pourra consulter le cours de Jean-Pierre Bourguignon [7] comme traité mathématique du calcul variationnel. Nous cherchons donc la fonction x(t) d’une variable réelle t qui minimise (ou maximise) l’intégrale S= Z t2 t1 (2.1) L(x(t), ẋ(t); t) dt , où les extrémités t1 et t2 sont fixes, où ẋ(t) ≡ dx/dt et où le lagrangien L est une fonction connue 1 . Supposons qu’il existe une solution, la vraie trajectoire, que nous notons x = X(t). Considérons une trajectoire x(t) infiniment voisine de X(t), partant elle aussi de x1 à t1 , et aboutissant en x2 à t2 x(t) = X(t) + δx(t) , ẋ(t) = Ẋ(t) + δ ẋ(t) , δ ẋ(t) = d δx(t) dt (2.2) 1. C’est exactement, faut-il le préciser, le type de problème posé dans l’équation 1.5, sachant qu’en (1.5) la variable p x prend le rôle de t et la variable z prend le rôle de x . On remarque que la fonction n(z) 1 + z ′ (x)2 en (1.5) ne dépend pas de x qu’implicitement à travers de z(x) , et non pas explicitement, comme il serait le cas, par exemple, si n était fonction de x et de z en même temps. 47 2.1. LE CALCUL VARIATIONNEL D’EULER ET LAGRANGE avec par hypothèse (2.3) δx(t1 ) = δx(t2 ) = 0 . Au premier ordre en δx, la variation de S est Z t2 ∂L ∂L δx(t) + δ ẋ(t) dt . δS = ∂x ∂ ẋ t1 (2.4) Le second terme peut être intégré par parties puisque par définition δ ẋ = (d/dt)δx. Les termes tout intégrés ne contribuent pas, car δx(t1 ) = δx(t2 ) = 0. Par conséquent, la variation δS s’écrit : Z t2 ∂L d ∂L δx(t) dt . (2.5) − δS = ∂x dt ∂ ẋ t1 Le principe de moindre action affirme que δS doit être nul quelle que soit la variation infinitésimale δx(t). Par conséquent, l’équation du mouvement qui détermine la trajectoire effectivement suivie, est l’équation différentielle du second ordre appelée Equation d’Euler-Lagrange : d ∂L ∂L ( )= dt ∂ ẋ ∂x . (2.6) On vérifiera sans peine sur le cas simple (1.7) que l’on retrouve bien l’équation du mouvement habituelle ∂V mẍ = − ≡f ∂x où f est la force. La généralisation à s degrés de liberté (xi , ẋi ), i = 1, . . . , s est immédiate. Le lagrangien est une fonction L({xi }, {ẋi }; t) des variables {xi } et {ẋi } et (éventuellement) du temps t, et les équations du mouvement sont données par l’ensemble des équations de Euler-Lagrange d ∂L ∂L (2.7) = i = 1, . . . , s . dt ∂ ẋi ∂xi Pour une particle dans l’espace R3 nous employons la notation ∂L x ∂x ∂L ∂L ~ rL = ~ vL = , où r = y , ≡∇ ≡∇ ∂L ∂y ∂r ∂v ∂L z ∂z ∂L ∂vx ∂L ∂vy ∂L ∂vz (2.8) 48 Mécanique analytique et calcul variationnel de façon que l’équation (2.7) s’écrit ∂L d ∂L = dt ∂v ∂r 2.2 (2.9) . Le lagrangien Non-unicité du Lagrangien Pour savoir utiliser le principe de moindre action il faut évidemment comprendre quel lagrangien s’associe à quel système. La première remarque à faire est peut-être décourageante, puisque le lagrangien d’un système donné n’est pas unique. On vérifiera notamment que si on lui ajoute une dérivée totale par rapport au temps d’une fonction quelconque f ({xi }, t), L′ = L + d f ({xi }, t) dt (2.10) les équations du mouvement demeurent inchangées. Ceci suit directement du fait que l’intégrale du terme ajouté ne change pas dans une variation des xi (t) qui satisfait δxi (t1 ) = δxi (t2 ) = 0 2 . Rappelons qu’il est important de distinguer la signification des derivées totale d/dt et partielle ∂/∂t par rapport au temps. La dervivée totale d/dt tient compte aussi de la dépendance en temps due à l’évolution temporelle des coordonnées et vitesses le long de la trajectoire. Pour une seule variable x d ∂L ∂L ∂L L(x, ẋ; t) = ẋ + ẍ + . dt ∂x ∂ ẋ ∂t 6= 0 on parle d’un lagrangien qui dépend explicitement du Au cas où ∂L ∂t temps. On appelle «système isolé» un système lagrangien avec ∂L = 0. ∂t Forme du Lagrangien Cherchons donc le lagrangien le plus simple associé à un système physique donné. Commençons par le cas le plus élémentaire, celui d’une particule libre dans l’espace R3 . Son lagrangien provient du principe d’inertie, ou encore de l’invariance sous les transformations de Galilée (voir réf [9]) : 2. D’ailleurs on se convainc facilement de l’identité constat explicitement. d ∂ df dt ∂ ẋi dt = ∂ df ∂xi dt , pour vérifier ce 49 2.2. LE LAGRANGIEN 1. Il n’y a pas d’origine des temps privilégiée, par conséquent ∂L/∂t = 0 . 2. Il n’y a pas d’origine d’espace privilégiée, par conséquent ∂L/∂xi = 0 . 3. Il n’y a pas de direction dans l’espace privilégiée ; cette invariance par rotation implique que L ne dépend que du carré de la vitesse, soit L(v 2 ). Le forme la plus simple du lagrangien d’une particule libre est alors L = Kv 2 où K est une constante qu’on choisira comme étant égale à m/2. On obtient donc pour une particule libre Le lagrangien d’une particule libre L = m 2 v 2 . (2.11) On voit facilement qu’un choix plus général, sous la forme de L = f (v 2 ) , (f différentiable), mène à la même équation du mouvement 3 . 4. Dans ces conditions, dans un référentiel animé d’une vitesse constante V par rapport au premier, le lagrangien devient L′ = d m (v + V)2 = L + (mr · V + mV 2 t/2) , 2 dt et les équations du mouvement sont les mêmes dans les deux référentiels d’après le paragraphe précédent, voir (2.10). On peut donc revenir à (2.11). 5. Revenant au cas d’une particule soumise à un champ de force, on voit que le terme d’énergie potentielle dans (1.7) n’est qu’une définition de la force. Nous souhaitons, bien entendu, retrouver la loi fondamentale de Newton, et ce choix nous le garantit lorsque les forces dérivent de potentiels. 6. Généralisation Le lagrangien d’un ensemble de N points matériels dans un référentiel inertiel, exposés au potentiel V (r1 , . . . , rN ; t) - qui inclut les potentiels d’interaction entre particules - est N L= 3. on excluera f (x) = √ x 1X mi ṙ2i − V (r1 , . . . , rN ; t) 2 i=1 . (2.12) 50 Mécanique analytique et calcul variationnel Fonctionnement du principe d’optimisation Il est remarquable que les lois de la mécanique se déduisent d’un principe variationnel . La trajectoire physique est celle qui minimise ou optimise l’action. Cette optimisation apparaît ici comme réalisant un «compromis» entre l’effet de diverses contributions en «conflit» . En effet, en l’absence de force (V = cte dans (1.7)), S est minimum pour ẋ =cte, c’est-à-dire que le mouvement est rectiligne uniforme. En l’absence d’inertie, au contraire, la particule se logera au maximum du potentiel à l’instant de départ pour en «revenir» à l’instant d’arrivée. La présence du potentiel peut être considérée comme une propriété de l’espace qui courbe la trajectoire. Force et inertie apparaissent comme étant en conflit. La particule suit un chemin de «longueur» minimum, cette longueur étant mesurée par l’action S. Calcul variationnel et principe de Maupertuis Nous verrons en 4.4.2 que le principe de Maupertuis se comprend comme un cas particulier du principe de moindre action. Ici nous voulons montrer que l’équation pour la trajectoire que nous en déduisons, est la même que celle qu’on obtient de l’équation de Newton. Regardons donc un système conservatif d’énergie conservée et revenons à (1.6) qui est l’analogue de (1.5). Supposons, pour simplifier les notations, que la trajectoire se situe dans le plan (xOz) , et qu’elle puisse être paramétrée par la coordonnée x . Dans ce cas la trajectoire s’obtient à l’aide du calcul variationnel, à partir du «lagrangien» p 1 L(z(x), z ′ (x); x) = 2m(E − V (z(x), x)) (1 + z ′2 ) 2 , où nous avons utilisé dℓ = √ dx2 + dz 2 = √ 1 + z ′2 dx . L’équation d’Euler-Lagrange d ∂L ∂L = dx ∂z ′ ∂z nous donne après simplification 4 (− z ′′ ∂V ∂V ′ ) z + 2(E − V ) = − ′2 ∂x 1+z ∂z 4. On se souvient que la dérivée totale d/dx du potentiel donne (2.13) . dV dx = ∂V ∂z z′ + ∂V ∂x . 2.3. INVARIANCES ET LOIS DE CONSERVATION 51 Pour vérifier que les équations de Newton ∂V ∂V , mz̈ = − ∂x ∂z définissent la même trajectoire, il faut éliminer le paramètre temps dans ces équations : pour une courbe qui peut être paramétrée par la coordonnée x nous avons ż = z ′ ẋ , z̈ = z ′′ ẋ2 + z ′ ẍ . mẍ = − Les équations de Newton permettent d’éliminer ẍ et z̈, la conservation de l’énergie ż 2 + ẋ2 = m2 (E − V ) et la première des équations précédentes permettent d’éliminer ẋ et ż, de façon que la deuxième de ces équations peut finalement se récrire sous la forme 2(E − V ) ∂V ∂V = z ′′ + (− ) z′ (2.14) − ∂z 1 + z ′2 ∂x qui n’est autre que (2.13). 2.3 Invariances et lois de conservation Les lois d’invariance des phénomènes physiques sont fondamentales. Elles forment l’ensemble de ce que l’on sait a priori sur la physique d’un problème. Elles impliquent des lois de conservation, qui jouent un rôle fondamental en mécanique au travers des intégrales premières correspondantes. Dans des problèmes plus élaborés que ceux que nous avons considérés jusqu’ici, elles constituent le corpus de base pour construire le lagrangien d’un système (nous en avons donné un aperçu en discutant la forme du lagrangien libre ci-dessus). Un système à s degrés de liberté possède, a priori, 2s intégrales premières. En effet, l’évolution du système est complètement déterminée par la connaissance des 2s conditions initiales {xi (0), ẋi (0)}. Il y a donc, en principe, 2s relations entre les variables {xi (t), ẋi (t)} qui, à tout instant, permettent de recalculer {xi (0), ẋi (0)}. De manière générale seul un sous-ensemble de ces relations sont utiles en pratique. 2.3.1 Moments conjugués, impulsions généralisées Afin de discuter les lois de conservation, nous introduisons la notion fondamentale de moment conjugué de Lagrange. Pour un lagrangien donné les 52 Mécanique analytique et calcul variationnel quantités pi = ∂L ∂ ẋi (2.15) s’appellent moments conjugués des variables xi , ou encore impulsions généralisées . Dans le cas simple (2.12), pi = mẋi , mais cela cesse d’être vrai dans des coordonnées non cartésiennes ou, comme nous le verrons, lorsque les forces dépendent de la vitesse. On note que, d’après (2.7), l’évolution temporelle du moment conjugué pi est donné par ṗi = ∂L ∂xi , (2.16) que l’on peut considérer comme la forme généralisée de la loi de Newton. Au cas où ri décrit la position de la particle i dans l’espace R3 nous employons la notation (2.8) pour écrire ṗi = 2.3.2 ∂L ∂ri . (2.17) Changement de coordonnées, variables cycliques Dans le formalisme lagrangien, on peut évidemment faire tout changement de variables (x1 , x2 , . . . , xN ) → (q1 , q2 , . . . , qN ) , soit L({xi }, {ẋi }; t) → L′ ({qi }, {q̇i }; t) := L({xi }({qi }), {ẋi }({qi }, {q̇i }); t) . Dans un changement de variables, les équations d’Euler-Lagrange gardent la même forme, et l’on définit le moment conjugué pi d’une variable qi par la relation ∂L′ pi = (2.18) ∂ q̇i qui obéit à la même équation que (2.16) c’est-à-dire ṗi = ∂L′ /∂qi . On appelle coordonnées généralisées un ensemble quelconque de coordonnées qi . Pour l’exemple (x, y, z) → (r, θ, ϕ) , voir l’exercice 2.7. De façon générale, on nomme variable cyclique une variable qi qui ne figure pas explicitement dans le lagrangien L′ , c’est-à-dire que ∂L′ =0 . ∂qi 53 2.3. INVARIANCES ET LOIS DE CONSERVATION Dans ce cas, le moment conjugué pi = ∂L′ /∂ q̇i est conservé pi = Cte. La recherche de variables cycliques joue un rôle important dans la résolution des problèmes de mécanique, en raison des lois de conservation qui en découlent. 2.3.3 Énergie et translation dans le temps Supposons le système isolé, c’est-à-dire ∂L/∂t = 0. Une autre façon d’énoncer cette hypothèse est de dire que le problème est invariant par translation dans le temps, ou encore que le temps est homogène. Evaluons l’évolution de L(x, ẋ) le long de la trajectoire x(t) effectivement suivie ∂L ∂L d dL (x, ẋ) = ẋ(t) + ẍ(t) = dt ∂x ∂ ẋ dt ∂L ẋ(t) ∂ ẋ (2.19) où nous avons transformé le premier terme en tenant compte de l’équation d’Euler-Lagrange (2.6). On en déduit d ∂L ẋ(t) −L =0 . dt ∂ ẋ (2.20) On appelle énergie E la valeur de la quantité ∂L −L ẋ(t) ∂ ẋ resp. s X i=1 ẋi (t) ∂L −L ∂ ẋi (2.21) le long de la trajectoire physique. Par conséquent, pour un système isolé, ou encore lorsqu’il y a invariance par translation dans le temps, l’énergie est conservée. C’est une intégrale première du mouvement. Dans le cas (2.12), l’énergie est bien la somme de l’énergie cinétique et de l’énergie potentielle E= N X mi ṙ2 i i=1 2 + V (r1 , . . . , rN ; t) . (2.22) En utilisant les moments conjugués de Lagrange, la définition de l’énergie s’écrit X E= pi ẋi − L . (2.23) i 54 2.3.4 Mécanique analytique et calcul variationnel Impulsion et translations dans l’espace Supposons que le problème est invariant par translation dans l’espace. C’est le cas d’une particule libre, mais c’est également le cas d’un système de particules dont les interactions ne dépendent que des coordonnées relatives : V ({ri − rj }). Dans cette hypothèse, pour toute transformation infinitésimale ri → ri + ~ε le lagrangien est invariant δL = X ∂L i ∂ri · ~ε = 0 ∀~ε , soit X ∂L ∂ri i =0. (2.24) Pour un système dont le lagrangien est de la forme (2.12) avec un potentiel V ({ri − rj }) , la relation (2.24) n’est autre que le principe de l’action et de la réaction de Newton. Soit, en effet, un système de deux particules interagissant au travers d’un potentiel V (r1 − r2 ), on obtient ~ 1 V = +∇ ~ 2 V = −f2 f1 = −∇ (2.25) . Cependant, le résultat (2.24) a une autre interprétation. Utilisant les définitions (2.15) des impulsions généralisées et les équations du mouvement, cette relation s’écrit en effet N d d X pi ≡ P = 0 (2.26) dt i=1 dt P où P est l’impulsion totale P = N i=1 pi . L’invariance par translation dans l’espace implique la conservation de l’impulsion totale d’un système de particules. On voit de la même manière que l’invariance par translations en direction x implique la conservation de Px , la composante selon x de P etc. de façon que la conservation P est correspond à 3 quantités conservées simultanément. 2.3.5 Moment cinétique et rotations Considérons maintenant les rotations. Une rotation infinitésimale d’un angle δφ autour d’un axe porté par le vecteur unitaire û transforme les positions et vitesses comme ri → ri + δφ û × ri , ṙi → ṙi + δφ û × ṙi . 55 2.3. INVARIANCES ET LOIS DE CONSERVATION Dans cette transformation, la variation du lagrangien est δL = ou encore X ∂L ∂L ( · (δφ û × ri ) + · (δφ û × ṙi )) ∂r ∂ ṙ i i i δL = X i ∂L ∂L + ṙi × ri × ∂ri ∂ ṙi ! (2.27) · û δφ . S’il y a invariance par rotation, alors δL = 0 quel que soit δφ û. En revenant à la définition des moments conjugués et de leurs dérivées, on obtient en utilisant les équations du mouvement X (ri × ṗi + ṙi × pi ) = 0 i soit d X d X d ri × pi ≡ Li = L = 0 , dt i dt i dt (2.28) où le moment cinétique (généralisé) Li de chaque particule et le moment cinétique (généralisé) total L sont définis par X Li = ri × pi , L= Li . (2.29) i Nous avons donc montré : A l’invariance par rotation d’un système correspond la conservation du moment cinétique total. 2.3.6 Symétries dynamiques Un problème peut avoir des symétries, plus ou moins cachées, d’origine dynamique. Nous verrons, au chapitre 4, les symétries multiples de l’oscillateur harmonique. Une symétrie bien connue dans le problème de Kepler V (r) = −g 2 /r, soit L = mv 2 /2 + g 2/r, provient de la conservation du vecteur de Runge-Lenz p×L r A= − g2 (2.30) m r où p est l’impulsion et L = r × p le moment cinétique de la particule en orbite. Dans le problème de Kepler, on doit déterminer six grandeurs à tout 56 Mécanique analytique et calcul variationnel instant : r(t), ṙ(t). La conservation du moment cinétique et de l’énergie fixe 4 de ces grandeurs. La conservation de la direction du vecteur de Runge-Lenz fixe une grandeur restante, voir l’exercice 4.8. Par conséquent la résolution du problème ne nécessite pas de «quadrature» (ou intégration). Une conséquence est que les trajectoires compactes sont fermées, ce qui est exceptionnel : seuls les potentiels harmonique (∝ r 2 ) et newtonien (∝ 1/r) conduisent à cette propriété. 2.4 Multiplicateurs de Lagrange A ce stade nous rappelons rapidement un outil technique presqu’omniprésent dans le contexte de problèmes d’optimisation. De manière générale la quantitié qu’on cherche à optimiser est soumise à des contraintes qu’il faut respecter 5 . Une manière souvent commode de tenir compte des contraintes est d’introduire des multiplicateurs de Lagrange. Un exemple simple serait de trouver le point le plus haut non pas d’une montagne mais d’un chemin dessiné sur cette montagne. Mathématiquement ce problème revient à trouver le maximum d’une fonction f (x, y) sous une contrainte g(x, y) = 0 (qui détermine le chemin). Supposons que la contrainte peut s’écrire sous forme explicite y − y0 (x) = 0 (au moins localement). Bien entendu, on peut injecter l’équation du chemin dans f et calculer x tel que ∂f ∂f d d f (x, y0(x)) = + (y0 (x)) = 0 . dx ∂x ∂y dx (2.31) La méthode de Lagrange consiste par contre à introduire un nouveau paramètre λ appelé multiplicateur de Lagrange et à chercher l’extrémum de la fonction f (x, y) + λ g(x, y) . (2.32) L’annulation des dérivées par rapport à x, y donne les équations ∂f ∂g +λ = 0, ∂x ∂x ∂f ∂g +λ =0. ∂y ∂y (2.33) 5. Un exemple important d’une telle situation est le principe de base de la thermodynamique à l’équilibre : l’équilibre thermique correspond à une situation qui maximise l’entropie compte tenu des contraintes qu’on impose sur l’énergie, le volume ... de l’échantillon considéré. Ce principe sera analysé en physique statistique. 57 2.4. MULTIPLICATEURS DE LAGRANGE Pour les solutions (x(λ), y(λ)) de ces équations on fixe λ de façon que la contrainte soit respectée : g(x(λ), y(λ)) = 0 . Dans ce cas simple l’équivalence des deux méthodes se voit facilement : puisque (localement) g(x, y) = 0 ⇔ y − y0 (x) = 0, on obtient pour (2.33) dy0 ∂f −λ = 0 (1) , ∂x dx ∂f + λ = 0 (2) , ∂y (2.34) et l’élimination de λ entre (1) et (2) revient à l’équation de départ (2.31). L’avantage de la méthode de Lagrange consiste dans le fait qu’elle ne demande pas d’exprimer la contrainte sous forme explicite, ce qui peut être difficile (voir l’exemple de la corde pesante ci-dessous), surtout pour des problèmes à plusieurs variables. Cette forme explicite est indispensable dans le procédé pédestre (2.31). La méthode de Lagrange se généralise à une fonction f ({xi }) d’un nombre quelconque de variables xi , i = 1, . . . , n reliées par un nombre quelconque p de contraintes indépendantes gk ({xi }) = 0, k = 1, . . . , p avec p < n . Elle se résume comme suit : i) On pose F (x1 , . . . , xn , λ1 , . . . , λp ) = f ({xi }) + λ1 g1 ({xi }) + . . . + λp gp ({xi }) , et on cherche les extrema de F en supposant les {xi } indépendantes. On cherche donc les solutions du système à n équations ∂F/∂xi = 0 . Ces solutions sont fonctions des p multiplicateurs λk . ii) Pour déterminer les valeurs de ces multiplicateurs on reporte la solution {x∗i (λ1 , . . . , λp )} dans les p contraintes gk ({x∗i }) = 0 . Ce sont p équations pour les p multiplicateurs. iii) Après résolution de ces p équations on reporte le résultat dans les x∗i . On obtient alors un extremum de f , tenant compte des contraintes gk = 0 . Pour se convaincre de l’équivalence de la méthode de Lagrange avec la procédure explicite, on pourra procéder comme suit : Supposons que f ({xi }) soit extrémale en un point {x∗i } qui respecte les contraintes : gk ({x∗i }) = 0, k = 1, . . . , p. Si les contraintes sont mutuellement indépendantes, on peut les paramétrer localement en terme de n − p coordonnées y1 , . . . , yn−p , et on trouve ∂gk ~ ~x gk ) · ∂~x = 0 , = (∇ ∂yj ∂yj puisque gk (~x(~y )) ≡ 0 , (2.35) où nous avons noté ~x = (x1 , . . . , xn ) et ~y = (y1 , . . . , yn−p ) . D’autre part nous avons aussi ∂f ~ ~x f ) · ∂~x = 0 = (∇ ∂yj ∂yj 58 Mécanique analytique et calcul variationnel pour un point extrémal {x∗i } ≡ ~x∗ = ~x(~y ∗ ) . On en déduit que, dans un point extrémal, ~ ~x f est orthogonal (au plan tangentiel) à la surface décrite par les contraintes le vecteur ∇ gk , et il peut donc s’écrire sous forme de combinaison linéaire ~ ~x f = − ∇ p X k=1 ~ ~x gk . λk ∇ D’où le résultat recherché : il existe des nombres réels λk , k = 1, . . . , p , tel que ! p X ∂ λk gk = 0 au point extrémal ~x∗ . f+ ∂xi (2.36) k=1 Inversement considérons les solutions de la relation (2.36) en fonction des paramètres λk . Si, pour un choix approprié des λk , une solution ~x∗ (λ1 , . . . , λp ) vérifie les contraintes ~ ~x f à la surface des contraintes en gk (~x∗ ) = 0 , alors (2.36) implique l’orthogonalité de ∇ ∗ ce point (de coordonnées locales ~y ), voir ci-dessus (2.35), et on a donc ∂f ~ ~x f ) · ∂~x = 0 = (∇ ∂yj ∂yj en ~x∗ = ~x(~y ∗ ) , de façon que ~x∗ = ~x(~y ∗ ) est un point extrémal de f respectant les contraintes. 2.5 2.5.1 Exemples Rayons courbes Reprenons le cas des rayons courbes de (1.1.2) muni de nos connaissances du calcul variationnel. Considérons l’intégrale (1.5) et supposons que l’indice de réfraction varie avec la hauteur comme n(z) = 1+νz avec ν > 0 (cette formule ne s’appliquant que pour des valeurs limitées de z) et que les extrémités A et B correspondent à la même altitude : z(x = 0) = h et z(x = l) = h. La fonction de Lagrange L(z(x), z ′ (x), x) est alors √ 1 L = (1 + νz) 1 + z ′ 2 c , d’où l’on déduit - de la même façon que nous avons obtenu (2.13) - l’équation d’Euler-Lagrange (1 + νz) z ′′ = ν(1 + z ′ 2 ) . (2.37) En effectuant le changement de fonction u = z + 1/ν et en reportant dans (2.37) on obtient u u′′ = 1 + u′ 2 (2.38) 59 2.5. EXEMPLES dont la solution générale est u = d cosh((x − b)/d) (2.39) où b et d sont des constantes. Une façon d’aboutir à ce résultat consiste à dériver (2.38) une fois. On obtient u′′′ /u′′ = u′ /u dont la «solution» est u′′ = Cu, où C est une constante arbitraire. La solution de cette dernière équation est u = a cosh((x − b)/d), où d2 = 1/C, et en reportant dans (2.38) on trouve a = d. 6 . En imposant les conditions aux limites z(x = 0) = h et z(x = l) = h, on obtient donc le résultat z = a cosh( x − l/2 ) − 1/ν a avec a cosh( l ) − 1/ν = h . 2a (2.40) Dans ce modèle ultra-simple, le chemin du rayon lumineux est une chaînette de hauteur minimale en x = l/2 (symétrie du problème). 2.5.2 Forme d’une corde pesante Soit une corde massive de masse linéique constante µ et de longueur L dans le plan (xOz), placée dans le champ de pesanteur constant dirigé suivant la verticale z. La corde est fixée à ses extrémités, en A, choisi comme l’origine (x = 0, z = 0), et en B (x = a, z = z1 ). On se pose le problème de déterminer la forme de la corde à l’équilibre. On suppose bien entendu que a2 + z12 ≤ L2 . L’équilibre correspond à la configuration où l’énergie potentielle gravitationnelle de la corde est minimale. Soit z(x) une forme quelconque de la corde. Un élément de la corde dans l’intervalle [x, x + dx] est de longueur dl2 = dx2 + dz 2 = (1 + z ′ (x)2 ) dx2 et son énergie potentielle est dV = µg z dl (g est l’accélération de la pesanteur). Il s’agit donc de minimiser l’intégrale Z a p (2.41) V = µg z(x) 1 + z ′ (x)2 dx 0 sous la contrainte 7 L= Z 0 a p 1 + z ′ (x)2 dx . (2.42) 6. On obtient le résultat (2.39) de façon plus élégante en utilisant une loi de conservation, voir (2.5.2) 7. La contrainte apparaît ici sous forme d’intégrale. Là encore on peut en tenir compte à l’aide d’un paramètre de Lagrange, comme on le voit par un argument de discrétisation [11], ch.3.2.2. 60 Mécanique analytique et calcul variationnel Il est convenable de tenir compte de cette contrainte en introduisant un multiplicateur de Lagrange λ (voir 2.4), donc de minimiser la quantité Z a √ V + λL = µg(z − zλ ) 1 + z ′ 2 dx , (2.43) 0 où nous avons écrit λ = −µgzλ . L’équation d’Euler-Lagrange donne (z − zλ ) z ′′ = 1 + z ′ 2 (2.44) qui ressemble à (2.38) et dont la solution est une chaînette x − x0 ). (2.45) c Elle dépend de 3 paramètres zλ , c, et x0 , qu’on peut exprimer en terme des conditions aux limites et de la contrainte sur la longueur L x0 z(0) = 0 ⇒ zλ = −c cosh( ) c a − x0 x0 z(a) = z1 ⇒ z1 = c cosh( ) − cosh( ) , c c Z a Z ap a − x0 x0 x − x0 ) dx = c sinh( )+sinh( ) . 1 + z ′ (x)2 dx = cosh( L= c c c 0 0 Dans la solution on voit une symétrie par dilatations : si l’on multiplie toutes les quantités homogènes à une longueur par le même facteur κ on obtient une solution pour une corde de longueur κ L qui passe par les points (0, 0) et (κa, κz1 ) . Dans ce cas c est remplacé par κ c . C’est donc c qui caractérise les unités de longueur choisies. Cette symétrie est due au fait que le lagrangien de départ ne dépend pas d’une échelle de longueur explicite. Nous trouvons pour le rapport de z1 et de L z(x) = zλ + c cosh( 0 cosh( a−x ) − cosh( xc0 ) z1 a − 2x0 c = ). = tanh( a−x0 x0 L 2c sinh( c ) + sinh( c ) (2.46) Le minimum de la chaînette est situé au point x0 qui peut ou non se trouver dans l’intervalle [0, a]. De (2.46) nous tirons (pour c = 1) x0 = a/2 − arth(z1 /L) , (2.47) ce qui implique x0 → −∞ pour z1 /L → 1 (corde verticale orientée vers le haut), x0 = a/2 pour z1 = 0 (corde symétrique par rapport à a/2 ), et x0 → ∞ pour z1 /L → −1 (corde verticale orientée vers le bas). 61 2.5. EXEMPLES Utilisation d’une loi de conservation Revenons à l’équation (2.43). Le lagrangien est (à des constantes multiplicatives près) p L ∝ (z(x) − zλ ) 1 + z ′ (x)2 . L ne dépend pas explicitement de la variable x. Par conséquent, la quantité pz ′ − L, où p est le moment conjugué de z, est une intégrale première, constante le long de la courbe, donc une quantité « conservée ». On obtient sans difficulté √ p = (z − zλ )z ′ / 1 + z ′ 2 , et donc √ √ pz ′ − L = −(z − zλ )/ 1 + z ′ 2 = −c ⇒ z − zλ = c 1 + z ′ 2 , où c est une constante. Posons, par définition de φ(x), z ′ (x) = sinh φ(x) . Il vient z(x) − zλ = c cosh φ(x) soit z ′ = cφ′ sinh φ , d’où évidemment cφ′ (x) = 1 et la solution z(x) − zλ = c cosh((x − x0 )/c) donnée en (2.45). L’utilisation de cette intégrale première a ramené l’équation différentielle à résoudre du deuxième au premier ordre. De façon générale, si l’on considère un lagrangien de la forme √ (2.48) L(z, ż; t) = f (z) 1 + ż 2 , le moment conjugué de z est f (z)ż p= √ 1 + ż 2 (2.49) . Puisque le lagrangien ne dépend pas explicitement de la variable t, il y a conservation de la quantité f (z) A = pż − L = − √ 1 + ż 2 , dont la valeur est fixée par les conditions initiales. On obtient donc r f (z) 2 2 2 2 A (1 + ż ) = f (z) soit ż = ± ( ) −1 . A (2.50) (2.51) La solution générale se ramène donc à une simple quadrature (ou intégration) Z z dz q = t − t0 . (2.52) ± f (z) 2 z0 ( A ) −1 62 Mécanique analytique et calcul variationnel C’est l’analogue de la méthode usuelle d’intégration de l’équation du mouvement lorsqu’il y a conservation de l’énergie. 2.5.3 Lois de Kirchhoff Soit à déterminer les intensités respectives I1 et I2 du courant dans les deux branches, de résistance R1 et R2 du circuit représenté sur la figure 2.1. Le courant entrant a une intensité I. Le résultat s’obtient aisément par les lois d’Ohm-Kirchhoff. Le principe variationnel consiste ici à supposer que les pertes par effet Joule sont les plus petites possibles. Autrement dit trouver le minimum de W = R1 I12 + R2 I22 avec la contrainte I1 + I2 = I (qu’on pourra s’exercer à exprimer par l’introduction d’un multiplicateur de Lagrange). En dérivant l’expression W = R1 I12 +R2 (I −I1 )2 par rapport à I1 , on obtient sans difficulté R1 I1 = R2 I2 c’est-à-dire le résultat obtenu en posant que le potentiel V entre les deux noeuds est donné. Remarquons que nous nous sommes affranchis de la notion de potentiel. Nous avons remplacé la notion locale de différence de potentiel par une condition énergétique globale, et un principe plus simple. I I1 R 1 I2 R 2 I Figure 2.1 – Elément simple de circuit électrique avec bifurcation. Pour quelconque, le principe est que la perte globale par effet P un circuit 2 Joule k Rk Ik est minimum. On retrouve, bien entendu, les lois de Kirchhoff. Pour un circuit relativement simple les deux approches sont équivalentes. Elles le sont moins en pratique pour un réseau de transport d’électricité comportant, par exemple, dix millions d’éléments. Inverser en temps réel une matrice 107 × 107 est irréaliste, alors que les méthodes mathématiques d’optimisation sont infiniment plus commodes à utiliser. 63 2.5. EXEMPLES 2.5.4 Potentiel électrostatique Considérons maintenant un problème un peu plus compliqué. Il s’agit de déterminer le potentiel électrostatique φ(r) créé par une distribution de charges donnée ρ(r). On sait que la forme cherchée est la loi de Poisson ∆φ = − ρ ε0 (2.53) . Elle se déduit du principe variationnel suivant que l’on peut retrouver comme cas particulier d’un principe plus général concernant les équations de Maxwell, voir 3.2.3. Le champ électrostatique s’exprime R 2 à3 partir du potentiel par ε0 ~ E = −∇φ et l’énergie du champ est EE = 2 E d r. L’énergie potentielle électrostatique de la distribution de charges ρ(r) dans le potentiel φ(r) est R Eρ = ρ(r) φ(r) d3r. Le principe variationnel est que le potentiel φ(r) recherché rend minimale la différence de ces deux énergies. Considérons l’intégrale Z ~ 2 − ρ(r)φ] d3 r . U = [(ε0 /2)(∇φ) (2.54) Le problème posé est de trouver le potentiel φ(r) qui minimise cette expression. Notons les points suivants : 1. Nous supposons qu’il n’y a pas de charges à l’infini, si bien que φ peut être choisi comme nul à l’infini. Les intégrales portent sur tout l’espace. 2. Puisque le premier terme est positif, s’il existe un minimum de cette expression pour une fonction φ(r), ce minimum correspond à une situation d’équilibre entre deux contributions à l’énergie totale en « compétition ». Tout « excès » d’une de ces deux formes de l’énergie électrique correspond à une situation instable. 3. Par comparaison au problèmes du rayon courbe 2.5.1 ou de la corde 2.5.2, c’est ici le champ φ et son gradient ∇φ qui jouent les rôles précédemment tenus par la variable z et sa dérivée z ′ . La variable x des problèmes simples précédents est maintenant r ∈ R3 . Soit φ la solution recherchée, et η(r) une variation infinitésimale de ce potentiel. Dans la variation φ → φ + η on a, au premier ordre, ~ 2 → (∇φ) ~ 2 + 2∇φ ~ · ∇η ~ (∇φ) . 64 Mécanique analytique et calcul variationnel Par conséquent, la variation de (2.54) est Z ~ · ∇η) ~ − ρ η ] d3 r . δU = [ε0 (∇φ (2.55) En intégrant le premier terme par parties et en tenant compte de l’annulation de φ à l’infini, on obtient Z Z 3 ~ · ∇η) ~ d r = − ∆φ η d3 r (∇φ soit δU = Z [−ε0 ∆φ − ρ ] η d3 r . (2.56) Le fait que δU = 0 quel que soit η(r) infinitésimal, entraîne la loi de Poisson (2.53). Un cas particulier est celui où la densité de charge est nulle. Nous entendons par là qu’il y a un certain nombre de conducteurs chargés chacun porté à un potentiel donné V1 , V2 , · · · , Vn . Il y a certes une densité de charge surfacique mais la charge volumique ρ est partout nulle. Soient Σ1 , Σ2 , · · · , Σn les surfaces des conducteurs, l’équation (2.56) se ramène à ∆φ = 0 avec les n contraintes φ = Vi sur Σi . 2.5.5 Bulles de savon Figure 2.2 – Bulle de savon tendue sur deux cercles. L’énergie potentielle d’une bulle de savon d’aire A est V = σA où σ est la constante de tension superficielle du savon. On tend une bulle de savon entre 65 2.5. EXEMPLES deux cercles coaxiaux de même rayon R, comme schématisé sur la figure 2.2. L’axe Oz est l’axe commun perpendiculaire aux deux cercles, qui sont centrés en z = −h et z = h respectivement. Le problème est de trouver la surface d’aire minimale tendue entre les deux cercles en fonction de leur distance d = 2h. Considérons l’intervalle [z, z +dz] et r(z) le rayon d’une section transverse de la surface symétrique de révolution. Il s’agit de minimiser l’énergie Z h q σA = σ 2π r(z) 1 + r ′ (z)2 dz −h avec les conditions aux limites r(−h) = r(h) = R. Le problème est semblable à celui de la corde (2.41). La solution est r = a cosh(z/a), avec R = a cosh(h/a) . Cette surface de révolution autour de Oz , engendrée par un chaînette, porte le doux nom de caténoïde. On pourra s’exercer à trouver les formes prises par de bulles tendues sur des supports plus compliqués. Le fait que les exemples précédents aboutissent tous à des chaînettes est dû à la simplicité de leur résolution mathématique. Exercices 2.1 Intégrale première Dans le calcul p de rayons courbes 2.5.1, montrer par un calcule direct que Γ(x) = z(x)/ 1 + z ′ (x)2 est une constante le long de la courbe. En déduire la solution. 2.2 Brachistochrone Un des problèmes favoris des mathématiciens et mécaniciens est celui du brachistochrone. On considère deux points O et A dans un plan vertical, et une courbe C les joignant. On lâche en O, sans vitesse initiale, une masse qui glisse sans frottement sur la courbe sous l’effet de la pesanteur. On veut déterminer la courbe C telle que le temps nécessaire à la masse pour aller de O en A, soit minimum. (Cet exercice n’est pas facile. Une version «guidée» se trouve dans le recueil des contrôles antérieurs sous le titre «Gagner un slalom».) 66 Mécanique analytique et calcul variationnel Historiquement l’énoncé du problème brachistochrone en 1696 peut être considéré comme le vrai acte de naissance du calcul des variations. Il suscite la recherche de méthodes générales progressivement élaborées au cours d’une véritable compétition. La première solution vient de Jean Bernoulli en 1697. Il part de son analogie au principe de Fermat et résout le problème par discrétisation. 2.3 Rayons courbes et super-réfraction d’ondes radio 1. On s’intéresse à la propagation d’un rayon lumineux dans un milieu d’indice de réfraction variable n(x, y) ≥ 1 dans le plan xOy . Ecrire l’intégrale qui donne de le temps de propagation TAB de la lumière pour aller du point A au point B . 2. Le plan peut être paramétré en coordonnées polaires x = r cos φ , y = r sin φ . On suppose que l’indice n n’est fonction que de la variable radiale r : n = n(r) , et que le rayon lumineux allant de A(r1 , φ1 ) à B(r2 , φ2 ) peut être paramétré par la variable φ. Réécrire le temps TAB sous forme d’une intégrale portant sur la variable φ, dont l’intégrant est fonction de r(φ) et de ṙ(φ) , où ṙ = dr/dφ . On appellera cette fonction lagrangien L . 3. Le lagrangien L ne dépend pas explicitement de la variable φ . En déduire l’existence d’une quantité conservée le long du rayon lumineux, et donner son expression. On appellera E cette quantité conservée. 4. Utiliser E pour exprimer ṙ(φ) en fonction de r, n, E . 5. Dans quelle condition l’expression précédente décrit-elle une trajectoire circulaire ? On se placera dans une situation proche de celle-ci par la suite. 6. Déduire de l’expression pour ṙ(φ) la relation r̈ = r (1 + r dn ), n dr dans la situation où n2 r 2 ≃ E2 . c2 (2.57) Indication : dériver la relation pour ṙ par rapport à φ, éliminer ṙ grâce 2 2 à la relation trouvée en 4., et prendre la limite nc2r → E 2 à la fin. 7. Une valeur moyenne de ( dn dr dans les basses couches atmosphériques est dn )moy = −0, 39 · 10−4 km−1 , dr 67 2.5. EXEMPLES Figure 2.3 – Sous-réfraction et super-réfraction d’une onde radar émise par une antenne dans l’atmosphère terrestre ce qui correspond au régime standard dans la Fig. 2.3. Comment se situent les valeurs de dn dans les régimes de sous-réfraction et de superdr réfraction par rapport à cette valeur ? 8. Pour une onde radio émise par une antenne tel que r(0) = R et ṙ(0) = 0 (donc horizontalement), donner la valeur de dn/dr en km−1 , pour laquelle l’onde radio suit un grand cercle autour de la terre. On peut approcher n(r) pour l’air - qui vaut ≃ 1, 0003 - par 1 . Le rayon de la terre R est de 6370 km. 2.4 Stratégie d’une régate. Un voilier avance à la vitesse v(θ) qui est fonction de l’angle θ entre la vitesse du vent et celle du bateau, et de la norme w de la vitesse du vent. On suppose que la vitesse du bateau v est proportionnelle à celle du vent w, mais dépend de l’angle θ, choisi par le capitaine du bateau. On écrit cette vitesse sous la forme v(θ) = w , cos(θ) h(tan θ) 1 1 avec h(u) = (u + ) . 2 u (2.58) On s’intéresse à la stratégie de "remontée au vent" du bateau, c’est-à-dire θ ≤ π/2, comme on le représente sur la figure (2.5.5). La vitesse vx du bateau le long de Ox est opposée à celle du vent, et sa coordonnée x augmente toujours en fonction du temps. On suppose une côte linéaire (terre = demiplan z < 0, mer = demi-plan z > 0). On suppose que le vent est parallèle à la côte, de direction opposé à l’axe 68 Mécanique analytique et calcul variationnel vitesse du bateau de norme v v θ w vitesse du vent de norme w z z=z 2 L x Terre Figure 2.4 – Plan d’eau et schéma de la direction du bateau par rapport à celle du vent. Ox, et que la norme de sa vitesse w(z) ne dépend que de l’éloignement à la côte z. La vitesse du vent a la forme : w(z) = w0 − w1 z0 , z + z0 (2.59) où w0 est la vitesse du vent loin de la côte, qui est supérieure à la vitesse (w0 − w1 ) ≥ 0 au bord de la côte z = 0. 1. On note : dx , dt Montrer que z ′ = tan θ. ẋ = ż = dz , dt z′ = dz dx . 2. On suppose d’abord le vent uniforme (w = constante, w1 = 0). Ecrire la vitesse du bateau suivant l’axe du vent vx = ẋ en fonction de w et h(tanθ). Pour quelle valeur de θ et de z ′ cette vitesse est-elle maximum ? Quelle est alors sa valeur ? 3. On suppose maintenant que w1 6= 0. Le bateau va du point de départ, l’origine (x = 0, z = 0), à un point d’arrivée au large (x = L, z = z1 ). On suppose que z ′ ≥ 0 pour tout t (c’est-à-dire que le bateau ne vire jamais de bord). On veut déterminer la trajectoire z(x) la plus rapide. Ecrire le temps dt mis, sur cette trajectoire, pour aller de x à x + dx en terme des fonctions w et h. Ecrire la valeur du temps total T pour aller du départ à l’arrivée. 69 2.5. EXEMPLES 4. En déduire l’équation qui détermine la trajectoire optimale. 5. Montrer que l’invariance du problème par translation suivant Ox entraîne h′ (z ′ )z ′ − h(z ′ ) =A w(z) où A est une constante. 6. Utiliser le résultat précédent pour calculer la trajectoire sous la forme d’une fonction x(z) (et non pas d’une fonction z(x)). Fixer la valeur de la constante A. 7. Calculer la valeur de z ′ = dz/dx en fonction de z. On suppose que z1 ≪ L et z1 ≪ z0 . Pensez-vous que le résultat obtenu corresponde effectivement à la meilleure stratégie ? Sinon, quelle modification doiton apporter ? 2.5 Pendule mobile On considère un pendule de longueur l et de masse m2 suspendu à un point de masse m1 qui se déplace horizontalement sur un rail (sans frottement). On note x l’abscisse de m1 et φ l’angle du pendule avec la verticale. Ecrire le lagrangien de ce système. 2.6 Propriétés de l’action a) Calculer l’action le long de la trajectoire physique en fonction des positions et instants de départ x1 , t1 et d’arrivée x2 , t2 1. pour une particule libre, de lagrangien L = mẋ2 /2 2. pour un oscillateur harmonique L = mẋ2 /2 − 3. pour une force constante L = mẋ2 /2 − F x. mω 2 2 x2 b) Montrer que le moment conjugué p2 = ( ∂L )| au point d’arrivée x2 ∂ ẋ x=x2 vaut ∂S12 . p2 = ∂x2 c) Montrer que l’énergie E = pẋ − L au point d’arrivée x2 est donnée par E2 = − ∂S12 ∂t2 . 70 Mécanique analytique et calcul variationnel 2.7 Moments conjugués en coordonnées sphériques. On considère une particulepnon-relativiste de masse m placée dans un potentiel central V (r) où r = x2 + y 2 + z 2 . On note v ≡ ṙ la vitesse et v 2 son carré. On étudie le problème en coordonnées sphériques (r, θ, φ) définies par x = r sin θ cos φ , y = r sin θ sin φ , z = r cos θ (2.60) . Le carré de la vitesse est alors v 2 = ṙ 2 + r 2 θ̇2 + r 2 sin2 θ φ̇2 . (2.61) 1. Ecrire le lagrangien de la particule en coordonnées sphériques. 2. Calculer les moments conjugués pr , pθ et pφ . 3. Montrer que le moment pφ est égal au moment cinétique Lz dont l’expression en coordonnées cartésiennes est Lz = xpy − ypx . 4. A quelle loi d’invariance correspond la conservation de Lz ? 5. Si la particule est chargée et que l’on plonge le système dans un champ ~ parallèle à Oz, la composante Lz est-elle conservée ? magnétique B Chapitre 3 Théorie lagrangienne de l’électromagnétisme Si tous disent que tu es un âne, il est temps de braire. Le Talmud, Baba Kamma. Les exemples de systèmes physiques que nous avons traités jusqu’ici en formalisme lagrangien, ont été des systèmes de particules non-relativistes, en interaction mutuelle et/ou dans un champ de force dérivant d’un potentiel externe. Il est évident que l’électromagnétisme sort de ce cadre pour plusieurs raisons. Tout d’abord, même si l’on ne considère qu’une seule particule chargée non-relativiste dans l’approximation où le champ électromagnétique est traité comme un champ externe fixé, nous savons bien qu’elle subit la force de Lorentz f = q (E + v × B) . (3.1) Cette force dépend de la vitesse et ne dérive pas d’un potentiel. La force magnétique q v × B ne travaille pas. Ensuite l’électromagnétisme est une théorie invariante de Lorentz. L’invariance relativiste devrait donc se manifester dans la description lagrangienne dès le départ. En effet, ce sera le principe de l’invariance relativiste qui nous servira de guide pour proposer une expression, d’abord pour le lagrangien d’une particule libre, ensuite pour celui d’une particule chargée placée dans un champ électromagnétique. Nous vérifierons, bien sûr, que la limite nonrelativiste nous rendra la force de Lorentz. 71 72 Théorie lagrangienne de l’électromagnétisme Enfin une théorie complète de l’électromagnétisme requiert d’intégrer les champs électromagnétiques eux-mêmes dans le formalisme lagrangien. Un champ qui peut prendre des valeurs a priori arbitraires dans tous les points de l’espace est évidemment un système à un nombre de degrés de liberté infini. Le formalisme lagrangien trouve sa pleine puissance dans ces cas. La mécanique des milieux continus peut servir d’un autre exemple de tels systèmes. Nous allons voir comment le formalisme lagrangien se prête à la théorie des champs. En soi, la théorie des champs est un vaste domaine qui atteint sa plénitude lorsque l’on aborde la quantification des champs et les théories des interactions fondamentales [16]. Dans ce chapitre nous ne souhaitons donner que les principes de la théorie lagrangienne des champs et son application au champ électromagnétique. Dans la partie 1, nous commençons par traiter du cas d’une particule relativiste libre. Nous nous restreindrons au cas d’une particule massive. Le fondement de notre propos sera alors l’invariance de Lorentz. Le principe de moindre action ne peut avoir de sens que si il détermine le mouvement de la particule de la même façon, quel que soit le référentiel inertiel choisi. Cela nous permettra de construire un lagrangien pour la particule. Nous verrons comment l’impulsion et l’énergie d’une particule libre sont reliées à sa masse et sa vitesse. Le formalisme lagrangien permet ainsi de démontrer que l’ensemble {E/c, p} forme un quadrivecteur de l’espace-temps en relativité, alors que ni l’énergie E ni l’impulsion p ne sont définies a priori. Leur forme est dictée par le formalisme lagrangien à partir des variables cinématiques position et vitesse. Ensuite nous verrons que le lagrangien d’interaction d’une particule chargée avec le champ électromagnétique se déduit de l’invariance relativiste, de la connaissance du lagrangien d’interaction d’une particule chargée avec un champ électrostatique, et du fait que le potentiel électrostatique constitue la composante genre temps du quadrivecteur potentiel électromagnétique. Nous découvrirons que le moment conjugué diffère alors radicalement de l’impulsion ou de la quantité de mouvement, qui dans la limite non-relativiste, est donnée par le produit de la masse par la vitesse. Ce fait, intimément associé à l’invariance de jauge, a des répercussions considérables en mécanique quantique et, plus généralement, dans toutes les théories actuelles des interactions fondamentales. Nous allons analyser les équations du mouvement qui en découlent, leur limite non-relativiste, aussi bien que leur invariance de jauge. Dans la partie 2 nous comprendrons le principe de la forme lagrangienne de la théorie des champs en commençant par la physique d’une corde vi- Théorie lagrangienne de l’électromagnétisme 73 brante. La démarche est relativement simple : on commence par discrétiser la corde en éléments finis en interaction auxquels on applique la théorie de Lagrange. On passe ensuite à la limite du continu, ce qui fait apparaître une densité spatiale de lagrangien à partir de laquelle on obtient naturellement l’équation d’ondes. C’est dans cette extension à la limite du continu, donc d’un nombre infini de degrés de liberté, que l’on mesure combien le formalisme lagrangien est adapté à ce problème. Ensuite nous passons à trois dimensions ainsi qu’à plusieurs champs. On y entrevoit facilement l’extension dans l’espace-temps. Finalement nous traiterons du champ vecteur électromagnétique et des équations de Maxwell. Dans cette partie nous donnerons aussi le lagrangien complet de l’électromagnétisme qui comprend la partie particules (ou sources des champs), la partie champs et l’interaction des deux. 74 3.1 Théorie lagrangienne de l’électromagnétisme Lagrangien d’une particule relativiste Nous nous restreignons au cas d’une particule massive soit libre, soit placée dans un champ électromagnétique. Le fondement de notre propos sera l’invariance de Lorentz. Le principe de moindre action ne peut avoir de sens que si il détermine le mouvement de la particule de la même façon, quel que soit le référentiel inertiel choisi. Nous souhaitons procéder comme en section 1.3. Nous nous proposons de déterminer le trajet parcouru pour aller de (t1 , r1 ) à (t2 , r2 ) en minimisant l’action S= 3.1.1 Z t2 t1 (3.2) L(r, ṙ; t) dt . Particule libre Nous avons vu en 2.2, par des arguments de symétrie, que le lagrangien d’une particule libre de masse m ne devrait être fonction que de la vitesse au carré v 2 de la particule. Cherchons donc cette fonction sous une forme qui rende l’action S qui s’y associe, invariante de Lorentz. En relativité, voir réf. [2], nous avons vu un invariant de Lorentz, sous forme d’une intégrale paramétré par le temps et portant sur une fonction de v 2 . On l’a appelé le temps propre τ . Il représente le temps qui s’écoule sur une montre rattachée au point mobile. D’ailleurs, en traitant du «paradoxe des jumeaux», nous avons vu que parmi tous les chemins possibles, celui associé au mouvement libre a pour caractéristique que le temps propre est le plus long. Ceci correspond bien à un principe d’optimisation comme nous le cherchons. Rappelons les formules : Nous avons c dτ = ds où ds2 = c2 dt2 − dx2 est l’élément de longueur infinitésimal invariant de Lorentz. Par construction, τ est donc un invariant de Lorentz. Si dt est un interval de temps observé par un observateur de vitesse relative v par rapport à la particule, le temps propre de celle-ci est p 2 dτ = dt 1 − v /c2 . Le mouvement libre maximise donc la quantité τ = Z t2 t1 p 1 − v 2 /c2 dt . 75 3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE Pour obtenir un lagrangien homogène à une énergie, et afin de retrouver un principe de minimisation plutôt que de maximisation, nous posons finalement Z t2 p 2 1 − v 2 /c2 dt . (3.3) S = −mc t1 Cette action nous fournit le lagrangien d’une particule relativiste libre p L = −mc2 1 − v 2 /c2 . (3.4) p L’expression 1 − v 2 /c2 dt est invariante de Lorentz alors que le lagrangien (3.4) ne l’est pas. Cela provient de ce que nous avons gardé une approche qui confère un rôle particulier à la variable temps sur laquelle porte l’intégration. On peut s’affranchir de ce problème, voir (3.16) qu’à la p en bas. On remarque 2 2 2 2 limite des faibles vitesses, (3.4) donne −mc 1 − v /c = −mc + m v 2 /2 , et on retrouve donc, à la constante −mc2 près, le lagrangien non-relativiste L = mv 2 /2. 3.1.2 Impulsion et énergie d’une particule libre L’impulsion et l’énergie se déduisent de cette forme par les mêmes démarches qu’en section 2.3. Ces deux quantités nous intéressent particulièrement car ce sont les grandeurs conservées de façon générale s’il y a homogénéité de l’espace et du temps, et cela quel que soit le référentiel. Le moment conjugué est 1 mv ∂L , (3.5) =p plib = ∂v 1 − v 2 /c2 l’énergie Elib = plib · v − L = p mc2 1 − v 2 /c2 ou encore Elib = q p2lib c2 + m2 c4 . (3.6) L’énergie et l’impulsion satisfont la relation (Elib/c)2 − p2lib = m2 c2 . (3.7) Si nous supposons que l’ensemble (Elib /c, plib ) ≡ P lib soit un quadrivecteur, nous voyons donc que son carré au sens de Minkowski est un invariant relativiste, proportionnel à la masse au carré de la particule, en accord avec 1. Nous écrivons Elib , plib pour indiquer que les expressions changent si la particule est exposée à un champ électromagnétique. 76 Théorie lagrangienne de l’électromagnétisme l’hypothèse. Pour la confirmer nous nous souvenons du fait que L dt est un invariant relativiste, que nous pouvons récrire sous la forme : −L dt = plib · v − L dt − plib · dx = Elib dt − plib · dx = P lib · dX . (3.8) Le produit scalaire de Minkowski de P lib avec un quadrivecteur arbitraire (genre temps, infinitésimal) dX = (c dt, dx) forme donc un invariant, ce qui montre que P lib est un quadrivecteur, du genre temps d’après (3.7) 2 . Einstein a déduit les équations (3.6), (3.7) - qui sont parmi les plus connues de toute la physique - par un raisonnement concernant le bilan energétique d’un corps en mouvement, émettant du rayonnement électromagnétique 3 . Ici le formalisme lagrangien nous les fournit automatiquement, révélant ainsi toute sa puissance. Il nous dit aussi que l’ensemble (Elib/c, plib ) forme un quadrivecteur de l’espace-temps en relativité, alors que ni l’énergie ni l’impulsion ne sont définies a priori et que seules les variables cinématiques position et vitesse interviennent. Cette propriété découle de l’hypothèse de départ (3.3) dont le fondement est l’invariance relativiste. La vitesse observée de la particule est reliée à son impulsion et à son énergie par v= 3.1.3 c2 plib Elib . (3.9) Particule chargée dans un champ électromagnétique Interaction avec un champ électromagnétique Considérons maintenant une particule chargée, de charge q et de masse m, placée dans un champ électromagnétique. Nous connaissons le lagrangien d’une particule libre relativiste et celui d’une particule non-relativiste exposée à un champ purement électrostatique qui dérive du potentiel qφ . Dans ce dernier cas nous avons L = mv 2 /2 − q φ . (3.10) Cette forme nous indique qu’il faut chercher le lagrangien complet sous la forme d’une somme Llibre + LI , où le lagrangien d’interaction LI décrit 2. D’ailleurs, nous avons déjà vu ce quadrivecteur en relativité [2] : à la constante m près c’est le quadrivecteur quadrivitesse U . 3. A. Einstein : Ist die Trägheit eines Körpers von seinem Energieinhalt abhängig ?, Ann. d. Phys. 18, 639-641 (1905). 3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE 77 l’interaction de la particule et du champ. Pour retrouver une action S, invariante de Lorentz, comme dans le cas d’une particule libre, nous remplaçons q φ dt → q A · dX , (3.11) en nous souvenant que le produit scalaire invariant des deux quadrivecteurs A = (φ/c, A) et dX = (cdt, dx) se réduit à l’expression φ dt dans la condition que le potentiel vecteur A soit nul. Notre proposition pour l’action d’une particule relativiste dans un champ électromagnétique est donc Z t2 Z t2 p dx 2 2 2 , (3.12) 1 − v /c dt − q (φ − v · A) dt , v = S = −mc dt t1 t1 et le lagrangien correspondant s’écrit alors p L = −mc2 1 − v 2 /c2 − q (φ − v · A) . (3.13) Moment conjugué et énergie Pour le lagrangien (3.13) le moment conjugué p = ∂L/∂v est relié à l’impulsion plib = √ mv2 2 par 1−v /c p= ∂L = plib + q A . ∂v (3.14) Le moment conjugué p est donc différent de la quantité de mouvement relativiste plib . L’énergie E totale de la particule est donnée par E =v· ∂L − L = Elib + q φ . ∂v (3.15) Interaction minimale Nous pouvons écrire l’action de la particule d’une manière manifestement covariante. Pour une particule libre, d’après (3.8), son action entre deux événements A et B dans l’espace-temps - séparés par un quadrivecteur genre temps - se récrit de façon manifestement invariante de Lorentz Z B Slib = − P lib · dX , (3.16) A expression qui fait intervenir le quadrivecteur P lib = (Elib /c , plib) . 78 Théorie lagrangienne de l’électromagnétisme Pour une particule chargée dans un champ électromagnétique on obtiendra de la même façon Z B S= − (3.17) P · dX , A c’est à dire l’action s’exprime en terme du quadrivecteur P qu’on obtient à partir de (3.14) et de (3.15) (3.18) P = (E/c, p) . P s’exprime en partant de P lib par la substitution dite minimale P lib → P = P lib + q A . (3.19) De ce point de vue la nouvelle action s’obtient donc par une simple redéfinition du moment conjugué qui, effectivement, est la plus simple à faire apparaître le potentiel électromagnétique et à maintenir l’invariance de Lorentz. L’interaction correspondante est appelée « interaction minimale » entre une particule chargée et le champ électromagnétique. Equation du mouvement L’équation du mouvement s’obtient à partir des équations d’Euler-Lagrange ∂L d ∂L = . (3.20) dt ∂v ∂r Le lagrangien (3.13) donne ∂L ~ r L = q (∇(v ~ · A) − ∇φ) ~ =∇ , ∂r (3.21) d’où, en utilisant (3.20) et (3.14), dp d(plib + qA) ~ · A) − ∇φ)) ~ = = q (∇(v . dt dt (3.22) Les dérivées totales des composantes A par rapport au temps s’expriment sous la forme ∂Ax (r, t) ∂Ax (r, t) ∂Ax (r, t) ∂Ax (r, t) dAx (r, t) = + ẋ + ẏ + ż dt ∂t ∂x ∂y ∂z etc. (3.23) 79 3.1. LAGRANGIEN D’UNE PARTICULE RELATIVISTE ou en notation vectorielle dA ∂A ∂A ∂A ∂A ∂A ~ = + (ẋ + ẏ + ż )= + (v · ∇)A . dt ∂t ∂x ∂y ∂z ∂t (3.24) D’autre part on a la relation ~ · A) = (v · ∇)A ~ ~ × A) . ∇(v + v × (∇ En reportant dans (3.22) il vient ∂A dplib ~ × A) − ~ = q v × (∇ − ∇φ dt ∂t (3.25) . (3.26) Les équations de Maxwell, et plus précisément le couple d’équations ~ ·B=0, ∇ ~ × E = − ∂B ∇ ∂t (3.27) permettent d’exprimer les champs E et B à partir des potentiels scalaire et vecteur Φ et A ~ ×A, B=∇ E=− ∂A ~ − ∇Φ . ∂t (3.28) Cela mène à l’équation du mouvement dplib = q(E + v × B) , dt (3.29) où l’impulsion plib et la vitesse v sont reliés par (3.5). Nous avons donc retrouvé l’équation de Lorentz (3.1), à la modification près que l’impulsion non-relativiste a été remplacée par sa version relativiste (3.5). En dérivant (3.6) par rapport au temps on obtient à l’aide de (3.9) dplib dElib =v· dt dt . (3.30) Reportant l’équation du mouvement (3.29) et utilisant l’égalité v · (v × B) = 0, on obtient dElib = qv·E , (3.31) dt où E est le champ électrique : seul le champ électrique travaille et modifie l’énergie cinétique Elib , donc la norme de la vitesse. 80 Théorie lagrangienne de l’électromagnétisme Equation du mouvement sous forme covariante de Lorentz Nous avons vu en (3.1.2) que les quantités (Elib /c, plib ) forment un quadrivecteur P lib . Par conséquent il devrait être possible de ramener les équations (3.30) et (3.29) sous une forme covariante de Lorentz qui ne fasse apparaître que des quantités covariantes de Lorentz, c’est à dire des quadri-vecteurs, tenseurs et scalaires lorentziens. Ceci nous garantit qu’elle gardera la même forme dans tous les référentiels. On voit bien qu’on peut exprimer (3.30) et (3.29) sous forme d’une équation différentielle pour un quadri-vecteur, sous condition de remplacer le différentiel dt au dénominateur par l’élément différentiel de l’invariant relativiste temps propre vu en (3.1.1), donc par dτ . Car dτd (Elib /c, plib ) se transformera alors comme un quadri-vecteur. Ce passage s’effectue en multipliant ces équations par un facteur γ = √ 1 2 2 . 1−v /c Ce facteur peut être absorbé côté droit en faisant apparaître le quadrivecteur quadrivitesse U = m1 P lib , dont les composantes spatiales sont liés à celles de v par ui = γv i . Finalement les composantes des champs électrique et magnétique forment un tenseur - le tenseur champ électro-magnétique F µν donné en (3.64), et nos équations (3.30) et (3.29) s’écrivent sous la forme covariante µ dPlib = qF µν uν , dτ comme le lecteur le vérifiera sans peine après ces explications. (3.32) Limite non-relativiste On peut passer à la limite non-relativiste dans chacune des expressions relativistes précédentes. La forme non-relativiste du lagrangien (3.13) s’écrit 1 L = −m c2 + m v 2 − q φ(r, t) + q v · A(r, t) , (3.33) 2 où le premier terme est une constante qu’on supprimera. Le même calcul que celui du cas relativiste nous donne l’équation du mouvement de Lorentz non-relativiste mr̈ = q (E + v × B) . (3.34) Le moment conjugué prend la forme p = mv + q A(r, t) . (3.35) 81 3.2. THÉORIE LAGRANGIENNE DES CHAMPS On constate encore une fois que dans un champ magnétique, le moment conjugué p ne coïncide pas avec la quantité de mouvement mv. De la même façon, le moment cinétique L = r × p ne coïncide pas avec le moment de la quantité de mouvement r × mv. Pour l’énergie non-relativiste on retrouve E = m v 2 /2 + q Φ comme il se doit. Invariance de jauge Une chose, cependant, paraît surprenante. Nous exprimons le lagrangien toujours en fonction des potentiels A et Φ, et non des champs E et B. Or les potentiels ne sont pas uniques : les champs E et B demeurent invariants par les transformations de jauge, ~ A → A′ = A + ∇χ(r, t) , Φ → Φ′ = Φ − ∂χ ∂t , (3.36) où χ(r, t) est une fonction arbitraire. La vitesse v de la particule est une une grandeur physique, mesurable, indépendante de la jauge. En revanche, la variable moment conjugué p = mv + qA dépend de la jauge choisie. Pour analyser le comportement du lagrangien dans les transformations (3.36) on porte cette transformation dans l’expression (3.12) ou dans (3.33), et on obtient ∂χ ~ ). (3.37) L′ = L + q (v · ∇χ(r, t) + ∂t La différence est une dérivée totale par rapport au temps L′ = L + q d χ(r, t) , dt (3.38) dont nous avons vu en 2.2 qu’elle n’affecte pas les équations du mouvement. Une transformation de jauge n’affecte donc pas la physique du problème. Remarquons que l’invariance de jauge a joué un rôle clé dans la découverte du modèle standard de la physique des particules, qui est une théorie quantique de champs de jauge nonabéliens [16]. 3.2 Théorie lagrangienne des champs Pour obtenir le lagrangien complet de l’électromagnétisme il nous faut étendre le formalisme lagrangien aux systèmes continus, donc aux systèmes 82 Théorie lagrangienne de l’électromagnétisme à un nombre infini de degrés de liberté. Le prototype de système physique qui permet d’étudier la transition vers le continu en mécanique est la corde vibrante. 3.2.1 Corde vibrante x=0 x=l ψ(x,t) Figure 3.1 – La corde discrétisée ; ψ(x, t) est l’élongation par rapport à la position d’équilibre à l’instant t . On considère une corde élastique tendue horizontalement entre les points x = 0 et x = l. Sa masse linéique ρ est uniforme. On ne tient pas compte de la pesanteur, et on ne considère que les déformations de la corde dans le plan transverse (ondes transversales). On note ψ(x, t) l’élongation transverse du point d’abscisse x par rapport à sa position d’équilibre à l’instant t. On suppose, pour simplifier, que cette élongation se produit dans une seule direction (l’axe vertical). On peut, par la pensée, considérer la corde comme l’ensemble d’un grand nombre d’éléments de longueur individuelle dx obéissant chacun aux lois de la dynamique. A la limite, cela se transforme en un système à nombre infini de degrés de liberté. Soit un élément de la corde de longueur dx, l’énergie cinétique de cet élément est 1 ∂ψ dEc = (ρ dx)( )2 . (3.39) 2 ∂t Soit T la tension de la corde. Si l’élongation de deux éléments centrés en x et x + dx, varie par rapport à l’élongation au repos, l’énergie potentielle V , correspondant à la loi de Hooke, varie d’après Pythagore de ! r p ∂ψ (ψ(x + dx) − ψ(x))2 + dx2 − dx = T 1 + ( )2 − 1 dx dV = T ∂x 83 3.2. THÉORIE LAGRANGIENNE DES CHAMPS où, bien évidemment, (∂ψ/∂x)2 ≪ 1. L’énergie potentielle V de la corde due à la déformation est, par conséquent, Z l ∂ψ 1 (3.40) ( )2 dx . V = T 2 0 ∂x Le lagrangien de la corde entière est la somme des lagrangiens élémentaires dL = dEc − dV , soit Z 1 l ∂ψ ∂ψ L= [ ρ ( )2 − T ( )2 ] dx . (3.41) 2 0 ∂t ∂x Si l’on considère la corde comme un ensemble d’éléments matériels de longueur dx, chacun a un lagrangien élémentaire dL = L(ψ, 1 ∂ψ ∂ψ ∂ψ ∂ψ , ) dx = [ ρ ( )2 − T ( )2 ] dx . ∂t ∂x 2 ∂t ∂x (3.42) La quantité L qui apparaît dans cette expression est appelée la densité de lagrangien de la corde. Dans notre cas, L ne dépend pas de ψ , mais seulement de ∂ψ et de ∂ψ . L’action de la corde est en effet ∂t ∂x S= Z 1 L dx dt = 2 Z t2 dt t1 Z 0 l dx [ρ ( ∂ψ 2 ∂ψ ) − T ( )2 ] . ∂t ∂x (3.43) Nous avons affaire à un problème à deux variables (x, t) dont dépend la variable dynamique ψ(x, t). Dans un procédé analogue à celui du chapitre précédent nous nous donnons l’état initial ψ(x, t1 ) et l’état final ψ(x, t2 ) de la corde. D’après le principe de moindre action, il faut alors minimiser l’intégrale (3.43) avec les conditions aux bords δψ(0, t) = 0 , δψ(l, t) = 0 , δψ(x, t1 ) = 0 , δψ(x, t2 ) = 0 . (3.44) Les deux premières de ces équations correspondent au fait que la corde est fixée à x = 0 et à x = l. Les deux autres expriment le fait que les variations considérées sont toujours telles qu’elles laissent inchangés l’état initial et ∂ ∂ l’état final du système (de la corde). En faisant varier ψ, ∂t ψ et ∂x ψ on obtient " # Z ∂L ∂L ∂ψ ∂L ∂ψ δS = dx dt δψ + ∂ψ δ( ) + ∂ψ δ( ) . ∂ψ ∂t ∂( ∂t ) ∂( ∂x ) ∂x 84 Théorie lagrangienne de l’électromagnétisme Ensuite on effectue les intégrations par parties usuelles en utilisant (3.44) " # Z ∂ ∂L ∂ ∂L ∂L δS = dx dt δψ . − − ∂ψ ∂ψ ∂t ∂( ∂ψ ∂x ) ∂( ) ∂t ∂x Vu que δψ est une fonction arbitraire de x et de t , la condition δS = 0 nous donne l’équation d’Euler-Lagrange ∂L ∂ ∂L ∂L ∂ + = . (3.45) ∂t ∂(∂ψ/∂t) ∂x ∂(∂ψ/∂x) ∂ψ Dans notre cas, par ∂L ∂ψ = 0 si bien qu’en définissant la vitesse de propagation c T (3.46) ρ nous aboutissons à l’équation de propagation des vibrations de la corde c2 = 2 ∂2ψ 2 ∂ ψ −c =0 . ∂t2 ∂x2 (3.47) On voit ainsi comment une équation d’ondes se déduit d’un principe variationnel. Il faut, ici, que la différence entre l’énergie cinétique totale de la corde et son énergie potentielle soit la plus faible possible. On peut ajouter à la densité de lagrangien L un terme linéaire en ψ provenant d’une force extérieure F (x) dx appliquée sur chaque élément de la corde 1 ∂ψ ∂ψ L = [ ρ ( )2 − T ( )2 ] + F ψ , (3.48) 2 ∂t ∂x ce qui mène à l’équation du mouvement inhomogène 2 ∂2ψ 2 ∂ ψ − c = F/ρ . ∂t2 ∂x2 3.2.2 (3.49) Equations d’Euler-Lagrange généralisées Le cas précédent nous a fait aborder un problème plus complexe que les équations vues en (2.6) et (2.7). En effet, s’agissant d’un champ, la variable dynamique ψ dépend de plusieurs variables : dans l’exemple (3.47) le champ ψ dépend des deux variables t et x. Considérons, de manière générale, n variables dynamiques ψk , k = 1, . . . , n, qui, elles-mêmes, dépendent de m 3.2. THÉORIE LAGRANGIENNE DES CHAMPS 85 variables xs , s = 1, . . . , m (y compris le temps), soit ψk (xs ) . Posons par définition ∂ψk , (3.50) ψk,s ≡ ∂xs et notons [ψk,s ] l’ensemble des dérivées partielles de ψk (x1 , . . . , xm ). La densité de lagrangien est de la forme L(ψ1 , [ψ1,s ], . . . , ψn , [ψn,s ]) et l’action Z S = L(ψ1 , [ψ1,s ], . . . , ψn , [ψn,s ]) dx1 . . . dxm . On se convaincra que la détermination de l’extrémum de l’action S sous l’ensemble des variations infinitésimales ψk → ψk + δψk , k = 1, . . . , n qui s’annulent au bord du volume d’intégration, mène, après avoir effectué toutes les intégrations par parties, aux équations d’Euler-Lagrange généralisées m X ∂ ∂L ∂L = , k = 1, . . . , n . (3.51) s ∂x ∂ψk,s ∂ψk s=1 En théorie des champs relativistes, il est naturel d’englober le temps t dans les variables (t, x, y, z) dont dépendent les champs ψk . Dans beaucoup d’autres problèmes, il est commode de singulariser la variable temps. En définissant ∂ψk , ψ̇k ≡ ∂t on obtient m−1 X ∂ ∂L ∂L ∂ ∂L , (3.52) − = ∂t ∂ ψ̇k ∂ψk ∂xs ∂ψk,s s=1 dont (3.45) est un cas particulier. Champ scalaire Les résultats précédents nous font entrevoir le lagrangien d’un champ scalaire à 3 dimensions, par exemple les ondes sonores dans un fluide compressible non-visqueux. En appelant ψ(r, t) la compression du fluide, et c la vitesse du son dans le fluide, la densité de lagrangien a la forme 1 1 ∂ψ ~ 2] . L = ρ [ 2 ( )2 − (∇ψ) (3.53) 2 c ∂t On obtient sans difficulté, à partir de la densité de lagrangien (3.53), l’équation de propagation 1 ∂2ψ − ∆ψ = 0 . (3.54) c2 ∂t2 86 3.2.3 Théorie lagrangienne de l’électromagnétisme Champ électromagnétique Le cas du champ électromagnétique est plus complexe. Il faut tenir compte de la nature vectorielle de ces champs, et surtout prendre en compte l’invariance relativiste, propriété fondamentale des équations de Maxwell. Le champ électromagnétique est inséparable des particules chargées qui en sont les sources et sur lesquelles il agit. Nous avons vu en (3.12) que l’action d’un point matériel chargé dans un champ électromagnétique s’écrit comme Slibre + Sint où Z Z Sint = Lint dt = q v · A(r, t) − q Φ(r, t) dt . (3.55) Nous voulons généraliser (3.55) à une distribution de charge ρ(x, t) . Rappelons le quadrivecteur courant [2] (3.56) J = (cρ, j) , où ρ et j sont respectivement la densité de charge et la densité de courant. L’interaction avec un champ électromagnétique s’exprime en terme du quadrivecteur potentiel A = (Φ/c, A) . (3.57) Le produit scalaire 4 J · A ≡ jµ Aµ au sens de Minkowski est un invariant relativiste homogène à une densité de lagrangien. Posons donc Z (3.58) Sint = (−J · A) d3 x dt Sint est un invariant relativiste, car J·A et d3 x dt (voir [3], chapitre 2) le sont. Pour un point matériel de charge q, de trajectoire ~x(t) et de vitesse ~v (t) , on trouve (cρ, ~j) = q c δ 3 (~x − ~x(t)), ~v δ 3 (~x − ~x(t)) , où δ 3 (~x) est la distribution de Dirac dans l’espace à trois dimensions (pour ceux qui la connaissent), et dans ce cas on récupère (3.55) de (3.58). La quantité (3.59) Lint = −J · A est une densité de lagrangien de façon que Sint = R Lint d3 x dt . 4. Dans cette section nous utilisons la convention d’Einstein de sommation sur les indices répétés. 3.2. THÉORIE LAGRANGIENNE DES CHAMPS 87 Cherchons maintenant l’action totale d’un système de particules chargées dans un électromagnétique. Il nous manque encore la contribution R champ 3 Sch = Lch d x dt dont se déduisent les équations du champ électromagnétique en l’absence de sources. Dans l’hypothèse la plus simple l’action totale sera alors de la forme S = Spart + Sint + Sch . (3.60) Connaissant la forme de Lint nous partons de l’hypothèse que les variables dynamiques dont dépend la partie Sch de l’action sont toujours les composantes du quadrivecteur potentiel A . Dans ce cas les équations d’Euler-Lagrange généralisées (3.51) s’écrivent ! ∂ ∂L ∂L = , µ = 0, 1, 2, 3 . (3.61) ∂Aµ ν ∂x ∂Aµ ∂( ν ) ∂x La partie Lint (3.59) du lagrangien, que nous connaissons déjà, va contribuer un terme −j µ au membre de droite de cette équation. Pour continuer jetons encore un coup d’œil sur la forme covariante des équations de Maxwell ([2], ch. 7.3 ou [3], ch. 6). Les champs s’expriment à partir des potentiels Φ et A par ~ ×A, B=∇ ~ − ∂A . E = −∇Φ ∂t (3.62) En utilisant la notation ∂µ = ∂/∂xµ et ∂ µ = η µν ∂ν , on exprime le tenseur champ électromagnétique par F µν = ∂ µ Aν − ∂ ν Aµ . En notation matricielle ce tenseur antisymétrique s’écrit 0 −Ex /c −Ey /c −Ez /c Ex /c 0 −Bz By (F ) = Ey /c Bz 0 −Bx Ez /c −By Bx 0 (3.63) (3.64) en accord avec (3.62). Le couple d’équations de Maxwell homogènes (3.27) découle de la structure du tenseur F µν , qui assure les équations (ou identités) ∂ µ F νρ + ∂ ν F ρµ + ∂ ρ F µν = 0 . (3.65) 88 Théorie lagrangienne de l’électromagnétisme On vérifiera qu’elles se réduisent pour µ, ν, ρ mutuellement différents 5 à ~ × E = − ∂B , ∇ ∂t ~ ·B=0 . ∇ Les deux équations de Maxwell inhomogènes relient les champs aux densités de charge et de courant. Elles s’écrivent ∂ν F νµ = µ0 j µ , (3.66) et elles se ramènent bien à ~ ·E = ρ , ∇ ε0 ~ × B = µ0 j + 1 ∂E . ∇ c2 ∂t Au vu de (3.61) et de (3.59), les équations (3.66) nous font chercher Lch sous une forme qui donne ∂ 1 ∂Lch ∂Lch ≡ − ∂ν F νµ , = 0. (3.67) ν ∂x ∂(∂ν Aµ ) µ0 ∂Aµ Pour satisfaire à cette identité l’expression pour Lch devrait donc être bilinéaire dans les variables ∂ν Aµ . Nous la voulons aussi invariante relativiste ce qui nous limite aux trois expressions (voir aussi [2], ch. 7.3) 6 Fµν F µν = −2( E2 − B2 ) , c2 ∗ Fµν F µν = 4 E·B , c (∂µ Aµ )2 . (3.68) Nous vérifions qu’en retenant le premier terme et en posant Lch = − 1 Fµν F µν 4µ0 (3.69) on trouve la relation recherchée (3.67). En revenant à (3.68) nous constatons d’ailleurs que le troisième terme (∂µ Aµ )2 n’est pas invariant de jauge, et que le deuxième terme ∗ F µν Fµν n’est pas invariant dans les transformations de Lorentz de déterminant -1 (ce qui implique une brisure de la symétrie parité, symétrie pourtant respectée par l’électromagnétisme). 5. si au moins 2 indices sont égaux le membre de gauche est identiquement nul 6. Nous utilisons la définition ∗ Fµν = 12 εµνρσ F ρσ , qui fait apparaître le tenseur εµνρσ . Il est complètement antisymétrique dans une permutation de ses 4 indices et il satisfait à ε0123 = 1 . 3.2. THÉORIE LAGRANGIENNE DES CHAMPS 89 Nous avons donc trouvé une expression pour l’action totale de l’électromagnétisme. En ajoutant (3.69), (3.58), et (3.3) adaptée à une densité continue de la masse ρm (x, t) , on obtient Z p 1 µν 2 2 2 Fµν F − J · A − ρm c 1 − v /c d3 x dt . (3.70) S= − 4µ0 On voit à partir de (3.68), (3.69) que le champ électromagnétique physique dans le vide, en dehors des charges, est celui qui rend extrémale la différence E 2 /c2 −B 2 , compte tenu des contraintes imposées par la présence des sources et aux limites. Pour une onde plane cette différence s’annule. La contrainte était explicite dans le cas simple du champ électrostatique traité en 2.5.4. Exercices 3.1 Repère tournant et pendule de Foucault Le lagrangien d’une particule libre nonrelativiste de masse m prend la forme L= m 2 v0 2 où v0 est la vitesse de la particule dans un référentiel inertiel S0 . 1. On se place dans un référentiel S qui est en rotation uniforme par rapport à S0 à la vitesse angulaire Ω . Quelle est la forme du lagrangien dans S ? 2. Ecrire les équations d’Euler-Lagrange dans S . 3. En partant du lagrangien déduire le moment p conjugué à r dans S . Comparer au cas d’une particule dans un champ magnétique. Montrer que l’énergie E est conservée. 4. On considère un pendule de longueur l , dans un référentiel en rotation lente. Dans ce cas on peut négliger le terme d’ordre Ω2 dans le 90 Théorie lagrangienne de l’électromagnétisme z Ω θ Ωz Ωx r φ x Figure 3.2 – Pendule pesant de longueur l . lagrangien. On passe en coordonnées sphériques. Le vecteur position ~r du pendule s’écrit alors comme ~r = l (sin θ cos φ, sin θ sin φ, − cos θ) , voir Fig. 3.2. On choisira les axes tels que ~ = (Ωx , 0, Ωz ) . Ω On se limite aux petites oscillations du pendule. Dans ce cas, montrer ~ × ~r) du lagrangien L dans S prend la forme que le terme m ~v · (Ω 2 2 ml Ωz θ φ̇ + Ωx (θ̇ sin φ + θ cos φ φ̇) . 5. Le pendule est soumis au champ gravitationnel de la Terre, orienté selon l’axe z, voir Fig.3.2. Exprimer l’énergie potentielle du pendule en fonction de l’angle θ pour θ ≪ 1 . 6. En ajoutant le terme m2 v 2 , le lagrangien du pendule pesant dans le repère tournant s’écrit en coordonnées sphériques comme θ2 m 2 2 l θ̇ + θ2 φ̇2 + 2 Ωz θ2 φ̇ + 2 Ωx (θ̇ sin φ + θ cos φ φ̇) −m g l Lp = 2 2 2 3 où nous avons négligé les termes d’ordre Ω ou d’ordre θ . Pourquoi le lagrangien simplifié m 2 2 θ2 Ls = l θ̇ + θ2 φ̇2 + 2 Ωz θ2 φ̇ − m g l 2 2 donne-t-il les mêmes équations du mouvement que le lagrangien Lp ? 91 3.2. THÉORIE LAGRANGIENNE DES CHAMPS 7. Déduire de Ls les moments conjugués pθ et pφ , des variables angulaires θ et φ . 8. Ecrire les équations du mouvement et montrer que pφ est conservé. 9. On choisit pφ ≡ 0 . Comment peut-on réaliser cette condition expérimentalement ? 10. Pour pφ ≡ 0 , donner la solution pour φ(t) . Pour le pendule de Foucault au Panthéon, voir Fig.3.3, la Terre constitue un référentiel tournant, dont l’axe de rotation ne passe pas par le ~ × ~r) du lapoint ~r = 0 . Comment doit-on modifier le terme m ~v · (Ω grangien dans ce cas ? Expliquer pourquoi cette modification ne change pas les équations du mouvement du pendule. A quelle vitesse angulaire, en degrés par heure, le plan des oscillations du pendule de Foucault tourne-t-il (toujours pour pφ ≡ 0 ), sachant que la latitude de Paris est de 49o ? z Ω Paris 49 o Figure 3.3 – Rappel géographique 3.2 Le lagrangien de Proca Nous considérons la densité de lagrangien µ2 1 Aµ Aµ − µ0 jµ Aµ . Lproca = − F µν Fµν + 4 2 2 L’essentielle modification par rapport à (3.70) est le terme µ2 Aµ Aµ . (Nous avons supprimé la contribution Lpart qui ne nous intéresse pas ici, et nous avons introduit un facteur multiplicatif global sans importance, pour simplifier la notation). Ecrire l’équation d’onde pour Aµ qui se déduit de ce lagrangien. On utilisera la jauge de Lorentz ∂µ Aµ = 0 . Pour J = 0 on trouve 92 Théorie lagrangienne de l’électromagnétisme des ondes planes comme solutions de cette équation. Quelle est la relation entre la pulsation ω et le vecteur d’onde k de ces ondes ? En utilisant les relations, de Planck-Einstein E = ~ω , et d’Einstein-de Broglie p = ~k , pour le photon, donner l’interprétation physique de la quantité ~µ/c. Chapitre 4 Formalisme canonique de Hamilton C’est dans le silence des lois que naissent les grandes actions. Donatien, Alphonse, Marquis de Sade Le travail de Lagrange avait été suivi par le monumental Traité de Mécanique Céleste en 5 volumes de Laplace, publié entre 1799 et 1825. Ce traité se révéla d’une importance décisive pour l’astronomie aussi bien que pour la philosophie. Cela nous mène à la formulation dite canonique de la mécanique analytique due à Hamilton 1 qui date de 1834. Elle est plus commode pour un certain nombre de problèmes, notamment la mécanique d’ensembles de points. Mais elle est surtout d’une richesse impressionnante tant par ses développements mathématiques que physiques. Ce texte est avant tout orienté vers les applications à la mécanique, mais nous ferons allusions à quantité d’autres retombées des travaux de Hamilton. Dans la partie 1, nous exposerons ce formalisme qui consiste à décrire l’état d’un système par les variables conjuguées que sont les positions {x} et les moments conjugués de Lagrange {p}, et non par les positions et les vitesses. Autrement dit, on décrit cet état par un point dans l’espace des phases, un système étant caractérisé par un hamiltonien dérivé du lagrangien par une transformation de Legendre. Par ce nouveau regard sur le problème qui rend les variables dans l’espace des phases complètement indépendantes, l’étude de systèmes hamiltoniens 1. Comme au chapitre 2 on pourra se référer à Landau et Lifshitz [9], à Herbert Goldstein [10] et à Guignoux et Silvestre-Brac [11] pour tout complément. 93 94 Formalisme canonique de Hamilton en mécanique, devient une étude géométrique : c’est le hamiltonien qui régit les propriétés géométriques de l’ensemble des trajectoires dans l’espace des phases. Après avoir établi les équations canoniques de Hamilton, qui sont des équations différentielles couplées du premier ordre en temps pour les variables d’état, nous abordons, dans la partie 2, avec les crochets de Poisson, une structure mathématique naturellement liée à la géométrie hamiltonienne. Les crochets de Poisson ont été inventés en 1809. Carl Gustav Jacob Jacobi considérait que c’était la plus grande découverte de Poisson, qui, pourtant, avait fait des contributions importantes aux mathématiques, aux probabilités, à la mécanique analytique, à l’électricité (sans compter ses nombreuses fonctions officielles). Cette étude nous permettra de voir les lois de conservation sous un angle nouveau. Elle nous permettra d’analyser les transformations canoniques, qui ont de multiples applications, et qui font apparaître une parfaite équivalence entre les variables d’état {x} et {p}. L’espace des phases est, du point de vue mathématique, le véritable espace approprié à la description de l’évolution d’un système de points, contrairement à l’espace « empirique » des variables position. Nous établirons notamment le théorème de Liouville, propriété géométrique remarquable de l’évolution d’un système dans l’espace des phases. Nous parviendrons ensuite naturellement à l’étonnante découverte faite par Dirac en 1925. Il y a une symétrie entre mécanique analytique et mécanique quantique si l’on fait correspondre aux crochets de Poisson classiques les commutateurs des observables quantiques. Dans la partie 3, nous présentons quelques aspects des systèmes dynamiques. Ce type de problème physique a, en effet, été une extraordinaire source de découvertes tant en mathématiques qu’en physique. Le fondateur de ce champ d’étude est Henri Poincaré, dès 1885, notamment quand il a étudié le problème des 3 corps. Cela mène à des problèmes fascinants : les problèmes limites à t = ∞, les attracteurs et les attracteurs étranges, les bifurcations, le chaos etc. L’attracteur étrange le plus célèbre est sans doute l’attracteur de Lorenz, du nom de son inventeur Edward N. Lorenz qui le découvrit en 1963 à partir d’un modèle mathématique de l’atmosphère, et relança de façon spectaculaire avec l’effet « aile de papillon » en météorologie, l’intérêt pour le chaos, inventé par Poincaré 80 ans plus tôt. La partie 4 est consacrée à l’équation de Hamilton-Jacobi, où l’on travaille directement avec l’action et non plus le lagrangien ou le hamiltonien. Après avoir établi l’équation de Hamilton-Jacobi, nous découvrirons une série impressionnante de résultats. Nous verrons comment, pour les systèmes conser- 4.1. EQUATIONS CANONIQUES 95 vatifs, le flot des trajectoires est orthogonal aux surfaces d’action constante. Cela nous fera redécouvrir le Principe de Maupertuis sous une forme géométrique. Nous verrons alors comment l’optique géométrique apparaît comme limite de l’optique ondulatoire, comme l’avait découvert Hamilton. Cette démonstration fait intervenir ce que l’on nomme l’eikonal qui est l’analogue optique de l’action. Dans l’approximation des faibles longueurs d’onde dite approximation eikonale, l’onde se propage avec un vecteur d’onde localement perpendiculaire aux surfaces sur lesquelles l’eikonal est constant. Ces surfaces sont les fronts d’ondes géométriques. L’approximation eikonale correspond exactement au principe de Fermat. L’interprétation géométrique n’est autre que le Principe de Huygens-Fresnel. Enfin, nous montrerons comment le même cadre de pensée peut être appliqué à la mécanique ondulatoire et à l’équation de Schrödinger. Cela constitue la célèbre approximation semiclassique de Brillouin, Kramers et Wentzel. Remarquons que le formalisme hamiltonien se prête moins aux problèmes relativistes que le formalisme lagrangien. Car le hamiltonien, étant lié à l’énergie qui est la composante genre temps d’un quadrivecteur, n’est pas un invariant relativiste. Nous nous limiterons donc essentiellement à des illustrations non-relativistes du formalisme canonique. 4.1 Equations canoniques De fait, la formulation (1.8) du principe de moindre action n’est pas celle de Lagrange (plus complexe). Elle est due à Hamilton, un des plus grands génies de la science, parfois ignoré par les mécaniciens français, qui était fasciné par Lagrange et par cette Mécanique analytique, qu’il qualifiait de « poème scientifique par le Shakespeare des Mathématiques ». Le formalisme canonique de Hamilton date de 1834. Il est plus commode pour un certain nombre de problèmes, et contient le germe d’une structure mathématique particulièrement féconde qui mènera aux groupes de Lie, aux systèmes dynamiques et à quantité d’autres développements. Hamilton se propose de décrire l’état d’un système par les variables xi et pi , moments conjugués, au lieu de xi et ẋi . Supposons que l’on sache inverser l’équation (2.15) et calculer {ẋi } en fonction de {xi } et {pi }, que nous prenons comme nouvelles variables d’état 2 . 2. Ici nous nous limitons aux cas suivants : soit il n’existe pas de contrainte entre les xi , soit ces contraintes ont été exprimées par des multiplicateurs de Lagrange. Dans ces cas le 96 Formalisme canonique de Hamilton Le problème posé est d’obtenir les équations du mouvement de {xi } et {pi } en termes de ces mêmes variables, en éliminant les {ẋi }. La solution consiste à effectuer ce qu’on appelle une transformation de Legendre 3 . Introduisons la fonction de Hamilton, ou hamiltonien X H({xi }, {pi }; t) = pi ẋi − L . (4.1) i Considérons un problème à une dimension et écrivons la différentielle totale dH = p dẋ + ẋ dp − ∂L ∂L ∂L dx − dẋ − dt . ∂x ∂ ẋ ∂t (4.2) Si nous tenons compte de (2.15), le premier et le quatrième terme se compensent, et le long de la trajectoire physique, le troisième n’est autre que −ṗ dx d’après (2.16), d’où dH = ẋ dp − ṗ dx − ∂L dt ∂t (4.3) ∂H ∂x (4.4) ce qui donne les équations du mouvement ẋ = ∂H , ∂p ṗ = − qu’on appelle équations canoniques de Hamilton. Pour un nombre quelconque de degrés de liberté on trouve ẋi = ∂H , ∂pi ṗi = − ∂H ∂xi . (4.5) Les équations de Hamilton (4.5) constituent un système différentiel couplé du premier ordre dans le temps. Elles sont symétriques en x et p (au signe − moment conjugué de xi «existe» toujours puisque le lagrangien contient un terme cinétique qui est fonction nonlinéaire de ẋi . Dans le deuxième cas les moments conjugués pourraient faire apparaître les multiplicateurs de Lagrange, qui généralement peuvent dépendre du temps. 3. Les transformations de Legendre sont d’un usage courant lorsque l’on souhaite faire des changements de variables. On choisit tel ou tel couple (ou ensemble) de variables par commodité suivant le problème considéré. Un exemple simple est celui des fonctions ou potentiels thermodynamiques. A partir de l’énergie interne U qui est commode si l’on travaille avec le volume et l’entropie dU = −P dV + T dS, on passe à l’énergie libre F = U − T S si l’on travaille avec le volume et la température dF = −P dV − SdT etc. 97 4.1. EQUATIONS CANONIQUES près, sur lequel nous reviendrons). Elles présentent le gros avantage technique d’exprimer directement l’évolution dans le temps des variables d’état comme fonction de ces mêmes variables. La valeur de la fonction de Hamilton le long de la trajectoire physique est tout simplement l’énergie (2.23). Si le lagrangien ne dépend pas explicitement du temps : ∂L/∂t = 0 , on a d’après (4.2) ∂H/∂t = 0 , et par conséquent l’énergie est conservée : d ∂H = 0 =⇒ H=0 ∂t dt . (4.6) Exemple : Hamiltonien d’une particule en champ électromagnétique Dans le cas non-relativiste nous partons du lagrangien (3.33) et de l’expression du moment conjugué (3.35). La transformation de Legendre donne le hamiltonien non-relativiste. A l’aide de (3.35) on l’exprime en fonction de p et de r : H = 1 ∂L ·v−L = (p − q A(r, t))2 + q Φ(r, t) . ∂v 2m (4.7) En partant du lagrangien relativiste (3.13) et de l’expression du moment conjugué (3.14) on obtient de la même manière le hamiltonien relativiste p H = m2 c4 + c2 (p − q A)2 + q Φ , (4.8) où l’on retrouve encore une «prescription minimale» pour introduire l’interaction électromagnétique : on part de l’expression (3.6) pour l’énergie d’une particule libre relativiste, on exprime plib comme p − q A , et on remplace l’énergie Elib par Elib + q φ . Le long de la trajectoire physique H prend donc la valeur Elib + q φ . C’est cette prescription que Schrödinger appliquait à l’équation d’onde libre des ondes de de Broglie pour calculer les niveaux de l’atome d’hydrogène. Après quelques méandres imprévus, cela le fit aboutir à sa célèbrissime équation. On retrouve (4.7) aussi, à la constante mc2 près, par la limite nonrelativiste de (4.8). Et (4.7) s’obtient encore par la règle de substitution 1 minimale, en partant du hamiltonien nonrelativiste libre Hlib = 2m p2lib . 98 Formalisme canonique de Hamilton Nous avons constaté en 3.1.3 que les équations du mouvement sont invariantes de jauge (voir aussi l’exercice 4.1), même si le hamiltonien en dépend. Ce point est moins évident lorsque l’on considère la transposition quantique du résultat 4 . Dans l’expérience d’Aharonov et Bohm 5 on peut mettre en évidence que le hamiltonien s’exprime à partir des potentiels, et non pas des champs. 4.2 Crochets de Poisson ; Espace des phases Pour un système à N degrés de liberté l’espace des phases est défini comme l’espace à dimension 2N qui est donné par l’ensemble des points (x1 , . . . , xN , p1 , . . . , pN ) . Considérons deux grandeurs physiques f et g, fonctions des variables d’état (xi , pi ), i = 1, . . . , N et éventuellement du temps. On appelle crochet de Poisson de f et g la quantité N X ∂f ∂g ∂f ∂g − {f, g} = ∂xi ∂pi ∂pi ∂xi i=1 (4.9) . Les crochets de Poisson ont les propriétés suivantes, que l’on établit directement {f, g} = −{g, f } , (4.10) {f1 + f2 , g} = {f1 , g} + {f2 , g} {f1 f2 , g} = f1 {f2 , g} + {f1 , g}f2 (4.11) . Pour les variables d’état (xi , pi ) on a les relations importantes {xi , xj } = 0 , et {xi , f } = {pi , pj } = 0 , ∂f ∂pi {xi , pj } = δij {pi , f } = − ∂f ∂xi . , (4.12) (4.13) On établira sans difficulté l’identité de Jacobi {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0 . (4.14) 4. Voir J.-L. Basdevant et Jean Dalibard, Mécanique quantique Edition 2001, Chapitre 15, § 5.3. 5. A. Tonomura et al., Phys. Rev. Lett. 56, 792, (1986). 4.2. CROCHETS DE POISSON, ESPACE DES PHASES 4.2.1 99 Evolution temporelle, constantes du mouvement Calculons maintenant l’évolution temporelle d’une quantité physique quelconque f (x1 , . . . , xN , p1 , . . . , pN ; t) . On a X ∂f ∂f ∂f df ẋi + ṗi ) + = ( . (4.15) f˙ = dt ∂xi ∂pi ∂t i En utilisant les équations de Hamilton (4.5), on obtient ∂f f˙ = {f, H} + ∂t . (4.16) En particulier, les équations canoniques (4.5) s’écrivent de façon symétrique ẋi = {xi , H} , ṗi = {pi , H} . (4.17) Dans le formalisme canonique, le hamiltonien gouverne l’évolution dans le temps du système. Si une grandeur physique f ne dépend pas explicitement du temps, c’est-à-dire ∂f /∂t = 0, alors son évolution dans le temps est obtenue à partir du crochet de Poisson de f et du hamiltonien f˙ = {f, H} . (4.18) Nous avons donc établi le résultat : Si le crochet de Poisson avec le hamiltonien d’une fonction f (x1 , . . . , xN , p1 , . . . , pN ) s’annule, alors f est une constante du mouvement. Plus précisément une grandeur f (x1 , . . . , xN , p1 , . . . , pN ; t) est nommée intégrale première si elle satisfait {f, H} = 0 . On l’appelle constante du mouvement si df /dt = 0 . Les deux notions sont équivalentes si ∂f /∂t = 0 . Théorème de Poisson : Si f et g sont deux intégrales premières, alors leur crochet de Poisson est aussi une intégrale première. Ce théorème, dû à Poisson, découle de l’identité de Jacobi (4.14) {H, {f, g}} + {f, {g, H}} + {g, {H, f }} = 0 . (4.19) Par hypothèse {g, H} = 0 et {H, f } = 0. Par conséquent, {H, {f, g}} = 0 , et {f, g} est une intégrales première. Ce théorème peut permettre de trouver de nouvelles constantes du mouvement. 100 4.2.2 Formalisme canonique de Hamilton Transformations canoniques Dans le formalisme lagrangien, les équations d’Euler-Lagrange gardent la même forme dans tout changement de coordonnées xi −→ Xi (x1 , . . . , xn ) (par exemple dans le passage de coordonnées cartésiennes (x, y, z) en coordonnées polaires (r, θ, φ)). Ces changements de coordonnées dans l’espace des configurations sont appelés des transformations ponctuelles. Dans le formalisme hamiltonien, il existe une classe encore plus large de transformations qui laissent invariantes les équations du mouvement. On peut, en effet, mélanger les variables d’état que sont les positions {xi } et les moments conjugués {pi } . On appelle transformation canonique une transformation de coordonnées Xi (x1 , . . . , xN , p1 , . . . , pN ) , Pi (x1 , . . . , xN , p1 , . . . , pN ) (4.20) telle que les équations de Hamilton gardent la même forme dans ces nouvelles variables. Elle préserve donc les équations du mouvement : Soit H ′ (X1 , . . . , XN , P1 , . . . , PN ) la fonction de Hamilton exprimée dans les variables {Xi }, {Pi } , alors, dans une transformation canonique, Ẋi = ∂H ′ , ∂Pi Ṗi = − ∂H ′ ∂Xi (4.21) . Le théorème suivant est d’une grande importance pratique. Théorème : Une transformation (x1 , . . . , pN ) → (X1 , . . . , PN ) qui préserve les crochets de Poisson des variables canoniques (4.12), est une transformation canonique. Une transformation canonique préserve les crochets de Poisson. Le critère du théorème signifie que les crochets de Poisson exprimés dans les nouvelles variables soient les mêmes que ceux exprimés dans les variables initiales, c’est-à-dire {Xi , Xj } = 0 , {Pi , Pj } = 0 , {Xi , Pj } = δij . (4.22) Donnons une démonstration directe. Pour la simplifier, considérons un seul couple de variables (x, p) et une transformation (x, p) → (X(x, p), P (x, p)), tel que {X, P } = 1 . Notons H(x, p) et H ′(X, P ) l’expression de la fonction de Hamilton dans ces deux systèmes de variables. L’évolution temporelle de X et P s’écrit dans les variables (x, p) comme Ẋ = {X, H} et Ṗ = {P, H} soit, par exemple, ∂X ∂H ∂X ∂H − . (4.23) Ẋ = ∂x ∂p ∂p ∂x 101 4.2. CROCHETS DE POISSON, ESPACE DES PHASES La fonction de Hamilton s’exprime dans les nouvelles variables comme H ′ (X, P ) = H (x(X, P ), p(X, P )) (4.24) , et son inverse H(x, p) = H ′ (X(x, p), P (x, p)) . (4.25) Si l’on différencie H par rapport à x et à p dans l’expression précédente, on obtient ∂H ′ ∂X ∂H ′ ∂P ∂H = + ∂x ∂X ∂x ∂P ∂x ∂H ∂H ′ ∂X ∂H ′ ∂P = + ∂p ∂X ∂p ∂P ∂p ; . (4.26) En reportant dans (4.23), on obtient sans difficulté ∂X ∂P ∂H ′ ∂H ′ ∂X ∂P Ẋ = − ≡ {X, P } , ∂x ∂p ∂p ∂x ∂P ∂P ∂P ∂X ∂P ∂X ∂H ′ ∂H ′ Ṗ = − ≡ −{X, P } . ∂x ∂p ∂p ∂x ∂X ∂X Puisque, par hypothèse, {X, P } = 1, on obtient bien les équations canoniques Ẋ = ∂H ′ ∂P , Ṗ = − ∂H ′ ∂X . (4.27) Pour l’opposé, c’est à dire qu’une transformation canonique préserve les crochets de Poisson entre les Xi et les Pj , nous nous limitons encore à un sys′ tème à un degré de liberté. Dans ce cas l’équation ci-dessus Ẋ = {X, P } ∂H ∂P montre que {X, P } = 1 , vu que pour une transformation canonique Ẋ = ∂H ′ . ∂P (a) Remarques 1. L’extension à un nombre quelconque N de variables (x1 , . . . , xN , p1 , . . . , pN ) → (X1 , . . . , XN , P1 , . . . , PN ) ne pose pas de problème. Il est même possible d’élargir la notion de transformation canonique en incluant des transformations (4.20) dépendant explicitement du temps : Xi (x1 , . . . , xN , p1 , . . . , pN ; t) , Pi (x1 , . . . , xN , p1 , . . . , pN ; t) . 102 Formalisme canonique de Hamilton Dans ce cas le théorème précédent reste vrai, sous condition d’ajouter le terme N X ∂Pi ∂Xi − Xi Pi ∂t ∂t i=1 au hamiltonien H ′ (X1 , . . . , XN , P1 , . . . , PN ) . 2. On voit que puisque les transformations canoniques mélangent coordonnées et impulsions, il n’y a pas de différence fondamentale entre ces variables d’état. Dans le formalisme hamiltonien, les notions de coordonnées d’espace et d’impulsions (assimilée à une quantité de mouvement) perdent de leur sens intuitif premier. Pour cette raison, on a coutume d’appeler ces variables des variables canoniquement conjuguées que l’on note (qi , pi ) avec les relations {qi , pj } = δij , {qi , qj } = {pi , pj } = 0. La transformation canonique très simple ( X = p, P = −x ) montre "l’interchangeabilité" de ces variables en ce sens. Les variables canoniquement conjuguées caractérisent l’état du système par un point dans l’espace des phases. 3. Pour tout point (x1 , . . . , xn , p1 , . . . , pn ) de l’espace des phases on peut considérer son évolution temporelle entre les temps t et t′ sous l’influence du hamiltonien H. Ceci définit une transformation dans l’espace des phases qu’on écrit sous la forme (x1 (t), . . . , pN (t)) → (x1 (t′ ), . . . , pN (t′ )) . On se convainc 6 qu’il s’agit bien d’une transformation canonique, sachant que les équations de Hamilton gardent leur forme sous une translation dans le temps. Le mouvement hamiltonien apparaît donc comme réalisant à chaque instant une transformation canonique des variables d’état. 4. Plus généralement, on nomme grandeurs canoniquement conjuguées q et p deux grandeurs physiques telles que {q, p} = 1. Un exemple est, en coordonnées sphériques, l’angle azimutal φ et la projection du moment cinétique suivant l’axe polaire Lz (voir l’exercice 2.7 du chapitre 2). 6. Tout point (x1 , . . . , pN ) dans l’espace des phases peut être vu comme un point d’une trajectoire hamiltonienne au moment initial t. La transformation lui associe alors le point (x′1 , . . . , p′N ) par lequel passe la même trajectoire au moment t′ . Evidemment les équations de Hamilton sont valables aux deux moments t et t′ . 103 4.2. CROCHETS DE POISSON, ESPACE DES PHASES (b) Exemple : oscillateur harmonique à une dimension, variables angle-action. Soit un oscillateur harmonique à une dimension de hamiltonien H= 1 2 mω 2 2 p + x , 2m 2 où, bien entendu, x et p sont canoniquement conjugués. La transformation √ √ x = X/ mω , p = P mω est une transformation canonique : {X, P } = 1 , et le hamiltonien s’écrit avec ces variables H = ω(P 2 + X 2 )/2 . La rotation dans l’espace des phases ξ = X cos θ + P sin θ , Π = P cos θ − X sin θ , (4.28) où θ est un angle fixe quelconque, est encore une transformation canonique : {ξ, Π} = {X, P } = 1 . L’expression de la fonction de Hamilton reste de même forme : H = ω(Π2 + ξ 2 )/2 . Il s’agit là d’un exemple important de symétrie dynamique d’un système. C’est, en l’occurrence, une des nombreuses symétries de l’oscillateur harmonique. Cet argument s’étend à N degrés de liberté. La méthode de Dirac des opérateurs de création et d’annihilation en mécanique quantique 7 repose directement sur cette symétrie. Cette symétrie peut être exploitée de façon plus poussée. Dans l’espace des phases, ici à deux dimensions (X, P ), passons en coordonnées polaires en introduisant des variables (A, ϕ) définies par √ √ (4.29) X = 2A cos ϕ , P = 2A sin ϕ , soit A= X2 + P 2 2 , ϕ = arctan( P ) . X (4.30) 7. Voir J.L. Basdevant et J. Dalibard, Mécanique quantique chapitre 7, section 5. 104 Formalisme canonique de Hamilton Les variables (A, ϕ) sont canoniquement conjuguées, comme on le vérifiera sans difficulté : {A, ϕ} = X 1 P 1 1 −P (− 2 ) = 1 . P 2 P 2 X 1 + (X ) X 1 + (X ) Dans ces variables, le hamiltonien s’écrit simplement H = ωA , d’où les équations du mouvement H = ωA , {A, ϕ} = 1 ⇒ Ȧ = 0 , ϕ̇ = − ω , (4.31) dont la solution est évidente A = E/ω = Cte , ϕ = − ωt + ϕ0 , (4.32) où E est l’énergie de l’oscillateur (constante du mouvement). L’intérêt de cette opération est de ramener le problème à une seule variable dépendant du temps, l’angle ϕ. Puisque l’énergie, proportionnelle à l’action A, est conservée, seule la variable angulaire ϕ évolue. La variable ϕ est une variable cyclique 8 . Elle ne figure pas dans la fonction de Hamilton, ce qui entraîne la conservation de la variable conjuguée A. L’interprétation géométrique dans l’espace (X, P ), qui ici est l’espace des phases, est simple. Le mouvement se fait sur un cercle de rayon A = E/ω qui dépend de l’énergie E, constante du mouvement. Sur ce cercle, le mouvement du point (X, P ) est uniforme, de vitesse angulaire ω : ϕ = − ωt + ϕ0 . Nous avons évoqué les variable cycliques au 2.3.2. La recherche de variables cycliques, c’est-à-dire de variables qui ne figurent pas explicitement dans la fonction de Hamilton ou de Lagrange, joue un rôle important, notamment dans l’investigation des systèmes intégrables. 4.2.3 Théorème de Liouville L’évolution dans l’espace des phases (x1 , . . . , xN , p1 , . . . , pN ) donne une représentation géométrique particulièrement utile en mécanique. Un point de l’espace des phases correspond à un état du système. Lorsque le système 8. La notion de variable cyclique s’applique de la même manière au formalisme hamiltonien que dans le formailsme lagrangien. 105 4.2. CROCHETS DE POISSON, ESPACE DES PHASES évolue, ce point se déplace dans l’espace des phases. On définit l’élément de volume dans l’espace des phases par dΩ = dx1 . . . dxN dp1 . . . dpN (4.33) . R Soit un volume quelconque Ω de l’espace des phases, Ω = dΩ, nous affirmons que ce volume est invariant par rapport aux transformations canoniques Z Z dx1 . . . dxN dp1 . . . dpN = dX1 . . . dXN dP1 . . . dPN . (4.34) En effet, dans le changement de variables, on a Z Z dX1 . . . dXN dP1 . . . dPN = |J| dx1 . . . dxN dp1 . . . dpN où J est le jacobien de la transformation. Or, le jacobien d’une transformation canonique est égal à un. C’est évident sur le petit exemple 4.2.2 (b) ci-dessus. Si l’on considère le cas simple d’un seul couple de variables canoniquement conjuguées (x, p) → (X, P ) comme en 4.2.2, la démonstration est simple. En effet, le jacobien n’est autre que le crochet de Poisson {X, P } J= ∂X ∂P ∂X ∂P − = {X, P } = 1 ∂x ∂p ∂p ∂x (4.35) égal à un, pour une transformation canonique, comme nous l’avons vu en 4.2.2. Pour N variables canoniquement conjuguées x1 . . . xN , p1 . . . pN l’argument devient techniquement plus lourd, tout en se basant toujours sur les crochets de Poisson. Considérons maintenant un volume Ω de l’espace des phases. Chaque point de ce volume se déplace suivant les équations de Hamilton. Le mouvement peut se comprendre, nous venons de le dire, comme réalisant à chaque instant une transformation canonique des variables d’état dans l’espace des phases. Nous aboutissons ainsi à un résultat important, notamment en physique statistique : Théorème de Liouville : Un volume de l’espace des phases reste inchangé lors d’une évolution hamiltonienne. Cette propriété géométrique remarquable est indépendante de la forme particulière du hamiltonien. Elle découle de la structure des équations de Hamilton. 106 4.2.4 Formalisme canonique de Hamilton Flot hamiltonien Une autre propriété géométrique intéressante est la suivante. La fonction de Hamilton H(x, p) est définie dans l’espace des phases. Considérons, dans cet espace, le champ de vecteurs de composantes (ẋ, ṗ) c’est-à-dire ẋ = ∂H , ∂p ṗ = − ∂H ∂x . On appelle flot de ce champ de vecteurs l’ensemble des courbes dont la tan, − ∂H ) en ce point. On gente en chaque point est colinéaire au vecteur ( ∂H ∂p ∂x remarque que le flot de (ẋ, ṗ), encore appelé flot hamiltonien, est en chaque point orthogonal au gradient du hamiltonien en ce point ∂H ∂H ~ ∇H = . , ∂x ∂p Dans l’exemple 4.2.2 (b) ci-dessus, le résultat est tout simple : les trajectoires dans le plan (X, P ) sont des cercles centrés à l’origine et le gradient de H = (P 2 + X 2 )/2 est porté par les droites passant par l’origine. Cela peut être énoncé réciproquement : le gradient de H = (P 2 + X 2 )/2 est porté par les droites passant par l’origine, les trajectoires sont donc des cercles centrés à l’origine. Ce résultat se généralise à un nombre quelconque de variables (x, p), dans le sens que le mouvement reste limité au surfaces H = cste, orthogonales en ~ = (∇ ~ x H, ∇ ~ p H) . On peut ramener les lois de conservation tout point à ∇H de l’impulsion et du moment cinétique à des considérations géométriques du même type . 4.2.5 Lien entre mécanique analytique et mécanique quantique Les formules ci-dessus nous font entrevoir une chose étonnante : il y a une forte analogie de structure entre la mécanique analytique, et la mécanique quantique. On démontre en mécanique quantique 9 ce qu’on appelle le théorème d’Ehrenfest : la dérivée temporelle de la valeur moyenne hai d’une 9. Voir par exemple J.L. Basdevant et J. Dalibard, Mécanique quantique chapitre 7, Section 3. 4.3. SYSTÈMES DYNAMIQUES 107 grandeur A est reliée au commutateur de l’observable  et du hamiltonien Ĥ par la relation d 1 ∂  hai = h[Â, Ĥ]i + h i . (4.36) dt i~ ∂t Mis à part le fait qu’en mécanique quantique on considère des valeurs moyennes dans un état donné, (4.36) a la même structure que (4.16) si l’on remplace les crochets de Poisson par les commutateurs, divisés par i~, des observables quantiques. Cette même remarque s’applique aux relations de commutation canoniques de Heisenberg des observables conjuguées de position x̂ et d’impulsion p̂ [x̂j , p̂k ] = i~δjk , (4.37) que l’on rapprochera de (4.12). En effet Heisenberg avait introduit ces relations en 1925 pour rendre compte des niveaux d’énergie discrets des atomes, et Dirac quelques semaines plus tard, à la suite d’une conférence de Heisenberg, avait découvert cette identité de structure des deux mécaniques. Tous les deux avaient 23 ans. Bien entendu, la nature mathématique et l’interprétation physique des êtres manipulés sont différentes dans les deux cas, mais les équations qui les relient sont les mêmes à condition de faire la correspondance entre les crochets de Poisson en mécanique analytique et les commutateurs divisés par i~ - en mécanique quantique 10 . Dans des problèmes complexes en mécanique quantique la relation entre crochets de Poisson et commutateurs peut servir de guide pour la quantification du système. 4.3 Systèmes dynamiques Considérons un système dans l’espace des phases à 6N dimensions. Si l’on note X(t) = ({ri (t)}, {pi (t)}) la position du système dans l’espace des phases à l’instant t, les équations de Hamilton sont de la forme Ẋ = F(X), 10. Cependant, en mécanique quantique, il faut faire attention à ce que les relations (4.37), valables pour des coordonnées cartésiennes, ne conservent pas toujours leur forme dans un changement de variables canonique. Par exemple l’énergie cinétique à deux dimensions p2 /2m s’exprime en terme des moments pr et pϕ , conjugués aux coordonnées polaires r, ϕ comme p2r /2m + p2ϕ/(2mr2 ) où pr = mṙ et pϕ = mr2 ϕ̇. Le hamiltonien correspondant en mécanique quantique s’écrit −~2 /2m[∂ 2 /∂r2 + (1/r)∂/∂r + (1/r2 ) ∂ 2 /∂ϕ2 ] . Au vu du terme (1/r)∂/∂r , ceci montre qu’on ne peut pas simplement remplacer pr → (~/i)∂/∂r pour maintenir (4.37) entre r et pr . Par contre le remplacement pϕ → (~/i)∂/∂ϕ est le bon, voir J.L. Basdevant et J. Dalibard, Mécanique quantique, chapitre 7, Section 4. 108 Formalisme canonique de Hamilton c’est-à-dire une équation différentielle du premier ordre pour l’évolution du vecteur à 6N composantes X(t), ce que l’on nomme un système dynamique. Ce type de problème a été une extraordinaire source de découvertes tant en mathématiques qu’en physique ; on pourra se référer à [11], [12], [13]. Le fondateur de ce champ d’étude est Henri Poincaré, en 1885, quand il a étudié le problème des 3 corps. Une pléiade de mathématiciens célèbres ont étudié ce problème, qui est toujours un sujet d’étude de premier plan en mathématiques : J.-C. Yoccoz a obtenu la médaille Fields en 1994 pour ses travaux sur le sujet, qu’il avait abordé avec Michael Herman, au Centre de Mathématiques de l’Ecole Polytechnique. On étudie l’ensemble des mouvements possibles, ce qu’on appelle le flot de ces vecteurs. Cela mène à des problèmes fascinants : les problèmes limites à t = ∞, les attracteurs et les attracteurs étranges ; les bifurcations, changements brusques de la nature de ces flots à certaines valeurs des paramètres de F(X), et les comportements chaotiques. 4.3.1 Poincaré et le chaos dans le système solaire Poincaré avait démontré que, dans un système gravitationnel impliquant plus de deux astres, il existe des régions dans l’espace des phases, où des trajectoires aussi proches que l’on veut initialement, s’éloignent l’une de l’autre de façon exponentielle avec le temps. 11 . Cet effet est ce que l’on appelle le chaos. Il se rencontre dans quantité d’autres problèmes physiques. Suivant le système considéré, le temps caractéristique est très variable. Le système solaire est donc un système dynamique très compliqué où ces comportements chaotiques existent. Il semble que pour certains aspects concernant la terre, l’échelle de temps pour la multiplication par e de l’incertitude sur les conditions initiales est de l’ordre de 10 millions d’années, de façon que la dynamique devient impredictible à partir de la centaine de millions d’années. Ceci est à mettre en relation avec l’âge du système solaire d’environ cinq milliards d’années [13]. Un exemple simple de système chaotique est le jeu de dés. En poussant les choses a l’extrême, dans le cadre de la mécanique classique, si l’on connaissait très précisément toutes les données du problème (conditions initiales, façon de lancer le dé, géométrie de celui-ci, etc...), on pourrait en principe prévoir 11. Au XIXe siècle, sous l’impulsion de Laplace, le développement en série des perturbations avait donné des résultats extraordinairement précis en mécanique céleste. Au passage, Poincaré montrait que ce développement ne convergeait pas ! Ce n’était qu’un développement asymptotique. 109 4.3. SYSTÈMES DYNAMIQUES le résultat (la face sur laquelle il va retomber), et le phénomène n’aurait pas de caractère probabiliste. Toutefois, il est bien évident qu’à des conditions initiales extrêmement voisines correspondront des résultats d’expérience différents, et qu’il nous faudrait donc posséder une information considérable sur le système pour effectuer cette prévision. Typiquement on se limite donc à une description probabiliste du phénomène, dans laquelle on s’impose une certaine ignorance des conditions initiales, qui sont choisies «au hasard». Ce phénomène se retrouve dans la mécanique céleste, et bien d’autres problèmes, pour des conditions initiales qui sont voisines sans l’être de façon infinitésimale, pourvu que le temps d’évolution soit suffisamment long. Le cas de 3 planètes de masses inégales gravitant autour d’un «Soleil» en tenant compte de leurs interactions mutuelles est montré sur la figure 4.1. On voit que, si au début de l’évolution, tout se passe de façon relativement douce, la plus légère des planètes est tout simplement éjectée au bout d’un certain temps. En faisant tourner l’ordinateur suffisamment longtemps, on s’aperçoit que l’ensemble des 2 autres, qui semble tout à fait tranquille après l’expulsion de la troisième, adopte des configurations elles-mêmes inattendues. 4.3.2 L’effet aile de papillon ; l’attracteur de Lorenz On considère l’évolution d’une tranche d’air rectangulaire chauffée par dessous et refroidie par dessus. Les variables sont au nombre de trois : x est proportionnel à l’intensité du mouvement de convection, y est proportionnel à la différence de température entre les courants ascendants et les courants descendants, et z est proportionnel à la distortion du profil du gradient de température par rapport à la linéarité. Peu nous importe le détail de la physique du problème. Dans le modèle de Lorenz, l’évolution temporelle est donnée par le système différentiel non-linéaire à 3 variables dx = σ(y − x) , dt dy = ρx − y − xz dt , dz = xy − βz dt , (4.38) où σ est la constante de Prandtl, qui caractérise la viscosité et la conductivité thermique du fluide, ρ est un paramètre de contrôle, qui représente la différence de température entre le bas et le haut du réservoir, et β mesure le rapport entre hauteur et largeur du système de convection. Lorenz résolvait ces équations pendant la nuit avec des heures et des heures d’ordinateur, par la méthode de pas discrets (xi , yi , zi ) → (xi+1 , yi+1 , zi+1 ). Cela générait, à l’époque, des kilogrammes de papier (appelés «listings»). 110 Formalisme canonique de Hamilton Figure 4.1 – Evolution de 3 planètes, autour d’un soleil, en tenant compte de leurs interactions mutuelles. Le déroulement temporel des images doit se lire de gauche à droite et de bas en haut. L’intervalle de temps entre deux images est constant. On voit qu’à la onzième étape, la troisième planète, plus légère et initialement proche de la deuxième, est expulsée du système. Image due à Jean-François Colonna, [email protected], http ://www.lactamme.polytechnique.fr ; tous droits réservés. 4.3. SYSTÈMES DYNAMIQUES 111 A titre d’exemple des performances informatiques du début des années 60, son premier ordinateur, nommé Royal McBee, était capable de faire 60 multiplications par seconde. Un jour, il eut l’idée de refaire un calcul dont il avait la solution en prenant comme point de départ une valeur intermédiaire (xi , yi , zi ) obtenue dans son calcul de la veille. A sa stupéfaction, les valeurs suivantes devenaient, après un nombre relativement faible d’itérations, complètement différentes de celles de la veille. Il venait de redécouvrir le chaos, dû, en l’occurrence, aux erreurs d’arrondi des nombres manipulés : la sensibilité des résultats aux conditions initiales provoque l’écart considérable de deux solutions initialement voisines. Lorenz appela cela l’effet «aile de papillon». En fait le titre d’une de ses conférences était : Le battement d’une aile de papillon au Brésil peut-il déclencher une tornade au Texas ? Coïncidence ou non, l’«attracteur de Lorenz» a une forme d’ailes de papillon. On peut voir sur les figures 4.2 et 4.3 le résultat d’une itération des équations (4.38). On voit que l’évolution du point (x, y, z) en fonction du temps a un aspect tout à fait tranquille : le point tourne sur une des nappes de l’attracteur, sauf que, de façon imprévue, à certains instants il «saute» d’une nappe (ou d’une aile) à l’autre. C’est imprévu dans le temps, c’est également imprévu dans l’espace dans le sens où les trajectoires de deux points initialement très proches dans l’espace des phases peuvent devenir complètement différentes à un instant ultérieur. Les deux positions peuvent notamment se retrouver, à un instant donné, sur deux nappes différentes de l’attracteur. Soulignons en concluant que le système de Lorenz est du type le plus simple qui montre ce comportement chaotique : un système dynamique chaotique doit être non-linéaire et comporter au moins 3 variables. Un théorème célèbre de Poincaré et Bendixson interdit ce genre de comportement aux systèmes à seulement 2 variables indépendantes, comme par exemple un système hamiltonien dans un espace des phases à 2 dimensions. Ce théorème interdit également le comportement chaotique de systèmes dynamiques dans un espace des phases à N dimensions, si il existe en même temps N − 2 quantités conservées indépendantes, qui limitent le mouvement à un espace des phases «effectif» bi-dimensionnel 12 . 12. L’interdiction d’un comportement chaotique dans un espace des phases bidimensionnel est liée au fait topologique, qu’une courbe fermée dans un espace bidimensionnel sépare l’espace en deux parties disjointes d’une part, et d’autre part au fait que deux trajectoires distinctes dans l’espace des phases ne se croisent jamais (pourquoi d’ailleurs ?). 112 Formalisme canonique de Hamilton Figure 4.2 – Attracteur de Lorenz vu sous deux angles différents. Les points correpondent à une résolution de (4.38) par une méthode de discrétisation. On peut suivre ces points et voir la transition, imprévisible une quasi-période plus tôt, d’une nappe vers l’autre de l’attracteur. Figure 4.3 – Projection de l’attracteur de Lorenz sur le plan (x,z). Images dues à Jean-François Colonna, tous droits réservés. 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 4.4 113 L’action et l’équation de Hamilton-Jacobi Le principe de moindre action consiste à trouver les équations du mouvement en minimisant l’action définie en fonction du lagrangien et des points de départ et d’arrivée par (1.8). L’action elle-même doit donc déterminer les trajectoires physiques. En quelles variables doit-on l’exprimer ? Il semble naturel, à un degré de liberté, de calculer les valeurs de S le long de l’ensemble des trajectoires physiques, c’est-à-dire comme une fonction du point et de l’instant d’arrivée (x, t) , le point et l’instant de départ étant fixés. De façon équivalente, nous voulons caractériser les diverses trajectoires issues de (x1 , t1 ) et arrivant en (x, t) par la valeur de l’action S(x, t; x1 , t1 ). L’action est définie par Z t S= t1 L(x, ẋ; t′ ) dt′ , (4.39) les variables (x(t), ẋ(t)) prenant par hypothèse dans cette expression leurs valeurs physiques, qui satisfont les équations d’Euler-Lagrange. 4.4.1 L’action comme fonction des coordonnées et du temps Reprenons la variation de l’action écrite en (2.4) Z t ∂L ∂L δS = δx(t) + δ ẋ(t) dt . ∂x ∂ ẋ t1 (4.40) Nous intégrons le deuxième terme par parties, mais nous n’imposons plus d’arriver au même point x(t) mais en un point voisin x(t) + δx(t) (en maintenant δx(t1 ) = 0). Le terme tout intégré ne s’élimine donc plus, et l’on obtient Z t ∂L d ∂L ∂L δS = δx(t) dt = p δx(t) (4.41) δx(t) + − ∂ ẋ ∂x dt ∂ ẋ t1 car, par hypothèse, la trajectoire est physique, si bien que l’intégrale s’annule. De façon plus générale, on a pour N variables δS = N X i=1 pi δxi . (4.42) 114 Formalisme canonique de Hamilton Par conséquent, les dérivées partielles de l’action par rapport aux coordonnées sont tout simplement les moments conjugués ∂S = pi , soit encore ∂xi ∂S = pi ∂qi (4.43) si l’on travaille avec un ensemble quelconque [qi , pi ] de variables canoniquement conjuguées. De même, on peut calculer la variation de l’action si l’on varie l’instant d’arrivée t. On a, de façon évidente, dS =L . dt (4.44) Mais, si nous considérons l’action comme fonction des coordonnées et du temps, on a N N ∂S X ∂S ∂S X dS = + ẋi = + pi ẋi . (4.45) dt ∂t ∂x ∂t i i=1 i=1 En réunissant ces deux égalités, on obtient que la dérivée partielle de l’action par rapport au temps est, au signe près, le hamiltonien N X ∂S =L− pi ẋi = −H ∂t i=1 , (4.46) et la différentielle totale de l’action s’écrit en fonction des coordonnées et du temps N X pi dxi − H dt . (4.47) dS = i=1 On obtient alors l’expression suivante pour l’action ! Z X N S= pi dxi − H dt (4.48) i=1 où l’intégrale est évaluée le long de la trajectoire physique à x1 , t1 fixés. Le principe de moindre action, sous la forme exprimé par Hamilton, s’écrit δS = 0 à x1 , t1 et x2 , t2 fixés, et (4.48) donne alors ! Z Z X N dxi − H dt ≡ δ L dt = 0 , (4.49) δS = δ pi dt i=1 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 115 qui est bien la forme (1.8) qui nous a servi de point de départ au chapitres précédents. Si nous travaillons avec les variables conjuguées (x, p) et non les variables (x, ẋ) du chapitre 2, les équations canoniques de Hamilton se déduisent directement de l’expression (4.48) de l’action. En effet, considérons les variables x et p comme indépendantes, et prenons le cas simple d’un seul degré de liberté, l’action est Z (2) S= (p dx − H dt) . (4.50) (1) Si l’on fait varier x de δx et p de δp , en imposant comme au chapitre 2, δx(2) = δx(1) = 0, la variation de S est Z (2) ∂H ∂H δS = δp ẋ + p δ ẋ − δx − δp dt . (4.51) ∂x ∂p (1) où l’on a choisi de paramétrer l’intégrale par le temps. Le deuxième terme dans l’intégrale peut être intégré par parties. Le terme tout intégré (p δx) s’annule puisque par hypothèse δx(2) = δx(1) = 0, et l’on obtient Z (2) ∂H ∂H ] − δx [ṗ + ] dt , (4.52) δS = δp [ ẋ − ∂p ∂x (1) qui s’annule pour toute variation (δx, δp) si et seulement si les intégrants sont identiquement nuls soit ẋ = ∂H , ∂p ṗ = ∂H ∂x , où l’on reconnaît les équations canoniques de Hamilton. En résumé on obtient le hamiltonien aussi bien que les équations hamiltoniennes directement de l’action. 4.4.2 Equation de Hamilton-Jacobi L’équation de Hamilton-Jacobi se lit sur (4.46) et (4.43). Nous pouvons remplacer dans la fonction de Hamilton les moments pi par les dérivées partielles de l’action, pour aboutir à ∂S ∂S ∂S + H(x1 , . . . , xN , ,..., ; t) = 0 . ∂t ∂x1 ∂xN (4.53) 116 Formalisme canonique de Hamilton L’équation de Hamilton-Jacobi est une équation aux dérivées partielles nonlinéaire, du premier ordre. Elle permet de calculer le mouvement de la même façon que les équations d’Euler-Lagrange ou les équations canoniques. L’emploi de tel ou tel de ces formalismes est une affaire de commodité ou de structure mathématique du problème. L’équation de Hamilton-Jacobi est particulièrement adaptée à la séparation des variables et au choix de variables appropriées à la symétrie d’un problème. (a) Action réduite Par la suite de 4.4.2 nous supposons que la fonction de Hamilton H ne dépend pas explicitement du temps. Alors, l’énergie est conservée. Soit E la valeur de l’énergie du problème considéré, l’équation (4.46) se traduit par ∂S = −E ∂t (4.54) , soit (4.55) S = −Et + S0 (x1 , . . . , xN ) . La quantité S0 est appelée l’action réduite. Elle satisfait l’équation H(x1 , . . . , xN , ∂S0 ∂S0 ,..., )=E ∂x1 ∂xN . (4.56) De façon générale, en se reportant à (4.48) on définit l’action réduite S0 par S0 = Z N X i=1 pi dxi ! , (4.57) et, pour un système isolé, en se limitant aux variations qui laissent invariante l’énergie E , on voit que le principe variationnel porte sur cette quantité S0 : δS0 = 0 . (b) Interprétation géométrique Dans ce cas la relation (4.43) peut également s’écrire en fonction de l’action réduite ∂S0 = pi . (4.58) ∂xi 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 117 Cette forme fait apparaître une propriété géométrique simple qui nous sera utile pour faire le lien avec l’optique. Plaçons nous en coordonnées cartésiennes pour plus de clarté et considérons le cas simple où les impulsions se confondent avec les quantités de mouvement pi = mi ẋi . Considérons dans l’espace des coordonnées (x1 , x2 , . . . , xN ), les surfaces sur lesquelles l’action réduite est constante S0 = Cte. La relation (4.58) signifie que le vecteur P ≡ (p1 , p2 , . . . , pN ) est en tout point orthogonal à ces surfaces. En d’autres termes, le flot des trajectoires est orthogonal aux surfaces S0 = Cte. A un instant donné, cette propriété vaut également pour l’action S. Dans le cas simple d’une particule dans l’espace à 3 dimensions, on voit donc que la trajectoire est en tout point de l’espace orthogonale à la surface S0 = Cte passant par ce point : si l’on note dr un vecteur élémentaire tangent à la surface S0 = Cte au point r, on a par définition ~ 0 · dr = p · dr = 0 . ∇S (4.59) (c) Principe de Maupertuis Pour une particule de masse m dans un potentiel V (r), l’équation (4.56) s’écrit 1 ~ (∇S0 )2 + V (r) = E 2m , ~ 0 )2 = 2m(E − V (r)) . (4.60) ou encore (∇S Dans ce problème, le moment conjugué est simplement égal à la quantité de mouvement p = m ṙ . L’action réduite (4.57) s’écrit donc Z Z S0 = p · dr = m ṙ · dr . (4.61) 2 2 2 2 2 Nous avons q (dr) = dx + dy + dz = (dℓ) d’où ṙ · dr = ℓ̇ dℓ . D’autre part ) ℓ̇ = v = 2(E−V . En reportant dans (4.61) on obtient donc m S0 = Z p 2m(E − V ) dℓ . D’où la forme simple du principe de Maupertuis donnée en 1.2 Z p 2m(E − V ) dℓ = 0 . δ (4.62) (4.63) 118 Formalisme canonique de Hamilton (d) Exemple : potentiel à symétrie sphérique Contentons-nous ici, à titre d’exemple de l’utilisation de l’équation de Hamilton-Jacobi, d’un problème qui englobe le problème de Kepler 13 . En coordonnées sphériques (r, θ, φ) le hamiltonien s’écrit 1 H= 2m p2φ p2θ 2 pr + 2 + 2 2 + V (r, θ, φ) . r r sin θ (4.64) On peut séparer les variables si le potentiel est de la forme V = V0 (r) + f (θ) r2 (4.65) (en toute généralité on peut ajouter un terme en g(φ)/r 2 sin2 θ). L’équation de Hamilton-Jacobi s’écrit alors " 2 2 2 # ∂S0 1 ∂S0 ∂S0 1 1 =E + V0 (r) + + 2mf (θ) + 2m ∂r 2mr 2 ∂θ sin2 θ ∂φ (4.66) où E est la valeur constante de l’énergie. La variable φ est cyclique, notons ℓ = Lz la valeur constante de pφ . Autrement dit, ∂S0 ∂φ 2 = ℓ2 . En portant cela dans (4.66) on réduit le problème à " # 2 2 1 ∂S0 ∂S0 1 ℓ2 + V0 (r) + + 2mf (θ) + =E 2m ∂r 2mr 2 ∂θ sin2 θ (4.67) . (4.68) En multipliant par 2mr 2 on constate que cette équation se sépare en la somme de deux termes, l’un portant sur la variable θ, l’autre sur la variable r. On recherche par conséquent une solution de la forme S0 = ℓ φ + S1 (θ) + S2 (r) . (4.69) 13. Pour d’autres exemples on pourra se référer au livre réf.[9] Mécanique Chapitre VII, § 48. 119 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI On obtient 2 ℓ2 dS1 = a + 2mf (θ) + dθ sin2 θ 2 dS2 1 a = E + V0 (r) + 2m dr 2mr 2 (4.70) (4.71) , où a est, comme E et ℓ, une constante du mouvement, déterminée par les conditions initiales. L’intégration de ces équations donne S = −Et + ℓ φ+ + Z r 2m(E − V0 (r)) − a r2 Z s a − 2mf (θ) − dr + ℓ2 sin2 θ dθ . (4.72) Ici, (E, ℓ, a) sont des constantes d’intégration arbitraires. Pour obtenir les équations du mouvement, on utilise le Théorème de Jacobi, que nous allons expliquer sur le cas le plus simple à une dimension. Théorème : Soit a une constante d’intégration, et supposons que nous connaissons l’action S(q, t; a) 14. Alors β = ∂S/∂a est une constante du mouvement. Démonstration : On a par définition β= ∂S ∂a soit d ∂ ∂S ∂2S β= + q̇ dt ∂t ∂a ∂q ∂a (4.73) . Or, q̇ est, par définition, la dérivée de q le long de la trajectoire physique, par conséquent q̇ = ∂H ∂p , et d ∂ ∂S ∂H ∂ 2 S β= + dt ∂t ∂a ∂p ∂q ∂a . Par ailleurs, on a ∂ ∂S(q, t; a) ∂H ∂ 2 S H(q, )= ∂a ∂q ∂p ∂a∂q . (4.74) 14. On se souvient que nous considérons S à positions et temps initiaux fixés. Ces données peuvent s’exprimer à travers des constantes d’intégration a. 120 Formalisme canonique de Hamilton En reportant dans (4.73), on obtient le résultat souhaité d ∂ ∂S ∂S(q, t; a) β= + H(q, ) =0 , dt ∂a ∂t ∂q en raison de l’équation de Hamilton-Jacobi (4.53). (4.75) CQFD Reprenons le résultat (4.72) et considérons les trois constantes d’intégration (E, ℓ, a). A partir de l’expression (4.72) de l’action, on définit les trois constantes βE , βℓ , βa par βE = ∂S ∂E , βℓ = ∂S ∂ℓ , βa = ∂S ∂a . La valeur de ces constantes est fixée par les conditions initiales du problème. On obtient donc la trajectoire à partir des trois équations obtenues en dérivant (4.72) par rapport à E, ℓ et a. 4.4.3 Limite géométrique de l’optique ondulatoire. Les considérations précédentes permettent de comprendre comment l’optique géométrique se présente comme la limite à petites longueurs d’onde de l’optique ondulatoire. (a) Onde scalaire Considérons l’équation de propagation d’une onde scalaire Φ dans un milieu d’indice de réfraction variable n(r). On suppose que le milieu est inhomogène, mais isotrope : l’indice n dépend du point considéré mais pas de la direction de propagation. Le cas général de la propagation des ondes électromagnétiques dans un milieu non-conducteur de susceptibilités électrique et magnétique ε et µ, en tenant compte d’éventuelles discontinuités entre deux milieux et de la polarisation, est traité dans le livre de Born et Wolf Principles of Optics réf.[14], Chapitre III et Appendice I. Il suffit pour notre propos de considérer un milieu isotrope non-magnétique. L’équation de propagation d’une onde scalaire Φ(r, t) est n2 ∂ 2 Φ − ∆Φ = 0 . c2 ∂t2 (4.76) 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 121 On étudie une onde périodique en temps de pulsation ω soit Φ(r, t) = ϕ(r)e−iωt , ce qui, reporté dans l’équation précédente mène à n2 ω 2 ϕ + ∆ϕ = 0 . c2 (4.77) Cherchons une solution de cette équation de la forme 15 ϕ = ϕ0 (r)eik0 S(r) , (4.78) où 2π ω = (4.79) c λ est le module du vecteur d’onde. La quantité S dans (4.78) est appelée l’ei⊃ ′ konal (du grec εικ ων image). Reportons (4.78) dans (4.77), nous obtenons, après simplification par eik0 S(r) et en divisant par (−k02 ), ~ 2 − i 2∇ϕ ~ 0 · ∇S ~ + ϕ0 ∆S − 1 (∆ϕ0 ) = n2 ϕ0 . ϕ0 (∇S) (4.80) k0 k02 k0 = Dans cette équation, le terme imaginaire proportionnel à 1/k0 peut s’écrire, en multipliant par ϕ0 , ~ · (ϕ2 ∇S) ~ ∇ = 0. (4.81) 0 C’est là une équation de conservation, en l’occurrence liée à la conservation ~ et la densité d’énergie de l’énergie. L’onde se propage dans la direction de ∇S 2 est proportionnelle à ϕ0 . On trouvera l’interprétation complète en termes du vecteur de Poynting dans le livre de Born et Wolf réf.[14]. Considérons maintenant la partie réelle. Supposons que la longueur d’onde soit très petite, c’est à dire que l’indice n ne varie pas sur une longueur d’onde et que la taille d’instruments (par exemple des diaphragmes) soit beaucoup plus grande que λ défini en (4.79). Cette hypothèse peut également s’exprimer sous la forme λ → 0 par conséquent k0 → ∞ et s’appelle l’approximation eikonale. Nous négligeons alors le terme en 1/k02 ce qui mène à l’équation de l’eikonal ~ 2 = n2 (∇S) (4.82) qui est l’équation fondamentale de l’optique géométrique. Dans cette approximation, l’onde Φ(r, t) = ϕ0 (r)ei(k0 S(r)−ωt) , (4.83) 15. l’idée étant que le premier facteur ne que varie faiblement dans l’espace par rapport au deuxième 122 Formalisme canonique de Hamilton se propage avec un vecteur d’onde localement perpendiculaire aux surfaces S(r) = Cte , définies par (4.82). Ces surfaces sont les fronts d’ondes géométriques. (b) Optique géométrique et mécanique classique Bien entendu, on note l’extrême similitude de l’équation de l’eikonal (4.82) et de l’équation de Hamilton-Jacobi (4.60) pour un point matériel. L’action réduite S0 de ce dernier et l’eikonal S pour une onde lumineuse suivent la même loi si l’on fait la correspondance n(r) ⇐⇒ p 2m(E − V (r)) . (4.84) Nous avons vu que (4.60) mène au principe de Maupertuis pour un point matériel Z p δ 2m(E − V (r)) dℓ = 0 . De la même manière l’equation de l’eikonal (4.82) mènera alors à la relation Z Z n(r) dℓ = 0 (4.85) δ n(r) dℓ = 0 ou aussi δT = δ c qui n’est autre que le principe de Fermat ! C’est Hamilton qui fit cette découverte autour de 1830. Il avait compris comment et dans quelle limite l’optique géométrique était une approximation de l’optique ondulatoire. Fasciné par les principes variationnels, et en particulier par la similitude entre le principe de Maupertuis en mécanique et le principe de Fermat en optique géométrique, il remarqua que les formalismes de l’optique et de la mécanique pouvaient être unifiés, et (vision prophétique !) que la mécanique newtonienne correspondait à la même limite ou approximation, que l’optique géométrique par rapport à l’optique ondulatoire. Cette remarque fut ignorée par ses contemporains ce que déplora en 1891 le célèbre mathématicien Felix Klein. Il est vrai qu’en 1830 aucune expérience ne mettait en évidence le rôle de la constante de Planck. Remarquons, finalement, que l’interprétation géométrique (4.59) qui, dans ce cas revient à (4.83), n’est rien d’autre que le Principe de Huygens . Ce principe, première théorie ondulatoire de la lumière, consiste à dire que la lumière se propage comme un front d’onde. A chaque instant t, chaque 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 123 point du front d’onde peut être considéré comme une source ponctuelle. A l’instant suivant t + δt le nouveau front d’onde est l’enveloppe des sphères de rayon δr = (c/n)δt centrées en chaque point du front d’onde précédent. Ce principe est équivalent à l’approximation eikonale : les enveloppes constituent les surfaces d’eikonal S constant, et il est alors, comme on a vu, équivalent au principe de Fermat. L’approche de Huygens fut vivement combattue par Newton, promoteur acharné du concept corpusculaire. Toutefois, Huygens fut le premier à obtenir grâce à ce principe, une théorie de la double réfraction par les cristaux anisotropes comme le spath d’Islande. 4.4.4 Approximation semi-classique en mécanique quantique. Le même cadre de pensée peut être appliqué à la mécanique ondulatoire et à l’équation de Schrödinger, où on l’appelle l’approximation semi-classique de Brillouin, Kramers et Wentzel (BKW). On se reportera par exemple au livre de Messiah réf.[15] Mécanique quantique, tome 1, chapitre VI pour tout détail, notamment dans l’application pratique de cette méthode. Considérons l’équation de Schrödinger i~ ~2 ∂ ψ(r, t) = − ∆ψ(r, t) + V (r) ψ(r, t) . ∂t 2m (4.86) Nous séparons dans la fonction d’onde le module et la phase suivant i ψ(r, t) = A(r, t) exp S(r, t) . (4.87) ~ En substituant dans (4.86) et en séparant partie réelle et partie imaginaire, on obtient 1 ~ 2 ~2 ∆A ∂S + (∇S) + V = ∂t 2m 2m A ∂A ~ 1 ~ + A ∆S = 0 . m + ∇A · ∇S ∂t 2 (4.88) (4.89) La seconde équation exprime la conservation de la probabilité. Si l’on introduit les densités de probabilité ρ et de courant de probabilité J comme ρ(r, t) = ψ ∗ (r, t)ψ(r, t) , J(r, t) = ~ ~ − ψ ∇ψ ~ ∗) , (ψ ∗ ∇ψ 2im (4.90) 124 Formalisme canonique de Hamilton la conservation de la probabilité s’écrit sous forme locale ∂ ~ · J(r, t) = 0 . ρ(r, t) + ∇ ∂t (4.91) Avec la forme (4.87), cette équation revient à m ∂ 2 ~ ~ A + ∇ · (A2 ∇S) =0 ∂t (4.92) ce qui est équivalent à (4.89). On rapprochera cette équation de l’équation (4.81). L’approximation classique consiste à prendre la limite ~ → 0 dans l’équation (4.88) soit 1 ~ 2 ∂S + (∇S) + V = 0 , ∂t 2m (4.93) qui n’est autre que l’équation de Hamilton-Jacobi classique (4.53). Par conséquent, dans la limite classique, la fonction d’onde peut être considérée comme décrivant un fluide de particules classiques sans interactions mutuelles, soumises au potentiel V . La densité et la densité de courant de ces particules sont à tout instant égales à la densité de probabilité ρ et à la densité de courant de probabilité J quantiques. Exercices 4.1 Vérifier à partir du hamiltonien (4.7) que les équations de Hamilton donnent bien l’équation du mouvement attendue. 4.2 Oscillateurs couplés On considère deux oscillateurs harmoniques couplés de hamiltonien H= p2 mω 2 x21 mω 2 x22 mΩ2 (x1 − x2 )2 p21 + 2 + + + 2m 2m 2 2 4 1. Montrer que la transformation X= x1 + x2 √ , 2 P = p1 + p2 √ 2 . 125 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI p1 − p2 x1 − x2 √ , Q= √ 2 2 est une transformation canonique et exprimer le hamiltonien dans ces nouvelles variables. 2. Trouver les fréquences propres du système. Y = 3. Ecrire la forme générale du mouvement (x1 (t), x2 (t)). 4.3 Système hamiltonien unidimensionnel On considère le mouvement unidimensionnel d’un point matériel de hamiltonien p2 1 H = − 2 . 2m 2q 1. Pourquoi l’énergie E du système est-elle conservée ? En utilisant les équations du mouvement, montrer que la quantité D= pq − Ht 2 est conservée aussi. On supposera D > 0 par la suite. 2. Exprimer la vitesse q̇ du point matériel en faisant apparaître ces deux quantités conservées. 3. Résoudre l’équation différentielle pour q̇ . Quel est le comportement asymptotique du point matériel pour E > 0 ? Que se passe-t-il pour E < 0 ? Interpréter. 4.4 Oscillations forcées On considère un oscillateur harmonique à une dimension de hamiltonien p2 1 H= + mω 2 x2 2m 2 (4.94) où x et p sont des variables conjuguées de Lagrange. √ √ 1. On pose x = X/ mω et p = P mω. Ecrire l’expression du hamiltonien (4.94) en fonction de X et P , et calculer le crochet de Poisson {X, P }. 2. On introduit les fonctions a et a∗ , complexe conjuguée de a, definies par X − iP X + iP , a∗ = √ . a= √ 2 2 Ecrire le hamiltonien en fonction de a et a∗ et ω. 126 Formalisme canonique de Hamilton 3. Calculer le crochet de Poisson {a, a∗ }. 4. Ecrire l’équation de l’évolution dans le temps de a et donner sa solution générale. Exprimer l’énergie E de l’oscillateur à partir des paramètres de cette solution et de ω. 5. On suppose que l’énergie de l’oscillateur est nulle pour t ≤ 0, E(t ≤ 0) = 0. Entre t = 0 et t = T on applique à l’oscillateur une force √ dérivant de l’énergie potentielle Hpot = b 2X sin (Ωt) (Hpot = 0 si t ≤ 0 ou t > T ) où b est un paramètre. Calculer l’énergie E ′ de l’oscillateur pour t > T . 6. Discuter la variation de E ′ en fonction de la pulsation excitatrice Ω. 4.5 Chaîne fermée d’oscillateurs couplés On rappelle que pour 1 ≤ n ≤ N et 1 ≤ n′ ≤ N N 1 X 2ik(n − n′ )π exp ( ) = δnn′ N k=1 N (δ de Kronecker). On considère une chaîne fermée de N particules de même masse m disposées régulièrement sur un cercle plan (voir figure). Ces particules ont chacune un mouvement unidimensionnel suivant la normale (Ox) au plan. On désigne par xn , n = 1, . . . , N l’abscisse de la particule n le long de cet axe. 127 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI Ces particules forment un ensemble d’oscillateurs harmoniques couplés à leurs plus proches voisins. Le hamiltonien est N X p2 1 1 [ n + mω 2 x2n + mΩ2 (xn − xn+1 )2 ] H= 2m 2 2 n=1 (4.95) où pn est le moment conjugué de xn et où nous adoptons la convention cyclique xN +1 ≡ x1 . 1. On définit les variables complexes suivantes N 1 X 2iknπ/N e xn , yk = √ N n=1 N 1 X −2iknπ/N qk = √ e pn N n=1 (4.96) dont les relations inverses sont N 1 X −2iknπ/N xn = √ e yk , N k=1 N 1 X 2iknπ/N pn = √ e qk N k=1 . (4.97) (a) Montrer que ∗ yk = yN −k , ∗ qk = qN −k N X N X . (b) Montrer que N X yk yk∗ k=1 = x2n et n=1 qk qk∗ = N X p2n (4.98) n=1 k=1 (c) Montrer que N X n=1 (xn − xn+1 )2 = N X 4 sin2 ( k=1 kπ )yk yk∗ N (4.99) 2. Equations du mouvement et leur solution. (a) Ecrire le hamiltonien (4.95) en fonction de {yk , yk∗, qk , qk∗ }. (b) Calculer les crochets de Poisson suivants {yj , qk } , {yj∗, qk∗ } , ∗ {yj , qN −k } , {yj∗, qN −k } . (4.100) (c) Ecrire les équations différentielles satisfaites par les {yk , yk∗ , qk , qk∗ }. 128 Formalisme canonique de Hamilton (d) Ecrire l’expression générale de {yk (t)} ; en déduire celle de {xn (t)}. 3. On suppose qu’à l’instant t = 0 on a yN (0) = 1, ẏN (0) = 0 et {yn (0) = 0, ẏn (0) = 0, ∀n 6= N}. Calculer {xn (t)} et interpréter le résultat. 4. Propagation d’ondes. On suppose maintenant, pour simplifier, que ω = 0. On suppose aussi que N ≫ 1, si bien que sin(kπ/N) ≃ (kπ/N) pour k ≪ N. On suppose qu’à l’instant t = 0 on a yN −1 = 1, y1 = 1, yn = 0 si n 6= (1 ou N − 1), et ẏn = 0 ∀n. (a) Calculer xn (t) et xN −n (t). (b) Interpréter physiquement le résultat. (c) On suppose que la distance entre deux oscillateurs adjacents est a. En posant que xn (t) est la valeur en y = na d’une fonction f (t, y), écrire l’équation de propagation (équation aux dérivées partielles du second ordre) satisfaite par la fonction f . 4.6 Théorème du viriel On considère, à 3 dimensions, une particule de masse m placée dans un potentiel V (r), de hamiltonien H = p2 /2m + V (r). On suppose que cette particule est dans un état lié d’énergie E donnée. 1. Soit la grandeur physique A = r · p ≡ xpx + ypy + zpz . Calculer le crochet de Poisson {A, H}. En déduire la forme de l’évolution temporelle de A en fonction des variables r et p. 2. On suppose que la particule a un mouvement périodique, de période T . Soit f (r, p) une grandeur physique, on définit sa moyenne hf i par Z 1 T f (t) dt (4.101) hf i = T 0 En considérant la valeur moyenne de Ȧ ≡ dA/dt, montrer que l’on a p2 ~ i 2h i = hr · ∇V 2m (4.102) 3. Que devient cette égalité si V est un potentiel central en puissances V = g r n avec r = |r| ? 4. Dans le cas ci-dessus, quelle est la relation entre l’énergie totale E, la moyenne de l’énergie cinétique hEc i et la moyenne de l’énergie potentielle hV i pour 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 129 a) un oscillateur harmonique n = 2, et pour b) un potentiel newtonien (ou coulombien) n = −1 ? 5. En général, pour un potentiel quelconque, les orbites des états liés ne sont pas fermées, mais elles restent confinées dans l’espace. A tout instant |r| ≤ r0 et |p| ≤ p0 où r0 et p0 sont fixes. Pouvez-vous trouver une généralisation de la définition (4.101) telle que le résultat (4.102) reste valable ? 4.7 Calculer les crochets de Poisson des trois composantes du moment cinétique L = r × p entr’elles. 4.8 Du problème de Kepler à la précession du périhélie de Mercure I. On considère le mouvement non-relativiste d’un objet ponctuel de masse m dans un potentiel coulombien V (r) = − kr , k > 0 . 1. Ecrire le lagrangien L du système. 2. En déduire l’équation du mouvement du point matériel. 3. Ecrire le hamiltonien H. En déduire que l’énergie E du point matériel est conservée le long de la trajectoire. 4. Ecrire les équations de Hamilton pour le point matériel. 5. Evaluer les crochets de Poisson {r, H} et {p, H} du vecteur position r et du vecteur impulsion p avec le hamiltonien. Confirmer ainsi le résultat de la question précédente. 6. Démontrer, toujours en utilisant les crochets de Poisson, que le vecteur moment cinétique L = r × p est conservé. En déduire que le mouvement du point matériel est planaire. 7. Le vecteur de Runge-Lenz est défini comme A= r p×L −k . m r Utiliser les crochets de Poisson pour vérifier que ce vecteur est aussi une quantité conservée. 8. Calculer A2 et vérifier que A2 s’exprime en termes d’autres quantités conservées déjà introduites. 130 Formalisme canonique de Hamilton 9. Montrer que le vecteur A est situé dans le plan du mouvement paramétré par coordonnées polaires r , ϕ . On supposera que A et r sont parallèles pour ϕ = 0 (choix de l’origine des ϕ). Exprimer la quantité A · r en terme de L2 et de r . En déduire la forme géométrique de la trajectoire. Quelle est cette trajectoire pour A < 1, k pour A = 1, k et pour A >1? k 10. Quelle est la signification géométrique de l’orientation du vecteur A ? On considère Ak < 1 . Que peut-on conclure pour la trajectoire du fait que A soit conservé ? II. On considère la planète Mercure, prise comme objet ponctuel de masse m, dans le champ gravitationnel du soleil. La théorie actuelle de la gravitation prédit de faibles corrections au potentiel V (r) = − kr , qui mènent à une modification du hamiltonien de la partie I. Le hamiltonien corrigé H ′ s’écrit H ′ = H + δH = p2 k 3 β4 ε2 − + mc2 − β2 ε − 2m r 2 2 8 où les quantités sans dimension β2 = ( p 2 ) mc et ε= M⊙ G 1 c2 r sont petits et du même ordre de grandeur. Le paramètre k de la partie I prend la valeur k = m M⊙ G . Données numériques : M⊙ = 2 · 1030 kg , masse du soleil. 3 G = 6, 67 · 10−11 kgms2 , constante gravitationnelle. c = 3 · 108 m/s , vitesse de la lumière. r = 55 · 106 km , distance moyenne de la planéte Mercure au soleil. Cette distance ne varie que très faiblement au cours d’une révolution. 1. Calculer et petit. M⊙ G 1 c2 r et vérifier qu’ ε est bien un paramètre sans dimension 2. Pour le système de hamiltonien H ′ , les quantités E et L sont toujours conservées. Pourquoi ? 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 131 3. On définit ∆ comme l’angle de rotation de l’orientation du périhélie de la trajectoire de la planète par révolution. Exprimer ∆ sous forme d’une intégrale portant sur la variable temps. On se souviendra de la signification géométrique de A, et on fera intervenir les crochets de Poisson de A et H ′ , en utilisant le fait que δH est une perturbation faible. 4. Le calcul du crochet de Poisson {A, δH} est élémentaire mais un peu long. On admettra donc le résultat de ce calcul sous la forme suivante : Pour la composante A⊥ perpendiculaire à la direction de A(t = 0) = A(ϕ = 0) dans le plan du mouvement on trouve dA⊥ 1 dA⊥ M⊙ G = = 6 A(0) 2 cos2 ϕ + C1 cos ϕ + C2 sin2 ϕ cos ϕ dϕ ϕ̇ dt cr où C1 et C2 sont des constantes. En déduire l’angle ∆ et la précession du périhélie de Mercure par siècle, en secondes d’arc. Donnée numérique : Le période de révolution pour Mercure est de T = 0, 24 ans. 4.9 Le bétatron Dans un bétatron des électrons sont accélérés sur une trajectoire circulaire fixée. L’adaptation du champ magnétique aux énergies des électrons est fondée sur la loi d’induction de Faraday . Nous allons étudier le mouvement des électrons dans le bétatron dans le formalisme hamiltonien. 1. On considère une particule non-relativiste de masse m et de charge q (par exemple un électron) dans un champ électromagnétique. Ecrire l’expression du lagrangien L de la particule. Dans toute la suite on supposera que le potentiel scalaire est nul : φ(x, y, z, t) = 0 . 2. L’espace peut être paramétré en coordonnées cylindriques (r, ϕ, z) , qui sont liées aux coordonnées cartésiennes par x = r cos ϕ , y = r sin ϕ , z = z . Exprimer la vitesse au carré v 2 de la particule et le ~ en coordonnées cylindriques. Montrer que le laproduit scalaire ~v · A grangien L en coordonnées cylindriques peut s’écrire sous la forme L = m 2 (ṙ + r 2 ϕ̇2 + ż 2 ) + q (ṙ Ar + ϕ̇ Aϕ + ż Az ) . 2 Déterminer le champ radial Ar et le champ tangentiel Aϕ en terme ~ , de r et de ϕ . des composantes cartésiennes de A 132 Formalisme canonique de Hamilton Figure 4.4 – Schéma d’un bétatron 3. Calculer les moments conjugués aux vitesses généralisées ṙ , ϕ̇ , ż . 4. En déduire l’expression du hamiltonien H(pr , pϕ , pz , r, ϕ, z) de la particule. ~ qui dépend du temps, mais qui ne 5. On considère un champ vecteur A ~ = A(r, ~ t) . En déduire l’existence de dépend pas de ϕ ni de z : A deux quantités conservées. Dans toute la suite on supposera que les champs radial et vertical sont nuls : Ar (r, t) = 0 , Az (r, t) = 0 . 6. On suppose qu’à t = 0 on a pϕ = 0 , pz = 0 . En utilisant ces conditions, écrire explicitement les équations du mouvement canoniques de Hamilton pour ϕ , pϕ et pour r , pr ; en fonction de r , de pr et de Aϕ . 7. Dans quelles conditions les équations du mouvement précédentes admettentelles une solution qui décrit un mouvement circulaire de la particule ? 8. On étudiera par la suite un champ vecteur tangentiel Aϕ de la forme p (ν, µ, a > 0) . Aϕ (r, t) = r µ2 (r − a)2 + ν 2 t2 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 133 Montrer que, dans ce potentiel, la particule peut suivre une trajectoire circulaire et donner son rayon. Quelle est la vitesse angulaire ϕ̇(t) de la particule sur cette trajectoire circulaire ? La vitesse de la particule est en augmentation constante, et en pratique les électrons dans le bétatron atteignent rapidement des vitesses proches de la vitesse de la lumière c . Dans ce cas il faut passer à la description relativiste. 9. Rappeler le hamiltonien d’une particule relativiste de masse m et de ~ . En reprenant l’excharge q dans un un potentiel vecteur A = (0, A) ~ 2 en coordonnées cylindriques de la question 4., pression pour (~p − q A) écrire le hamiltonien relativiste en coordonnées cylindriques, toujours ~ = A(r, ~ t) avec Ar (r, t) = 0 , Az (r, t) = 0 . Les quandans le cas A tités pϕ et pz sont-elles toujours conservées ? Ecrire les équations du mouvement de Hamilton pour ϕ , et pour r , pr . 10. On revient au champ tangentiel Aϕ (r, t) du 8. Ecrire le hamiltonien relativiste H pour ce champ dans le cas pϕ = 0 , pz = 0 . Ce hamiltonien dépend explicitement du temps. Soit H0 la fonction dans l’espace des phases obtenue en remplaçant dans H : Aϕ (r, t) → Aϕ (r, 0) . Montrer que H0 est une quantité conservée le long de la trajectoire. On pourra utiliser les crochets de Poisson pour la démonstration. On posera pϕ = 0 , pz = 0 dès le départ. 11. Pour pϕ = 0 , pz = 0 écrire les équations du mouvement de Hamilton pour ϕ , et pour r , pr pour le potentiel du 8. Pour résoudre ces équations, on introduit un paramètre s(t) qui est fonction monotone du temps t d’après la loi s(0) = 0 , ds c2 , =√ dt H0 + b2 t2 b := c q ν . On supposera que |r − a| ≪ a le long de la trajectoire de façon qu’on peut approcher r par a dans l’équation pour ϕ . Dans cette approximation, écrire l’expression pour dϕ . Ecrire aussi les expressions pour ds dpr dr et ds , et donner la solution r(s) de l’équation du mouvement. ds Dans le bétatron on veut accélérer des particules sur des trajectoires circulaires. A quoi doit-on faire attention pour assurer cette condition expérimentalement avec bonne précision ? Expliquer le terme "oscillations de bétatron" en partant de la solution trouvée. 134 Formalisme canonique de Hamilton 12. Exprimer le temps t en fonction du paramètre s et vérifier que la vitesse de la particule reste toujours inférieure à la vitesse de la lumière c . On négligera les petites oscillations autour de la trajectoire circulaire. 4.10 Les points de Lagrange Considérons deux astres de masses M1 et M2 qui, sous l’effet de leur attraction gravitationnelle tournent l’un autour de l’autre en gardant une distance fixe R . On se placera toujours dans un référentiel où le centre de masse des deux astres est au repos et qui est centré au centre de masse. Dans la première partie - questions (a) à (e) - nous choisirons un référentiel inertiel qui satisfait à cette condition. Les deux astres évoluent alors sur des orbites circulaires. On posera M = M1 + M2 pour la masse totale des deux astres, en supposant M1 ≥ M2 . 1. Expliquer pourquoi le mouvement relatif des deux astres est un mouvement planaire. 2. Donner les distances r1 et r2 des astres à leur centre de masse noté O , en fonction de leur distance R et de leurs masses. Montrer que la pulsation de rotation ω des deux astres satisfait ω2 = GM , R3 (4.103) où G est la constante de la gravitation. Pour le mouvement circulaire considéré, on trouve ω de la façon la plus simple en égalisant la force centrifuge et la force gravitationnelle, pour l’un ou l’autre des deux astres. Considérons aussi un astéroïde (ou un satellite), de masse m , si faible qu’il n’influence pas le mouvement des deux astres. 3. En admettant cette approximation, dans quelle mesure la valeur de la masse de l’astéroïde est-elle déterminante pour son mouvement ? 4. On note ~r˜ la position et ~p˜ le moment conjugué (ou l’impulsion) de l’astéroïde dans le référentiel inertiel considéré. On suppose qu’à un moment t donné ~r˜ et p~˜ se trouvent dans le plan déterminé par le mouvement des deux astres. Pourquoi ~r˜ et p~˜ vont-ils rester dans ce plan à tout temps t′ ≥ t ? Par la suite nous considérerons toujours le mouvement de l’astéroïde restreint à ce plan. 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 135 5. Ecrire explicitement le lagrangien L̃ et le hamiltonien H̃ de l’astéroïde qui régissent son mouvement en fonction de la position des deux astres. Dans le référentiel inertiel considéré on choisira comme variables canoniques les coordonnées cartésiennes x̃, ỹ de l’astéroïde dans le plan du mouvement, et leurs moments conjugués p̃x , p̃y . Le lagrangien et le hamiltonien dépendent explicitement du temps. Pourquoi ? 6. On veut passer à un référentiel tournant à la vitesse angulaire ω donnée en (4.103), qui suit le mouvement rotationnel des deux astres. Comment obtient-on le lagrangien de l’astéroïde dans ce nouveau référentiel, en partant du lagrangien L̃ dans le référentiel inertiel ? Montrer que le hamiltonien H dans le référentiel tournant peut s’écrire p~ 2 GmM1 GmM2 H= − ω (xpy − ypx ) − − . 2m |~r − ~r1 | |~r − ~r2 | (4.104) Ici p~ = (px , py ) , et px , py sont les moments conjugués aux coordonnées cartésiennes x, y dans le nouveau référentiel ; ~r1 , ~r2 sont les vecteurs position des astres dans ce référentiel. Par la suite on choisira comme l’axe des x , la droite qui relie les deux astres dans ce référentiel. 7. Donner une quantité conservée pour le système planaire (à deux degrés de liberté) régi par le hamiltonien H . Tenant compte de cette loi de conservation, peut-on exclure à priori un comportement chaotique de la trajectoire de l’astéroïde ? 8. Ecrire les équations du mouvement hamiltoniennes pour les variables x, y et px , py du système régi par H . 9. Le mouvement de l’astéroïde est stationnaire dans l’espace des phases, si il existe des solutions x, y, px , py des équations du mouvement, constants dans le temps (dans le référentiel tournant choisi). Montrer graphiquement qu’il existe 3 solutions stationnaires pour lesquelles l’astéroïde se trouve sur la droite déterminée par la position des deux astres. Caractériser le mouvement de l’astéroïde pour ce type de solution dans le référentiel inertiel de départ. 10. Montrer aussi qu’il existe deux autres solutions stationnaires pour lesquelles l’astéroïde et les deux astres forment un triangle équilatéral. On appelle points de Lagrange les 5 points stationnaires dans l’espace des phases, trouvés dans les deux questions précédentes. 136 Formalisme canonique de Hamilton 11. Pour étudier la stabilité d’un point de Lagrange, on peut regarder de faibles déviations de ~r et de ~p autour de leurs valeurs en ce point de Lagrange. A l’ordre dominant on obtient alors une équation différentielle linéarisée pour ces petites déviations de la forme δ~r δ~r˙ . =M ˙ δ~p δ ~p M est une matrice 4×4, qu’on ne calculera pas. Elle dépend des dérivées du hamiltonien par rapport aux variables canoniques, évaluées au point de Lagrange considéré. Quelle est la condition aux valeurs propres de la matrice M , pour que le point de Lagrange considéré soit stable ? Figure 4.5 – Schéma des 5 points de Lagrange L1 à L5 pour le système Soleil-Terre 12. Il s’avère que les 3 configurations correspondant aux points de Lagrange, situés sur la droite joignant les deux astres sont instables. D’autre part les deux configurations équilatérales sont stables à la M2 condition que M ≤ 0, 04 . Cette condition est vérifiée pour tous les 1 systèmes Soleil-planète dans le système solaire. Le rapport vaut 1/1000 pour le système Soleil-Jupiter. Au vu de ces faits et de la figure expliquer : a) pourquoi on ne trouve pas d’objet naturel situé aux points L1 , L2 , L3 dans aucun système Soleil-planète. b) le fait que plusieurs milliers d’astéroïdes, appelés Troyens, se trouvent près des points L4 , L5 du système Soleil-Jupiter. 4.4. L’ACTION ET L’ÉQUATION DE HAMILTON-JACOBI 137 c) pourquoi on a envoyé plusieurs satellites destinés à l’observation du cosmos vers le point de Lagrange L2 (WMAP en 2001, Herschel et Planck en 2009). d) Application numérique : Donner (à 10% près) la distance à la Terre des trois points de Lagrange instables L1 à L3 pour le système SoleilTerre. On donne : la distance Terre - Soleil : R = 150·106km, et le rapport de leurs masses MS /MT = 300 000 . 138 Solution des exercices Solution des exercices Chapitre 2 2.1 Intégrale première On a directement dΓ/dx = z ′ (1 + z ′2 − z z ′′ )/(1 + z ′2 )3/2 , l’équation de la courbe est 1 + z ′2 − z z ′′ = 0 d’où le résultat. On en déduit p z(x) = a 1 + z ′2 (x) , où a est un constante. En posant z ′ (x) = sinh(φ(x)), il vient z(x) = a cosh(φ(x)) soit z ′ = aφ′ (x) sinh(φ(x)) d’où évidemment aφ′ (x) = 1 et la solution z(x) = a cosh((x − x0 )/a). 2.2 Brachistochrone y O A x Figure 6 – Trajectoire optimale de O à A. Le temps de parcours dans le plan (xOy) est donné par Z A ds T12 = O v 139 Solution des exercices où ds2 = dx2 + dy 2 . La condition initiale sur v et la conservation de l’énergie √ totale impliquent v(x) = 2gx , où on a posé (sans limiter la généralité) O = (0, 0) . Donc Z As 1 + y ′2 T12 = dx , 2gx O où l’on a pris x comme variable indépendante. Le lagrangien associé L = q 1+y ′2 ne dépend pas explicitement de la variable y. Les équations d’Euler2gx Lagrange donnent alors On en tire y′ ∂L 1 p √ = = C = cste . ∂y ′ 1 + y ′2 2gx ẏ 2 = où w = 2γ x − 1 , ẏ = dy dw 1 1+w , 4γ 2 1 − w , et γ = 2g C 2 . En posant w = − cos θ on arrive à 1 dy = (1 − cos θ) dθ 2γ et finalement, en tenant compte du choix O = (0, 0) : y(θ) = 1 (θ − sin θ) , 2γ x(θ) = 1 (1 − cos θ) . 2γ Il s’agit donc d’un arc de cycloïde (voir figure 6) (y − 1 1 θ 2 ) + (x − )2 = ( )2 2γ 2γ 2γ dont le sommet est situé en O. On voit bien qu’au point d’arrivée A = (x2 , y2 ) on a θ2 − sin θ2 y2 /x2 = , 1 − cos θ2 de façon que θ2 → 0 si y2 /x2 → 0 , et θ2 → 2π si y2 /x2 → ∞ . Le cas limite y ≡ 0 correspond à C = 0. 140 Solution des exercices 2.3 Rayons courbes et super-réfraction d’ondes radio RB dℓ . 1. TAB = A n(x,y) c 2 2 2 2. dℓ = dx + dy = dr 2 + r 2 dφ2 = (ṙ 2 + r 2 ) dφ2 , d’où Z B n(r) √ 2 ṙ + r 2 dφ . TAB = c A 3. Si L ne dépend pas de φ la quantité E ≡ ṙ ∂L − L est conservée. ∂ ṙ On trouve n(r) r 2 E=− √ . c r 2 + ṙ 2 4. On obtient r n2 r 2 −1 . ṙ = ±r c2 E 2 5. Pour une trajectoire circulaire r ≡ cste , d’où ṙ ≡ 0 . La condition est 2 2 donc nc2r ≡ E 2 . 6. En dérivant la relation pour ṙ r 2 2 2 2 n r nr 1 dn 1 r̈ = ± ṙ − 1 + r2 q ṙ + r q n ṙ 2 2 2 2 2 2 2 2 2 2 c E n r n r −1c E − 1 c E dr c2 E 2 c2 E 2 r dn r 2 dn n2 r 2 n2 r 2 ≃r 1+ . = r ( 2 2 − 1) + 2 2 r + cE cE n dr n dr 7. En cas de sous-réfraction la courbure est plus grande que dans le régime standard, on a donc dn dn > ( )moy . dr dr En cas de super-réfraction on a dn dn < ( )moy . dr dr = −1 , car r est constant 8. La condition pour un grand cercle est r dn dr dans cette condition. Pour r = R on trouve dn = −1, 57 · 10−4 km−1 . dr En accord avec la figure on est dans le régime de super-réfraction. La réfraction d’ondes radio en fonction des conditions météorologiques et atmosphériques est évidemment d’une grande importance pour la transmission d’ondes radio entre stations terrestres. Voir par exemple le site http ://perso.wanadoo.fr/f6crp/ba/propavu.htm, conçu par Denis Auquebon 141 Solution des exercices z x=L z=z 2 X z1 L Terre x Figure 7 – Chemin du bateau avec un virement de bord en x = L/2. 2.4 Stratégie d’une régate. 1. On a par définition ẋ = vx = v cos θ, ż = vz = v sin θ, par conséquent z ′ = dz/dx = tan θ. 2. On a vx = v cos θ = w/h. Cette vitesse est maximum lorsque h(z ′ ) est minimum, c’est-à-dire pour z ′ = 1, soit θ = π/4. On a alors vx = w/2. En fait, il suffit de multiplier h par une constante pour se mettre dans la situation appropriée à un bateau donné, pour lequel vx,max = λw. 3. On a dt = dx/vx = h′ (z ′ ) dx/w(z), d’où T = Z L dx 0 h′ (z ′ ) w(z) (105) . 4. Posons Φ = h′ (z ′ )/w(z). L’équation de Euler-Lagrange qui optimise le temps total T est d ∂Φ ∂Φ = ( ) . ∂z dx ∂z ′ 5. La fonction Φ ne dépend pas explicitement de x. Par conséquent, on a ∂Φ ∂Φ d Φ = z′ + z ′′ ′ dx ∂z ∂z . 142 Solution des exercices Par conséquent ∂Φ d (Φ − z ′ ′ ) = 0 , dx ∂z ce qui donne (h′ (z ′ )z ′ − h(z ′ ))/w(z) = constante. 6. On a z ′ h′ −h = −2/z ′ . On obtient donc, pour la fonction x(z), l’équation différentielle du premier ordre (−2/A)dx/dz = w(z). D’où le résultat : x=L w0 z − w1 z0 ln(1 + (z/z0 )) w0 z1 − w1 z0 ln(1 + (z1 /z0 )) (106) , où nous avons incorporé les conditions aux limites : (x = 0, z = 0) et (x = L, z = z1 ). 7. On obtient z′ = w0 z1 − w1 z0 ln(1 + (z1 /z0 )) dz = dx w0 L − w1 Lz0 /(z + z0 ) . Si z1 ≪ L et z1 ≪ z0 , la vitesse du vent ne varie pas beaucoup sur le trajet, et on aura z ′ ∼ z1 /L ≪ 1. Or, à la deuxième question, nous avons vu que la vitesse optimale pour un vent constant est atteinte pour z ′ = 1. La configuration envisagée ne correspond certainement pas à la meilleure stratégie. Il faut virer de bord en un point (x1 , Z) avec 0 < x1 < L et Z ≫ z1 , comme représenté sur la figure (7) pour bénéficier de façon optimale de la puissance du vent (cette hypothèse était exclue par l’énoncé). La trajectoire représentée, avec un angle de θ = 45 degrés (|z ′ | = 1 et√un virement de bord θ → −θ en x = L/2 a une longueur totale L 2 et √ une vitesse supérieure à (w0 − w1 )/2. Le temps sur ce chemin Tv = 2L 2/(w0 − w1 ) est, à l’évidence plus court que le temps le long de la trajectoire sans virement de bord T ∼ 2L(z1 /L)/(w0 − w1 ) = 2z1 /(w0 − w1 ) . Commentaire hors problème : on voit combien dans des régates comme la Course de l’America, la présence et le talent d’un bon tacticien est utile. Il doit notamment juger, et préjuger, de la vitesse du vent sur tout le plan d’eau. Dans des cas plus réalistes que celui envisagé ici dans l’équation (2.59), par exemple v = w(1 − cos θ)/2, on pourra se convaincre que le problème devient très vite compliqué à résoudre, il faut le faire numériquement. Si les règlements ne permettent pas 143 Solution des exercices d’entrer la distribution du vent automatiquement dans un ordinateur (ce qui est permis dans les courses au large), l’expérience de l’équipage est primordiale. 2.5 Pendule mobile L= m1 + m2 2 m2 2 2 ẋ + (l φ̇ + 2lẋφ̇ cos φ) + m2 gl cos φ . 2 2 2.6 Propriétés de l’action a) 1. Particule libre S= m (x2 − x1 )2 2 t2 − t1 2. Oscillateur harmonique S= mω (x22 + x21 ) cos ω(t2 − t1 ) − 2x2 x1 2 sin ω(t2 − t1 ) 3. Force constante S= m F 1 F2 (v0 + (t2 − t1 ))2 (t2 − t1 ) + F x1 (t2 − t1 ) − (t2 − t1 )3 2 m 6 m où v0 = (x2 − x1 )/(t2 − t1 ) − (1/2)(F/m)(t2 − t1 ) est la vitesse initiale de la particule. b) Nous partons de la variation de l’action écrite en (2.4) δS12 = Z t2 t1 ∂L ∂L δx(t) + δ ẋ(t) ∂x ∂ ẋ dt . Nous intégrons le deuxième terme par parties, mais nous n’imposons plus d’arriver au même point x2 mais en un point voisin x2 + δx2 . Le terme tout intégré ne s’élimine donc plus, et l’on obtient Z t2 ∂L ∂L d ∂L δx(t) dt . δS12 = δx2 + − ∂ ẋ ∂x dt ∂ ẋ t1 144 Solution des exercices Par hypothèse, la trajectoire est physique, si bien que l’intégrale de droite s’annule. On obtient donc une variation de l’action δS12 = ∂L |x=x2 δx2 = p2 δx2 et donc ∂ ẋ ∂S |x=x2 = p2 . ∂x c) Nous considérons l’action comme fonction de la coordonnée d’arrivée x = L , et aussi d’après et du temps d’arrivée t. On a, de façon évidente, dS dt ∂S ∂S ∂S le résultat précédent dS = + ẋ = + p ẋ . En réunissant ces deux dt ∂t ∂x ∂t ∂S égalités, on obtient ∂t = L − p ẋ = −H , donc au signe près l’énergie au point d’arrivée E2 . 2.7 Moments conjugués en coordonnées sphériques. 1. Le lagrangien est L = 21 m(ṙ 2 + r 2 θ̇2 + r 2 sin2 θ φ̇2 ) − V (r). 2. Les moments conjugués sont pr = ∂L = mṙ , ∂ ṙ pθ = ∂L = mr 2 θ̇ , ∂ θ̇ pφ = ∂L = mr 2 sin2 θ φ̇ . ∂ φ̇ 3. En dérivant (2.60) par rapport au temps, et en tenant compte du fait qu’en coordonnées cartésiennes p = mv, on obtient directement le résultat Lz = mr 2 sin2 θφ̇ = pφ . 4. La conservation de pφ , ou de Lz , correspond à l’invariance par translation en φ, c’est-à-dire à l’invariance par rotation autour de Oz. ~ pa5. Si la particule chargée est plongée dans un champ magnétique B rallèle à Oz, il y a invariance du problème par rotation autour de Oz et la composante Lz est conservée. En effet on ajoute à L un terme ∼ ṙ · (B × r) ∼ Lz · B qui est indépendant de φ (se rappeler (3.33) et noter que pour un champ magnétique constant on peut choisir A = 12 B × r). Chapitre 3 3.1 Repère tournant et pendule de Foucault 1. La vitesse dans le repère tournant s’obtient de v0 par v0 = v + Ω × r 145 Solution des exercices où l’origine r = 0 se trouve sur l’axe de rotation. Le lagrangien est un invariant qui détermine la trajectoire physique indépendamment du repère. Dans le repère tournant il prend donc la forme L= m 2 m v + m v · (Ω × r) + (Ω × r)2 , 2 2 qui s’obtient en remplaçant v0 . 2. On trouve ∂L = m (v + Ω × r) , ∂v ∂L = m (v × Ω) + m Ω2 r − m (Ω · r) Ω . ∂r On en déduit l’équation du mouvement mv̇ = 2m (v × Ω) + m Ω2 r⊥ . On reconnaît la force de Coriolis et la force centrifuge. 3. Nous avons trouvé en 2. p = m (v + Ω × r) . Le moment conjugué contient un terme supplémentaire qui ressemble au terme qA = 2q B × r apparaissant dans un champ magnétique homogène, voir (3.35). L’énergie est conservée puisque le lagrangien ne dépend pas explicitement du temps. 4. Pour θ ≪ 1 on trouve ~r = l (θ cos φ, θ sin φ, −1) , ~v = l (cos φ, sin φ, 0) θ̇ + l (−θ sin φ, θ cos φ, 0) φ̇ , ~ × ~r = l (−Ωz θ sin φ, Ωz θ cos φ + Ωx , Ωx θ sin φ) , Ω ~ × ~r) = l2 (Ωx sin φ θ̇ + Ωz θ2 φ̇ + Ωx θ cos φ φ̇) . ~v · (Ω 5. V (θ) = −mgl cos θ = mgl 2 θ + O(θ4 ) + cste . 2 146 Solution des exercices 6. On a θ̇ sin φ + θ cos φ φ̇ = d (θ sin φ) . dt Les équations du mouvement restent inchangées si l’on ajoute au lagrangien la dérivée totale par rapport au temps d’une fonction quelconque des variables position (et du temps). 7. pθ = ∂L = ml2 θ̇ , ∂ θ̇ pφ = ∂L = ml2 θ2 (φ̇ + Ωz ) . ∂ φ̇ 8. Ls ne dépend pas de φ ; nous déduisons donc des équations d’EulerLagrange que ṗφ = 0 , c’est à dire, pφ est conservé. Nous avons aussi d ∂Ls = ml2 θ̈ , dt ∂ θ̇ ∂Ls = ml2 Ωz θ φ̇ − mgl θ ∂θ Donc θ̈ = Ωz θ φ̇ − g θ. l 9. Pour réaliser cette condition on s’assure que le pendule passe (de façon régulière) par la position θ = 0 , car pφ = ml2 θ2 (φ̇ + Ωz ) d’après 7. 10. Si pφ ≡ 0 , on trouve φ̇ = −Ωz , φ(t) = φ(0) − Ωz t . Dans le cas où l’axe de rotation du repère tournant ne passe pas par ~ × ~r) en l’origine ~r = 0 , on doit modifier le terme de Coriolis m ~v · (Ω ~ m ~v · [Ω × (~r − ~r0 )] , où ~r0 est un vecteur qui relie l’origine à un point de l’axe de rotation. La modification du lagrangien ~ × ~r0 ) = −m −m ~v · (Ω d ~ × ~r0 ) ~r · (Ω dt est une dérivée totale par rapport au temps qui n’affecte pas les équations du mouvement du pendule. La rotation du plan des oscillations s’obtient comme Ωz · 1h = (360o /24) · sin(49o) = 11, 3o . 147 Solution des exercices 3.2 Lagrangien de Proca L’équation d’onde pour A en se servant de (3.61, 3.67). Dans la jauge de Lorenz elle s’écrit ( + µ2 )Aµ = µ0 j µ , équation qui fait apparaître un terme supplémentaire en µ2 par rapport à l’équation d’onde de l’électromagnétisme (voir [2], chapitre 7.3) Aµ = µ0 j µ . Pour j µ = 0 on trouve comme solutions des ondes planes ∼ exp{iωt − k · x} , où ω 2 /c2 = µ2 + k 2 . En portant les relations E = ~ω et p = ~k ceci donne E 2 = ~ 2 µ 2 c2 + p 2 c2 . En comparant à E 2 = m2 c4 + p2 c2 on voit que la quantité ~µ/c a l’interprétation d’une masse du photon. Actuellement les bornes expérimentales supérieures pour cette masse sont de l’ordre de 10−51 kg . Chapitre 4 4.1 Les équations de Hamilton s’écrivent ṙ = ∂H 1 dA = (p − qA) ⇒ mv̇ = ṗ − q , ∂p m dt ∂H ~ · A(r, t)) − q ∇Φ ~ . = q ∇(v ∂r En utilisant (3.24), (3.25) et (3.28) on trouve alors ṗ = − mv̇ = q (v × B + E) . 148 Solution des exercices 4.2 Oscillateurs couplés 1. On obtient sans difficulté {X, P } = 1 H= {X, Q} = 0 {Y, P } = 0 {Y, Q} = 1 P2 mω 2 X 2 Q2 m(ω 2 + Ω2 )Y 2 + + + 2m 2 2m 2 . √ 2. Les fréquences propres du système sont donc ω1 = ω et ω2 = ω 2 + Ω2 . 3. La forme générale du mouvement se déduit immédiatement de X = A cos(ω1 t + φ) , Y = B cos(ω2 t + ψ) . 4.3 Système hamiltonien unidimensionnel 1. Le hamiltonien ne dépend pas explicitement du temps. L’énergie est donc conservée. On a Ḋ = 21 ṗ q + 12 q̇ p − H = 0 , en utilisant les équations du mouvement ṗ = − q13 et q̇ = mp . 2. p 2 q̇ = = (D + E t) . m mq 3. L’équation précédente donne q dq = m2 (D + E t) dt , d’où q 2 − q02 = m2 (2 D t + E t2 ) . Ceci donne pour q0 > 0 r 2 4 q(t) = Dt + E t2 . q02 + m m Pour E > 0 nous trouvons q(t) ≃ r 2E t m à t grand, ce qui correspond au mouvement libre loin de l’origine. Pour E < 0 l’expression de q s’annule pour s D2 D m q02 t0 = + + |E| E2 2|E| et devient imaginaire pure pour des temps t > t0 . La non-existence d’une solution pour t > t0 reflète la singularité du potentiel à l’origine. 149 Solution des exercices 4.4 Oscillations forcées. 1. On obtient sans difficulté H = ω2 (X 2 + P 2 ) , {X, P } = 1 . 2. Dans ces variables, qui sont celles utilisées par Dirac dans la quantification de l’oscillateur harmonique, H = ω(a∗ a) . 3. On obtient évidemment {a, a∗ } = −i. 4. L’équation de l’évolution dans le temps de a est ȧ = {a, H} = −iωa dont on note que c’est une équation du premier ordre. La solution générale est a(t) = a0 exp (−iωt) où a0 est une constante complexe. L’énergie de l’oscillateur est E = ω|a0 |2 . 5. Pour t ≤ 0 on a donc a0 = 0. En présence de Hpot le hamiltonien devient H = ω(a∗ a) + b(a + a∗ ) sin Ωt . On a donc ȧ = {a, H} = −iωa − ib sin Ωt . Cette équation inhomogène se résout par "variation des constantes". On obtient, en tenant compte de la condition E(t < 0) = 0, E(t > T ) = ωb2 | e−i(Ω−ω)T − 1 e−i(Ω+ω)T − 1 2 + | 2i(Ω − ω) 2i(Ω + ω) . 6. On se trouve en présence d’un phénomène de résonance à Ω = ω ( ou à Ω = −ω ce qui est équivalent). Au voisinage de Ω = ω, l’énergie acquise par l’oscillateur est de la forme E(t > T ) = ωb2 sin2 (Ω − ω)T /2 (Ω − ω)2 qui présente un pic de hauteur ωb2 T 2 /4 à Ω = ω. 4.5 Chaîne fermée d’oscillateurs couplés. 1. (a) Il est évident, sur la définition, que ∗ yk = yN −k , ∗ qk = qN −k . 150 Solution des exercices (b) On a N X yk yk∗ = k=1 N N 1 X −2ikn′ π/N ′ 1 X 2iknπ/N e xn )( √ e xn ) (√ N n=1 N n′ =1 k=1 N X (107) La somme sur k nous donne δnn′ , d’où le résultat N X qk qk∗ k=1 = N X p2n . (108) n=1 De même N X qk qk∗ = k=1 N X N N 1 X −2iknπ/N 1 X 2ikn′ π/N ′ (√ e pn )( √ e pn ) (109) N N ′ n=1 k=1 n =1 La somme sur k nous donne δnn′ , d’où le résultat. (c) Par ailleurs N X n=1 (xn − xn+1 )2 = (110) N N N X 1 X X −2iknπ/N −2ikπ/N ( e (1 − e )yk )( e2iknπ/N (1 − e2ikπ/N )yk∗) N n=1 k=1 k=1 La somme sur n nous donne δkk′ , d’où le résultat. 2. Equations du mouvement et leur solution. (a) On a donc N X kπ qk q ∗ 1 2 2 H= [ k + mΩ′ k yk yk∗ ] avec Ω′ k = ω 2 + 4Ω2 sin2 ( ) . 2m 2 N k=1 (b) ∗ ∗ On a : {yj , qk } = {yj∗, qk∗ } = {yj , qN −k } = {yj , qN −k } = δjk . 151 Solution des exercices (c) On obtient : m ∗ (qk + qN −k ) = mqk∗ 2 m ∗ ẏk∗ = {yk∗, H} = (qk + qN −k ) = mqk 2 mΩ′ 2k (yk∗ + yN −k ) 2 q̇k = {qk , H} = − = mΩ′ k yk∗ 2 ∗ mΩ′ 2k (yk + yN 2 −k ) q̇k∗ = {qk∗ , H} = − = mΩ′ k yk 2 (d) On a donc {yk (t)} = ak cos(Ω′ k t + φk ), d’où {xn (t)}. 3. Si à l’instant t = 0 on a yN (0) = 1, ẏN (0) = 0 et {yn (0) = 0, ẏn (0) = 0, ∀n 6= N,√alors yN (t) = cos(ωt) et yn (t) = 0 , ∀n 6= N. On a alors xn (t) = (1/ N ) cos(ωt). Les oscillateurs, de même élongation à chaque instant, sont toujours en phase et seul le mouvement global de rappel par rapport au plan x = 0, à la pulsation ω se manifeste. 4. Propagation d’ondes. Si ω = 0, les fréquences propres sont Ω′k = 2Ω sin(kπ/N) ∼ 2Ω(kπ/N) pour k ≪ N. Les conditions aux limites donnent y1 = cos 2Ωπt/N , yN −1 = cos 2Ωπt/N et yn = 0 autrement. (a) Par conséquent, on obtient : ẏk = {yk , H} = 2nπ 2Ωπt 2 ) cos( ) (111) xn = xN −n = √ cos( N N N 1 2Ωπt − 2nπ 2Ωπt + 2nπ = √ [cos( ) + cos( )] (112) N N N (b) On voit un phénomène de propagation en sens inverse de deux ondes puisque xn+m (t) = xn (t ± m/Ω) dans les termes ci-dessus. le point xn+m a la même amplitude à l’instant t + m/Ω que le point xn à l’instant t. (c) En écrivant que xn (t) = f (t, y = na) la fonction f est f (t, y) = 2Ωπt+2yπ/a √1 [cos( )+ cos( 2Ωπt−2yπ/a )] . Elle satisfait l’équation d’ondes N N N 1 ∂2f ∂2f − = 0 . Ω2 a2 ∂t2 ∂x2 Dans cette chaîne d’oscillateurs couplés une onde progressive de vitesse Ωa se propage. 152 Solution des exercices 4.6 Théorème du viriel. 2 ~ . L’évolution temporelle 1. On trouve sans difficulté {A, H} = pm −r· ∇V 2 ~ . de A est tout simplement dA = {A, H} = pm − r · ∇V dt 2. On a évidemment hȦi = (A(T ) − A(0))/T = 0. Par conséquent, en reportant le résultat précédent, on obtient l’égalité recherchée. ~ = r ∂V = nV . On obtient donc 2hEc i = nhV i . 3. Si V = g r n , on a r · ∇V ∂r 4. L’énergie totale est E = Ec + V . On obtient donc : a) pour un oscillateur harmonique E = 2hEc i = 2hV i, résultat bien connu ; b) Pour un potentiel newtonien E = −hEc i = (1/2)hV i, résultat facile à obtenir pour une orbite circulaire, mais général pour une orbite elliptique quelconque. 5. En général, pour un potentiel quelconque, les orbites des états liés ne sont pas fermées, mais restent confinées dans l’espace. La généralisation de la définition (4.101) de la moyenne est 1 hf i = lim T →∞ T Z T f (t) dt . 0 Avec cette définition, on a hȦi = lim (A(T ) − A(0))/T = 0 puisque T →∞ A(t) est borné quelque soit t. Avec cette définition de la moyenne, la relation reste valable. 4.7 {Lx , Ly } = {ypz − zpy , zpx − xpz } = {ypz , zpx }−{zpy , zpx }−{ypz , xpz }+{zpy , xpz } = −ypx −0−0+py x = Lz . De la même façon on montre {Ly , Lz } = Lx , {Lz , Lx } = Ly . 4.8 Du problème de Kepler à la précession du périhélie de Mercure 1. L = T − V = mv2 2 + k r . 153 Solution des exercices 2. L’équation d’ Euler-Lagrange mène à l’équation de Newton bien connue ~ (r) = −k m r̈ = −∇V r . r3 3. On a par définition H = p · ṙ − L = p2 k − 2m r avec p = ∂L . La conservation de l’énergie suit du fait que H ne dépende ∂ ṙ pas explicitement du temps. 4. On a ṙ = p ∂H = , ∂p m ṗ = − ∂H r = −k 3 . ∂r r 5. On déduit de la définition des crochets de Poisson {r, H} = ∂H ∂p et {p, H} = − ∂H . ∂r On trouve donc pour ṙ = {r, H} et pour ṗ = {p, H} les mêmes résulats qu’en 4. 6. On a dL r = {L, H} = {r, H} × p + r × {p, H} = ṙ × p + r × (−k 3 ) = 0 dt r parce que, dans les deux cas, les vecteurs figurant dans le produit vectoriel sont parallèles. Pour L 6= 0 les vecteurs r et p , et donc aussi v , sont dans le plan perpendiculaire à L . Si L est constant, ce plan est toujours le même. Si L = 0 le mouvement est rectiligne. 7. On calcule {p × L, H} = {p, H} × L + p × {L, H} = −k r ×L + 0 , r3 r k k k p k r·p {k , H} = {r, H} + r { , H} = + r (− ). r r r r m m r3 En développant le produit vectoriel de la première ligne on déduit que {A, H} = { r p×L − k , H} = 0 . m r 154 Solution des exercices 8. On trouve 2k 1 p2 L2 2k 2 1 2 2 (p × L) − r · (p × L) + k = − L + k2 A = 2 2 m m r m mr 2 2L2 E + k2 . m 2 La quantité A est donc entièrement déterminée par les quantités conservées L2 et E . 9. Le vecteur A est perpendiculaire à L et donc dans le plan du mouvement. On a = A·r = donc 1 1 2 (p × L) · r − k r = L − kr , m m A r cos ϕ + k r = L2 L2 1 d’où r(ϕ) = . m 1 + Ak cos ϕ km La trajectoire est donc une conique ; une ellipse pour rabole pour Ak = 1 , et une hyperbole pour Ak > 1 . A k < 1 , une pa- 10. Nous avons choisi l’origine des ϕ tel que ϕ = 0 correspond à la direction de A . C’est la position où la distance du point matériel au centre du potentiel est minimale. La direction de A correspond donc à la position du périhélie de la trajectoire. Le fait que cette direction soit fixée implique dans le cas Ak < 1 que la trajectoire est périodique ou fermée. II. 1. On trouve M⊙ G c2 r = 2, 7 · 10−8 ≪ 1 . 2. H ′ ne dépend pas explicitement du temps t , et H ′ est invariant par rotations. E et L sont donc conservés. 3. Dans l’approximation où ce changement est petit on a ∆ = où A⊥ A(0) A(0) = |A(0)| , et A(2π) = A|| + A⊥ , A⊥ = |A⊥ | . {A, H} = 0 , d’où dA = {A, δH} , dt dA⊥ = {A, δH}⊥ , dt 155 Solution des exercices 1 ∆ = A(0) 4. Avec les données on trouve Z 2π dA⊥ M⊙ G = 6π A(0) 2 , dt c r 0 Z T 0 {A, δH}⊥ dt . ∆ = 6π M⊙ G = 2π · 8, 4 · 10−8 . c2 r Pour passer en secondes d’arc on multiplie par 360 · 60 · 60 et on divise par 2π . Pour passer à la révoultion par siècle on multiplie aussi par 100/0, 24 ≃ 415 . De cette manière on obtient une précession du périhélie de Mercure par siècle de 43, 5′′ . Les astronomes savaient dès le XIXe siècle que la théorie newtonienne était en désaccord avec les observations de la précession du périhélie de Mercure. Le désaccord était de 35′′ d’après les calculs de Jean-Joseph Le Verrier en 1845 et de 43′′ d’après les nouveaux calculs de Simon Newcomb en 1883 (qui a pu se baser aussi sur des observations plus précises). On a essayé d’expliquer ce désaccord par la présence d’autres masses dans le système solaire -qu’on n’a pas su trouver-, et/ou par une modification ad hoc de la loi de Newton. Einstein avait trouvé en 1915 que la relativité générale pouvait expliquer cet écart quantitativement, d’après le résultat du calcul précédent. Pendant plusieurs décennies ce résulat a été la confirmation observationnelle la plus importante de la nouvelle théorie de la gravitation d’Einstein. 4.9 Le bétatron 1. On a d’après le cours L= m 2 v + qv·A − qφ 2 2. On a v · A = (ṙ cos ϕ − ϕ̇ r sin ϕ) Ax + (ṙ sin ϕ + ϕ̇ r cos ϕ) Ay + ż Az = ṙ (Ax cos ϕ + Ay sin ϕ) + ϕ̇ r (Ay cos ϕ − Ax sin ϕ) + ż Az donc Ar = Ax cos ϕ + Ay sin ϕ , Aϕ = r (Ay cos ϕ − Ax sin ϕ) . 156 Solution des exercices 3. pr = ∂L = m ṙ + qAr , ∂ ṙ pϕ = ∂L = m r 2 ϕ̇ + qAϕ , ∂ ϕ̇ pz = ∂L = m ż + qAz . ∂ ż 4. On obtient H(pr , pϕ , pz , r, ϕ, z) = (m ṙ+q Ar )ṙ+(m r 2 ϕ̇+q Aϕ ) ϕ̇+(m ż+q Az )ż−L = = 1 1 1 (pr − q Ar )2 + (pϕ − q Aϕ )2 + (pz − q Az )2 . 2 2m 2mr 2m 5. Dans ces conditions le hamiltonien ne dépend pas de ϕ ni de z . On déduit des équations de mouvement de Hamilton que pϕ et pz se conservent. 6. Le hamiltonien se simplifie pour Ar = 0 , Az = 0 : H(pr , pϕ , pz , r, ϕ, z) = p2r 1 1 2 2 + (p − q A ) + p . ϕ ϕ 2m 2mr 2 2m z Pour pϕ = 0 , pz = 0 les équations du mouvement de Hamilton peuvent s’écrire ϕ̇ = − q Aϕ , mr 2 ṙ = pr , m ṗr = − ∂ (q Aϕ )2 . ∂r 2mr 2 7. Les deux dernières relations donnent r̈ = − ∂ (q Aϕ )2 . ∂r 2m2 r 2 Les conditions se résument donc à ∂ A2ϕ |r=r0 = 0 et pr (0) = 0 ∂r r 2 pour une trajectoire circulaire de rayon r0 . 8. On vérifie que 2 ∂ Aϕ | 2 ∂r r r=a = 0 , et on trouve ϕ̇(t) = −q ν t . ma 157 Solution des exercices 9. D’après (4.8) on a H = H = r q ~ 2 ce qui se traduit en m2 c4 + c2 (~p − q A) m2 c4 + c2 [p2r + 1 (pϕ − qAϕ )2 + p2z ] r2 en coordonnées cylindriques. Le hamiltonien relativiste ne dépend ni de ϕ ni de z , pϕ et pz sont donc toujours conservées. Les équations de Hamilton prennent la forme ϕ̇ = c2 1 (pϕ − qAϕ ) , H r2 ṙ = c2 pr , H ṗr = − c2 ∂ 1 ( 2 (pϕ − qAϕ )2 ) . H ∂r r 10. On obtient H(t) = On a 11. On a p m2 c4 + c2 [p2r + q 2 {µ2 (r − a)2 + ν 2 t2 }] . dH0 ∂H0 ∂H(t) ∂H0 ∂H(t) = {H0 , H(t)} = − dt ∂r ∂pr ∂pr ∂r 4 c q 2 µ2 (r − a) pr − pr q 2 µ2 (r − a) = 0 . = H0 H c2 q 1 (− ϕ̇ = √ H0 + b2 t2 p µ2 (r − a)2 + ν 2 t2 ), r ṙ = √ c2 p r , H0 + b2 t2 q 2 µ2 c2 (r − a) ṗr = − √ . H0 + b2 t2 On en déduit dans l’approximation indiquée dϕ νt = −q , ds a dr = pr , ds dpr = − q 2 µ2 (r − a) . ds La solution pour r(s) donne un mouvement harmonique autour de a : r(s) = a + δr sin ωs , ω = qµ , |δr| ≪ a (par hypothèse) . C’est un mouvement oscillatoire autour de la trajectoire circulaire. Pour obtenir de petites osillations il faut injecter les particules avec pr ≃ 0 , donc en direction tangentielle. 158 Solution des exercices 12. On trouve c2 s(t) = √ H0 Z t 0 et donc dt′ q 1+ b2 ′2 t H0 = b c arsh( √ t) qν H0 √ H0 qν sinh( s) . b c En négligeant les petites oscillations la vitesse s’écrit t(s) = v(t) = a dϕ = a dt dϕ ds dt ds . Ceci donne une vitesse inférieure à c : v(t) = −c tanh( t qν s) = −c q c t2 + H0 b2 . Le premier bétatron a été construit en 1940 à l’université d’Illinois par D.W. Kerst. L’énergie des électrons a rapidement dépassé les 10 MeV. Il a d’abord été un outil de la recherche fondamentale. Plus tard et jusqu’à présent les bétratrons ont servi de source d’électrons et de rayons X pour le traitement des cancers. 4.10 Les points de Lagrange 1. Il s’agit d’un mouvement keplérien. L’invariance par rotations limite le mouvement au plan perpendiculaire au moment cinétique conservé. 2. En égalisant les deux forces on obtient M1 ω 2r1 = GMR12M2 , M2 ω 2 r2 = GM1 M2 2 1 . On a aussi r1 + r2 = R , et r1 = M R , r2 = M R par définition R2 M M GM 2 du centre de masse. D’où ω = R3 . 3. En vue de l’égalité des masses gravitationnelle et inertielle, la masse de l’astéroïde apparaît comme facteur multiplicatif des deux côtés de l’équation du mouvement et ne joue donc aucun rôle. Remarque : ceci n’est vrai que dans l’approximation considérée où l’on néglige l’influence de l’astéroïde sur les deux astres de façon que les positions des deux astres sont données indépendamment de l’astéroïde. 159 Solution des exercices 4. La force exercée par les astres est somme de deux vecteurs dirigés de la position de l’astéroïde vers l’un ou l’autre des astres. Le vecteur force est donc dans le plan du mouvement. Par conséquent la dérivée temporelle du vecteur impulsion est dans ce plan, et le vecteur impulsion reste alors dans ce plan. Ensuite le même argument s’applique au vecteur position. 5. Il s’agit de décrire le mouvement non-relativiste d’une particule dans un potentiel gravitationnel qui s’obtient en fonction des positions des deux autres particules. Le lagrangien/le hamiltonien s’obtiennent donc de la façon usuelle comme différence/somme des énergies cinétique et potentielle. On obtient donc L̃ = GmM2 GmM1 GmM2 GmM1 p~˜ 2 m ˜2 + , H̃ = − − . ~v + ˜ ˜ ˜ ˜ ˜ ˜ ˜ 2 2m |~r − ~r1 (t)| |~r − ~r˜2 (t)| |~r − ~r1 (t)| |~r − ~r2 (t)| Ici ~v˜ = (ṽx , ṽy ) , ~p˜ = (p̃x , p̃y ) = m~v˜ , ~r˜ = (x̃, ỹ) ~r˜1 = (x̃1 , ỹ1 ) , ~r˜2 = (x̃2 , ỹ2 ) . L̃ et H̃ ne décrivent que la dynamique de l’astéroïde. Celle-ci dépend des positions des astres ~r˜1 (t) et ~r˜2 (t) , L̃ et H̃ dépendent donc explicitement du temps. 6. En effet le lagrangien dans le repère tournant reste le même - par universalité du principe de moindre action ; cependant il faut remplacer la variable ~v˜ par ~v + ~ω ×~r . En trouve alors pour le moment conjugué dans le repère tournant p~ = m(~v + ~ω × ~r). En exprimant H qui s’obtient du lagrangien par transformation de Legendre, on trouve (4.104). On peut résumer le résultat par le fait que le hamiltonien dans le repère tournant s’obtient de celui dans le référentiel inertiel par la transformation ~ , H = H̃ − ~ω · L ~ est le moment cinétique du point matériel (de l’astéroïde). où L 7. Dans le référentiel tournant le hamiltonien H ne dépend plus explicitement du temps, vu que ~r1 et ~r2 sont constants par choix du référentiel. Par conséquent H est conservé. Cette loi de conservation restreint l’espace des phases accessible à une variété tri-dimensionnelle. Ceci autorise toujours des comportements chaotiques qui ne sont a priori exclus qu’en deux dimensions (d’après le théorème de Poincaré-Bendixson). 160 Solution des exercices 8. On obtient de (4.104) ẋ = px + ωy , m ṗx = ω py − (x − x1 ) ẏ = py − ωx , m GmM2 GmM1 − (x − x ) , 2 |~r − ~r1 |3 |~r − ~r2 |3 ṗy = −ω px − (y − y1 ) GmM1 GmM2 − (y − y2 ) . 3 |~r − ~r1 | |~r − ~r2 |3 9. Le système d’équations précédent donne : ẋ = 0 ⇒ px = −mωy , ṗx = 0 ⇒ py = ẏ = 0 ⇒ py = mωx , GmM1 x − x1 GmM2 x − x2 + , 3 ω |~r − ~r1 | ω |~r − ~r2 |3 ṗy = 0 ⇒ px = − GmM2 y − y2 GmM1 y − y1 − . 3 ω |~r − ~r1 | ω |~r − ~r2 |3 (113) (114) Si les trois objets se trouvent sur une droite, et avec notre choix de l’axe des x , on trouve comme solution y = 0 ⇒ px = 0 , et py = mωx implique x = = GM2 x − x2 GM1 x − x1 + 2 3 ω |~r − ~r1 | ω 2 |~r − ~r2 |3 R3 M1 x − x1 R3 M2 x − x2 + , M |x − x1 |3 M |x − x2 |3 (115) où nous avons reporté la valeur de ω . Graphiquement on voit facilement que cette équation possède 3 solutions différentes, voir Fig. 8. Pour chacune de ces solutions, l’astéroïde suit le mouvement circulaire des deux astres, tout en restant sur la droite les reliant et à distance constante de chacun d’eux. 10. Pour y 6= 0 nous avons à satisfaire l’équation (115) et l’équation analogue provenant de (114) y = R3 M1 y R3 M2 y + . 3 M |~r − ~r1 | M |~r − ~r2 |3 (116) 161 Solution des exercices f(x) x1 x2 x Figure 8 – Les 3 points de Lagrange linéaires s’obtiennent par intersection de la courbe donnée par le côté droit de (115) avec la diagonale f (x) = x . En reportant (116) dans (115) on obtient après simplification 0 = M2 x2 R3 M1 x1 + . M |~r − ~r1 |3 |~r − ~r2 |3 (117) Vu que M1 x1 + M2 x2 = 0 (définition du c.d.m.) ceci implique 1 1 = ⇒ |~r − ~r1 |2 = |~r − ~r2 |2 . 3 |~r − ~r1 | |~r − ~r2 |3 (118) R . 2 (119) On a |~r − ~ri |2 = (x − xi )2 + y 2 , et on en tire donc x − x1 = ±(x − x2 ) ⇒ x = x1 + x2 , 2 |x − xi | = La relation (116) donne alors 2 2 (x − xi ) + y = R 2 ⇒ y=± √ 3 R 2 (120) d’où |~r − ~r1 | = |~r − ~r2 | = |~r1 − ~r2 | , (121) ce qui prouve que les deux configurations (119), (120) des trois corps correspondent bien à un triangle équilatéral. 162 Solution des exercices 11. Une fois la matrice M diagonalisée, on obtient des solutions du système d’équations du type fi (t) = eλi t fi (0) , où les fi (t) sont des combinaisons linéaires des quantités δx(t), δy(t), δpx (t) , δpy (t) . Pour rester proche des valeurs d’équilibre il faut donc que la partie réelle de λi satisfasse à la condition Reλi ≤ 0 . pour toutes les valeurs propres λi . 12. a) s’explique par l’instabilité de L1 à L3 . b) est une conséquence de la stabilité de L4 , L5 . c) un satellite positionné sur un point de Lagrange demande moins d’approvisionnement en énergie que si il se trouve sur un endroit où il n’y a pas de compensation des forces. L’instablilité est moins gênante pour un satellite, vu qu’il est possible de corriger sa position à partir de la Terre. Le point L2 est beaucoup plus proche que L3 . Par rapport à L1 il a l’avantage d’être écranté du Soleil par la Terre. d) Application numérique : L’équation (115) réécrite en unités de R donne pour le système Terre-Soleil x = (1 − ε) x+ε x−1+ε +ε , 3 |x + ε| |x − 1 + ε|3 ε = 0, 33 · 10−5 . (122) On voit que x ≃ −1 est solution à des corrections d’ordre ε près. La distance de L3 à la Terre est donc de l’ordre de 3·108km . Pour x proche de x2 = 1 − ε on pose x = 1 − ε + δ . On obtient alors pour δ 1 − ε + δ = (1 − ε) 1 ε 1+δ 2 ± ε = 1 − ε − 2δ + O(δ , εδ) ± (123) |1 + δ|3 δ2 δ2 en fonction du signe de δ , et donc δ ≃ ±(ε/3)1/3 , ce qui donne une distance de l’ordre de 1, 5 · 106 km , c.a.d. 1% de la distance Terre-Soleil. Bibliographie [1] Jean-Louis Basdevant, Le principe de moindre action et les principes variationnels en physique, Editions Vuibert (2010). [2] David Langlois, Introduction à la Relativité, Ecole polytechnique (2009). [3] André Rougé, Introduction à la Relativité, Editions de l’Ecole polytechnique (2004). [4] Arthur Koestler, The Act of Creation, Hutchinson & Co. (1964). [5] R.P. Feynman, R.B. Leighton et M. Sands, The Feynman Lectures on Physics, Addison-Wesley (1964). [6] Wolfgang Yourgrau et Stanley Mandelstam, Variational Principles in Dynamics and Quantum Theory, Dover Publications (1979). [7] Jean-Pierre Bourguignon, Calcul Variationnel, Editions de l’Ecole Polytechnique (2007). [8] Erwin Schrödinger, Statistical thermodynamics, Dover Publications (1989). [9] L. Landau et E. Lifshitz, Mécanique, Editions Mir (1970). [10] Herbert Goldstein, Charles Poole et John Safko, Classical Mechanics, Addison Wesley, Boston (2002). [11] Claude Gignoux et Bernard Silvestre-Brac, Mécanique De la formulation lagrangienne au chaos hamiltonien, EDP Sciences, Grenoble (2002). [12] Ian Percival et Derek Richards, Introduction to Dynamics, Cambridge University Press, (1982). 163 164 Bibliographie [13] K. Alligood, T. Sauer et J. Yorke CHAOS - An introduction to dynamical systems, Springer Verlag, Heidelberg (1996). [14] Max Born et Emil Wolf, Principles of Optics, Pergamon Press, Oxford (1964). [15] Albert Messiah, Mécanique quantique, nouvelle édition, Dunod, Paris (1995). [16] Pierre Fayet, Introduction à la théorie relativiste des champs, Ecole Polytechnique (2011). Index action, 15, 40, 42, 113 action réduite, 116 approximation BKW, 123 approximation eikonale, 121 approximation semi-classique, 123 attracteur, 110-112 théorème de, 106 eikonal, 121 équation de, 121 Einstein, A., 25, 41 énergie, 53, 97 énergie-impulsion, 75-80 équation des champs, 86-88 brachistochrone, 65 équations canoniques, 95-96 bulle de savon, 63 équations d’Euler-Lagrange, 47, 48, 78, Buridan, Jean de, 17 84-85 généralisées, 84-85 calcul variationnel, 45-50 équations de Maxwell, 78, 79, 87 caténoïde, 64 champ électromagnétique, 76-81, 85- espace courbe, 41 espace des phases, 98-107 88 Euler, L., 30, 40 champ scalaire, 85 chaos, 107-112 Fermat, P. de, 14, 31-34 commutateur, 106 Fermat, constante du mouvement, 99 principe de, 14, 31-34 corde pesante, 58 flot, 94, 105, 107 corde vibrante, 82 flot hamiltonien, 105, 107 crochets de Poisson, 98-105 force de Lorentz, 71 cyclique, formalisme canonique, 95-97 variable, 52, 103-104 densité de lagrangien, 83 Descartes, R., 14, 31, 32 Descartes-Snell, loi de, 32, 34 Dirac, P.A.M., 24, 94, 106 Ehrenfest Galilée, G., 29 Galilée, transformation de, 48 gamme pythagoricienne, 8-9 Héron d’Alexandrie, 16 Hamilton, W.R., 20, 42, 93, 95, 122 165 166 Hamilton-Jacobi, équation de, 113, 115-120 hamiltonien, 96 Heisenberg, W. 106-107 Huygens, principe de, 24, 122 identité de Jacobi, 98 impetus, 17-18 impulsion généralisée, 51-52 intégrale première, 51, 53, 95 interaction minimale, 77 invariance de jauge, 80, 88 invariance de Lorentz, 74, 75, 77 invariant de Lorentz, 74, 75, 77 INDEX Maupertuis, principe de, 15, 30, 34, 40-41, 50, 117 Maxwell, équations de, 78, 79, 87 mirage, 36-40 inférieur, 36 supérieur, 37 modèles économiques, 22 moment cinétique, 54-55 et rotations, 54-55 moment conjugué, 51-52 multiplicateurs de Lagrange, 56-57 Newton, I., 22, 30 Jacobi, identité de, 98 théorème de, 119 optimisation sous contraintes, 16, 29 optique géométrique et optique ondulatoire, 120-122 Klein, Felix, 20, 122 paradoxe des jumeaux, 74 particule relativiste, 74-81 Philopon, Jean, 17 Poincaré, H., 23, 94 Poincaré, théorème de Poincaré-Bendixson, 111 Poisson, S. D., 94 Poisson, crochets de, 98-104 loi de, 62 théorème de, 99 principe de moindre action, 15, 20, 30, 42, 46 de moindre temps, 14, 21, 31-34 du meilleur, 15 variationnel, 15-18 d’économie naturelle, 29, 33 Lagrange, fonction de, 42 Lagrange, J.-L., 20, 30, 42, 46 lagrangien, 42, 48-51 densité de, 83 Laplace, P. S. de, 93 Legendre, transformation de, 96 Leibniz, G. W., 14 Liouville théorème de,104-105 loi de conservation, 51-55 loi de Snell-Descartes, 31, 34 Lorenz, attracteur de, 109-112 Maupertuis, P. L. de, 15, 30, 40 INDEX de Fermat, 14, 31-34, 122 de Maupertuis, 15, 30, 34, 40-41, 50, 117 quadri-vecteur, énergie-impulsion, 7580 quadri-vitesse, 80 réfraction, 32-34 rayons courbes, 35-36, 57-58 relations de commutation canoniques, 106 relativité générale, 25, 41 sauvetage en mer, 35 Schrödinger équation de, 123 symétrie dynamique, 55, 103 systèmes conservatifs, 41 systèmes dynamiques, 107-112 temps propre, 74 théorème d’Ehrenfest, 106 théorème de Liouville, 104-105 théorème de Poincaré-Bendixson, 111 théorème de Poisson, 99 théorie des champs, 81-88 Titius Bode, loi de, 12-13 transformation canonique, 100-104, 124 transformation ponctuelle, 100 transformations de jauge, 80 translation dans le temps, 53 translations dans l’espace, 53-54 variable cyclique, 52, 103-104 variables d’état, 42 variables angle-action, 102-103 variables canoniquement conjuguées, 102-103 167