1 Introduction et principe de moindre action

publicité
1 Introduction et principe de moindre action
Les lois de la mécanique classique, telles qu’établies par Galilée d’abord, puis par Newton,
représentent la première situation où les mathématiques ont permis une description de la réalité
objective, permettant en outre de faire des prévisions vérifiables.
Ces avancées majeures ont révolutionné la science et la philosophie à partir de la fin du 17ème
siècle. Cependant, certains penseurs se sont demandés s’il n’existait pas une formulation plus élégante (et plus "française"...) de la mécanique newtonienne, à partir de considérations générales
exprimables en langage humain, plus que par des équations différentielles. Maupertuis a ainsi
établi au début du 18ème siècle le principe qui porte son nom, ou "principe de moindre action".
Ce principe a été mathématisé par Euler, Lagrange, puis Hamilton, et est tout à fait équivalent
aux différentes lois de Newton. Nous verrons dans ce cours que dans certains cas, il permet de
résoudre assez facilement des problèmes qui seraient très compliqués à traiter par la mécanique
newtonienne, un peu comme par le théorème de l’énergie mécanique ou le théorème du moment cinétique. Il permet également de traiter rigoureusement les problèmes mécaniques avec contraintes
(objet contraint à rester sur une surface, par exemple), faisant apparaître naturellement les forces
de réaction du suport , par exemple.
Cependant, l’intérêt majeur de ces équations a été découvert en 1920 par Louis de Broglie, qui
a réussi à profiter de l’analogie entre le principe de moindre action en mécanique et le principe
de Fermat en optique pour formuler la mécanique ondulatoire, unifiant l’aspect corpusculaire et
l’aspect ondulatoire de la lumière, et faisant apparaître la notion d’ondes de matière. Ces concepts,
raffinés par Schrödinger et Dirac en particulier, ont donné naissance à la mécanique quantique
moderne, qui a révolutionné la société du XXème siècle par des avancées telles que le transistor
ou l’énergie nucléaire.
Nous verrons également dans ce cours que la physique quantique "traditionnelle" (atome de
Bohr) peut également s’exprimer par la mécanique analytique, et que l’arrivée de la simulation
numérique sur ordinateur dans les années 1960 a généré de nombreuses avancées dans la théorie
des systèmes chaotiques, qui présentent un grand intérêt fondamental pour comprendre des systèmes complexes au delà des approximations linéarisées ou à plus de deux corps en interaction
(météorologie, systèmes planétaires, galaxies, systèmes biologiques, atomes ou molécules au delà
de l’hélium, puits quantiques, etc).
1.1
Principe de moindre action
Maupertuis a introduit lors de la première moitié du 18ème siècle le principe de moindre
action, proche du principe de Fermat en optique. Ce dernier généralise les lois de la réfraction de
Snell-Descartes en stipulant que le chemin optique suivi par un rayon lumineux est minimal ; dans
le cas de la réfraction par un dioptre plan entre deux milieux isotropes où la lumière se propage
en ligne droite, il est bien plus fastidieux à appliquer que les lois des sinus, mais dans un cas plus
complexe comme celui d’un milieu à indice optique continûment variable (exemple des mirages
dans le désert) il donne beaucoup plus facilement le parcours courbé des rayons lumineux.
De la même façon, le principe de moindre action en mécanique stipule que la trajectoire effectivement suivie par un système mécanique entre deux instants t1 et t2 correspond à un extremum
de l’action, notée S, cette quantité n’étant pas vraiment définie par Maupertuis au delà des considérations philosophiques.
On parle ici d’un extremum, car il peut y en avoir plusieurs (on pense au cas d’une particule rejoignant le pôle Nord au pôle Sud d’une sphère, tous les trajets suivant un méridien sont
équivalents), et on peut même imaginer que la trajectoire corresponde à une action maximale au
lieu d’être minimale. Ce type de situation est d’ores et déjà très difficile à traiter en mécanique
newtonienne.
3
1.2
Coordonnées généralisées
Pour faire le lien avec cette dernière, il faut commencer par mieux définir le système étudié.
Avant de passer à un système continu (comme par exemple un solide déformable ou un fluide sans
considération atomistique), nous allons nous restreindre à un système de N points matériels en interaction, avec N fini. Ces N points peuvent être repérés dans un système de coordonnées cartésien
par leurs abscisses, ordonnées et cotes (xi , yi , zi ) constituant un vecteur position~xi (t), mais ces dernières coordonnées ne sont, comme la plupart des exercices le montrent, utiles que pour effectuer
des démonstrations ou des calculs généraux. La plupart des problèmes présentent (du moins, pour
pouvoir être résolus autrement que par le calcul sur ordinateur) un certain nombre de symétries
et d’invariances telles que la symétrie de translation ou de révolution, qui encouragent à supprimer certaines des coordonnées du problème, ou à passer en coordonnées sphériques, cylindriques,
polaires, elliptiques ou hyperboliques.
Traditionnellement on note donc qi les coordonnées généralisées du système, qui peuvent être
un mélange de coordonnées cartésiennes ou angulaires, suivant le problème considéré, éventuellement en nombre inférieur à 3N. Nous verrons plus tard qu’il est même possible de générer mathématiquement les coordonnées les plus adaptées à un problème donné à condition qu’il présente
certaines invariances (variables angle-action et méthode de Hamilton-Jacobi).
Ces coordonnées dépendent évidemment du temps sous la forme qi (t).
1.3
Action
Le principe de moindre action sur une trajectoire donnée s’écrit mathématiquement sous la
forme
δS = 0
avec S l’action entre t1 et t2 , en supposant que cette quantité est différentiable en fonction des
qi (t) sur la trajectoire effectivement suivie. Nous n’avons cependant pas encore défini cette action ;
remarquons en tout cas qu’il apparaît une forme dite fonctionnelle, car l’action S est manifestement
une fonction d’autres fonctions, à savoir une fonction non pas d’une variable, mais de l’ensemble
des qi (t) sur la trajectoire effectivement suivie par le système mécanique entre t1 et t2 .
Le plus simple est donc d’introduire une intégrale sur la trajectoire, car l’intégrale, moyennant certaines propriétés de régularité mathématiques, constitue une forme linéaire, ou une fonctionnelle linéaire simple, qui présente les propriétés requises, à savoir associer un nombre réel à
l’ensemble du comportement d’une fonction L sur un intervalle donné. Cette fonction, construite
à partir des coordonnées généralisées, est appellée Lagrangien. Ainsi, l’action est définie mathématiquement par
S=
Z t2
Ldt
t1
1.4
Lagrangien et rappel de mécanique classique
Le Lagrangien a été nommé en hommage à Lagrange, qui, à la fin du 18ème siècle, a contribué à mathématiser le principe de moindre action de Maupertuis ; reste évidemment la question
de l’expression de ce Lagrangien à partir des coordonnées généralisées. Rappelons-nous que la
mécanique de Newton prétend, dans un référentiel galiléen, reconstituer l’intégralité de l’histoire
d’un système mécanique et prédire son futur à partir d’un système d’équations différentielles du
second ordre reliant les accélérations ~ai des particules aux forces ~Fi qui s’exercent sur celles-ci, le
tout exprimé à l’instant t
4
mi~ai (t) = ~Fi (t)
avec
~ai =
d~vi
dt
et
d~xi
dt
La force totale s’exerçant sur une particule étant elle-même fonction des coordonnées des
autres particules
~vi =
~Fi (t) = ~F(~
x1 , . . . , x~N )
Si le système est isolé, (si, par exemple, nous considérons l’univers entier) il n’existe pas en
effet de force supplémentaire dépendant par exemple du temps et de la position s’exerçant sur
la particule considérée, en dehors des forces d’interaction avec les autres particules du système
(force de gravitation, typiquement, ou force électromagnétique, qui se traitent bien dans le cadre
de la mécanique classique).
Si l’on peut séparer le système en deux parties très inégales, comme par exemple on le fait
en thermodynamique en faisant apparaître un thermostat, on peut considérer quelques particules
très mobiles d’un petit système, subissant l’action d’un système de taille beaucoup plus importante mais dont l’action réciproque est négligeable (par exemple, un humain à la surface de la
terre subit le champ gravitationnel de celle-ci mais n’en influence que peu le mouvement). Cette
action peut être résumée sous la forme d’une force dérivant éventuellement d’un potentiel V (~r,t)
comme le potentiel gravitationnel ou électrostatique, et les interactions interparticulaires ellesmêmes peuvent éventuellement aussi s’écrire soit sous la forme d’une somme de forces dites "à
deux corps", soit sous la forme d’une interaction avec un potentiel. Ainsi l’on écrit
~Fi (t) = ∑ ~Fi j
j
ou
~
~Fi (t) = −gradV
(~xi (t),t)
en cachant dans le potentiel V la charge ou la masse de la particule i. Il peut également arriver
que ce potentiel dépende des vitesses, nous y reviendrons.
Finalement, en résolvant le système d’équations différentielles obtenu, à condition d’avoir
spécifié système étudié, forces en présence, référentiel, et conditions initiales, il est possible de
reconstituer l’histoire et de prévoir le futur du système ; citons comme applications la balistique
ou la navigation interstellaire, qui permettent aujourd’hui, par un inventaire détaillé des forces en
présence, d’obtenir une précision meilleure que le millionième.
Remarquons cependant que le système différentiel obtenu est du second ordre, ce qui ne simplifie pas sa résolution, et que les conditions initiales demandent la connaissance aussi bien des
coordonnées que des vitesses initiales.
Le Lagrangien que nous avons introduit plus haut va donc dépendre, lui aussi, des coordonnées
généralisées comme de leurs dérivées temporelles.
L = L(qi , q̇i ,t)
avec
5
dqi (t)
dt
Pour trouver la forme du Lagrangien, nous allons procéder comme dans l’ouvrage de Landau et
Lifchitz ("Mécanique", tome 1) et, comme de façon générale en physique, simplifier le système au
maximum possible, en imaginant un univers constitué d’une seule particule (N = 1). Le premier
principe de Newton (principe d’inertie) nous dit donc qu’en l’absence de forces (puisqu’il n’y
a pas d’autres particules pouvant les exercer, et que de façon générale en physique on suppose
l’absence d’auto-interaction) la particule va avoir un mouvement rectiligne et uniforme, que l’on
peut donc ramener à une seule coordonnée généralisée x qui sera l’abscisse de la particule sur la
droite parcourue. Alors
q̇i =
L = L(x, ẋ)
car le système est manifestement invariant par translation dans le temps en l’absence d’un
"macro-système" pouvant exercer une action à distance sur lui.
Le principe de moindre action reste cependant à exprimer dans ce cadre.
On a donc l’extrémalité de
Z t2
Ldt
S=
t1
avec
L = L(x, ẋ)
soit
δS = 0
autour de la trajectoire réellement suivie par le système.
Le calcul des variations d’une fonction est similaire au calcul de l’influence d’une perturbation
de la valeur d’une variable autour d’un point donné.
1.5
Dérivée fonctionnelle
Rappelons-nous la définition mathématique de la dérivée d’une fonction f (x) (si elle existe au
point x)
f ′ (x) =
df
f (x + h) − f (x)
= lim
dx h→0
h
avec la notation de Newton ( f ′ (x)) et la notation de Leibniz ou des physiciens ddxf , à rapprocher
de la définition de la différentielle de la fonction f en x comme nouvelle fonction d f , forme linéaire
d’une nouvelle variable dx :
df
dx
dx
avec les deux notations. On voit qu’en fait la définition "mathématique" de la dérivée ou de
la différentielle, avec ses deux notations usuelles, (sans oublier le point pour les dérivées temporelles...), coïncide avec la notion physique de variation linéaire d’une fonction autour d’un point
donné x, à condition, au premier ordre, de l’assimiler à sa tangente en ce point.
Rappelons en effet que moyennant les bonnes propriétés mathématiques de f (dérivabilité
suffisante, continuité) on peut écrire au point x
d f (x) = f ′ (x)dx =
f (x + h) = f (x) + h f ′ (x) +
h2 ′′
hn
f (x) + . . . + f (n) (x) + o(hn+1 )
2
n!
6
avec le dernier terme de l’ordre de hn+1 . Au premier ordre on retrouve donc les formules
précédentes.
Dans le cas d’une fonction f (x, y, . . .) de plusieurs variables, on ne peut pas définir de dérivée,
mais on peut encore définir une différentielle d f à partir des dérivées partielles de la fonction
autour du point considéré et de petits accroissements dans chaque direction. Ainsi la différentielle
(ou variation au premier ordre) de la fonction autour du point considéré (x, y, . . .) vaut
∂f
∂f
dx + dy + . . .
∂x
∂y
d f (x, y, . . .) =
De la même façon que les physiciens et mathématiciens s’accordent ainsi à peu près sur la définition d’une dérivée ou d’une différentielle, on peut donc définir la dérivée fonctionnelle comme
variation d’une grandeur I (typiquement une intégrale ou forme linéaire comme nous en avons déjà
parlé au sujet de l’action ) dépendant d’une fonction f par une dépendance fonctionnelle notée par
des crochets sous la forme I[ f ].
Par exemple
I[ f ] =
Z b
f (x)dx
a
Remarquons que cette forme qui fait correspondre un nombre réel à une fonction est bien
linéaire (I[ f + g] = I[ f ] + I[g] pour deux fonctions f et g) mais qu’elle dépend de façon non-locale
de f , dans le sens que toute fluctuation de f sur l’intervalle [a, b] va affecter la valeur de I. Ce
point est très important car il permettra de décrire des effets de mémoire temporels très subtils en
physique statistique ou en mécanique quantique.
À partir de là, si la fonction f change d’une "petite" fonction δ f (c’est à dire qu’on la perturbe
par une autre fonction δ f (x), notée ainsi pour ne pas confondre avec l’accroissement différentiel
ou variation de x noté précédemment dx) la quantité I[ f ] va fluctuer de δI de même que sous l’effet
de dx la fonction f change de d f .
Par analogie on définit donc la différentielle de I[ f ] puis sa dérivée fonctionnelle notée avec
des δ par
I[ f + δ f ] − I[ f ] =
δI
δf
δf
à condition que cette écriture soit possible, c’est à dire que la variation de I soit linéaire en δ f
en première approximation (l’erreur étant en |δ f |2 , la norme étant désormais une norme fonctionnelle). Nous verrons des exemples correspondants en travaux dirigés, comme la longueur d’une
courbe.
1.6
Équations de Euler-Lagrange pour une particule libre
Si nous revenons à l’action et au Lagrangien, la forme fonctionnelle est un peu plus compliquée
que l’exemple précédent d’une intégrale, mais n’en reste pas moins linéaire.
Dans ce cas, le calcul des variations donne à partir de
S[L] =
Z t2
L(x, ẋ)dt
t1
qui est manifestement linéaire sous l’effet d’une perturbation δL, perturbation pouvant provenir soit d’une perturbation δx des trajectoires, soit d’une perturbation δẋ de l’histoire des vitesses
de la particule sur la trajectoire
S[L + δL] − S[L] =
Z t2
t1
[L(x + δx, ẋ + δẋ) − L(x, ẋ)] dt
7
comme le Lagrangien, est, lui, une fonction "traditionnelle" des deux variables x et ẋ, on peut
écrire à partir de la définition d’une différentielle d’une fonction de plusieurs variables
L(x + δx, ẋ + δẋ) = L(x, ẋ) +
∂L
∂L
dx +
d ẋ
∂x
∂d ẋ
soit
S[L + δL] − S[L] =
Z t2 ∂L
t1
∂L
dx +
d ẋ dt
∂x
∂d ẋ
En intégrant par parties le deuxième terme il vient comme
d ẋ = d
∂L t2
d ẋ dt = dx
| −
∂d ẋ
∂d ẋ t1
Z t2 ∂L
t1
dx
dt
Z t2 d ∂L
t1
dt ∂d ẋ
dx dt
Le premier terme obtenu est du second ordre et donc négligeable dans la dérivée fonctionnelle,
et il reste donc la formule dite d’Euler-Lagrange
Z t2 ∂L d ∂L
δS =
dxdt
−
∂x dt ∂d ẋ
t1
Rappelons-nous que le principe de moindre action impose δS = 0 autour de la trajectoire
réellement suivie, pour laquelle, aux deux extrémités imposées, il faut que dx = 0, ce qui annule
le premier terme de l’intégration par parties (terme tout intégré pris en t1 et t2 ).
D’autre part, différents arguments mathématiques contribuent au fait que pour qu’une intégrale
du produit de deux fonctions (ici le premier terme, et la fonction dx, arbitraire) soit nulle entre deux
bornes fixées, il faut que le premier terme soit nul.
Par conséquent le principe de moindre action se traduit mathématiquement par
∂L d ∂L
−
=0
∂x dt ∂d ẋ
Si le Lagrangien ne dépend pas de x (particule libre) on obtient donc
d ∂L
=0
dt ∂d ẋ
Remarquons que si nous assimilons le Lagrangien à l’énergie cinétique de la particule, soit
1
L = mẋ2
2
on a bien en appliquant l’équation de Euler-Lagrange
mẍ = 0
ce qui correspond à la fois au premier et second principe de la mécanique newtonienne.
8
1.7
Équations de Lagrange : généralisation
Revenons à un système de N particules en interaction. Posons pour Lagrangien L = T − V
avec T (qi , q̇i ,t) énergie cinétique du système, (qi , q̇i ) représentant les N coordonnées généralisées
du système et V (qi , q̇i ,t) son énergie potentielle.
Les équations d’Euler-Lagrange s’écrivent sous la forme de N équations du second ordre
∂L
d ∂L
−
=0
dt ∂q̇i
∂qi
En coordonnées cartésiennes (qi = xi , yi , zi )
N
1
T = ∑ mi q̇2i
i=1 2
on en tire bien
∂V
d
(mi q̇i ) = −
dt
∂qi
et on retrouve bien les équations de Newton. Remarquons cependant que grâce aux équations
de Lagrange, il est possible de traiter des cas complexes où les degrés de liberté sont mélangés dans
l’énergie cinétique ou potentielle, comme dans les systèmes à plusieurs degrés de liberté exprimés
en coordonnées sphériques, par exemple, ou dans les cas où l’énergie cinétique ou potentielle
dépend des vitesses (cas relativiste, présence d’un champ magnétique, etc).
1.8
Définition du Hamiltonien
Le problème des équations de Lagrange, malgré leur élégance, réside dans le fait qu’elles sont
du second ordre.
On effectue donc une transformée de Legendre du Lagrangien (comme ce qui est fait par
exemple en thermodynamique pour passer de l’énergie totale U à l’énergie libre F) afin, en introduisant une nouvelle variable pi d’obtenir un système d’équations du premier ordre, donc plus
faciles à résoudre.
ainsi on pose le hamiltonien H
H = ∑ pi q̇i − L
i
avec
pi =
∂L
∂q̇i
on obtient
H = T +V
qui s’identifie dans les cas simples (sans dépendances explicites en temps) avec l’énergie mécanique du système.
1.9
Équations de Hamilton
Des équations de Euler-Lagrange on tire ainsi un système de 2N équations du premier ordre
ṗi = −
9
∂H
∂qi
q̇i =
∂H
∂pi
Encore une fois, dans le cas d’un système de coordonnées cartésiennes,
N
1 2
ṗi
i=1 2mi
T=∑
et les équations de Hamilton s’écrivent
ṗi = −
ẋi =
∂V
∂xi
∂T
pi
=
∂pi mi
On retrouve bien les équations de Newton usuelles en mélangeant les deux équations
mi ẍi = −
∂V
= Fi
∂xi
Remarquons que dans ce cas (le plus usuel, en l’absence de forçage externe) le Hamiltonien
s’identifie à l’énergie mécanique T +V et, finalement, les équations de Hamilton sont équivalentes
au théorème de conservation de l’énergie mécanique en présence de forces dérivant uniquement
d’un potentiel (donc en l’absence de forces de frottement, non conservatives).
Le grand avantage des équations de Hamilton est d’être du premier ordre, même si elles sont en
nombre deux fois plus élevé que les équations de Newton. Mathématiquement, ou numériquement
sur ordinateur, leur résolution est bien plus facile ; on peut même les faire apparaître simplement
comme version des équations de Newton en introduisant une variable intermédiaire pi . Cette dernière quantité, d’ailleurs, ne s’identifie à la quantité de mouvement de la mécanique newtonienne
que dans les cas les plus simples, nous en verrons un contre-exemple en travaux dirigés.
Par ailleurs, il n’est pas plus arbitraire d’étudier un problème de mécanique en posant un
Lagrangien ou un Hamiltonien qu’en effectuant un bilan des forces en présence. En particulier,
il est possible d’introduire des termes dépendant explicitement du temps dans le Hamiltonien, ou
toutes sortes de termes croisés.
10
Téléchargement