1 Introduction et principe de moindre action
Les lois de la mécanique classique, telles qu’établies par Galilée d’abord, puis par Newton,
représentent la première situation où les mathématiques ont permis une description de la réalité
objective, permettant en outre de faire des prévisions vérifiables.
Ces avancées majeures ont révolutionné la science et la philosophie à partir de la fin du 17ème
siècle. Cependant, certains penseurs se sont demandés s’il n’existait pas une formulation plus élé-
gante (et plus "française"...) de la mécanique newtonienne, à partir de considérations générales
exprimables en langage humain, plus que par des équations différentielles. Maupertuis a ainsi
établi au début du 18ème siècle le principe qui porte son nom, ou "principe de moindre action".
Ce principe a été mathématisé par Euler, Lagrange, puis Hamilton, et est tout à fait équivalent
aux différentes lois de Newton. Nous verrons dans ce cours que dans certains cas, il permet de
résoudre assez facilement des problèmes qui seraient très compliqués à traiter par la mécanique
newtonienne, un peu comme par le théorème de l’énergie mécanique ou le théorème du moment ci-
nétique. Il permet également de traiter rigoureusement les problèmes mécaniques avec contraintes
(objet contraint à rester sur une surface, par exemple), faisant apparaître naturellement les forces
de réaction du suport , par exemple.
Cependant, l’intérêt majeur de ces équations a été découvert en 1920 par Louis de Broglie, qui
a réussi à profiter de l’analogie entre le principe de moindre action en mécanique et le principe
de Fermat en optique pour formuler la mécanique ondulatoire, unifiant l’aspect corpusculaire et
l’aspect ondulatoire de la lumière, et faisant apparaître la notion d’ondes de matière. Ces concepts,
raffinés par Schrödinger et Dirac en particulier, ont donné naissance à la mécanique quantique
moderne, qui a révolutionné la société du XXème siècle par des avancées telles que le transistor
ou l’énergie nucléaire.
Nous verrons également dans ce cours que la physique quantique "traditionnelle" (atome de
Bohr) peut également s’exprimer par la mécanique analytique, et que l’arrivée de la simulation
numérique sur ordinateur dans les années 1960 a généré de nombreuses avancées dans la théorie
des systèmes chaotiques, qui présentent un grand intérêt fondamental pour comprendre des sys-
tèmes complexes au delà des approximations linéarisées ou à plus de deux corps en interaction
(météorologie, systèmes planétaires, galaxies, systèmes biologiques, atomes ou molécules au delà
de l’hélium, puits quantiques, etc).
1.1 Principe de moindre action
Maupertuis a introduit lors de la première moitié du 18ème siècle le principe de moindre
action, proche du principe de Fermat en optique. Ce dernier généralise les lois de la réfraction de
Snell-Descartes en stipulant que le chemin optique suivi par un rayon lumineux est minimal ; dans
le cas de la réfraction par un dioptre plan entre deux milieux isotropes où la lumière se propage
en ligne droite, il est bien plus fastidieux à appliquer que les lois des sinus, mais dans un cas plus
complexe comme celui d’un milieu à indice optique continûment variable (exemple des mirages
dans le désert) il donne beaucoup plus facilement le parcours courbé des rayons lumineux.
De la même façon, le principe de moindre action en mécanique stipule que la trajectoire effec-
tivement suivie par un système mécanique entre deux instants t1et t2correspond à un extremum
de l’action, notée S, cette quantité n’étant pas vraiment définie par Maupertuis au delà des consi-
dérations philosophiques.
On parle ici d’un extremum, car il peut y en avoir plusieurs (on pense au cas d’une parti-
cule rejoignant le pôle Nord au pôle Sud d’une sphère, tous les trajets suivant un méridien sont
équivalents), et on peut même imaginer que la trajectoire corresponde à une action maximale au
lieu d’être minimale. Ce type de situation est d’ores et déjà très difficile à traiter en mécanique
newtonienne.
3
1.2 Coordonnées généralisées
Pour faire le lien avec cette dernière, il faut commencer par mieux définir le système étudié.
Avant de passer à un système continu (comme par exemple un solide déformable ou un fluide sans
considération atomistique), nous allons nous restreindre à un système de Npoints matériels en in-
teraction, avec Nfini. Ces Npoints peuvent être repérés dans un système de coordonnées cartésien
par leurs abscisses, ordonnées et cotes (xi,yi,zi)constituant un vecteur position~xi(t), mais ces der-
nières coordonnées ne sont, comme la plupart des exercices le montrent, utiles que pour effectuer
des démonstrations ou des calculs généraux. La plupart des problèmes présentent (du moins, pour
pouvoir être résolus autrement que par le calcul sur ordinateur) un certain nombre de symétries
et d’invariances telles que la symétrie de translation ou de révolution, qui encouragent à suppri-
mer certaines des coordonnées du problème, ou à passer en coordonnées sphériques, cylindriques,
polaires, elliptiques ou hyperboliques.
Traditionnellement on note donc qiles coordonnées généralisées du système, qui peuvent être
un mélange de coordonnées cartésiennes ou angulaires, suivant le problème considéré, éventuel-
lement en nombre inférieur à 3N. Nous verrons plus tard qu’il est même possible de générer ma-
thématiquement les coordonnées les plus adaptées à un problème donné à condition qu’il présente
certaines invariances (variables angle-action et méthode de Hamilton-Jacobi).
Ces coordonnées dépendent évidemment du temps sous la forme qi(t).
1.3 Action
Le principe de moindre action sur une trajectoire donnée s’écrit mathématiquement sous la
forme
δS=0
avec Sl’action entre t1et t2, en supposant que cette quantité est différentiable en fonction des
qi(t)sur la trajectoire effectivement suivie. Nous n’avons cependant pas encore défini cette action;
remarquons en tout cas qu’il apparaît une forme dite fonctionnelle, car l’action Sest manifestement
une fonction d’autres fonctions, à savoir une fonction non pas d’une variable, mais de l’ensemble
des qi(t)sur la trajectoire effectivement suivie par le système mécanique entre t1et t2.
Le plus simple est donc d’introduire une intégrale sur la trajectoire, car l’intégrale, moyen-
nant certaines propriétés de régularité mathématiques, constitue une forme linéaire, ou une fonc-
tionnelle linéaire simple, qui présente les propriétés requises, à savoir associer un nombre réel à
l’ensemble du comportement d’une fonction Lsur un intervalle donné. Cette fonction, construite
à partir des coordonnées généralisées, est appellée Lagrangien. Ainsi, l’action est définie mathé-
matiquement par
S=Zt2
t1Ldt
1.4 Lagrangien et rappel de mécanique classique
Le Lagrangien a été nommé en hommage à Lagrange, qui, à la fin du 18ème siècle, a contri-
bué à mathématiser le principe de moindre action de Maupertuis; reste évidemment la question
de l’expression de ce Lagrangien à partir des coordonnées généralisées. Rappelons-nous que la
mécanique de Newton prétend, dans un référentiel galiléen, reconstituer l’intégralité de l’histoire
d’un système mécanique et prédire son futur à partir d’un système d’équations différentielles du
second ordre reliant les accélérations~aides particules aux forces ~
Fiqui s’exercent sur celles-ci, le
tout exprimé à l’instant t
4
mi~ai(t) = ~
Fi(t)
avec
~ai=d~vi
dt
et
~vi=d~xi
dt
La force totale s’exerçant sur une particule étant elle-même fonction des coordonnées des
autres particules
~
Fi(t) = ~
F(~x1,..., ~xN)
Si le système est isolé, (si, par exemple, nous considérons l’univers entier) il n’existe pas en
effet de force supplémentaire dépendant par exemple du temps et de la position s’exerçant sur
la particule considérée, en dehors des forces d’interaction avec les autres particules du système
(force de gravitation, typiquement, ou force électromagnétique, qui se traitent bien dans le cadre
de la mécanique classique).
Si l’on peut séparer le système en deux parties très inégales, comme par exemple on le fait
en thermodynamique en faisant apparaître un thermostat, on peut considérer quelques particules
très mobiles d’un petit système, subissant l’action d’un système de taille beaucoup plus impor-
tante mais dont l’action réciproque est négligeable (par exemple, un humain à la surface de la
terre subit le champ gravitationnel de celle-ci mais n’en influence que peu le mouvement). Cette
action peut être résumée sous la forme d’une force dérivant éventuellement d’un potentiel V(~r,t)
comme le potentiel gravitationnel ou électrostatique, et les interactions interparticulaires elles-
mêmes peuvent éventuellement aussi s’écrire soit sous la forme d’une somme de forces dites "à
deux corps", soit sous la forme d’une interaction avec un potentiel. Ainsi l’on écrit
~
Fi(t) =
j
~
Fij
ou
~
Fi(t) = ~
gradV(~xi(t),t)
en cachant dans le potentiel Vla charge ou la masse de la particule i. Il peut également arriver
que ce potentiel dépende des vitesses, nous y reviendrons.
Finalement, en résolvant le système d’équations différentielles obtenu, à condition d’avoir
spécifié système étudié, forces en présence, référentiel, et conditions initiales, il est possible de
reconstituer l’histoire et de prévoir le futur du système; citons comme applications la balistique
ou la navigation interstellaire, qui permettent aujourd’hui, par un inventaire détaillé des forces en
présence, d’obtenir une précision meilleure que le millionième.
Remarquons cependant que le système différentiel obtenu est du second ordre, ce qui ne sim-
plifie pas sa résolution, et que les conditions initiales demandent la connaissance aussi bien des
coordonnées que des vitesses initiales.
Le Lagrangien que nous avons introduit plus haut va donc dépendre, lui aussi, des coordonnées
généralisées comme de leurs dérivées temporelles.
L=L(qi,˙qi,t)
avec
5
˙qi=dqi(t)
dt
Pour trouver la forme du Lagrangien, nous allons procéder comme dans l’ouvrage de Landau et
Lifchitz ("Mécanique", tome 1) et, comme de façon générale en physique, simplifier le système au
maximum possible, en imaginant un univers constitué d’une seule particule (N=1). Le premier
principe de Newton (principe d’inertie) nous dit donc qu’en l’absence de forces (puisqu’il n’y
a pas d’autres particules pouvant les exercer, et que de façon générale en physique on suppose
l’absence d’auto-interaction) la particule va avoir un mouvement rectiligne et uniforme, que l’on
peut donc ramener à une seule coordonnée généralisée xqui sera l’abscisse de la particule sur la
droite parcourue. Alors
L=L(x,˙x)
car le système est manifestement invariant par translation dans le temps en l’absence d’un
"macro-système" pouvant exercer une action à distance sur lui.
Le principe de moindre action reste cependant à exprimer dans ce cadre.
On a donc l’extrémalité de
S=Zt2
t1Ldt
avec L=L(x,˙x)
soit
δS=0
autour de la trajectoire réellement suivie par le système.
Le calcul des variations d’une fonction est similaire au calcul de l’influence d’une perturbation
de la valeur d’une variable autour d’un point donné.
1.5 Dérivée fonctionnelle
Rappelons-nous la définition mathématique de la dérivée d’une fonction f(x)(si elle existe au
point x)
f(x) = d f
dx =lim
h0
f(x+h)f(x)
h
avec la notation de Newton (f(x)) et la notation de Leibniz ou des physiciens d f
dx , à rapprocher
de la définition de la différentielle de la fonction fen xcomme nouvelle fonction d f, forme linéaire
d’une nouvelle variable dx :
d f(x) = f(x)dx =d f
dx dx
avec les deux notations. On voit qu’en fait la définition "mathématique" de la dérivée ou de
la différentielle, avec ses deux notations usuelles, (sans oublier le point pour les dérivées tempo-
relles...), coïncide avec la notion physique de variation linéaire d’une fonction autour d’un point
donné x, à condition, au premier ordre, de l’assimiler à sa tangente en ce point.
Rappelons en effet que moyennant les bonnes propriétés mathématiques de f(dérivabilité
suffisante, continuité) on peut écrire au point x
f(x+h) = f(x) + hf(x) + h2
2f′′(x) + ...+hn
n!f(n)(x) + o(hn+1)
6
avec le dernier terme de l’ordre de hn+1. Au premier ordre on retrouve donc les formules
précédentes.
Dans le cas d’une fonction f(x,y,...)de plusieurs variables, on ne peut pas définir de dérivée,
mais on peut encore définir une différentielle d f à partir des dérivées partielles de la fonction
autour du point considéré et de petits accroissements dans chaque direction. Ainsi la différentielle
(ou variation au premier ordre) de la fonction autour du point considéré (x,y,...)vaut
d f(x,y,...) = f
xdx+f
ydy+...
De la même façon que les physiciens et mathématiciens s’accordent ainsi à peu près sur la dé-
finition d’une dérivée ou d’une différentielle, on peut donc définir la dérivée fonctionnelle comme
variation d’une grandeur I(typiquement une intégrale ou forme linéaire comme nous en avons déjà
parlé au sujet de l’action ) dépendant d’une fonction fpar une dépendance fonctionnelle notée par
des crochets sous la forme I[f].
Par exemple
I[f] = Zb
af(x)dx
Remarquons que cette forme qui fait correspondre un nombre réel à une fonction est bien
linéaire (I[f+g] = I[f]+I[g]pour deux fonctions fet g) mais qu’elle dépend de façon non-locale
de f, dans le sens que toute fluctuation de fsur l’intervalle [a,b]va affecter la valeur de I. Ce
point est très important car il permettra de décrire des effets de mémoire temporels très subtils en
physique statistique ou en mécanique quantique.
À partir de là, si la fonction fchange d’une "petite" fonction δf(c’est à dire qu’on la perturbe
par une autre fonction δf(x), notée ainsi pour ne pas confondre avec l’accroissement différentiel
ou variation de xnoté précédemment dx) la quantité I[f]va fluctuer de δIde même que sous l’effet
de dx la fonction fchange de d f.
Par analogie on définit donc la différentielle de I[f]puis sa dérivée fonctionnelle notée avec
des δpar
I[f+δf]I[f] = δI
δfδf
à condition que cette écriture soit possible, c’est à dire que la variation de Isoit linéaire en δf
en première approximation (l’erreur étant en |δf|2, la norme étant désormais une norme fonction-
nelle). Nous verrons des exemples correspondants en travaux dirigés, comme la longueur d’une
courbe.
1.6 Équations de Euler-Lagrange pour une particule libre
Si nous revenons à l’action et au Lagrangien, la forme fonctionnelle est un peu plus compliquée
que l’exemple précédent d’une intégrale, mais n’en reste pas moins linéaire.
Dans ce cas, le calcul des variations donne à partir de
S[L] = Zt2
t1L(x,˙x)dt
qui est manifestement linéaire sous l’effet d’une perturbation δL, perturbation pouvant prove-
nir soit d’une perturbation δxdes trajectoires, soit d’une perturbation δ˙xde l’histoire des vitesses
de la particule sur la trajectoire
S[L+δL]S[L] = Zt2
t1
[L(x+δx,˙x+δ˙x)L(x,˙x)]dt
7
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !