Espace tangent et extrema liés

publicité
Espace tangent et extrema liés
Dans tout ce qui suit, U désigne un ouvert de Rn . On se donne des fonctions
f1 , . . . , fd , g : U → R,
toutes de classe C 1 , et on pose
S = {x ∈ Rn /f1 (x) = . . . = fd (x) = 0}.
Le problème qu’on se pose est de localiser les extrema de la restriction de g à S. Il
faut bien comprendre d’emblée que comme S a très peu de chances d’être un ouvert, le
théorème usuel sur les points critiques ne fonctionne plus : dans la situation présente, les
variables de g|S sont liées par les relations
f1 (x) = . . . = fd (x) = 0.
Une première étape va consister à préciser la géométrie de S. Heuristiquement, S se présente sous la forme d’une intersection de d hypersurfaces ; on a donc dans l’idée que S
sera un objet (n − d)-dimensionnel, au sens où S ressemblera, au voisinage de chacun de
ses points, à un sous-espace vectoriel de Rn de dimension n − d. On va montrer que cela
est vrai sous des hypothèses raisonnables d’indépendance, et aboutir à la notion d’espace
tangent.
Une fois l’espace tangent en place, nous obtiendrons immédiatement une condition nécessaire pour que g|S admette un extremum en un point a de S, exprimant essentiellement
que la différentielle de g en a est nulle sur l’espace tangent à S en a. En reformulant
cette condition via la dualité, on obtiendra enfin le théorème des extrema liés, ce résultat
apparaissant alors sous son véritable visage : un théorème de géométrie.
1
L’espace tangent
Fixons un point a de S, et supposons que les différentielles des fi au point a (qui sont
des formes linéaires sur Rn ) soient linéairement indépendantes. Il revient au même de
supposer que les gradients des fi en a sont indépendants.
Définissons l’application
f : U → Rd , x 7→ (f1 (x), . . . , fd (x)).
1
Par hypothèse, les formes linéaires d(fi )(a), 1 ≤ i ≤ d, sont indépendantes ; de façon
équivalente, df (a) est surjective. Quitte à renommer les variables, cela revient aussi à
supposer que la matrice
[∂j fi (a)]1≤i,j≤d
est inversible. Toutefois, il sera plus commode d’exprimer cette condition en disant que
l’application « différentielle partielle 1 » :
d1 f (a) : Rd → Rd , h = (h1 , . . . , hd ) 7→ df (a)(h, 0) = df (a)(h1 , . . . , hd , 0, . . . , 0)
est un isomorphisme. Nous utiliserons aussi dans la suite l’autre différentielle partielle de
f en a, définie ainsi :
d2 f (a) : Rn−d → Rd , h = (hd+1 , . . . , hn ) 7→ df (a)(0, h) = df (a)(0, . . . , 0, hd+1 , . . . , hn ).
Notre hypothèse fondamentale d’indépendance se traduit alors de la façon suivante :
d1 f (a) ∈ GL(Rd ).
On définit alors l’espace (vectoriel 2 ) tangent à S en a, noté Ta S, comme l’ensemble des
vitesses en a des arcs de classe C 1 tracés sur S et passant par a. De façon précise, Ta S est
l’ensemble des vecteurs v ∈ Rn tels qu’il existe γ : [−δ, δ] → Rn de classe C 1 vérifiant :
γ(0) = a, γ 0 (0) = v et γ(t) ∈ S pour |t| ≤ δ.
Défini ainsi, il n’est pas du tout évident que Ta S soit un espace vectoriel. C’est l’objet
de notre théorème principal :
Théorème 1. Sous l’hypothèse d’indépendance linéaire des formes linéaires (dfi )(a), Ta S
est un sous-espace vectoriel de Rn de codimension d. Plus précisément :
Ta S =
d
\
ker d(fi )(a).
i=1
Démonstration. Une inclusion est facile : soit v = γ 0 (0) ∈ Ta S (les notations sont les
mêmes que supra). On a alors
f (γ(t)) = 0 pour |t| ≤ δ.
En dérivant cette égalité en t = 0, nous obtenons
0 = df (a)(γ 0 (0)) = df (a)(v),
autrement dit
(dfi )(a)(v) = 0 pour 1 ≤ i ≤ d.
1. d1 f (a) n’est autre que la restriction à Rd × {0Rn−d } de df (a).
2. L’espace affine tangent à S en a serait a + Ta S.
2
La réciproque est plus délicate, et utilise de façon cruciale le théorème des fonctions
implicites, qui va nous permettre de paramétrer 3 localement S au voisinage de a. Si
nous écrivons a = (a1 , a2 ) ∈ Rd × Rn−d , ce théorème fournit l’existence de deux ouverts
V ⊂ Rd et W ⊂ Rn−d contenant a1 et a2 respectivement et tels que V × W ⊂ U , ainsi
que d’une fonction
φ:W →V
de classe C 1 telle que
f (x, y) = 0 ⇔ x = φ(y) pour tout (x, y) ∈ V × W .
Fixons alors v ∈
d
\
ker d(fi )(a). Nous écrirons v = (v1 , v2 ) ∈ Rd × Rn−d . L’application
i=1
γ : t 7→ (φ(a2 + tv2 ), a2 + tv2 )
est alors bien définie au voisinage de 0, de classe C 1 , et elle vérifie
γ(0) = (φ(a2 ), a2 ) = (a1 , a2 ) = a.
Pour compléter la preuve, nous allons vérifier que γ 0 (0) = v, ce qui prouvera que v ∈ Ta S.
On a
γ 0 (0) = (dφa2 (v2 ), v2 ).
Il s’agit donc de calculer la différentielle en a2 de la fonction implicite φ, ce qui se fait
selon la méthode standard consistant à différentier en a2 l’identité
f (φ(y), y) = 0 pour tout y ∈ W .
Cela donne :
df (a)(dφa2 (h2 ), h2 ) = 0 pour tout h2 ∈ Rn−d ,
soit
df (a)(dφa2 (h2 ), 0) = −df (a)(0, h2 ),
ou encore
dφa2 (h2 ) = −(d1 f (a))−1 ◦ d2 f (a)(h2 ).
On en déduit donc que
γ 0 (0) = (−(d1 f (a))−1 ◦ d2 f (a)(v2 ), v2 ).
Or, l’hypothèse sur v, c’est-à-dire df (a)(v) = 0, peut aussi s’écrire
df (a)(v1 , 0) + df (a)(0, v2 ) = 0,
soit
v1 = −(d1 f (a))−1 ◦ d2 f (a)(v2 ).
En définitive, nous avons donc
γ 0 (0) = (v1 , v2 ) = v,
ce qui clôt la preuve.
3. c’est-à-dire de décrire localement S grâce à n − d variables redevenues libres (c’est-à-dire vivant
dans un ouvert).
3
2
Le théorème des extrema liés
Théorème 2. Soit f1 , . . . , fd , g : U → R des fonctions de classe C 1 ,
S := {x ∈ U/f1 (x) = . . . = fd (x) = 0}
et a ∈ S fixé. On suppose :
• que les différentielles des fi en a sont linéairement indépendantes,
• que la restriction de g à S présente en a un extremum local.
Alors, il existe des réels λ1 , . . . , λd uniques tels que
dg(a) =
d
X
λi d(fi )(a).
i=1
Les λi sont appelés multiplicateurs de Lagrange.
Démonstration. Par dualité, il suffit de montrer que
d
\
ker d(fi )(a) = ker df (a) ⊂ ker dg(a),
i=1
autrement dit, d’après le théorème 1, que
Ta S ⊂ ker dg(a).
Soit donc v = γ 0 (0) ∈ Ta S (les notations sont les mêmes que supra). L’application
u : t 7→ g(γ(t))
est alors bien définie au voisinage de 0, de classe C 1 , et elle présente en 0 un extremum
local. Par suite, u0 (0) = 0, autrement dit dg(a)(v) = 0.
3
Un exemple d’application (d’après un exercice posé à l’oral
de l’X)
Soit a un réel strictement positif fixé. Considérons la partie S de R3 définie par les
équations
x + y + z = a,
x2 + y 2 + z 2 = a2 .
4
S est un bien sûr un brave cercle :
Considérons à présent la fonction
g : R3 → R, (x, y, z) 7→ xyz.
Comme S est compacte, g|S admet un maximum et un minimum absolu. Calculons-les.
Pour cela, fixons a = (x, y, z) ∈ S en lequel g|S atteint un extremum local. Si jamais
xyz = 0, alors f (a) = 0. Écartons ce cas dans la suite.
En posant
f1 (x, y, z) = x + y + z − a,
f2 (x, y, z) = x2 + y 2 + z 2 − a2
on a
∇f1 (a) = (1, 1, 1) et ∇f2 (a) = 2(x, y, z).
Or, on vérifie facilement que S ne contient aucun point dont les coordonnées sont toutes
égales. Comme a ∈ S, ces deux gradients sont indépendants. D’autre part,
1 1 1
∇g(a) = (yz, xz, yz) = xyz
, ,
.
x y z
D’après le théorème des extrema liés, il existe λ1 , λ2 ∈ R tels que

1


= λ1 + 2λ2 x,


 x
1
= λ1 + 2λ2 y,

y



 1 = λ1 + 2λ2 z.
z
5
(1)
x, y et z sont donc solutions de l’équation
2λ2 t2 + λ1 t − 1 = 0.
(2)
Si jamais λ2 = 0, alors x = y = z d’après (1), ce qui est exclu puisque a ∈ S. Notre
équation (2) est donc de degré 2, de sorte que, par exemple, x = y 6= z. L’appartenance
de a à S se traduit alors par le système
2x + z = a,
2x2 + z 2 = a2
d’où l’on tire
2x2 + (2x − a)2 = a2 ,
soit
2x(3x − 2a) = 0,
d’où
2a
a
et z = − .
3
3
En définitive, nous avons montré que les points a en lesquels g|S est susceptible de
présenter un extremum local
• ou bien ont une coordonnée nulle,
a
• ou bien ont deux coordonnées égales à 2a
3 et la troisième égale à − 3 .
Cela nous permet de localiser les extrema dont l’existence est acquise, et de conclure que
x=y=
min g|S = −
4a3
et max g|S = 0.
27
Remarque 1. Il est évident sur le dessin que g|S est négative, donc aussi que le maximum
de g|S est 0.
Remarque 2. Le théorème des extrema liés nous a servi uniquement à montrer qu’un
point en lequel g|S atteint un extremum local possède ou bien une coordonnée nulle, ou
bien deux coordonnées égales.
Remarque 3. Dans cet exemple, on a voulu faire fonctionner le théorème des extrema
liés. Une méthode plus élémentaire mais pesante aurait consisté à paramétrer le cercle
S puis à étudier les variations d’une fonction d’une seule variable réelle. Signalons enfin pour les amateurs que l’exercice se traite ultra-rapidement en utilisant les fonctions
symétriques élémentaires et les relations entre coefficients et racines.
6
Téléchargement