Espace tangent et extrema liés Dans tout ce qui suit, U désigne un ouvert de Rn . On se donne des fonctions f1 , . . . , fd , g : U → R, toutes de classe C 1 , et on pose S = {x ∈ Rn /f1 (x) = . . . = fd (x) = 0}. Le problème qu’on se pose est de localiser les extrema de la restriction de g à S. Il faut bien comprendre d’emblée que comme S a très peu de chances d’être un ouvert, le théorème usuel sur les points critiques ne fonctionne plus : dans la situation présente, les variables de g|S sont liées par les relations f1 (x) = . . . = fd (x) = 0. Une première étape va consister à préciser la géométrie de S. Heuristiquement, S se présente sous la forme d’une intersection de d hypersurfaces ; on a donc dans l’idée que S sera un objet (n − d)-dimensionnel, au sens où S ressemblera, au voisinage de chacun de ses points, à un sous-espace vectoriel de Rn de dimension n − d. On va montrer que cela est vrai sous des hypothèses raisonnables d’indépendance, et aboutir à la notion d’espace tangent. Une fois l’espace tangent en place, nous obtiendrons immédiatement une condition nécessaire pour que g|S admette un extremum en un point a de S, exprimant essentiellement que la différentielle de g en a est nulle sur l’espace tangent à S en a. En reformulant cette condition via la dualité, on obtiendra enfin le théorème des extrema liés, ce résultat apparaissant alors sous son véritable visage : un théorème de géométrie. 1 L’espace tangent Fixons un point a de S, et supposons que les différentielles des fi au point a (qui sont des formes linéaires sur Rn ) soient linéairement indépendantes. Il revient au même de supposer que les gradients des fi en a sont indépendants. Définissons l’application f : U → Rd , x 7→ (f1 (x), . . . , fd (x)). 1 Par hypothèse, les formes linéaires d(fi )(a), 1 ≤ i ≤ d, sont indépendantes ; de façon équivalente, df (a) est surjective. Quitte à renommer les variables, cela revient aussi à supposer que la matrice [∂j fi (a)]1≤i,j≤d est inversible. Toutefois, il sera plus commode d’exprimer cette condition en disant que l’application « différentielle partielle 1 » : d1 f (a) : Rd → Rd , h = (h1 , . . . , hd ) 7→ df (a)(h, 0) = df (a)(h1 , . . . , hd , 0, . . . , 0) est un isomorphisme. Nous utiliserons aussi dans la suite l’autre différentielle partielle de f en a, définie ainsi : d2 f (a) : Rn−d → Rd , h = (hd+1 , . . . , hn ) 7→ df (a)(0, h) = df (a)(0, . . . , 0, hd+1 , . . . , hn ). Notre hypothèse fondamentale d’indépendance se traduit alors de la façon suivante : d1 f (a) ∈ GL(Rd ). On définit alors l’espace (vectoriel 2 ) tangent à S en a, noté Ta S, comme l’ensemble des vitesses en a des arcs de classe C 1 tracés sur S et passant par a. De façon précise, Ta S est l’ensemble des vecteurs v ∈ Rn tels qu’il existe γ : [−δ, δ] → Rn de classe C 1 vérifiant : γ(0) = a, γ 0 (0) = v et γ(t) ∈ S pour |t| ≤ δ. Défini ainsi, il n’est pas du tout évident que Ta S soit un espace vectoriel. C’est l’objet de notre théorème principal : Théorème 1. Sous l’hypothèse d’indépendance linéaire des formes linéaires (dfi )(a), Ta S est un sous-espace vectoriel de Rn de codimension d. Plus précisément : Ta S = d \ ker d(fi )(a). i=1 Démonstration. Une inclusion est facile : soit v = γ 0 (0) ∈ Ta S (les notations sont les mêmes que supra). On a alors f (γ(t)) = 0 pour |t| ≤ δ. En dérivant cette égalité en t = 0, nous obtenons 0 = df (a)(γ 0 (0)) = df (a)(v), autrement dit (dfi )(a)(v) = 0 pour 1 ≤ i ≤ d. 1. d1 f (a) n’est autre que la restriction à Rd × {0Rn−d } de df (a). 2. L’espace affine tangent à S en a serait a + Ta S. 2 La réciproque est plus délicate, et utilise de façon cruciale le théorème des fonctions implicites, qui va nous permettre de paramétrer 3 localement S au voisinage de a. Si nous écrivons a = (a1 , a2 ) ∈ Rd × Rn−d , ce théorème fournit l’existence de deux ouverts V ⊂ Rd et W ⊂ Rn−d contenant a1 et a2 respectivement et tels que V × W ⊂ U , ainsi que d’une fonction φ:W →V de classe C 1 telle que f (x, y) = 0 ⇔ x = φ(y) pour tout (x, y) ∈ V × W . Fixons alors v ∈ d \ ker d(fi )(a). Nous écrirons v = (v1 , v2 ) ∈ Rd × Rn−d . L’application i=1 γ : t 7→ (φ(a2 + tv2 ), a2 + tv2 ) est alors bien définie au voisinage de 0, de classe C 1 , et elle vérifie γ(0) = (φ(a2 ), a2 ) = (a1 , a2 ) = a. Pour compléter la preuve, nous allons vérifier que γ 0 (0) = v, ce qui prouvera que v ∈ Ta S. On a γ 0 (0) = (dφa2 (v2 ), v2 ). Il s’agit donc de calculer la différentielle en a2 de la fonction implicite φ, ce qui se fait selon la méthode standard consistant à différentier en a2 l’identité f (φ(y), y) = 0 pour tout y ∈ W . Cela donne : df (a)(dφa2 (h2 ), h2 ) = 0 pour tout h2 ∈ Rn−d , soit df (a)(dφa2 (h2 ), 0) = −df (a)(0, h2 ), ou encore dφa2 (h2 ) = −(d1 f (a))−1 ◦ d2 f (a)(h2 ). On en déduit donc que γ 0 (0) = (−(d1 f (a))−1 ◦ d2 f (a)(v2 ), v2 ). Or, l’hypothèse sur v, c’est-à-dire df (a)(v) = 0, peut aussi s’écrire df (a)(v1 , 0) + df (a)(0, v2 ) = 0, soit v1 = −(d1 f (a))−1 ◦ d2 f (a)(v2 ). En définitive, nous avons donc γ 0 (0) = (v1 , v2 ) = v, ce qui clôt la preuve. 3. c’est-à-dire de décrire localement S grâce à n − d variables redevenues libres (c’est-à-dire vivant dans un ouvert). 3 2 Le théorème des extrema liés Théorème 2. Soit f1 , . . . , fd , g : U → R des fonctions de classe C 1 , S := {x ∈ U/f1 (x) = . . . = fd (x) = 0} et a ∈ S fixé. On suppose : • que les différentielles des fi en a sont linéairement indépendantes, • que la restriction de g à S présente en a un extremum local. Alors, il existe des réels λ1 , . . . , λd uniques tels que dg(a) = d X λi d(fi )(a). i=1 Les λi sont appelés multiplicateurs de Lagrange. Démonstration. Par dualité, il suffit de montrer que d \ ker d(fi )(a) = ker df (a) ⊂ ker dg(a), i=1 autrement dit, d’après le théorème 1, que Ta S ⊂ ker dg(a). Soit donc v = γ 0 (0) ∈ Ta S (les notations sont les mêmes que supra). L’application u : t 7→ g(γ(t)) est alors bien définie au voisinage de 0, de classe C 1 , et elle présente en 0 un extremum local. Par suite, u0 (0) = 0, autrement dit dg(a)(v) = 0. 3 Un exemple d’application (d’après un exercice posé à l’oral de l’X) Soit a un réel strictement positif fixé. Considérons la partie S de R3 définie par les équations x + y + z = a, x2 + y 2 + z 2 = a2 . 4 S est un bien sûr un brave cercle : Considérons à présent la fonction g : R3 → R, (x, y, z) 7→ xyz. Comme S est compacte, g|S admet un maximum et un minimum absolu. Calculons-les. Pour cela, fixons a = (x, y, z) ∈ S en lequel g|S atteint un extremum local. Si jamais xyz = 0, alors f (a) = 0. Écartons ce cas dans la suite. En posant f1 (x, y, z) = x + y + z − a, f2 (x, y, z) = x2 + y 2 + z 2 − a2 on a ∇f1 (a) = (1, 1, 1) et ∇f2 (a) = 2(x, y, z). Or, on vérifie facilement que S ne contient aucun point dont les coordonnées sont toutes égales. Comme a ∈ S, ces deux gradients sont indépendants. D’autre part, 1 1 1 ∇g(a) = (yz, xz, yz) = xyz , , . x y z D’après le théorème des extrema liés, il existe λ1 , λ2 ∈ R tels que 1 = λ1 + 2λ2 x, x 1 = λ1 + 2λ2 y, y 1 = λ1 + 2λ2 z. z 5 (1) x, y et z sont donc solutions de l’équation 2λ2 t2 + λ1 t − 1 = 0. (2) Si jamais λ2 = 0, alors x = y = z d’après (1), ce qui est exclu puisque a ∈ S. Notre équation (2) est donc de degré 2, de sorte que, par exemple, x = y 6= z. L’appartenance de a à S se traduit alors par le système 2x + z = a, 2x2 + z 2 = a2 d’où l’on tire 2x2 + (2x − a)2 = a2 , soit 2x(3x − 2a) = 0, d’où 2a a et z = − . 3 3 En définitive, nous avons montré que les points a en lesquels g|S est susceptible de présenter un extremum local • ou bien ont une coordonnée nulle, a • ou bien ont deux coordonnées égales à 2a 3 et la troisième égale à − 3 . Cela nous permet de localiser les extrema dont l’existence est acquise, et de conclure que x=y= min g|S = − 4a3 et max g|S = 0. 27 Remarque 1. Il est évident sur le dessin que g|S est négative, donc aussi que le maximum de g|S est 0. Remarque 2. Le théorème des extrema liés nous a servi uniquement à montrer qu’un point en lequel g|S atteint un extremum local possède ou bien une coordonnée nulle, ou bien deux coordonnées égales. Remarque 3. Dans cet exemple, on a voulu faire fonctionner le théorème des extrema liés. Une méthode plus élémentaire mais pesante aurait consisté à paramétrer le cercle S puis à étudier les variations d’une fonction d’une seule variable réelle. Signalons enfin pour les amateurs que l’exercice se traite ultra-rapidement en utilisant les fonctions symétriques élémentaires et les relations entre coefficients et racines. 6