4. Quelques révisions d’analyse classique 5 à deux joueurs de somme nulle ainsi qu’avec les problèmes primal et dual de Fenchel du Chapitre 2. Une forme générale du lemme de Farkas est donnée en préparation du chapitre suivant. Les constructions et les résultats sont étendus au problème d’optimisation quadratique et aux fonctions objectif Fréchet différentiables. À la fin de ce chapitre, on donne un aperçu de l’optimisation via les sous-différentielles qui font appel à l’analyse multivoque. Le chapitre 5 traite de l’optimisation différentiable par rapport à un ensemble de points admissibles spécifié par un nombre fini de fonctions de contrainte différentiables. En utilisant la condition nécessaire duale d’optimalité, on retrouve le Théorème des multiplicateurs de Lagrange pour les contraintes de type égalité, le Théorème de Karush-Kuhn-Tucker pour celles de type inégalité, et enfin le théorème général pour le cas mixte de contraintes de types égalité et inégalité. 4 Quelques révisions d’analyse classique Ce paragraphe réunit de façon très compacte quelques éléments de base d’analyse classique dont on aura besoin dans les autres chapitres. Ils proviennent de plusieurs sources (par exemple, entre autres, W. H. Fleming [1], W. Rudin [1], ou L. Schwartz [1]). Le calcul différentiel ne nécessite pas de prérequis car il sera complètement traité au Chapitre 3. Les différentes notions de convexité dont on aura besoin seront introduites dans chaque chapitre, mais le lecteur peut aussi consulter des ouvrages spécifiquement consacrés à ce sujet comme, par exemple, F. A. Valentine [1], R. T. Rockafellar [1], L. D. Berkovitz [1], S. R. Lay [1], H. Tuy [1], S. Boyd et L. Vandenberghe [1]. 4.1 Plus petite borne supérieure et plus grande borne inférieure Soient R l’ensemble des nombres réels et |x| la valeur absolue de x. Les notations suivantes seront utilisées pour les réels positifs et les réels strictement positifs déf R+ = {x ∈ R : x ≥ 0} et déf R+ = {x ∈ R : x > 0} et la notation R = R ∪{±∞} pour l’ensemble étendu des réels. Définition 4.1. Soit A une partie non vide de R. a) On dit que b0 ∈ R est une plus petite borne supérieure de A si i) b0 est une borne supérieure de A, ii) pour toute borne supérieure M de A, on a b0 ≤ M . La plus petite borne supérieure b0 de A est unique et sera notée sup A. Si A n’est pas borné supérieurement, on pose sup A = +∞. b) On dit que b0 ∈ R est une plus grande borne inférieure de A si i) b0 est une borne inférieure de A, ii) pour toute borne inférieure m de A, on a b0 ≥ m. 6 Chapitre 1. Introduction La plus grande borne inférieure b0 de A est unique et sera notée inf A. Si A n’est pas borné inférieurement, on pose inf A = −∞. Remarque 4.1. (i) Lorsque A 6= ∅, on a donc toujours −∞ ≤ inf A ≤ sup A ≤ +∞. Par définition, sup A ∈ R si et seulement si A est borné supérieurement et inf A ∈ R si et seulement si A est borné inférieurement. (ii) Lorsque A = ∅, on écrira sup A = −∞ et inf A = +∞. À première vue, il peut paraı̂tre choquant d’avoir sup A < inf A, mais, d’un point de vue mathématique, il s’agit du bon choix puisque sup A < inf A si et seulement si A = ∅ ou, de façon équivalente, sup A ≥ inf A si et seulement si A 6= ∅. On utilisera souvent les conditions équivalentes suivantes. Théorème 4.1. Soit ∅ 6= A ⊂ R. a) b0 est la plus petite borne supérieure de A si et seulement si i) b0 est une borne supérieure de A, ii’) pour tout M tel que b0 > M , il existe x0 ∈ A tel que b0 ≥ x0 > M . b) b0 est la plus grande borne inférieure de A si et seulement si i) b0 est une borne inférieure de A, ii’) pour tout m tel que b0 < m, il existe x0 ∈ A tel que b0 ≤ x0 < m. c) sup A = +∞ si et seulement si, pour tout M ∈ R, il existe x0 ∈ A tel que x0 > M . d) inf A = −∞ si et seulement si, pour tout m ∈ R, il existe x0 ∈ A tel que x0 < m. 4.2 Espace euclidien La plupart des résultats de ce livre demeurent vrais dans des espaces vectoriels de fonctions ou dans des groupes de transformations de dimension infinie. Dans ce livre on se limitera aux espaces vectoriels de dimension finie qui seront identifiés au produit cartésien Rn . Par exemple, ces espaces incluent l’espace des polynômes d’ordre inférieur ou égal à n − 1, n ≥ 1, un entier. Dans ce paragraphe on rappelle quelques définitions, notions et théorèmes de l’analyse classique. 4.2.1 Produit cartésien, boules, et continuité Pour un entier n ≥ 1, soit Rn = R × . . . × R | {z } n fois (4.1) 4. Quelques révisions d’analyse classique 7 le produit cartésien de dimension n avec les notations suivantes un élément la norme x = (x1 , . . . , xn ) ∈ Rn déf kxkRn = " n X i=1 x2i #1/2 x1 ou sous forme matricielle ~x = ... xn et le produit scalaire x · y n xi yi . (4.2) On écrira simplement kxk pour la norme lorsque le contexte le permettra et la flèche sur le vecteur ~x sera souvent omise. Pour n = 1, kxkR1 coı̈ncide avec la valeur absolue |x|. Rn muni de la multiplication par un scalaire et de l’addition ∀α ∈ R, x ∈ Rn , α x = (αx1 , . . . , αxn ) ∀x, y ∈ Rn , x + y = (x1 + y1 , . . . , xn + yn ) est un espace vectoriel sur R de dimension n. Définition 4.2. La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} défini par ( 1, si i = j déf déf (eni )j = δij , δij = 0, si i 6= j, c’est-à-dire, en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1). En particulier, eni · enj = δij . Lorsque le contexte le permet, on écrira simplement {ei } sans l’indice n. On appelle espace euclidien un espace vectoriel E que l’on peut identifier à Rn via une bijection linéaire pour un entier n ≥ 1. Par exemple, on peut identifier à Rn l’espace P n−1 [0, 1] des polynômes d’ordre inférieur ou égal à n − 1 dans l’intervalle [0, 1] : p 7→ (p(0), p′ (0), . . . , p(n−1) (0)) : P n−1 [0, 1] → Rn déf (p0 , p1 , . . . , pn−1 ) 7→ p(x) = 4.2.2 n−1 X i=0 pi xi : Rn → P n−1 [0, 1]. i! Ensembles ouverts et intérieur Les notions d’ensemble ouvert et d’ensemble fermé dans Rn peuvent être définis à l’aide de boules. 8 Chapitre 1. Introduction Boules centrées en x de rayon r > 0 : boule ouverte boule fermée Br (x) = {y ∈ Rn : ky − xk < r} Br (x) = {y ∈ Rn : ky − xk ≤ r}. Boule unité centrée en 0 : ouverte B = {y ∈ Rn : kyk < 1}, fermée B = {y ∈ Rn : kyk ≤ 1}. Boule ouverte trouée centrée en x : Br′ (x) = {y ∈ Rn : 0 < ky − xk < r}. Définition 4.3. Soit U une partie de Rn . (i) a ∈ Rn est un point intérieur de U s’il existe r > 0 tel que Br (a) ⊂ U . (ii) L’intérieur de U est l’ensemble de tous les points intérieurs de U . On le notera int U . Par définition int U ⊂ U . (iii) V (x) est un voisinage de x s’il existe r > 0 tel que Br (x) ⊂ V (x). (iv) A est un ensemble ouvert de Rn pour tout x ∈ A, il existe un voisinage V (x) de x tel que V (x) ⊂ A. (v) La famille T de tous les ouverts dans Rn est la topologie de Rn générée par la norme. La topologie T de Rn coı̈ncide avec la famille des intersections finies et des réunions arbitraires des boules ouvertes dans Rn . 4.2.3 Suite de Cauchy, suite convegente Définition 4.4. (i) Une suite {xn } dans Rn est convergente s’il existe un point n x ∈ R tel que ∀ε > 0, ∃N, ∀n > N, kxn − xkRn < ε. Le point x est unique et appelé le point limite de {xn }. (ii) {xn } dans Rn est une suite de Cauchy si ∀ε > 0, ∃N, ∀n, m > N, kxn − xm kRn < ε. Un espace métrique E est dit complet si toute suite de Cauchy. converge vers un point de E. Rn est un espace complet. 4. Quelques révisions d’analyse classique 4.2.4 9 Ensemble fermé et adhérence Les notions de point d’adhérence et d’ensemble fermé peuvent être amenées de plusieurs façons. On utilise ici les notions de point d’accumulation et de point isolé. Définition 4.5. Soit U une partie de Rn . (i) a ∈ U est un point isolé de U s’il existe r > 0 tel que Br′ (a) ∩ U = ∅. (ii) a ∈ Rn est un point d’accumulation de U si, pour tout r > 0, Br′ (a) ∩ U 6= ∅. Définition 4.6. (i) a ∈ Rn est un point d’adhérence de U si pour tout r > 0 on a Br (a) ∩ U 6= ∅. (ii) L’adhérence (ou fermeture) de U est l’ensemble de tous les points d’adhérence de U . On la notera U . (iii) F est un ensemble fermé s’il contient tous ses points d’accumulation. Remarque 4.2. (i) De façon équivalente, x est un point d’adhérence ou de la fermeture d’une partie U de Rn si, pour tout voisinage V (x) de x, V (x) ∩ U 6= ∅. (ii) L’adhérence de U est égale à l’union de ses points isolés et de ses points d’accumulation. On a donc U ⊂ U . (iii) Les seules parties de Rn qui soient à la fois ouvertes et fermées sont l’ensemble vide ∅ et l’espace Rn . 4.2.5 Recouvrement ouvert et ensemble compact Définition 4.7. (i) Une famille de parties ouvertes {Gα } de Rn est un recouvrement ouvert de E ⊂ Rn si E ⊂ ∪α Gα . (ii) Une partie non vide E de Rn est dite compacte si tout recouvrement ouvert {Gα } de E possède un sous recouvrement fini {Gαi : 1 ≤ i ≤ k}. Théorème 4.2 (Heine–Borel). Soit E une partie non vide de Rn . Alors E est compacte si et seulement si E est fermée et bornée. 16 17 Dans un espace vectoriel normé V , une partie compacte E de V est fermée et bornée, mais la réciproque n’est généralement pas vraie sauf dans des espaces normés de dimension finie. On a les équivalences suivantes dans les espaces métriques. Théorème 4.3 (Bolzano–Weierstrass). Soit un espace métrique (X, d) et un sousensemble E de X. Les propriétés suivantes sont équivalentes. 18 19 16. 17. 18. 19. Heinrich Eduard Heine (1821–1881). Félix Edouard Justin Émile Borel (1871–1956). Bernard Placidus Johann Nepomuk Bolzano (1781–1848). Karl Theodor Wilhelm Weierstrass (1815–1897) fut le chef de file d’une brillante 10 Chapitre 1. Introduction (i) E est compact. (ii) E est séquentiellement compact, c’est-à-dire, toute suite {xn } dans E possède une sous-suite {xnk } qui converge vers un élément x ∈ E. (iii) Tout sous-ensemble infini U de E possède (au moins) un point d’accumulation dans E, c’est-à-dire, U ′ ∩ E 6= ∅. 4.2.6 Complément et frontière Définition 4.8. Soient A et B deux parties de Rn . déf (i) A\B = {x ∈ A : x ∈ / B}. Lorsque A = Rn on écrira ∁B ou Rn \B et on dira que ∁B est le complément de B par rapport à Rn . (ii) La frontière de U ⊂ Rn est définie comme U ∩ ∁U . On la notera ∂U . On peut vérifier que ∂U = U \int U , et U = int U ∪ ∂U , et ∁U = int ∁U ∪ ∂U . 4.3 4.3.1 Application, fonction, continuité et linéarité Fonction réelle et fonction vectorielle Définition 4.9. Soient n ≥ 1 et m ≥ 1 deux entiers, U , ∅ 6= U ⊂ Rn . (i) On appele fonction numérique ou fonction réelle toute application f : U ⊂ Rn → R. On dira aussi fonction réelle d’une variable réelle pour une fonction f : U ⊂ R → R et fonction réelle de plusieurs variables réelles pour une fonction f : U ⊂ Rn → R, n ≥ 2. (ii) On appelera fonction vectorielle toute application f : U ⊂ Rn → Rm pour un entier m ≥ 2. 4.3.2 Continuité et prolongement continu d’une application Définition 4.10. Soient deux entiers n ≥ 1 et m ≥ 1, et U , ∅ 6= U ⊂ Rn . Une application f : U → Rm est continue en x ∈ U si ∀ε > 0, ∃δ(x) > 0 tel que ∀y ∈ U tel que ky − xkRn < δ(x), kf (y) − f (x)kRm < ε. (4.3) La fonction f est continue sur U si f est continue en tout point de U . Lorsque U est un sous-ensemble fermé de Rn , il existe toujours un prolongement continu fˆ : Rn → Rm de cette fonction de U à tout Rn . Théorème 4.4 (H. Tietze [1], 1915). Soit U , ∅ 6= U ⊂ Rn , fermé. Toute application continue f : U → Rm possède un prolongement continu de U à tout Rn . école d’analystes, qui entreprirent la révision systématique des divers secteurs de l’analyse mathématique. 4. Quelques révisions d’analyse classique 11 Remarque 4.3. Ce résultat demeure vrai dans un espace métrique arbitraire (X, d), mais il est aussi vrai dans un espace topologique T4 en faisant appel au Lemme de Uryshohn 20 en Topologie. La notion de continuité pour une fonction f : Rn → Rm est implicitement définie à l’aide de boules ouvertes. En effet, la condition (4.3) de la Définition 4.10 peut s’écrire ∀ε > 0, ∃δ(x) > 0 tel que Bδ(x) (x) ∩ U ⊂ f −1 {Bε (f (x))} pour les boules ouvertes Bε (f (x)) et Bδ(x) (x). Ceci mêne au critère équivalent suivant en termes de voisinages. Théorème 4.5. Soit une application f : Rn → Rm pour deux entiers n ≥ 1 et m ≥ 1. La fonction f est continue en x ∈ Rn si et seulement si pour tout voisinage W de f (x) dans Rm , f −1 {W } est un voisinage de x dans Rn . Démonstration. Pour tout voisignage W de f (x) il existe ε > 0 tel que Bε (f (x)) ⊂ W . Si f est continue en x, alors par définition, il existe δ(x) > 0 tel que Bδ(x)) (x) ⊂ f −1 {Bε (f (x))}. Comme f −1 {Bε (f (x))} ⊂ f −1 {W }, f −1 {Bε (f (x))} est donc bien un voisinage de x par définition. Réciproquement, pour tout ε > 0, la boule ouverte Bε (f (x)) est un voisinage de f (x). Alors f −1 {Bε (f (x))} est un voisinage de x. Il existe donc une boule ouverte Bδ(x) (x) de rayon δ(x) > 0 tel que Bδ(x) (x) ⊂ f −1 {Bε (f (x))}. D’où la définition ε-δ de la continuité de f en x. 4.3.3 Application linéaire, application transposée et matrices associées Définition 4.11. (i) Une application L : Rn → Rm est linéaire si ∀x, y ∈ Rn , ∀α, β ∈ R, L(αx + βy) = α L(x) + β L(y). (4.4) L’ensemble de toutes les applications linéaires de Rn dans Rm sera dénoté L(Rn , Rm ). (ii) Soient n ≥ 1 et m ≥ 1 deux entiers. On dénote par m {em i ∈ R : 1 ≤ j ≤ m} et {eni ∈ Rn : 1 ≤ i ≤ n} les bases canoniques orthonormales associées à Rm et Rn , respectivement. On associe à une application linéaire L : Rn → Rm la m × n matrice {Aij } déf n Aij = em i · Lej , Lx · y = m X n X Aij xj yi (4.5) i=1 j=1 pour x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ). Par convention, on utilisera souvent la même notation A pour L et sa matrice associée. 20. Pavel Samouilovitch Urysohn (1898-1924). 12 Chapitre 1. Introduction Théorème 4.6. (i) Soit f : Rn → R une fonction linéaire pour la norme euclidienne sur Rn . Il existe un élément unique a ∈ Rn tel que x1 . n ∀x ∈ R , f (x) = a · x = a1 . . . an .. (sous forme matricielle), xn (4.6) f est continue et déf kf kL(Rn ,R) = sup x6=0 |f (x)| = kak. kxkRn (4.7) (ii) Soit L : Rn → Rm une application linéaire pour les normes euclidiennes sur Rn et Rm . Alors L est continue sur Rn . Il existe une matrice m × n unique A = {aij } telle que x1 a11 . . . a1n m n X X .. . m . .. .. ... aij xj ei = . L(x1 , . . . , xn ) = , (4.8) i=1 j=1 xn am1 . . . amn où aij = L(enj ) · em i , et déf kLkL(Rn ,Rm ) = sup x6=0 kLxkRm ≤ kAk2 , kxkRn déf kAk2 = m X n X i=1 j=1 a2ij 1/2 . (4.9) Remarque 4.4. kAk2 est appelée norme de Frobenius. 21 L(Rn , Rm ) est un espace de Hilbert pour le produit scalaire (dit de Frobenius) 22 déf A·· B = m X n X i=1 j=1 aij bij , kAk2 = √ A·· A, (4.10) des matrices A et B associées à deux éléments L et M de L(Rn , Rm ). Il peut être identifié à Rmn muni de la norme euclidienne kAk2 . La norme de Frobénius kAk2 est équivalente mais pas égale à la norme kLkL(Rn ,Rm ) de l’application linéaire correspondante. L(Rn , Rm ) est seulement un espace de Banach pour la norme kLkL(Rn ,Rm ) . Démonstration. (i) Soit une fonction linéaire f : Rn → R. Tout point x ∈ Rn peut s’écrire x = (x1 , . . . , xn ) = n X xi ei i=1 21. Ferdinand Georg Frobenius (1849–1917). 22. On peut montrer que A·· B = tr (A⊤ B) = tr (A B ⊤ ). 4. Quelques révisions d’analyse classique 13 et, par linéarité de f , f (x) = n X i=1 xi f (ei ) = x · a, déf a = (f (e1 ), . . . , f (en )). Le vecteur a est unique. Pour tout ε > 0, on prend δ = ε/(kak + 1). De là, ∀y, ky − xk < δ ⇒ |f (y) − f (x)| = |f (y − x)| = |a · (y − x)| ≤ kak ky − xk < kak δ = kak ε < ε. kak + 1 f est donc continue en tout point de Rn . Si f est identiquement nulle, on prend a = 0. Sinon, par Cauchy-Schwartz, pour le produit scalaire ∀x ∈ Rn , |f (x)| = |x · a| ≤ kxk kak ⇒ kf kL(Rn ,R) = sup 06=x∈Rn |f (x)| ≤ kak. kxk Mais, comme f (a/kak) = a·(a/kak) = kak, le supremum est atteint et kf kL(Rn ,R) = kak. (ii) On applique (i) à chaque composante fi (x) = ei · f (x) de f : il existe ai ∈ Rn tel que fi (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque ai , on forme ainsi la matrice A : f1 (x) a1 · x a11 .. .. .. f (x) = . = . = . fn (x) an · x Le reste est évident. | an1 x1 . . . a1n .. .. . .. . . . xn . . . ann {z } | {z } x A L’opération de composition de deux applications linéaires correspond à la multiplication de leurs matrices associées. Théorème 4.7. Soient trois entiers ℓ, m, n plus grands ou égaux à 1. (i) La composition L ◦ M de L ∈ L(Rℓ , Rm ) et de M ∈ L(Rn , Rℓ ) M L ℓ m x 7→ M (x) 7→ L(M (x)) : Rn −→ | R {z −→} R L◦M est un élément de L(Rn , Rm ) et kL ◦ M kL(Rn ,Rm ) ≤ kLkL(Rℓ ,Rm ) kM kL(Rn ,Rℓ ) . (4.11) 14 Chapitre 1. Introduction (ii) Si A est la matrice m × ℓ associée à L et B est la matrice ℓ × n associée à M , alors la matrice m × n associée à la composition L ◦ M est le produit déf (A B)ij = ℓ X aik bkj , 1 ≤ i ≤ m, k=1 1 ≤ j ≤ n, (4.12) des matrices A et B et kABk2 kAk2 z }| { }| { 1/2 z( )1/2 m ℓ m X n X XX a2ik (A B)2ij ≤ i=1 k=1 i=1 j=1 (iii) Pour tout A ∈ L(Rn , Rm ), déf Ker A = {x ∈ Rn : Ax = 0} ⊂ Rn kBk2 z }| { 1/2 ℓ X n X b2kj . (4.13) k=1 j=1 déf Im A = {Ax : x ∈ Rn } ⊂ Rm (4.14) et sont des sous-espaces linéaires de Rn et de Rm , respectivement. Démonstration. La composition de deux applications linéaires A B Rn −→ Rmm −→ Rk {en j } {ek ℓ} {ei } correspond à la multiplication de leurs matrices associées. En effet, x = (x1 , . . . , xn ) = n X xj ′ enj′ j ′ =1 Ax = n X j ′ =1 xj ′ Aenj′ = m X i=1 em i · n X j ′ =1 xj ′ Aenj′ em i (B ◦ A)(x) = B(Ax) = m X (B ◦ A)ℓj = ekℓ · (B ◦ A)(enj ) = i=1 m X i=1 n X j ′ =1 n m X X m n em = i · Aej ′ xj ′ ei | {z } i=1 j ′ =1 Aij′ Aij ′ xj ′ Bem i = Aij ekℓ · Bem | {z i } Bℓi m X Bℓi Aij . i=1 On introduit l’application transposée ou adjointe A⊤ : Rm → Rn d’une application linéaire A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax : Rn → R est linéaire. Par le Théorème 4.6 (i), il existe un vecteur unique a(y) ∈ Rn tel que ∀x ∈ Rn , a(y) · x = y · Ax 4. Quelques révisions d’analyse classique 15 et ceci induit une application déf y 7→ A⊤ y = a(y) : Rm → Rn (4.15) qui est linéaire. En effet, pour tout α, β dans R et y1 , y2 dans Rm , on a ∀x ∈ Rn , a(αy1 + βy2 ) · x = (αy1 + βy2 ) · Ax = α y1 · Ax + β y2 · Ax = α a(y1 ) · x + β a(y2 ) · x = [α a(y1 ) + β a(y2 )] · x ⇒ a(αy1 + βy2 ) = α a(y1 ) + β a(y2 ). Par construction, A⊤ vérifie l’identité ∀x ∈ Rn , y ∈ Rm , y · Ax = A⊤ y · x. (4.16) Définition 4.12. L’application A⊤ : Rm → Rn associée à une application linéaire A : Rn → Rm telle que définie par (4.15) est appelée application transposée de A. n Si Aij = em i · Aej est la matrice m × n associée à A pour les bases orthonormales n m n canoniques {ej : 1 ≤ j ≤ n} et {em i : 1 ≤ i ≤ m} de R et R , alors la matrice n × m associée à A⊤ est donnée par (A⊤ )ij = Aji . On complète l’exposé par les définitions suivantes : Définition 4.13. Soit A ∈ L(Rn , Rn ) une application linéaire (matrice n × n). (i) A est symétrique si A⊤ = A (aji = aij ). (ii) Une application linéaire symétrique A est définie positive (resp., semidéfinie positive) si ∀x ∈ Rn , x 6= 0, (Ax) · x > 0 (resp., ∀x ∈ Rn , (Ax) · x ≥ 0). On écrira A > 0 (resp., A ≥ 0). Définition 4.14. Soit A ∈ L(Rn , Rn ) et C l’ensemble des nombres complexes : (i) λ ∈ C est une valeur propre de A s’il existe x ∈ Cn non nul tel que Ax = λx ; on dira que x ∈ Cn est un vecteur propre de A associé à λ ; (iii) l’ensemble E(λ) = Ker[A − λI] est un sous-espace linéaire de Cn appelé espace propre de A associé à la valeur propre λ ; (iv) si l’espace propre E(λ) associé à la valeur propre λ de A est de dimension un, on dit que la valeur propre est simple. Les valeurs propres et l’ensemble des vecteurs propres sont donc donnés par det[A − λI] = 0 et E(λ) = Ker[A − λI]. n n (4.17) Lorsque A⊤ = A, les valeurs propres λ de A ∈ L(R , R ) sont toutes réelles et E(λ) ⊂ Rn . 16 5 Chapitre 1. Introduction Exercices Exercice 5.1. Soient n ≥ 1 et m ≥ 1 des entiers et L(Rn , Rm ) l’espace des applications linéaires A : Rn → Rm . On pose L(Rn ) = L(Rn , Rn ), déf Ker A = {x ∈ Rn : Ax = 0} , déf Im A = {Ax : x ∈ Rn } . (i) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est définie positive et inversible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A. (ii) Montrer que pour A ∈ L(Rn , Rm ), (A⊤ )⊤ = A, Ker A⊤ = (Im A)⊥ et Im A⊤ = (Ker A)⊥ , où l’orthogonal U ⊥ d’un sous-ensemble U de Rn est défini par déf U ⊥ = {v ∈ Rn : v · u = 0, ∀u ∈ U }. Chapitre 2 10 10 8 10 6 10 4 10 2 0 10 0.2 0.4 0 10 1 1 0.8 0.6 0.6 0.4 0.2 0 ! 0.2 0.8 ! 0.4 ! 0.6 ! 0.8 !1 1 Existence, convexités et convexification Introduction Dans ce chapitre, Rn sera le produit cartésien muni du produit scalaire et de la norme (4.2) du Chapitre 1, f : Rn → R ou R ∪{+∞} une fonction objectif et U une partie non vide de Rn . Le Théorème de Weierstrass donne des conditions sur U et f pour lesquelles il existe des points de U réalisant l’infimum inf f (U ) et le supremum sup f (U ) : compacité de U et continuité de f dans U . En fait, on peut se limiter au problème de minimisation, car celui de la maximisation se ramène à celui de la minimisation en mettant un signe moins devant la fonction objectif. En se restreignant à la recherche de l’infimum, on peut élargir la classe de fonctions objectif à des fonctions f : Rn → R ∪{+∞} et l’on pourra relaxer la condition de continuité en une condition de semicontinuité inférieure qui permettra d’obtenir l’existence de points minimisants pour des fonctions discontinues. Des conditions de croissance à l’infini complèteront les résultats lorsque U est fermé mais non-borné. En absence de compacité, on donne aussi le Principe variationnel d’Ekeland et quelques unes de ses ramifications comme le théorème d’existence de Takahashi et celui de point fixe de Caristi. Tous ces résultats sont vrais pour des espaces vectoriels de dimension finie et les idées et constructions de bases se généralisent aux espaces de fonctions. La dernière partie du chapitre est consacrée à la convexité qui joue un rôle particulier dans le contexte de la minimisation. Si, en plus,de l’existence, la convexité de f est stricte on obtient l’unicité du point minimisant. Pour des fonctions objectif convexes, tous les infima sont globaux et égaux. D’où l’idée de convexifier une fonction et de rechercher l’infimum de sa convexifiée qui coı̈ncidera avec l’infimum global de la fonction initiale qui peut avoir plusieurs infima locaux. Ceci mène aux travaux de Legendre, Fenchel et Rockafellar, à l’introduction de la transformée de Fenchel–Legendre, aux des problèmes primal et dual, et au Théorème de dualité de Fenchel que l’on reverra au Chapitre 4 dans le contexte des optimisations linéaire et quadratique. 17 18 2 Chapitre 2. Existence, convexités et convexification Théorème d’existence de Weierstrass Le fait d’avoir inf f (U ) fini ne garantit pas l’existence d’un point a ∈ U qui réalise l’infimum f (a) = inf f (U ) comme l’illustre l’exemple suivant. Exemple 2.1. Soit U = R et la fonction f (x) = 1 si x ≤ 0 et f (x) = x si x > 0 pour laquelle inf f (U ) = 0 et f (x) 6= 0 pour tout x ∈ U = R. Ce premier théorème est à la base de la théorie de l’optimisation. Il donne des conditions suffisantes sur U et f pour l’existence de points de U réalisant l’infimum inf f (U ) et le supremum sup f (U ). Théorème 2.1 (de Weierstrass 1 ). Soient U une partie compacte non vide de Rn et une fonction f : U → R continue sur U . Alors (i) ∃a ∈ U tel que f (a) = sup f (U ), (ii) ∃b ∈ U tel que f (b) = inf f (U ). Démonstration. Voir la démonstration plus loin du Theorème 5.1 sous des hypothèses plus faibles. Les hypothèses de ce théorème sont un peu trop fortes puisqu’il donne à la fois l’existence de points minimisants et maximisants. En fait. il suffit de chercher des conditions d’existence d’un point minimisant de f dans U car tout supremum peut se ramener à un infimum en observant que sup f (U ) = − inf(−f )(U ) et vice versa. 0 1 0 1 Figure 2.1. Fonctions discontinues ayant un point minimisant dans [0, 1]. On devrait pouvoir relaxer la continuité. En effet, les fonctions numériques dans U = [0, 1] représentées à la Figure 2.1 ne sont que continues par morceaux, mais atteignent leur minimum en un point de [0, 1]. Au point de discontinuité on 1. Karl Theodor Wilhelm Weierstrass (1815–1897). 3. Extrema des fonctions à valeurs réelles étendues 19 a choisi comme définition de la fonction la valeur inférieure et non pas la valeur supérieure qui n’aurait pas donné l’existence d’un point minimisant. 3 Extrema des fonctions à valeurs réelles étendues Le inf f (U ) et le sup f (U ) ont été définis pour des fonctions à valeurs réelles, c’est-à-dire, f (U ) ⊂ R. Lorsque l’ensemble f (U ) n’est pas vide et n’est pas borné inférieurement inf f (U ) = −∞ et lorsque il n’est pas borné supérieurement sup f (U ) = +∞ (cf. Définition 4.1 et Remarque 4.1 du Chapitre 1). L’idée d’introduire des fonctions objectif prenant les valeurs +∞ ou −∞ et l’introduction de leur domaine effectif seraient attribuables à R. T. Rockafellar 2 et à J. J. Moreau. 3 Dans ce chapitre on considère non seulement des fonctions f : Rn → R à valeurs réelles, mais aussi des fonctions f : Rn → R = R ∪{±∞} pouvant prendre les valeurs +∞ ou −∞ pour lesquelles il est nécessaire de préciser les définitions du inf f (U ) et du sup f (U ). Définition 3.1. Soient f : Rn → R une fonction et U ⊂ Rn . (i) On associe à f son domaine effectif déf dom f = {x ∈ Rn : −∞ < f (x) < +∞} . (3.1) On dira aussi simplement domaine de f . (ii) L’infimum de f par rapport à U est défini comme suit ( inf f (U ∩ dom f ), si f (U ) ⊂ R ∪{+∞}, déf inf f (U ) = − ∞, si ∃x ∈ U tel que f (x) = −∞. On utilisera aussi la notation inf x∈U f (x). Le supremum de f par rapport à U est défini comme suit ( si f (U ) ⊂ R ∪{−∞}, sup f (U ∩ dom f ), déf sup f (U ) = + ∞, si ∃x ∈ U tel que f (x) = +∞. 2. Ralph Tyrrell Rockafellar (1935– ). ≪Moreau and I independently in those days at first, but soon in close exchanges with each other, made the crucial changes in outlook which, I believe, created convex analysis out of convexity. For instance, he and I passed from the basic objects in Fenchel’s work, which were pairs consisting of a convex set and a finite convex function on that set, to extended real-valued functions implicitly having effective domains, for which we moreover introduced set-valued subgradient mappings.≫ R. T. Rockafellar, http ://www.convexoptimization.com/wikimization/index.php/Rockafellar. 3. Jean Jacques Moreau (1923– ) ≪. . .appears as a rightful heir to the founders of differential calculus and mechanics through the depth of his thinking in the field of nonsmooth mechanics and the size of his contribution to the development of nonsmooth analysis. His interest in mechanics has focused on a wide variety of subjects : singularities in fluid flows, the initiation of cavitation, plasticity, and the statics and dynamics of granular media. Allied to this is his investment in mathematics in the fields of convex analysis, calculus of variations and differential measures.≫ (cf. P. Alart, O. Maisonneuve et R. T. Rockafellar [1]). 20 Chapitre 2. Existence, convexités et convexification On utilisera aussi la notation supx∈U f (x). Les infima et suprema forment l’ensemble des extrema de f dans U . (iii) Lorsqu’il existe a ∈ U tel que f (a) = inf f (U ), on dira que f atteint son minimum en un point de U et l’on écrira min f (U ) ou min f (x); x∈U L’ensemble des points minimisants de f dans U est dénoté par déf argmin f (U ) = {a ∈ U : f (a) = inf f (U )} . (3.2) Lorsqu’il existe b ∈ U tel que f (b) = sup f (U ), on dira que f atteint son maximum en un point de U et l’on écrira max f (U ) or max f (x) x∈U L’ensemble des points maximisants de f dans U est dénoté par déf argmax f (U ) = {b ∈ U : f (b) = sup f (U )} . (3.3) Comme on considère les extrema de fonctions qui peuvent prendre les valeurs ±∞, il convient de donner la démonstration que tout supremum pour f peut se ramener à l’infimum pour −f et vice versa. Théorème 3.1. Soient f : Rn → R ∪{±∞} et U ⊂ Rn . sup f (U ) = − inf(−f )(U ) et argmax f (U ) = argmin (−f )(U ). (3.4) Démonstration. Si U = ∅, alors f (U ) = ∅. Par convention sup f (U ) = −∞ et inf(−f )(U ) = +∞, d’où sup f (U ) = −∞ = − inf(−f )(U ). On suppose donc que U 6= ∅. On élimine deux cas triviaux. S’il existe x ∈ U tel que f (x) = +∞, alors sup f (U ) = +∞, −f (x) = −∞ et inf −f (U ) = −∞. Le second cas est f (x) = −∞ pour tout x ∈ U qui implique sup f (U ) = −∞ et, pour tout x ∈ U , −f (x) = +∞ et inf −f (U ) = +∞. Il reste le cas U 6= ∅ et f : Rn → R ∪{−∞} pour lequel il existe x ∈ U tel que f (x) > −∞. Donc sup f (U ) > −∞. (i) Soit b0 = sup f (U ) ∈ R. Par la Définition 4.1 du Chapitre 1, b0 est une borne supérieure, c’est-à-dire, pout tout x ∈ U , f (x) ≤ b0 , et pour toute borne supérieure M de f (U ) on a b0 ≤ M . Donc pout tout x ∈ U , −f (x) ≥ −b0 et −b0 est une borne inférieure de −f (U ) = {−f (x) : x ∈ U }. Soit m une borne inférieure de −f (U ). Alors, −m est une borne supérieure de f (U ) et comme b0 est la plus petite borne supérieure on a b0 ≤ −m. De là, −b0 ≥ m et −b0 est la plus grande borne inférieure de −f (U ). Ceci donne inf −f (U ) = −b0 = − sup f (U ) et − inf −f (U ) = b0 = sup f (U ). 3. Extrema des fonctions à valeurs réelles étendues 21 (ii) Par la convention de la Remarque 4.1 du Chapitre 1, le cas b0 = sup f (U ) = +∞ correspond à f (U ) non borné supérieurement. Il existe donc une suite {xn } ⊂ U tel que f (xn ) → +∞. Ceci entraı̂ne que −f (xn ) → −∞ et l’ensemble −f (U ) n’est pas borné inférieurement. Par convention, inf −f (U ) = −∞. D’où sup f (U ) = +∞ = − inf −f (U ). L’introduction de fonctions numériques prenant les valeurs ±∞ permet de remplacer l’infimum de f par rapport à U par l’infimum par rapport à tout Rn en introduisant la fonction ) ( f (x), si x ∈ U déf : Rn → R ∪{±∞}. (3.5) x 7→ fU (x) = + ∞, si x ∈ Rn \U Théorème 3.2. Soient U ⊂ Rn et une fonction f : Rn → R ∪{±∞}. Alors inf f (U ) = inf fU (U ) = inf fU (Rn ) et argmin f (U ) = U ∩ argmin fU (Rn ). Si, en plus, inf f (U ) < +∞, alors argmin f (U ) = argmin fU (Rn ). Démonstration. S’il existe x ∈ U tel que f (x) = −∞, alors fU (x) = −∞ et, par définition, inf fU (Rn ) = −∞ = inf f (U ). De plus, inf f (U ) = inf fU (U ) puisque fU = f dans U . Si f (U ) ⊂ R ∪{+∞}, alors f (U ) = fU (U ) ⊂ fU (Rn ) ⊂ R ∪{+∞} et dom fU = U ∩ dom f puisque fU (x) = +∞ dans Rn \U et f (x) > −∞ dans U . Donc inf f (U ∩ dom f ) = inf f (dom fU ) = inf fU (dom fU ) = inf fU (Rn ∩ dom fU ) et, par définition de inf f (U ), inf fU (U ) et inf fU (Rn ), inf f (U ) = inf fU (U ) = inf fU (Rn ). (3.6) Comme inf f (U ) = inf fU (U ) = inf fU (Rn ) et que U ⊂ Rn , on a argmin f (U ) = argmin fU (U ) ⊂ argmin fU (Rn ) et argmin fU (U ) = U ∩ argmin fU (Rn ). Si, en plus, inf f (U ) < +∞, on a, par définition de fU , argmin fU (Rn ) ⊂ argmin fU (U ) = argmin f (U ). Remarque 3.1. Dans le cas du supremum, on prolongera f par −∞ en considérant la fonction ) ( f (x), si x ∈ U déf = −(−f )U (x). (3.7) f U (x) = − ∞, si x ∈ Rn \U Pour l’infimum deux cas sont triviaux : (i) il existe x ∈ U tel que f (x) = −∞ ce qui entraı̂ne inf fU (Rn ) = inf f (U ) = −∞ et x ∈ argmin f (U ) ; (ii) pour tout x ∈ U , f (x) = +∞, ce qui entraı̂ne inf fU (Rn ) = inf f (U ) = +∞ et argmin f (U ) = U . 22 Chapitre 2. Existence, convexités et convexification On est alors amené à exclure les cas (i) et (ii) pour l’infimum pour en arriver à la notion de fonction propre que l’on étend à des fonctions qui ne sont pas nécessairement convexes. La notion duale pour le supremum s’obtient en considérant l’infimum de −f . Définition 3.2. Soit une fonction f : Rn → R ∪ {±∞}. (i) f est dite propre 4 pour l’infimum si a) pour tout x ∈ Rn , f (x) > −∞ et b) il existe x ∈ Rn tel que f (x) < +∞. Ceci est donc équivalent à f : Rn → R ∪{+∞} et dom f 6= ∅. (ii) f est dite propre pour le supremum si a) pour tout x ∈ Rn , f (x) < +∞ et b) il existe x ∈ Rn tel que f (x) > −∞. Ceci est donc équivalent à f : Rn → R ∪{−∞} et dom f 6= ∅. Lorsque le contexte le permet, on dira simplement fonction propre. Un autre cas trivial est celui où dom f est un singleton, c’est à dire qu’il n’existe qu’un seul point où f prend une valeur finie. 4 Semi-continuités inférieure et supérieure Pour pouvoir considérer l’infimum de fonctions discontinues, on affaiblit la notion de continuité en la décomposant en deux notions plus faibles qui sont simultanément présentes dans la définition de la continuité. On rapelle qu’une fonction f : Rn → R est continue en a ∈ Rn si ∀ε > 0, ∃δ > 0 tel que ∀x ∈ Bδ (a), |f (x) − f (a)| < ε. (4.1) La boule ouverte Bδ (a) de rayon δ > 0 en a est un voisinage de a. En posant V (a) = Bδ (a), la condition sur f donne deux conditions suivantes ∀x ∈ V (a), ∀x ∈ V (a), −ε < f (x) − f (a) f (x) − f (a) < ε ⇒ f (a) − ε < f (x) ⇒ f (x) < f (a) + ε. (4.2) La première condition dit que f (a) se trouve en dessous de tous les points limite de f (x), lorsque x tend vers a, alors que la seconde dit que f (a) se trouve au dessus, d’où la décomposition de la continuité en semi-continuité inférieure et semicontinuité supérieure. Définition 4.1. Soit U , ∅ 6= U ⊂ Rn . 4. Il ne faut pas confondre fonction propre traduction de l’anglais proper function avec fonction propre traduction de eigenfunction. 4. Semi-continuités inférieure et supérieure 23 (i) f : U → R ∪{+∞} est semi-continue inférieurement en a ∈ U si ∀h < f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , h < f (x). (4.3) f : U → R ∪{+∞} est semi-continue inférieurement dans U si elle est semi-continue inférieurement en tout point de U . Par convention, la fonction identiquement égale à −∞ dans U est semicontinue inférieurement dans U . (ii) f : U → R ∪{−∞} est semi-continue supérieurement en a ∈ U si ∀k > f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , k > f (x). (4.4) f : U → R ∪{−∞} est semi-continue supérieurement dans U si elle est semi-continue supérieurement en tout point de U . Par convention, la fonction identiquement égale à +∞ dans U est semicontinue supérieurement dans U . On utilisera les abbréviations sci pour semi-continue inférieurement et scs pour semi-continue supérieurement. Les fonctions de la Figure 2.1 sont sci dans ]0, 1[ . La fonction identiquement égale à +∞ est sci et celle identiquement égale à −∞ est scs dans Rn . Comme on l’a vu au début, la définition (4.1) de la continuité d’une fonction f : Rn → R en un point a ∈ Rn est équivalente aux deux conditions (4.2) : la première est la sci en a avec h = f (a) − ε < f (a) et la seconde est la scs en a avec k = f (a) + ε > f (a). Pour U fermé, on a, comme pour les fonctions continues sur U , un prolongement sci à tout Rn . Lemme 4.1. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞} sci dans U . Alors, la fonction ) ( f (x), si x ∈ U : Rn → R ∪{+∞} x 7→ fU (x) = + ∞, si x ∈ Rn \U (définie en (3.5)) est un prolongement sci de f dans Rn . Remarque 4.1. En général, si U n’est pas fermé, fU n’est pas sci, mais cette condition n’est pas nécessaire. En effet, soit U = (0, 1] et f (x) = 1/x dans U . Le prolongement ) ( 1/x, si 0 < x ≤ 1 : R → R ∪{+∞}. x 7→ fU (x) = + ∞, si x ∈ R \(0, 1] est sci. Il suffit de montrer que fU est sci en x = 0. En effet, pour tout h < fU (0) = +∞, on prend comme voisinage de 0, V (0) = (−∞, 1/h) pour lequel f (x) > h. 24 Chapitre 2. Existence, convexités et convexification Démonstration du Lemma 4.1. La fonction fU est sci en tout point a ∈ Rn \U . En effet, V (a) = Rn \U est un ouvert non vide contenant a puisque U est fermé. C’est donc un voisinage de a. Pour tout h < f (a) = +∞, ∀x ∈ V (a), h < +∞ = f (x) et, par définition, fU est sci sur Rn \U . Comme pour tout a ∈ U , fU (a) = f (a) et f est sci en tout point de U , il existe donc un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U, h < f (x) ⇒ ∀x ∈ V (a), h < f (x) ≤ fU (x), puisque, par construction, fU (x) = +∞ sur Rn \U . fU est donc aussi sci en tout point de U . Exemple 4.1. La fonction indicatrice d’une partie fermée U de Rn ( 0, si x ∈ U, déf IU (x) = + ∞, si x ∈ / U, est sci dans tout Rn car IU = fU pour la fonction x 7→ f (x) = 0 : U ⊂ Rn → R. Comme dans le cas du supremum et de l’infimum où sup f (U ) = − inf −f (U ), f est scs en x si et seulement si −f est sci en x et il suffira d’étudier les propriétés des fonctions sci. Théorème 4.1. (i) f : Rn → R ∪{−∞} est scs en x si et seulement si −f : n R → R ∪{+∞} est sci en x. (ii) f : Rn → R ∪{+∞} est sci en x si et seulement si −f : Rn → R ∪{−∞} est scs en x. Démonstration. Comme f : Rn → R ∪{−∞}, on a −f : Rn → R ∪{+∞}. Soit h < −f (x), alors f (x) < −h. Comme f est scs en x, il existe un voisinage V (x) de x tel que pour tout y ∈ V (x), f (y) < −h. Ceci entraı̂ne pour tout y ∈ V (x), −f (y) > h. Par définition, −f est sci en x. La réciproque est similaire. Il est facile de vérifier les propriétés suivantes des fonctions sci (voir les exercices 9.1 à 9.4) en utilisant la convention (+∞) + (+∞) = +∞, (+∞) + a = +∞ pour tout a ∈ R, et (+∞) a = (a/kak) ∞ pour tout a ∈ R différent de 0. Théorème 4.2. (i) Pour tout f : Rn → R ∪{+∞} et tout g : Rn → R ∪{+∞} n sci en a ∈ R , la fonction déf x 7→ (f + g)(x) = f (x) + g(x): Rn → R ∪{+∞} est sci en a. 4. Semi-continuités inférieure et supérieure 25 (ii) Pour tout λ > 0 et tout f : Rn → R ∪{+∞} sci en a ∈ Rn , la fonction déf x 7→ (λf )(x) = λf (x) : Rn → R ∪{+∞} est sci en a. (iii) Pour toute famille {fα }α∈A (A un ensemble d’indices possiblement infini) de fonctions fα : Rn → R ∪{+∞} sci en a ∈ Rn , l’ enveloppe supérieure x 7→ déf sup fα (x) = sup fα (x): Rn → R ∪{+∞} α∈A α∈A est sci en a ∈ Rn . (iv) Pour toute famille finie fi : Rn → R ∪{+∞}, 1 ≤ i ≤ m, de fonctions sci en a ∈ Rn , l’ enveloppe inférieure déf x 7→ min fi (x) = min fi (x): Rn → R ∪{+∞} 1≤i≤m 1≤i≤m est sci en a ∈ Rn . (v) Pour une fonction f : Rn → R et un point a ∈ Rn f continue en a ⇐⇒ f est sci et scs en a. (vi) Pour une application linéaire A : Rm → Rn et une fonction f : Rn → R ∪{+∞} sci en Ax, f ◦ A : Rm → R ∪{+∞} est sci en x. La propriété (iv) n’est pas nécessairement vraie pour l’enveloppe inférieure d’une famille infinie de fonctions sci comme le montre l’exemple suivant. Exemple 4.2. Pour chaque entier k ≥ 1, soit la fonction numérique continue si x ∈ [0, 1], 1, déf fk (x) = 1 − k(x − 1), si x ∈ [1, 1 + 1/k], 0, si x ∈ [1 + 1/k, 2]. Il est facile de vérifier que inf fk (x) = k≥1 ( 1, 0, si x ∈ [0, 1], si x ∈ ]1, 2], est une fonction scs mais pas sci en x = 1. La semi-continuité inférieure (resp., supérieure) peut aussi être caractérisée par la limite inférieure (resp., supérieure). 26 Chapitre 2. Existence, convexités et convexification Définition 4.2. Pour une fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞}) déf déf lim inf f (x) = sup inf f (x) resp., lim sup f (x) = inf sup x→a ε>0 x6=a kx−ak<ε ε>0 x→a x6=a kx−ak<ε f (x) . Théorème 4.3. La fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞}) est sci (resp., scs) en a si et seulement si lim inf f (x) ≥ f (a) resp., lim sup f (x) ≤ f (a) . (4.5) x→a x→a Démonstration. (⇒) Si f est sci en a, pour tout h < f (a), il existe un voisinage V (a) de a tel que pour tout x ∈ V (a), f (x) > h. Comme V (a) est un voisinage de a il existe une boule Bε (a), ε > 0, tel que Bε (a) ⊂ V (a) et ∀x ∈ Bε (a), f (x) > h ⇒ inf x∈Bε (a) x6=a f (x) ≥ h ⇒ sup inf ε>0 x∈Bε (a) x6=a f (x) ≥ h. L’inégalité étant vraie pour tout h < f (a), on peut faire tendre h vers f (a) : lim inf f (x) ≥ h x→a ⇒ lim inf f (x) ≥ f (a). x→a (⇐) Pour tout h tel que f (a) > h, on a par hypothèse lim inf f (x) = sup inf x→a ε>0 x∈Bε (a) x6=a f (x) ≥ f (a) > h. Par définition du sup, pour ce h, il existe ε0 > 0 tel que sup inf ε>0 x∈Bε (a) x6=a f (x) ≥ inf x∈Bε0 (a) x6=a f (x) > h ⇒ ∀x ∈ Bε0 (a), f (x) > h. Comme Bε0 (a) est un voisinage de a, f est sci en a. On a comme corollaire la caractérisation suivante de l’épigraphe. Définition 4.3. L’épigraphe d’une fonction f : Rn → R ∪{+∞} est l’ensemble déf épi f = {(x, µ) ∈ Rn × R : x ∈ dom f et µ ≥ f (x)} . (4.6) L’épigraphe épi f est non vide si et seulement si dom f 6= ∅, c’est-à-dire, lorsque f est propre pour l’infimum. 4. Semi-continuités inférieure et supérieure 27 Lemme 4.2. La fonction f : Rn → R ∪{+∞} est sci dans Rn si et seulement si son épigraphe épi f est fermé dans Rn × R. Remarque 4.2. Cependant, le domaine effectif dom f d’une fonction f sci n’est pas nécessairement fermé, comme le montre l’exemple de la fonction f (x) = 1/|x| si x 6= 0 et +∞ si x = 0, où dom f = R \{0}. Démonstration. Si f est sci dans Rn , considérons une suite de Cauchy (xn , µn ) ∈ épi f . On a donc µn ≥ f (xn ) et il existe (x, µ) ∈ Rn × R tel que xn → x et µn → µ. Comme f est sci dans Rn , µ = lim µn = lim inf µn ≥ lim inf f (xn ) ≥ f (x), n→∞ n→∞ n→∞ x ∈ dom f , et (x, µ) ∈ épi f . L’épigraphe de f est donc fermé dans Rn × R. Réciproquement, supposons que épi f est fermé dans Rn × R. Soient x ∈ Rn et h < f (x). Le point (x, h) ∈ / épi f . Il existe donc un voisinage W (x, h) tel que W (x, h) ∩épi f = ∅. En particulier, il existe un voisinage V (x) de x tel que V (x) × {h} ⊂ W (x, h) et donc pour tout y ∈ V (x), f (y) > h et f est sci dans Rn . On donne maintenant un certain nombre de caractérisations de la semi-continuité en préparation du Théorème 5.1. f (x) f (a) h x a Gh Figure 2.2. Exemple d’une fonction semi-continue inférieurement. Lemme 4.3. Soit f : Rn → R ∪{+∞}. Les conditions suivantes sont équivalentes : (i) f est sci dans Rn . 28 Chapitre 2. Existence, convexités et convexification (ii) ∀h ∈ R, Gh = {x ∈ Rn : f (x) > h} est ouvert dans Rn (voir la Figure 2.2). (iii) ∀h ∈ R, Fh = {x ∈ Rn : f (x) ≤ h} est fermé dans Rn . Démonstration. (i) ⇒ (ii). Si Gh = ∅, Gh est ouvert. Si Gh 6= ∅, pour tout a ∈ Gh , on a f (a) > h et, comme f est sci en a, il existe un voisinage V (a) de a tel que ∀x ∈ V (a), f (x) > h ⇒ V (a) ⊂ Gh . Donc a ∈ int Gh et Gh est ouvert. (ii) ⇒ (i). Soit a ∈ Rn et h tel que f (a) > h. Par défintion de Gh , a ∈ Gh . Comme Gh est ouvert, c’est un voisinage de a et, pour tout x ∈ Gh , on a f (x) > h. Par définition, f est donc sci en a et, a fortiori, en tout point de Rn . (ii) ⇐⇒ (iii) est évident. L’utilisation de ces lemmes pour une fonction f : U → R ∪{+∞} sci dans un sous-ensemble U de Rn nécessite le lemme suivant. Lemme 4.4. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞}. Les conditions suvantes sont équivalentes : (i) f est sci dans U . (ii) fU est sci dans Rn . (iii) ∀h ∈ R, Gh = {x ∈ Rn : fU (x) > h} est ouvert dans Rn . (iv) ∀h ∈ R, Fh = {x ∈ U : f (x) ≤ h} est fermé dans Rn . En particulier, pour tout h {x ∈ Rn : fU (x) ≤ h} = {x ∈ U : f (x) ≤ h}. (4.7) Démonstration. (i) ⇒ (ii) Du Lemme 4.1. (ii) ⇒ (i) Si fU est sci dans Rn , sa restriction f = fU |U is sci dans U . (ii) ⇔ (iii). Par le Lemme 4.3. (iii) ⇔ (iv). Par le Lemme 4.3, la condition (iii) est équivalente à : ∀h ∈ R, {x ∈ Rn : fU (x) ≤ h} est fermé dans Rn . Il suffit alors de remarquer que, puisque fU (x) = +∞ pour tout x ∈ Rn \U , on a {x ∈ Rn : fU (x) ≤ h} = {x ∈ U : fU (x) ≤ h} = Fh . Ceci permet de travailler dans Rn plutôt que dans U . Exemple 4.3. La fonction indicatrice d’une partie fermée U de Rn ( 0, si x ∈ U, déf IU (x) = + ∞, si x ∈ / U, est sci dans tout Rn . En fait IU = fU pour la fonction x 7→ f (x) = 0 : Rn → R. 5. Existence de points minimisants dans U 29 Pour compléter ce paragraphe, on donne la définition de ≪lower semi-continuous hull ≫ d’une fonction f , dénotée cl f suivant la terminologie ≪closure ≫ de R. T. Rockafellar [1]. Elle correspond à la définition de la régularisée sci que l’on retrouve dans I. Ekeland et R. Temam [1]. Définition 4.4. (i) La régularisée sci d’une fonction f : Rn → R ∪{+∞} est l’enveloppe supérieure des fonctions sci inférieures ou égales à f déf cl f (x) = sup g(x). (4.8) g sci et g≤f dans Rn S’il existe g sci dans Rn tel que g ≤ f dans Rn , cl f est sci dans Rn . Sinon, on pose cl f (x) = −∞ par convention. (ii) La régularisée scs d’une fonction f : Rn → R ∪{−∞} est définie comme l’enveloppe inférieure des fonctions scs supérieures ou égales à f cl scs f (x) déf = inf g scs et f ≤g dans Rn g(x). S’il existe g scs dans Rn tel que f ≤ g dans Rn , cl Sinon, on pose cl scs f (x) = +∞ par convention. Noter que la définition de la régularisée scs revient à cl 5 5.1 scs f (4.9) scs f est scs dans Rn . = −cl (−f ). Existence de points minimisants dans U U compact On peut maintenant affaiblir les hypothèses du théorème de Weierstrass (Théorème 2.1) en séparant la recherche de l’infimum de celle du supremum. Théorème 5.1. Soit U , ∅ 6= U ⊂ Rn , compact. (i) Si f : U → R ∪{+∞} est sci dans U , alors ∃a ∈ U tel que f (a) = inf f (U ). (5.1) Si U ∩ dom f 6= ∅, alors inf f (U ) ∈ R. (ii) Si f : U → R ∪{−∞} est scs dans U , alors ∃b ∈ U tel que f (b) = sup f (U ). (5.2) Si U ∩ dom f 6= ∅, alors sup f (U ) ∈ R. En particulier, argmin f (U ) = ∩k>inf f (U) Fk , où Fk = {x ∈ U : f (x) ≤ k}. Comme U est compact, il est fermé. Par le Lemme 4.4, on pourra utiliser la fonction fU qui est sci dans tout Rn sans changer l’infimum puisque inf f (U ) = inf fU (Rn ) par le Théorème 3.2. Pour le supremum de f : U → R ∪{−∞} scs dans U fermé, la fonction f U définie en (3.7) de la Remarque 3.1 est scs dans Rn . 30 Chapitre 2. Existence, convexités et convexification Démonstration du Théorème 5.1. Soit m = inf f (U ). Comme U est compact, il est fermé. Par le Lemme 4.4 la fonction fU associée à f définie par (3.5) est sci dans tout Rn et par le Théorème 3.2 on a m = inf f (U ) = inf fU (U ) = inf fU (Rn ). Si m = +∞, alors f est identiquement égale à +∞ dans U et tous les points de U sont minimisants. Si m < +∞, alors pour tout réel k > m, l’ensemble Fk = {x ∈ U : f (x) ≤ k} = {x ∈ Rn : fU (x) ≤ k} est fermé par la sci de fU dans Rn (Lemme 4.4) et l’ensemble ∁Fk = {x ∈ Rn : fU (x) > k} = ∁U ∪ {x ∈ U : f (x) > k} est ouvert. Fk est aussi non vide puisque par définition du inf, pour tout k tel que m < k, il existe f (x) ∈ f (U ) tel que m = inf f (U ) ≤ f (x) < k. On veut montrer que ∩k>m Fk 6= ∅. On procède par contradiction. Si cette intersection est vide, alors Rn = ∁ [∩k>m Fk ] = ∪k>m ∁Fk ⇒ U ⊂ Rn = ∪k>m ∁Fk . La famille {∁Fk : m < k} est donc un recouvrement ouvert du compact U . Par définition de la compacité, il existe un sous-recouvrement fini of U U ⊂ ∪ℓj=1 ∁Fkj ⇒ ⇒ U = U ∩ ∪ℓj=1 ∁Fkj = ∪ℓj=1 U \Fkj ∀x ∈ U, f (x) = fU (x) > min{k1 , . . . , kℓ } > m ⇒ inf f (U ) ≥ min{k1 , . . . , kℓ } > m = inf f (U ). Ceci contredit la comjecture que l’intersection des {Fk : k > m} est vide. Puisque ∩k>m Fk 6= ∅, tout élément a ∈ ∩k>m Fk ⊂ U , appartient à U et ∀k > m, f (a) ≤ k ⇒ f (a) ≤ m = inf f (x) ≤ f (a) x∈U en laissant k tendre vers m. Le point a dans U est un point minimisant ainsi que tous les points dans l’intersection des Fk : argmin f (U ) = ∩k>m Fk . Il est important d’observer que, en général, on ne peut remplacer l’infimum par rapport à U par l’infimum par rapport à sa fermeture U même si f est sci. On n’a seulement que inf f (U ) ≥ inf f (U ) comme le montre l’exemple suivant. 5. Existence de points minimisants dans U | 1 31 0 | −1 0 1 Figure 2.3. Fonction sci, mais pas scs en 0. Exemple 5.1. Soient U = [−1, 1]\{0} et la fonction sci ( 1, f (x) = 0, si x 6= 0, si x = 0. Alors U = [−1, 1] et inf f (U ) = 1 > 0 = inf f (U ). De plus, f n’est pas scs en 0. En effet, pour 1/2 > 0 = f (0) l’ensemble {x ∈ [−1, 1] : f (x) < 1/2} = {0} n’est pas un voisinage de 0. On a cependant la condition suffisante suivante. Théorème 5.2. Soient U , ∅ 6= U ⊂ Rn , et f : U → R scs dans U . Alors inf f (U ) = inf f (U ). Démonstration. Comme U ⊂ U , on a inf f (U ) ≤ inf f (U ). Comme U 6= ∅ les deux inf sont bornés supérieurement. Si inf f (U ) = −∞, alors inf f (U ) = −∞ et le résultat est vrai. Si inf f (U ) est fini, supposons que inf f (U ) < inf f (U ). Par définition de inf f (U ), il existe x0 ∈ U tel que inf f (U ) ≤ f (x0 ) < inf f (U ). 32 Chapitre 2. Existence, convexités et convexification Comme f est scs, il existe un voisinage V (x0 ) de x0 tel que ∀x ∈ U ∩V (x0 ), f (x) < inf f (U ). Mais x0 ∈ U est un point d’adhérence de U pour lequel on a V (x0 ) ∩ U 6= ∅. Il existe donc u ∈ U tel que f (u) < inf f (U ). Mais ceci est une contradiction et inf f (U ) = inf f (U ). 5.2 U fermé mais pas nécessairement borné Par le Théorème 5.1 on peut maintenant dire que les fonctions de la Figure 2.1 possèdent au moins un point minimisant dans le compact U = [0, 1] de R. Cependant, dans sa forme présente, ce théorème est encore quelque peu restrictif car il ne nous permet pas de traiter le cas simple suivant déf inf f (Rn ), f (x) = kxk2 , x ∈ Rn . La difficulté provient du fait que l’ensemble Rn n’est pas borné et donc pas compact. Remarque 5.1. En analysant la démonstration du théorème précédent, on s’aperçoit que l’on a pas vraiment besoin de la compacité de U . Puisque les parties fermés Fk de U forment une suite croissante Fk1 ⊂ Fk2 ⊂ U, ∀k2 ≥ k1 > m, alors, pour tout k̄ > m, ∩k̄≥k>m Fk = ∩k>m Fk . Il suffit donc de trouver un k̄ ∈ R pour lequel la section inférieure Fk̄ = {x ∈ U : f (x) ≤ k̄} soit non vide et bornée (donc compacte 5 au lieu de faire l’hypothèse sur U . Définition 5.1. Soit U une partie non vide de Rn . (i) La fonction f : U → R ∪{+∞} est à section inférieure bornée dans U s’il existe k ∈ R tel que la section inférieure Fk = {x ∈ U : f (x) ≤ k} (5.3) soit non vide et bornée. (ii) La fonction f : U → R ∪{−∞} est à section supérieure bornée dans U s’il existe k ∈ R tel que la section supérieure déf F k = {x ∈ U : f (x) ≥ k} (5.4) soit non vide et bornée. Lorsque U est une partie non vide compacte de Rn (c’est-à-dire, bornée et fermée), alors toute fonction f propre pour l’infimum est à section inférieure bornée dans U . 5. En dimension finie, un ensemble est compact si et seulement si il est borné et fermé par le théorème de Heine-Borel (Théorème 4.2 du Chapitre 1). 5. Existence de points minimisants dans U 33 Théorème 5.3. Soit U une partie non vide et fermée de Rn . (i) Si f : U → R ∪{+∞} est une fonction sci dans U et à section inférieure bornée dans U , alors ∃a ∈ U tel que f (a) = inf f (U ) ∈ R . (5.5) (ii) Si f : U → R ∪{−∞} est une fonction scs dans U et à section supérieure bornée dans U , alors ∃b ∈ U tel que f (b) = sup f (U ) ∈ R . (5.6) Exemple 5.2 (fonction distance). Soit U , ∅ 6= U ⊂ Rn , fermé et x ∈ Rn . On veut montrer qu’il existe x̂ ∈ U tel que déf dU (x) = inf kx − yk = kx − x̂k y∈U (5.7) et ∀x1 , x2 ∈ Rn , |dU (x2 ) − dU (x1 )| ≤ kx2 − x1 k. (5.8) On considère l’infimum inf f (y), y∈U déf f (y) = ky − xk. La fonction f est continue et donc sci dans Rn . Soient y0 ∈ U et k = ky0 − xk. La section inférieure déf Fk = {y ∈ U : ky − xk ≤ k} est non vide puisque y0 ∈ Fk et bornée puisque ∀y ∈ Fk , kyk ≤ kxk + ky − xk ≤ kxk + ky0 − xk ≤ kxk + k. La fonction f est donc à section inférieure bornée dans U . Par le Théorème 5.3 (i), il existe un point minimisant x̂ ∈ U . Pour tout y ∈ U kx2 − yk ≤ kx1 − yk + kx2 − x1 k n ⇒ ∀x1 , x2 ∈ R , ⇒ inf kx2 − yk ≤ inf kx1 − yk + kx2 − x1 k y∈U y∈U dU (x2 ) − dU (x1 ) ≤ kx2 − x1 k. En interchangeant les rôles de x1 et x2 , on obtient |dU (x2 ) − dU (x1 )| ≤ kx2 − x1 k. Exemple 5.3 (fonction distance). Soit U , ∅ 6= U ⊂ Rn , pas nécessairement fermé et x ∈ Rn . Comme dans l’exemple précédent on définit déf dU (x) = inf kx − yk. y∈U (5.9) Comme U ⊂ U , on a dU (x) ≥ dU (x). Cependant, comme la fonction y 7→ ky − xk est continue, elle est scs et par le Théorème 5.2, dU (x) = dU (x). 34 5.3 Chapitre 2. Existence, convexités et convexification Condition de croissance à l’infini La simple croissance vers +∞ de la fonction lorsque la norme kxk tend vers l’infini entraı̂ne la propriété de section inférieure bornée. Définition 5.2. Soient U , ∅ 6= U ⊂ Rn , non bornée et f : U → R ∪{+∞}. La fonction f est croissante à l’infini dans U si lim x∈U, kxk→∞ f (x) = +∞. Théorème 5.4. Soit U , ∅ 6= U ⊂ Rn , non-bornée. Si f : Rn → R ∪{+∞} est croissante à l’infini dans U et si dom f ∩ U 6= ∅, elle est à section inférieure bornée dans U . Démonstration. Nous allons démontrer qu’il existe un k ∈ R tel que la section Fk = {x ∈ U : f (x) ≤ k} soit bornée et non vide. Comme dom f ∩ U 6= ∅, pour x ∈ dom f ∩ U , posons k = f (x). La section Fk n’est donc pas vide. Par hypothèse de croissance à l’infini dans U , ∃R(k) > 0 tel que ∀x ∈ U et kxk > R(k), f (x) > k. On en conclut que Fk = {x ∈ U : f (x) ≤ k} ⊂ {x ∈ U : kxk ≤ R(k)} et que Fk est non vide et borné. Considérons quelques exemples génériques. Exemple 5.4. Les fonctions f (x) = |x| et f (x) = x2 sont croissantes à l’infini dans R. Exemple 5.5. La fonction f (x) = x − b n’est pas croissante à l’infini dans R. En effet, il suffit de prendre la suite xn = −n pour les entiers positifs n tendant vers l’infini. Exemple 5.6. La fonction f (x) = sin x + (1 + x)2 est croissante à l’infini dans R. En effet f (x) ≥ −1 + (1 + x)2 = x2 − 2x → +∞ lorsque |x| → ∞. 5. Existence de points minimisants dans U 35 Exemple 5.7. Soit la fonction f (x1 , x2 ) = (x1 + x2 )2 . Alors f n’est pas croissante à l’infini dans R2 . Il suffit de prendre la suite {(n, −n)}, n ≥ 1, f (n, −n) = (n − n)2 = 0 6→ +∞. Cependant, f est croissante à l’infini dans U = {(x1 , 0) : x1 ∈ R} car f (x) = x21 → +∞ lorsque |x1 | tend vers +∞ dans U . Théorème 5.5. Les fonctions x 7→ f (x) = kx − akp , p ≥ 1, sont croissantes à l’infini dans Rn (a ∈ Rn est fixé). Démonstration. En effet, on peut écrire p x a f (x) = kxkp − kxk kxk . Lorsque kxk → ∞ le terme x a − kx | kxk converge vers 1 et donc sa puissance p converge aussi vers 1. Pour p ≥ 1, kxkp → +∞ lorsque kxk tend vers +∞. La limite de f (x) est le produit des deux limites. Pour l’exemple suivant, on aura besoin du lemme suivant pour les applications linéaires définies positives (voir la Définition 4.13 du Chapitre 1). Lemme 5.1. Une matrice symétrique A est définie positive si et seulement si ∃α > 0, ∀x ∈ Rn , (Ax) · x ≥ αkxk2 . Dans ce cas, ∀x ∈ Rn , kAxk ≥ αkxk et l’inverse A−1 est aussi définie positive. Démonstration. (⇐) S’il existe α > 0 tel que ∀x ∈ Rn , alors ∀x ∈ Rn , x 6= 0, (Ax) · x ≥ αkxk2 , (Ax) · x ≥ αkxk2 > 0 36 Chapitre 2. Existence, convexités et convexification et A > 0. (⇒) Dans l’autre sens si A > 0, alors ∀x ∈ Rn , (Ax) · x ≥ 0. Supposons qu’il n’existe pas de α > 0 tel que ∀x ∈ Rn , (Ax) · x ≥ αkxk2 . Alors pour tout entier k > 0, il existe xk tel que 0 ≤ Axk · xk < 1 kxk k2 k ⇒ xk 6= 0. On peut alors diviser par kxk k2 ce qui donne 0≤A xk xk 1 · < kxk k kxk k k ⇒ lim A k→∞ xk xk · = 0. kxk k kxk k Les points sk = xk /kxk k appartiennent à la sphère S = {x ∈ Rn : kxk = 1} qui est compacte dans Rn . Par le théorème de Bolzano–Weierstrass (Théorème 4.3, Chapitre 1), il existe une sous-suite {skℓ } de {sk } qui converge vers un point s de S: ∃s, ksk = 1 tel que 0 = lim Askℓ · skℓ = As · s. ℓ→∞ Donc ∃s 6= 0 tel que As · s = 0 =⇒ A ≯ 0. Ceci contredit l’hypothèse que A > 0. D’où le résultat. Pour montrer que A est inversible, il suffit de vérifier que sous l’hypothèse A > 0, l’application linéaire A : Rn → Rn est injective. Ceci revient à montrer que Ax = 0 entraı̂ne x = 0. En utilisant le résultat que nous venons de démontrer, on vérifie facilement les implications suivantes Ax = 0 ⇒ 0 = Ax · x ≥ α kxk2 ⇒ x = 0. En particulier, pour x 6= 0, kAxk kxk ≥ Ax · x ≥ α kxk2 ⇒ kAxk ≥ αkxk. Enfin, comme ∀y ∈ Rn , A−1 y · y = A−1 y · A(A−1 y) ≥ αkA−1 yk2 ≥ 0, A−1 est semi-définie positive. De plus, comme A−1 est injective, 0 = A−1 y · y ≥ αkA−1 yk2 et A−1 est définie positive. ⇒ A−1 y = 0 ⇒ y=0 5. Existence de points minimisants dans U 37 Exemple 5.8. Soit A une matrice n × n symétrique tel que A > 0. On associe à A et à un vecteur arbitraire b de Rn la fonction numérique suivante 6 f (x) = 1 (Ax) · x + b · x, x ∈ Rn . 2 Par le Lemme 5.1 appliqué à la matrice A, il existe α > 0 tel que ∀x ∈ Rn , Ax · x ≥ αkxk2 . Il vient f (x) = 1 (Ax) · x + b · x 2 =⇒ f (x) ≥ 1 αkxk2 − kbk kxk 2 et la fonction f est croissante à l’infini dans Rn . Comme f est polynômiale, elle est continue et comme U = Rn est fermé, on a l’existence d’un point minimisant. 5.4 Quelques propriétés de l’ensemble des points minimisants Revenons à l’infimum de f par rapport à U , ∅ 6= U ⊂ Rn . Dans la démonstration du Théorème 5.1, on vu que que, pour f : U → R ∪{+∞}, l’ensemble des points minimisants de f par rapport à U est donné par argmin f (U ) = \ k>m Fk , où m = inf f (U ) et Fk = {x ∈ U : f (x) ≤ k}. On peut donc déduire certaines propriétés de argmin f (U ) de celles des Fk . En utilisant le fait que, pour U fermé, les sections inférieures {Fk } d’une fonction f sci sont fermées, on obtient que argmin f (U ) est fermé en tant qu’intersection d’une famille de fermés par l’dentité (5.4). Si, de plus, f est à section inférieure bornée, alors il existe k0 tel que la section Fk0 soit non vide et bornée. Fk0 est donc compact car il est aussi fermé. Comme m est l’infimum et que Fk0 est non vide, argmin f (U ) ⊂ Fk0 . On a donc argmin f (U ) = \ k>m Fk ⊂ Fk0 et l’ensemble argmin f (U ) est compact comme sous-ensemble fermé du compact Fk0 . On peut alors énoncer le résultat suivant. Théorème 5.6. Soient U , ∅ 6= U ⊂ Rn , fermé et f : U → R ∪{+∞} sci dans U . Alors, argmin f (U ) est fermé (possiblement vide). Si, en plus, f est à section inférieure bornée dans U alors argmin f (U ) est compact et non vide. 6. Si un vecteur v ∈ Rn est considéré comme une matrice n × 1, on peut écrire le produit (Ax) · x comme le produit de trois matrices x⊤ Ax et b · x comme le produit de deux matrices b⊤ x. 38 Chapitre 2. Existence, convexités et convexification Démonstration. Puisque U est fermé et que f est sci, les sections inférieures {Fk } en (5.4) sont fermées et argmin f (U ), en tant qu’intersection de fermés est fermée. Si, en plus, f est à section inférieure bornée (il existe k0 tel que Fk0 soit non vide et bornée) le fermé Fk0 est compact. L’ensemble des minimisants \ argmin f (U ) = Fk ⊂ Fk0 k>m est donc compact en tant que partie bornée d’un compact Fk0 . Exemple 5.9. On revient aux Exemples 5.2 et 5.3 pour U , ∅ 6= U ⊂ Rn . Pour x ∈ Rn , on a montré que dU (x) = dU (x) et que ∃x̂ ∈ U tel que dU (x) = inf kx − yk = kx − x̂k. (5.10) y∈U Pour ce faire on a considéré l’infimum de la distance inf f (y), y∈U déf f (y) = ky − xk. On a montré que f est continue et à section inférieure bornée dans U . Par le Théorème 5.6, argmin f (U ) est non vide et compact. Les points de argmin f (U ) sont les projections de x sur U . On désignera par ΠU (x) cet ensemble. Si x ∈ U , alors ΠU (x) = {x} est un singleton. 6 ◮ Principe variationnel d’Ekeland Le principe variationnel d’Ekeland 7 en 1974 (I. Ekeland [1]) est un outil fondamental pour l’existence de points minimisants approchés en l’absence de compacité. Son impact majeur est dans le contexte d’espaces fonctionnels. On en donne ici une version en dimension finie ainsi que quelques unes de ses ramifications. Théorème 6.1. Soit f : Rn → R ∪{+∞}, dom f 6= ∅, une fonction sci et bornée inférieurement. Alors, pour tout ε > 0, il existe xε tel que inf f (x) ≤ f (xε ) < infn f (x) + ε x∈Rn x∈R (6.1) et, pour tout η > 0, il existe y (qui dépend de ε) tel que ky − xε k < η, f (y) ≤ f (xε ) − ε ky − xε k η (6.2) ε ky − xk. η (6.3) et ∀x ∈ Rn , x 6= y, 7. Ivar Ekeland (1944– ). f (y) < f (x) +