4 Quelques révisions d`analyse classique

publicité
4. Quelques révisions d’analyse classique
5
à deux joueurs de somme nulle ainsi qu’avec les problèmes primal et dual de Fenchel
du Chapitre 2. Une forme générale du lemme de Farkas est donnée en préparation
du chapitre suivant. Les constructions et les résultats sont étendus au problème
d’optimisation quadratique et aux fonctions objectif Fréchet différentiables. À la fin
de ce chapitre, on donne un aperçu de l’optimisation via les sous-différentielles qui
font appel à l’analyse multivoque.
Le chapitre 5 traite de l’optimisation différentiable par rapport à un ensemble de points admissibles spécifié par un nombre fini de fonctions de contrainte
différentiables. En utilisant la condition nécessaire duale d’optimalité, on retrouve
le Théorème des multiplicateurs de Lagrange pour les contraintes de type égalité, le
Théorème de Karush-Kuhn-Tucker pour celles de type inégalité, et enfin le théorème
général pour le cas mixte de contraintes de types égalité et inégalité.
4
Quelques révisions d’analyse classique
Ce paragraphe réunit de façon très compacte quelques éléments de base d’analyse classique dont on aura besoin dans les autres chapitres. Ils proviennent de
plusieurs sources (par exemple, entre autres, W. H. Fleming [1], W. Rudin [1],
ou L. Schwartz [1]). Le calcul différentiel ne nécessite pas de prérequis car il sera
complètement traité au Chapitre 3. Les différentes notions de convexité dont on aura
besoin seront introduites dans chaque chapitre, mais le lecteur peut aussi consulter
des ouvrages spécifiquement consacrés à ce sujet comme, par exemple, F. A. Valentine [1], R. T. Rockafellar [1], L. D. Berkovitz [1], S. R. Lay [1],
H. Tuy [1], S. Boyd et L. Vandenberghe [1].
4.1
Plus petite borne supérieure et plus grande borne inférieure
Soient R l’ensemble des nombres réels et |x| la valeur absolue de x. Les notations suivantes seront utilisées pour les réels positifs et les réels strictement positifs
déf
R+ = {x ∈ R : x ≥ 0}
et
déf
R+ = {x ∈ R : x > 0}
et la notation R = R ∪{±∞} pour l’ensemble étendu des réels.
Définition 4.1.
Soit A une partie non vide de R.
a) On dit que b0 ∈ R est une plus petite borne supérieure de A si
i) b0 est une borne supérieure de A,
ii) pour toute borne supérieure M de A, on a b0 ≤ M .
La plus petite borne supérieure b0 de A est unique et sera notée sup A. Si
A n’est pas borné supérieurement, on pose sup A = +∞.
b) On dit que b0 ∈ R est une plus grande borne inférieure de A si
i) b0 est une borne inférieure de A,
ii) pour toute borne inférieure m de A, on a b0 ≥ m.
6
Chapitre 1. Introduction
La plus grande borne inférieure b0 de A est unique et sera notée inf A. Si
A n’est pas borné inférieurement, on pose inf A = −∞.
Remarque 4.1.
(i) Lorsque A 6= ∅, on a donc toujours −∞ ≤ inf A ≤
sup A ≤ +∞. Par définition, sup A ∈ R si et seulement si A est borné
supérieurement et inf A ∈ R si et seulement si A est borné inférieurement.
(ii) Lorsque A = ∅, on écrira sup A = −∞ et inf A = +∞. À première vue,
il peut paraı̂tre choquant d’avoir sup A < inf A, mais, d’un point de vue
mathématique, il s’agit du bon choix puisque sup A < inf A si et seulement
si A = ∅ ou, de façon équivalente, sup A ≥ inf A si et seulement si A 6=
∅.
On utilisera souvent les conditions équivalentes suivantes.
Théorème 4.1. Soit ∅ 6= A ⊂ R.
a) b0 est la plus petite borne supérieure de A si et seulement si
i) b0 est une borne supérieure de A,
ii’) pour tout M tel que b0 > M , il existe x0 ∈ A tel que b0 ≥ x0 > M .
b) b0 est la plus grande borne inférieure de A si et seulement si
i) b0 est une borne inférieure de A,
ii’) pour tout m tel que b0 < m, il existe x0 ∈ A tel que b0 ≤ x0 < m.
c) sup A = +∞ si et seulement si, pour tout M ∈ R, il existe x0 ∈ A tel que
x0 > M .
d) inf A = −∞ si et seulement si, pour tout m ∈ R, il existe x0 ∈ A tel que
x0 < m.
4.2
Espace euclidien
La plupart des résultats de ce livre demeurent vrais dans des espaces vectoriels
de fonctions ou dans des groupes de transformations de dimension infinie. Dans ce
livre on se limitera aux espaces vectoriels de dimension finie qui seront identifiés
au produit cartésien Rn . Par exemple, ces espaces incluent l’espace des polynômes
d’ordre inférieur ou égal à n − 1, n ≥ 1, un entier. Dans ce paragraphe on rappelle
quelques définitions, notions et théorèmes de l’analyse classique.
4.2.1
Produit cartésien, boules, et continuité
Pour un entier n ≥ 1, soit
Rn = R × . . . × R
|
{z
}
n fois
(4.1)
4. Quelques révisions d’analyse classique
7
le produit cartésien de dimension n avec les notations suivantes
un élément
la norme
x = (x1 , . . . , xn ) ∈ Rn
déf
kxkRn =
"
n
X
i=1
x2i
#1/2

x1
 
ou sous forme matricielle ~x =  ... 

xn
et le produit scalaire x · y n xi yi .
(4.2)
On écrira simplement kxk pour la norme lorsque le contexte le permettra et la
flèche sur le vecteur ~x sera souvent omise. Pour n = 1, kxkR1 coı̈ncide avec la valeur
absolue |x|. Rn muni de la multiplication par un scalaire et de l’addition
∀α ∈ R, x ∈ Rn , α x = (αx1 , . . . , αxn )
∀x, y ∈ Rn , x + y = (x1 + y1 , . . . , xn + yn )
est un espace vectoriel sur R de dimension n.
Définition 4.2.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} défini
par
(
1,
si i = j
déf
déf
(eni )j = δij , δij =
0,
si i 6= j,
c’est-à-dire,
en1 = (1, 0, 0, . . . , 0, 0),
en2 = (0, 1, 0, . . . , 0, 0),
...,
enn = (0, 0, 0, . . . , 0, 1).
En particulier, eni · enj = δij .
Lorsque le contexte le permet, on écrira simplement {ei } sans l’indice n.
On appelle espace euclidien un espace vectoriel E que l’on peut identifier à Rn
via une bijection linéaire pour un entier n ≥ 1. Par exemple, on peut identifier à Rn
l’espace P n−1 [0, 1] des polynômes d’ordre inférieur ou égal à n − 1 dans l’intervalle
[0, 1] :
p 7→ (p(0), p′ (0), . . . , p(n−1) (0)) : P n−1 [0, 1] → Rn
déf
(p0 , p1 , . . . , pn−1 ) 7→ p(x) =
4.2.2
n−1
X
i=0
pi
xi
: Rn → P n−1 [0, 1].
i!
Ensembles ouverts et intérieur
Les notions d’ensemble ouvert et d’ensemble fermé dans Rn peuvent être
définis à l’aide de boules.
8
Chapitre 1. Introduction
Boules centrées en x de rayon r > 0 :
boule ouverte
boule fermée
Br (x) = {y ∈ Rn : ky − xk < r}
Br (x) = {y ∈ Rn : ky − xk ≤ r}.
Boule unité centrée en 0 :
ouverte B = {y ∈ Rn : kyk < 1},
fermée B = {y ∈ Rn : kyk ≤ 1}.
Boule ouverte trouée centrée en x :
Br′ (x) = {y ∈ Rn : 0 < ky − xk < r}.
Définition 4.3.
Soit U une partie de Rn .
(i) a ∈ Rn est un point intérieur de U s’il existe r > 0 tel que Br (a) ⊂ U .
(ii) L’intérieur de U est l’ensemble de tous les points intérieurs de U . On le
notera int U . Par définition int U ⊂ U .
(iii) V (x) est un voisinage de x s’il existe r > 0 tel que Br (x) ⊂ V (x).
(iv) A est un ensemble ouvert de Rn pour tout x ∈ A, il existe un voisinage
V (x) de x tel que V (x) ⊂ A.
(v) La famille T de tous les ouverts dans Rn est la topologie de Rn générée
par la norme.
La topologie T de Rn coı̈ncide avec la famille des intersections finies et des réunions
arbitraires des boules ouvertes dans Rn .
4.2.3
Suite de Cauchy, suite convegente
Définition 4.4.
(i) Une suite {xn } dans Rn est convergente s’il existe un point
n
x ∈ R tel que
∀ε > 0, ∃N, ∀n > N,
kxn − xkRn < ε.
Le point x est unique et appelé le point limite de {xn }.
(ii) {xn } dans Rn est une suite de Cauchy si
∀ε > 0, ∃N, ∀n, m > N,
kxn − xm kRn < ε.
Un espace métrique E est dit complet si toute suite de Cauchy. converge vers un
point de E. Rn est un espace complet.
4. Quelques révisions d’analyse classique
4.2.4
9
Ensemble fermé et adhérence
Les notions de point d’adhérence et d’ensemble fermé peuvent être amenées
de plusieurs façons. On utilise ici les notions de point d’accumulation et de point
isolé.
Définition 4.5.
Soit U une partie de Rn .
(i) a ∈ U est un point isolé de U s’il existe r > 0 tel que Br′ (a) ∩ U = ∅.
(ii) a ∈ Rn est un point d’accumulation de U si, pour tout r > 0, Br′ (a) ∩ U 6=
∅.
Définition 4.6.
(i) a ∈ Rn est un point d’adhérence de U si pour tout r > 0
on a Br (a) ∩ U 6= ∅.
(ii) L’adhérence (ou fermeture) de U est l’ensemble de tous les points d’adhérence
de U . On la notera U .
(iii) F est un ensemble fermé s’il contient tous ses points d’accumulation.
Remarque 4.2.
(i) De façon équivalente, x est un point d’adhérence ou de
la fermeture d’une partie U de Rn si, pour tout voisinage V (x) de x,
V (x) ∩ U 6= ∅.
(ii) L’adhérence de U est égale à l’union de ses points isolés et de ses points
d’accumulation. On a donc U ⊂ U .
(iii) Les seules parties de Rn qui soient à la fois ouvertes et fermées sont l’ensemble vide ∅ et l’espace Rn .
4.2.5
Recouvrement ouvert et ensemble compact
Définition 4.7.
(i) Une famille de parties ouvertes {Gα } de Rn est un recouvrement ouvert de E ⊂ Rn si E ⊂ ∪α Gα .
(ii) Une partie non vide E de Rn est dite compacte si tout recouvrement ouvert
{Gα } de E possède un sous recouvrement fini {Gαi : 1 ≤ i ≤ k}.
Théorème 4.2 (Heine–Borel). Soit E une partie non vide de Rn . Alors E est
compacte si et seulement si E est fermée et bornée. 16 17
Dans un espace vectoriel normé V , une partie compacte E de V est fermée
et bornée, mais la réciproque n’est généralement pas vraie sauf dans des espaces
normés de dimension finie.
On a les équivalences suivantes dans les espaces métriques.
Théorème 4.3 (Bolzano–Weierstrass). Soit un espace métrique (X, d) et un sousensemble E de X. Les propriétés suivantes sont équivalentes. 18 19
16.
17.
18.
19.
Heinrich Eduard Heine (1821–1881).
Félix Edouard Justin Émile Borel (1871–1956).
Bernard Placidus Johann Nepomuk Bolzano (1781–1848).
Karl Theodor Wilhelm Weierstrass (1815–1897) fut le chef de file d’une brillante
10
Chapitre 1. Introduction
(i) E est compact.
(ii) E est séquentiellement compact, c’est-à-dire, toute suite {xn } dans E possède
une sous-suite {xnk } qui converge vers un élément x ∈ E.
(iii) Tout sous-ensemble infini U de E possède (au moins) un point d’accumulation dans E, c’est-à-dire, U ′ ∩ E 6= ∅.
4.2.6
Complément et frontière
Définition 4.8.
Soient A et B deux parties de Rn .
déf
(i) A\B = {x ∈ A : x ∈
/ B}. Lorsque A = Rn on écrira ∁B ou Rn \B et on
dira que ∁B est le complément de B par rapport à Rn .
(ii) La frontière de U ⊂ Rn est définie comme U ∩ ∁U . On la notera ∂U .
On peut vérifier que ∂U = U \int U , et U = int U ∪ ∂U , et ∁U = int ∁U ∪ ∂U .
4.3
4.3.1
Application, fonction, continuité et linéarité
Fonction réelle et fonction vectorielle
Définition 4.9.
Soient n ≥ 1 et m ≥ 1 deux entiers, U , ∅ 6= U ⊂ Rn .
(i) On appele fonction numérique ou fonction réelle toute application f :
U ⊂ Rn → R. On dira aussi fonction réelle d’une variable réelle pour une
fonction f : U ⊂ R → R et fonction réelle de plusieurs variables réelles
pour une fonction f : U ⊂ Rn → R, n ≥ 2.
(ii) On appelera fonction vectorielle toute application f : U ⊂ Rn → Rm pour
un entier m ≥ 2.
4.3.2
Continuité et prolongement continu d’une application
Définition 4.10.
Soient deux entiers n ≥ 1 et m ≥ 1, et U , ∅ 6= U ⊂ Rn . Une application f : U → Rm
est continue en x ∈ U si ∀ε > 0, ∃δ(x) > 0 tel que
∀y ∈ U tel que ky − xkRn < δ(x),
kf (y) − f (x)kRm < ε.
(4.3)
La fonction f est continue sur U si f est continue en tout point de U .
Lorsque U est un sous-ensemble fermé de Rn , il existe toujours un prolongement
continu fˆ : Rn → Rm de cette fonction de U à tout Rn .
Théorème 4.4 (H. Tietze [1], 1915). Soit U , ∅ 6= U ⊂ Rn , fermé. Toute
application continue f : U → Rm possède un prolongement continu de U à tout Rn .
école d’analystes, qui entreprirent la révision systématique des divers secteurs de l’analyse
mathématique.
4. Quelques révisions d’analyse classique
11
Remarque 4.3.
Ce résultat demeure vrai dans un espace métrique arbitraire (X, d), mais il est aussi
vrai dans un espace topologique T4 en faisant appel au Lemme de Uryshohn 20 en
Topologie.
La notion de continuité pour une fonction f : Rn → Rm est implicitement
définie à l’aide de boules ouvertes. En effet, la condition (4.3) de la Définition 4.10
peut s’écrire
∀ε > 0, ∃δ(x) > 0 tel que Bδ(x) (x) ∩ U ⊂ f −1 {Bε (f (x))}
pour les boules ouvertes Bε (f (x)) et Bδ(x) (x). Ceci mêne au critère équivalent suivant en termes de voisinages.
Théorème 4.5. Soit une application f : Rn → Rm pour deux entiers n ≥ 1 et
m ≥ 1. La fonction f est continue en x ∈ Rn si et seulement si pour tout voisinage
W de f (x) dans Rm , f −1 {W } est un voisinage de x dans Rn .
Démonstration. Pour tout voisignage W de f (x) il existe ε > 0 tel que Bε (f (x)) ⊂
W . Si f est continue en x, alors par définition, il existe δ(x) > 0 tel que Bδ(x)) (x) ⊂
f −1 {Bε (f (x))}. Comme f −1 {Bε (f (x))} ⊂ f −1 {W }, f −1 {Bε (f (x))} est donc bien
un voisinage de x par définition. Réciproquement, pour tout ε > 0, la boule ouverte
Bε (f (x)) est un voisinage de f (x). Alors f −1 {Bε (f (x))} est un voisinage de x.
Il existe donc une boule ouverte Bδ(x) (x) de rayon δ(x) > 0 tel que Bδ(x) (x) ⊂
f −1 {Bε (f (x))}. D’où la définition ε-δ de la continuité de f en x.
4.3.3
Application linéaire, application transposée et matrices associées
Définition 4.11.
(i) Une application L : Rn → Rm est linéaire si
∀x, y ∈ Rn , ∀α, β ∈ R,
L(αx + βy) = α L(x) + β L(y).
(4.4)
L’ensemble de toutes les applications linéaires de Rn dans Rm sera dénoté
L(Rn , Rm ).
(ii) Soient n ≥ 1 et m ≥ 1 deux entiers. On dénote par
m
{em
i ∈ R : 1 ≤ j ≤ m}
et {eni ∈ Rn : 1 ≤ i ≤ n}
les bases canoniques orthonormales associées à Rm et Rn , respectivement.
On associe à une application linéaire L : Rn → Rm la m × n matrice {Aij }
déf
n
Aij = em
i · Lej ,
Lx · y =
m X
n
X
Aij xj yi
(4.5)
i=1 j=1
pour x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ). Par convention, on utilisera
souvent la même notation A pour L et sa matrice associée.
20. Pavel Samouilovitch Urysohn (1898-1924).
12
Chapitre 1. Introduction
Théorème 4.6.
(i) Soit f : Rn → R une fonction linéaire pour la norme
euclidienne sur Rn . Il existe un élément unique a ∈ Rn tel que
 
x1
 . 
n
∀x ∈ R , f (x) = a · x = a1 . . . an  ..  (sous forme matricielle),
xn
(4.6)
f est continue et
déf
kf kL(Rn ,R) = sup
x6=0
|f (x)|
= kak.
kxkRn
(4.7)
(ii) Soit L : Rn → Rm une application linéaire pour les normes euclidiennes
sur Rn et Rm . Alors L est continue sur Rn . Il existe une matrice m × n
unique A = {aij } telle que
 



x1
a11 . . . a1n
m
n
X
X


 ..
.
m
.


..
..   ... 
aij xj ei =  .
L(x1 , . . . , xn ) =
 , (4.8)
i=1
j=1
xn
am1 . . . amn
où aij = L(enj ) · em
i , et
déf
kLkL(Rn ,Rm ) = sup
x6=0
kLxkRm
≤ kAk2 ,
kxkRn
déf
kAk2 =

m X
n
X

i=1 j=1
a2ij
1/2


. (4.9)
Remarque 4.4.
kAk2 est appelée norme de Frobenius. 21 L(Rn , Rm ) est un espace de Hilbert pour
le produit scalaire (dit de Frobenius) 22
déf
A·· B =
m X
n
X
i=1 j=1
aij bij ,
kAk2 =
√
A·· A,
(4.10)
des matrices A et B associées à deux éléments L et M de L(Rn , Rm ). Il peut
être identifié à Rmn muni de la norme euclidienne kAk2 . La norme de Frobénius
kAk2 est équivalente mais pas égale à la norme kLkL(Rn ,Rm ) de l’application linéaire
correspondante. L(Rn , Rm ) est seulement un espace de Banach pour la norme
kLkL(Rn ,Rm ) .
Démonstration. (i) Soit une fonction linéaire f : Rn → R. Tout point x ∈ Rn peut
s’écrire
x = (x1 , . . . , xn ) =
n
X
xi ei
i=1
21. Ferdinand Georg Frobenius (1849–1917).
22. On peut montrer que A·· B = tr (A⊤ B) = tr (A B ⊤ ).
4. Quelques révisions d’analyse classique
13
et, par linéarité de f ,
f (x) =
n
X
i=1
xi f (ei ) = x · a,
déf
a = (f (e1 ), . . . , f (en )).
Le vecteur a est unique. Pour tout ε > 0, on prend δ = ε/(kak + 1). De là,
∀y, ky − xk < δ
⇒ |f (y) − f (x)| = |f (y − x)| = |a · (y − x)|
≤ kak ky − xk
< kak δ =
kak
ε < ε.
kak + 1
f est donc continue en tout point de Rn .
Si f est identiquement nulle, on prend a = 0. Sinon, par Cauchy-Schwartz,
pour le produit scalaire
∀x ∈ Rn ,
|f (x)| = |x · a| ≤ kxk kak
⇒ kf kL(Rn ,R) =
sup
06=x∈Rn
|f (x)|
≤ kak.
kxk
Mais, comme f (a/kak) = a·(a/kak) = kak, le supremum est atteint et kf kL(Rn ,R) =
kak.
(ii) On applique (i) à chaque composante fi (x) = ei · f (x) de f : il existe
ai ∈ Rn tel que fi (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque
ai , on forme ainsi la matrice A :

 
 
f1 (x)
a1 · x
a11
 ..   ..   ..
f (x) =  .  =  .  =  .
fn (x)
an · x
Le reste est évident.
|
an1
 
x1
. . . a1n
..   .. .
..
.
.  . 
xn
. . . ann
{z
} | {z }
x
A
L’opération de composition de deux applications linéaires correspond à la multiplication de leurs matrices associées.
Théorème 4.7. Soient trois entiers ℓ, m, n plus grands ou égaux à 1.
(i) La composition L ◦ M de L ∈ L(Rℓ , Rm ) et de M ∈ L(Rn , Rℓ )
M
L
ℓ
m
x 7→ M (x) 7→ L(M (x)) : Rn −→
| R
{z −→} R
L◦M
est un élément de L(Rn , Rm ) et
kL ◦ M kL(Rn ,Rm ) ≤ kLkL(Rℓ ,Rm ) kM kL(Rn ,Rℓ ) .
(4.11)
14
Chapitre 1. Introduction
(ii) Si A est la matrice m × ℓ associée à L et B est la matrice ℓ × n associée à
M , alors la matrice m × n associée à la composition L ◦ M est le produit
déf
(A B)ij =
ℓ
X
aik bkj ,
1 ≤ i ≤ m,
k=1
1 ≤ j ≤ n,
(4.12)
des matrices A et B et
kABk2
kAk2
z
}|
{
}|
{
1/2 z(

)1/2
m
ℓ
m X
n

X
XX
a2ik
(A B)2ij
≤


i=1 k=1
i=1 j=1
(iii) Pour tout A ∈ L(Rn , Rm ),
déf
Ker A = {x ∈ Rn : Ax = 0} ⊂ Rn
kBk2
z
}|
{
1/2

ℓ X
n

X
b2kj
.


(4.13)
k=1 j=1
déf
Im A = {Ax : x ∈ Rn } ⊂ Rm (4.14)
et
sont des sous-espaces linéaires de Rn et de Rm , respectivement.
Démonstration. La composition de deux applications linéaires
A
B
Rn −→ Rmm −→ Rk
{en
j }
{ek
ℓ}
{ei }
correspond à la multiplication de leurs matrices associées. En effet,
x = (x1 , . . . , xn ) =
n
X
xj ′ enj′
j ′ =1
Ax =
n
X
j ′ =1
xj ′ Aenj′ =
m
X
i=1


em
i ·
n
X
j ′ =1

xj ′ Aenj′  em
i
(B ◦ A)(x) = B(Ax) =
m
X
(B ◦ A)ℓj = ekℓ · (B ◦ A)(enj ) =
i=1


m
X
i=1
n
X
j ′ =1


n
m
X
X

 m
n
em
=

i · Aej ′ xj ′  ei
| {z }
i=1
j ′ =1
Aij′

Aij ′ xj ′  Bem
i
=
Aij ekℓ · Bem
| {z i }
Bℓi
m
X
Bℓi Aij .
i=1
On introduit l’application transposée ou adjointe A⊤ : Rm → Rn d’une application linéaire A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax : Rn → R est linéaire. Par le Théorème 4.6 (i), il existe un vecteur
unique a(y) ∈ Rn tel que
∀x ∈ Rn ,
a(y) · x = y · Ax
4. Quelques révisions d’analyse classique
15
et ceci induit une application
déf
y 7→ A⊤ y = a(y) : Rm → Rn
(4.15)
qui est linéaire. En effet, pour tout α, β dans R et y1 , y2 dans Rm , on a
∀x ∈ Rn ,
a(αy1 + βy2 ) · x = (αy1 + βy2 ) · Ax = α y1 · Ax + β y2 · Ax
= α a(y1 ) · x + β a(y2 ) · x
= [α a(y1 ) + β a(y2 )] · x
⇒ a(αy1 + βy2 ) = α a(y1 ) + β a(y2 ).
Par construction, A⊤ vérifie l’identité
∀x ∈ Rn , y ∈ Rm ,
y · Ax = A⊤ y · x.
(4.16)
Définition 4.12.
L’application A⊤ : Rm → Rn associée à une application linéaire A : Rn → Rm telle
que définie par (4.15) est appelée application transposée de A.
n
Si Aij = em
i · Aej est la matrice m × n associée à A pour les bases orthonormales
n
m
n
canoniques {ej : 1 ≤ j ≤ n} et {em
i : 1 ≤ i ≤ m} de R et R , alors la matrice
n × m associée à A⊤ est donnée par (A⊤ )ij = Aji .
On complète l’exposé par les définitions suivantes :
Définition 4.13.
Soit A ∈ L(Rn , Rn ) une application linéaire (matrice n × n).
(i) A est symétrique si A⊤ = A (aji = aij ).
(ii) Une application linéaire symétrique A est définie positive (resp., semidéfinie positive) si
∀x ∈ Rn , x 6= 0,
(Ax) · x > 0 (resp., ∀x ∈ Rn ,
(Ax) · x ≥ 0).
On écrira A > 0 (resp., A ≥ 0).
Définition 4.14.
Soit A ∈ L(Rn , Rn ) et C l’ensemble des nombres complexes :
(i) λ ∈ C est une valeur propre de A s’il existe x ∈ Cn non nul tel que
Ax = λx ; on dira que x ∈ Cn est un vecteur propre de A associé à λ ;
(iii) l’ensemble E(λ) = Ker[A − λI] est un sous-espace linéaire de Cn appelé
espace propre de A associé à la valeur propre λ ;
(iv) si l’espace propre E(λ) associé à la valeur propre λ de A est de dimension
un, on dit que la valeur propre est simple.
Les valeurs propres et l’ensemble des vecteurs propres sont donc donnés par
det[A − λI] = 0 et E(λ) = Ker[A − λI].
n
n
(4.17)
Lorsque A⊤ = A, les valeurs propres λ de A ∈ L(R , R ) sont toutes réelles et
E(λ) ⊂ Rn .
16
5
Chapitre 1. Introduction
Exercices
Exercice 5.1.
Soient n ≥ 1 et m ≥ 1 des entiers et L(Rn , Rm ) l’espace des applications linéaires
A : Rn → Rm . On pose L(Rn ) = L(Rn , Rn ),
déf
Ker A = {x ∈ Rn : Ax = 0} ,
déf
Im A = {Ax : x ∈ Rn } .
(i) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est définie
positive et inversible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de
A.
(ii) Montrer que pour A ∈ L(Rn , Rm ), (A⊤ )⊤ = A, Ker A⊤ = (Im A)⊥ et
Im A⊤ = (Ker A)⊥ , où l’orthogonal U ⊥ d’un sous-ensemble U de Rn est
défini par
déf
U ⊥ = {v ∈ Rn : v · u = 0,
∀u ∈ U }.
Chapitre 2
10
10
8
10
6
10
4
10
2
0
10
0.2
0.4
0
10
1
1
0.8
0.6
0.6
0.4
0.2
0
! 0.2
0.8
! 0.4
! 0.6
! 0.8
!1
1
Existence,
convexités
et convexification
Introduction
Dans ce chapitre, Rn sera le produit cartésien muni du produit scalaire et de
la norme (4.2) du Chapitre 1, f : Rn → R ou R ∪{+∞} une fonction objectif et U
une partie non vide de Rn .
Le Théorème de Weierstrass donne des conditions sur U et f pour lesquelles
il existe des points de U réalisant l’infimum inf f (U ) et le supremum sup f (U ) :
compacité de U et continuité de f dans U . En fait, on peut se limiter au problème
de minimisation, car celui de la maximisation se ramène à celui de la minimisation en
mettant un signe moins devant la fonction objectif. En se restreignant à la recherche
de l’infimum, on peut élargir la classe de fonctions objectif à des fonctions f : Rn →
R ∪{+∞} et l’on pourra relaxer la condition de continuité en une condition de semicontinuité inférieure qui permettra d’obtenir l’existence de points minimisants pour
des fonctions discontinues. Des conditions de croissance à l’infini complèteront les
résultats lorsque U est fermé mais non-borné. En absence de compacité, on donne
aussi le Principe variationnel d’Ekeland et quelques unes de ses ramifications comme
le théorème d’existence de Takahashi et celui de point fixe de Caristi. Tous ces
résultats sont vrais pour des espaces vectoriels de dimension finie et les idées et
constructions de bases se généralisent aux espaces de fonctions.
La dernière partie du chapitre est consacrée à la convexité qui joue un rôle
particulier dans le contexte de la minimisation. Si, en plus,de l’existence, la convexité
de f est stricte on obtient l’unicité du point minimisant. Pour des fonctions objectif
convexes, tous les infima sont globaux et égaux. D’où l’idée de convexifier une
fonction et de rechercher l’infimum de sa convexifiée qui coı̈ncidera avec l’infimum
global de la fonction initiale qui peut avoir plusieurs infima locaux. Ceci mène aux
travaux de Legendre, Fenchel et Rockafellar, à l’introduction de la transformée de
Fenchel–Legendre, aux des problèmes primal et dual, et au Théorème de dualité de
Fenchel que l’on reverra au Chapitre 4 dans le contexte des optimisations linéaire
et quadratique.
17
18
2
Chapitre 2. Existence, convexités et convexification
Théorème d’existence de Weierstrass
Le fait d’avoir inf f (U ) fini ne garantit pas l’existence d’un point a ∈ U qui
réalise l’infimum f (a) = inf f (U ) comme l’illustre l’exemple suivant.
Exemple 2.1.
Soit U = R et la fonction
f (x) = 1 si x ≤ 0 et f (x) = x si x > 0
pour laquelle inf f (U ) = 0 et f (x) 6= 0 pour tout x ∈ U = R.
Ce premier théorème est à la base de la théorie de l’optimisation. Il donne des
conditions suffisantes sur U et f pour l’existence de points de U réalisant l’infimum
inf f (U ) et le supremum sup f (U ).
Théorème 2.1 (de Weierstrass 1 ). Soient U une partie compacte non vide de Rn
et une fonction f : U → R continue sur U . Alors
(i) ∃a ∈ U tel que f (a) = sup f (U ),
(ii) ∃b ∈ U tel que f (b) = inf f (U ).
Démonstration. Voir la démonstration plus loin du Theorème 5.1 sous des hypothèses plus faibles.
Les hypothèses de ce théorème sont un peu trop fortes puisqu’il donne à la fois
l’existence de points minimisants et maximisants. En fait. il suffit de chercher des
conditions d’existence d’un point minimisant de f dans U car tout supremum peut
se ramener à un infimum en observant que sup f (U ) = − inf(−f )(U ) et vice versa.
0
1
0
1
Figure 2.1. Fonctions discontinues ayant un point minimisant dans [0, 1].
On devrait pouvoir relaxer la continuité. En effet, les fonctions numériques
dans U = [0, 1] représentées à la Figure 2.1 ne sont que continues par morceaux,
mais atteignent leur minimum en un point de [0, 1]. Au point de discontinuité on
1. Karl Theodor Wilhelm Weierstrass (1815–1897).
3. Extrema des fonctions à valeurs réelles étendues
19
a choisi comme définition de la fonction la valeur inférieure et non pas la valeur
supérieure qui n’aurait pas donné l’existence d’un point minimisant.
3
Extrema des fonctions à valeurs réelles étendues
Le inf f (U ) et le sup f (U ) ont été définis pour des fonctions à valeurs réelles,
c’est-à-dire, f (U ) ⊂ R. Lorsque l’ensemble f (U ) n’est pas vide et n’est pas borné
inférieurement inf f (U ) = −∞ et lorsque il n’est pas borné supérieurement sup f (U ) =
+∞ (cf. Définition 4.1 et Remarque 4.1 du Chapitre 1).
L’idée d’introduire des fonctions objectif prenant les valeurs +∞ ou −∞ et
l’introduction de leur domaine effectif seraient attribuables à R. T. Rockafellar 2
et à J. J. Moreau. 3 Dans ce chapitre on considère non seulement des fonctions
f : Rn → R à valeurs réelles, mais aussi des fonctions f : Rn → R = R ∪{±∞}
pouvant prendre les valeurs +∞ ou −∞ pour lesquelles il est nécessaire de préciser
les définitions du inf f (U ) et du sup f (U ).
Définition 3.1.
Soient f : Rn → R une fonction et U ⊂ Rn .
(i) On associe à f son domaine effectif
déf
dom f = {x ∈ Rn : −∞ < f (x) < +∞} .
(3.1)
On dira aussi simplement domaine de f .
(ii) L’infimum de f par rapport à U est défini comme suit
(
inf f (U ∩ dom f ),
si f (U ) ⊂ R ∪{+∞},
déf
inf f (U ) =
− ∞,
si ∃x ∈ U tel que f (x) = −∞.
On utilisera aussi la notation inf x∈U f (x).
Le supremum de f par rapport à U est défini comme suit
(
si f (U ) ⊂ R ∪{−∞},
sup f (U ∩ dom f ),
déf
sup f (U ) =
+ ∞,
si ∃x ∈ U tel que f (x) = +∞.
2. Ralph Tyrrell Rockafellar (1935– ). ≪Moreau and I independently in those days at
first, but soon in close exchanges with each other, made the crucial changes in outlook which,
I believe, created convex analysis out of convexity. For instance, he and I passed from the
basic objects in Fenchel’s work, which were pairs consisting of a convex set and a finite
convex function on that set, to extended real-valued functions implicitly having effective domains, for which we moreover introduced set-valued subgradient mappings.≫ R. T. Rockafellar,
http ://www.convexoptimization.com/wikimization/index.php/Rockafellar.
3. Jean Jacques Moreau (1923– ) ≪. . .appears as a rightful heir to the founders of differential
calculus and mechanics through the depth of his thinking in the field of nonsmooth mechanics and
the size of his contribution to the development of nonsmooth analysis. His interest in mechanics
has focused on a wide variety of subjects : singularities in fluid flows, the initiation of cavitation,
plasticity, and the statics and dynamics of granular media. Allied to this is his investment in
mathematics in the fields of convex analysis, calculus of variations and differential measures.≫ (cf.
P. Alart, O. Maisonneuve et R. T. Rockafellar [1]).
20
Chapitre 2. Existence, convexités et convexification
On utilisera aussi la notation supx∈U f (x).
Les infima et suprema forment l’ensemble des extrema de f dans U .
(iii) Lorsqu’il existe a ∈ U tel que f (a) = inf f (U ), on dira que f atteint son
minimum en un point de U et l’on écrira
min f (U ) ou min f (x);
x∈U
L’ensemble des points minimisants de f dans U est dénoté par
déf
argmin f (U ) = {a ∈ U : f (a) = inf f (U )} .
(3.2)
Lorsqu’il existe b ∈ U tel que f (b) = sup f (U ), on dira que f atteint son
maximum en un point de U et l’on écrira
max f (U ) or max f (x)
x∈U
L’ensemble des points maximisants de f dans U est dénoté par
déf
argmax f (U ) = {b ∈ U : f (b) = sup f (U )} .
(3.3)
Comme on considère les extrema de fonctions qui peuvent prendre les valeurs
±∞, il convient de donner la démonstration que tout supremum pour f peut se
ramener à l’infimum pour −f et vice versa.
Théorème 3.1. Soient f : Rn → R ∪{±∞} et U ⊂ Rn .
sup f (U ) = − inf(−f )(U )
et
argmax f (U ) = argmin (−f )(U ).
(3.4)
Démonstration. Si U = ∅, alors f (U ) = ∅. Par convention sup f (U ) = −∞ et
inf(−f )(U ) = +∞, d’où sup f (U ) = −∞ = − inf(−f )(U ). On suppose donc que
U 6= ∅.
On élimine deux cas triviaux. S’il existe x ∈ U tel que f (x) = +∞, alors
sup f (U ) = +∞, −f (x) = −∞ et inf −f (U ) = −∞. Le second cas est f (x) = −∞
pour tout x ∈ U qui implique sup f (U ) = −∞ et, pour tout x ∈ U , −f (x) = +∞
et inf −f (U ) = +∞.
Il reste le cas U 6= ∅ et f : Rn → R ∪{−∞} pour lequel il existe x ∈ U tel
que f (x) > −∞. Donc sup f (U ) > −∞.
(i) Soit b0 = sup f (U ) ∈ R. Par la Définition 4.1 du Chapitre 1, b0 est une
borne supérieure, c’est-à-dire, pout tout x ∈ U , f (x) ≤ b0 , et pour toute borne
supérieure M de f (U ) on a b0 ≤ M . Donc pout tout x ∈ U , −f (x) ≥ −b0 et
−b0 est une borne inférieure de −f (U ) = {−f (x) : x ∈ U }. Soit m une borne
inférieure de −f (U ). Alors, −m est une borne supérieure de f (U ) et comme b0 est
la plus petite borne supérieure on a b0 ≤ −m. De là, −b0 ≥ m et −b0 est la plus
grande borne inférieure de −f (U ). Ceci donne inf −f (U ) = −b0 = − sup f (U ) et
− inf −f (U ) = b0 = sup f (U ).
3. Extrema des fonctions à valeurs réelles étendues
21
(ii) Par la convention de la Remarque 4.1 du Chapitre 1, le cas b0 = sup f (U ) =
+∞ correspond à f (U ) non borné supérieurement. Il existe donc une suite {xn } ⊂ U
tel que f (xn ) → +∞. Ceci entraı̂ne que −f (xn ) → −∞ et l’ensemble −f (U )
n’est pas borné inférieurement. Par convention, inf −f (U ) = −∞. D’où sup f (U ) =
+∞ = − inf −f (U ).
L’introduction de fonctions numériques prenant les valeurs ±∞ permet de
remplacer l’infimum de f par rapport à U par l’infimum par rapport à tout Rn en
introduisant la fonction
)
(
f (x),
si x ∈ U
déf
: Rn → R ∪{±∞}.
(3.5)
x 7→ fU (x) =
+ ∞,
si x ∈ Rn \U
Théorème 3.2. Soient U ⊂ Rn et une fonction f : Rn → R ∪{±∞}. Alors
inf f (U ) = inf fU (U ) = inf fU (Rn )
et
argmin f (U ) = U ∩ argmin fU (Rn ).
Si, en plus, inf f (U ) < +∞, alors argmin f (U ) = argmin fU (Rn ).
Démonstration. S’il existe x ∈ U tel que f (x) = −∞, alors fU (x) = −∞ et, par
définition, inf fU (Rn ) = −∞ = inf f (U ). De plus, inf f (U ) = inf fU (U ) puisque
fU = f dans U . Si f (U ) ⊂ R ∪{+∞}, alors f (U ) = fU (U ) ⊂ fU (Rn ) ⊂ R ∪{+∞}
et dom fU = U ∩ dom f puisque fU (x) = +∞ dans Rn \U et f (x) > −∞ dans U .
Donc
inf f (U ∩ dom f ) = inf f (dom fU ) = inf fU (dom fU ) = inf fU (Rn ∩ dom fU )
et, par définition de inf f (U ), inf fU (U ) et inf fU (Rn ),
inf f (U ) = inf fU (U ) = inf fU (Rn ).
(3.6)
Comme inf f (U ) = inf fU (U ) = inf fU (Rn ) et que U ⊂ Rn , on a argmin f (U ) =
argmin fU (U ) ⊂ argmin fU (Rn ) et argmin fU (U ) = U ∩ argmin fU (Rn ). Si, en plus,
inf f (U ) < +∞, on a, par définition de fU , argmin fU (Rn ) ⊂ argmin fU (U ) =
argmin f (U ).
Remarque 3.1.
Dans le cas du supremum, on prolongera f par −∞ en considérant la fonction
)
(
f
(x),
si
x
∈
U
déf
= −(−f )U (x).
(3.7)
f U (x) =
− ∞,
si x ∈ Rn \U
Pour l’infimum deux cas sont triviaux :
(i) il existe x ∈ U tel que f (x) = −∞ ce qui entraı̂ne inf fU (Rn ) = inf f (U ) =
−∞ et x ∈ argmin f (U ) ;
(ii) pour tout x ∈ U , f (x) = +∞, ce qui entraı̂ne inf fU (Rn ) = inf f (U ) = +∞
et argmin f (U ) = U .
22
Chapitre 2. Existence, convexités et convexification
On est alors amené à exclure les cas (i) et (ii) pour l’infimum pour en arriver à la notion de fonction propre que l’on étend à des fonctions qui ne sont pas
nécessairement convexes. La notion duale pour le supremum s’obtient en considérant
l’infimum de −f .
Définition 3.2.
Soit une fonction f : Rn → R ∪ {±∞}.
(i) f est dite propre 4 pour l’infimum si
a) pour tout x ∈ Rn , f (x) > −∞ et
b) il existe x ∈ Rn tel que f (x) < +∞.
Ceci est donc équivalent à f : Rn → R ∪{+∞} et dom f 6= ∅.
(ii) f est dite propre pour le supremum si
a) pour tout x ∈ Rn , f (x) < +∞ et
b) il existe x ∈ Rn tel que f (x) > −∞.
Ceci est donc équivalent à f : Rn → R ∪{−∞} et dom f 6= ∅.
Lorsque le contexte le permet, on dira simplement fonction propre.
Un autre cas trivial est celui où dom f est un singleton, c’est à dire qu’il n’existe
qu’un seul point où f prend une valeur finie.
4
Semi-continuités inférieure et supérieure
Pour pouvoir considérer l’infimum de fonctions discontinues, on affaiblit la
notion de continuité en la décomposant en deux notions plus faibles qui sont simultanément présentes dans la définition de la continuité.
On rapelle qu’une fonction f : Rn → R est continue en a ∈ Rn si
∀ε > 0, ∃δ > 0 tel que ∀x ∈ Bδ (a),
|f (x) − f (a)| < ε.
(4.1)
La boule ouverte Bδ (a) de rayon δ > 0 en a est un voisinage de a. En posant
V (a) = Bδ (a), la condition sur f donne deux conditions suivantes
∀x ∈ V (a),
∀x ∈ V (a),
−ε < f (x) − f (a)
f (x) − f (a) < ε
⇒ f (a) − ε < f (x)
⇒ f (x) < f (a) + ε.
(4.2)
La première condition dit que f (a) se trouve en dessous de tous les points limite
de f (x), lorsque x tend vers a, alors que la seconde dit que f (a) se trouve au
dessus, d’où la décomposition de la continuité en semi-continuité inférieure et semicontinuité supérieure.
Définition 4.1.
Soit U , ∅ 6= U ⊂ Rn .
4. Il ne faut pas confondre fonction propre traduction de l’anglais proper function avec
fonction propre traduction de eigenfunction.
4. Semi-continuités inférieure et supérieure
23
(i) f : U → R ∪{+∞} est semi-continue inférieurement en a ∈ U si
∀h < f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , h < f (x).
(4.3)
f : U → R ∪{+∞} est semi-continue inférieurement dans U si elle est
semi-continue inférieurement en tout point de U .
Par convention, la fonction identiquement égale à −∞ dans U est semicontinue inférieurement dans U .
(ii) f : U → R ∪{−∞} est semi-continue supérieurement en a ∈ U si
∀k > f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , k > f (x).
(4.4)
f : U → R ∪{−∞} est semi-continue supérieurement dans U si elle est
semi-continue supérieurement en tout point de U .
Par convention, la fonction identiquement égale à +∞ dans U est semicontinue supérieurement dans U .
On utilisera les abbréviations sci pour semi-continue inférieurement et scs pour
semi-continue supérieurement.
Les fonctions de la Figure 2.1 sont sci dans ]0, 1[ . La fonction identiquement égale
à +∞ est sci et celle identiquement égale à −∞ est scs dans Rn . Comme on l’a vu
au début, la définition (4.1) de la continuité d’une fonction f : Rn → R en un point
a ∈ Rn est équivalente aux deux conditions (4.2) : la première est la sci en a avec
h = f (a) − ε < f (a) et la seconde est la scs en a avec k = f (a) + ε > f (a).
Pour U fermé, on a, comme pour les fonctions continues sur U , un prolongement sci à tout Rn .
Lemme 4.1. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞} sci dans U .
Alors, la fonction
)
(
f (x),
si x ∈ U
: Rn → R ∪{+∞}
x 7→ fU (x) =
+ ∞,
si x ∈ Rn \U
(définie en (3.5)) est un prolongement sci de f dans Rn .
Remarque 4.1.
En général, si U n’est pas fermé, fU n’est pas sci, mais cette condition n’est pas
nécessaire. En effet, soit U = (0, 1] et f (x) = 1/x dans U . Le prolongement
)
(
1/x,
si 0 < x ≤ 1
: R → R ∪{+∞}.
x 7→ fU (x) =
+ ∞,
si x ∈ R \(0, 1]
est sci. Il suffit de montrer que fU est sci en x = 0. En effet, pour tout h < fU (0) =
+∞, on prend comme voisinage de 0, V (0) = (−∞, 1/h) pour lequel f (x) > h.
24
Chapitre 2. Existence, convexités et convexification
Démonstration du Lemma 4.1. La fonction fU est sci en tout point a ∈ Rn \U . En
effet, V (a) = Rn \U est un ouvert non vide contenant a puisque U est fermé. C’est
donc un voisinage de a. Pour tout h < f (a) = +∞,
∀x ∈ V (a),
h < +∞ = f (x)
et, par définition, fU est sci sur Rn \U . Comme pour tout a ∈ U , fU (a) = f (a) et
f est sci en tout point de U , il existe donc un voisinage V (a) de a tel que
∀x ∈ V (a) ∩ U,
h < f (x)
⇒ ∀x ∈ V (a),
h < f (x) ≤ fU (x),
puisque, par construction, fU (x) = +∞ sur Rn \U . fU est donc aussi sci en tout
point de U .
Exemple 4.1.
La fonction indicatrice d’une partie fermée U de Rn
(
0,
si x ∈ U,
déf
IU (x) =
+ ∞,
si x ∈
/ U,
est sci dans tout Rn car IU = fU pour la fonction x 7→ f (x) = 0 : U ⊂ Rn → R.
Comme dans le cas du supremum et de l’infimum où sup f (U ) = − inf −f (U ),
f est scs en x si et seulement si −f est sci en x et il suffira d’étudier les propriétés
des fonctions sci.
Théorème 4.1.
(i) f : Rn → R ∪{−∞} est scs en x si et seulement si −f :
n
R → R ∪{+∞} est sci en x.
(ii) f : Rn → R ∪{+∞} est sci en x si et seulement si −f : Rn → R ∪{−∞}
est scs en x.
Démonstration. Comme f : Rn → R ∪{−∞}, on a −f : Rn → R ∪{+∞}. Soit
h < −f (x), alors f (x) < −h. Comme f est scs en x, il existe un voisinage V (x)
de x tel que pour tout y ∈ V (x), f (y) < −h. Ceci entraı̂ne pour tout y ∈ V (x),
−f (y) > h. Par définition, −f est sci en x. La réciproque est similaire.
Il est facile de vérifier les propriétés suivantes des fonctions sci (voir les exercices 9.1 à 9.4) en utilisant la convention (+∞) + (+∞) = +∞, (+∞) + a = +∞
pour tout a ∈ R, et (+∞) a = (a/kak) ∞ pour tout a ∈ R différent de 0.
Théorème 4.2.
(i) Pour tout f : Rn → R ∪{+∞} et tout g : Rn → R ∪{+∞}
n
sci en a ∈ R , la fonction
déf
x 7→ (f + g)(x) = f (x) + g(x): Rn → R ∪{+∞}
est sci en a.
4. Semi-continuités inférieure et supérieure
25
(ii) Pour tout λ > 0 et tout f : Rn → R ∪{+∞} sci en a ∈ Rn , la fonction
déf
x 7→ (λf )(x) = λf (x) : Rn → R ∪{+∞}
est sci en a.
(iii) Pour toute famille {fα }α∈A (A un ensemble d’indices possiblement infini)
de fonctions fα : Rn → R ∪{+∞} sci en a ∈ Rn , l’ enveloppe supérieure
x 7→
déf
sup fα (x) = sup fα (x): Rn → R ∪{+∞}
α∈A
α∈A
est sci en a ∈ Rn .
(iv) Pour toute famille finie fi : Rn → R ∪{+∞}, 1 ≤ i ≤ m, de fonctions sci
en a ∈ Rn , l’ enveloppe inférieure
déf
x 7→
min fi (x) = min fi (x): Rn → R ∪{+∞}
1≤i≤m
1≤i≤m
est sci en a ∈ Rn .
(v) Pour une fonction f : Rn → R et un point a ∈ Rn
f continue en a
⇐⇒
f est sci et scs en a.
(vi) Pour une application linéaire A : Rm → Rn et une fonction f : Rn →
R ∪{+∞} sci en Ax, f ◦ A : Rm → R ∪{+∞} est sci en x.
La propriété (iv) n’est pas nécessairement vraie pour l’enveloppe inférieure
d’une famille infinie de fonctions sci comme le montre l’exemple suivant.
Exemple 4.2.
Pour chaque entier k ≥ 1, soit la fonction numérique continue


si x ∈ [0, 1],
1,
déf
fk (x) = 1 − k(x − 1),
si x ∈ [1, 1 + 1/k],


0,
si x ∈ [1 + 1/k, 2].
Il est facile de vérifier que
inf fk (x) =
k≥1
(
1,
0,
si x ∈ [0, 1],
si x ∈ ]1, 2],
est une fonction scs mais pas sci en x = 1.
La semi-continuité inférieure (resp., supérieure) peut aussi être caractérisée
par la limite inférieure (resp., supérieure).
26
Chapitre 2. Existence, convexités et convexification
Définition 4.2.
Pour une fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞})
déf
déf
lim inf f (x) = sup inf f (x) resp., lim sup f (x) = inf sup
x→a
ε>0
x6=a
kx−ak<ε
ε>0
x→a
x6=a
kx−ak<ε
f (x) .
Théorème 4.3. La fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞}) est
sci (resp., scs) en a si et seulement si
lim inf f (x) ≥ f (a)
resp., lim sup f (x) ≤ f (a) .
(4.5)
x→a
x→a
Démonstration. (⇒) Si f est sci en a, pour tout h < f (a), il existe un voisinage
V (a) de a tel que pour tout x ∈ V (a), f (x) > h. Comme V (a) est un voisinage de
a il existe une boule Bε (a), ε > 0, tel que Bε (a) ⊂ V (a) et
∀x ∈ Bε (a),
f (x) > h
⇒
inf
x∈Bε (a)
x6=a
f (x) ≥ h
⇒ sup
inf
ε>0 x∈Bε (a)
x6=a
f (x) ≥ h.
L’inégalité étant vraie pour tout h < f (a), on peut faire tendre h vers f (a) :
lim inf f (x) ≥ h
x→a
⇒ lim inf f (x) ≥ f (a).
x→a
(⇐) Pour tout h tel que f (a) > h, on a par hypothèse


lim inf f (x) = sup  inf
x→a
ε>0
x∈Bε (a)
x6=a
f (x) ≥ f (a) > h.
Par définition du sup, pour ce h, il existe ε0 > 0 tel que


sup  inf
ε>0
x∈Bε (a)
x6=a
f (x) ≥
inf
x∈Bε0 (a)
x6=a
f (x) > h
⇒ ∀x ∈ Bε0 (a), f (x) > h.
Comme Bε0 (a) est un voisinage de a, f est sci en a.
On a comme corollaire la caractérisation suivante de l’épigraphe.
Définition 4.3.
L’épigraphe d’une fonction f : Rn → R ∪{+∞} est l’ensemble
déf
épi f = {(x, µ) ∈ Rn × R : x ∈ dom f et µ ≥ f (x)} .
(4.6)
L’épigraphe épi f est non vide si et seulement si dom f 6= ∅, c’est-à-dire, lorsque f
est propre pour l’infimum.
4. Semi-continuités inférieure et supérieure
27
Lemme 4.2. La fonction f : Rn → R ∪{+∞} est sci dans Rn si et seulement si
son épigraphe épi f est fermé dans Rn × R.
Remarque 4.2.
Cependant, le domaine effectif dom f d’une fonction f sci n’est pas nécessairement
fermé, comme le montre l’exemple de la fonction f (x) = 1/|x| si x 6= 0 et +∞ si
x = 0, où dom f = R \{0}.
Démonstration. Si f est sci dans Rn , considérons une suite de Cauchy (xn , µn ) ∈
épi f . On a donc µn ≥ f (xn ) et il existe (x, µ) ∈ Rn × R tel que xn → x et µn → µ.
Comme f est sci dans Rn ,
µ = lim µn = lim inf µn ≥ lim inf f (xn ) ≥ f (x),
n→∞
n→∞
n→∞
x ∈ dom f , et (x, µ) ∈ épi f . L’épigraphe de f est donc fermé dans Rn × R. Réciproquement, supposons que épi f est fermé dans Rn × R. Soient x ∈ Rn et h < f (x). Le
point (x, h) ∈
/ épi f . Il existe donc un voisinage W (x, h) tel que W (x, h) ∩épi f = ∅.
En particulier, il existe un voisinage V (x) de x tel que V (x) × {h} ⊂ W (x, h) et
donc pour tout y ∈ V (x), f (y) > h et f est sci dans Rn .
On donne maintenant un certain nombre de caractérisations de la semi-continuité
en préparation du Théorème 5.1.
f (x)
f (a)
h
x
a
Gh
Figure 2.2. Exemple d’une fonction semi-continue inférieurement.
Lemme 4.3. Soit f : Rn → R ∪{+∞}. Les conditions suivantes sont équivalentes :
(i) f est sci dans Rn .
28
Chapitre 2. Existence, convexités et convexification
(ii) ∀h ∈ R, Gh = {x ∈ Rn : f (x) > h} est ouvert dans Rn (voir la Figure 2.2).
(iii) ∀h ∈ R, Fh = {x ∈ Rn : f (x) ≤ h} est fermé dans Rn .
Démonstration. (i) ⇒ (ii). Si Gh = ∅, Gh est ouvert. Si Gh 6= ∅, pour tout a ∈ Gh ,
on a f (a) > h et, comme f est sci en a, il existe un voisinage V (a) de a tel que
∀x ∈ V (a),
f (x) > h
⇒
V (a) ⊂ Gh .
Donc a ∈ int Gh et Gh est ouvert.
(ii) ⇒ (i). Soit a ∈ Rn et h tel que f (a) > h. Par défintion de Gh , a ∈ Gh .
Comme Gh est ouvert, c’est un voisinage de a et, pour tout x ∈ Gh , on a f (x) > h.
Par définition, f est donc sci en a et, a fortiori, en tout point de Rn .
(ii) ⇐⇒ (iii) est évident.
L’utilisation de ces lemmes pour une fonction f : U → R ∪{+∞} sci dans un
sous-ensemble U de Rn nécessite le lemme suivant.
Lemme 4.4. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞}. Les conditions
suvantes sont équivalentes :
(i) f est sci dans U .
(ii) fU est sci dans Rn .
(iii) ∀h ∈ R, Gh = {x ∈ Rn : fU (x) > h} est ouvert dans Rn .
(iv) ∀h ∈ R, Fh = {x ∈ U : f (x) ≤ h} est fermé dans Rn .
En particulier, pour tout h
{x ∈ Rn : fU (x) ≤ h} = {x ∈ U : f (x) ≤ h}.
(4.7)
Démonstration. (i) ⇒ (ii) Du Lemme 4.1.
(ii) ⇒ (i) Si fU est sci dans Rn , sa restriction f = fU |U is sci dans U .
(ii) ⇔ (iii). Par le Lemme 4.3.
(iii) ⇔ (iv). Par le Lemme 4.3, la condition (iii) est équivalente à :
∀h ∈ R,
{x ∈ Rn : fU (x) ≤ h} est fermé dans Rn .
Il suffit alors de remarquer que, puisque fU (x) = +∞ pour tout x ∈ Rn \U , on a
{x ∈ Rn : fU (x) ≤ h} = {x ∈ U : fU (x) ≤ h} = Fh .
Ceci permet de travailler dans Rn plutôt que dans U .
Exemple 4.3.
La fonction indicatrice d’une partie fermée U de Rn
(
0,
si x ∈ U,
déf
IU (x) =
+ ∞,
si x ∈
/ U,
est sci dans tout Rn . En fait IU = fU pour la fonction x 7→ f (x) = 0 : Rn → R.
5. Existence de points minimisants dans U
29
Pour compléter ce paragraphe, on donne la définition de ≪lower semi-continuous hull ≫ d’une fonction f , dénotée cl f suivant la terminologie ≪closure ≫ de
R. T. Rockafellar [1]. Elle correspond à la définition de la régularisée sci que
l’on retrouve dans I. Ekeland et R. Temam [1].
Définition 4.4.
(i) La régularisée sci d’une fonction f : Rn → R ∪{+∞} est
l’enveloppe supérieure des fonctions sci inférieures ou égales à f
déf
cl f (x) =
sup
g(x).
(4.8)
g sci et
g≤f dans Rn
S’il existe g sci dans Rn tel que g ≤ f dans Rn , cl f est sci dans Rn . Sinon,
on pose cl f (x) = −∞ par convention.
(ii) La régularisée scs d’une fonction f : Rn → R ∪{−∞} est définie comme
l’enveloppe inférieure des fonctions scs supérieures ou égales à f
cl
scs f (x)
déf
=
inf
g scs et
f ≤g dans Rn
g(x).
S’il existe g scs dans Rn tel que f ≤ g dans Rn , cl
Sinon, on pose cl scs f (x) = +∞ par convention.
Noter que la définition de la régularisée scs revient à cl
5
5.1
scs f
(4.9)
scs f
est scs dans Rn .
= −cl (−f ).
Existence de points minimisants dans U
U compact
On peut maintenant affaiblir les hypothèses du théorème de Weierstrass (Théorème 2.1) en séparant la recherche de l’infimum de celle du supremum.
Théorème 5.1. Soit U , ∅ 6= U ⊂ Rn , compact.
(i) Si f : U → R ∪{+∞} est sci dans U , alors
∃a ∈ U tel que f (a) = inf f (U ).
(5.1)
Si U ∩ dom f 6= ∅, alors inf f (U ) ∈ R.
(ii) Si f : U → R ∪{−∞} est scs dans U , alors
∃b ∈ U tel que f (b) = sup f (U ).
(5.2)
Si U ∩ dom f 6= ∅, alors sup f (U ) ∈ R.
En particulier, argmin f (U ) = ∩k>inf f (U) Fk , où Fk = {x ∈ U : f (x) ≤ k}.
Comme U est compact, il est fermé. Par le Lemme 4.4, on pourra utiliser la
fonction fU qui est sci dans tout Rn sans changer l’infimum puisque inf f (U ) =
inf fU (Rn ) par le Théorème 3.2. Pour le supremum de f : U → R ∪{−∞} scs dans
U fermé, la fonction f U définie en (3.7) de la Remarque 3.1 est scs dans Rn .
30
Chapitre 2. Existence, convexités et convexification
Démonstration du Théorème 5.1. Soit m = inf f (U ). Comme U est compact, il est
fermé. Par le Lemme 4.4 la fonction fU associée à f définie par (3.5) est sci dans
tout Rn et par le Théorème 3.2 on a m = inf f (U ) = inf fU (U ) = inf fU (Rn ).
Si m = +∞, alors f est identiquement égale à +∞ dans U et tous les points
de U sont minimisants. Si m < +∞, alors pour tout réel k > m, l’ensemble
Fk = {x ∈ U : f (x) ≤ k} = {x ∈ Rn : fU (x) ≤ k}
est fermé par la sci de fU dans Rn (Lemme 4.4) et l’ensemble
∁Fk = {x ∈ Rn : fU (x) > k} = ∁U ∪ {x ∈ U : f (x) > k}
est ouvert. Fk est aussi non vide puisque par définition du inf, pour tout k tel que
m < k, il existe f (x) ∈ f (U ) tel que m = inf f (U ) ≤ f (x) < k.
On veut montrer que ∩k>m Fk 6= ∅. On procède par contradiction. Si cette
intersection est vide, alors
Rn = ∁ [∩k>m Fk ] = ∪k>m ∁Fk
⇒ U ⊂ Rn = ∪k>m ∁Fk .
La famille {∁Fk : m < k} est donc un recouvrement ouvert du compact U . Par
définition de la compacité, il existe un sous-recouvrement fini of U
U ⊂ ∪ℓj=1 ∁Fkj
⇒
⇒ U = U ∩ ∪ℓj=1 ∁Fkj = ∪ℓj=1 U \Fkj
∀x ∈ U, f (x) = fU (x) > min{k1 , . . . , kℓ } > m
⇒ inf f (U ) ≥ min{k1 , . . . , kℓ } > m = inf f (U ).
Ceci contredit la comjecture que l’intersection des {Fk : k > m} est vide.
Puisque ∩k>m Fk 6= ∅, tout élément
a ∈ ∩k>m Fk ⊂ U ,
appartient à U et
∀k > m, f (a) ≤ k
⇒
f (a) ≤ m = inf f (x) ≤ f (a)
x∈U
en laissant k tendre vers m. Le point a dans U est un point minimisant ainsi que
tous les points dans l’intersection des Fk : argmin f (U ) = ∩k>m Fk .
Il est important d’observer que, en général, on ne peut remplacer l’infimum
par rapport à U par l’infimum par rapport à sa fermeture U même si f est sci. On
n’a seulement que
inf f (U ) ≥ inf f (U )
comme le montre l’exemple suivant.
5. Existence de points minimisants dans U
|
1
31
0
|
−1
0
1
Figure 2.3. Fonction sci, mais pas scs en 0.
Exemple 5.1.
Soient U = [−1, 1]\{0} et la fonction sci
(
1,
f (x) =
0,
si x 6= 0,
si x = 0.
Alors U = [−1, 1] et
inf f (U ) = 1 > 0 = inf f (U ).
De plus, f n’est pas scs en 0. En effet, pour 1/2 > 0 = f (0) l’ensemble
{x ∈ [−1, 1] : f (x) < 1/2} = {0}
n’est pas un voisinage de 0.
On a cependant la condition suffisante suivante.
Théorème 5.2. Soient U , ∅ 6= U ⊂ Rn , et f : U → R scs dans U . Alors
inf f (U ) = inf f (U ).
Démonstration. Comme U ⊂ U , on a
inf f (U ) ≤ inf f (U ).
Comme U 6= ∅ les deux inf sont bornés supérieurement. Si inf f (U ) = −∞, alors
inf f (U ) = −∞ et le résultat est vrai. Si inf f (U ) est fini, supposons que
inf f (U ) < inf f (U ).
Par définition de inf f (U ), il existe x0 ∈ U tel que
inf f (U ) ≤ f (x0 ) < inf f (U ).
32
Chapitre 2. Existence, convexités et convexification
Comme f est scs, il existe un voisinage V (x0 ) de x0 tel que
∀x ∈ U ∩V (x0 ),
f (x) < inf f (U ).
Mais x0 ∈ U est un point d’adhérence de U pour lequel on a V (x0 ) ∩ U 6= ∅.
Il existe donc u ∈ U tel que f (u) < inf f (U ). Mais ceci est une contradiction et
inf f (U ) = inf f (U ).
5.2
U fermé mais pas nécessairement borné
Par le Théorème 5.1 on peut maintenant dire que les fonctions de la Figure 2.1
possèdent au moins un point minimisant dans le compact U = [0, 1] de R. Cependant, dans sa forme présente, ce théorème est encore quelque peu restrictif car il ne
nous permet pas de traiter le cas simple suivant
déf
inf f (Rn ),
f (x) = kxk2 ,
x ∈ Rn .
La difficulté provient du fait que l’ensemble Rn n’est pas borné et donc pas compact.
Remarque 5.1.
En analysant la démonstration du théorème précédent, on s’aperçoit que l’on a pas
vraiment besoin de la compacité de U . Puisque les parties fermés Fk de U forment
une suite croissante
Fk1 ⊂ Fk2 ⊂ U, ∀k2 ≥ k1 > m,
alors, pour tout k̄ > m, ∩k̄≥k>m Fk = ∩k>m Fk . Il suffit donc de trouver un k̄ ∈ R
pour lequel la section inférieure Fk̄ = {x ∈ U : f (x) ≤ k̄} soit non vide et bornée
(donc compacte 5 au lieu de faire l’hypothèse sur U .
Définition 5.1.
Soit U une partie non vide de Rn .
(i) La fonction f : U → R ∪{+∞} est à section inférieure bornée dans U s’il
existe k ∈ R tel que la section inférieure
Fk = {x ∈ U : f (x) ≤ k}
(5.3)
soit non vide et bornée.
(ii) La fonction f : U → R ∪{−∞} est à section supérieure bornée dans U s’il
existe k ∈ R tel que la section supérieure
déf
F k = {x ∈ U : f (x) ≥ k}
(5.4)
soit non vide et bornée.
Lorsque U est une partie non vide compacte de Rn (c’est-à-dire, bornée et fermée),
alors toute fonction f propre pour l’infimum est à section inférieure bornée dans U .
5. En dimension finie, un ensemble est compact si et seulement si il est borné et fermé par
le théorème de Heine-Borel (Théorème 4.2 du Chapitre 1).
5. Existence de points minimisants dans U
33
Théorème 5.3. Soit U une partie non vide et fermée de Rn .
(i) Si f : U → R ∪{+∞} est une fonction sci dans U et à section inférieure
bornée dans U , alors
∃a ∈ U tel que f (a) = inf f (U ) ∈ R .
(5.5)
(ii) Si f : U → R ∪{−∞} est une fonction scs dans U et à section supérieure
bornée dans U , alors
∃b ∈ U tel que f (b) = sup f (U ) ∈ R .
(5.6)
Exemple 5.2 (fonction distance).
Soit U , ∅ 6= U ⊂ Rn , fermé et x ∈ Rn . On veut montrer qu’il existe x̂ ∈ U tel que
déf
dU (x) = inf kx − yk = kx − x̂k
y∈U
(5.7)
et
∀x1 , x2 ∈ Rn ,
|dU (x2 ) − dU (x1 )| ≤ kx2 − x1 k.
(5.8)
On considère l’infimum
inf f (y),
y∈U
déf
f (y) = ky − xk.
La fonction f est continue et donc sci dans Rn . Soient y0 ∈ U et k = ky0 − xk. La
section inférieure
déf
Fk = {y ∈ U : ky − xk ≤ k}
est non vide puisque y0 ∈ Fk et bornée puisque
∀y ∈ Fk ,
kyk ≤ kxk + ky − xk ≤ kxk + ky0 − xk ≤ kxk + k.
La fonction f est donc à section inférieure bornée dans U . Par le Théorème 5.3 (i),
il existe un point minimisant x̂ ∈ U .
Pour tout y ∈ U
kx2 − yk ≤ kx1 − yk + kx2 − x1 k
n
⇒ ∀x1 , x2 ∈ R ,
⇒ inf kx2 − yk ≤ inf kx1 − yk + kx2 − x1 k
y∈U
y∈U
dU (x2 ) − dU (x1 ) ≤ kx2 − x1 k.
En interchangeant les rôles de x1 et x2 , on obtient |dU (x2 ) − dU (x1 )| ≤ kx2 −
x1 k.
Exemple 5.3 (fonction distance).
Soit U , ∅ 6= U ⊂ Rn , pas nécessairement fermé et x ∈ Rn . Comme dans l’exemple
précédent on définit
déf
dU (x) = inf kx − yk.
y∈U
(5.9)
Comme U ⊂ U , on a dU (x) ≥ dU (x). Cependant, comme la fonction y 7→ ky − xk
est continue, elle est scs et par le Théorème 5.2, dU (x) = dU (x).
34
5.3
Chapitre 2. Existence, convexités et convexification
Condition de croissance à l’infini
La simple croissance vers +∞ de la fonction lorsque la norme kxk tend vers
l’infini entraı̂ne la propriété de section inférieure bornée.
Définition 5.2.
Soient U , ∅ 6= U ⊂ Rn , non bornée et f : U → R ∪{+∞}. La fonction f est
croissante à l’infini dans U si
lim
x∈U, kxk→∞
f (x) = +∞.
Théorème 5.4. Soit U , ∅ 6= U ⊂ Rn , non-bornée. Si f : Rn → R ∪{+∞} est
croissante à l’infini dans U et si dom f ∩ U 6= ∅, elle est à section inférieure bornée
dans U .
Démonstration. Nous allons démontrer qu’il existe un k ∈ R tel que la section
Fk = {x ∈ U : f (x) ≤ k}
soit bornée et non vide. Comme dom f ∩ U 6= ∅, pour x ∈ dom f ∩ U , posons
k = f (x). La section Fk n’est donc pas vide. Par hypothèse de croissance à l’infini
dans U ,
∃R(k) > 0 tel que ∀x ∈ U et kxk > R(k),
f (x) > k.
On en conclut que
Fk = {x ∈ U : f (x) ≤ k} ⊂ {x ∈ U : kxk ≤ R(k)}
et que Fk est non vide et borné.
Considérons quelques exemples génériques.
Exemple 5.4.
Les fonctions f (x) = |x| et f (x) = x2 sont croissantes à l’infini dans R.
Exemple 5.5.
La fonction f (x) = x − b n’est pas croissante à l’infini dans R. En effet, il suffit de
prendre la suite xn = −n pour les entiers positifs n tendant vers l’infini.
Exemple 5.6.
La fonction f (x) = sin x + (1 + x)2 est croissante à l’infini dans R. En effet
f (x) ≥ −1 + (1 + x)2 = x2 − 2x → +∞
lorsque |x| → ∞.
5. Existence de points minimisants dans U
35
Exemple 5.7.
Soit la fonction
f (x1 , x2 ) = (x1 + x2 )2 .
Alors f n’est pas croissante à l’infini dans R2 . Il suffit de prendre la suite {(n, −n)},
n ≥ 1,
f (n, −n) = (n − n)2 = 0 6→ +∞.
Cependant, f est croissante à l’infini dans
U = {(x1 , 0) : x1 ∈ R}
car
f (x) = x21 → +∞
lorsque |x1 | tend vers +∞ dans U .
Théorème 5.5. Les fonctions x 7→ f (x) = kx − akp , p ≥ 1, sont croissantes à
l’infini dans Rn (a ∈ Rn est fixé).
Démonstration. En effet, on peut écrire
p
x
a f (x) = kxkp −
kxk kxk .
Lorsque kxk → ∞ le terme
x
a −
kx | kxk converge vers 1 et donc sa puissance p converge aussi vers 1. Pour p ≥ 1, kxkp → +∞
lorsque kxk tend vers +∞. La limite de f (x) est le produit des deux limites.
Pour l’exemple suivant, on aura besoin du lemme suivant pour les applications
linéaires définies positives (voir la Définition 4.13 du Chapitre 1).
Lemme 5.1. Une matrice symétrique A est définie positive si et seulement si
∃α > 0, ∀x ∈ Rn , (Ax) · x ≥ αkxk2 .
Dans ce cas,
∀x ∈ Rn ,
kAxk ≥ αkxk
et l’inverse A−1 est aussi définie positive.
Démonstration. (⇐) S’il existe α > 0 tel que
∀x ∈ Rn ,
alors
∀x ∈ Rn , x 6= 0,
(Ax) · x ≥ αkxk2 ,
(Ax) · x ≥ αkxk2 > 0
36
Chapitre 2. Existence, convexités et convexification
et A > 0.
(⇒) Dans l’autre sens si A > 0, alors
∀x ∈ Rn ,
(Ax) · x ≥ 0.
Supposons qu’il n’existe pas de α > 0 tel que
∀x ∈ Rn ,
(Ax) · x ≥ αkxk2 .
Alors pour tout entier k > 0, il existe xk tel que
0 ≤ Axk · xk <
1
kxk k2
k
⇒ xk 6= 0.
On peut alors diviser par kxk k2 ce qui donne
0≤A
xk
xk
1
·
<
kxk k kxk k
k
⇒ lim A
k→∞
xk
xk
·
= 0.
kxk k kxk k
Les points sk = xk /kxk k appartiennent à la sphère S = {x ∈ Rn : kxk = 1}
qui est compacte dans Rn . Par le théorème de Bolzano–Weierstrass (Théorème 4.3,
Chapitre 1), il existe une sous-suite {skℓ } de {sk } qui converge vers un point s de
S:
∃s, ksk = 1 tel que 0 = lim Askℓ · skℓ = As · s.
ℓ→∞
Donc
∃s 6= 0 tel que
As · s = 0 =⇒ A ≯ 0.
Ceci contredit l’hypothèse que A > 0. D’où le résultat.
Pour montrer que A est inversible, il suffit de vérifier que sous l’hypothèse
A > 0, l’application linéaire A : Rn → Rn est injective. Ceci revient à montrer que
Ax = 0 entraı̂ne x = 0. En utilisant le résultat que nous venons de démontrer, on
vérifie facilement les implications suivantes
Ax = 0
⇒ 0 = Ax · x ≥ α kxk2
⇒ x = 0.
En particulier, pour x 6= 0,
kAxk kxk ≥ Ax · x ≥ α kxk2
⇒ kAxk ≥ αkxk.
Enfin, comme
∀y ∈ Rn ,
A−1 y · y = A−1 y · A(A−1 y) ≥ αkA−1 yk2 ≥ 0,
A−1 est semi-définie positive. De plus, comme A−1 est injective,
0 = A−1 y · y ≥ αkA−1 yk2
et A−1 est définie positive.
⇒ A−1 y = 0
⇒ y=0
5. Existence de points minimisants dans U
37
Exemple 5.8.
Soit A une matrice n × n symétrique tel que A > 0. On associe à A et à un vecteur
arbitraire b de Rn la fonction numérique suivante 6
f (x) =
1
(Ax) · x + b · x, x ∈ Rn .
2
Par le Lemme 5.1 appliqué à la matrice A, il existe α > 0 tel que
∀x ∈ Rn ,
Ax · x ≥ αkxk2 .
Il vient
f (x) =
1
(Ax) · x + b · x
2
=⇒ f (x) ≥
1
αkxk2 − kbk kxk
2
et la fonction f est croissante à l’infini dans Rn . Comme f est polynômiale, elle est
continue et comme U = Rn est fermé, on a l’existence d’un point minimisant.
5.4
Quelques propriétés de l’ensemble des points minimisants
Revenons à l’infimum de f par rapport à U , ∅ 6= U ⊂ Rn . Dans la démonstration du Théorème 5.1, on vu que que, pour f : U → R ∪{+∞}, l’ensemble des
points minimisants de f par rapport à U est donné par
argmin f (U ) =
\
k>m
Fk , où m = inf f (U ) et Fk = {x ∈ U : f (x) ≤ k}.
On peut donc déduire certaines propriétés de argmin f (U ) de celles des Fk .
En utilisant le fait que, pour U fermé, les sections inférieures {Fk } d’une
fonction f sci sont fermées, on obtient que argmin f (U ) est fermé en tant qu’intersection d’une famille de fermés par l’dentité (5.4). Si, de plus, f est à section
inférieure bornée, alors il existe k0 tel que la section Fk0 soit non vide et bornée.
Fk0 est donc compact car il est aussi fermé. Comme m est l’infimum et que Fk0 est
non vide, argmin f (U ) ⊂ Fk0 . On a donc
argmin f (U ) =
\
k>m
Fk ⊂ Fk0
et l’ensemble argmin f (U ) est compact comme sous-ensemble fermé du compact
Fk0 . On peut alors énoncer le résultat suivant.
Théorème 5.6. Soient U , ∅ 6= U ⊂ Rn , fermé et f : U → R ∪{+∞} sci dans
U . Alors, argmin f (U ) est fermé (possiblement vide). Si, en plus, f est à section
inférieure bornée dans U alors argmin f (U ) est compact et non vide.
6. Si un vecteur v ∈ Rn est considéré comme une matrice n × 1, on peut écrire le produit
(Ax) · x comme le produit de trois matrices x⊤ Ax et b · x comme le produit de deux matrices b⊤ x.
38
Chapitre 2. Existence, convexités et convexification
Démonstration. Puisque U est fermé et que f est sci, les sections inférieures {Fk }
en (5.4) sont fermées et argmin f (U ), en tant qu’intersection de fermés est fermée.
Si, en plus, f est à section inférieure bornée (il existe k0 tel que Fk0 soit non vide
et bornée) le fermé Fk0 est compact. L’ensemble des minimisants
\
argmin f (U ) =
Fk ⊂ Fk0
k>m
est donc compact en tant que partie bornée d’un compact Fk0 .
Exemple 5.9.
On revient aux Exemples 5.2 et 5.3 pour U , ∅ 6= U ⊂ Rn . Pour x ∈ Rn , on a montré
que dU (x) = dU (x) et que
∃x̂ ∈ U tel que dU (x) = inf kx − yk = kx − x̂k.
(5.10)
y∈U
Pour ce faire on a considéré l’infimum de la distance
inf f (y),
y∈U
déf
f (y) = ky − xk.
On a montré que f est continue et à section inférieure bornée dans U . Par le
Théorème 5.6, argmin f (U ) est non vide et compact. Les points de argmin f (U )
sont les projections de x sur U . On désignera par ΠU (x) cet ensemble. Si x ∈ U ,
alors ΠU (x) = {x} est un singleton.
6
◮ Principe variationnel d’Ekeland
Le principe variationnel d’Ekeland 7 en 1974 (I. Ekeland [1]) est un outil
fondamental pour l’existence de points minimisants approchés en l’absence de compacité. Son impact majeur est dans le contexte d’espaces fonctionnels. On en donne
ici une version en dimension finie ainsi que quelques unes de ses ramifications.
Théorème 6.1. Soit f : Rn → R ∪{+∞}, dom f 6= ∅, une fonction sci et bornée
inférieurement. Alors, pour tout ε > 0, il existe xε tel que
inf f (x) ≤ f (xε ) < infn f (x) + ε
x∈Rn
x∈R
(6.1)
et, pour tout η > 0, il existe y (qui dépend de ε) tel que
ky − xε k < η,
f (y) ≤ f (xε ) −
ε
ky − xε k
η
(6.2)
ε
ky − xk.
η
(6.3)
et
∀x ∈ Rn , x 6= y,
7. Ivar Ekeland (1944– ).
f (y) < f (x) +
Téléchargement