4 Quelques révisions d`analyse classique

4. Quelques révisions d’analyse classique
5
à deux joueurs de somme nulle ainsi qu’avec les problèmes primal et dual de Fenchel
du Chapitre 2. Une forme générale du lemme de Farkas est donnée en préparation
du chapitre suivant. Les constructions et les résultats sont étendus au problème
d’optimisation quadratique et aux fonctions objectif Fréchet différentiables. À la fin
de ce chapitre, on donne un aperçu de l’optimisation via les sous-différentielles qui
font appel à l’analyse multivoque.
Le chapitre 5 traite de l’optimisation différentiable par rapport à un ensemble de points admissibles spécifié par un nombre fini de fonctions de contrainte
différentiables. En utilisant la condition nécessaire duale d’optimalité, on retrouve
le Théorème des multiplicateurs de Lagrange pour les contraintes de type égalité, le
Théorème de Karush-Kuhn-Tucker pour celles de type inégalité, et enfin le théorème
général pour le cas mixte de contraintes de types égalité et inégalité.
4
Quelques révisions d’analyse classique
Ce paragraphe réunit de façon très compacte quelques éléments de base d’analyse classique dont on aura besoin dans les autres chapitres. Ils proviennent de
plusieurs sources (par exemple, entre autres, W. H. Fleming [1], W. Rudin [1],
ou L. Schwartz [1]). Le calcul différentiel ne nécessite pas de prérequis car il sera
complètement traité au Chapitre 3. Les différentes notions de convexité dont on aura
besoin seront introduites dans chaque chapitre, mais le lecteur peut aussi consulter
des ouvrages spécifiquement consacrés à ce sujet comme, par exemple, F. A. Valentine [1], R. T. Rockafellar [1], L. D. Berkovitz [1], S. R. Lay [1],
H. Tuy [1], S. Boyd et L. Vandenberghe [1].
4.1
Plus petite borne supérieure et plus grande borne inférieure
Soient R l’ensemble des nombres réels et |x| la valeur absolue de x. Les notations suivantes seront utilisées pour les réels positifs et les réels strictement positifs
déf
R+ = {x ∈ R : x ≥ 0}
et
déf
R+ = {x ∈ R : x > 0}
et la notation R = R ∪{±∞} pour l’ensemble étendu des réels.
Définition 4.1.
Soit A une partie non vide de R.
a) On dit que b0 ∈ R est une plus petite borne supérieure de A si
i) b0 est une borne supérieure de A,
ii) pour toute borne supérieure M de A, on a b0 ≤ M .
La plus petite borne supérieure b0 de A est unique et sera notée sup A. Si
A n’est pas borné supérieurement, on pose sup A = +∞.
b) On dit que b0 ∈ R est une plus grande borne inférieure de A si
i) b0 est une borne inférieure de A,
ii) pour toute borne inférieure m de A, on a b0 ≥ m.
6
Chapitre 1. Introduction
La plus grande borne inférieure b0 de A est unique et sera notée inf A. Si
A n’est pas borné inférieurement, on pose inf A = −∞.
Remarque 4.1.
(i) Lorsque A 6= ∅, on a donc toujours −∞ ≤ inf A ≤
sup A ≤ +∞. Par définition, sup A ∈ R si et seulement si A est borné
supérieurement et inf A ∈ R si et seulement si A est borné inférieurement.
(ii) Lorsque A = ∅, on écrira sup A = −∞ et inf A = +∞. À première vue,
il peut paraı̂tre choquant d’avoir sup A < inf A, mais, d’un point de vue
mathématique, il s’agit du bon choix puisque sup A < inf A si et seulement
si A = ∅ ou, de façon équivalente, sup A ≥ inf A si et seulement si A 6=
∅.
On utilisera souvent les conditions équivalentes suivantes.
Théorème 4.1. Soit ∅ 6= A ⊂ R.
a) b0 est la plus petite borne supérieure de A si et seulement si
i) b0 est une borne supérieure de A,
ii’) pour tout M tel que b0 > M , il existe x0 ∈ A tel que b0 ≥ x0 > M .
b) b0 est la plus grande borne inférieure de A si et seulement si
i) b0 est une borne inférieure de A,
ii’) pour tout m tel que b0 < m, il existe x0 ∈ A tel que b0 ≤ x0 < m.
c) sup A = +∞ si et seulement si, pour tout M ∈ R, il existe x0 ∈ A tel que
x0 > M .
d) inf A = −∞ si et seulement si, pour tout m ∈ R, il existe x0 ∈ A tel que
x0 < m.
4.2
Espace euclidien
La plupart des résultats de ce livre demeurent vrais dans des espaces vectoriels
de fonctions ou dans des groupes de transformations de dimension infinie. Dans ce
livre on se limitera aux espaces vectoriels de dimension finie qui seront identifiés
au produit cartésien Rn . Par exemple, ces espaces incluent l’espace des polynômes
d’ordre inférieur ou égal à n − 1, n ≥ 1, un entier. Dans ce paragraphe on rappelle
quelques définitions, notions et théorèmes de l’analyse classique.
4.2.1
Produit cartésien, boules, et continuité
Pour un entier n ≥ 1, soit
Rn = R × . . . × R
|
{z
}
n fois
(4.1)
4. Quelques révisions d’analyse classique
7
le produit cartésien de dimension n avec les notations suivantes
un élément
la norme
x = (x1 , . . . , xn ) ∈ Rn
déf
kxkRn =
"
n
X
i=1
x2i
#1/2

x1
 
ou sous forme matricielle ~x =  ... 

xn
et le produit scalaire x · y n xi yi .
(4.2)
On écrira simplement kxk pour la norme lorsque le contexte le permettra et la
flèche sur le vecteur ~x sera souvent omise. Pour n = 1, kxkR1 coı̈ncide avec la valeur
absolue |x|. Rn muni de la multiplication par un scalaire et de l’addition
∀α ∈ R, x ∈ Rn , α x = (αx1 , . . . , αxn )
∀x, y ∈ Rn , x + y = (x1 + y1 , . . . , xn + yn )
est un espace vectoriel sur R de dimension n.
Définition 4.2.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} défini
par
(
1,
si i = j
déf
déf
(eni )j = δij , δij =
0,
si i 6= j,
c’est-à-dire,
en1 = (1, 0, 0, . . . , 0, 0),
en2 = (0, 1, 0, . . . , 0, 0),
...,
enn = (0, 0, 0, . . . , 0, 1).
En particulier, eni · enj = δij .
Lorsque le contexte le permet, on écrira simplement {ei } sans l’indice n.
On appelle espace euclidien un espace vectoriel E que l’on peut identifier à Rn
via une bijection linéaire pour un entier n ≥ 1. Par exemple, on peut identifier à Rn
l’espace P n−1 [0, 1] des polynômes d’ordre inférieur ou égal à n − 1 dans l’intervalle
[0, 1] :
p 7→ (p(0), p′ (0), . . . , p(n−1) (0)) : P n−1 [0, 1] → Rn
déf
(p0 , p1 , . . . , pn−1 ) 7→ p(x) =
4.2.2
n−1
X
i=0
pi
xi
: Rn → P n−1 [0, 1].
i!
Ensembles ouverts et intérieur
Les notions d’ensemble ouvert et d’ensemble fermé dans Rn peuvent être
définis à l’aide de boules.
8
Chapitre 1. Introduction
Boules centrées en x de rayon r > 0 :
boule ouverte
boule fermée
Br (x) = {y ∈ Rn : ky − xk < r}
Br (x) = {y ∈ Rn : ky − xk ≤ r}.
Boule unité centrée en 0 :
ouverte B = {y ∈ Rn : kyk < 1},
fermée B = {y ∈ Rn : kyk ≤ 1}.
Boule ouverte trouée centrée en x :
Br′ (x) = {y ∈ Rn : 0 < ky − xk < r}.
Définition 4.3.
Soit U une partie de Rn .
(i) a ∈ Rn est un point intérieur de U s’il existe r > 0 tel que Br (a) ⊂ U .
(ii) L’intérieur de U est l’ensemble de tous les points intérieurs de U . On le
notera int U . Par définition int U ⊂ U .
(iii) V (x) est un voisinage de x s’il existe r > 0 tel que Br (x) ⊂ V (x).
(iv) A est un ensemble ouvert de Rn pour tout x ∈ A, il existe un voisinage
V (x) de x tel que V (x) ⊂ A.
(v) La famille T de tous les ouverts dans Rn est la topologie de Rn générée
par la norme.
La topologie T de Rn coı̈ncide avec la famille des intersections finies et des réunions
arbitraires des boules ouvertes dans Rn .
4.2.3
Suite de Cauchy, suite convegente
Définition 4.4.
(i) Une suite {xn } dans Rn est convergente s’il existe un point
n
x ∈ R tel que
∀ε > 0, ∃N, ∀n > N,
kxn − xkRn < ε.
Le point x est unique et appelé le point limite de {xn }.
(ii) {xn } dans Rn est une suite de Cauchy si
∀ε > 0, ∃N, ∀n, m > N,
kxn − xm kRn < ε.
Un espace métrique E est dit complet si toute suite de Cauchy. converge vers un
point de E. Rn est un espace complet.
4. Quelques révisions d’analyse classique
4.2.4
9
Ensemble fermé et adhérence
Les notions de point d’adhérence et d’ensemble fermé peuvent être amenées
de plusieurs façons. On utilise ici les notions de point d’accumulation et de point
isolé.
Définition 4.5.
Soit U une partie de Rn .
(i) a ∈ U est un point isolé de U s’il existe r > 0 tel que Br′ (a) ∩ U = ∅.
(ii) a ∈ Rn est un point d’accumulation de U si, pour tout r > 0, Br′ (a) ∩ U 6=
∅.
Définition 4.6.
(i) a ∈ Rn est un point d’adhérence de U si pour tout r > 0
on a Br (a) ∩ U 6= ∅.
(ii) L’adhérence (ou fermeture) de U est l’ensemble de tous les points d’adhérence
de U . On la notera U .
(iii) F est un ensemble fermé s’il contient tous ses points d’accumulation.
Remarque 4.2.
(i) De façon équivalente, x est un point d’adhérence ou de
la fermeture d’une partie U de Rn si, pour tout voisinage V (x) de x,
V (x) ∩ U 6= ∅.
(ii) L’adhérence de U est égale à l’union de ses points isolés et de ses points
d’accumulation. On a donc U ⊂ U .
(iii) Les seules parties de Rn qui soient à la fois ouvertes et fermées sont l’ensemble vide ∅ et l’espace Rn .
4.2.5
Recouvrement ouvert et ensemble compact
Définition 4.7.
(i) Une famille de parties ouvertes {Gα } de Rn est un recouvrement ouvert de E ⊂ Rn si E ⊂ ∪α Gα .
(ii) Une partie non vide E de Rn est dite compacte si tout recouvrement ouvert
{Gα } de E possède un sous recouvrement fini {Gαi : 1 ≤ i ≤ k}.
Théorème 4.2 (Heine–Borel). Soit E une partie non vide de Rn . Alors E est
compacte si et seulement si E est fermée et bornée. 16 17
Dans un espace vectoriel normé V , une partie compacte E de V est fermée
et bornée, mais la réciproque n’est généralement pas vraie sauf dans des espaces
normés de dimension finie.
On a les équivalences suivantes dans les espaces métriques.
Théorème 4.3 (Bolzano–Weierstrass). Soit un espace métrique (X, d) et un sousensemble E de X. Les propriétés suivantes sont équivalentes. 18 19
16.
17.
18.
19.
Heinrich Eduard Heine (1821–1881).
Félix Edouard Justin Émile Borel (1871–1956).
Bernard Placidus Johann Nepomuk Bolzano (1781–1848).
Karl Theodor Wilhelm Weierstrass (1815–1897) fut le chef de file d’une brillante
10
Chapitre 1. Introduction
(i) E est compact.
(ii) E est séquentiellement compact, c’est-à-dire, toute suite {xn } dans E possède
une sous-suite {xnk } qui converge vers un élément x ∈ E.
(iii) Tout sous-ensemble infini U de E possède (au moins) un point d’accumulation dans E, c’est-à-dire, U ′ ∩ E 6= ∅.
4.2.6
Complément et frontière
Définition 4.8.
Soient A et B deux parties de Rn .
déf
(i) A\B = {x ∈ A : x ∈
/ B}. Lorsque A = Rn on écrira ∁B ou Rn \B et on
dira que ∁B est le complément de B par rapport à Rn .
(ii) La frontière de U ⊂ Rn est définie comme U ∩ ∁U . On la notera ∂U .
On peut vérifier que ∂U = U \int U , et U = int U ∪ ∂U , et ∁U = int ∁U ∪ ∂U .
4.3
4.3.1
Application, fonction, continuité et linéarité
Fonction réelle et fonction vectorielle
Définition 4.9.
Soient n ≥ 1 et m ≥ 1 deux entiers, U , ∅ 6= U ⊂ Rn .
(i) On appele fonction numérique ou fonction réelle toute application f :
U ⊂ Rn → R. On dira aussi fonction réelle d’une variable réelle pour une
fonction f : U ⊂ R → R et fonction réelle de plusieurs variables réelles
pour une fonction f : U ⊂ Rn → R, n ≥ 2.
(ii) On appelera fonction vectorielle toute application f : U ⊂ Rn → Rm pour
un entier m ≥ 2.
4.3.2
Continuité et prolongement continu d’une application
Définition 4.10.
Soient deux entiers n ≥ 1 et m ≥ 1, et U , ∅ 6= U ⊂ Rn . Une application f : U → Rm
est continue en x ∈ U si ∀ε > 0, ∃δ(x) > 0 tel que
∀y ∈ U tel que ky − xkRn < δ(x),
kf (y) − f (x)kRm < ε.
(4.3)
La fonction f est continue sur U si f est continue en tout point de U .
Lorsque U est un sous-ensemble fermé de Rn , il existe toujours un prolongement
continu fˆ : Rn → Rm de cette fonction de U à tout Rn .
Théorème 4.4 (H. Tietze [1], 1915). Soit U , ∅ 6= U ⊂ Rn , fermé. Toute
application continue f : U → Rm possède un prolongement continu de U à tout Rn .
école d’analystes, qui entreprirent la révision systématique des divers secteurs de l’analyse
mathématique.
4. Quelques révisions d’analyse classique
11
Remarque 4.3.
Ce résultat demeure vrai dans un espace métrique arbitraire (X, d), mais il est aussi
vrai dans un espace topologique T4 en faisant appel au Lemme de Uryshohn 20 en
Topologie.
La notion de continuité pour une fonction f : Rn → Rm est implicitement
définie à l’aide de boules ouvertes. En effet, la condition (4.3) de la Définition 4.10
peut s’écrire
∀ε > 0, ∃δ(x) > 0 tel que Bδ(x) (x) ∩ U ⊂ f −1 {Bε (f (x))}
pour les boules ouvertes Bε (f (x)) et Bδ(x) (x). Ceci mêne au critère équivalent suivant en termes de voisinages.
Théorème 4.5. Soit une application f : Rn → Rm pour deux entiers n ≥ 1 et
m ≥ 1. La fonction f est continue en x ∈ Rn si et seulement si pour tout voisinage
W de f (x) dans Rm , f −1 {W } est un voisinage de x dans Rn .
Démonstration. Pour tout voisignage W de f (x) il existe ε > 0 tel que Bε (f (x)) ⊂
W . Si f est continue en x, alors par définition, il existe δ(x) > 0 tel que Bδ(x)) (x) ⊂
f −1 {Bε (f (x))}. Comme f −1 {Bε (f (x))} ⊂ f −1 {W }, f −1 {Bε (f (x))} est donc bien
un voisinage de x par définition. Réciproquement, pour tout ε > 0, la boule ouverte
Bε (f (x)) est un voisinage de f (x). Alors f −1 {Bε (f (x))} est un voisinage de x.
Il existe donc une boule ouverte Bδ(x) (x) de rayon δ(x) > 0 tel que Bδ(x) (x) ⊂
f −1 {Bε (f (x))}. D’où la définition ε-δ de la continuité de f en x.
4.3.3
Application linéaire, application transposée et matrices associées
Définition 4.11.
(i) Une application L : Rn → Rm est linéaire si
∀x, y ∈ Rn , ∀α, β ∈ R,
L(αx + βy) = α L(x) + β L(y).
(4.4)
L’ensemble de toutes les applications linéaires de Rn dans Rm sera dénoté
L(Rn , Rm ).
(ii) Soient n ≥ 1 et m ≥ 1 deux entiers. On dénote par
m
{em
i ∈ R : 1 ≤ j ≤ m}
et {eni ∈ Rn : 1 ≤ i ≤ n}
les bases canoniques orthonormales associées à Rm et Rn , respectivement.
On associe à une application linéaire L : Rn → Rm la m × n matrice {Aij }
déf
n
Aij = em
i · Lej ,
Lx · y =
m X
n
X
Aij xj yi
(4.5)
i=1 j=1
pour x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ). Par convention, on utilisera
souvent la même notation A pour L et sa matrice associée.
20. Pavel Samouilovitch Urysohn (1898-1924).
12
Chapitre 1. Introduction
Théorème 4.6.
(i) Soit f : Rn → R une fonction linéaire pour la norme
euclidienne sur Rn . Il existe un élément unique a ∈ Rn tel que
 
x1
 . 
n
∀x ∈ R , f (x) = a · x = a1 . . . an  ..  (sous forme matricielle),
xn
(4.6)
f est continue et
déf
kf kL(Rn ,R) = sup
x6=0
|f (x)|
= kak.
kxkRn
(4.7)
(ii) Soit L : Rn → Rm une application linéaire pour les normes euclidiennes
sur Rn et Rm . Alors L est continue sur Rn . Il existe une matrice m × n
unique A = {aij } telle que
 



x1
a11 . . . a1n
m
n
X
X


 ..
.
m
.


..
..   ... 
aij xj ei =  .
L(x1 , . . . , xn ) =
 , (4.8)
i=1
j=1
xn
am1 . . . amn
où aij = L(enj ) · em
i , et
déf
kLkL(Rn ,Rm ) = sup
x6=0
kLxkRm
≤ kAk2 ,
kxkRn
déf
kAk2 =

m X
n
X

i=1 j=1
a2ij
1/2


. (4.9)
Remarque 4.4.
kAk2 est appelée norme de Frobenius. 21 L(Rn , Rm ) est un espace de Hilbert pour
le produit scalaire (dit de Frobenius) 22
déf
A·· B =
m X
n
X
i=1 j=1
aij bij ,
kAk2 =
√
A·· A,
(4.10)
des matrices A et B associées à deux éléments L et M de L(Rn , Rm ). Il peut
être identifié à Rmn muni de la norme euclidienne kAk2 . La norme de Frobénius
kAk2 est équivalente mais pas égale à la norme kLkL(Rn ,Rm ) de l’application linéaire
correspondante. L(Rn , Rm ) est seulement un espace de Banach pour la norme
kLkL(Rn ,Rm ) .
Démonstration. (i) Soit une fonction linéaire f : Rn → R. Tout point x ∈ Rn peut
s’écrire
x = (x1 , . . . , xn ) =
n
X
xi ei
i=1
21. Ferdinand Georg Frobenius (1849–1917).
22. On peut montrer que A·· B = tr (A⊤ B) = tr (A B ⊤ ).
4. Quelques révisions d’analyse classique
13
et, par linéarité de f ,
f (x) =
n
X
i=1
xi f (ei ) = x · a,
déf
a = (f (e1 ), . . . , f (en )).
Le vecteur a est unique. Pour tout ε > 0, on prend δ = ε/(kak + 1). De là,
∀y, ky − xk < δ
⇒ |f (y) − f (x)| = |f (y − x)| = |a · (y − x)|
≤ kak ky − xk
< kak δ =
kak
ε < ε.
kak + 1
f est donc continue en tout point de Rn .
Si f est identiquement nulle, on prend a = 0. Sinon, par Cauchy-Schwartz,
pour le produit scalaire
∀x ∈ Rn ,
|f (x)| = |x · a| ≤ kxk kak
⇒ kf kL(Rn ,R) =
sup
06=x∈Rn
|f (x)|
≤ kak.
kxk
Mais, comme f (a/kak) = a·(a/kak) = kak, le supremum est atteint et kf kL(Rn ,R) =
kak.
(ii) On applique (i) à chaque composante fi (x) = ei · f (x) de f : il existe
ai ∈ Rn tel que fi (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque
ai , on forme ainsi la matrice A :

 
 
f1 (x)
a1 · x
a11
 ..   ..   ..
f (x) =  .  =  .  =  .
fn (x)
an · x
Le reste est évident.
|
an1
 
x1
. . . a1n
..   .. .
..
.
.  . 
xn
. . . ann
{z
} | {z }
x
A
L’opération de composition de deux applications linéaires correspond à la multiplication de leurs matrices associées.
Théorème 4.7. Soient trois entiers ℓ, m, n plus grands ou égaux à 1.
(i) La composition L ◦ M de L ∈ L(Rℓ , Rm ) et de M ∈ L(Rn , Rℓ )
M
L
ℓ
m
x 7→ M (x) 7→ L(M (x)) : Rn −→
| R
{z −→} R
L◦M
est un élément de L(Rn , Rm ) et
kL ◦ M kL(Rn ,Rm ) ≤ kLkL(Rℓ ,Rm ) kM kL(Rn ,Rℓ ) .
(4.11)
14
Chapitre 1. Introduction
(ii) Si A est la matrice m × ℓ associée à L et B est la matrice ℓ × n associée à
M , alors la matrice m × n associée à la composition L ◦ M est le produit
déf
(A B)ij =
ℓ
X
aik bkj ,
1 ≤ i ≤ m,
k=1
1 ≤ j ≤ n,
(4.12)
des matrices A et B et
kABk2
kAk2
z
}|
{
}|
{
1/2 z(

)1/2
m
ℓ
m X
n

X
XX
a2ik
(A B)2ij
≤


i=1 k=1
i=1 j=1
(iii) Pour tout A ∈ L(Rn , Rm ),
déf
Ker A = {x ∈ Rn : Ax = 0} ⊂ Rn
kBk2
z
}|
{
1/2

ℓ X
n

X
b2kj
.


(4.13)
k=1 j=1
déf
Im A = {Ax : x ∈ Rn } ⊂ Rm (4.14)
et
sont des sous-espaces linéaires de Rn et de Rm , respectivement.
Démonstration. La composition de deux applications linéaires
A
B
Rn −→ Rmm −→ Rk
{en
j }
{ek
ℓ}
{ei }
correspond à la multiplication de leurs matrices associées. En effet,
x = (x1 , . . . , xn ) =
n
X
xj ′ enj′
j ′ =1
Ax =
n
X
j ′ =1
xj ′ Aenj′ =
m
X
i=1


em
i ·
n
X
j ′ =1

xj ′ Aenj′  em
i
(B ◦ A)(x) = B(Ax) =
m
X
(B ◦ A)ℓj = ekℓ · (B ◦ A)(enj ) =
i=1


m
X
i=1
n
X
j ′ =1


n
m
X
X

 m
n
em
=

i · Aej ′ xj ′  ei
| {z }
i=1
j ′ =1
Aij′

Aij ′ xj ′  Bem
i
=
Aij ekℓ · Bem
| {z i }
Bℓi
m
X
Bℓi Aij .
i=1
On introduit l’application transposée ou adjointe A⊤ : Rm → Rn d’une application linéaire A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax : Rn → R est linéaire. Par le Théorème 4.6 (i), il existe un vecteur
unique a(y) ∈ Rn tel que
∀x ∈ Rn ,
a(y) · x = y · Ax
4. Quelques révisions d’analyse classique
15
et ceci induit une application
déf
y 7→ A⊤ y = a(y) : Rm → Rn
(4.15)
qui est linéaire. En effet, pour tout α, β dans R et y1 , y2 dans Rm , on a
∀x ∈ Rn ,
a(αy1 + βy2 ) · x = (αy1 + βy2 ) · Ax = α y1 · Ax + β y2 · Ax
= α a(y1 ) · x + β a(y2 ) · x
= [α a(y1 ) + β a(y2 )] · x
⇒ a(αy1 + βy2 ) = α a(y1 ) + β a(y2 ).
Par construction, A⊤ vérifie l’identité
∀x ∈ Rn , y ∈ Rm ,
y · Ax = A⊤ y · x.
(4.16)
Définition 4.12.
L’application A⊤ : Rm → Rn associée à une application linéaire A : Rn → Rm telle
que définie par (4.15) est appelée application transposée de A.
n
Si Aij = em
i · Aej est la matrice m × n associée à A pour les bases orthonormales
n
m
n
canoniques {ej : 1 ≤ j ≤ n} et {em
i : 1 ≤ i ≤ m} de R et R , alors la matrice
n × m associée à A⊤ est donnée par (A⊤ )ij = Aji .
On complète l’exposé par les définitions suivantes :
Définition 4.13.
Soit A ∈ L(Rn , Rn ) une application linéaire (matrice n × n).
(i) A est symétrique si A⊤ = A (aji = aij ).
(ii) Une application linéaire symétrique A est définie positive (resp., semidéfinie positive) si
∀x ∈ Rn , x 6= 0,
(Ax) · x > 0 (resp., ∀x ∈ Rn ,
(Ax) · x ≥ 0).
On écrira A > 0 (resp., A ≥ 0).
Définition 4.14.
Soit A ∈ L(Rn , Rn ) et C l’ensemble des nombres complexes :
(i) λ ∈ C est une valeur propre de A s’il existe x ∈ Cn non nul tel que
Ax = λx ; on dira que x ∈ Cn est un vecteur propre de A associé à λ ;
(iii) l’ensemble E(λ) = Ker[A − λI] est un sous-espace linéaire de Cn appelé
espace propre de A associé à la valeur propre λ ;
(iv) si l’espace propre E(λ) associé à la valeur propre λ de A est de dimension
un, on dit que la valeur propre est simple.
Les valeurs propres et l’ensemble des vecteurs propres sont donc donnés par
det[A − λI] = 0 et E(λ) = Ker[A − λI].
n
n
(4.17)
Lorsque A⊤ = A, les valeurs propres λ de A ∈ L(R , R ) sont toutes réelles et
E(λ) ⊂ Rn .
16
5
Chapitre 1. Introduction
Exercices
Exercice 5.1.
Soient n ≥ 1 et m ≥ 1 des entiers et L(Rn , Rm ) l’espace des applications linéaires
A : Rn → Rm . On pose L(Rn ) = L(Rn , Rn ),
déf
Ker A = {x ∈ Rn : Ax = 0} ,
déf
Im A = {Ax : x ∈ Rn } .
(i) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est définie
positive et inversible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de
A.
(ii) Montrer que pour A ∈ L(Rn , Rm ), (A⊤ )⊤ = A, Ker A⊤ = (Im A)⊥ et
Im A⊤ = (Ker A)⊥ , où l’orthogonal U ⊥ d’un sous-ensemble U de Rn est
défini par
déf
U ⊥ = {v ∈ Rn : v · u = 0,
∀u ∈ U }.
Chapitre 2
10
10
8
10
6
10
4
10
2
0
10
0.2
0.4
0
10
1
1
0.8
0.6
0.6
0.4
0.2
0
! 0.2
0.8
! 0.4
! 0.6
! 0.8
!1
1
Existence,
convexités
et convexification
Introduction
Dans ce chapitre, Rn sera le produit cartésien muni du produit scalaire et de
la norme (4.2) du Chapitre 1, f : Rn → R ou R ∪{+∞} une fonction objectif et U
une partie non vide de Rn .
Le Théorème de Weierstrass donne des conditions sur U et f pour lesquelles
il existe des points de U réalisant l’infimum inf f (U ) et le supremum sup f (U ) :
compacité de U et continuité de f dans U . En fait, on peut se limiter au problème
de minimisation, car celui de la maximisation se ramène à celui de la minimisation en
mettant un signe moins devant la fonction objectif. En se restreignant à la recherche
de l’infimum, on peut élargir la classe de fonctions objectif à des fonctions f : Rn →
R ∪{+∞} et l’on pourra relaxer la condition de continuité en une condition de semicontinuité inférieure qui permettra d’obtenir l’existence de points minimisants pour
des fonctions discontinues. Des conditions de croissance à l’infini complèteront les
résultats lorsque U est fermé mais non-borné. En absence de compacité, on donne
aussi le Principe variationnel d’Ekeland et quelques unes de ses ramifications comme
le théorème d’existence de Takahashi et celui de point fixe de Caristi. Tous ces
résultats sont vrais pour des espaces vectoriels de dimension finie et les idées et
constructions de bases se généralisent aux espaces de fonctions.
La dernière partie du chapitre est consacrée à la convexité qui joue un rôle
particulier dans le contexte de la minimisation. Si, en plus,de l’existence, la convexité
de f est stricte on obtient l’unicité du point minimisant. Pour des fonctions objectif
convexes, tous les infima sont globaux et égaux. D’où l’idée de convexifier une
fonction et de rechercher l’infimum de sa convexifiée qui coı̈ncidera avec l’infimum
global de la fonction initiale qui peut avoir plusieurs infima locaux. Ceci mène aux
travaux de Legendre, Fenchel et Rockafellar, à l’introduction de la transformée de
Fenchel–Legendre, aux des problèmes primal et dual, et au Théorème de dualité de
Fenchel que l’on reverra au Chapitre 4 dans le contexte des optimisations linéaire
et quadratique.
17
18
2
Chapitre 2. Existence, convexités et convexification
Théorème d’existence de Weierstrass
Le fait d’avoir inf f (U ) fini ne garantit pas l’existence d’un point a ∈ U qui
réalise l’infimum f (a) = inf f (U ) comme l’illustre l’exemple suivant.
Exemple 2.1.
Soit U = R et la fonction
f (x) = 1 si x ≤ 0 et f (x) = x si x > 0
pour laquelle inf f (U ) = 0 et f (x) 6= 0 pour tout x ∈ U = R.
Ce premier théorème est à la base de la théorie de l’optimisation. Il donne des
conditions suffisantes sur U et f pour l’existence de points de U réalisant l’infimum
inf f (U ) et le supremum sup f (U ).
Théorème 2.1 (de Weierstrass 1 ). Soient U une partie compacte non vide de Rn
et une fonction f : U → R continue sur U . Alors
(i) ∃a ∈ U tel que f (a) = sup f (U ),
(ii) ∃b ∈ U tel que f (b) = inf f (U ).
Démonstration. Voir la démonstration plus loin du Theorème 5.1 sous des hypothèses plus faibles.
Les hypothèses de ce théorème sont un peu trop fortes puisqu’il donne à la fois
l’existence de points minimisants et maximisants. En fait. il suffit de chercher des
conditions d’existence d’un point minimisant de f dans U car tout supremum peut
se ramener à un infimum en observant que sup f (U ) = − inf(−f )(U ) et vice versa.
0
1
0
1
Figure 2.1. Fonctions discontinues ayant un point minimisant dans [0, 1].
On devrait pouvoir relaxer la continuité. En effet, les fonctions numériques
dans U = [0, 1] représentées à la Figure 2.1 ne sont que continues par morceaux,
mais atteignent leur minimum en un point de [0, 1]. Au point de discontinuité on
1. Karl Theodor Wilhelm Weierstrass (1815–1897).
3. Extrema des fonctions à valeurs réelles étendues
19
a choisi comme définition de la fonction la valeur inférieure et non pas la valeur
supérieure qui n’aurait pas donné l’existence d’un point minimisant.
3
Extrema des fonctions à valeurs réelles étendues
Le inf f (U ) et le sup f (U ) ont été définis pour des fonctions à valeurs réelles,
c’est-à-dire, f (U ) ⊂ R. Lorsque l’ensemble f (U ) n’est pas vide et n’est pas borné
inférieurement inf f (U ) = −∞ et lorsque il n’est pas borné supérieurement sup f (U ) =
+∞ (cf. Définition 4.1 et Remarque 4.1 du Chapitre 1).
L’idée d’introduire des fonctions objectif prenant les valeurs +∞ ou −∞ et
l’introduction de leur domaine effectif seraient attribuables à R. T. Rockafellar 2
et à J. J. Moreau. 3 Dans ce chapitre on considère non seulement des fonctions
f : Rn → R à valeurs réelles, mais aussi des fonctions f : Rn → R = R ∪{±∞}
pouvant prendre les valeurs +∞ ou −∞ pour lesquelles il est nécessaire de préciser
les définitions du inf f (U ) et du sup f (U ).
Définition 3.1.
Soient f : Rn → R une fonction et U ⊂ Rn .
(i) On associe à f son domaine effectif
déf
dom f = {x ∈ Rn : −∞ < f (x) < +∞} .
(3.1)
On dira aussi simplement domaine de f .
(ii) L’infimum de f par rapport à U est défini comme suit
(
inf f (U ∩ dom f ),
si f (U ) ⊂ R ∪{+∞},
déf
inf f (U ) =
− ∞,
si ∃x ∈ U tel que f (x) = −∞.
On utilisera aussi la notation inf x∈U f (x).
Le supremum de f par rapport à U est défini comme suit
(
si f (U ) ⊂ R ∪{−∞},
sup f (U ∩ dom f ),
déf
sup f (U ) =
+ ∞,
si ∃x ∈ U tel que f (x) = +∞.
2. Ralph Tyrrell Rockafellar (1935– ). ≪Moreau and I independently in those days at
first, but soon in close exchanges with each other, made the crucial changes in outlook which,
I believe, created convex analysis out of convexity. For instance, he and I passed from the
basic objects in Fenchel’s work, which were pairs consisting of a convex set and a finite
convex function on that set, to extended real-valued functions implicitly having effective domains, for which we moreover introduced set-valued subgradient mappings.≫ R. T. Rockafellar,
http ://www.convexoptimization.com/wikimization/index.php/Rockafellar.
3. Jean Jacques Moreau (1923– ) ≪. . .appears as a rightful heir to the founders of differential
calculus and mechanics through the depth of his thinking in the field of nonsmooth mechanics and
the size of his contribution to the development of nonsmooth analysis. His interest in mechanics
has focused on a wide variety of subjects : singularities in fluid flows, the initiation of cavitation,
plasticity, and the statics and dynamics of granular media. Allied to this is his investment in
mathematics in the fields of convex analysis, calculus of variations and differential measures.≫ (cf.
P. Alart, O. Maisonneuve et R. T. Rockafellar [1]).
20
Chapitre 2. Existence, convexités et convexification
On utilisera aussi la notation supx∈U f (x).
Les infima et suprema forment l’ensemble des extrema de f dans U .
(iii) Lorsqu’il existe a ∈ U tel que f (a) = inf f (U ), on dira que f atteint son
minimum en un point de U et l’on écrira
min f (U ) ou min f (x);
x∈U
L’ensemble des points minimisants de f dans U est dénoté par
déf
argmin f (U ) = {a ∈ U : f (a) = inf f (U )} .
(3.2)
Lorsqu’il existe b ∈ U tel que f (b) = sup f (U ), on dira que f atteint son
maximum en un point de U et l’on écrira
max f (U ) or max f (x)
x∈U
L’ensemble des points maximisants de f dans U est dénoté par
déf
argmax f (U ) = {b ∈ U : f (b) = sup f (U )} .
(3.3)
Comme on considère les extrema de fonctions qui peuvent prendre les valeurs
±∞, il convient de donner la démonstration que tout supremum pour f peut se
ramener à l’infimum pour −f et vice versa.
Théorème 3.1. Soient f : Rn → R ∪{±∞} et U ⊂ Rn .
sup f (U ) = − inf(−f )(U )
et
argmax f (U ) = argmin (−f )(U ).
(3.4)
Démonstration. Si U = ∅, alors f (U ) = ∅. Par convention sup f (U ) = −∞ et
inf(−f )(U ) = +∞, d’où sup f (U ) = −∞ = − inf(−f )(U ). On suppose donc que
U 6= ∅.
On élimine deux cas triviaux. S’il existe x ∈ U tel que f (x) = +∞, alors
sup f (U ) = +∞, −f (x) = −∞ et inf −f (U ) = −∞. Le second cas est f (x) = −∞
pour tout x ∈ U qui implique sup f (U ) = −∞ et, pour tout x ∈ U , −f (x) = +∞
et inf −f (U ) = +∞.
Il reste le cas U 6= ∅ et f : Rn → R ∪{−∞} pour lequel il existe x ∈ U tel
que f (x) > −∞. Donc sup f (U ) > −∞.
(i) Soit b0 = sup f (U ) ∈ R. Par la Définition 4.1 du Chapitre 1, b0 est une
borne supérieure, c’est-à-dire, pout tout x ∈ U , f (x) ≤ b0 , et pour toute borne
supérieure M de f (U ) on a b0 ≤ M . Donc pout tout x ∈ U , −f (x) ≥ −b0 et
−b0 est une borne inférieure de −f (U ) = {−f (x) : x ∈ U }. Soit m une borne
inférieure de −f (U ). Alors, −m est une borne supérieure de f (U ) et comme b0 est
la plus petite borne supérieure on a b0 ≤ −m. De là, −b0 ≥ m et −b0 est la plus
grande borne inférieure de −f (U ). Ceci donne inf −f (U ) = −b0 = − sup f (U ) et
− inf −f (U ) = b0 = sup f (U ).
3. Extrema des fonctions à valeurs réelles étendues
21
(ii) Par la convention de la Remarque 4.1 du Chapitre 1, le cas b0 = sup f (U ) =
+∞ correspond à f (U ) non borné supérieurement. Il existe donc une suite {xn } ⊂ U
tel que f (xn ) → +∞. Ceci entraı̂ne que −f (xn ) → −∞ et l’ensemble −f (U )
n’est pas borné inférieurement. Par convention, inf −f (U ) = −∞. D’où sup f (U ) =
+∞ = − inf −f (U ).
L’introduction de fonctions numériques prenant les valeurs ±∞ permet de
remplacer l’infimum de f par rapport à U par l’infimum par rapport à tout Rn en
introduisant la fonction
)
(
f (x),
si x ∈ U
déf
: Rn → R ∪{±∞}.
(3.5)
x 7→ fU (x) =
+ ∞,
si x ∈ Rn \U
Théorème 3.2. Soient U ⊂ Rn et une fonction f : Rn → R ∪{±∞}. Alors
inf f (U ) = inf fU (U ) = inf fU (Rn )
et
argmin f (U ) = U ∩ argmin fU (Rn ).
Si, en plus, inf f (U ) < +∞, alors argmin f (U ) = argmin fU (Rn ).
Démonstration. S’il existe x ∈ U tel que f (x) = −∞, alors fU (x) = −∞ et, par
définition, inf fU (Rn ) = −∞ = inf f (U ). De plus, inf f (U ) = inf fU (U ) puisque
fU = f dans U . Si f (U ) ⊂ R ∪{+∞}, alors f (U ) = fU (U ) ⊂ fU (Rn ) ⊂ R ∪{+∞}
et dom fU = U ∩ dom f puisque fU (x) = +∞ dans Rn \U et f (x) > −∞ dans U .
Donc
inf f (U ∩ dom f ) = inf f (dom fU ) = inf fU (dom fU ) = inf fU (Rn ∩ dom fU )
et, par définition de inf f (U ), inf fU (U ) et inf fU (Rn ),
inf f (U ) = inf fU (U ) = inf fU (Rn ).
(3.6)
Comme inf f (U ) = inf fU (U ) = inf fU (Rn ) et que U ⊂ Rn , on a argmin f (U ) =
argmin fU (U ) ⊂ argmin fU (Rn ) et argmin fU (U ) = U ∩ argmin fU (Rn ). Si, en plus,
inf f (U ) < +∞, on a, par définition de fU , argmin fU (Rn ) ⊂ argmin fU (U ) =
argmin f (U ).
Remarque 3.1.
Dans le cas du supremum, on prolongera f par −∞ en considérant la fonction
)
(
f
(x),
si
x
∈
U
déf
= −(−f )U (x).
(3.7)
f U (x) =
− ∞,
si x ∈ Rn \U
Pour l’infimum deux cas sont triviaux :
(i) il existe x ∈ U tel que f (x) = −∞ ce qui entraı̂ne inf fU (Rn ) = inf f (U ) =
−∞ et x ∈ argmin f (U ) ;
(ii) pour tout x ∈ U , f (x) = +∞, ce qui entraı̂ne inf fU (Rn ) = inf f (U ) = +∞
et argmin f (U ) = U .
22
Chapitre 2. Existence, convexités et convexification
On est alors amené à exclure les cas (i) et (ii) pour l’infimum pour en arriver à la notion de fonction propre que l’on étend à des fonctions qui ne sont pas
nécessairement convexes. La notion duale pour le supremum s’obtient en considérant
l’infimum de −f .
Définition 3.2.
Soit une fonction f : Rn → R ∪ {±∞}.
(i) f est dite propre 4 pour l’infimum si
a) pour tout x ∈ Rn , f (x) > −∞ et
b) il existe x ∈ Rn tel que f (x) < +∞.
Ceci est donc équivalent à f : Rn → R ∪{+∞} et dom f 6= ∅.
(ii) f est dite propre pour le supremum si
a) pour tout x ∈ Rn , f (x) < +∞ et
b) il existe x ∈ Rn tel que f (x) > −∞.
Ceci est donc équivalent à f : Rn → R ∪{−∞} et dom f 6= ∅.
Lorsque le contexte le permet, on dira simplement fonction propre.
Un autre cas trivial est celui où dom f est un singleton, c’est à dire qu’il n’existe
qu’un seul point où f prend une valeur finie.
4
Semi-continuités inférieure et supérieure
Pour pouvoir considérer l’infimum de fonctions discontinues, on affaiblit la
notion de continuité en la décomposant en deux notions plus faibles qui sont simultanément présentes dans la définition de la continuité.
On rapelle qu’une fonction f : Rn → R est continue en a ∈ Rn si
∀ε > 0, ∃δ > 0 tel que ∀x ∈ Bδ (a),
|f (x) − f (a)| < ε.
(4.1)
La boule ouverte Bδ (a) de rayon δ > 0 en a est un voisinage de a. En posant
V (a) = Bδ (a), la condition sur f donne deux conditions suivantes
∀x ∈ V (a),
∀x ∈ V (a),
−ε < f (x) − f (a)
f (x) − f (a) < ε
⇒ f (a) − ε < f (x)
⇒ f (x) < f (a) + ε.
(4.2)
La première condition dit que f (a) se trouve en dessous de tous les points limite
de f (x), lorsque x tend vers a, alors que la seconde dit que f (a) se trouve au
dessus, d’où la décomposition de la continuité en semi-continuité inférieure et semicontinuité supérieure.
Définition 4.1.
Soit U , ∅ 6= U ⊂ Rn .
4. Il ne faut pas confondre fonction propre traduction de l’anglais proper function avec
fonction propre traduction de eigenfunction.
4. Semi-continuités inférieure et supérieure
23
(i) f : U → R ∪{+∞} est semi-continue inférieurement en a ∈ U si
∀h < f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , h < f (x).
(4.3)
f : U → R ∪{+∞} est semi-continue inférieurement dans U si elle est
semi-continue inférieurement en tout point de U .
Par convention, la fonction identiquement égale à −∞ dans U est semicontinue inférieurement dans U .
(ii) f : U → R ∪{−∞} est semi-continue supérieurement en a ∈ U si
∀k > f (a), ∃ un voisinage V (a) de a tel que ∀x ∈ V (a) ∩ U , k > f (x).
(4.4)
f : U → R ∪{−∞} est semi-continue supérieurement dans U si elle est
semi-continue supérieurement en tout point de U .
Par convention, la fonction identiquement égale à +∞ dans U est semicontinue supérieurement dans U .
On utilisera les abbréviations sci pour semi-continue inférieurement et scs pour
semi-continue supérieurement.
Les fonctions de la Figure 2.1 sont sci dans ]0, 1[ . La fonction identiquement égale
à +∞ est sci et celle identiquement égale à −∞ est scs dans Rn . Comme on l’a vu
au début, la définition (4.1) de la continuité d’une fonction f : Rn → R en un point
a ∈ Rn est équivalente aux deux conditions (4.2) : la première est la sci en a avec
h = f (a) − ε < f (a) et la seconde est la scs en a avec k = f (a) + ε > f (a).
Pour U fermé, on a, comme pour les fonctions continues sur U , un prolongement sci à tout Rn .
Lemme 4.1. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞} sci dans U .
Alors, la fonction
)
(
f (x),
si x ∈ U
: Rn → R ∪{+∞}
x 7→ fU (x) =
+ ∞,
si x ∈ Rn \U
(définie en (3.5)) est un prolongement sci de f dans Rn .
Remarque 4.1.
En général, si U n’est pas fermé, fU n’est pas sci, mais cette condition n’est pas
nécessaire. En effet, soit U = (0, 1] et f (x) = 1/x dans U . Le prolongement
)
(
1/x,
si 0 < x ≤ 1
: R → R ∪{+∞}.
x 7→ fU (x) =
+ ∞,
si x ∈ R \(0, 1]
est sci. Il suffit de montrer que fU est sci en x = 0. En effet, pour tout h < fU (0) =
+∞, on prend comme voisinage de 0, V (0) = (−∞, 1/h) pour lequel f (x) > h.
24
Chapitre 2. Existence, convexités et convexification
Démonstration du Lemma 4.1. La fonction fU est sci en tout point a ∈ Rn \U . En
effet, V (a) = Rn \U est un ouvert non vide contenant a puisque U est fermé. C’est
donc un voisinage de a. Pour tout h < f (a) = +∞,
∀x ∈ V (a),
h < +∞ = f (x)
et, par définition, fU est sci sur Rn \U . Comme pour tout a ∈ U , fU (a) = f (a) et
f est sci en tout point de U , il existe donc un voisinage V (a) de a tel que
∀x ∈ V (a) ∩ U,
h < f (x)
⇒ ∀x ∈ V (a),
h < f (x) ≤ fU (x),
puisque, par construction, fU (x) = +∞ sur Rn \U . fU est donc aussi sci en tout
point de U .
Exemple 4.1.
La fonction indicatrice d’une partie fermée U de Rn
(
0,
si x ∈ U,
déf
IU (x) =
+ ∞,
si x ∈
/ U,
est sci dans tout Rn car IU = fU pour la fonction x 7→ f (x) = 0 : U ⊂ Rn → R.
Comme dans le cas du supremum et de l’infimum où sup f (U ) = − inf −f (U ),
f est scs en x si et seulement si −f est sci en x et il suffira d’étudier les propriétés
des fonctions sci.
Théorème 4.1.
(i) f : Rn → R ∪{−∞} est scs en x si et seulement si −f :
n
R → R ∪{+∞} est sci en x.
(ii) f : Rn → R ∪{+∞} est sci en x si et seulement si −f : Rn → R ∪{−∞}
est scs en x.
Démonstration. Comme f : Rn → R ∪{−∞}, on a −f : Rn → R ∪{+∞}. Soit
h < −f (x), alors f (x) < −h. Comme f est scs en x, il existe un voisinage V (x)
de x tel que pour tout y ∈ V (x), f (y) < −h. Ceci entraı̂ne pour tout y ∈ V (x),
−f (y) > h. Par définition, −f est sci en x. La réciproque est similaire.
Il est facile de vérifier les propriétés suivantes des fonctions sci (voir les exercices 9.1 à 9.4) en utilisant la convention (+∞) + (+∞) = +∞, (+∞) + a = +∞
pour tout a ∈ R, et (+∞) a = (a/kak) ∞ pour tout a ∈ R différent de 0.
Théorème 4.2.
(i) Pour tout f : Rn → R ∪{+∞} et tout g : Rn → R ∪{+∞}
n
sci en a ∈ R , la fonction
déf
x 7→ (f + g)(x) = f (x) + g(x): Rn → R ∪{+∞}
est sci en a.
4. Semi-continuités inférieure et supérieure
25
(ii) Pour tout λ > 0 et tout f : Rn → R ∪{+∞} sci en a ∈ Rn , la fonction
déf
x 7→ (λf )(x) = λf (x) : Rn → R ∪{+∞}
est sci en a.
(iii) Pour toute famille {fα }α∈A (A un ensemble d’indices possiblement infini)
de fonctions fα : Rn → R ∪{+∞} sci en a ∈ Rn , l’ enveloppe supérieure
x 7→
déf
sup fα (x) = sup fα (x): Rn → R ∪{+∞}
α∈A
α∈A
est sci en a ∈ Rn .
(iv) Pour toute famille finie fi : Rn → R ∪{+∞}, 1 ≤ i ≤ m, de fonctions sci
en a ∈ Rn , l’ enveloppe inférieure
déf
x 7→
min fi (x) = min fi (x): Rn → R ∪{+∞}
1≤i≤m
1≤i≤m
est sci en a ∈ Rn .
(v) Pour une fonction f : Rn → R et un point a ∈ Rn
f continue en a
⇐⇒
f est sci et scs en a.
(vi) Pour une application linéaire A : Rm → Rn et une fonction f : Rn →
R ∪{+∞} sci en Ax, f ◦ A : Rm → R ∪{+∞} est sci en x.
La propriété (iv) n’est pas nécessairement vraie pour l’enveloppe inférieure
d’une famille infinie de fonctions sci comme le montre l’exemple suivant.
Exemple 4.2.
Pour chaque entier k ≥ 1, soit la fonction numérique continue


si x ∈ [0, 1],
1,
déf
fk (x) = 1 − k(x − 1),
si x ∈ [1, 1 + 1/k],


0,
si x ∈ [1 + 1/k, 2].
Il est facile de vérifier que
inf fk (x) =
k≥1
(
1,
0,
si x ∈ [0, 1],
si x ∈ ]1, 2],
est une fonction scs mais pas sci en x = 1.
La semi-continuité inférieure (resp., supérieure) peut aussi être caractérisée
par la limite inférieure (resp., supérieure).
26
Chapitre 2. Existence, convexités et convexification
Définition 4.2.
Pour une fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞})
déf
déf
lim inf f (x) = sup inf f (x) resp., lim sup f (x) = inf sup
x→a
ε>0
x6=a
kx−ak<ε
ε>0
x→a
x6=a
kx−ak<ε
f (x) .
Théorème 4.3. La fonction f : Rn → R ∪{+∞} (resp., f : Rn → R ∪{−∞}) est
sci (resp., scs) en a si et seulement si
lim inf f (x) ≥ f (a)
resp., lim sup f (x) ≤ f (a) .
(4.5)
x→a
x→a
Démonstration. (⇒) Si f est sci en a, pour tout h < f (a), il existe un voisinage
V (a) de a tel que pour tout x ∈ V (a), f (x) > h. Comme V (a) est un voisinage de
a il existe une boule Bε (a), ε > 0, tel que Bε (a) ⊂ V (a) et
∀x ∈ Bε (a),
f (x) > h
⇒
inf
x∈Bε (a)
x6=a
f (x) ≥ h
⇒ sup
inf
ε>0 x∈Bε (a)
x6=a
f (x) ≥ h.
L’inégalité étant vraie pour tout h < f (a), on peut faire tendre h vers f (a) :
lim inf f (x) ≥ h
x→a
⇒ lim inf f (x) ≥ f (a).
x→a
(⇐) Pour tout h tel que f (a) > h, on a par hypothèse


lim inf f (x) = sup  inf
x→a
ε>0
x∈Bε (a)
x6=a
f (x) ≥ f (a) > h.
Par définition du sup, pour ce h, il existe ε0 > 0 tel que


sup  inf
ε>0
x∈Bε (a)
x6=a
f (x) ≥
inf
x∈Bε0 (a)
x6=a
f (x) > h
⇒ ∀x ∈ Bε0 (a), f (x) > h.
Comme Bε0 (a) est un voisinage de a, f est sci en a.
On a comme corollaire la caractérisation suivante de l’épigraphe.
Définition 4.3.
L’épigraphe d’une fonction f : Rn → R ∪{+∞} est l’ensemble
déf
épi f = {(x, µ) ∈ Rn × R : x ∈ dom f et µ ≥ f (x)} .
(4.6)
L’épigraphe épi f est non vide si et seulement si dom f 6= ∅, c’est-à-dire, lorsque f
est propre pour l’infimum.
4. Semi-continuités inférieure et supérieure
27
Lemme 4.2. La fonction f : Rn → R ∪{+∞} est sci dans Rn si et seulement si
son épigraphe épi f est fermé dans Rn × R.
Remarque 4.2.
Cependant, le domaine effectif dom f d’une fonction f sci n’est pas nécessairement
fermé, comme le montre l’exemple de la fonction f (x) = 1/|x| si x 6= 0 et +∞ si
x = 0, où dom f = R \{0}.
Démonstration. Si f est sci dans Rn , considérons une suite de Cauchy (xn , µn ) ∈
épi f . On a donc µn ≥ f (xn ) et il existe (x, µ) ∈ Rn × R tel que xn → x et µn → µ.
Comme f est sci dans Rn ,
µ = lim µn = lim inf µn ≥ lim inf f (xn ) ≥ f (x),
n→∞
n→∞
n→∞
x ∈ dom f , et (x, µ) ∈ épi f . L’épigraphe de f est donc fermé dans Rn × R. Réciproquement, supposons que épi f est fermé dans Rn × R. Soient x ∈ Rn et h < f (x). Le
point (x, h) ∈
/ épi f . Il existe donc un voisinage W (x, h) tel que W (x, h) ∩épi f = ∅.
En particulier, il existe un voisinage V (x) de x tel que V (x) × {h} ⊂ W (x, h) et
donc pour tout y ∈ V (x), f (y) > h et f est sci dans Rn .
On donne maintenant un certain nombre de caractérisations de la semi-continuité
en préparation du Théorème 5.1.
f (x)
f (a)
h
x
a
Gh
Figure 2.2. Exemple d’une fonction semi-continue inférieurement.
Lemme 4.3. Soit f : Rn → R ∪{+∞}. Les conditions suivantes sont équivalentes :
(i) f est sci dans Rn .
28
Chapitre 2. Existence, convexités et convexification
(ii) ∀h ∈ R, Gh = {x ∈ Rn : f (x) > h} est ouvert dans Rn (voir la Figure 2.2).
(iii) ∀h ∈ R, Fh = {x ∈ Rn : f (x) ≤ h} est fermé dans Rn .
Démonstration. (i) ⇒ (ii). Si Gh = ∅, Gh est ouvert. Si Gh 6= ∅, pour tout a ∈ Gh ,
on a f (a) > h et, comme f est sci en a, il existe un voisinage V (a) de a tel que
∀x ∈ V (a),
f (x) > h
⇒
V (a) ⊂ Gh .
Donc a ∈ int Gh et Gh est ouvert.
(ii) ⇒ (i). Soit a ∈ Rn et h tel que f (a) > h. Par défintion de Gh , a ∈ Gh .
Comme Gh est ouvert, c’est un voisinage de a et, pour tout x ∈ Gh , on a f (x) > h.
Par définition, f est donc sci en a et, a fortiori, en tout point de Rn .
(ii) ⇐⇒ (iii) est évident.
L’utilisation de ces lemmes pour une fonction f : U → R ∪{+∞} sci dans un
sous-ensemble U de Rn nécessite le lemme suivant.
Lemme 4.4. Soient U ⊂ Rn non vide fermé et f : U → R ∪{+∞}. Les conditions
suvantes sont équivalentes :
(i) f est sci dans U .
(ii) fU est sci dans Rn .
(iii) ∀h ∈ R, Gh = {x ∈ Rn : fU (x) > h} est ouvert dans Rn .
(iv) ∀h ∈ R, Fh = {x ∈ U : f (x) ≤ h} est fermé dans Rn .
En particulier, pour tout h
{x ∈ Rn : fU (x) ≤ h} = {x ∈ U : f (x) ≤ h}.
(4.7)
Démonstration. (i) ⇒ (ii) Du Lemme 4.1.
(ii) ⇒ (i) Si fU est sci dans Rn , sa restriction f = fU |U is sci dans U .
(ii) ⇔ (iii). Par le Lemme 4.3.
(iii) ⇔ (iv). Par le Lemme 4.3, la condition (iii) est équivalente à :
∀h ∈ R,
{x ∈ Rn : fU (x) ≤ h} est fermé dans Rn .
Il suffit alors de remarquer que, puisque fU (x) = +∞ pour tout x ∈ Rn \U , on a
{x ∈ Rn : fU (x) ≤ h} = {x ∈ U : fU (x) ≤ h} = Fh .
Ceci permet de travailler dans Rn plutôt que dans U .
Exemple 4.3.
La fonction indicatrice d’une partie fermée U de Rn
(
0,
si x ∈ U,
déf
IU (x) =
+ ∞,
si x ∈
/ U,
est sci dans tout Rn . En fait IU = fU pour la fonction x 7→ f (x) = 0 : Rn → R.
5. Existence de points minimisants dans U
29
Pour compléter ce paragraphe, on donne la définition de ≪lower semi-continuous hull ≫ d’une fonction f , dénotée cl f suivant la terminologie ≪closure ≫ de
R. T. Rockafellar [1]. Elle correspond à la définition de la régularisée sci que
l’on retrouve dans I. Ekeland et R. Temam [1].
Définition 4.4.
(i) La régularisée sci d’une fonction f : Rn → R ∪{+∞} est
l’enveloppe supérieure des fonctions sci inférieures ou égales à f
déf
cl f (x) =
sup
g(x).
(4.8)
g sci et
g≤f dans Rn
S’il existe g sci dans Rn tel que g ≤ f dans Rn , cl f est sci dans Rn . Sinon,
on pose cl f (x) = −∞ par convention.
(ii) La régularisée scs d’une fonction f : Rn → R ∪{−∞} est définie comme
l’enveloppe inférieure des fonctions scs supérieures ou égales à f
cl
scs f (x)
déf
=
inf
g scs et
f ≤g dans Rn
g(x).
S’il existe g scs dans Rn tel que f ≤ g dans Rn , cl
Sinon, on pose cl scs f (x) = +∞ par convention.
Noter que la définition de la régularisée scs revient à cl
5
5.1
scs f
(4.9)
scs f
est scs dans Rn .
= −cl (−f ).
Existence de points minimisants dans U
U compact
On peut maintenant affaiblir les hypothèses du théorème de Weierstrass (Théorème 2.1) en séparant la recherche de l’infimum de celle du supremum.
Théorème 5.1. Soit U , ∅ 6= U ⊂ Rn , compact.
(i) Si f : U → R ∪{+∞} est sci dans U , alors
∃a ∈ U tel que f (a) = inf f (U ).
(5.1)
Si U ∩ dom f 6= ∅, alors inf f (U ) ∈ R.
(ii) Si f : U → R ∪{−∞} est scs dans U , alors
∃b ∈ U tel que f (b) = sup f (U ).
(5.2)
Si U ∩ dom f 6= ∅, alors sup f (U ) ∈ R.
En particulier, argmin f (U ) = ∩k>inf f (U) Fk , où Fk = {x ∈ U : f (x) ≤ k}.
Comme U est compact, il est fermé. Par le Lemme 4.4, on pourra utiliser la
fonction fU qui est sci dans tout Rn sans changer l’infimum puisque inf f (U ) =
inf fU (Rn ) par le Théorème 3.2. Pour le supremum de f : U → R ∪{−∞} scs dans
U fermé, la fonction f U définie en (3.7) de la Remarque 3.1 est scs dans Rn .
30
Chapitre 2. Existence, convexités et convexification
Démonstration du Théorème 5.1. Soit m = inf f (U ). Comme U est compact, il est
fermé. Par le Lemme 4.4 la fonction fU associée à f définie par (3.5) est sci dans
tout Rn et par le Théorème 3.2 on a m = inf f (U ) = inf fU (U ) = inf fU (Rn ).
Si m = +∞, alors f est identiquement égale à +∞ dans U et tous les points
de U sont minimisants. Si m < +∞, alors pour tout réel k > m, l’ensemble
Fk = {x ∈ U : f (x) ≤ k} = {x ∈ Rn : fU (x) ≤ k}
est fermé par la sci de fU dans Rn (Lemme 4.4) et l’ensemble
∁Fk = {x ∈ Rn : fU (x) > k} = ∁U ∪ {x ∈ U : f (x) > k}
est ouvert. Fk est aussi non vide puisque par définition du inf, pour tout k tel que
m < k, il existe f (x) ∈ f (U ) tel que m = inf f (U ) ≤ f (x) < k.
On veut montrer que ∩k>m Fk 6= ∅. On procède par contradiction. Si cette
intersection est vide, alors
Rn = ∁ [∩k>m Fk ] = ∪k>m ∁Fk
⇒ U ⊂ Rn = ∪k>m ∁Fk .
La famille {∁Fk : m < k} est donc un recouvrement ouvert du compact U . Par
définition de la compacité, il existe un sous-recouvrement fini of U
U ⊂ ∪ℓj=1 ∁Fkj
⇒
⇒ U = U ∩ ∪ℓj=1 ∁Fkj = ∪ℓj=1 U \Fkj
∀x ∈ U, f (x) = fU (x) > min{k1 , . . . , kℓ } > m
⇒ inf f (U ) ≥ min{k1 , . . . , kℓ } > m = inf f (U ).
Ceci contredit la comjecture que l’intersection des {Fk : k > m} est vide.
Puisque ∩k>m Fk 6= ∅, tout élément
a ∈ ∩k>m Fk ⊂ U ,
appartient à U et
∀k > m, f (a) ≤ k
⇒
f (a) ≤ m = inf f (x) ≤ f (a)
x∈U
en laissant k tendre vers m. Le point a dans U est un point minimisant ainsi que
tous les points dans l’intersection des Fk : argmin f (U ) = ∩k>m Fk .
Il est important d’observer que, en général, on ne peut remplacer l’infimum
par rapport à U par l’infimum par rapport à sa fermeture U même si f est sci. On
n’a seulement que
inf f (U ) ≥ inf f (U )
comme le montre l’exemple suivant.
5. Existence de points minimisants dans U
|
1
31
0
|
−1
0
1
Figure 2.3. Fonction sci, mais pas scs en 0.
Exemple 5.1.
Soient U = [−1, 1]\{0} et la fonction sci
(
1,
f (x) =
0,
si x 6= 0,
si x = 0.
Alors U = [−1, 1] et
inf f (U ) = 1 > 0 = inf f (U ).
De plus, f n’est pas scs en 0. En effet, pour 1/2 > 0 = f (0) l’ensemble
{x ∈ [−1, 1] : f (x) < 1/2} = {0}
n’est pas un voisinage de 0.
On a cependant la condition suffisante suivante.
Théorème 5.2. Soient U , ∅ 6= U ⊂ Rn , et f : U → R scs dans U . Alors
inf f (U ) = inf f (U ).
Démonstration. Comme U ⊂ U , on a
inf f (U ) ≤ inf f (U ).
Comme U 6= ∅ les deux inf sont bornés supérieurement. Si inf f (U ) = −∞, alors
inf f (U ) = −∞ et le résultat est vrai. Si inf f (U ) est fini, supposons que
inf f (U ) < inf f (U ).
Par définition de inf f (U ), il existe x0 ∈ U tel que
inf f (U ) ≤ f (x0 ) < inf f (U ).
32
Chapitre 2. Existence, convexités et convexification
Comme f est scs, il existe un voisinage V (x0 ) de x0 tel que
∀x ∈ U ∩V (x0 ),
f (x) < inf f (U ).
Mais x0 ∈ U est un point d’adhérence de U pour lequel on a V (x0 ) ∩ U 6= ∅.
Il existe donc u ∈ U tel que f (u) < inf f (U ). Mais ceci est une contradiction et
inf f (U ) = inf f (U ).
5.2
U fermé mais pas nécessairement borné
Par le Théorème 5.1 on peut maintenant dire que les fonctions de la Figure 2.1
possèdent au moins un point minimisant dans le compact U = [0, 1] de R. Cependant, dans sa forme présente, ce théorème est encore quelque peu restrictif car il ne
nous permet pas de traiter le cas simple suivant
déf
inf f (Rn ),
f (x) = kxk2 ,
x ∈ Rn .
La difficulté provient du fait que l’ensemble Rn n’est pas borné et donc pas compact.
Remarque 5.1.
En analysant la démonstration du théorème précédent, on s’aperçoit que l’on a pas
vraiment besoin de la compacité de U . Puisque les parties fermés Fk de U forment
une suite croissante
Fk1 ⊂ Fk2 ⊂ U, ∀k2 ≥ k1 > m,
alors, pour tout k̄ > m, ∩k̄≥k>m Fk = ∩k>m Fk . Il suffit donc de trouver un k̄ ∈ R
pour lequel la section inférieure Fk̄ = {x ∈ U : f (x) ≤ k̄} soit non vide et bornée
(donc compacte 5 au lieu de faire l’hypothèse sur U .
Définition 5.1.
Soit U une partie non vide de Rn .
(i) La fonction f : U → R ∪{+∞} est à section inférieure bornée dans U s’il
existe k ∈ R tel que la section inférieure
Fk = {x ∈ U : f (x) ≤ k}
(5.3)
soit non vide et bornée.
(ii) La fonction f : U → R ∪{−∞} est à section supérieure bornée dans U s’il
existe k ∈ R tel que la section supérieure
déf
F k = {x ∈ U : f (x) ≥ k}
(5.4)
soit non vide et bornée.
Lorsque U est une partie non vide compacte de Rn (c’est-à-dire, bornée et fermée),
alors toute fonction f propre pour l’infimum est à section inférieure bornée dans U .
5. En dimension finie, un ensemble est compact si et seulement si il est borné et fermé par
le théorème de Heine-Borel (Théorème 4.2 du Chapitre 1).
5. Existence de points minimisants dans U
33
Théorème 5.3. Soit U une partie non vide et fermée de Rn .
(i) Si f : U → R ∪{+∞} est une fonction sci dans U et à section inférieure
bornée dans U , alors
∃a ∈ U tel que f (a) = inf f (U ) ∈ R .
(5.5)
(ii) Si f : U → R ∪{−∞} est une fonction scs dans U et à section supérieure
bornée dans U , alors
∃b ∈ U tel que f (b) = sup f (U ) ∈ R .
(5.6)
Exemple 5.2 (fonction distance).
Soit U , ∅ 6= U ⊂ Rn , fermé et x ∈ Rn . On veut montrer qu’il existe x̂ ∈ U tel que
déf
dU (x) = inf kx − yk = kx − x̂k
y∈U
(5.7)
et
∀x1 , x2 ∈ Rn ,
|dU (x2 ) − dU (x1 )| ≤ kx2 − x1 k.
(5.8)
On considère l’infimum
inf f (y),
y∈U
déf
f (y) = ky − xk.
La fonction f est continue et donc sci dans Rn . Soient y0 ∈ U et k = ky0 − xk. La
section inférieure
déf
Fk = {y ∈ U : ky − xk ≤ k}
est non vide puisque y0 ∈ Fk et bornée puisque
∀y ∈ Fk ,
kyk ≤ kxk + ky − xk ≤ kxk + ky0 − xk ≤ kxk + k.
La fonction f est donc à section inférieure bornée dans U . Par le Théorème 5.3 (i),
il existe un point minimisant x̂ ∈ U .
Pour tout y ∈ U
kx2 − yk ≤ kx1 − yk + kx2 − x1 k
n
⇒ ∀x1 , x2 ∈ R ,
⇒ inf kx2 − yk ≤ inf kx1 − yk + kx2 − x1 k
y∈U
y∈U
dU (x2 ) − dU (x1 ) ≤ kx2 − x1 k.
En interchangeant les rôles de x1 et x2 , on obtient |dU (x2 ) − dU (x1 )| ≤ kx2 −
x1 k.
Exemple 5.3 (fonction distance).
Soit U , ∅ 6= U ⊂ Rn , pas nécessairement fermé et x ∈ Rn . Comme dans l’exemple
précédent on définit
déf
dU (x) = inf kx − yk.
y∈U
(5.9)
Comme U ⊂ U , on a dU (x) ≥ dU (x). Cependant, comme la fonction y 7→ ky − xk
est continue, elle est scs et par le Théorème 5.2, dU (x) = dU (x).
34
5.3
Chapitre 2. Existence, convexités et convexification
Condition de croissance à l’infini
La simple croissance vers +∞ de la fonction lorsque la norme kxk tend vers
l’infini entraı̂ne la propriété de section inférieure bornée.
Définition 5.2.
Soient U , ∅ 6= U ⊂ Rn , non bornée et f : U → R ∪{+∞}. La fonction f est
croissante à l’infini dans U si
lim
x∈U, kxk→∞
f (x) = +∞.
Théorème 5.4. Soit U , ∅ 6= U ⊂ Rn , non-bornée. Si f : Rn → R ∪{+∞} est
croissante à l’infini dans U et si dom f ∩ U 6= ∅, elle est à section inférieure bornée
dans U .
Démonstration. Nous allons démontrer qu’il existe un k ∈ R tel que la section
Fk = {x ∈ U : f (x) ≤ k}
soit bornée et non vide. Comme dom f ∩ U 6= ∅, pour x ∈ dom f ∩ U , posons
k = f (x). La section Fk n’est donc pas vide. Par hypothèse de croissance à l’infini
dans U ,
∃R(k) > 0 tel que ∀x ∈ U et kxk > R(k),
f (x) > k.
On en conclut que
Fk = {x ∈ U : f (x) ≤ k} ⊂ {x ∈ U : kxk ≤ R(k)}
et que Fk est non vide et borné.
Considérons quelques exemples génériques.
Exemple 5.4.
Les fonctions f (x) = |x| et f (x) = x2 sont croissantes à l’infini dans R.
Exemple 5.5.
La fonction f (x) = x − b n’est pas croissante à l’infini dans R. En effet, il suffit de
prendre la suite xn = −n pour les entiers positifs n tendant vers l’infini.
Exemple 5.6.
La fonction f (x) = sin x + (1 + x)2 est croissante à l’infini dans R. En effet
f (x) ≥ −1 + (1 + x)2 = x2 − 2x → +∞
lorsque |x| → ∞.
5. Existence de points minimisants dans U
35
Exemple 5.7.
Soit la fonction
f (x1 , x2 ) = (x1 + x2 )2 .
Alors f n’est pas croissante à l’infini dans R2 . Il suffit de prendre la suite {(n, −n)},
n ≥ 1,
f (n, −n) = (n − n)2 = 0 6→ +∞.
Cependant, f est croissante à l’infini dans
U = {(x1 , 0) : x1 ∈ R}
car
f (x) = x21 → +∞
lorsque |x1 | tend vers +∞ dans U .
Théorème 5.5. Les fonctions x 7→ f (x) = kx − akp , p ≥ 1, sont croissantes à
l’infini dans Rn (a ∈ Rn est fixé).
Démonstration. En effet, on peut écrire
p
x
a f (x) = kxkp −
kxk kxk .
Lorsque kxk → ∞ le terme
x
a −
kx | kxk converge vers 1 et donc sa puissance p converge aussi vers 1. Pour p ≥ 1, kxkp → +∞
lorsque kxk tend vers +∞. La limite de f (x) est le produit des deux limites.
Pour l’exemple suivant, on aura besoin du lemme suivant pour les applications
linéaires définies positives (voir la Définition 4.13 du Chapitre 1).
Lemme 5.1. Une matrice symétrique A est définie positive si et seulement si
∃α > 0, ∀x ∈ Rn , (Ax) · x ≥ αkxk2 .
Dans ce cas,
∀x ∈ Rn ,
kAxk ≥ αkxk
et l’inverse A−1 est aussi définie positive.
Démonstration. (⇐) S’il existe α > 0 tel que
∀x ∈ Rn ,
alors
∀x ∈ Rn , x 6= 0,
(Ax) · x ≥ αkxk2 ,
(Ax) · x ≥ αkxk2 > 0
36
Chapitre 2. Existence, convexités et convexification
et A > 0.
(⇒) Dans l’autre sens si A > 0, alors
∀x ∈ Rn ,
(Ax) · x ≥ 0.
Supposons qu’il n’existe pas de α > 0 tel que
∀x ∈ Rn ,
(Ax) · x ≥ αkxk2 .
Alors pour tout entier k > 0, il existe xk tel que
0 ≤ Axk · xk <
1
kxk k2
k
⇒ xk 6= 0.
On peut alors diviser par kxk k2 ce qui donne
0≤A
xk
xk
1
·
<
kxk k kxk k
k
⇒ lim A
k→∞
xk
xk
·
= 0.
kxk k kxk k
Les points sk = xk /kxk k appartiennent à la sphère S = {x ∈ Rn : kxk = 1}
qui est compacte dans Rn . Par le théorème de Bolzano–Weierstrass (Théorème 4.3,
Chapitre 1), il existe une sous-suite {skℓ } de {sk } qui converge vers un point s de
S:
∃s, ksk = 1 tel que 0 = lim Askℓ · skℓ = As · s.
ℓ→∞
Donc
∃s 6= 0 tel que
As · s = 0 =⇒ A ≯ 0.
Ceci contredit l’hypothèse que A > 0. D’où le résultat.
Pour montrer que A est inversible, il suffit de vérifier que sous l’hypothèse
A > 0, l’application linéaire A : Rn → Rn est injective. Ceci revient à montrer que
Ax = 0 entraı̂ne x = 0. En utilisant le résultat que nous venons de démontrer, on
vérifie facilement les implications suivantes
Ax = 0
⇒ 0 = Ax · x ≥ α kxk2
⇒ x = 0.
En particulier, pour x 6= 0,
kAxk kxk ≥ Ax · x ≥ α kxk2
⇒ kAxk ≥ αkxk.
Enfin, comme
∀y ∈ Rn ,
A−1 y · y = A−1 y · A(A−1 y) ≥ αkA−1 yk2 ≥ 0,
A−1 est semi-définie positive. De plus, comme A−1 est injective,
0 = A−1 y · y ≥ αkA−1 yk2
et A−1 est définie positive.
⇒ A−1 y = 0
⇒ y=0
5. Existence de points minimisants dans U
37
Exemple 5.8.
Soit A une matrice n × n symétrique tel que A > 0. On associe à A et à un vecteur
arbitraire b de Rn la fonction numérique suivante 6
f (x) =
1
(Ax) · x + b · x, x ∈ Rn .
2
Par le Lemme 5.1 appliqué à la matrice A, il existe α > 0 tel que
∀x ∈ Rn ,
Ax · x ≥ αkxk2 .
Il vient
f (x) =
1
(Ax) · x + b · x
2
=⇒ f (x) ≥
1
αkxk2 − kbk kxk
2
et la fonction f est croissante à l’infini dans Rn . Comme f est polynômiale, elle est
continue et comme U = Rn est fermé, on a l’existence d’un point minimisant.
5.4
Quelques propriétés de l’ensemble des points minimisants
Revenons à l’infimum de f par rapport à U , ∅ 6= U ⊂ Rn . Dans la démonstration du Théorème 5.1, on vu que que, pour f : U → R ∪{+∞}, l’ensemble des
points minimisants de f par rapport à U est donné par
argmin f (U ) =
\
k>m
Fk , où m = inf f (U ) et Fk = {x ∈ U : f (x) ≤ k}.
On peut donc déduire certaines propriétés de argmin f (U ) de celles des Fk .
En utilisant le fait que, pour U fermé, les sections inférieures {Fk } d’une
fonction f sci sont fermées, on obtient que argmin f (U ) est fermé en tant qu’intersection d’une famille de fermés par l’dentité (5.4). Si, de plus, f est à section
inférieure bornée, alors il existe k0 tel que la section Fk0 soit non vide et bornée.
Fk0 est donc compact car il est aussi fermé. Comme m est l’infimum et que Fk0 est
non vide, argmin f (U ) ⊂ Fk0 . On a donc
argmin f (U ) =
\
k>m
Fk ⊂ Fk0
et l’ensemble argmin f (U ) est compact comme sous-ensemble fermé du compact
Fk0 . On peut alors énoncer le résultat suivant.
Théorème 5.6. Soient U , ∅ 6= U ⊂ Rn , fermé et f : U → R ∪{+∞} sci dans
U . Alors, argmin f (U ) est fermé (possiblement vide). Si, en plus, f est à section
inférieure bornée dans U alors argmin f (U ) est compact et non vide.
6. Si un vecteur v ∈ Rn est considéré comme une matrice n × 1, on peut écrire le produit
(Ax) · x comme le produit de trois matrices x⊤ Ax et b · x comme le produit de deux matrices b⊤ x.
38
Chapitre 2. Existence, convexités et convexification
Démonstration. Puisque U est fermé et que f est sci, les sections inférieures {Fk }
en (5.4) sont fermées et argmin f (U ), en tant qu’intersection de fermés est fermée.
Si, en plus, f est à section inférieure bornée (il existe k0 tel que Fk0 soit non vide
et bornée) le fermé Fk0 est compact. L’ensemble des minimisants
\
argmin f (U ) =
Fk ⊂ Fk0
k>m
est donc compact en tant que partie bornée d’un compact Fk0 .
Exemple 5.9.
On revient aux Exemples 5.2 et 5.3 pour U , ∅ 6= U ⊂ Rn . Pour x ∈ Rn , on a montré
que dU (x) = dU (x) et que
∃x̂ ∈ U tel que dU (x) = inf kx − yk = kx − x̂k.
(5.10)
y∈U
Pour ce faire on a considéré l’infimum de la distance
inf f (y),
y∈U
déf
f (y) = ky − xk.
On a montré que f est continue et à section inférieure bornée dans U . Par le
Théorème 5.6, argmin f (U ) est non vide et compact. Les points de argmin f (U )
sont les projections de x sur U . On désignera par ΠU (x) cet ensemble. Si x ∈ U ,
alors ΠU (x) = {x} est un singleton.
6
◮ Principe variationnel d’Ekeland
Le principe variationnel d’Ekeland 7 en 1974 (I. Ekeland [1]) est un outil
fondamental pour l’existence de points minimisants approchés en l’absence de compacité. Son impact majeur est dans le contexte d’espaces fonctionnels. On en donne
ici une version en dimension finie ainsi que quelques unes de ses ramifications.
Théorème 6.1. Soit f : Rn → R ∪{+∞}, dom f 6= ∅, une fonction sci et bornée
inférieurement. Alors, pour tout ε > 0, il existe xε tel que
inf f (x) ≤ f (xε ) < infn f (x) + ε
x∈Rn
x∈R
(6.1)
et, pour tout η > 0, il existe y (qui dépend de ε) tel que
ky − xε k < η,
f (y) ≤ f (xε ) −
ε
ky − xε k
η
(6.2)
ε
ky − xk.
η
(6.3)
et
∀x ∈ Rn , x 6= y,
7. Ivar Ekeland (1944– ).
f (y) < f (x) +

4 Quelques révisions d`analyse classique

Documents connexes

Produits

Soutien

4 Quelques révisions d`analyse classique

Documents connexes

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib