Convexité et optimisation - EPI - Université Paris 1 Panthéon

publicité
UFR Mathématiques et Informatique
Convexité et optimisation
Licence 3ème année MIASHS
Moncef MEDDEB
2016 − 2017
ii
Convexité et optimisation
Avant-propos
Ce polycopié est destiné aux étudiants de L3 MIASHS qui suivent le cours de « convexité et optimisation ». Afin de bénéficier pleinement de l’enseignement dispensé, il est fortement recommandé
de travailler de manière assidue et de :
B aller au cours en amphi ;
B réviser le cours chaque semaine en s’assurant de connaître les définitions, résultats ainsi
que les démonstrations et d’avoir bien compris les différents exemples et remarques ;
B fournir un travail individuel pour préparer et chercher les exercices chaque semaine avant
d’aller en TD ;
B participer de manière active et dynamique aux séances de TD ;
B faire les autres exercices proposés et qui ne sont pas traités en TD ;
B ne pas hésiter à poser toute question ou demander conseil à l’équipe pédagogique.
Toutes les erreurs qui pourraient figurer dans ces notes de cours, sont de ma responsabilité.
iii
iv
Convexité et optimisation
Notations
R, N, Z, Q, Rn :
R+ , R∗+
:
Mn (R)
:
t A ou AT
:
h., .i
:
kxk
:
Epi(f )
:
Gr(f )
:
∇f (x)
:
Hf (x)
:
B(x, r), BF (x, r) :
int(A)
:
adh(A)
:
Fr(A)
:
Vect(A)
:
co(A)
:
cone(A)
:
:
projA (x)
NA (x)
:
TA (x)
:
A◦
:
⊥
A
:
ensembles habituels
ensembles des réels positifs, strictement positifs
ensemble des matrices carrées d’ordre n à coefficients dans R
transposée d’une matrice A
produit scalaire sur un espace de Hilbert
norme du vecteur x
épigraphe de f
graphe de f
gradient de f en x
matrice hessienne de f en x
boule ouverte, boule fermée de centre x et de rayon r
intérieur de A
adhérence de A
frontière de A
sous-espace vectoriel engendré par A
enveloppe convexe de A
enveloppe conique de A
projection de x sur A
cône normal à A en x
cône tangent à A en x
cône polaire négatif de A
orthogonal de A
Table des matières
0
Introduction
1
1
Ensembles convexes
3
1.1
Ensembles convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.2
Le théorème de Carathéodory . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.3
L’enveloppe Convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.4
Cônes convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.5
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2
3
4
5
Propriétés topologiques des ensembles convexes
13
2.1
Intérieur et adhérence d’un convexe . . . . . . . . . . . . . . . . . . . . . . . .
13
2.2
Autres propriétés des convexes . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.3
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
Théorèmes de séparation
21
3.1
Projection sur un convexe fermé . . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.2
Théorèmes de séparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3.3
Polarité et lemme de Farkas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
3.4
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
Fonctions convexes
35
4.1
Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
4.2
Le cas des fonctions convexes différentiables . . . . . . . . . . . . . . . . . . .
37
4.3
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
Optimisation : généralités
43
5.1
Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
5.2
Existence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
5.3
Le cas de l’optimisation sans contraintes . . . . . . . . . . . . . . . . . . . . . .
45
v
vi
Convexité et optimisation
5.4
6
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
Optimisation sous contraintes : conditions d’optimalité
53
6.1
Condition nécessaire d’optimalité . . . . . . . . . . . . . . . . . . . . . . . . .
53
6.2
Cône normal et cône tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
6.3
La condition de qualification . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
6.4
Le théorème de Karush-Kuhn-Tucker . . . . . . . . . . . . . . . . . . . . . . .
59
6.5
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
Chapitre 0
Introduction
Les problèmes d’optimisation peuvent être rencontrés dans toutes les disciplines et dans de nombreux domaines d’activité. En fonction du contexte, il s’agit de maximiser un « gain » ou de minimiser un « coût » en faisant le « meilleur » choix possible dans un ensemble de variables de
décision qui peut être plus ou moins large, plus ou moins contraint. Ce qui peut s’écrire :
(
∗
On cherche x solution de
min f (x)
x∈C
Ici f est la fonction à minimiser et la variable x est à choisir dans l’ensemble des valeurs « admissibles » C. Un problème de maximisation revient à considérer la minimisation de −f et on
n’énoncera les résultats de ce cours que pour des problèmes de minimisation.
Lorsque l’ensemble C est un ouvert, Il s’agit d’un problème d’optimisation sans contraintes qui a
notamment été étudié. L’objectif de ce cours est de couvrir les techniques mathématiques de base
pour « résoudre » les probèmes d’optimisation sous contraintes, c’est à dire, lorsque C n’est pas
nécessairement ouvert. L’étude du cas simple
(
min f (x) = x2
x ∈ [1, +∞[
dont la solution est x∗ = 1 (et pourtant f 0 (x∗ ) 6= 0) illustre la nécessité de mieux prendre en
compte la géométrie des contraintes afin de caractériser correctement les solutions optimales.
Une partie de ce cours sera donc consacrée aux ensembles et fonctions convexes. Des propriétés
topologiques importantes résultent de cette propriété géométrique et offrent un cadre et des outils
particulièrement adaptés à l’étude des problèmes d’optimisation.
Par ailleurs, il est important de savoir qu’on se limitera aux situations suivantes :
B Un seul critère à optimiser. Nous n’aborderons pas les problèmes d’optimisation à plusieurs
critères où la fonction objectif est une fonction vectorielle.
B Problèmes statiques. Nous n’aborderons pas les problèmes dynamiques où le temps intervient (commande optimale). Nous nous limiterons à des situations où la décision est prise
en une seule étape.
1
2
Convexité et optimisation
B Problèmes déterministes. Nous n’étudierons pas les situations stochastiques où le décideur
peut faire face à certaines variables incertaines et qui sont connues soit statistiquement soit
par l’ensemble des valeurs qu’elles peuvent prendre.
B Pas de variables discrètes. Les variables de décision considérées prennent des valeurs continues.
B Le cas de la programmation linéaire, sans être exclu de ce cours, ne fait pas l’objet des
approfondissements qui lui sont propres.
B Même si les aspects numériques et algorithmiques peuvent être abordés notamment dans
certains exercices, cet axe très important n’est pas développé dans ce cours.
Problématique
Modélisation et
formulation du
problème
d’optimisation
Caractérisation
des solutions
Existence
Calcul numérique
Topologie
Analyse convexe
Calcul différentiel
Le cas non convexe
Objet du cours : partie en gras du diagramme
Chapitre 1
Ensembles convexes
1.1
Ensembles convexes
D ÉFINITION 1.1 Soit C un sous-ensemble de Rn . On dit que C est convexe si pour tous a, b ∈ C,
le segment [a, b] est inclus dans C, c’est à dire, ∀t ∈ [0, 1], ta + (1 − t)b ∈ C.
a
a
a
ta + (1 − t)b
ta + (1 − t)b
b
b
b
F IGURE 1.1 – Exemple d’ensembles convexes et non convexes
Exemples 1.1
B L’espace tout entier A = E = Rn est convexe.
B Si k.k est une norme sur Rn , alors toutes les boules de Rn , ouvertes ou fermées, sont
convexes.
B Les seuls sous-ensembles convexes de R sont les intervalles.
B Pour tout n ∈ N, n ≥ 2, l’ensemble
(
Sn :=
λ = (λ1 , . . . , λn ) ∈ Rn+ |
n
X
)
λi = 1
i=1
est convexe. C’est le simplexe habituel de Rn .
P ROPOSITION 1.1 C désigne un sous-ensemble convexe de Rn .
B L’intersection de sous-ensembles convexes est convexe.
B L’union de sous-ensembles convexes croissants au sens de l’inclusion, est convexe.
3
4
Convexité et optimisation
z
1
1
y
x
1
F IGURE 1.2 – Le simplexe S3
B Pour x ∈ Rn , le sous-ensemble x + C := {x + a | a ∈ C} est convexe.
B Pour α ∈ R, αC := {αa | a ∈ C} est convexe.
B L’image de C par une application linéaire de Rn dans Rp est convexe.
B L’image réciproque de C par une application linéaire de Rp dans Rn est convexe.
B Si C et C 0 sont convexes, alors C + C 0 := {x + x0 | x ∈ C, x0 ∈ C 0 } est convexe.
B Le produit cartésien de deux sous-ensembles convexes est convexe.
B Inversement, la projection d’un sous-ensemble convexe d’un espace produit E × F sur l’un
des sous-espaces composants E ou F , est convexe.
Remarque 1.2
L’union de sous-ensembles convexes n’est en général pas convexe.
L EMME 1.2 Soient α, β > 0 et C un sous-ensemble convexe de Rn . Alors
αC + βC = (α + β)C.
Remarque 1.3
La preuve ci-dessous montre que l’inclusion (α + β)C ⊂ αC + βC est toujours
vraie même si C n’est pas convexe. Ce n’est pas le cas de l’inclusion inverse. Prendre α = β = 1
et C = [−2, −1] ∪ [1, 2] ⊂ R et vérifier que C + C = [−4, 4] et 2C = [−4, −2] ∪ [2, 4].
Preuve Pour tout y ∈ (α + β)C, il existe x ∈ C tel que y = (α + β)x = αx + βx et ainsi
y ∈ αC + βC. Inversement
si y ∈ αC + βC,
on peut trouver x1 et x2 ∈ C tel que y = αx1 + βx2 .
α
β
α
β
Ainsi y = (α + β)
x1 +
x2 et y ∈ (α + β)C car
x1 +
x2 est une
α+β
α+β
α+β
α+β
combinaison convexe de x1 et x2 et appartient donc à C car C est convexe.
D ÉFINITION 1.2 On appelle combinaison convexe de m vecteurs (x1 , . . . , xm ) tout vecteur u qui
peut s’écrire u =
m
X
i=1
ti xi où t1 , . . . , tm ∈ R+ et
m
X
ti = 1.
i=1
P ROPOSITION 1.3 Soit C, un sous-ensemble de E. C est convexe si et seulement si C contient
toutes les combinaisons convexes des familles finies d’éléments de C.
Preuve Si C contient toutes les combinaisons convexes des familles finies d’éléments de C,
alors il contient toutes les combinaisons convexes de deux vecteurs arbitraires de C et il est donc
convexe.
5
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
Réciproquement, nous allons raisonner par récurrence sur le nombre d’éléments de la famille.
Si la famille a un ou deux éléments, la définition d’un sous-ensemble convexe montre que toute
combinaison convexe de cette famille est dans C. Supposons que ceci soit vraie pour toutes les
familles ayant au plus n éléments. Soit (x1 , . . . , xn , xn+1 ), une famille de n + 1 éléments de C.
Soit (λ1 , . . . , λn+1 ) ∈ Sn+1 et soit x =
n+1
X
λi xi . Comme
i=1
x=
λi = 1, il existe au moins un λi
i=1
non nul. Supposons sans perte de généralité λ1 6= 0. Alors

n+1
X

! n

 X λj


λi 
x
j  + λn+1 xn+1
n

j=1 X

i=1
n
X
λi
i=1
Par notre hypothèse de récurrence, x0 =
n
X
j=1
λj
n
X
xj est un élément de C car c’est une combinai-
λi
i=1
son convexe d’une famille de n éléments de C. De plus, comme
n
X
!
λi
+ λn+1 = 1, x est la
i=1
combinaison convexe de x0 et xn+1 . Donc x ∈ C ce qui termine la preuve.
1.2
Le théorème de Carathéodory
T HÉORÈME 1.4 (Théorème de Carathéodory). Soit C un sous-ensemble de Rn . Toute combinaison convexe d’éléments de C peut s’écrire comme combinaison convexe d’au plus n + 1 éléments
de C
Preuve Pour démontrer ce résultat, il suffit de montrer qu’une combinaison convexe d’une famille contenant p > n + 1 éléments est aussi combinaison convexe d’une famille d’au plus p − 1
éléments. Soit p > n + 1, soit (x1 , . . . , xp ) ∈ C p , soit λ ∈ Sp et soit x =
p
X
λi xi . Comme
i=1
p > n + 1, les vecteurs (x2 − x1 , . . . , xp − x1 ) sont liés dans Rn . Il existe un vecteur non nul
(µ2 , . . . , µp ) tel que
p
X
µi (xi − x1 ) = 0. Posons µ1 = −
i=2
p
X
µi . Le vecteur µ est un vecteur
i=2
non nul de Rp dont la somme des composantes est égale à 0 et de plus,
p
X
µi xi = 0. L’ensemble
i=1
I+ = {i ∈ {1, . . . , p} | µi > 0} est donc non vide. Soit
t = min
et soit i0 tel que t =
λi
, i ∈ I+
µi
λ i0
. Posons maintenant βi = λi − tµi pour tout i. Il est clair que la définition
µi0
de t implique que le vecteur β a toutes ses composantes positives et βi0 = 0. Comme
p
X
i=1
µi = 0,
6
X
i6=i0
Convexité et optimisation
βi = 1. De plus, comme
p
X
µi xi = 0,
i=1
x=
p
X
βi xi =
i=1
X
βi xi
i6=i0
Donc x est la combinaison convexe d’une famille contenant p − 1 éléments. Ceci termine notre
démonstration.
1.3
L’enveloppe Convexe
D ÉFINITION 1.3 (Enveloppe convexe). A est un sous-ensemble de E(= Rn ). On appelle l’enveloppe convexe de A, notée co(A), le plus petit sous-ensemble convexe qui le contient.
F IGURE 1.3 – Dessiner l’enveloppe convexe de ce sous-ensemble du plan.
D ÉFINITION 1.4 L’enveloppe convexe d’un nombre fini de points de Rn est appelé un polytope.
x1
x6
x2
x3
x5
x4
F IGURE 1.4 – Un polytope dans R2
T HÉORÈME 1.5 Soit A un sous-ensemble de E(= Rn ). L’enveloppe convexe de A, co(A) est
égale à l’ensemble de toutes les combinaisons convexes d’éléments de A.
Il résulte de ce théorème, grâce au théorème de Caratheodory (1.4), que l’enRemarque 1.4
veloppe convexe d’un sous-ensemble A d’un espace vectoriel réel de dimension n est égale à
l’ensemble des combinaisons convexes de n + 1 points de A.
7
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
Preuve On note B, l’ensemble de toutes les combinaisons convexes des familles finies d’éléments de A. B ⊂ co(A) car co(A) est un sous-ensemble convexe de E contenant A qui, d’après
la proposition (1.3), contient toutes les combinaisons convexes des familles finies d’éléments de
co(A).
Montrons maintenant que co(A) ⊂ B. Il est clair que A ⊂ B. Donc, pour démontrer cette inclusion, il suffit de montrer que B est convexe et d’utiliser ensuite la définition de co(A). Soit x
et y, deux éléments de B et t ∈ [0, 1]. Il existe donc deux familles (x1 . . . , xn ) et (y1 , . . . , yp )
d’éléments de A, λ ∈ Sn et µ ∈ Sp tels que x =
n
X
λi xi et y =
i=1
tx + (1 − t)y =
n
X
tλi xi +
i=1
p
X
µj yj . Donc
j=1
p
X
(1 − t)µj yj
j=1
Donc tx + (1 − t)y est une combinaison convexe de la famille (x1 , . . . , xn , y1 . . . , yp ) car
n
X
i=1
tλi +
p
X
(1 − t)µj = t + (1 − t) = 1
j=1
et donc, (tλ1 , . . . , tλn , (1 − t)µ1 . . . , (1 − t)µp ) ∈ Sn+p .
1.4
Cônes convexes
D ÉFINITION 1.5 Soit C un sous-ensemble de Rn .
B On dit que C est un cône si ∀x ∈ C, ∀t ∈ R+ , tx ∈ C.
B Un cône C est dit saillant si C ∩ (−C) = {0}.
Exemple 1.5
pas saillant.
Tout sous-espace vectoriel de Rn est un cône qui, sauf s’il est réduit à {0}, n’est
P ROPOSITION 1.6
Un cône K est convexe si et seulement si il est stable par addition.
1
Preuve Soit K, un cône convexe. Soit x et y deux éléments de K. Alors (x + y) appartient à
2
1
K car celui-ci est convexe et x + y = 2 (x + y) appartient à K car c’est un cône. Donc K est
2
stable par addition.
Soit K, un cône stable par addition et soit x et y deux éléments de K. Pour tout t ∈ [0, 1], tx et
(1 − t)y sont des éléments de K car c’est un cône. Comme K est stable par addition, tx + (1 − t)y
appartient à K et donc K est convexe.
D ÉFINITION 1.6 (Enveloppe conique) L’enveloppe conique d’un sous-ensemble A de Rn , notée
cone(A), est le plus petit (au sens de l’inclusion) cône convexe qui contient A.
8
Convexité et optimisation
cone(A)
A
F IGURE 1.5 – Enveloppe conique de A
T HÉORÈME 1.7 Soit A un sous-ensemble de Rn .
B On a cone(A) = cone(co(A)).
B L’enveloppe conique de A est égale à l’ensemble des combinaisons linéaires à coefficients
positifs d’éléments de A, c’est à dire :
(
x | ∃m ∈ N, x1 , . . . , xm ∈ A, t1 , . . . , tm ∈ R+ telle que x =
cone(A) =
m
X
)
t i xi .
i=1
De manière similaire au théorème de Caratheodory (1.4), on peut énoncer le
Remarque 1.6
résultat suivant.
T HÉORÈME 1.8 Soit A, une partie non vide d’un espace vectoriel de dimension n. Alors pour
tout y ∈ cone(A) \ {0}, il existe une famille libre (a1 , . . . , ap ) d’éléments de A et des coefficients
λ = (λ1 , . . . , λp ) ∈ Rp+ tels que y =
p
X
λi ai .
i=1
1.5
Exercices
E XERCICE 1
quelconque.
Soient A et B, (Ai )i∈I des sous-ensembles convexes de Rn ; I est un ensemble
1 - Montrer que A ∩ B est convexe.
2 - Montrer que
\
Ai est convexe.
i∈I
3 - Donner un exemple pour lequel l’union d’ensembles convexes n’est pas convexe.
4 - Montrer que l’union dénombrable croissante d’ensembles convexes est convexe.
5 - Soit f : Rn → Rp une application linéaire.
a - Montrer f (A) est convexe.
b - Soit C un sous-ensemble convexe de Rp . Montrer que f −1 (C) est convexe.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
9
6 - Soient α, β ∈ R.
a - Montrer que αA + βB est convexe.
b - A-t-on (α + β)A = αA + βA, pour α > 0 et β > 0 ?
c - Soient C ⊂ Rn un ensemble non convexe et λ ∈ [0, 1]. A-t-on : λC + (1 − λ)C = C ?
7 - C un sous-ensemble convexe de Rn . Montrer que toute combinaison convexe finie d’éléments
de C appartient à C.
8 - Soit K un sous-ensemble de Rn . Montrer que l’enveloppe convexe de K, co(K), est l’ensemble
de toutes les combinaisons convexes d’éléments de K.
9 - Soit K ⊂ Rn un cône. Montrer que K est convexe si et seulement si K est stable par addition,
c’est-à-dire, K + K ⊂ K.
Soient E et F deux espaces vectoriels réels et C un sous-ensemble non vide de
E XERCICE 2
E × F . On appelle projection de C sur E (resp. sur F ) l’ensemble noté
PE (C) := {x ∈ E | ∃y ∈ F telle que (x, y) ∈ C}
(resp. PF (C) := {y ∈ F | ∃x ∈ E telle que (x, y) ∈ C}).
1 - Montrer que si C est convexe, alors les sous-ensembles PE (C) et PF (C) sont convexes.
2 - La réciproque est elle vraie ?
3 - Pour i = 1, . . . , n, on considère Ci un sous-ensemble convexe d’un espace vectoriel réel Ei .
Montrer que C1 × . . . × Cn est un sous-ensemble convexe de E1 × . . . × En .
E XERCICE 3
On considère le sous-ensemble S des matrices symétriques et semi-définies positives de Mn (R) (l’ensemble des matrices carrées d’ordre n). Montrer que S est convexe.
E XERCICE 4
Pour tout a = (a1 , . . . , an ) ∈ Rn on note Pa le polynôme définie par Pa (x) =
an xn−1 + an−1 xn−2 + . . . + a2 x + a1 . On considère α < β deux nombres réels et C le sousensemble de Rn définie par :
C = {a ∈ Rn | Pa (0) = 1 et ∀x ∈ [α, β], |Pa (x)| ≤ 1} .
C est il convexe ?
E XERCICE 5
Soit C ⊂ Rn vérifiant :
1
a, b ∈ C =⇒ (a + b) ∈ C.
2
1 - Montrer que C n’est pas nécessairement convexe.
2 - Montrer que si de plus C est fermé, alors C est convexe.
10
Convexité et optimisation
E XERCICE 6
Déterminer l’enveloppe convexe de chacun des sous-ensembles de R2 suivants :
B Z2 ;
B N2 ;
B Deux droites (discuter) ;
B Un point et une droite ;
B {(x1 , x2 ) ∈ N2 | 2x1 + 3x2 ≤ 8} ;
B {(x1 , x2 ) ∈ N2 | 14x1 + 10x2 ≤ 35} ;
E XERCICE 7
On note e1 , . . . , en les vecteurs de la base canonique de Rn .
Déterminer co(e1 , −e1 , . . . , en , −en ).
E XERCICE 8
Soit A = {(x1 , x2 ) ∈ R2 | x2 |x1 | ≤ 2}.
1 - Dessiner A.
2 - Déterminer co A.
E XERCICE 9
Soit A un sous-ensemble de Rn .
1 - Montrer que A est convexe si et seulement si A = co A.
2 - En déduire que co A = co(co A).
E XERCICE 10
Soit A et B deux sous-ensembles d’un espace vectoriel E.
1 - Montrer que
co(A + B) ⊂ co A + co B.
2 - Soit
C = {x ∈ E,
∀z ∈ B,
x + z ∈ co(A + B)}.
Montrer que C est un convexe contenant A. En déduire :
co(A) + B ⊂ co(A + B).
3 - En raisonnant de manière analogue, en déduire que
co A + co B = co(A + B).
E XERCICE 11
C si :
Soit C ⊂ Rn un ensemble convexe. On dit que a ∈ C est un point extrémal de
1
(b + c) = a =⇒ b = c = a,
2
∀b, c ∈ C.
1 - Montrer que a est un point extrémal de C si et seulement si C \ {a} est convexe.
2 - On considère A ⊂ Rn et on suppose que a est un point extrémal de co(A). Montrer que a ∈ A.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
11
E XERCICE 12 (Théorème de Radon). On considère un sous-ensemble A de Rn qui contient au
moins n + 2 éléments distincts. Montrer qu’il existe deux sous-ensembles de A, S et T telle que
S ∩ T = ∅ et co(S) ∩ co(T ) 6= ∅.
12
Convexité et optimisation
Chapitre 2
Propriétés topologiques des ensembles
convexes
Dans ce chapitre l’espace vectoriel Rn est muni d’une norme k.k. On rappelle qu’en dimension
finie, toutes les normes sur un même espace vectoriel sont équivalentes.
2.1
Intérieur et adhérence d’un convexe
P ROPOSITION 2.1 Soient C un sous-ensemble convexe de (Rn , k.k), x ∈ int(C) et y ∈ adh(C).
Alors ∀t ∈]0, 1], tx + (1 − t)y ∈ int(C).
Preuve Soient x ∈ int C, y ∈ adh C et t ∈]0, 1[. Il existe r > 0 tel que B(x, r) ⊂ C. Il existe
tr
z ∈ C tel que kz − yk <
. Soit D la boule ouverte égale à B(tx + (1 − t)z, tr). Pour montrer
1−t
que tx + (1 − t)y appartient à int C, nous allons prouver que D ⊂ C et tx + (1 − t)y appartient
à D.
z
y ∈ adh(C)
tx + (1 − t)y
B(x, r)
x
F IGURE 2.1 – Une boule de centre tx + (1 − t)z reste dans C
Soit u ∈
Rn
1
1−t
tel que ku − tx − (1 − t)zk < tr. Donc, u −
z − x
< r. Ceci est équit
t
1−t
1
z appartient à B(x, r). Donc v appartient à C. Comme u = tv + (1 − t)z,
valent à v = u −
t
t
13
14
Convexité et optimisation
u appartient à C comme combinaison convexe de v et z. Ceci montre que D est inclus dans C.
tr
Finalement, ktx + (1 − t)y − (tx + (1 − t)z)k = (1 − t)ky − zk < (1 − t)
= tr. Donc
1−t
tx + (1 − t)y appartient à D.
P ROPOSITION 2.2 Soit C, un sous-ensemble convexe de E = Rn . Alors, int C et adh C sont
convexes. De plus, si int C 6= ∅, alors int(adh C) = int C et adh(int C) = adh C.
Preuve Soit x et y, deux éléments de int C. Comme y ∈ int C ⊂ adh C, la proposition (2.1)
implique que [x, y[⊂ int C. De plus y ∈ int C donc [x, y] ⊂ int C. Donc int C est convexe.
Soit x et y, deux éléments de adh C. Il existe donc deux suites (xn ) et (yn ) de C qui convergent
respectivement vers x et y. Pour tout t ∈ [0, 1], txn + (1 − t)yn appartient à C car C est convexe
et la suite (txn + (1 − t)yn ) converge vers tx + (1 − t)y. Donc tx + (1 − t)y appartient à adh C
ce qui montre que adh C est convexe.
Supposons maintenant que int C est non vide. Il est clair que int C ⊂ adh C. Donc, int C ⊂
int(adh C). Soit y ∈ int(adh C). Il existe donc r > 0 tel que B(y, r) ⊂ adh C. Comme int C
est non vide, nous pouvons choisir x ∈ int C. Il existe λ > 0 assez petit, z = y + λ(y − x)
appartient à B(y, r). La proposition (2.1) implique donc que [x, z[ est inclus dans int C. Or y =
1
λ
x+
z ∈ [x, z[. Donc, y appartient à int C ce qui montre que int C = int(adh C).
1+λ
1+λ
Comme int C ⊂ C, adh(int C) ⊂ adh C. Soit y ∈ adh C. Comme int C est non vide, nous
pouvons choisir x ∈ int C. D’après le théorème précédent, [x, y[ est inclus dans int C. De façon
évidente, y ∈ adh[x, y[⊂ adh(int C). Ceci montre que adh(int C) = adh C.
T HÉORÈME 2.3 Soit C, un sous-ensemble convexe de E = Rn . Alors, x ∈ int(C) si et seulement si pour tout u ∈ E, il existe ru > 0 tel que x + ru u appartient à C.
Preuve Si x ∈ int(C), il est évident que la propriété est satisfaite. Montrons maintenant l’implication inverse.
Soit (u1 , . . . , un ), une base de E. Posons, pour tout i = 1, . . . , n, vi = −ui . Par hypothèse, pour
tout i, il existe ri > 0 et ri0 > 0 tels que x + ri ui ∈ C et x + ri0 vi ∈ C. Soit r égal au minimum
des ri et des ri0 . Comme C est convexe, pour tout i, le segment [x − ri0 ui , x + ri ui ] est inclus dans
C et donc x, x + rui et x + rvi sont des vecteurs de C.
Soit maintenant ϕ l’isomorphisme linéaire de Rn dans E = Rn défini par :
ϕ(λ) =
n
X
λi ui
i=1
(
Soit Ω =
λ∈
Rn
|
n
X
)
|λi | < r . Ω est un ouvert de Rn et donc ϕ(Ω) est un ouvert de E = Rn .
i=1
Nous allons maintenant montrer que {x} + ϕ(Ω) est inclus dans C. Soit λ ∈ Ω. Soit I+ = {i ∈
15
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
{1, . . . , n} | λi ≥ 0} et I− = {i ∈ {1, . . . , n} | λi < 0}.
x + ϕ(λ) = x +
X
|λi |ui +
i∈I+
X
|λi |vi
i∈I−
n
X
X 1
X 1
1
=
r−
|λi | x +
|λi |(x + rui ) +
|λi |(x + rvi )
r
r
r
i=1
i∈I
i∈I
!
−
+
Donc, x + ϕ(λ) est une combinaison convexe d’éléments de C, donc il appartient à C. Comme
x ∈ {x} + ϕ(Ω) ⊂ int(C), ceci montre que x appartient à l’intérieur de C.
2.2
Autres propriétés des convexes
Nous donnons tout d’abord le lemme technique suivant qui ne concerne pas uniquement les sousensembles convexes.
L EMME 2.4 Soient E un espace vectoriel muni d’une norme et C1 et C2 deux sous-ensembles de
E. Alors :
B Si C1 ou bien C2 est ouvert, alors C1 + C2 est ouvert.
B Si C1 et C2 sont compacts, alors C1 + C2 est compact.
B Si C1 est fermé et C2 est compact, alors C1 + C2 est fermé.
Remarque 2.1
Si C1 et C2 sont deux sous-ensembles fermés sans que l’un des deux soit compact, alors nous n’avons en général pas que C1 +C2 est fermé comme le montre l’exemple suivant.
Prenons C1 := {(x, y) ∈ R2 | xy ≥ 1} et C2 := R × {0}. C1 et C2 sont bien fermés de R2 .
Toutefois C1 + C2 est ici égal à R × R∗ qui n’est pas un fermé.
P ROPOSITION 2.5
pact.
Soit K, un sous-ensemble compact de E = Rn . Alors, co(K) est un com-
Preuve Le théorème de Carathéodory implique que
co(K) =
(n+1
X
)
λi xi | (λi ) ∈ Sn+1 , (x1 , . . . , xn+1 ) ∈ K n+1
i=1
Donc co(K) est l’image du compact Sn+1 × K n+1 par l’application
(λ, x1 , . . . , xn+1 ) 7→
n+1
X
λi xi .
i=1
Cette application est continue et donc co(K) est compact.
Remarques 2.2
B Un polytope qui est l’enveloppe convexe d’un nombre fini de points est donc compact.
16
Convexité et optimisation
B Si A est un sous-ensemble ouvert de Rn alors co(A) est un ouvert également.
B En général, A est un fermé de Rn n’implique pas nécessairement que co(A) est un fermé,
comme le montre (le vérifier) l’exemple suivant :
1 [
1
2
A = (x, y) ∈ R | x > 0 et y ≥
(x, y) ∈ R | x < 0 et y ≥ −
.
x
x
2
Soit E = Rn et C, un cône de E. C est finiment généré s’il existe une famille
D ÉFINITION 2.1
finie (a1 , . . . , ap ) d’éléments de E telle que
C=
( p
X
i=1
)
p
λi ai λ = (λ1 , . . . , λp ) ∈ R+
En fait, grâce au théorème (1.7), un cône finiment généré est l’enveloppe conique
Remarque 2.3
d’une famille finie d’éléments de E = Rn .
P ROPOSITION 2.6
Soit C, un cône finiment généré de E = Rn , alors C est fermé.
Preuve Soit (a1 , . . . , ap ) une famille d’éléments de E telle que
C=
( p
X
i=1
)
p
λi ai λ ∈ R+
Soit P , l’ensemble des parties non vides I de {1, . . . , p} telles que la famille (ai )i∈I est libre.
D’après le théorème (1.8),
(
)
C=
[
X
I∈P
i∈I
λi ai | λ ∈ RI+
Comme P est fini, il suffit de montrer que pour tout I ∈ P , CI =
(
X
)
λi ai | λ ∈
RI+
est
i∈I
fermé. Soit ϕ, l’application de RI dans l’espace vectoriel Vect{ai , i ∈ I} définie par ϕ(λ) =
X
λi ai . Comme la famille (ai )i∈I est libre, ϕ est une bijection linéaire donc bicontinue de RI
i∈I
dans Vect{ai , i ∈ I}. CI est l’image par ϕ du fermé RI+ , donc CI est un fermé de Vect{ai , i ∈ I}.
Comme cet espace est un sous-espace vectoriel de dimension finie, il est fermé et donc CI est un
fermé de Rn .
2.3
Exercices
E XERCICE 13
définie par :
Soit {x1 , ..., xp } des éléments de Rn et soit f : Rp −→ Rn une application
(λ1 , ..., λp ) ∈ Rp 7−→ f (λ1 , ..., λp ) =
p
X
λi xi
i=1
(
1 - Soit S =
λ ∈ Rp |
p
X
i=1
)
λi = 1, λi ≥ 0, 1 ≤ i ≤ p . Montrer que f (S) = co{x1 , ..., xp }.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
17
2 - Montrer que f est continue.
3 - En déduire que l’ensemble co{x1 , ..., xp } est compact.
E XERCICE 14
1 - Soit A = (x, y) ∈
R2
1
. Montrer que A est fermé, mais que co(A) n’est
| x ≥ 1, 0 ≤ y ≤
x
pas fermé.
2 - Montrer que si A est un sous-ensemble fini de Rn alors co(A) est fermé.
3 - Montrer que si A est un sous-ensemble ouvert de Rn alors co(A) est ouvert.
4 - Montrer que si A est un sous-ensemble compact de Rn alors co(A) est compact.
E XERCICE 15
Soit C un sous-ensemble convexe de Rn telle que int C 6= ∅ et U un ouvert de
Rn . Montrer que si adh(C) ∩ U 6= ∅, alors, int C ∩ U 6= ∅.
E XERCICE 16
Soit A un sous-ensemble de Rn . Montrer que adh(co(A)) est le plus petit ensemble convexe fermé contenant A.
E XERCICE 17
Soit C un sous-ensemble convexe et fermé de Rn vérifiant :
Rn =
[
tC.
t>0
1 - Montrer que 0 ∈ C. En déduire que si t1 < t2 , alors t1 C ⊂ t2 C.
2 - Montrer que 0 est dans l’intérieur de C (on pourra commencer par démontrer qu’il existe un
réel t tel que e1 , . . . , en , −e1 , . . . , −en soient tous dans tC, où les ei sont les vecteurs de la base
canonique.
E XERCICE 18
C est dit strictement convexe si pour tout (x1 , x2 ) ∈ C × C, x1 6= x2 et pour
tout t ∈]0, 1[, tx1 + (1 − t)x2 ∈ int C.
1 - Donner un exemple d’un ensemble convexe mais qui n’est pas strictement convexe.
2 - Montrer que si C est strictement convexe, alors ou bien C est un singleton, ou bien, int C 6= ∅.
3 - Montrer que si C est strictement convexe, alors ∀x ∈ Fr C, C \ {x} est convexe.
4 - Montrer que si C est convexe mais n’est pas strictement convexe alors il existe (x1 , x2 ) ∈
C × C, x1 6= x2 tel que [x1 , x2 ] ⊂ Fr C.
Soit C un sous-ensemble convexe de Rn contenant 0. La fonction jauge de C,
E XERCICE 19
notée jC , est définie par :
jC (x) = inf{λ ∈ R+ | x ∈ λC}.
1 - Montrer que pour tout (x, y) ∈ Rn × Rn , jC (x + y) ≤ jC (x) + jC (y).
2 - Montrer que pour tout x ∈ Rn et pour tout t ≥ 0, jC (tx) = tjC (x).
18
Convexité et optimisation
3 - Montrer que pour tout x ∈ C, on a jC (x) ≤ 1.
4 - Montrer que si 0 ∈ int C alors jC (x) est finie pour tout x ∈ Rn .
5 - Montrer que jC est une fonction convexe.
Soit C un sous-ensemble convexe fermé de Rn et c un élément de C. Un vecteur
E XERCICE 20
u de Rn est appelé direction asymptotique de C en c si la demi-droite {c + tu | t ≥ 0} est incluse
dans C.
1 - Montrer que l’ensemble des directions asymptotiques de C en c est un cône convexe fermé.
2 - Soit c0 un autre élément de C. Montrer que l’ensemble des directions asymptotiques de C en
c0 est égal à l’ensemble des directions asymptotiques de C en c.
Cet ensemble est appelé le cône asymptotique de C et il est noté N∞
C.
∞
3 - Montrer que ∀z ∈ Rn , N∞
C+{z} = NC .
4 - Trouver N∞
C lorsque C est un cône convexe contenant l’origine.
5 - Montrer que C est borné, si et seulement si, N∞
C = {0}.
6 - Soit C1 et C2 deux sous-ensembles convexes fermés de Rn . On suppose que
∞
N∞
C1 ∩ − NC2 = {0}.
Montrer qu’alors C1 + C2 est fermé.
Soit K, un sous-ensemble convexe compact de Rn . On suppose que l’intérieur
E XERCICE 21
de K est non vide. Le but de l’exercice est de montrer que cet ensemble est homéomorphe à la
boule unité fermée.
1 - Soit a ∈ int K. Montrer que pour tout u ∈ Rn \ {0}, la demi-droite affine {a + tu | t ≥ 0}
rencontre la frontière de K en exactement un point.
2 - Soit S = {x ∈ Rn | kxk = 1}. On définit l’application g : FrK → S par
g(x) =
x−a
kx − ak
Montrer que g est injective et continue.
3 - Montrer que g est surjective à l’aide de la première question, et en déduire que g est un homéomorphisme de FrK sur S.
4 - Soit B = {x ∈ Rn | kxk ≤ 1}. On définit la fonction f de B dans K par :


f (0) = a
−1

f (y) = (1 − kyk)a + kykg
Montrer que f est continue.
y
kyk
si y 6= 0
19
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
5 - Soit x ∈ K\{a}. On pose y = g −1
x−a
. Montrer que x ∈ [a, y] et que f
kx − ak
x−a
ky − ak
=
x. En déduire que f est surjective.
6 - Montrer que f (y) = a implique y = 0.
7 - Soient y1 , y2 ∈ Rn tels que y1 6= y2 et 0 < ky1 k ≤ ky2 k ≤ 1. Montrer que f (y1 ) = f (y2 )
y2
y1
=
. En déduire que f est injective et conclure.
implique
ky1 k
ky2 k
20
Convexité et optimisation
Chapitre 3
Théorèmes de séparation
Dans ce chapitre l’espace vectoriel E = Rn est muni d’une structure d’espace de Hilbert. Un
espace de Hilbert est un espace vectoriel réel muni d’un produit scalaire, c’est-à-dire d’une forme
bilinéaire symétrique définie positive et qui est complet pour la norme issue de ce produit scalaire.
Nous notons hx, yi le produit scalaire de x et de y. La norme de x est définie par kxk =
p
hx, xi.
L’inégalité de Cauchy-Schwarz nous dit que pour tout (x, y) ∈ E × E, |hx, yi| ≤ kxkkyk. Il y a
égalité si et seulement si x et y sont colinéaires. L’égalité du parallélogramme est :
kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 ).
Deux vecteurs x et y sont orthogonaux si et seulement si hx, yi = 0. Ceci est équivalent par le
théorème de Pythagore à kx + yk2 = kxk2 + kyk2 .
3.1
Projection sur un convexe fermé
T HÉORÈME 3.1 Soit C, un sous-ensemble convexe fermé non vide d’un espace de Hilbert E (=
Rn ).
1. Pour tout x ∈ E, il existe un unique élément de C appelé la projection de x sur C et noté
projC (x) vérifiant :
kx − projC (x)k = min{kx − ck, c ∈ C}
2. Soit x ∈ E. Alors c ∈ E est égal à la projection de x sur C si et seulement si c ∈ C et
hx − c, d − ci ≤ 0;
∀d ∈ C.
Preuve On commence par le point 1 et nous allons tout d’abord montrer l’unicité de projC (x).
Supposons qu’il existe deux points c1 et c2 de C tels que c1 6= c2 et kx − c1 k = kx − c2 k =
1
min{kx − ck, c ∈ C}. Posons c = (c1 + c2 ). Comme C est convexe, c appartient à C. Nous
2
allons montrer que kx − ck < kx − c1 k ce qui contredit kx − c1 k = min{kx − ck, c ∈ C}.
21
22
Convexité et optimisation
1
1
Nous remarquons que x − c = (x − c1 ) + (x − c2 ). L’égalité du parallélogramme implique
2
2
alors
2 2 ! 2
1
1
1
2
kx − ck = 2 (x − c1 ) + (x − c2 ) − (c2 − c1 )
2
2
2
Vu que kx − c1 k = kx − c2 k, on obtient
2
1
kx − ck = kx − c1 k − (c2 − c1 )
2
2
2
donc, kx − ck < kx − c1 k car c1 6= c2 .
Nous montrons maintenant l’existence de projC (x). Soit α = inf{kx − ck, c ∈ C}. Pour tout
1
n ∈ N, n 6= 0, il existe cn ∈ C tel que kx − cn k ≤ α + . Montrons que la suite (cn ) est de
n
Cauchy.
L’égalité du parallélogramme implique que pour tout (n, m),
kx − cn + x − cm k2 + kcm − cn k2 = 2(kx − cn k2 + kx − cm k2 )
1
= 2 x − (cn + cm ) , on obtient
2
Donc, en remarquant que x − cn + x − cm
2
2
2
kcm − cn k = 2 kx − cn k + kx − cm k
2
1
− 4 x − (cn + cm )
2
1
Vu les choix de cn et cm et le fait que (cn + cm ) appartient à C, on en déduit
2
2
kcm − cn k ≤ 2
1
α+
n
2
1
+ α+
m
2 !
4α 4α
1
1
− 4α =
+
+2
+
n
m
n2 m2
2
Si n et m sont plus grands que n0 , on en déduit que
s
kcn − cm k ≤
8α
4
+ 2
n0
n0
Il est clair que le deuxième membre de l’inégalité tend vers 0 lorsque n0 tend vers l’infini. Donc,
pour tout ε > 0, il existe n0 ∈ N tel que si n et m sont plus grands que n0 , alors kcn − cm k ≤ ε.
Donc la suite (cn ) est de Cauchy.
Comme C est fermé, la suite (cn ) converge vers un élément c̄ de C et kx − c̄k = α. Donc c̄ est la
projection de x sur C.
Pour le point 2, si c = projC (x) alors, pour tout d ∈ C, kx − ck2 ≤ kx − dk2 . En remarquant que
x − d = x − c + c − d, on obtient
kx − ck2 ≤ kx − ck2 + kc − dk2 + 2hx − c, c − di
Donc, 2hx − c, d − ci ≤ kc − dk2 . Comme C est convexe, pour tout t ∈]0, 1], d0 = (1 − t)c + td
appartient à C. Donc, en appliquant l’inégalité obtenue ci-dessus à d0 ,
2hx − c, d0 − ci = 2thx − c, d − ci ≤ kc − d0 k2 = t2 kc − dk2
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
23
En divisant par t et en faisant tendre t vers 0, on en déduit que hx − c, d − ci ≤ 0.
Montrons maintenant l’implication inverse. Soit c ∈ C tel que hx − c, d − ci ≤ 0 pour tout d ∈ C.
Alors, pour tout d ∈ C,
kx − dk2 = kx − c + c − dk2 = kx − ck2 + kc − dk2 + 2hx − c, c − di
Or kc − dk2 + 2hx − c, c − di est positif donc kx − dk2 ≥ kx − ck2 pour tout d ∈ C, donc c est
la projection de x sur C.
Remarques 3.1
B L’application p n’est en général pas linéaire. Il suffit de prendre dans R, C = [0, 1] pour le
vérifier.
B Dans le thèorème ci-dessus (et dans tout le chapitre) on travaille avec la norme euclidienne
qui résulte de la structure d’espace de Hilbert et du produit scalaire. Le résultat du théorème
est faux si on utilise une autre norme. Pour s’en convaincre, il suffit de prendre un exemple
avec R2 muni de la norme k.k∞ et la droite d’équation x = 0 qui est bien un convexe et
fermé. Pourtant le point (1, 0) admet une infinité de projetés sur cette droite (tous les points
(0, t) avec t ∈ [−1, 1])
B La figure (3.1) ci-dessous montre que si C n’est pas convexe alors l’unicité de p(x) n’est
pas assurée.
B Si C est un convexe non vide mais qui n’est pas fermé, alors l’existence de p(x) n’est pas
assurée. Pour cela prendre dans R, C = [0, 1[ et x = 2.
•
C
•
A
•
F IGURE 3.1 – Le point A a 2 projections sur C
P ROPOSITION 3.2
(=Rn ). Alors
Soit C, un sous-ensemble convexe fermé non vide d’un espace de Hilbert E
1. projC ◦ projC = projC ;
2. pour tout (x, y) ∈ E, k projC (x) − projC (y)k ≤ kx − yk.
3. ∀x, y ∈ Rn , hprojC (x) − projC (y), x − yi ≥ 0 ;
Preuve (1) est évident car la projection d’un élément de C sur C est égale lui-même.
Montrons maintenant (2). D’après le point 2 du théorème (3.1), comme projC (x) et projC (y) sont
des éléments de C, nous avons
24
Convexité et optimisation
hx − projC (x), projC (y) − projC (x)i ≤ 0
et
hy − projC (y), projC (x) − projC (y)i ≤ 0
En sommant ces inégalités, on obtient
hy − projC (y) − x + projC (x), projC (x) − projC (y)i ≤ 0
d’où on déduit en utilisant l’inégalité de Cauchy-Schwarz que
k projC (x) − projC (y)k2 ≤ hx − y, projC (x) − projC (y)i ≤ kx − ykk projC (x) − projC (y)k
Donc, k projC (x) − projC (y)k ≤ kx − yk. On a également au passage montré le point (3).
P ROPOSITION 3.3 Soit C, un cône convexe fermé de sommet 0 et soit x ∈ E. c ∈ C est la
projection de x sur C si et seulement si hx − c, ci = 0 et pour tout d ∈ C, hx − c, di ≤ 0.
Preuve Si c est la projection de x sur C, alors d’après le point 2 du théorème (3.1), pour tout
d ∈ C, hx − c, d − ci ≤ 0. En prenant d = 0, on obtient hx − c, −ci ≤ 0. En prenant d = 2c qui
appartient à C car C est un cône, on obtient hx − c, ci ≤ 0. Donc hx − c, ci = 0. On conclut alors
de la première inégalité que hx − c, di ≤ 0.
Maintenant, si c ∈ C vérifie les inégalités, alors en faisant la somme des deux, on déduit que
hx − c, d − ci ≤ 0 pour tout d ∈ C. D’après le théorème (3.1), c est la projection de x sur C.
P ROPOSITION 3.4 Soit M , un sous-espace vectoriel (fermé) de E = Rn et soit x ∈ E. c ∈
M est la projection de x sur M si et seulement si hx − c, di = 0 pour tout d ∈ M . De plus
l’application projM : E → E, x 7→ projM (x) est linéaire et vérifie k projM k = 1 si M 6= {0}.
projM est appelée la projection orthogonale sur M .
Preuve Il est clair que si c ∈ M vérifie hx − c, di = 0 pour tout d ∈ M , alors hx − c, ci = 0 et
donc, d’après la proposition précédente, comme un sous-espace vectoriel est un cas particulier de
cône, c est la projection de x sur M .
Réciproquement, si c est la projection de x sur M , alors d’après la proposition précédente, pour
tout d ∈ M , hx − c, di ≤ 0. Mais alors, −d appartient aussi à M et donc, hx − c, −di ≤ 0. On en
conclut donc que hx − c, di = 0.
Montrons maintenant que projM est linéaire. Soit x1 et x2 , deux éléments de E. Comme M est
un espace vectoriel, projM (x1 ) + projM (x2 ) appartient à M . De plus, pour tout d ∈ M ,
hx1 + x2 − (projM (x1 ) + projM (x2 )), di = hx1 − projM (x1 ), di + hx2 − projM (x2 ), di = 0
d’après la proposition précédente. De nouveau d’après cette proposition, ceci implique que :
projM (x1 ) + projM (x2 ) = projM (x1 + x2 ).
25
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
La preuve est identique pour montrer que projM (λx) = λ projM (x) pour tout λ ∈ R. Donc
projM est une application linéaire.
Si M 6= {0}, il existe x ∈ M , x 6= 0. projM (x) = x, donc k projM k ≥ 1. D’après la proposition
(3.2), k projM (x) − projM (0)k = k projM (x)k ≤ kxk. Donc k projM k ≤ 1. Finalement, on en
déduit que k projM k = 1.
3.2
Théorèmes de séparation
Les théorèmes de séparation correspondent à une version géométrique du théorème plus général
de Hahn-Banach. Ils seront obtenus dans le cadre d’un espace de Hilbert grâce aux propriétés de
la projection sur un sous-ensemble convexe et fermé, que nous venons d’étudier.
D ÉFINITION 3.1 Soient E un espace de Hilbert, A et B deux sous-ensemble de E.
B Soient p ∈ E \ {0} et α ∈ R. L’ensemble H := {x ∈ E | hp, xi = α} est appelé un hyperplan affine. Les sous-ensembles {x ∈ E | hp, xi ≤ α} et {x ∈ E | hp, xi ≥ α} sont appelés
des demi-espaces fermés. Les sous-ensembles {x ∈ E | hp, xi < α} et {x ∈ E | hp, xi > α}
sont appelés des demi-espaces ouverts.
B On dit qu’on peut séparer strictement les deux sous-ensembles A et B si on peut trouver un
hyperplan qui sépare strictement A et B, c’est à dire : ∃p ∈ E \ {0}, α ∈ R tel que :
sup hp, xi < α ≤ inf hp, xi
x∈B
x∈A
B On dit qu’on peut séparer au sens large les deux sous-ensembles A et B si on peut trouver
un hyperplan qui sépare A et B, c’est à dire : ∃p ∈ E \ {0}, α ∈ R tel que :
sup hp, xi ≤ α ≤ inf hp, xi
x∈B
x∈A
hp, xi = α
hp, xi = α
C1
C2
C2
Séparation stricte
C1
Séparation large
F IGURE 3.2 – Séparation entre deux convexes
T HÉORÈME 3.5 (séparation stricte d’un convexe et d’un point). Soit C un sous-ensemble convexe
fermé et non vide de E un espace de Hilbert et x0 ∈
/ C. Alors il existe p ∈ E \ {0} telle que :
hp, x0 i < inf hp, xi .
x∈C
26
Convexité et optimisation
Preuve On considère projC (x0 ) la projection de x0 sur le convexe fermé non vide C et on pose
p = projC (x0 ) − x0 . Comme x0 ∈
/ C, on a p 6= 0 et ∃ε > 0 tel que :
ε < kpk2 = hprojC (x0 ) − x0 , projC (x0 ) − x0 i
hp, xi = α
C
p
x0
•
projC (x0 )
•
F IGURE 3.3 – Séparation stricte entre un point et un convexe
et donc
hprojC (x0 ) − x0 , x0 i + ε < hprojC (x0 ) − x0 , projC (x0 )i ≤ hprojC (x0 ) − x0 , xi ,
∀x ∈ C
La dernière inégalité s’obtient grâce au théorème (3.1). On obtient donc :
hp, x0 i + ε ≤ inf hp, xi
x∈C
et donc le résultat recherché :
hp, x0 i < inf hp, xi .
x∈C
C OROLLAIRE 3.6 (Séparation stricte de deux convexes). Soient C1 et C2 deux sous-ensembles
convexes, fermés et non vides de E un espace de Hilbert. De plus C1 est supposé compact. On
suppose C1 ∩ C2 = ∅. Alors il existe p ∈ E \ {0} telle que :
sup hp, xi < inf hp, xi .
x∈C1
x∈C2
Preuve On remarque que d’après le lemme (2.4), C1 −C2 est un sous-ensemble convexe et fermé
de E. De plus 0 ∈
/ C1 − C2 car C1 ∩ C2 = ∅. Ainsi d’après le théorème (3.5) ci-dessus, il existe
p 6= 0 tel que :
0 = hp, 0i <
inf
hp, x − yi
x∈C1 , y∈C2
Ce qui implique :
sup hp, yi < inf hp, xi .
y∈C2
x∈C1
27
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
Remarque 3.2 L’hypothèse de compacité de l’un des deux sous-ensembles convexes C1 et C2 est
importante. Les deux sous-ensembles de R2 suivants sont convexes, fermés et disjoints et pourtant,
on ne peut les séparer strictement.
1
C1 = (x, y) ∈ R | x < 0, y ≥ −
x
2
C2 = R2+
T HÉORÈME 3.7 (Séparation large d’un point et d’un convexe). Soient C un sous-ensemble convexe
non vide de E un espace de Hilbert de dimension finie et x0 ∈
/ C. Alors, il existe p ∈ E \ {0} telle
que :
hp, x0 i ≥ sup hp, xi .
x∈C
Pour la démonstration que nous donnons de ce théorème, nous utilisons la caractérisation suivante
d’un ensemble compact.
L EMME 3.8 Soit E un espace vectoriel normé et K un sous-ensemble de E. Alors on a l’équivalence entre les deux assertions suivantes :
B K est compact ;
B Toute famille de fermés de K dont toute sous-famille finie est d’intersection non vide est elle
même d’intersection non vide.
Preuve du théorème (3.7) On considère le sous-ensemble K = S(0, 1) = {p ∈ E | kpk = 1}
qui est un compact car il est fermé et borné d’un espace vectoriel normé de dimension finie. Pour
tout x ∈ C on associe le sous-ensemble de K défini par
A(x) := {p ∈ K | hp, xi ≥ hp, x0 i} .
1
(x −
kx − x0 k
\
x0 ) ∈ A(x). Afin de conclure nous allons montrer que
A(x) =
6 ∅. Pour cela nous utiliOn remarque que pour tout x ∈ C, A(x) est un fermé de K qui est non vide car
x∈C
sons la propriété du lemme (3.8). Considérons x1 , . . . , xm un nombre fini déléments de C. On
a co{x1 , . . . , xm } ⊂ C car C est convexe et x0 ∈
/ co{x1 , . . . , xm } car x0 ∈
/ C. Comme de
plus co{x1 , . . . , xm } est un convexe fermé, on peut appliquer le théorème de séparation stricte et
obtenir qu’il existe p 6= 0 tel que :
hp, x0 i <
inf
x∈co{x1 ,...,xm }
hp, xi .
En particulier,
∀i ∈ {1, . . . , m},
et on a
m
\
1
p∈
A(xi ).
kpk
i=1
hp, x0 i ≤ hp, xi i
28
Convexité et optimisation
C OROLLAIRE 3.9 Soient E un espace de Hilbert de dimension finie, C un sous-ensemble de E
convexe et d’intérieur non vide et x0 ∈
/ int(C). Alors, il existe p ∈ E \ {0} telle que :
hp, x0 i ≥ sup hp, xi .
x∈C
T HÉORÈME 3.10 (Séparation large de deux convexes). Soient C1 et C2 deux sous-ensembles
convexes et non vides de E = Rn . On suppose C1 ∩ C2 = ∅. Alors il existe p ∈ Rn \ {0}
telle que :
sup hp, xi ≤ inf hp, xi .
x∈C1
x∈C2
Preuve On remarque que 0 ∈
/ C1 − C2 et on utilise le théorème (3.7).
3.3
Polarité et lemme de Farkas
D ÉFINITION 3.2 Soit E(= Rn ) un espace de Hilbert et A un sous-ensemble de E.
B On appelle le cône polaire négatif de A, noté A◦ l’ensemble :
A◦ = {y ∈ E | ∀x ∈ A, hy, xi ≤ 0} .
B On appelle l’orthogonal de A, noté A⊥ l’ensemble :
A⊥ = {y ∈ E | ∀x ∈ A, hy, xi = 0} .
P ROPOSITION 3.11 Soit E un espace de Hilbert et A un sous-ensemble de E. Alors :
B Le cône polaire négatif de A, A◦ est un cône convexe fermé.
B L’orthogonal de A, A⊥ est un sous-espace vectoriel fermé et A⊥ ⊂ A◦ .
B Si A est un sous-espace vectoriel de E alors A⊥ = A◦ .
B Si B est un sous-ensemble de E telle que A ⊂ B, alors, B ◦ ⊂ A◦ et B ⊥ ⊂ A⊥ .
Remarque 3.3 Si A = {0} alors A◦ = A⊥ = E et si A = E alors A◦ = A⊥ = {0}.
T HÉORÈME 3.12 (Théorème des bipolaires) Soit A un sous-ensemble non vide de l’espace euclidien Rn . Alors :
A◦◦ = adh(cone(A)) et A⊥⊥ = Vect(A).
Preuve (A◦ )◦ est un cône convexe fermé qui contient A. Donc, adh(cone A) ⊂ (A◦ )◦ . Montrons
maintenant l’inclusion inverse en raisonnant par l’absurde. Soit x0 ∈ (A◦ )◦ et x0 ∈
/ adh(cone A).
Alors, on peut séparer strictement le singleton {x0 } et le convexe fermé adh(cone A). Il existe
donc p 6= 0 telle que sup{hp, yi | y ∈ adh(cone A)} < hp, x0 i. Comme la forme linéaire y 7→
hp, yi est majorée sur le cône adh(cone A), on en déduit que sup{hp, yi | y ∈ adh(cone A)} =
0 < hp, x0 i. Comme A ⊂ adh(cone A)}, on en déduit que p ∈ A◦ . Alors, hp, x0 i > 0 contredit
x0 ∈ (A◦ )◦ ce qui termine la démonstration.
29
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
C OROLLAIRE 3.13 Soit A un sous-ensemble de l’espace euclidien Rn .
B Si A est un cône convexe fermé, alors A◦◦ = A.
B Si A est un sous-espace vectoriel, alors A⊥⊥ = A.
T HÉORÈME 3.14 (Lemme de Farkas)
E = Rn . Soit

A=
X

Soit (ai )i∈I et (bj )j∈J , deux familles finies d’éléments de
X
λi ai +
i∈I
µj bj | λ ∈ RI+ , µ ∈ RJ



j∈J
et
B = {p ∈ Rn | hp, ai i ≤ 0, ∀i ∈ I, hp, bj i = 0, ∀j ∈ J}
Alors, A◦ = B et B ◦ = A.
Preuve Il est clair que A◦ = B et que A ⊂ B ◦ . De plus, la première égalité et le théorème des
bipolaires nous donnent que B ◦ = adh(cone A). Pour avoir la deuxième égalité, il suffit donc
de montrer que A est un cône convexe fermé. Or A est le cône finiment généré par la famille
((ai )i∈I , (bj )j∈J , (−bj )j∈J ). Il est donc convexe et d’après la proposition (2.6), il est fermé.
C OROLLAIRE 3.15 Soient a1 , . . . , am et b des vecteurs de Rn . Alors
{x ∈ Rn | ∀i = 1, . . . , m, hai , xi ≤ 0} ⊂ {x ∈ Rn | hb, xi ≤ 0}
si et seulement si
b ∈ cone({a1 , . . . , am }).
Preuve Soit A =
(m
X
)
λi ai | λ ∈
Rm
+
et B = {x ∈ Rn | hai , xi ≤ 0, ∀i = 1, . . . , m}. Alors,
i=1
la condition du corollaire s’écrit : ∀x ∈ Rn vérifiant hai , xi ≤ 0, pour tout i = 1, . . . , m, alors
hb, xi ≤ 0, est équivalente à b ∈ B ◦ . D’après le lemme de Farkas, ceci implique b ∈ A.
3.4
Exercices
E XERCICE 22
Soit X l’espace vectoriel des polynômes réels de degré inférieur ou égal à 2
muni du produit scalaire h., .i défini par :
P ∈ X, Q ∈ X, hP, Qi =
Z 1
P (x)Q(x)dx
0
On considère le problème (P) défini par :
(P)



Z 1
Minimiser
a, b ∈ R
0
1 - Montrer que (P) admet une solution unique.
2 - Résoudre (P).
(3x2 − ax − b)2 dx
30
Convexité et optimisation
E XERCICE 23
Soit M un sous-espace vectoriel de Rn . A tout x ∈ Rn on associe l’unique
élément de M , noté P (x), tel que
kx − P (x)k = inf kx − yk
y∈M
1 - Soient x ∈ Rn , z ∈ M et t ∈ R. Démontrer les inégalités suivantes
kx − P (x)k2 ≤ kx − P (x) + tzk2
et
0 ≤ t2 kzk2 + 2t hx − P (x), zi
En déduire que hx − P (x), zi = 0 pour tout z ∈ M .
2 - Montrer que l’application P est linéaire et que kP (x)k ≤ kxk, ∀x ∈ Rn .
3 - Soient x ∈ Rn et h ∈ Rn . Montrer que :
kx + h − P (x + h)k2 − kx − P (x)k2 = 2 hx − P (x), hi + kh − P (h)k2
4 - Pour tout x ∈ Rn , on pose f (x) = inf kx − yk2 . Montrer que f est différentiable et convexe
y∈M
sur Rn .
E XERCICE 24
Soit K un cône convexe fermé non vide de Rn .
1 - Montrer que pour tout p ∈ Rn , sup {hp, xi , x ∈ K} = 0 ou +∞.
2 - Montrer que : PK (u) est la projection de u ∈ Rn sur K si et seulement si :
PK (u) ∈ K, hu − PK (u), PK (u)i = 0 et sup{hu − PK (u), xi , x ∈ K} = 0
3 - Montrer que si Pu est la projection de u ∈ Rn sur K alors ∀β ≥ 0, la projection de βu sur K
est égale à βPu .
Rn est muni du produit scalaire habituel et de la norme euclidienne. On consiE XERCICE 25
dère C un sous-ensemble fermé, convexe et non vide de Rn et x ∈ Rn .
1 - Montrer que pour tout c ∈ C, kx − ck2 ≥ k projC (x) − ck2 + kx − projC (x)k2 .
2 - soit a ∈ Rn et D = a + C = {a + c | c ∈ C}. Montrer que projD (x) = a + projC (x − a).
1
3 - Soit α ∈ R∗ . On pose E = αC = {αc | c ∈ C}. Montrer que projE (x) = α projC
x .
α
4 - On pose u = x − projC (x) et on considère t ∈ [−1, +∞[. Montrer que projC (x + tu) =
projC (x). Donner une interprétation géométrique de ce résultat.
E XERCICE 26
habituel de Rn .
Soit K un cône convexe fermé de Rn telle que K ∩ Rn+ = {0} et S le simplexe
1 - Montrer que K ∩ S = ∅.
31
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
2 - Montrer qu’il existe p ∈ Rn telle que hp, xi ≤ 0 pour tout x ∈ K et hp, yi > 0 pour tout
y ∈ S.
3 - Montrer que p ∈ (R∗+ )n et en déduire que K ◦ ∩ (R∗+ )n 6= ∅.
E XERCICE 27
Soit C un cône convexe fermé de Rn non réduit à {0}.
1 - Montrer que C est saillant si et seulement si int (C ◦ ) 6= ∅.
2 - On suppose que C est saillant et on choisit u un élément de l’intérieur de C ◦ . Montrer que pour
tout α ≤ 0, l’ensemble Cα = {c ∈ C | hu, ci = α} est compact. Montrer que si α < 0, alors
[
C=
λCα .
λ≥0
Soient a ∈ Rn et K un sous-ensemble convexe fermé non vide de Rn , tel que :
E XERCICE 28
∀x ∈ K, ha, xi ≥ 0. Pour tout t ∈]0, +∞[, on pose
C(t) = x ∈ K | ha, xi ≤ inf ha, zi + t
z∈K
1 - Montrer que pour tout t ∈]0, +∞[, C(t) est un ensemble convexe fermé non vide.
2 - Montrer que, pour tout t ∈]0, +∞[, il existe un élément et un seul dans C(t), noté x(t), telle
que kx(t)k = inf kxk.
x∈C(t)
3 - Montrer que la fonction ϕ :]0, +∞[→ R, t 7→ ϕ(t) = kx(t)k est convexe, décroissante et
continue.
E XERCICE 29
Dans R3 , on considère l’ensemble
C = {(x, y, z) ∈ R3 | 0 ≤ x; 0 ≤ y; z 2 ≤ xy}
et la droite D d’équations x = 0, z = 1. Montrer que C est un convexe fermé et que tout hyperplan
affine passant par D rencontre C.
E XERCICE 30
Soient A et B deux parties convexes et non vides de Rn vérifiant : A ∩ B = ∅,
A ∪ B = Rn et A est fermé. Montrer que A est un demi-espace.
E XERCICE 31
Soit x ∈ Rn \ {0}. Pour tout k ∈ N∗ on considère Bk la boule ouverte de centre
[
kx et de rayon kkxk. Montrer que
Bk est un demi-espace.
k∈N∗
E XERCICE 32 Soit K un cône non vide de Rn . On suppose qu’il existe p ∈ Rn \ {0}, α ∈ R tel
que K est inclus dans le demi-espace D = {x ∈ Rn | hp, xi < α}.
1 - Montrer que α ≥ 0.
2 - Montrer que K ⊂ {x ∈ Rn | hp, xi ≤ 0}
32
Convexité et optimisation
E XERCICE 33
1 - Expliciter A◦ dans le cas où A est un sous-espace vectoriel.
2 - Montrer que si A ⊂ B, alors B ◦ ⊂ A◦ .
3 - Déterminer les polaires négatifs des ensembles :
(
x ∈ Rn | xk ≥ 0 ∀k = 1, ..., n et
B A=
n
X
)
xk ≤ 1 ;
k=1
(
x∈
B B=
Rn
|
n
X
)
|xk | ≤ 1 ;
k=1
B C = x ∈ R2 | (x1 − 1)2 + x22 ≤ 1 ;
B D= x∈
E XERCICE 34
R2
| x1 ≤ 1 −
q
1+
x22
.
Soient K1 et K2 deux cônes convexes et fermés de Rn . Montrer que
(K1 ∩ K2 )◦ = adh(K1◦ + K2◦ ).
E XERCICE 35
Soit A et B deux sous-ensembles de Rn tels que 0 appartient à l’intérieur de
A − B. Montrer que l’ensemble A◦ + B ◦ est fermé.
E XERCICE 36
Soit C un sous-ensemble de Rn défini par k contraintes affines :
C=
k
\
{x ∈ Rn | hai , xi ≤ αi }
i=1
ou les (ai )ki=1 sont des vecteurs de Rn et les (αi )ki=1 sont des réels. Soit x ∈ C et soit
I := {i ∈ {1, . . . , k} | hai , xi = αi }
l’ensemble des contraintes saturées au point x. Montrer que x est un point extrémal de C (définition si besoin dans l’exercice 11) si et seulement si Vect{ai , i ∈ I} = Rn .
E XERCICE 37
On note C l’ensemble des matrices A = (aij )1≤i,j≤n de Mn (R) qui sont doublement stochastiques, c’est à dire qui vérifient les conditions :
1. ∀i, j ∈ {1, . . . , n}, aij ≥ 0 ;
2. ∀i ∈ {1, . . . , n},
3. ∀j ∈ {1, . . . , n},
n
X
j=1
n
X
aij = 1 ;
aij = 1.
i=1
1 - Montrer que C est convexe.
2 - Une matrice A = (aij )1≤i,j≤n est une matrice de permutation s’il existe une bijection (permutation) σ de {1, . . . , n} sur lui même tel que ∀i, j ∈ {1, . . . n}, aij = 1 si j = σ(i) et 0 sinon.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
33
Montrer que les matrices de permutation sont des points extrémaux de C (définition si besoin dans
l’exercice 11).
3 - Montrer que l’ensemble K des matrices de Mn (R) vérifiant les conditions (2) et (3) est un
sous-espace affine (c’est à dire le translaté d’un sous-espace vectoriel) de dimension (n − 1)2 .
4 - Montrer, en utilisant l’exercice (36) que si une matrice A = (aij )1≤i,j≤n est un point extrémal
de C, alors (n − 1)2 de ses coefficients sont nuls.
5 - En déduire qu’il existe (i, j) ∈ {1, . . . , n}2 tel que aij = 1.
6 - Montrer que les points extrémaux de K sont les matrices des permutations.
34
Convexité et optimisation
Chapitre 4
Fonctions convexes
Dans tout ce chapitre, on suppose que E = Rn est muni d’une norme k.k.
4.1
Définitions et propriétés
D ÉFINITION 4.1 Soit U ⊂ Rn un sous-ensemble convexe et f : U → R une fonction.
B On dit que f est convexe sur U si
∀a, b ∈ U, ∀t ∈ [0, 1],
f (ta + (1 − t)b) ≤ tf (a) + (1 − t)f (b).
B On dit que f est strictement convexe sur U si
∀a, b ∈ U avec a 6= b, ∀t ∈]0, 1[,
f (ta + (1 − t)b) < tf (a) + (1 − t)f (b).
B On dit que f est quasi-convexe si ∀α ∈ R, {x ∈ U | f (x) ≤ α} est convexe.
B On dit que f est concave (respectivement strictement concave, quasi-concave) si −f est
convexe (respectivement strictement convexe, quasi-convexe).
Remarques 4.1
B La définition de f convexe signifie que si l’on prend deux points sur la courbe de f , alors le
segment défini par ces deux points reste au dessus de la courbe de f .
B Une fonction affine f : Rn → R définie par f (x) = ha, xi + b (a ∈ Rn et b ∈ R) est
convexe et concave à la fois.
B l’application x 7→ kxk est convexe.
B Une fonction strictement convexe est convexe mais la réciproque n’est pas vraie en général
comme on peut le vérifier avec les fonctions affines.
B Une fonction convexe est quasi-convexe mais la réciproque n’est en général pas vraie. Il
suffit de considérer une fonction de R dans R croissante mais sans être convexe.
35
36
Convexité et optimisation
y
courbe de f
segment [A, B]
•B
•
tf (a) + (1 − t)f (b)
A•
•
f (x)
a
x
ta + (1 − t)b
b
F IGURE 4.1 – Courbe d’une fonction convexe
B On montre par récurrence que si f est convexe alors pour tout m ∈ N∗ :
∀x1 , . . . , xm ∈ U , ∀t1 , . . . , tm ≥ 0 telle que
m
X
ti = 1, on a
i=1
f
m
X
i=1
!
ti xi
≤
m
X
ti f (xi ).
i=1
D ÉFINITION 4.2 (Epigraphe d’une fonction). Soit U ⊂ Rn et f : U → R une fonction.
B On appelle le graphe de f , noté Gr(f ), le sous-ensemble des éléments (x, t) de U × R telle
que f (x) = t :
Gr(f ) = {(x, t) ∈ U × R | f (x) = t} .
B On appelle l’épigraphe de f , noté Epi(f ), le sous-ensemble des éléments (x, t) de U × R
telle que f (x) ≤ t :
Epi(f ) = {(x, t) ∈ U × R | f (x) ≤ t} .
P ROPOSITION 4.1 Soit U un sous-ensemble convexe de Rn et f : U → R une fonction. f est
convexe si et seulement si Epi(f ) est convexe.
P ROPOSITION 4.2
B Soit (fi )i∈I une famille de fonctions convexes définies sur un convexe U de Rn et telle
que ∀x ∈ U , sup fi (x) < +∞. Alors le supremum de la famille (fi )i∈I définie par x 7→
i∈I
sup fi (x) est convexe.
i∈I
B Soient f une fonction convexe et α ≥ 0. Alors αf est une fonction convexe.
B La somme de deux fonctions convexes est convexe.
B Soient U un sous-ensemble convexe de Rn , f : U → R une fonction convexe et ϕ : R → R
une fonction croissante et convexe. Alors ϕ ◦ f est convexe.
37
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
f (x)
x
F IGURE 4.2 – Illustration de l’épigraphe d’une fonction
Exemples 4.2
B Si f : U → R est convexe alors x ∈ U 7→ ef (x) est convexe.
B Si f est convexe et positive, alors f p est convexe (∀p ∈ N∗ ).
B Pour p ∈ N∗ , la fonction x 7→ kxkp est convexe.
B Si f est convexe et strictement positive, alors la fonction
4.2
1
est convexe.
f
Le cas des fonctions convexes différentiables
P ROPOSITION 4.3 Soient U un sous-ensemble ouvert de Rn et f : U → R une fonction différentiable. On considère C un sous-ensemble de U convexe. Alors les assertions suivantes sont
équivalentes :
1. f est convexe sur C ;
2. ∀x, y ∈ C, f (y) − f (x) ≥ h∇f (x), y − xi ;
3. ∀x, y ∈ C, h∇f (y) − ∇f (x), y − xi ≥ 0.
Preuve Montrons tout d’abord que (1) implique (2). Prenons x et y ∈ C. Pour tout t ∈ [0, 1],
On a :
ϕ(t) = f (x + t(y − x)) = f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y)
et
f (x + t(y − x)) = f (x) + h∇f (x), t(y − x)i + tky − xkε(t(y − x))
avec lim ε(t(y − x)) = 0. On déduit que :
t→0+
t(f (y) − f (x)) ≥ h∇f (x), t(y − x)i + tky − xkε(t(y − x))
et en divisant par t et en faisant tendre t vers 0, on obtient bien le résultat recherché.
38
Convexité et optimisation
Montrons que (2) implique (3). Pour x et y ∈ C, on a les deux inégalités suivantes :
f (y) − f (x) ≥ h∇f (x), y − xi
f (x) − f (y) ≥ h∇f (y), x − yi
En additionnant ces deux inégalités, on obtient :
0 ≤ h∇f (y) − ∇f (x), y − xi .
Montrons que (3) implique (2). Raisonnons par l’absurde et supposons pour cela qu’il existe
x et y ∈ C tel que f (y) − f (x) < h∇f (x), y − xi. Nous allons appliquer le théorème des
accroissements finis à ϕ : [0, 1] → R définie par ϕ(t) = f (x + t(y − x)). Il existe donc t0 ∈]0, 1[
tel que :
f (y) − f (x) = ϕ(1) − ϕ(0) = ϕ0 (t0 ) = h∇f (x + t0 (y − x)), y − xi.
On obtient :
h∇f (x + t0 (y − x)), y − xi < h∇f (x), y − xi
En posant z = x + t0 (y − x) ∈ C et en remarquant que z − x = t0 (y − x), on a :
h∇f (z) − ∇f (x), z − xi < 0
Ce qui donne une contradiction avec la propriété (3).
Pour finir montrons que (2) implique (1). Pour tout x ∈ C, soit ϕx : C → R définie par
ϕx (y) = f (x) + h∇f (x), y − xi .
Les fonctions ϕx sont affines et donc convexes. On a donc, pour tout x, y ∈ C, f (y) ≥ ϕx (y) et
donc ∀y ∈ C, f (y) ≥ sup ϕx (y). Comme pour x = y on a ϕx (y) = f (y), on a :
x∈C
∀y ∈ C,
f (y) = sup ϕx (y)
x∈C
et f est donc convexe car elle est égale au sup (fini) d’une famille de fonctions convexes.
P ROPOSITION 4.4 Soient U un sous-ensemble de Rn ouvert et convexe et f : U → R une fonction
de classe C 2 . Alors :
B f est convexe si et seulement si ∀x ∈ U , Hf (x) est semi-définie positive.
B Si ∀x ∈ U , Hf (x) est définie positive, alors f est strictement convexe.
La réciproque du second point de la proposition ci-dessus n’est en général pas
Remarque 4.3
vraie. La fonction f : R2 → R définie par f (x, y) = x2 + y 2 est strictement convexe et pourtant
sa matrice Hessienne au point (0, 0) égale à la matrice nulle n’est pas définie positive.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
39
Preuve Tout d’abord supposons que f est convexe et soient a ∈ U et h ∈ Rn . Alors il existe
η > 0 tel que ∀t ∈ [0, η], a + th ∈ C et on a ∀t ∈ [0, η], f (a + th) ≥ f (a) + th∇f (a), hi et grâce
à la formule de Taylor à l’ordre 2, on a :
0 ≤ f (a + th) − f (a) − th∇f (a), hi =
t2
hh, Hf (a)hi + t2 khk2 ε(th)
2
avec lim ε(u) = 0. Ainsi :
u→0
hh, Hf (a)hi ≥ −2khk2 ε(th)
∀t ∈]0, η],
et en faisant tendre t vers 0, on obtient ∀h ∈ Rn , hh, Hf (a)hi ≥ 0 et la matrice Hessienne est
dont semi-définie positive en tout point a ∈ U .
Pour la réciproque, supposons que pour tout a ∈ U , Hf (a) est semi-définie positive. Soient x, y ∈
U . Pour tout t ∈ [0, 1] soit
g(t) = f (tx + (1 − t)y) − tf (x) − (1 − t)f (y).
La fonction g est deux fois dérivable et :
g 0 (t) = h∇f (y + t(x − y)), x − yi − f (x) + f (y)
g 00 (t) = hx − y, Hf (y + t(x − y))(x − y)i ≥ 0
Ainsi g 0 est croissante sur [0, 1]. Pour t ∈]0, 1[ fixé, Appliquons maintenant le théorème des accroissements finis sur [0, t] et [t, 1]. Il existe donc θ ∈]0, t[ et θ0 ∈]t, 1[ tel que :
g(t) = g(0) + g 0 (θ)t = g 0 (θ)t
−g(t) = g(1) − g(t) = g 0 (θ0 )(1 − t)
Comme θ < t < θ0 , on a :
g 0 (θ) =
Il en découle que g(t)
1
1
+
t
1−t
g(t)
g(t)
≤−
= g 0 (θ0 )
t
1−t
≤ 0 et donc g(t) ≤ 0, ce qui termine la preuve de cette
deuxième implication.
Pour la preuve du deuxième point, il suffit d’adapter l’argument ci-dessus.
4.3
Exercices
E XERCICE 38
1 - Montrer que les assertions suivantes sont équivalentes :
B f est une fonction convexe de Rn dans R ;
40
Convexité et optimisation
B ∀(xi ), i = 1, ..., m, xi ∈ Rn , ∀(λi ) ∈ [0, 1]m tel que
m
X
λi = 1 on a :
i=1
m
X
f
!
λ i xi
≤
i=1
m
X
λi f (xi )
i=1
B Epi(f ) est un sous-ensemble convexe de Rn+1 .
n
2 - Soit n ∈ N∗ . Montrer que ∀(x1 , . . . , xn ) ∈ (R+
∗) ,
1
(x1 ...xn ) n ≤
x1 + ... + xn
n
3 - Soient f et g : Rn → R deux fonctions convexes. En supposant que α, β > 0, montrer que
αf + βg est une fonction convexe.
4 - On considère p fonctions convexes, fi : Rn → R, i = 1, . . . , p. Montrer que la fonction
f = max fi est convexe.
i=1,...,p
5 - Soit U un sous-ensemble convexe de Rn .
a - Soit f : U −→ R une fonction convexe et soit ϕ : f (U ) −→ R une fonction convexe
croissante. Montrer que ϕ ◦ f est convexe sur U .
b - Soit f une fonction convexe définie sur Rn à valeurs dans R. Pour tout x ∈ Rn , on pose
g(x) = [max{0, f (x)}]2 , montrer que la fonction g ainsi définie est convexe.
E XERCICE 39
Soit f : Rn −→ R une fonction concave et U = {x ∈ Rn | f (x) > 0}.
1 - Montrer que U est un ouvert convexe.
2 - On suppose U non vide, Montrer que la fonction
1
est convexe sur U .
f
E XERCICE 40
Montrer que les fonctions f et g définies sur R2 par f (x, y) = x4 + y 4 et
g(x, y) = (x − y)2 sont convexes, mais que h = f − g n’est ni convexe ni concave sur R2 .
E XERCICE 41
On considère la fonction définie par
f (x, y) =
1 − xy
.
x+y
1 - Quel est le domaine de définition de f . Est-il ouvert ? fermé ? borné ? convexe ?
2 - Etudier la convexité de f sur D1 = (x, y) ∈ R2 | x + y > 0 et D2 = (x, y) ∈ R2 | x + y < 0 .
1 − xy √
3 - Etudier la convexité de g(x, y) =
− x + y sur son domaine de définition.
x+y
√
E XERCICE 42
x+y
Montrer que ∀x, y ∈]1, +∞[, ln
2
E XERCICE 43
Montrer que la fonction f : x 7→ max{|x + a|, |x + b|}, a, b ∈ R est convexe.
≥
ln x ln y.
41
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
E XERCICE 44
Soient U un sous-ensemble convexe de Rn et f : U → R une fonction.
1 - On suppose que f est convexe. Soit S :=
convexe.
u ∈ U | f (u) = inf f (x) . Montrer que S est
x∈U
2 - On suppose que f est strictement convexe. Montrer que S a au plus un élément.
E XERCICE 45
1 - Soit A un sous-ensemble fermé non vide de Rn . Montrer que A est convexe si et seulement si
la fonction x 7→ dA (x) = inf{kx − ak, a ∈ A} est convexe.
2 - Montrer sur un exemple que le résultat précédent n’est pas vrai si on ne suppose pas que A est
fermé.
E XERCICE 46
que
Soit f : Rn → R une fonction convexe et A un sous-ensemble de Rn . Montrer
sup f (x) = sup f (x).
x∈A
x∈co(A)
E XERCICE 47
Soit f une application convexe de Rn dans R. On suppose que l’épigraphe de f ,
Epi(f ) est fermé et qu’il existe a ∈ R tel que l’ensemble {x ∈ Rn | f (x) ≤ a} est non vide et
borné. Montrer que pour tout α ∈ R, l’ensemble {x ∈ Rn | f (x) ≤ α} est borné.
Indication : on pourra raisonner par l’absurde et montrer que si l’ensemble Cα = {x ∈ Rn |
f (x) ≤ α} est non borné, alors il existe x0 ∈ Cα et u ∈ Rn \ {0} tels que x0 + tu ∈ Cα pour tout
t ≥ 0. On déduira de ce résultat préliminaire que Ca est non borné.
E XERCICE 48
Soit
h : (x, y, z) ∈ R3 7→ h(x, y, z) = 3x2 + 2y 2 + z 2 + axy + 2yz + 2xz
Pour quelles valeurs du paramétre a, la fonction h est elle convexe ?
E XERCICE 49
Soient C un sous-ensemble ouvert et convexe de Rn et f : C → R une fonction.
Montrer que f est convexe si et seulement si :
∀x ∈ C, ∃p ∈ Rn telle que ∀y ∈ C, f (y) ≥ f (x) + hp, y − xi .
Soient f une fonction convexe de Rn dans R et x0 ∈ Rn . On appelle le sousE XERCICE 50
différentiel de f en x0 , l’ensemble des éléments p de Rn telle que :
f (x) − f (x0 ) ≥ hp, x − x0 i , ∀x ∈ Rn .
Montrer que si f est continue en x0 , alors le sous-différentiel de f en x0 est non vide. On pourra
considérer le point (x0 , f (x0 )) et l’intérieur de l’épigraphe de f .
42
Convexité et optimisation
E XERCICE 51
Soit f : Rn → R une fonction Soit a, h ∈ Rn , on rappelle que par définition,
f possède une dérivée directionnelle à droite au point a dans la direction h, si la limite suivante
existe dans R :
f (a + th) − f (a)
D+ f (a, h) := lim
.
t→0, t>0
t
1 - Soit f : Rn → R une fonction convexe, a, h ∈ Rn et g : R∗+ → R la fonction définie par
f (a + th) − f (a)
g(t) =
.
t
a - Montrer que g(t) ≥ f (a) − f (a − h), ∀t > 0.
b - Montrer que g est croissante.
c - En déduire que D+ f (a, h) existe et vérifie la condition (c) : D+ f (a, h) ≤ f (a + h) − f (a).
2 - Soit f : Rn → R une fonction différentiable, vérifiant la condition (c).
a - Montrer que ∇f (x) · (y − x) ≤ f (y) − f (x), ∀x, y ∈ Rn .
b - En déduire que f est convexe.
3 - Application.
Soit l’application f : R2 → R définie par :
f (x, y) =


0
y3

 2
y + |x|
si (x, y) = (0, 0)
sinon.
a - Montrer que f n’est pas différentiable en (0, 0).
b - Montrer que f admet une dérivée directionnelle à droite au point (0, 0) dans toute direction
h = (h1 , h2 ).
c - Montrer que f n’est pas convexe.
E XERCICE 52
Soient U un ouvert convexe de Rn et f : U → R une fonction.
1 - Montrer que f est convexe si et seulement si ∀a ∈ U , ∀h ∈ Rn , f admet une dérivée directionnelle à droite au point a dans la direction h, D+ f (a, h) et ∀(a, h) ∈ U × Rn tel que a + h et
a − h appartiennent à U on a :
f (a) − f (a − h) ≤ D+ f (a, h) ≤ f (a + h) − f (a).
2 - Soit f : U → R une fonction convexe. Montrer que f admet un minimum global sur U en
a ∈ U si et seulement si D+ f (a, h) ≥ 0 ∀h ∈ E.
Chapitre 5
Optimisation : généralités
Après les chapitres précédents traitant le cadre de l’analyse convexe, nous allons maintenant énoncer les premiers résultats en optimisation : théorèmes d’existence, conditions d’optimalité et conditions nécessaires et suffisantes dans le cas d’un problème d’optimisation sans contraintes.
Un problème d’optimisation peut en général s’écrire :
(
min f (x)
x∈U
Ou f est une fonction définie sur U un sous-ensemble de Rn . Maximiser une fonction f revient à
minimiser son opposée −f . Ainsi nous nous limiterons aux résultats qui concernent le problème
de minimisation.
5.1
Définitions
D ÉFINITION 5.1 Soit f une fonction de U un sous-ensemble de Rn dans R.
B x∗ ∈ U est un maximum de f sur U si f (x∗ ) ≥ f (x) pour tout x ∈ U .
B x∗ ∈ U est un minimum de f sur U si f (x∗ ) ≤ f (x) pour tout x ∈ U .
B x∗ ∈ U est un minimum local de f sur U si il existe r > 0 telle que f (x∗ ) ≤ f (x) pour tout
x ∈ U ∩ B(x∗ , r).
B x∗ ∈ U est un maximum local de f sur U si il existe r > 0 telle que f (x∗ ) ≥ f (x) pour
tout x ∈ U ∩ B(x∗ , r).
On rappelle que toute partie non vide A de R admet une borne inférieure notée
Remarque 5.1
inf A qui est par définition égale à son minorant maximal dans R ∪ {−∞}, c’est à dire :
a ≥ inf A,
∀a ∈ A
et
∀β > inf A, il existe a ∈ A tel que a ≤ β.
43
44
Convexité et optimisation
•
min local
•
min global
F IGURE 5.1 – Exempe : minimum local / minimum global
Si A n’est pas minoré inf A = −∞.
Si U est un ensemble non vide et f une fonction définie sur U à valeurs dans R et minorée, alors
la valeur α = inf f (x) est un nombre réel caractérisé par :
x∈U
∀x ∈ U, f (x) ≥ α et ∀ε > 0, ∃xε tel que f (xε ) ≤ α + ε.
Ainsi en considérant une suite (εn )n∈N de réels strictement positifs qui converge vers 0, nous
obtenons l’existence d’une suite (xn )n∈N à valeurs dans U tel que :
f (xn ) ≤ inf f (x) + εn .
x∈U
Comme pour tout n ∈ N, on a également f (xn ) ≥ inf f (x), on a :
x∈U
lim f (xn ) = inf f (x).
n→+∞
x∈U
Toute suite (xn )n∈N à valeurs dans U et qui converge vers inf f (x) est appelé suite minimisante
x∈U
de f sur U .
Si f n’est pas minorée sur U , alors α = inf f (x) = −∞ et une suite minimisante est simplement
x∈U
une suite (xn )n∈N vérifiant :
lim f (xn ) = inf f (x) = −∞.
n→+∞
5.2
x∈U
Existence
Nous rappelons deux résultats fondametaux.
T HÉORÈME 5.1 Soit K un compact non vide de Rn et f : K → R une fonction continue. Alors
le problème
(
min f (x)
x∈K
admet une solution.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
45
Preuve On considère une suite minimisante (xn )n∈N . Cette suite est à valeurs dans K et vérifie :
lim f (xn ) = inf f (x).
n→+∞
x∈K
Comme K est compact, on peut, quitte à extraire une sous-suite que nous continuerons à noter
(xn )n∈N , supposer que (xn )n∈N est convergente vers un élément x∗ ∈ K. Comme f est continue
(f (xn ))n∈N converge vers f (x∗ ) et on a alors :
f (x∗ ) = inf f (x).
x∈U
T HÉORÈME 5.2 Soit f : Rn → R une fonction continue. On suppose que f est cœrcive, c’est à
dire :
∀α > 0, ∃R > 0, [kxk ≥ R] ⇒ [f (x) ≥ α] .
Alors f est minorée et le problème
(
min f (x)
x ∈ Rn
admet une solution.
Preuve On considère K := {x ∈ Rn | f (x) ≤ f (0)}. On observe que K est non vide et fermé.
Il également borné car d’après l’hypothèse, il existe R > 0 tel que [kxk ≥ R] implique [f (x) ≥
α + 1] et donc K ⊂ B(0, R). K est donc un compact et d’après le théorème précédent, ∃x∗ ∈ K
tel que ∀x ∈ K, f (x) ≥ f (x∗ ). Mais cette inégalité reste vraie si x ∈
/ K car dans ce cas f (x) >
∗
f (0) ≥ f (x ) (car 0 ∈ K).
5.3
Le cas de l’optimisation sans contraintes
D ÉFINITION 5.2 Soit f différentiable sur U ouvert de Rn à valeurs dans R.
B Un point x ∈ U tel que ∇f (x) = 0 est appelé un point critique de f sur U .
B Un point x̄ ∈ U tel que ∇f (x) = 0 et Hf (x) n’est ni semi-définie positive, ni semi-définie
négative, est appelé un point selle de f sur U .
On dit que le problème d’optimisation
(
min f (x)
x∈U
est sans contrainte si le sous-ensemble U de Rn est un ouvert. Nous avons alors les conditions
nécessaires et suffisantes d’optimalité qui suivent.
P ROPOSITION 5.3 (Conditions nécessaires). Soit f différentiable sur U ouvert de Rn à valeurs
dans R.
46
Convexité et optimisation
point selle
F IGURE 5.2 – Le point (0, 0) est un point selle de f (x, y) = x2 − y 2
B Si x∗ est un minimum local de f sur U , alors x∗ est un point critique, c’est à dire ∇f (x∗ ) =
0.
B Supposons de plus que f est de classe C 2 sur U . Alors si x∗ est un minimum local de f sur
U , alors Hf (x∗ ) est semi-définie positive.
Remarque 5.2
B Pour rappel, les conditions nécessaires énoncées ci-dessus ne sont pas suffisantes comme le
montre l’exemple de la fonction f : R → R définie par f (x) = x3 en x∗ = 0.
B La proposition ci-dessus montre que si l’on recherche un minimum d’une fonction f : U →
R différentiable, alors il convient de s’intéresser à ses points critiques qui sont solution
de l’équation ∇f (x) = 0. Parmi ces points critiques, seuls ceux pour lesquels la matrice
Hessienne est semi-définie positive restent candidats pour être un éventuel minimum local.
B Pour la résolution numérique, il peut être utile de savoir, si on dispose d’un point a ∈ U
tel que ∇f (a) 6= 0, comment on peut construire un point du type a + d tel que, d’une part
a + d ∈ U (on dit que la direction d est admissible) et d’autre part f (a + d) < f (a) (la
direction d est alors dite direction de descente). La construction d’un tel vecteur d est l’objet
de la proposition (5.6). On peut vérifier que d = −t∇f (a) convient si t est assez petit.
P ROPOSITION 5.4 (Condition suffisante). Soit f de classe C 2 sur U ouvert de Rn à valeurs dans
R. Soit x∗ ∈ U telle que ∇f (x∗ ) = 0 et la matrice hessienne Hf (x∗ ) est définie positive, alors x∗
est un minimum local de f sur U .
Exemple 5.3 La condition suffisante ci-dessus n’est pas nécessaire. En effet l’application f :
R2 → R définie par f (x, y) = x4 + y 2 (x + 1)3 admet un point critique en (0, 0) et on vérifie que Hf (0, 0) est semi-définie positive sans être définie positive. On vérifie pourtant que (0, 0)
est bien un minimum local en (0, 0).
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
47
Dans le cas des problèmes d’optimisation sans contraintes, les conditions suffisantes peuvent être
améliorées.
P ROPOSITION 5.5 Soit f une fonction convexe et différentiable sur un ouvert U convexe de Rn , à
valeurs dans R. Soit x∗ ∈ U . x∗ est un minimum de f sur U si et seulement si ∇f (x∗ ) = 0.
Exemple 5.4
On considère la norme euclidienne sur Rn et u ∈ Rn est fixé. On cherche le
minimum de f (x) = kxk + hu, xi sur l’ouvert U = {x ∈ Rn | x1 > 0}. On remarque que U est
convexe et que f est aussi convexe car c’est la somme d’une fonction convexe (la norme) et d’une
1
x + u.
fonction linéaire donc convexe. Sur U , f est continûment différentiable et ∇f (x) =
kxk
Donc d’après la proposition ci-dessus, f admet un minimum en x∗ sur U si et seulement si
∇f (x∗ ) = 0. Cette équation admet des solutions si et seulement si le vecteur u vérifie kuk = 1
et u1 < 0. Dans ce cas, on a une infinité de minimum qui sont les éléments de l’ensemble
{−tu | t > 0}.
P ROPOSITION 5.6 Soient U un ouvert de Rn , f : U → R une fonction différentiable et a ∈ U tel
que ∇f (a) 6= 0. Alors ∀d ∈ Rn tel que hd, ∇f (a)i < 0, ∃ν > 0 tel que ∀t ∈]0, ν[, a + td ∈ U et
f (a + td) < f (a).
Preuve Supposons que ∇f (a) 6= 0 et soit d ∈ Rn tel que hd, ∇f (a)i < 0. Alors il existe η > 0
tel que ∀t ∈] − η, η[, a + td ∈ U et on a :
f (a + td) = f (a) + h∇f (a), tdi + ktdkε(td)
avec lim ε(u) = 0. On obtient si t ∈]0, η[ :
u→0
f (a + td) − f (a) = t (h∇f (a), di + kdkε(td))
Comme hd, ∇f (a)i < 0 et que ε(td) tend vers 0 lorsque t tend vers 0, il existe 0 < ν ≤ η tel que
∀t ∈]0, ν[, :
h∇f (a), di + kdkε(td) < 0
et donc f (a + td) < f (a), pour tout t ∈]0, ν[.
5.4
Exercices
E XERCICE 53
Soit f : R2 → R la fonction définie par f (x, y) = x4 + y 4 − (x − y)2 .
1 - Déterminer les extrema locaux de f .
2 - Montrer que f admet un minimum global sur R2 . Indication : on pourra utiliser un théorème
d’existence du cours.
E XERCICE 54
Déterminer les extrema locaux des fonctions suivantes sur R2 :
48
Convexité et optimisation
B f1 (x, y) = x3 + 3xy 2 − 15x − 12y ;
B f2 (x, y) = 3x3 + xy 2 − xy ;
1
B f3 (x, y) = x4 + y 3 − 4y − 2 ;
3
B f4 (x, y) = x3 + xy 2 − x2 y − y 3 .
Pour chaque fonction, montrer que les extrema locaux ne sont pas globaux.
E XERCICE 55
finition :
Déterminer les extrema locaux des fonctions suivantes sur leur domaine de dé-
y2
z2 2
+
+ ;
4x
y
z
3
3
B g(x, y, z) = 8x + y − 12xyz + 10z 3 − 6z.
B f (x, y, z) = x +
E XERCICE 56
Optimiser les fonctions suivantes sur leur domaine de définition :
B f (x, y, z) = x4 + 2y 2 + 3z 2 − yz − 23y + 4x − 5 ;
n
X
1
;
B g(x1 , . . . , xn ) =
xi ln
xi
i=1
B h(x1 , . . . , xn ) =
n
Y
xxi i .
i=1
E XERCICE 57
Soit n ∈ N, n ≥ 2. On considère n points (xi , yi ) de R2 , pour i = 1, . . . , n non
tous égaux, et la fonction f : R2 → R définie par :
f (a, b) =
n
X
(yi − axi − b)2 .
i=1
1 - Montrer que f admet un unique point critique.
2 - Montrer que f admet un minimum global sur R2 . Interpréter le résultat.
E XERCICE 58
(régression parabolique). Soit n ∈ N, n ≥ 2. On considère un nuage de n points
2
(xi , yi ) de R , i = 1, . . . , n, non tous égaux. On souhaite approcher ce nuage par une parabole
d’équation y(x) = ax2 + bx + c où a, b et c sont des réels à déterminer.
1 - Exprimer le problème ci-dessus à l’aide d’un problème de minimisation au sens des moindres
carrés.
2 - Ce problème admet-il une solution ? justifier ? est-elle unique ?
3 - Ecrire le système permettant de trouver le minimum. On pourra si nécessaire considérer les
quantités Sk :=
n
X
xki .
i=1
E XERCICE 59
Soit f : Rn −→ R une application différentiable. Montrer que :
∀v ∈ S(0, 1),
1
∇f (x̄) ≥ h∇f (x̄), vi
k∇f (x̄)k
∇f (x̄),
Ceci exprime le fait que le vecteur gradient donne la direction de la plus grande pente de f en x̄.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
49
E XERCICE 60
Soit A une matrice symétrique d’ordre n, b ∈ Rn et c ∈ R. On considère la
fonction quadratique :
∀x ∈ Rn ,
f (x) =
1
hx, Axi + hb, xi + c
2
1 - A quelle condition sur A, b et c, la fonction f est-elle-convexe.
2 - Application : n = 3. Quel point réalise le minimum de f si A est la matrice identité, b =
(1, 1, 1) et c = 5.
E XERCICE 61
Soit f : Rn → R une fonction continue et bornée inférieurement sur Rn . Soit
ε > 0 et uε ∈ Rn vérifiant :
f (uε ) ≤ infn f (x) + ε.
x∈R
1 - Justifier l’existence de uε .
2 - Soit α > 0, on considère g : Rn → R la fonction définie par :
g(x) = f (x) +
ε
kx − uε k.
α
Montrer que g admet un minimum v sur Rn .
3 - Montrer que v vérifie les propriétés suivantes :
1. f (v) ≤ f (uε ) ;
2. kv − uε k ≤ α ;
3. Pour tout x ∈ Rn , f (v) ≤ f (x) +
ε
kx − vk.
α
E XERCICE 62
Soit f : Rn −→ R une fonction convexe. On définit le sous-différentiel de f en
un point x ∈ Rn par :
∂f (x) := {p ∈ Rn : ∀y ∈ Rn , f (y) ≥ f (x) + hp, y − xi}
1 - Montrer que le sous-différentiel d’une fonction convexe est un ensemble convexe fermé.
2 - Montrer que x est le minimum de f si et seulement si 0 ∈ ∂f (x).
Pour x ∈ Rn , on pose g(x) = exp kxk, où k.k est la norme euclidienne.
3 - Montrer que g est une fonction convexe.
4 - Quel est le sous-différentiel de g en 0 ?
5 - Montrer que x = 0 est un minimum de g.
6 - Montrer que x = 0 est l’unique minimum de g.
E XERCICE 63
Rn est muni de la norme euclidienne. Soit f : Rn → R une application de classe
C1 telle que ∃α > 0
(T )
∀(x, y) ∈ Rn × Rn ,
f (y) − f (x) − h∇f (x), y − xi ≥ αky − xk2 .
50
Convexité et optimisation
1 - En choisissant x = 0 dans la condition (T ), montrer que f atteint son minimum en un unique
x∗ ∈ Rn .
2 - Montrer que x∗ est l’unique solution de l’équation ∇f (x) = 0
3 - Montrer en utilisant la condition (T ) que
h∇f (y) − ∇f (x), y − xi ≥ 2α ky − xk2 .
∀(x, y) ∈ Rn × Rn ,
En déduire que f est convexe.
On suppose dans la suite que f vérifie de plus la condition : ∃β > 2α telle que
(S)
∀(x, y) ∈ Rn × Rn ,
k∇f (x) − ∇f (y)k ≤ βkx − yk
et on considère t > 0 un paramètre et la suite récurrente (xk )k∈N définie par x0 ∈ Rn et ∀k ∈ N,
xk+1 = xk − t∇f (xk ).
4 - Soit k ∈ N. Que se passe-t-il si ∇f (xk ) = 0 ? Si ∇f (xk ) 6= 0, prouver que f (xk+1 ) < f (xk )
si t est assez petit (à préciser).
5 - Montrer que ∀k ∈ N, kxk+1 − x∗ k2 ≤ β 2 t2 − 2αt + 1 kxk − x∗ k2 .
6 - Montrer que pour tout t ∈ 0,
2α
, la suite (xk )k∈N converge vers x∗ .
β2
E XERCICE 64
On considèrere f : Rn → R une fonction de classe C1 et cœrcive. Elle admet
donc (théorème 5.2) un minimum et le but de l’exercice est de proposer un algorithme pour trouver
un point critique de f .
1 - Soit a ∈ Rn vérifiant ∇f (a) 6= 0.
a) Montrer que ∃ε > 0 telle que ∀t ∈]0, ε[, f (a − t∇f (a)) < f (a).
b) On considère la fonction ϕ : R+ → R définie par ϕ(t) = f (a − t∇f (a)). Montrer qu’il existe
t∗ > 0 telle que ∀t ≥ 0, ϕ(t∗ ) ≤ ϕ(t).
c) On note ψ(a) = a − t∗ ∇f (a). Déduire de la question b) que h∇f (a), ∇f (ψ(a))i = 0.
2 - On considère l’algorithme suivant :
B On choisit x0 arbitraire dans Rn ;
B Ayant construit x0 , . . . , xk
· Si ∇f (xk ) = 0 alors (xk est un point critique) l’algorithme s’arrête.
· Si ∇f (xk ) 6= 0 alors (en utilisant la question (3)) on choisit xk+1 = ψ (xk ).
On s’intéresse uniquement au cas où cet algorithme ne s’arrête jamais.
a) Montrer que la suite (f (xk ))n∈N est décroissante.
b) Montrer que la suite (xk )k∈N est bornée.
c) Montrer que si x̄ est une valeur d’adhérence de la suite (xk )k∈N , alors ∇f (x̄) = 0.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
51
E XERCICE 65
Dans cet exercice, Rn est muni du produit scalaire canonique h., .i et de la norme
euclidienne k.k.
1 - Soit g une fonction convexe de Rn dans R et soit g + : Rn → R la fonction définie par
g + (x) = max{g(x), 0}.
a - Montrer que g + est convexe et que (g + )2 est également convexe.
b - Montrer que si g est différentiable alors (g + )2 est différentiable et calculer sa différentielle en
fonction de celle de g.
2 - Pour i = 1, . . . , m, on considère la fonction gi : Rn → R définie par gi (y) = hai , yi − αi où
ai ∈ Rn et αi ∈ R sont donnés. On considère
K = {y ∈ Rn | gi (y) ≤ 0, pour i = 1, . . . , m}
et on suppose que K 6= ∅. Soient B ∈ Mn (R) une matrice symétrique, définie positive et b ∈ Rn .
Montrer que le problème suivant admet une solution unique, x∗ ∈ Rn :
(
(P)
minimiser J(x)
x∈K
où
1
J(x) = hx, Bxi − hb, xi.
2
3 - On considère ε > 0 fixé, et pour tout x ∈ Rn , on définit :
Jε (x) = J(x) +
m 2
1 X
gi+ (x) .
2ε i=1
Montrer qu’il existe une solution unique xε ∈ Rn au problème :
(
(Pε )
minimiser Jε (x)
x ∈ Rn
4 - Montrer que xε est solution de (Pε ) si et seulement si xε est solution de l’équation :
Bxε − b +
m
X
λiε ai = 0
i=1
où
λiε =
gi+ (xε )
.
ε
5 - Montrer qu’il existe un sous-ensemble C borné de Rn et un sous-ensemble I borné de R tel
g + (xε )
que : ∀ε > 0, xε ∈ C et i √
∈ I.
ε
6 - Montrer que xε converge vers x∗ lorsque ε → 0.
52
Convexité et optimisation
7 - On suppose dans la suite que la famille {a1 , . . . , am } est linéairement indépendante. Montrer
que pour tout i ∈ {1, . . . , m}, il existe di ∈ Fi := {aj , j = 1, . . . , m et j 6= i}⊥ tel que kdi k = 1
et hai , di i =
6 0.
8 - En prenant le produit scalaire de di avec l’équation trouvée dans la question (4), en déduire que
λiε reste borné dans R indépendamment de ε.
9 - En déduire que si x∗ est solution de (P), alors il existe des nombres réels λ1 , . . . , λm ≥ 0, tels
que :

m
X

∗−b+


Bx
λi ai = 0 ;


i=1

x∗ ∈ K ;




et ∀i = 1, . . . , m,
λi gi (x∗ ) = 0.
Chapitre 6
Optimisation sous contraintes :
conditions d’optimalité
6.1
Condition nécessaire d’optimalité
T HÉORÈME 6.1 Soient U un sous-ensemble ouvert de Rn , C un sous-ensemble convexe de U et
f : U → R différentiable. Soit x∗ ∈ C. Si f admet en x∗ un minimum local sur C, alors
∀y ∈ C, h∇f (x∗ ), y − x∗ i ≥ 0.
ensemble C
C0
courbes f (x) = cte
∇f (x∗ )
∇f (x∗ )
x∗
x∗
y
x∗ est un minimum de f sur C
Ici ∃y ∈ C 0 tel queh∇f (x∗ ), y − x∗ i < 0.
F IGURE 6.1 – Illustration de la condition nécessaire d’optimalité
Preuve Comme f admet en x∗ un minimum local sur C, il existe r > 0 tel que ∀x ∈ C ∩
∗
B(x∗ , r), f (x) ≥ f (x∗ ). Soit y ∈ C, y 6= x∗ . Alors il existe ν > 0 tel que ∀t ∈
[0, ν[, (1 − t)x
+
r
ty = x∗ + t(y − x∗ ) ∈ C ∩ B(x∗ , r). Il suffit en effet de prendre ν = min 1,
. On
ky − x∗ k
obtient donc pour tout t ∈ [0, ν[,
0 ≤ f (x∗ + t(y − x∗ )) − f (x∗ ) = h∇f (x∗ ), t(y − x∗ )i + tky − x∗ kε(t(y − x∗ ))
53
54
Convexité et optimisation
avec lim ε(u) = 0. En divisant par t et en faisant tendre t vers 0+ , on obtient bien le résultat
u→0
recherché.
6.2
Cône normal et cône tangent
D ÉFINITION 6.1 Soient C un sous-ensemble convexe de Rn et x ∈ C.
B On appelle cône normal à C en x, noté NC (x), l’ensemble défini par :
NC (x) := {p ∈ Rn | ∀y ∈ C, hp, y − xi ≤ 0} .
B On appelle cône tangent à C en x, noté TC (x), l’ensemble défini par :
TC (x) := adh {t(y − x) | t > 0, y ∈ C} .
Ensemble C1 :
Ensemble C2 :
x
x
C2
C1
Cône tangent et cône normal à C1 en x :
Cône tangent et cône normal à C2 en x :
NC2 (x)
TC1 (x)
0
TC2 (x)
0
NC1 (x)
F IGURE 6.2 – Exemples de cône normal et cône tangent
C OROLLAIRE 6.2 Si x∗ est solution (ou si c’est un minimum local sur C) de
(
min f (x)
x∈C
où C est un convexe d’un ouvert U de Rn et f : U → R une fonction différentiable, alors la
condition nécessaire du théorème (6.1) peut s’écrire
−∇f (x∗ ) ∈ NC (x∗ ).
P ROPOSITION 6.3 Soit C un sous-ensemble convexe de Rn et x ∈ C. Alors :
B NC (x) est un cône convexe fermé.
B TC (x) est un cône convexe fermé.
55
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
B (NC (x))◦ = TC (x).
B (TC (x))◦ = NC (x).
P ROPOSITION 6.4 (Exemples de calcul de cône normal et de cône tangent) C est un sous-ensemble
convexe de Rn .
B Si x ∈ int(C), alors NC (x) = {0} et TC (x) = Rn .
B Si C est un sous-espace affine qui s’écrit grâce à une matrice A ∈ Mk×n (R) et b ∈ Rk :
C = {x ∈ Rn | Ax = b} ,
alors pour tout x ∈ C,
NC (x) =


u ∈ Rn | ∃λ ∈ Rk , u =

k
X
λj aj
j=1



TC (x) = {v ∈ Rn | Av = 0}
Les aj sont les lignes de la matrice A, j = 1, . . . , k.
B Si C est un polyèdre qui peut s’écrire grâce à une matrice A ∈ Mk×n (R), un vecteur
α ∈ Rk , une deuxième matrice B ∈ Mm×n (R) et un vecteur β ∈ Rm :
C = {x ∈ Rn | Ax = α et Bx ≤ β} ,
alors,
NC (x) =

k
X

j=1
λj aj +
m
X


µi bi | λ ∈ Rk , µ ∈ Rm
+ et hµ, Bx − βi = 0

i=1
TC (x) = {v ∈ Rn | Av = 0 et B(x)v ≤ 0}
ou les aj et bi sont les lignes des matrices A et B et B(x) est la matrice extraite de B
en gardant uniquement les lignes des contraintes d’inégalité saturées en x, c’est à dire les
lignes bi , tel que hbi , xi = βi .
6.3
La condition de qualification
On considère un problème de minimisation
(
min f (x)
x∈C
On a vu que la condition nécessaire pour l’optmalité d’un point x∗ ∈ C pouvait s’écrire −∇f (x∗ ) ∈
NC (x∗ ). Afin d’aller plus loin dans la résolution du problème, il est donc primordial de savoir calculer et trouver la forme des vecteurs du cône normal à un ensemble convexe C en un point x ∈ C.
56
Convexité et optimisation
Nous avons déjà vu un cas relativement important dans la proposition (6.4) avec les sous-espaces
affines ou les polyèdres qui correspondent au cas où l’ensemble C est défini grâce à des contraintes
d’égalité ou d’inégalité qui sont toutes affines.
Nous allons maintenant supposer que C peut s’exprimer grâce à des contraintes d’inégalité ou
d’égalité :
C = {x ∈ U | ∀i ∈ I, gi (x) ≤ 0 et ∀j ∈ J, hj (x) = 0}
ou U est un ouvert et convexe de Rn , ∀i ∈ I, gi : U → R est une fonction convexe et ∀j ∈ J,
hj : U → R est une fonction affine. Ainsi l’ensemble C est défini avec #I contraintes d’inégalité
et #J contraintes d’égalité.
L’ensemble C défini ainsi est bien convexe.
Si x est un élément de C alors on note I(x) = {i ∈ I | gi (x) = 0} l’ensemble des contraintes
d’inégalité qui sont saturées en x.
Nous allons également noter Ia l’ensemble des contraintes d’inégalité qui sont affines et Ina celles
qui ne le sont pas. On a Ia ∩ Ina = ∅ et Ia ∪ Ina = I.
D ÉFINITION 6.2 On considère un ensemble convexe C défini comme ci-dessus. On suppose que
les fonctions (gi )i∈I et (hj )j∈J sont différentiables. On dit qu’un point x ∈ C est qualifié si on a
les égalités suivantes :
TC (x) = {v ∈ Rn | ∀i ∈ I(x), h∇gi (x), vi ≤ 0 et ∀j ∈ J, h∇hj (x), vi = 0}
NC (x) =

X

λi ∇gi (x) +
X


µj ∇hj (x), ∀i ∈ I, λi ≥ 0 et λi gi (x) = 0, ∀j ∈ J, µj ∈ R

j∈J
i∈I
T HÉORÈME 6.5 On considère un ensemble convexe C défini comme ci-dessus. On suppose que
les fonctions (gi )i∈I et (hj )j∈J sont différentiables et que la condition suivante est satisfaite.
∃x̄ ∈ C tel que ∀i ∈ Ina , gi (x̄) < 0
(Slater)
Alors tout x ∈ C est qualifié.
Remarques 6.1
B Dans la définition ci-dessus, pour le cône normal NC (x), la relation λi gi (x) = 0 signifie
que le coefficient λi doit être égal à zéro si la contrainte i n’est pas saturée, c’est à dire que
gi (x) < 0 et i ∈
/ I(x).
B Pour vérifier si x ∈ C est qualifié, il suffit de vérifier l’une ou l’autre des égalités pour NC (x)
ou TC (x). L’autre égalité en découle en remarquant que N◦C (x) = TC (x) et T◦C (x) =
NC (x) et en utilisant le lemme de Farkas.
B Le résultat ci-dessus inclut le résultat obtenu pour les polyèdres. En effet, dans ce cas, les
contraintes d’inégalités sont toutes affines et la condition de qualification de Slater est automatiquement vérifiée. Les résultats coincident bien puisque les gradients des fonctions fi et
gj sont bien donnés par les lignes des matrices A et B.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
57
Exemple 6.2
Comme le montre l’exemple suivant, sans la condition de qualification de Slater
le résultat ci-dessus n’est en général pas vrai. On se place dans R2 et on prend les fonctions
g1 (x, y) = x2 − y et g2 (x, y) = y. Ces deux fonctions sont bien convexes et l’ensemble C
définie avec deux contraintes d’inégalité C = {(x, y) ∈ R2 | x2 − y ≤ 0, y ≤ 0} est en
réalité égal à {(0, 0)}. Les deux contraintes sont saturées en (0, 0) et ∇g1 (0, 0) = (0, −1) et
∇g2 (0, 0) = (0, 1). Si le résultat du théorème était vrai, on devrait avoir v = (1, 0) ∈ TC ((0, 0))
car h∇g1 (0, 0), vi = 0 ≤ 0 et h∇g2 (0, 0), vi = 0 ≤ 0. On a donc une contradiction car à
l’évidence le cône tangent est ici réduit à TC ((0, 0)) = {(0, 0)}.
Preuve du théorème (6.5) Soit x ∈ C et considérons
A = {v ∈ Rn | ∀i ∈ I(x), h∇gi (x), vi ≤ 0 et ∀j ∈ J, h∇hj (x), vi = 0}
et
Ae = {v ∈ A | ∀i ∈ I(x) ∩ Ina , h∇gi (x), vi < 0} .
Le but est de montrer que TC (x) = A. Nous allons procéder en plusieurs étapes.
Etape 1
Montrons que Ae 6= ∅.
Considérons v = x̄ − x où x̄ est donné par la condition de qualification de Slater.
- Pour tout i ∈ I(x), on obtient en utilisant la convexité de la fonction gi que :
0 ≥ gi (x̄) = gi (x̄) − gi (x) ≥ h∇gi (x), x̄ − xi = h∇gi (x), vi.
- Pour tout j ∈ J, comme hj est affine et hj (x̄) = hj (x) = 0, on a :
h∇hj (x), vi = h∇hj (x), x̄ − xi = 0.
Ainsi v ∈ A. De plus, si i ∈ I(x) ∩ Ina , on a grâce à la condition de Slater vérifiée par x̄ :
0 > gi (x̄) = gi (x̄) − gi (x) ≥ h∇gi (x), x̄ − xi = h∇gi (x), vi
et donc v ∈ Ae et Ae 6= ∅.
Etape 2
Montrons que Ae ⊂ TC (x).
e On pose pour tout k ∈ N∗ , xk = x + 1 v. On va montrer que pour k assez grand
Soit v ∈ A.
k
xk ∈ C ce qui impliquera que v = k(xk − x) est bien un élément de TC (x).
- Pour tout j ∈ J, comme hj est affine,
1
hj (xk ) = hj (x) + h∇hj (x), xk − xi = 0 + h∇hj (x), vi = 0.
k
- Pour tout i ∈ I tel que i ∈
/ I(x), on a 0 > gi (x). Comme la suite (xk )k∈N∗ converge vers x, par
continuité des fonctions gi , il existe k0 ∈ N∗ tel que
∀k > k0 ,
∀i ∈
/ I(x),
gi (xk ) < 0.
58
Convexité et optimisation
- Pour tout i ∈ I(x) ∩ Ia , gi est affine et :
1
gi (xk ) = gi (x) + h∇gi (x), xk − xi = 0 + h∇gi (x), vi ≤ 0.
k
- Pour tout i ∈ I(x) ∩ Ina , on a : il existe une fonction ε qui vérifie lim ε(u) = 0 tel que :
u→0
gi (xk ) = gi (x) + h∇gi (x), xk − xi +
kx − xkε(xk − x)
k
1
kvk
1
= 0 + h∇gi (x), vi +
ε
v
k k
k
1
1
h∇gi (x), vi + kvkε
=
v
k
k
On obtient
donc qu’il existe k1 ∈ N∗ tel que ∀k ≥ k1 , gi (xk ) ≤ 0 car v ∈ Ae et donc h∇gi (x), vi <
1
0 et ε
v tend vers 0 lorsque k → +∞.
k
Finalement toutes les conditions sont satisfaites pour que ∀k ≥ max{k0 , k1 }, xk ∈ C.
Etape 3
Montrons que A ⊂ TC (x).
e Soit v ∈ A et choisissons un élément v0 de A.
e Un tel
Montrons tout d’abord que A ⊂ adh(A).
1
1
e
v0 existe car d’après l’étape 1, A 6= ∅. On définit la suite (up )p∈N∗ par up = v0 + 1 −
v.
p
p
e Donc v ∈ adh(A)
e et
Cette suite converge vers v et on vérifie facilement que ∀p ∈ N∗ , up ∈ A.
e Or comme A
e ⊂ TC (x) (grâce à l’étape 2) et TC (x) est fermé, on a :
A ⊂ adh(A).
e ⊂ TC (x).
A ⊂ adh(A)
Etape 4
Montrons enfin l’inclusion inverse TC (x) ⊂ A.
Soit v ∈ TC (x). D’après la définition du cône tangent, il existe pour tout k ∈ N, λk > 0 et xk ∈ C
tel que v = lim vk avec vk = λk (xk − x).
k→+∞
On peut, sans perte de généralité, supposer que la suite (xk )k∈N converge vers x car sinon on peut
pour tout k, choisir :
 0
x = tk xk + (1 − tk )x = x + tk (xk − x)


 k
λk
λ0k =

tk


avec tk choisi dans ]0, 1]
On a bien alors x0k ∈ C car C est convexe et vk = λk (xk − x) = λ0k (x0k − x). Ainsi en choisissant
1
pour chaque k, tk ≤
(quitte à passer à une sous-suite si nécessaire), on a bien (x0k )k∈N
kkxk − xk
qui converge vers x.
- Pour tout j ∈ J, h∇hj (x), vi = 0 car hj est affine et pour tout k ∈ N, hj (x) = hj (xk ) = 0
impliquant que h∇hj (x), λk (xk − x)i = 0.
- Pour tout i ∈ I(x), on a :
0 ≥ gi (xk ) = gi (xk ) − gi (x) = h∇gi (x), xk − xi + kxk − xkε(xk − x)
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
59
ou la fonction ε vérifie lim ε(u) = 0. En multipliant l’inégalité ci-dessus par λk , on obtient :
u→0
0 ≥ h∇gi (x), λk (xk − x)i + kλk (xk − x)kε(xk − x)
En passant à la limite, on obtient bien que h∇gi (x), vi ≤ 0.
On en déduit que v ∈ A.
6.4
Le théorème de Karush-Kuhn-Tucker
T HÉORÈME 6.6 (Karush Kuhn et Tucker) Soient U un ouvert convexe de Rn , f , (gi )i∈I et (hj )j∈J
des fonctions différentiables de U → R. On suppose que les (gi )i∈I sont des fonctions convexes et
que les (hj )j∈J sont affines. On suppose que la condition de Slater du théorème (6.5) est satisfaite.
On considère le problème d’optimisation :
(P)


minimiser f (x)




g (x) ≤ 0, ∀i ∈ I
i

hj (x) = 0, ∀j ∈ J





x∈U
Si x∗ est une solution locale de (P) alors ∃(λi )i∈I , (µj )j∈J des réels tels que :
(KKT)

X
X

−∇f (x∗ ) =
λi ∇gi (x∗ ) +
µj ∇hj (x∗ )




i∈I
j∈J
∗
∀i ∈ I, gi (x ) ≤ 0, λi ≥ 0 et λi gi (x∗ ) = 0




∀j ∈ J, h (x∗ ) = 0
j
Preuve Il s’agit d’une conséquence immédiate du corollaire (6.2) et du théorème (6.5).
T HÉORÈME 6.7 (Condition suffisante) Soient U un ouvert convexe de Rn , f , (gi )i∈I et (hj )j∈J
des fonctions différentiables de U → R. On suppose que les (gi )i∈I sont des fonctions convexes
et que les (hj )j∈J sont affines et que la condition de Slater du théorème (6.5) est satisfaite. On
considère le problème d’optimisation :
(P)


minimiser f (x)




g (x) ≤ 0, ∀i ∈ I
i

hj (x) = 0, ∀j ∈ J





x∈U
Si f est convexe alors on a l’équivalence entre les assertions suivantes :
1. x∗ est un minimum local de (P).
2. x∗ est un minimum global de (P).
3. x∗ vérifie les conditions (KKT) du théorème de Karush Kuhn et Tucker.
60
Convexité et optimisation
6.5
Exercices
E XERCICE 66
Soit X = Rn+ . Déterminer pour tout x ∈ X les ensembles TX (x) et NX (x).
Commencer par le cas n = 2.
Soit C = BF (0, 1) la boule fermé de centre 0 et de rayon 1 de Rn muni de la
E XERCICE 67
norme euclidienne et x ∈ Rn telle que kxk = 1. Montrer que
NC (x) = {λx | λ ≥ 0}
E XERCICE 68
et
TC (x) = {v | hv, xi ≤ 0}
Calculer les cônes normaux et tangents pour les ensembles suivants :
B C1 = {x ∈ Rn | hai , xi = bi , i = 1, . . . , p}
B C2 = {(x, y) ∈ R2 | x2 + y 2 − 1 ≤ 0, x ≥ 0 y ≥ 0}
E XERCICE 69
Soit f : R2 −→ R une fonction définie par :
f (x, y) = x2 + ay 2 + xy + x
1 - Pour quelles valeurs de a, f est elle convexe ?
2 - Pour les valeurs de a trouvées, résoudre le problème
(
P
E XERCICE 70
Minimiserf (x, y)
x+y ≤1
Résoudre les problèmes suivants :


Maximiser ln(x1 x2 x3 )


 x2 + x2 + x2 ≤ 4
2
3
1
(P )

x1 + x2 + x3 = 3



x1 > 0, x2 > 0, x3 > 0
(R)
E XERCICE 71

2
2

 Minimiser x1 + x2
x1 + x2 ≤ 1

 x ≥ 0, x ≥ 0
1
2
n
Soient un élément p ∈ (R+
∗ ) et un réel w > 0.
n
1 - Montrer qu’il existe un élément x ∈ (R+
∗ ) tel que hp, xi < w.
2 - On considère le problème suivant :


 Max x1 x2 ...xn
hp, xi ≤ w

 x ≥ 0, x ≥ 0, ..., x ≥ 0,
1
2
n
a - Montrer que ce problème a au moins une solution.
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
61
n
b - Montrer que si x̄ est une solution du problème, alors x̄ ∈ (R+
∗) .
c - Montrer que si x̄ est une solution du problème, alors hp, x̄i = w.
d - Ecrire les conditions nécessaires de Kuhn et Tucker et trouver l’unique solution du problème.
Soit f (x) = x1 x2 ...xn , calculer f (x̄(p, w)) en fonction de p et de w, calculer la dérivée de
f (x̄(p, w)) par rapport à w.
E XERCICE 72
Soit α = (α1 , ..., αn ) ∈ Rn \ {0} fixé.
1 - Trouver la ou les solutions du problème

n
X



Maximiser
αi xi


i=1
n
X



x2i ≤ 1


i=1
2 - Trouver la ou les solutions du problème

n
X



αi xi
Minimiser


n
X



x2i ≤ 1


i=1
i=1
E XERCICE 73
On considère le problème d’optimisation :
P

2
2

 Minimiser (x − 10) + (y − 10)
x2 + y 2 ≤ 1

 x ∈ R, y ∈ R
1 - Montrer que P est un problème d’optimisation convexe.
2 - Montrer que P admet une solution unique.
3 - Résoudre P.
E XERCICE 74
Soit Ω = {(x1 , ..., xn ) ∈ Rn | xi > −1, ∀i} et on considère la fonction
f : Ω −→ R définie par :
f (x1 , ..., xn ) =
n
X
αi ln(1 + xi )
i=1
Où les αi sont des réels tel que αi > 0 et
n
X
αi = 1.
i=1
Résoudre :
P

Maximiser f (x1 , ..., xn )



n
 X
xi ≤ 1



 i=1
(x1 , ..., xn ) ∈ Ω
62
Convexité et optimisation
E XERCICE 75
Résoudre le problème
(P )
E XERCICE 76

2
2

 Minimiser − 14x1 + x1 − 6x2 + x2 − 7
x +x ≤2
1
2

 x + 2x ≤ 3
1
2
On considère le problème
(
(P )
Minimiser 5x2 + 4xy + y 2
3x + 2y = 5
1 - Première methode : résoudre en se ramenant à un problème de minimisation d’une seule variable.
2 - Deuxième méthode : écrire les conditions de Kuhn et Tucker du problème, en déduire les
solutions et le multiplicateur.
E XERCICE 77
On considère le problème d’optimisation suivant :


min(x1 − 1)2 + (x2 − 5)2




−x − x ≥ 0
2
1

x1 ≥ −1





x2 ≥ −2
1. Pour ce problème, les conditions de Karush, Kuhn et Tucker (KKT) sont elles des conditions
nécessaires d’optimalité ?
2. Les conditions de KKT sont elles des conditions suffisantes d’optimalité ?
3. Ecrire les conditions de KKT associées à ce problème.
4. Déterminer un minimum de ce problème.
5. Le minimum obtenu à la question précédente, est-il unique ?
Reprendre l’ensemble de ces questions pour le problème suivant :


max 2x1 + x2




x2 + x2 ≤ 2
1
2

x2 ≥ 0





x1 ≤ 1
E XERCICE 78
Rn est muni du produit scalaire canonique et de la norme euclidienne. Soit a ∈
Rn et U = {x ∈ Rn | kxk < 1}. On considère la fonction fa : U → R définie par
fa (x) = − ln 1 − kxk2 + ha, xi.
1 - Montrer que la fonction fa est strictement convexe sur U .
On considère le problème d’optimisation suivant :
(
Pa
minimiserfa (x)
x ∈ Ca
63
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
où
Ca = x ∈ Rn | kxk2 ≤
1
et ha, xi ≤ 0 .
4
2 - On suppose que a = 0Rn . Montrer que le problème Pa vérifie la condition de qualification de
Slater.
3 - Ecrire les conditions nécessaires d’optimalité. Montrer que la solution ne peut pas se trouver
sur la frontière de C0 . Trouver la solution.
4 - On suppose maintenant que a 6= 0. Montrer que Pa vérifie la condition de qualification de
Slater.
5 - On désigne x∗ une éventuelle solution de Pa . Montrer qu’on a nécessairement ha, x∗ i < 0.
4
6 - Résoudre Pa (Indication : on discutera selon que kak est plus grand ou plus petit que ).
3
E XERCICE 79
On considère le problème d’optimisation suivant :


min(x1 − 2)2 + 2(x2 − 2)2




x 2 + x 2 ≤ 5
2
1

x1 ≥ 2





x2 ≥ 0
1. Pour ce problème, les conditions de Karush, Kuhn et Tucker (KKT) sont elles des conditions
nécessaires d’optimalité ?
2. Les conditions de KKT sont elles des conditions suffisantes d’optimalité ?
3. Ecrire les conditions de KKT associées à ce problème.
4. Déterminer un minimum de ce problème.
5. Le minimum obtenu à la question précédente, est-il unique ?
Reprendre l’ensemble de ces questions pour le problème suivant :

2
2

max −x1 + 2x1 x2 − x2

x1 + x2 = 2


x ≥ 0
2
E XERCICE 80
Pour x ∈ Rn , on pose f (x) = exp kxk2 +ha, xi, où k.k est la norme euclidienne.
1 - Montrer que f (.) est une fonction convexe.
2 - Résoudre le problème
(
(P )
Minimiser f (x)
x∈C
avec C = Rn , C = {x ∈ Rn , kxk ≤ r}.
E XERCICE 81
Soit f (x, y) = y 2 − x2 y + x2 et C = {(x, y) ∈ R2 | x2 − 1 ≤ y ≤ 1 − x2 }.
1 - Montrer que f admet un maximum et un minimum sur C.
64
Convexité et optimisation
2 - Déterminer les points critiques de f .
3 - Déterminer le maximum de f sur C.
4 - Déterminer le minimum de f sur C.
E XERCICE 82
déterminer.
Pour chacun des cas suivants, montrer que f admet un maximum sur C et le
1. f (x, y) = xy(1 − x − y) et C = {(x, y) ∈ R2 | x ≥ 0, y ≥ 0, x + y ≤ 1} ;
2. f (x, y) = x − y + x3 + y 3 et C = [0, 1]2 ;
π
3. f (x, y) = sin x sin y sin(x + y) et C = 0,
2
E XERCICE 83
2
.
Calculer en fonction du paramètre α ∈ R la solution du problème :

2


minimiser xy + αxz + α yz
0≤x≤y≤z


x + y + z ≤ 1
E XERCICE 84
Montrer que le problème suivant admet une unique solution et la calculer :



minimiser hx, Axi
x + 2x + 3x3 ≤ 1
1
2


x ∈ R3
+
où


2 1 1


A =  1 2 1 .
1 1 2
Indication : L’inverse de A est :

A−1

3 −1 −1
1

=  −1 3 −1  .
4
−1 −1 3
E XERCICE 85
On considère deux fonctions f et g de Rn dans R de classe C 1 , strictement
convexes avec f coercive. On considère le problème :
(
minimiser f (x)
g(x) ≤ 0
(P )
On suppose que la contrainte est qualifiée.
1 - Montrer que (P ) admet une unique solution x∗ . On notera λ le multiplicateur associé.
2 - Pour tout ε > 0, on pose :
Jε (x); = f (x) +
1
(max{0, g(x)})
ε
a - Montrer que Jε admet un unique minimum xε dans Rn .
1
b - Montrer que si ε ∈ 0, , alors xε = x∗ .
λ
∀x ∈ Rn .
65
Université Paris 1 Panthéon - Sorbonne - L3 MASS 2015/2016
E XERCICE 86
Soit A ∈ Mn (R) une matrice symétrique définie positive. On considère :
C = {x ∈ Rn | hx, Axi ≤ 1} .
1 - Montrer que C est convexe. Préciser l’ensemble C si A est une homothétie (c’est à dire A de
la forme λ Id).
2 - Montrer que pour une base orthonormée (ei )1≤i≤n qu’on peut choisir convenablement, il existe
des réels strictement positifs α1 , . . . , αn tels que :
C=
( n
X
xi ei | ∀i ∈ {1, . . . , n}, xi ∈ R et
i=1
n
X
)
αi x2i ≤ 1 .
i=1
3 - On considère dans la suite x =
n
X
xi ei de Rn \ C. Montrer qu’il existe un unique λ = λ(x) ∈
i=1
R+ tel que :
n
X
i=1
αi
x2i
= 1.
(1 + λαi )2
4 - Montrer que la projection de x sur C, projC (x), est définie par :
projC (x) =
n
X
i=1
E XERCICE 87
xi
ei .
1 + λ(x)αi
Soient f et g deux fonctions convexes de Rn dans R et
K := {y ∈ Rn | g(y) ≤ 0}.
(
On considère le problème
min f (x)
x∈K
et on rappelle que le sous-différentiel de f en un point
x ∈ Rn est défini par :
∂f (x) = {p ∈ Rn : ∀y ∈ Rn , f (y) ≥ f (x) + hp, y − xi}.
1 - Montrer que K est convexe et fermé.
2 - Soit x tel que g(x) < 0. Trouver NK (x) et TK (x).
3 - Montrer que si x ∈ K vérifie −∂f (x) ∩ NK (x) 6= ∅, alors x minimise f sur K. Montrer que
cette condition est également nécessaire.
4 - Montrer que si g(x) = 0, alors ∂g(x) ⊂ NK (x) et en déduire que cone (∂g(x)) ⊂ NK (x).
Pour tout λ ≥ 0, on considère maintenant la fonction parfois appelée pénalité exacte :
p(x) = f (x) + λ max{0, g(x)}.
5 - Montrer que si x minimise p sur Rn et appartient à K alors x minimise f .
66
Convexité et optimisation
6 - Quel est ∂p(x) en un point x tel que g(x) < 0 ? en un point x tel que g(x) = 0 ?
7 - En déduire que si x ∈ K est tel que g(x) = 0 et −∂f (x) ∩ cone (∂g(x)) 6= ∅ alors x minimise
f sur K.
8 - Montrer que cette condition est aussi nécessaire sous une hypothèse de qualification de Slater.
E XERCICE 88
pose :
Soient f et g deux fonctions de Rn dans R de classe C 1 . Pour tout t ∈ R, on
V (t) := inf{f (x) | x ∈ Rn et g(x) = t}.
On suppose qu’il existe α > 0 tel que pour tout t ∈] − α, α[, le problème précédent admet une
unique solution x(t) et de plus ∇g(x(0)) 6= 0 et l’application t 7→ x(t) est différentiable en 0.
1 - Montrer qu’il existe un unique λ ∈ R tel que ∇f (x(0)) = λ∇g(x(0)).
2 - Montrer que V est dérivable en 0 et que V 0 (0) = λ.
Téléchargement