1 Outils mathématiques et conditions d’optimalité
Afin de développer les méthodes d’optimisation, il est nécessaire de connaître un minimum d’outils
mathématiques relatifs au calcul différentiel. Pour de plus amples informations ou exercices, on se
reportera par exemple à [2].
1.1 Différentielle et gradient
On se place dans des espaces vectoriels normés de dimension finie : on notera toujours k·k la
norme, indépendamment de l’espace utilisé. Dans l’espace Rn, on note (e1, . . . , en)la base canonique et
on identifie le plus souvent une application linéaire et sa matrice dans la base canonique. Par ailleurs,
on notera ATla transposée d’une matrice A. L’espace Rnest naturellement muni d’un produit scalaire
canonique, noté h·,·i, et défini pour deux vecteurs x, y ∈Rnpar hx, yi=xTy.
Définition 1 (différentielle).Soient Uun ouvert de Rnet a∈U. Une fonction f:U→Rpest dite
différentiable en as’il existe une application linéaire continue L:Rn→Rpet une fonction ε:Rn→Rp
telles que
– pour tout h∈Rntel que a+h∈U,f(a+h)−f(a) = L(h) + khkε(h);
–lim
h→0kε(h)k= 0 .
Si Lexiste, elle est unique : on la note Df(a)(ou f0(a),df(a),Daf...) et on l’appelle différentielle de
fen a: dans la suite, on notera
f(a+h) = f(a)+Df(a)h+o(khk).
La fonction fest dite différentiable, si elle est différentiable en tout point de U.
Exemple 1.Si fest une application linéaire sur U=Rnalors fest différentiable de différentielle f.
Si f:Rn→Rest définie pour tout x∈Rnpar f(x) = xTAx avec Aune matrice n×nà coefficients
réels, alors fest différentiable de différentielle Df(a)h=aT(A+AT)h.
Théorème 1. Soient Uun ouvert de Rnet a∈U.
– Soient f, g :U→Rpdeux fonctions différentiables en aet λ∈R. L’application f+λg est
différentiable en ade différentielle D(f+λg)(a)=Df(a) + λDg(a).
– Soient f:U→Rpune application différentiable en aet g:f(U)→Rqune application dif-
férentiable en f(a). L’application g◦fest différentiable en ade différentielle D(g◦f)(a) =
Dg(f(a)) ◦Df(a).
Exercice 1. Soient Uun ouvert de Rn,a∈U,v∈Rnet f:U→Rpune application différentiable en
a. Montrer que l’application t∈R7→ f(a+tv)est définie sur un voisinage de t= 0 et est différentiable
en 0. Que vaut sa différentielle en 0 ?
Si f:U→Rpest différentiable en a, on note ∂f/∂xi(a)(ou ∂if(a)) le vecteur Df(a)ei∈Rp. Grâce
à la linéarité de la différentielle, on a pour tout h= (h1, . . . , hn)∈Rn
Df(a)h=
n
X
i=1
∂f
∂xi
(a)hi.
Définition 2 (gradient).On se place ici dans le cas où p= 1. On considère à nouveau un ouvert U
de Rn. Si fest une application U→Rdifférentiable en un point a∈U, telle que Df(a)n’est pas
l’application nulle, alors il existe un unique vecteur ∇f(a)∈Rn, appelé gradient de fen a, vérifiant
pour tout h∈Rn,Df(a)h=h∇f(a), hi.
On peut aisément vérifier que ∇f(a)=(∂f/∂x1(a), . . . , ∂f /∂xn(a)).
Exemple 2.Si fest une forme linéaire, de matrice uT∈R1×n(cela veut donc dire que f(x) = uTx
pour tout x∈Rn), alors ∇f(a) = u. Si f(x) = xTAx, alors ∇f(a)=(A+AT)a.
Exercice 2. Soit f:Rn→Rune application différentiable. Pour tout réel c, on appelle ligne de niveau
cde fl’ensemble Nc={x∈Rn|f(x) = c}. Soit x0∈ Nc. Montrer que ∇f(x0)est orthogonal à Nc
en x0.
2