ÉQUATIONS DIFFÉRENTIELLES, II On désigne toujours par E un

publicité
ÉQUATIONS DIFFÉRENTIELLES, II
MARC CHAPERON
On désigne toujours par E un espace vectoriel réel de dimension finie d > 0. Le
corps du texte est une version abrégée et un peu simplifiée du chapitre 8 de [1]1 ;
les annexes sur l’algèbre linéaire établissent ce qui a été dit en cours à ce sujet.
3. Quelques idées de base
Les corollaires 2.3 et 2.7 montrent que la structure même des équations différentielles permet d’effectuer des changements de variables dans l’espace-temps pour les
simplifier. Nous allons voir d’abord que l’on peut simplifier de même une équation
différentielle autonome, c’est-à-dire un champ de vecteurs X, par un changement
de variables dans l’espace au voisinage de tout point a où X ne s’annule pas.
3.1. Changement de variables et redressement. Étant donnés un ouvert U
de E, un ouvert V d’un espace vectoriel réel de dimension finie F , un champ de
vecteurs Y sur V et une application f : U → V de classe C 1 , il est raisonnable de
désirer que l’image réciproque de Y par f , si elle existe, soit un champ de vecteurs
continu X sur U tel que, pour toute courbe intégrale γ de X, l’image
f∗ γ = f 0◦γ de
γ par f soit
une
courbe
intégrale
de
Y
.
Comme
on
alors
Y
f
◦
γ(t)
= (f ◦ γ) (t) =
0
2
Df γ(t) γ (t) = Df γ(t) X γ(t) , cela impose l’identité Df (x)X(x) = Y f (x) ,
qui définit f ∗ Y = X de manière unique lorsque f est étale, c’est-à-dire que sa
dérivée en tout x ∈ U est un isomorphisme :
Images réciproques ou directes de champs de vecteurs. Sous les hypothèses
précédentes, si f est étale, alors l’image réciproque f ∗ Y de Y par f , donnée par
(1)
f ∗ Y (x) = Df (x)−1 Y f (x) ,
est l’unique champ de vecteurs sur U dont toute courbe intégrale a pour image
par f une courbe intégrale de Y .
Lorsque f est un difféomorphisme, tout champ de vecteurs X sur U a donc une
image directe f∗ X := (f −1 )∗ X par f , qui est l’unique champ de vecteurs sur V
dont toute courbe intégrale est l’image par f d’une courbe intégrale de X.
Preuve. Pour toute courbe intégrale γ de f ∗ Y , on a (f ◦γ)0 (t) = Df γ(t) f ∗ Y γ(t) ,
−1
c’est-à-dire (f ◦ γ)0 (t) = Df γ(t) Df γ(t)
Y f γ(t) = Y f ◦ γ(t) .
1Les
nombres entre crochets renvoient à la bibliographie en fin de chapitre.
par tout point x de U passe une courbe intégrale de X, même si X n’est pas
localement lipschitzien (théorème de Peano).
2Puisque
1
2
MARC CHAPERON
Exercice. 1) Montrer qu’une application étale f est ouverte.
2) Soit e : R2 → R2 l’application (θ, r) 7→ (r cos θ, r sin θ).
a) Montrer que e|R2 r(R×{0}) est étale.
b) Soit X un champ de vecteurs C k , 1 ≤ k ≤ ∞, sur un ouvert V 3 0 de
R2 ; le champ de vecteurs X̃ := e∗ X|V r{0} est donc bien défini et C k dans
l’ouvert e−1 (V r {0}) = e−1 (V ) r (R × {0}). Calculer X̃(θ, r) en fonction des
composantes a, b de X ; en déduire que si X(0) = 0, alors X̃ se prolonge par
continuité en un champ C k−1 sur e−1 (V ).
Proposition 3.1. Si ρ est le flot d’un champ de vecteurs X de classe C 1 , on a
ρs ∗ X(x) = X(x) pour tout (x, s) ∈ dom ρ. En particulier, pour tout a ∈ dom X,
ou bien ρa : t 7→ ρt (a) est une immersion, ou bien X(a) = 0, auquel cas ρa est
définie sur R tout entier, constante et égale à a.
s
t
ρ
(x)
=
Démonstration
En
dérivant
par
rapport
à
t
en
t
=
0
l’identité
ρ
s
t
ρ ρ (x) (qui a un sens pour |t| petit puisque dom ρ est ouvert), on obtient bien
X ρs (x) = Dρs (x)X(x).
Si X(a) = 0, la constante R 3 t 7→ a est une courbe intégrale de X, donc elle
est égale à ρa par unicité de celle-ci ; sinon, pour
tout t ∈ dom ρa , la formule
ρt ∗ X(a) = X(a) entraîne que ρ0a (t) = X ρa (t) = Dρt (a)X(a), qui n’est pas nul
car ρt est étale et X(a) non nul.
Théorème 3.2 (Théorème de redressement ou « flow box theorem »). Soit X un
champ de vecteurs C k , 1 ≤ k ≤ ∞ sur l’ouvert V de E. Pour tout point a ∈ S tel
que l’on ait X(a) 6= 0, il existe un difféomorphisme local h : (V, a) → (R × Rd−1 , 0)
de classe C k possédant les propriétés suivantes :
i) Im h = I × W , où I 3 0 est un intervalle ouvert et W 3 0 un ouvert de Rd−1 ;
ii) l’image directe h∗ X est le champ de vecteurs constant (s, x) 7→ (1, 0) sur
I × W.
Nous dirons que h est une carte adaptée à X en a.
Première démonstration. Nous allons obtenir h comme composé Φ−1 ◦ h−1
1 de deux
difféomorphismes locaux.
Puisque X(a) n’est pas nul, il existe une base de E de la forme (X(a), e1 , . . . , ed−1 ).
Soit alors h1 : R × Rd−1 → E l’isomorphisme affine qui à (λ, x) fait correspondre
a + λX(a) + x1 e1 + · · · + xd−1 ed−1 ; on a h1 (0) = a, le champ de vecteurs X1 := h∗1 X
est C k et ses composantes
f, g vérifient f (0) = 1 et g(0) = 0 car Dh1 (0)(1, 0) =
X(a) = X h1 (0) .
Construisons Φ : en notant ρ le flot de X1 , il résulte du théorème d’inversion locale
que l’application Φ : (R×Rd−1 , 0) → (R×Rd−1 , 0) définie par Φ(t, x) := ρt (0, x) est
un difféomorphisme C k en 0 puisque (exercice) DΦ(0) = IdR×Rd−1 ; par définition
de ρ, on a bien DΦ(t, x)(1, 0) = ∂1 Φ(t, x) = X1 Φ(t, x) , c’est-à-dire Φ∗ X1 = (1, 0).
ÉQUATIONS DIFFÉRENTIELLES, II
3
Seconde démonstration. Plus longue, elle est élémentaire et instructive. On obtient
h comme composé h3 ◦ h2 ◦ h−1
1 de trois difféomorphismes locaux, c’est-à-dire que
l’on construit le même Φ−1 que précédemment sous la forme h3 ◦ h2 , en utilisant
la structure des équations différentielles au lieu du théorème d’inversion locale.
L’isomorphisme h1 est celui de la première démonstration, de sorte que X1 := h∗1 X
vérifie près de 0 ∈ R × Rd−1 les hypothèses du
Lemme 3.3. Soit X1 un champ de vecteurs C 1 sur un ouvert V1 de R × Rd−1 ,
de composantes f et g ; si f ne s’annule pas dans V1 , les orbites de X1 sont les
graphes des solutions maximales de l’équation différentielle
(2)
g(x, y)
dy
=
.
dx
f (x, y)
Preuve du lemme. Si γ = (γ1 , γ2 ) est une courbe intégrale maximale de X1 , la
dérivée γ10 (t) = f γ(t) ne s’annule pas sur l’intervalle ouvert dom γ, donc (exercice
fait en TD) γ1 est un difféomorphisme de dom γ sur un intervalle ouvert I ; en
désignant par j la bijection réciproque, on a (γ2 ◦ j)0 = (γ20 ◦ j) j 0 = (γ20 ◦ j)/(γ10 ◦ j),
c’est-à-dire que γ2 ◦ j : I → Rd−1 est une solution de (2) ; son graphe est l’image
de γ, donc une orbite de X1 .
Inversement, si γ̄ : I → Rd−1 est une solution maximale de (2)et que l’on fixe
x0 ∈ I, soit γ1 la solution maximale de l’équation dx
= f x, γ̄(x) valant x0 pour
dt
t = 0 ; on voit facilement que γ := (γ1 , γ̄ ◦ γ1 ) est une courbe intégrale de X1 et [1]
que Im γ1 = I.
Nous avons ainsi montré que toute orbite O de X1 est le graphe d’une solution γ̄O
de (2), puis que le graphe de toute solution maximale γ̄ de (2) est contenu dans une
orbite Oγ̄ ; il en résulte que γ̄O est forcément maximale (le graphe de la solution
maximale qui l’étend est contenu dans une orbite contenant O, donc égale à O) ;
de même, Oγ̄ est forcément le graphe de γ̄ (puisque c’est le graphe d’une solution
étendant la solution maximale γ̄), d’où le lemme.
∗
2.7 et le lemme,
Soit R la résolvante de (2) pour X1 := h1 X ; d’après le corollaire
0
la restriction h2 du difféomorphisme local (x, y) 7→ x, Rx (y) à un ouvert convenable dom h2 ⊂ dom X1 a pour image le produit J ×W 0 d’un intervalle ouvert J 3 0
et d’un ouvert W 0 3 0 de Rd−1 , et envoie les orbites de X1 |dom h2 sur les horizon
tales J × {y}. Il en résulte que X2 := h2 ∗ X1 est de la forme X2 (x, y) = ϕ(x,
y),
0
,
où ϕ : J × W 0 → R∗ est la fonction C k définie par ϕ(x, y) := f x, R0x (y) .
Reste à construire h3 (x, y) = (ψ(x, y), y) avec ψ(0, y) = 0, dom h3 ⊂ J × W 0 et
Im h3 de la forme cherchée I × W , tel que
R x ψ∗ X2 = (1, 0), c’est-à-dire ϕ ∂1 ψ = 1 ; on
n’a pas le choix : la formule ψ(x, y) = 0 ϕ(ξ, y)−1 dξ donne le résultat voulu. Exercice. Soient X un champ de vecteurs C k (1 ≤ k ≤ ∞) sur l’ouvert V de
E et C une courbe C k+1 (sous-variété C k+1 de dimension 1) connexe et non vide
de V telle que l’on ait X(x) ∈ Tx C r {0} pour tout x ∈ C. On suppose de plus
que C est un fermé de V r X −1 (0) ; montrer que C est une orbite de X [utiliser
4
MARC CHAPERON
le théorème de redressement pour montrer que tout a ∈ C possède un voisinage
dans C contenu dans l’orbite de a ; en déduire que l’intersection ωa de ladite orbite
avec C est ouverte dans C, puis (en considérant les ωb avec b ∈ C r ωa ) qu’elle est
fermée dans C, donc égale à C par connexité ; la courbe C est donc contenue dans
l’orbite Im ρa de a ; utiliser de nouveau le théorème de redressement et l’hypothèse
sur a pour conclure, en raisonnant par l’absurde, que Im ρa = C].
Corollaire 3.4 (version précisée du théorème de redressement). Soit X un champ
de vecteurs C k , 1 ≤ k ≤ ∞ sur l’ouvert V de E. Pour tout hyperplan affine
~ et tout point a ∈ S tel que l’on ait X(a) ∈
~ il existe un
S, de direction3 S
/ S,
d−1
k
difféomorphisme local g : (V, a) → (R × R , 0) de classe C tel que
i) g(S ∩ dom g) = {0} × W et Im g = I × W , où I 3 0 est un intervalle ouvert
et W un ouvert de Rd−1
ii) l’image g∗ X est le champ de vecteurs constant (s, x) 7→ (1, 0) sur I × W .
~ dans la déDémonstration. Il suffit de prendre pour (e1 , . . . , ed−1 ) une base de S
monstration précédente.
Sections locales d’un flot. Sous les hypothèses et avec les notations de ce corollaire, on dit que Σ := S ∩ dom g est une section locale de ρ (ou de X).
Remarque. Dans [1], S peut être une hypersurface « courbe » :
Proposition 3.5. Pour toute section locale Σ de ρ, la restriction ρΣ du flot ρ à
(Σ × R) ∩ dom ρ est une application étale C k .
Preuve. On a DρΣ (x, t)(δx, δt) = Dρt (x)δx + δt X ρt (x) = Dρt (x) δx + δt X(x)
~ × R ; comme Dρt (x) est un
pour (x, t) ∈ (Σ × R) ∩ dom ρ, (δx, δt) ∈ Tx S × R = S
automorphisme de E et l’application (δx, δt) 7→ δx + δt X(x) un isomorphisme de
~ × R sur E, la proposition en résulte.
S
3Ensemble
des vecteurs x − a avec x, a ∈ H.
ÉQUATIONS DIFFÉRENTIELLES, II
5
Exercice. Soit X un champ de vecteurs C k+1 , 1 ≤ k ≤ ∞, sur un ouvert V 3 0
de R2 ; on suppose que X(0) = 0 et que les valeurs propres λ, λ̄ de DX(0) ne sont
pas réelles. Le but de cet exercice est de montrer les deux faits suivants :
i) les courbes intégrales de X voisines de 0 tournent autour de l’origine ;
ii) l’application qui à un point a 6= 0 de l’axe des x associe l’intersection suivante
(dans le sens des temps croissants) de l’orbite de a avec l’axe des x s’étend en
un difféomorphisme h : (R, 0) → (R, 0) de classe C k .
a) Montrer qu’il existe un isomorphisme A de R2 sur C = R2 tel que le champ
A∗ X ait pour différentielle en 0 l’homothétie z 7→ λz [utiliser un calcul direct4,
en supposant par exemple A(1, 0) = 1]. Dans la suite, on identifie X à A∗ X.
b) Avec les notations de l’exercice p. 2, le champ de vecteurs e∗ X|V r{0}
s’étend en un champ X̃ de classe C k dans l’ouvert e−1 (V ). Calculer X̃(θ, 0)
[il sera instructif de commencer par calculer X̃(θ, r) en tant que nombre complexe, sachant que e(θ, r) = reiθ ].
c) Soit g le flot de X. Prouver que l’on définit un difféomorphisme local
h : (R, 0) → (R, 0) de classe C k comme suit : pour chaque réel non nul x
assez proche de 0, on a h(x) = g τ (x) (x), où τ (x) est le plus petit t > 0
tel que g t (x) soit réel [appliquer le lemme 2 à X1 := X̃ en remarquant que
h(x) = −R0±π (x), où R est la résolvante de (2)].
3.2. Orbites périodiques et applications de Poincaré. Soient X un champ
de vecteurs C k , 1 ≤ k ≤ ∞, sur un ouvert V de E et ρ son flot.
Orbites périodiques. Si a ∈ V est un point où X n’est pas nul, mais tel que la
courbe intégrale ρa : t 7→ ρt (a) de X ne soit pas injective, les propriétés suivantes
sont vérifiées :
i) On a dom ρa = R et ρa est périodique, de période minimale T > 0.
ii) Pour tout b ∈ O, la courbe intégrale ρb : t 7→ ρt (b) de X, qui a pour image
O, est définie sur R tout entier et périodique, de période minimale T .
On dit que O est une orbite périodique de X, de période T .
Démonstration Puisqu’on a X(a) 6= 0, le théorème de redressement 3.2 entraîne
l’existence d’un intervalle ouvert J ⊂ dom ρa contenant 0 tel que ρa |J soit injective,
donc on aura bien T > 0 si ρa est périodique.
4Ou
le théorème A.10 de l’annexe A
6
MARC CHAPERON
Pour voir qu’elle l’est, écrivons notre autre hypothèse : il existe u > 0 et s ∈ R
tels que l’on ait ρu+s (a) = ρs (a) ; en posant c := ρs (a), cela signifie que ρu (c) = c
d’après le corollaire 2.8 ii). Comme X(c) = Dρs (a)X(a) (proposition 3.1) n’est
pas nul, le même argument que pour a montre que T := inf{u > 0 : ρu (c) = c}
est strictement positif. Il est alors essentiellement évident que ρc : t 7→ ρt (c) est
définie sur R tout entier et périodique, de période minimale T ; en effet, la courbe
intégrale5 γ de X qui vaut c au temps T est t 7→ ρt−T (c) = ρc (t−T ), mais c’est aussi
ρc puisque ρT (c) = c ; il en résulte bien que dom ρc est invariant par la translation
t 7→ t − T , donc égal à R tout entier (il contient [0, T ]), et que ρc (t − T ) = ρc (t)
quel que soit t ∈ R.
Pour tout b = ρu (c) dans l’orbite O de c (qui est aussi celle de a et de b par définition
d’une orbite), on en déduit que, d’après le corollaire 2.8 ii), ρb : t 7→ ρt (b) = ρt+u (c)
est définie sur R tout entier et de période T , et il est facile de voir que si T n’était
pas la période minimale de ρb ce ne serait pas celle de ρc non plus.
Exercice. a) Montrer qu’une surjection ouverte f d’un espace topologique séparé
non compact A sur un espace topologique compact K ne peut pas être injective
[remarquer que f −1 serait sinon une bijection continue de K sur A, donc un homéomorphisme].
b) Soit C ⊂ V une courbe C k , compacte, connexe et non vide, vérifiant
X(x) ∈ Tx C r {0} pour tout x ∈ C. Déduire de (a) et de l’exercice p. 3
que C est une orbite périodique de X [appliquer (a) à f = ρa pour a ∈ C].
Multiplicateurs de Floquet. Si a est un point d’une orbite périodique O de
période T de X, on a
(3)
DρT ρt (a) = Dρt (a) ◦ DρT (a) ◦ Dρt (a)−1
pour tout t ∈ R. Les valeurs propres de DρT (a) sont donc indépendantes du choix
de a : ce sont les multiplicateurs de Floquet de l’orbite périodique O.
T
t
t
T
ρ
(x)
par rapport à x au
ρ
(x)
=
ρ
Démonstration En dérivant l’identité
ρ
T
t
t
t
T
point a, on voit que Dρ ρ (a) ◦ Dρ (a) = Dρ ρ (a) ◦ DρT (a), d’où (3) car
ρT (a) = a.
Remarques importantes.
Sous ces hypothèses, en dérivant par rapport à t
T
t
t
l’identité ρ ρ (a) = ρ (a) en t = 0, on voit que X(a) est vecteur propre de
DρT (a) associé à la valeur propre 1, laquelle est donc toujours un multiplicateur
de Floquet. Ce sont les autres qui sont intéressants, c’est-à-dire les valeurs propres
de l’endomorphisme de E/RX(a) induit par DρT (a). Ils apparaîtront un peu différemment dans ce qui suit.
D’après le lemme 2.11, on a Dρt (a) = R0t pour tout t, où R est la résolvante de
l’équation linéaire dy
= DX ρt (a) y (« équation aux variations » ).
dt
Proposition 3.6 (transition entre deux sections locales d’une orbite.). Soient a, b
deux points d’une orbite O de X (a et b ne sont pas forcément distincts ni O
5Solution
maximale de
dx
dt
= X(x), rappelons-le : c’est essentiel.
ÉQUATIONS DIFFÉRENTIELLES, II
7
périodique) et Σa , Σb des sections locales (p. 4) de ρ en a et b respectivement. Si
b = ρs (a), les propriétés suivantes sont vérifiées :
i) Il existe un ouvert V 0 3 a de V et un intervalle ouvert J 3 s tels que l’on ait
V 0 × J ⊂ dom ρ et que l’ensemble des (x, t) ∈ V 0 × J vérifiant ρt (x) ∈ Σb soit
le graphe d’une fonction τ : V 0 → J de classe C k ; on a donc en particulier
τ (a) = s.
ii) L’application h : (Σa , a) → (Σb , b) de classe C k définie par h(x) := ρτ (x) (x)
est un difféomorphisme local en a.
On appelle parfois h application locale de Poincaré associée à X, a, b, s, Σa , Σb .
Démonstration i) Par définition d’une section locale, il existe un intervalle ouvert
I 3 0, un ouvert W 3 0 de Rd−1 et un difféomorphisme g : (V, b) → (R × Rd−1 , 0)
d’image I × W tels que g(Σb ) =
{0} × W et que g∗ X = (1, 0). kPour chaque
−s
s
x ∈ ρ (dom g), écrivons g ρ (x) = s − τ (x), y(x)
, où τ, y sont C et nulles en
t
t−s
s
a ; le chemin τ (x) + I 3 t 7→ ρ (x) = ρ
ρ (x) est alors bien
défini car c’est
−1
s
l’image par g de la courbe intégrale t 7→ (t − s, 0) + g ρ (x) = t − τ (x), y(x)
de g∗ X ; comme celle-ci ne rencontre g(Σb ) = {0} × W que pour t = τ (x), il suffit
de choisir J × V 0 contenu dans l’ouvert {(t, x) ∈ R × ρ−s (dom g) : t − τ (x) ∈ I}.
ii) Montrons que l’inverse de h est l’application locale de Poincaré h1 : x 7→ ρτ1 (x) (x)
associée à X, b, a, −s, Σb , Σa , où τ1 : V10 → J1 est l’analogue de τ pour ces données.
Il s’agit de montrer que τ1 ◦ h = −τ au voisinage de a et τ ◦ h1 = −τ
1 près de
τ1 ◦h(x)
−τ (x)
τ (x)
b, puisqu’on aura alors h1 ◦ h(x) = ρ
h(x) = ρ
ρ (x) = x près
de a et de même h ◦ h1 (x) = x près de b ; c’est à peu près évident : comme
τ1 ◦h(a) = τ1 (b) = −s = −τ (a) et ρ−τ (x) h(x) = ρ−τ (x) ρτ (x) (x) = x pour x ∈ V 0 ,
l’unique τ1 h(x) ∈ J1 vérifiant ρτ1 h(x) h(x) ∈ Σa va forcément être −τ (x) si
x ∈ Σa ∩ V 0 est assez proche de a pour que l’on ait h(x) ∈ V10 et −τ (x) ∈ J1 ; la
relation τ ◦ h1 = −τ1 se prouve de même.
Remarques. En termes imagés, pour tout x assez proche de a, la courbe intégrale
ρa traverse Σb à un instant τ (x) proche de s, et la fonction τ ainsi définie est C k .
La fonction h n’est définie de manière unique que modulo le choix de son domaine
de définition : ce qui est unique et bien déterminé, c’est son germe en a, c’est-à-dire
sa classe d’équivalence pour la relation « f = g sur un voisinage ouvert de a dans
8
MARC CHAPERON
dom(f ) ∩ dom(g) » entre applications locales f, g : (Σa , a) → (Σb , b). Nous avions
déjà ce problème avec les solutions d’une équation différentielle prenant une valeur
donnée à un instant donné, mais la notion de solution maximale nous fournissait
une unicité globale qui manque ici.
Corollaire 3.7 (holonomie d’une orbite périodique). Il s’agit du cas particulier
suivant de la proposition : l’orbite O est périodique de période T , et l’on a a = b,
Σa = Σb et s = T .
i) Quitte à remplacer Σa par son intersection avec un ouvert contenant a, on
peut supposer (ce que nous ferons) que O ∩ Σa = {a} ; nous l’exprimerons en
disant que Σa est une section de O en a.
ii) L’application locale de Poincaré h associée s’appelle alors application de premier retour dans Σa , ou holonomie de O. Il s’agit bien d’un premier retour
car, pour x ∈ Σa proche de a, le temps τ (x) est le plus petit t > 0 tel que l’on
ait ρt (x) ∈ Σa ; en d’autres termes, h(x) est le premier point de Σa que l’on
rencontre en suivant l’orbite de x dans le sens des temps croissants.
iii) À conjugaison par un difféomorphisme local près, h ne dépend ni du choix
de a, ni de celui de Σa : si l’on remplace a par b et Σa par une section Σb
de O, l’holonomie obtenue est (près de b) la conjuguée g ◦ h ◦ g −1 , où g est
l’application de Poincaré associée à X, a, b, s, Σa , Σb pour un s quelconque tel
que ρs (a) = b.
iv) En particulier, les valeurs propres de Dh(a) ∈ GL(Ta Σa ) ne dépendent que
de O ; ce sont en fait les multiplicateurs de Floquet non évidents de O, c’est-àdire les valeurs propres de l’automorphisme de E/RX(a) induit par DρT (a).
L’exercice p. 5 montre l’existence d’un premier retour dans un autre cas intéressant.
Démonstration du corollaire. i) Les intersections de Σa avec O sont les ρt (a) avec
t dans [0, T ] ∩ ρ−1
a (Σa ), qui est un ensemble fini puisqu’il est formé de points isolés
par définition d’une section locale.
ii) Montrons qu’il s’agit bien d’un « premier retour » : sinon, il existerait une suite
(ak , tk ) dans Σa × R telle que ak → a, ρtk (ak ) ∈ Σa et que l’on ait, 0 < tk < τ (ak )
pour tout k. La suite (tk ) serait donc bornée et, quitte à la remplacer par une soussuite, on pourrait supposer qu’elle converge vers un t, forcément compris (au sens
large) entre 0 et T = τ (a) = lim τ (ak ) ; comme on aurait ρt (a) = lim ρtk (ak ) ∈ Σa
et donc ρt (a) = a d’après l’hypothèse faite en (i), on en déduirait que t = 0 ou
t = T , ce qui n’est pas possible d’après la proposition précédente : appliquée à
a = b, Σa = Σb et s = T , elle exclut t = T puisque l’on devrait alors avoir tk ∈ J
et donc tk = τ (ak ) pour k assez grand ; appliquée à a = b, Σa = Σb et s = 0, elle
exclut de même t = 0.
iii) Soit h1 l’application de premier retour dans Σb ; les mêmes arguments que dans
la preuve du point (ii) de la proposition montrent que g ◦ h et h1 ◦ g sont toutes
deux égales, près de a, à l’application de Poincaré associée à X, a, b, s + T, Σa , Σb .
iv) Il en résulte bien que Dh(a) et Dh1 (b) = Dg(a) ◦ Dh(a) ◦ Dg(a)−1 , étant
ÉQUATIONS DIFFÉRENTIELLES, II
9
conjuguées, ont les mêmes valeurs propres. Si l’on dérive la relation h(x) = ρτ (x) (x)
T
en a, on voit que, pour tout δx ∈ Ta Σa , Dh(a)δx = Dρ
(a)δx + Dτ (a)δx X(a) ;
T
en d’autres termes, Dh(a) est la composée de Dρ (a) Ta Σa et de la projection sur
Ta Σa parallèlement à son supplémentaire RX(a), c’est-à-dire une réalisation de
l’automorphisme de E/RX(a) induit par DρT (a).
4. Stabilité
Hypothèses et notations. On désigne toujours par X un champ de vecteurs de
classe C k , 1 ≤ k ≤ ∞, sur un ouvert V de E et par ρ son flot6.
4.1. Stabilité des équilibres.
Définition. Soit a un point d’équilibre (ou équilibre) de X (ou de ρ), c’est-à-dire
un point de V où X s’annule.
Cet équilibre est dit stable (au sens de Lyapounov) si tout voisinage U de a dans
V contient un voisinage W de a tel que, pour chaque x ∈ W et tout t ≥ 0, ρt (x)
existe et appartienne à U . Il est dit instable lorsqu’il n’est pas stable.
L’équilibre est dit asymptotiquement stable (ou attractif ) s’il est stable et qu’il
existe un voisinage V0 de a dans V tel que limt→+∞ ρt (x) = a pour tout x ∈ V0 .
L’équilibre est dit répulsif si c’est un équilibre attractif de −X.
Remarque. Il résulte du corollaire 2.9 que l’équilibre a est stable si et seulement
si, pour tout voisinage compact U de a dans V (par exemple une boule fermée), il
existe un voisinage W de a dans U tel que l’on ait ρt (x) ∈ U pour tout x ∈ W et
tout t ∈ R+ ∩ dom ρx .
Théorème 4.1 (Lyapounov). Soient a un équilibre de X et L : (E, a) → R une
fonction continue (« fonction de Lyapounov » ) possédant les propriétés suivantes :
i) Elle atteint son mimimum strict en a.
ii) On a dom L ⊂ V et, pour tout x ∈ dom L, la fonction L ◦ ρx est décroissante
(au sens large) sur tout intervalle contenu dans son domaine de définition
ρ−1
x (dom L).
L’équilibre a est alors stable.
Il est attractif si de plus, pour x ∈ dom(L) r {a}, la fonction L ◦ ρx est strictement
décroissante sur tout intervalle non réduit à un point et contenu dans ρ−1
x (dom L).
Remarques importantes. Lorsque L est dérivable, (ii) est satisfaite si et seulement si l’on
≤ 0 pour tout x ∈ dom L ; en effet, (L ◦ ρx )0 (t) =
a DL(x)X(x)
DL ρx (t) X(ρx (t) sur tout intervalle non réduit à un point et contenu dans
ρ−1
x (dom L). Pour la même raison, l’hypothèse finale assurant la stabilité asymptotique sera vérifiée si l’on a DL(x)X(x) < 0 pour tout x ∈ dom(L) r {a}.
Quand a = 0 et que L est la restriction à un voisinage de 0 du carré d’une norme
euclidienne, ces conditions s’écrivent respectivement x · X(x) ≤ 0 (produit scalaire) pour x ∈ dom L et x · X(x) < 0 pour x ∈ dom(L) r {0} ; en outre, si la
6Dans
le théorème de Lyapounov, on peut supposer X localement lipschitzien sans plus.
10
MARC CHAPERON
première est satisfaite, la preuve du lemme ci-dessous montre que chaque boule
B = Br (0) ⊂ dom L est positivement invariante par le flot : pour x ∈ B, on a
R+ ⊂ dom ρx et ρx (R+ ) ⊂ B.
Démonstration du théorème. En voici la clef :
Lemme 4.2. Sous les hypothèses du théorème, soit B = B R (a) une boule fermée
de rayon R > 0 contenue dans dom L. Les deux propriétés suivantes sont vérifiées :
a) Les Vb := B ∩ L−1 (] − ∞, b]) avec b > L(a) forment une base de voisinages
compacts de a dans E, c’est-à-dire que ce sont des voisinages compacts de a
et que tout voisinage de a en contient un.
b) Il existe c > L(a) tel que chaque Vb avec L(a) < b < c soit positivement
invariant par ρ : quel que soit x ∈ Vb , on a R+ ⊂ dom ρx et ρt (x) ∈ Vb pour
tout t ≥ 0.
Preuve. Chaque Vb avec b > L(a) est un voisinage de a puisqu’il contient l’ouvert
BR (a) ∩ L−1 (] − ∞, b[) 3 a (par définition d’une application locale, dom L est
ouvert) ; en outre, Vb est compact car fermé dans le compact B.
Pour 0 < r ≤ R, la restriction de L au compact non vide B r Br (a) a un minimum
mr > L(a) ; par conséquent, on a Vb ⊂ Br (a) pour tout b < mr , ce qui prouve (a).
De plus, (b) est vraie avec c = mR . En effet, pour L(a) < b< c et x ∈ Vb , quand
t ≥ 0 croît, il résulte de l’hypothèse (ii) que l’on a L ρt (x) ≤ L(x) ≤ b et donc
ρt (x) ∈ Vb tant que ρt (x) reste dans dom L ; mais ρt (x) ne pourrait quitter dom L
qu’après avoir
quitté B et donc traversé sa frontière7 S, ce qui est impossible car
on a L ρt (x) ≤ b < c = min L S) pour t ∈ R+ ∩ dom ρx et ρt (x) ∈ dom L ; par
conséquent, ρt (x) appartient au compact Vb pour tout t ∈ R+ ∩ dom ρx ; d’après le
corollaire 2.9, on a donc R+ ⊂ dom ρx , ce qui achève de prouver (b).
La stabilité résulte immédiatement du lemme, tout voisinage U de a dans V
contenant un voisinage positivement invariant W = Vb de a, L(a) < b < c.
Supposons maintenant L ◦ ρx strictement décroissante sur tout intervalle non trivial contenu dans ρ−1
x (dom L) pour x ∈ dom(L) r {a} et montrons que, pour
L(a) < b < c, on a limt→+∞ ρt (x) = a quel que soit x ∈ Vb (d’où la stabilité
asymptotique) : si x = a, c’est clair car ρt (a) = a pour tout t ; sinon, d’après le
lemme, il s’agit de prouver que, pour tout ε > 0, il existe T ≥ 0 tel que l’on ait
ρt (x) ∈ VL(a)+ε pour t > T , ce qui revient à dire que la limite quand t → +∞ de
la fonction strictement décroissante R+ 3 t 7→ L ρt (x) ∈ R+ est L(a). Par compacité de Vb , on peut extraire de ρn (x) n∈N une sous-suite ρnk (x) conver
geant vers x0 ∈ Vb , d’où L(x0 ) = limk→∞ L ρnk (x) = limt→+∞ L ρt (x) ; si
l’on avait x0 6= a, pour s > 0 on obtiendrait L ρs (x0 ) < L(x
0 ), c’est-à-dire
s
nk
s+nk
limk→∞ L ρ ρ (x) < L(x0 ), autrement
dit limk→∞ L ρ
(x) < L(x0 ), d’où
t
la contradiction limt→+∞ L ρ (x) < L(x0 ).
7La
fonction continue t 7→ |ρt (x) − a| sur l’intervalle R+ ∩ dom ρx , prenant une valeur < R en
t = 0, ne peut prendre de valeur ≥ R sans prendre la valeur R.
ÉQUATIONS DIFFÉRENTIELLES, II
11
Remarque importante. Lorsqu’une partie W de V est positivement invariante
par ρ, les ρ−1
x (W ) avec x ∈ V sont des intervalles soit vides, soit non bornés à
droite.
En effet, si l’on a ρs (x) ∈ W , on a R+ ⊂ dom ρρs (x) et ρt ρs (x) ∈ W pour tout
t ≥ 0 ; d’après le corollaire 2.8 ii), cela revient à dire que ρs+t (x) est défini et
appartient à W pour tout t ≥ 0, d’où [s, +∞[⊂ dom ρx .
Corollaire 4.3 (équilibres stables des champs de gradient). On suppose que E est
un espace euclidien et que X est le gradient ∇f d’une fonction réelle f de classe
C k+1 sur V , défini par le fait que le produit scalaire v · ∇f (a) est égal à Df (a)v
quels que soient a ∈ V et v ∈ E. Les équilibres de X sont donc les points critiques
de f , et les propriétés
sont
0 suivantes
2vérifiées :
t
i) On a f ◦ ρx (t) = ∇f ρ (x) pour tout (x, t) ∈ dom ρ.
ii) Tout maximum local strict de f est un équilibre stable de ρ.
iii) Tout maximum (resp. minimum) local strict de f isolé parmi les points
critiques de f est un équilibre attractif (resp. répulsif ) de ρ.
Remarque. Un minimum local non dégénéré a de f est un minimum local strict
car D2 f (a) est définie positive ; il est en outre isolé parmi les points critiques de
f , puisque Df est alors un difféomorphisme en a. On peut donc le plus souvent
oublier (ii) au profit de (iii).
Démonstration du corollaire 4.3. i) Par définition du gradient, on voit bien que
0
f ◦ ρx (t) = Df ρx (t) ρ0x (t) = Df ρx (t) ∇f ρx (t)
2
= ∇f ρt (x) .
ii)–iii) Dans le cas d’un maximum (resp. minimum) local, il suffit donc d’appliquer
le théorème à X (resp. −X) en prenant pour L la restriction de −f (resp. f ) à
un voisinage W de a dans V tel que, pour tout x ∈ W r {a}, on ait f (x) < f (a)
(resp. > f (a)) et, dans le cas de (iii), ∇f (x) 6= 0.
Exercice. Déduire du corollaire 4.3 i) qu’un champ de gradient n’a pas d’orbite
périodique non réduite à un point.
Corollaire 4.4 (équilibres stables des champs hamiltonien). On suppose ici que
E = T ∗ Rn := Rn × Rn , on en note les points (q, p) et l’on suppose que X est un
champ hamiltonien, ce qui signifie la chose suivante : il existe une fonction réelle H
de classe C k+1 sur l’ouvert V , appelée hamiltonien ou énergie,
telle que X(q, p) =
∂
∂
∂
∂
H(q,
p),
.
.
.
,
H(q,
p),
−
H(q,
p),
.
.
.
,
−
H(q,
p)
.
Les
équilibres de X sont
∂p1
∂pn
∂q1
∂qn
donc les points critiques de H, et les propriétés suivantes sont vérifiées :
i) La fonction H ◦ ρx est constante pour tout x ∈ V (« conservation de l’énergie »).
ii) Par conséquent,
si a ∈ V n’est pas un point critique de H, alors S =
H −1 H(a) est une sous-variété en a et l’on a X(a) ∈ Ta S.
12
MARC CHAPERON
iii) Tout point a où H a un minimum local strict ou un maximum local strict
est un équilibre stable de X et de −X ; autrement dit, tout voisinage U de a
dans V contient un voisinage W de a tel que ρt (x) existe et appartienne à U
quels que soient x ∈ W et t ∈ R.
Démonstration Pour x ∈ V et t ∈ dom ρx , on a
0
H ◦ ρx (t) = DH ρx (t) ρ0x (t) = DH ρx (t) X ρx (t)
n X
∂
∂
∂
∂
H ρx (t)
H ρx (t) −
H ρx (t)
H ρx (t) = 0;
=
∂qj
∂pj
∂pj
∂qj
j=1
comme dom ρx est un intervalle, on en déduit (i).
En outre, sous l’hypothèse de (ii), comme Ta S = Ker DH(a) et (d’après le calcul
précédent avec (x, t) = (a, 0)) DH(a)X(a) = 0, on a bien X(a) ∈ Ta S.
Pour obtenir (iii) dans le cas de X (resp. −X), il suffit, d’après (i), d’appliquer
le théorème à X (resp. −X) en prenant pour L la restriction de H (ou, dans le
cas d’un maximum, de −H) à un voisinage W de a dans V tel que, pour tout
x ∈ W r {a}, on ait L(x) > L(a).
Exercice. Montrer qu’un champ hamiltonien a une divergence nulle.
Exemple : systèmes mécaniques dérivant d’un potentiel . Il s’agit du cas où le hamiltonien H est de la forme H(q, p) = K(p) + U (q), où K est une forme quadratique
définie positive appelée énergie cinétique et U une fonction C k+1 appelée énergie
potentielle ; on dit que q ∈ B est une position généralisée et p ∈ B 0 une impulsion
généralisée, dont le lien avec la « vitesse généralisée » q 0 := dq
est donné par la predt
0
mière équation de Hamilton q = ∂2 H(q, p) = DK(p) ; comme DK : B 0 → B 00 = B
est un isomorphisme linéaire, les équations de Hamilton
(q 0 , p0 ) = X(q, p) sont donc
équivalentes à l’équation de Newton q 00 + DK DU (q) = 0.
Exercice : le pendule sans frottement. On considère un pendule plan sans
frottement, c’est-à-dire un « point matériel » M de masse m > 0 soumis à la
pesanteur et fixé au bout d’une tige rigide de masse négligeable et de longueur `
dont l’autre extrémité est fixée en un point O de manière que l’ensemble puisse
tourner sans frottement autour de O dans un plan vertical P . Une orientation
quelconque étant choisie dans P , la « position généralisée » q est l’angle orienté
−−→
de OM avec la verticale descendante et nous avons vu que l’on était ici dans la
1
2
situation de l’exemple précédent avec U (q) = −mg` cos q et K(p) = 2m`
2 p , où g
l’accélération de la pesanteur.
a) Vérifier que l’équation de Newton obtenue est celle à laquelle on s’attendrait.
b) En utilisant la conservation de l’énergie et l’exercice p. 3, trouver les orbites
du champ hamiltonien X obtenu, les dessiner et donner leur interprétation
« physique » . Déduire de l’exercice p. 6 qu’au voisinage du minimum (0, 0) de
l’énergie toutes les orbites du champ hamiltonien considéré sont périodiques.
ÉQUATIONS DIFFÉRENTIELLES, II
13
Voici une condition simple pour qu’un équilibre soit attractif (le cas répulsif
s’obtient en remplaçant X par −X, et un puits de −X s’appelle une source de X).
Corollaire 4.5. Soit a un puits de X, c’est-à-dire un équilibre du champ de vecteur
X tel que les valeurs propres de A := DX(a) aient toutes une partie réelle < 0. Les
deux nombres C0 := max{− <e z : z ∈ SpecA} et c0 := min{− <e z : z ∈ SpecA}
sont donc strictement positifs.
L’équilibre a est alors attractif , d’où son nom ; plus précisément, quels que soient
C > C0 et c ∈]0, c0 [ (arbitrairement proches de C0 et c0 respectivement), il existe
une norme euclidienne | · | sur E et une boule ouverte B ⊂ V de centre a pour
cette norme possédant les propriétés suivantes :
i) La fonction L : B → R définie par L(x) := |x − a|2 est une fonction de
Lyapounov pour X, décroissant strictement le long des courbes intégrales de
X|Br{a} ; en particulier, B est positivement invariante par le flot de X.
ii) Quels que soient x ∈ B et t ∈ R+ , on a e−Ct |x−a| ≤ ρt (x)−a ≤ e−ct |x−a|.
Démonstration Quitte à substituer à X son image par une translation, on peut
supposer que a = 0. D’après le corollaire B.2, pour C1 ∈]C0 , C[ et c1 ∈]c, c0 [, il
existe une norme euclidienne | · | sur E telle que l’on ait
(4)
∀x ∈ E
− C1 |x|2 ≤ x · Ax ≤ −c1 |x|2 .
Déduisons-en le corollaire 3. Comme X(x) = Ax + o(|x|), on peut trouver une
boule ouverte B de centre 0 = a dans E dans laquelle on a
(5)
∀x ∈ B
− C|x|2 ≤ x · X(x) ≤ −c|x|2 .
D’après les remarques importantes p. 9, (i) en résulte après translation.
Cette remarque nous dit aussi que B est positivement invariante. Pour tout x ∈ B,
il résulte donc de (5) que l’on a −2C|ρx (t)|2 ≤ dtd |ρx (t)|2 ≤ −2c|ρx (t)|2 quel que
soit t ∈ dom ρ. En d’autres termes, la fonction R+ 3 t 7→ e2Ct |ρx (t)|2 (resp.
e2ct |ρx (t)|2 ) a une dérivée partout ≥ 0 (resp. ≤ 0) ; en écrivant que sa valeur en
t ≥ 0 est supérieure (resp. inférieure) ou égale à sa valeur en 0, on obtient l’inégalité
e−Ct |x| ≤ |ρx (t)| (resp. e−ct |x| ≥ |ρx (t)|), d’où (ii) après translation.
Exercice. a) Montrer qu’un champ hamiltonien ne peut avoir ni source, ni puits
[remarquer que la somme des valeurs propres (comptées avec leur multiplicité) de
DX(a) est la divergence de X en a et utiliser l’exercice p. 12].
Le résultat suivant est un cas particulier du corollaire 5.3 :
Corollaire 4.6 (classification topologique des puits). Sous les hypothèses et avec
les notations
du corollaire 4.5, si r > 0 vérifie B r (a) = {x ∈ E : |x − a| ≤ r} ⊂ B
et Lip X B r (a) < ∞, alors il existe un unique homéomorphisme h de B r (a) sur
B r (0) possédant les deux propriétés suivantes :
i) La restriction de h à la sphère Sr (a) = {x ∈ E : |x − a| = r} est l’homéomorphisme x 7→ x − a de Sr (a) sur Sr (0).
14
MARC CHAPERON
ii) On a h ρt (x) = e−t h(x) pour x, ρt (x) ∈ B r (a).
En particulier, h(a) = 0 et les courbes intégrales de X|Br (a) sont les images par h−1
de celles de la restriction à Br (0) du champ de vecteurs linéaire −IE : x 7→ −x ; on
peut donc dire que X|Br (a) = h∗ (−IE ). En fait, h|Br (a)r{a} est un difféomorphisme
C k sur son image Br (0) r {0}, donc X(x) = h∗ (−IE )(x) au sens ordinaire pour
x ∈ Br (a) r {a}.
Remarques. L’existence de r vient de ce que X est C 1 donc localement lipschitzien.
En composant h avec une isométrie linéaire de E sur Rn euclidien, on obtient
un homéomorphisme g de B r (a) sur la boule de centre 0 et de rayon r de Rn ,
possédant les propriétés suivantes :
i) La restriction g|Br (a)r{a} est un difféomorphisme C k sur son image Br (0)r{0}.
ii) Si In désigne le champ de vecteurs linéaire x 7→ x sur Rn , on a X|B = g ∗ (−In ),
au sens ordinaire dans Br (a) r {a}.
À homéomorphisme local près, il n’y a donc qu’un puits (et qu’une source) en
chaque dimension finie.
Exercice. a) Montrer que h ne peut être C 1 que si DX(a) = −IE .
b) Énoncer l’analogue du corollaire 4 pour les sources.
Preuve du corollaire 4.6. Posons S := Sr (0), D := B r (0) et D := Br (0) = D r S.
Toujours dans le cas d’un puits, une translation nous ramène au cas où a = 0 et
donc h|S = IdE |S .
– Pour tout x ∈ D r {0}, la courbe intégrale ρx rencontre S une fois et une
seule. La formule ρ−τ (x) (x) = r définit donc une fonction τ : D r {0} → R+ ,
localement lipschitzienne, C k dans D r {0} et telle que lim τ (x) = +∞.
x→0
En effet, l’unicité est claire puisqu’au voisinage de D la norme décroît strictement
le long des courbes intégrales de X. Comme évidemment τ |S = 0, le problème de
l’existence ne se pose que pour les x ∈ Dr{0}, et est résolu grâce au corollaire 2.9 :
si τ (x) n’était pas défini, on aurait ρt (x) ∈ D pour tout t ∈ R− ∩ dom ρx , c’est-àdire (d’après ledit corollaire) pour tout t ∈ R− , contredisant les inégalités (ii) du
corollaire 4.5, qui (avec t := −t et x := ρt (x)) impliquent |ρ−t (x)| ≥ ect |x| pour
t ≥ 0.
D’après lesdites inégalités, on a ecτ (x) |x| ≤ ρ−τ (x) (x)| = r ≤ eCτ (x) |x| et donc
1
r
1
r
ln
≤ τ (x) ≤ ln ,
C |x|
c |x|
d’où
lim τ (x) = +∞.
x→0
k
Comme | · | est euclidienne et que l’on peut supposer (5) vérifiée,
−t τ2est C d’après
le théorème desfonctions implicites, appliqué à l’équation ρ (y) = r au point
(y, t) = x, τ (x) .
ÉQUATIONS DIFFÉRENTIELLES, II
15
– L’application h est forcément donnée par h(0) = 0 et h(x) = e−τ (x) ρ−τ (x) (x)
pour x ∈ D r {0} ; elle est continue et vérifie bien h ρt (x) = e−t h(x) pour
x, ρt (x) ∈ D.
La première affirmation vient de ce que l’on doit avoir h ρ−τ (x) (x) = eτ (x) h(x),
c’est-à-dire (puisque ρ−τ (x) (x) ∈ S par définition) ρ−τ (x) (x) = eτ (x) h(x) ; l’application h est continue (en 0) car limx→0 τ (x) = +∞. Enfin, pour tout
x ∈ D r {0}
t
−τ (x)
t
−τ (x)−t
−1
ρ (x) = ρ
(x), donc τ ρ (x) = τ (x) + t et
et tout t ∈ ρx (D), on a ρ
t
−τ (x)−t −τ (x)
−t
h ρ (x) = e
ρ
(x) = e h(x).
– La restriction g0 à S × R du flot (x, t) 7→ e−t x de −IE est un isomorphisme de
Lipschitz
de S× R sur E r {0} (analytique si | · | est euclidienne), d’inverse
ry
r
y 7→ |y|
, ln |y|
.
– De même, g := ρ|S×R+ est un isomorphisme de Lipschitz (C k si | · | est eucli
dienne) de S × R+ sur D r {0}, d’inverse y 7→ ρ−τ (y) (y), τ (y) .
– On a h|Dr{0} = g0 ◦ g −1 .
De ces trois faits (essentiels mais faciles à établir)
résulte que h est bijective
r
ln
y
, qui tend bien vers 0 quand
et que h−1 Dr{0} = g ◦ g0−1 Dr{0} : y 7→ ρ |y| r |y|
y → 0.
4.2. Stabilité d’orbites périodiques et de points fixes. Une orbite périodique
O de X est dite stable si tout voisinage U de O dans V contient un voisinage W
de O tel que, pour chaque x ∈ W et tout t ≥ 0, ρt (x) existe et appartienne à U .
Elle est dite instable lorsqu’elle n’est pas stable.
L’orbite O est dite asymptotiquement stable (ou attractive) si elle est
stable et
qu’il existe un voisinage V0 de O dans V tel que limt→+∞ d ρt (x), O = 0 pour
tout x ∈ V0 . Elle est dite répulsive si c’est une orbite périodique attractive de −X.
Voici comment se traduisent ces notions en terme d’holonomie :
Un dictionnaire. Étant données une orbite périodique O de X et une section Σ
de O en a, désignons par h : (Σ, a) → (Σ, a) l’application de premier retour.
i) Les points fixes de h sont les intersections avec Σ d’orbites périodiques de X ;
plus généralement, c’est le cas des points périodiques de h, c’est-à-dire des x
tels que l’itérée hp (x) existe et soit égale à x pour un entier p > 0 (le plus petit
de ces p est la période du point périodique x de h).
ii) Pour que O soit stable, il faut et il suffit que a soit un point fixe stable de h
au sens suivant : tout voisinage Ω de a dans Σ contient un voisinage ω de a
tel que, pour chaque x ∈ ω et tout p ∈ N, hp (x) existe et appartienne à Ω (le
point fixe a de h est dit instable lorsqu’il n’est pas stable).
iii) Pour que O soit attractive, il faut et il suffit que a soit un point fixe attractif
(ou asymptotiquement stable) de h au sens suivant : c’est un point fixe stable,
et il existe un voisinage ω0 de a dans Σ tel que limp→+∞ hp (x) = a pour tout
x ∈ ω0 .
16
MARC CHAPERON
iv) Pour que O soit répulsive, il faut et il suffit que a soit un point fixe répulsif
de h, c’est-à-dire un point fixe attractif de h−1 .
La démonstration est faite dans [1]. Dans le cours oral, nous avons prouvé le
résultat suivant :
Proposition 4.7. Sous les hypothèses de ce dictionnaire, si 1 est multiplicateur
de Floquet simple de O (c’est-à-dire n’est pas valeur propre de Dh(a)) et que les
autre multiplicateurs de Floquet (valeurs propres de Dh(a)) sont de module < 1,
alors O est attractive.
4.3. Points fixes surattractifs et méthode de Newton.
Définition. On dit que le point fixe a d’une application h : (E, a) → (E, a) deux
fois différentiable en a est surattractif si Dh(a) = 0.
Cette terminologie est justifiée
par le fait que h(x)−a = h(x)−h(a)−Dh(a)(x−
a) = 21 D2 h(a)(x−a)2 + |x−a|2 d’après la formule de Taylor-Young ; il existe donc
C > 0 et r > 0 tels que, pour |x−a| < r, on ait x ∈ dom h et |h(x)−a| ≤ C |x−a|2 ,
d’où l’on déduit très facilement par récurrence la
Proposition 4.8. Sous ces hypothèses et avec ces notations, pour |x − a| <
min{C −1 , r}, la suite des itérées hn (x) est bien définie et converge « très vite »
2n
2n −1
vers a puisque l’on a alors |hn (x) − a| ≤ C|x − a| C −1 = C|x − a|
|x − a|.
On comprend ainsi bien la méthode de Newton :
Théorème 4.9 (Méthode de Newton). Soient F un espace vectoriel réel de dimension finie et f : (E, a) → F une application C 2 . Si f est nulle en a et que
Df (a) est un isomorphisme, alors a est un point fixe surattractif de l’application
h : (E, a) → (E, a) définie par h(x) := x − Df (x)−1 f (x).
Preuve si f est C 3 . On a h(a) = a et h est C 2 ; en outre,
h(a + εv) − h(a)
εv − Df (a + εv)−1 f (a + εv)
= lim
ε→0
ε→0
ε
ε
f (a + εv)
= v − lim Df (a + εv)−1
= v − Df (a)−1 Df (a)v = 0
ε→0
ε
pour tout v ∈ E, donc Dh(a) = 0.
La méthode de Newton consiste à approcher (très rapidement !) le zéro a de f
par les itérées hn (x) pour x assez proche de a. Bien entendu, dans la pratique, on
ne connaît pas précisément a et il s’agit de le calculer ; tout le problème est donc
d’en être assez près pour que la proposition s’applique.
Dh(a)v = lim
5. Hyperbolicité et variétés invariantes
Les résultats non démontrés dans cette section le sont dans [1].
ÉQUATIONS DIFFÉRENTIELLES, II
17
5.1. Hyperbolicité.
Définition. Un endomorphisme L de E (considéré comme un champ de vecteurs
linéaire sur E), est dit hyperbolique lorsqu’il n’a pas de valeur propre sur l’axe
imaginaire iR. On dit qu’un équilibre a d’un champ de vecteurs X de classe C 1
est hyperbolique lorsque DX(a) l’est.
Proposition 5.1. Si L ∈ gl(E) est hyperbolique en ce sens, alors
i) il existe une unique décomposition de E en somme directe Es ⊕ Eu de sousespaces fermés L–invariants telle que les valeurs propres de l’endomorphisme
Ls ∈ gl(Es ) (resp. Lu ∈ gl(Eu )) induit par L soient les valeurs propres de
partie réelle < 0 (resp. > 0) de L ;
ii) il existe des normes sur Es et Eu équivalentes à celles induites par la norme
de E, et des constantes Cs ≥ cs > 0, Cu ≥ cu > 0 telles que l’on ait
(
e−Cs t |x| ≤ etLs x ≤ e−cs t |x| pour tout x ∈ Es
∀t ≥ 0
ecu t |x| ≤ etLu x ≤ eCu t |x|
pour tout x ∈ Eu .
iii) le sous-espace stable Es (resp. le sous-espace instable Eu ) du champ de
vecteurs linéaire L est donc l’ensemble des v ∈ E tels que etL v → 0 quand
t → +∞ (resp. t → −∞).
Démonstration i) En notant λ1 , . . L
. , λn les valeurs propres de
LL à partie imaginaire
≥ 0, il est facile de voir que Es = <e λi <0 Eλi (L) et Eu = <e λi >0 Eλi (L), où les
Eλi (L) sont les sous-espace caractéristiques de L (corollaire A.14).
ii) résulte du corollaire B.2, appliqué à A = Ls et A = Lu .
iii) s’en déduit aisément.
Théorème 5.2 (théorème de linéarisation de Grobman). Soit a un équilibre hyperbolique d’un champ de vecteurs X de classe C 1 sur un ouvert de E. En désignant
par ρ le flot de X et en posant L := DX(a), il existe alors un homéomorphisme
h : (E, a) → (E, 0) tel que h ρt (x) = etL h(x) pour tout x ∈ dom h et tout
t ∈ dom ρx vérifiant ρx ([0, t]) ⊂ dom h ; en d’autres termes, h envoie les courbes
intégrales de X|dom h sur celles de L|Im h , ce que l’on pourrait exprimer par l’écriture h∗ X = L.
Corollaire 5.3 (classification des équilibres hyperboliques). Sous les hypothèses
du théorème 5.2, soient Es et Eu les sous-espaces stable et instable de L. Il existe
t
un homéomorphisme
h
=
(h
,
h
)
:
(E,
a)
→
(E
×
E
,
0)
tel
que
h
ρ
(x)
=
s
u
s
u
−t
t
e hs (x), e hu (x) pour tout x ∈ dom h et tout réel t vérifiant ρx ([0, t]) ⊂ dom h ;
on pourrait donc écrire que h∗ X(xs , xu ) = (−xs , xu ).
Si dim Es = j, il existe donc un homéomorphisme local h : (E, a) → (Rd , 0) tel que
h∗ X = (−Ij ) × Id−j .
Démonstration Le théorème fournit un homéomorphisme local h1 : (E, a) → (E, 0)
tel que h1 ∗ X = L ; de plus, l’isomorphisme canonique h2 de E = Es ⊕Eu sur Es ×Eu
envoie L sur Ls × Lu ; enfin, d’après le corollaire 4.6, il existe un homéomorphisme
18
MARC CHAPERON
local hs : (Es , 0) → (Es , 0) (resp. hu : (Eu , 0) → (Eu , 0)) tel que hs∗ Ls =
−IEs
(resp. hu∗ Lu = IEu ). En posant h3 := hs × hu : (xs , xu ) 7→ hs (xs ), hu (xu ) , il est
clair que h := h3 ◦ h2 ◦ h1 répond à la question.
5.2. Variétés stables et instables. Sous les hypothèses et avec les notations du
théorème de Grobman 5.2, identifions E à Es × Eu muni de la norme d’espace
produit, les normes sur Es et Eu étant choisies pour satisfaire la condition (ii) de
la proposition 5.1. Si r > 0 est assez petit pour que l’on ait B := Br (0) ⊂ Im h,
il résulte du théorème de Grobman que, pour tout ouvert U 3 a de E tel que
h(U ) ⊂ B soit une boule Bρ (0) avec ρ ≤ r, l’ensemble h−1 (Es ) ∩ U est la variété
stable Ws de X|U en a et h−1 (Eu ) ∩ U la variété instable Wu de X|U en a au sens
de la
Définition. Si a est un équilibre hyperbolique du champ de vecteurs X de flot ρ
sur V , la variété stable Ws de X en a est l’ensemble des x ∈ V tels que les ρt (x)
avec t ≥ 0 existent et tendent vers a quand t → +∞. La variété instable Wu de
X en a est la variété stable de −X.
Revenons au théorème de Grobman : comme h n’est pas différentiable en général, Ws = h−1 (Es ) ∩ U et Wu = h−1 (Eu ) ∩ U , sont a priori des « sous-variétés
topologiques », sans plus. Nous allons voir (entre autres) que ce sont des sousvariétés exactement aussi différentiables que X, d’espaces tangents respectifs Es
et Eu en a :
Théorème 5.4 (variétés stable et instable locales d’un équilibre). Soit a un équilibre hyperbolique d’un champ de vecteurs X de classe C k (1 ≤ k ≤ ∞) sur un
ouvert de E. Si l’on appelle ρ le flot de X et Es , Eu les sous-espaces stable et
instable du champ de vecteurs linéaire DX(a), il existe un ouvert U 3 a de dom X
tel que les propriétés suivantes sont vérifiées :
i) La variété stable Ws (resp. la variété instable Wu ) de X|U en a est une sousvariété C k vérifiant Ta Ws = Es (resp. Ta Wu = Eu ).
ii) Pour tout ouvert U1 3 a de U , la variété stable (resp. instable) de X|U1 en
a est un ouvert de Ws (resp. Wu ) contenant a.
– Si W 3 a est une sous-variété C 1 de dom X vérifiant Ta W = Es (resp.
Ta W = Eu ) et telle que l’on ait X(x) ∈ Tx W pour tout x ∈ W assez proche
de a, alors il existe un ouvert U1 3 a de U tel que W ∩ U1 = Ws ∩ U1 (resp.
W ∩ U1 = Wu ∩ U1 ).
ÉQUATIONS DIFFÉRENTIELLES, II
19
Annexe A. Rappels et compléments d’algèbre linéaire
A.1. Décomposition et forme normale de Jordan : le cas complexe.
Théorème A.1 (« Bonnes triangulations »). Pour tout endomorphisme A d’un
espace vectoriel complexe8 E de dimension d finie et non nulle, il existe une base
(ei,j )1≤j≤mi ,1≤i≤n de E telle que
A ei,j = λi ei,j +
X
aki,j ei,k ,
1≤k<j
où les λi sont les différentes9 valeurs propres de A et les aki,j des scalaires. En
d’autres termes, si l’on ordonne l’ensemble des (i, j) avec 1 ≤ i ≤ n et 1 ≤ j ≤ mi
suivant l’ordre lexicographique
(i, j) ≤ (i0 , j 0 ) ⇔ i < i0 ou j ≤ j 0 ,
la matrice de A dans la base (ei,j )1≤j≤mi ,1≤i≤n est diagonale par blocs :
(6)
Ti

λ1 Im1 + T1

0
0










=








0
0
...
0
0

0
,
λn Imn + Tn

1
0 a1i,2 · · · ai,mi
..
.
.
0 .. ..
.
. . . mi −1
ai,mi
0 0
0 ··· ···
0


 pour mi > 1


si mi = 1.
Démonstration Par récurrence sur la dimension d de E.
Si d = 1, n’importe quel vecteur e1,1 6= 0 de E en constitue une base, donc il
existe un unique scalaire λ1 tel que Ae1,1 = λ1 e1,1 et notre théorème est trivial.
Pour d > 1, on peut donc faire l’hypothèse de récurrence que le théorème est
vrai en dimension d − 1 ; le polynôme caractéristique de A a au moins une racine
λ1 ∈ C ; celle-ci est une valeur propre de A et il existe donc e1,1 ∈ E r {0}
tel que Ae1,1 = λ1 e1,1 (« vecteur propre de A associé à la valeur propre λ1 »).
Étant donné un supplémentaire F de Ce1,1 , on peut appliquer l’hypothèse de
récurrence à l’endomorphisme B de F obtenu en composant A|F et la projection
sur F parallèlement à e1,1 : cela donne (en mettant λ1 en premier si elle est valeur
8La
théorie vaut sur un corps algébriquement clos arbitraire.
à deux.
9Deux
20
MARC CHAPERON
propre de B) une base (e1,j )1<j≤m1 , (fi,j )1≤j≤mi ,2≤i≤n de F telle que
X
B e1,j = λ1 e1,j +
ak1,j e1,k
1<k<j
X
B fi,j = λi fi,j +
aki,j fi,k ,
1≤k<j
où les aki,j sont des scalaires. Comme il existe par définition de B des scalaires
a11,j , bi,j tels que A e1,j = B e1,j + a11,j e1,1 et A fi,j = B fi,j + bi,j e1,1 , on a donc
obtenu ainsi une base (e1,j )1≤j≤m1 , (fi,j )1≤j≤mi ,2≤i≤n de E telle que
A e1,j = λ1 e1,j +
X
ak1,j e1,k
1≤k<j
A fi,j = λi fi,j +
X
aki,j fi,k + bi,j e1,1 .
1≤k<j
Pour chaque i > 1, il ne reste plus qu’à construire par récurrence sur j les
ei,j = fi,j + ci,j e1,1 :
supposant construits les ei,k pour k < j, on a
X
A fi,j = λi fi,j +
aki,j ei,k + b0i,j e1,1
1≤k<j
et donc, pour chaque scalaire c,
A ( fi,j + c e1,1 ) = λi ( fi,j + c e1,1 ) +
X
aki,j ei,k + b0i,j + c(λ1 − λi ) e1,1 ,
1≤k<j
ce qui permet de conclure pour ci,j =
b0i,j
.
λi − λ1
Corollaire A.2 (sous-espaces caractéristiques). Sous les hypothèses et avec les
notations du théorème, pour 1 ≤ i ≤ n, le sous-espace engendré par ei,1 , . . . , ei,mi
est le noyau Eλi (A) de l’itérée (A − λi IdE )mi et ne dépend donc que de A, de sa
valeur propre λi et de la multiplicité mi de celle-ci ; on dit que Eλi (A) est le sousespace caractéristique de A associé à la valeur propre λi ; comme les ei,j forment
n
M
une base de E, le théorème affirme en particulier que E =
Eλi (A).
i=1
Démonstration La matrice de (A − λi IdE )mi dans la base (ei,j )1≤j≤mi ,1≤i≤n (ordonnée lexicographiquement comme précédemment) est la matrice diagonale par
ÉQUATIONS DIFFÉRENTIELLES, II
blocs

(λ1 − λi )Im1 + T1
mi
0
..
.
0
21


;
0
0
mi
0
0
(λn − λi )Imn + Tn
pour 1 ≤ j ≤ n et j 6= i, le j-ième de ces blocs est une matrice triangulaire supérieure d’éléments diagonaux (λj − λi )mi , donc de déterminant (λj − λi )mi mj 6= 0 et
donc inversible ; en revanche, le i-ième bloc Timi est nul10. Il en résulte bien que le
noyau Eλi (A) de (A − λi IdE )mi est le sous-espace correspondant à ce i-ième bloc,
c’est-à-dire le sous-espace engendré par ei,1 , . . . , ei,mi .


Notation. Dans la suite, on notera BC le composé B ◦C de deux endomorphismes
de E et Bv := B(v) pour v ∈ E.
Corollaire A.3 (théorème de Cayley-Hamilton). Sous les hypothèses et avec les
P
notations du théorème, si χA = (−1)d X d + dj=1 bj X d−j ∈ C[X] désigne le polyP
nôme caractéristique de A, on a χA (A) := (−1)d Ad + dj=1 bj Ad−j = 0, où l’on a
noté Ak l’itérée k-ième de A (en particulier, A0 = IdE ).
Démonstration Comme χA = (−1)d (X−λ1 )m1 · · · (X−λn )mn , on peut écrire χA (A)
d
m1
mn
comme le produit commutatif χA (A) = (−1)
Y (A − λ1 IdE ) · · · (A − λn IdE ) ;
pour vi ∈ Eλi (A), on a χA (A)vi = (−1)d (A − λj IdE )mj (A − λi IdE )mi vi = 0 ;
j6=i
d’après le corollaire A.2, tout v ∈ E s’écrit de manière unique v = v1 + · · · + vn
avec vi ∈ Eλi (A), d’où χA (A)v = χA (A)v1 + · · · + χA (A)vn = 0.
Corollaire A.4 (polynôme minimal). Sous les hypothèses et avec les notations
du théorème, il existe un unique polynôme unitaire11 PA ∈ C[X] de degré minimal
tel queQPA (A) = 0 ; on l’appelle polynôme minimal de A et il est de la forme
PA = ni=1 (X − λi )mi,1 avec 1 ≤ mi,1 ≤ mi ; tout polynôme P ∈ C[X] tel que
P (A) = 0 est un multiple de PA dans C[X].
Démonstration Les P ∈ C[X] tel que P (A) = 0 forment un idéal I, qui contient
χA d’après le théorème de Cayley-Hamilton ; comme C[X] est un anneau euclidien,
cet idéal est engendré par un unique polynôme unitaire PA ; puisque celui-ci divise
n
Y
χA , il est de la forme PA =
(X − λi )mi,1 avec 0 ≤ mi,1 ≤ mi ; si l’on avait
i=1
mj,1 = 0 pour un j, alors, pour tout vecteur propre vj non nul de A associé à la
n
Y
valeur propre λj , on aurait PA (A)vj =
(λj − λi )mi,1 vj 6= 0, contradiction. i6=j
10La
matrice Ti est triangulaire supérieure, de diagonale nulle et de taille mi × mi , donc
= 0.
11C’est-à-dire que le coefficient de son terme de plus haut degré est égal à 1.
Timi
22
MARC CHAPERON
Corollaire A.5 (décomposition de Jordan12). Sous les hypothèses et avec les notations du théorème, il existe un unique endomorphisme diagonalisable S de E et
un unique endomorphisme nilpotent N de E tels que N S = SN et A = N + S ;
on dit que S est la partie semi-simple de A et N sa partie nilpotente.
Démonstration Pour l’existence, il suffit de prendre pour S et N les endomorphismes dont les matrices dans la base (ei,j )1≤j≤mi ,1≤i≤n sont respectivement

 

λ1 Im1 0
0
T1 0 0
...
...
 0
0  et  0
0  , de taille d × d. En effet, la première
0
0 λn Imn
0 0 Tn
de ces matrices est diagonale, la seconde est nilpotente puisqu’elle est triangulaire
supérieure et a une diagonale nulle (sa puissance d-ième est donc nulle13), et la ma

λ1 T1 0
0
..
trice de SN est égal à celle de N S, c’est-à-dire au produit  0
.
0 
0
0
λn Tn
des deux matrices précédentes (dans n’importe quel ordre).
Pour l’unicité, il suffit de montrer que, pour « toute » décomposition de Jordan
A = S + N , la restriction de S à Eλi (A) est forcément la multiplication par λi
pour 1 ≤ i ≤ n. Pour cela, remarquons que, pour toute valeur propre µ de S,
– le sous-espace propre correspondant Eµ (S) est stable par A puisque la relation
SA = S(S + N ) = S 2 + SN = S 2 + N S = (S + N )S = AS entraîne que pour
tout v ∈ Eµ (S), on a (S − µIdE )Av = A(S − µIdE )v = 0
– la seule valeur propre de l’endomorphisme Aµ de Eµ (S) induit par A est µ,
car si v ∈ Eµ (S) r {0} satisfait Av = λv on a N v = Av − Sv = (λ − µ)v et
donc λ = µ puisque N k v = (λ − µ)k v = 0 pour tout entier k > 0 assez grand
– d’après le théorème A.1, appliqué à Aµ , pour m ≥ dim Eµ (S), on a donc
(Aµ −µIdEµ (S) )m = 0, c’est-à-dire (A−µIdE )m |Eµ (S) = 0, d’où Eµ (S) ⊂ Eµ (A).
En particulier, les valeurs propres de S sont des valeurs propres λi1 , . . . , λi` de
A ; comme S est diagonalisable, E = Eλi1 (S) ⊕ · · · ⊕ Eλi` (S) ; compte tenu de ce
que E = Eλ1 (A) ⊕ · · · ⊕ Eλn (A) et Eλik (S) ⊂ Eλik (A) pour 1 ≤ k ≤ `, ce n’est
possible14 que si les valeurs propres de S sont λ1 , . . . , λn et Eλi (S) = Eλi (A) pour
tout i.
Corollaire A.6. Si A est bijectif, il existe un endomorphisme L de E tel que
eL = A.
Démonstration Comme les valeurs propres de A sont non nulles et que ce sont
celles de S, celui-ci est inversible, d’où N1 := S −1 N = N S −1 puisque SN = N S ;
12Appelée
aussi « de Jordan-Chevalley » et même, ce qui est grotesque, « de Dunford » sous
prétexte que celui-ci en a donné en 1946 une version dans les espaces de Banach.
13Sa puissance m-ième, en fait, où m = max m : en effet, T mi = 0 pour tout i.
i
i
14La dimension d’une somme directe de sous-espaces vectoriels étant la somme de leurs
dimensions.
ÉQUATIONS DIFFÉRENTIELLES, II
23
l’endomorphisme N1 ainsi défini est nilpotent car N1k = (S −1 )k N k = N k (S −1 )k
pour tout k ∈ N. Comme A = (IdE +N1 )S = S(IdE +N1 ), nous pouvons construire
un L de la forme L = X + Y avec XY = Y X, eX = S et eY = IdE + N1 : d’après
la proposition 1.6, on aura alors bien eL = eX eY = S(IdE + N1 ) = S + N = A.
Il suffit de choisir pour 1 ≤ i ≤ n un nombre complexe αi tel que eαi = λi et
de prendre pour X et Y les endomorphismes dont les matrices dans la base (ei,j )


 
α1 Im1 0
0
ln(Im1 + λ−1
0
0
1 T1 )
..
..
 ressont  0
.
.
0  et 
0
0
0
0 αn Imn
0
0 ln(Imn + λ−1
n Tn )
pectivement, avec les notations du
Lemme A.7. Pour toute matrice complexe nilpotente ν de taille m × m avec
m > 0, le logarithme15
X
νk
ln(Im + ν) :=
(−1)k+1
k
1≤k<m
vérifie eln(Im +ν) = Im + ν.
Il résulte immédiatement du lemme que X et Y possèdent les propriétés requises.
Le lemme se prouve en remarquant que l’identité eln(1+x) = 1 + x est vraie au
niveau des séries formelles (développements limités en 0) et que, les mêmes causes
produisant les mêmes effets, elle est vérifiée dans notre cas.
Théorème A.8 (forme normale de Jordan). Sous les hypothèses et avec les notations du théorème A.1, il est possible de choisir la base (ei,j ) de manière que les
matrices Ti soient de la forme


Jmi,1 0
0
pi
X


.
.
(7) Ti =  0
mi,k = mi
.
0  , mi,1 ≥ · · · ≥ mi,pi ≥ 1,
k=1
0
0 Jmi,pi


0 1
0 ··· 0



 . .



 .. . . . . . . . . ... 







 ..
.
.
.
.
 .
. 0  (de taille m × m) pour m > 1
.


Jm :=
 ..

..


.
.
1







0 ··· ··· ··· 0



0
si m = 1;
0 Im−1
bref, Jm est pour m > 1 la matrice m × m qui s’écrit par blocs Jm =
.
0
0
15Avec
donc ln(Im + ν) = 0 si m = 1.
24
MARC CHAPERON
n
Y
Le polynôme minimal de A est donc PA =
(X−λi )mi,1 et, si m̄ := maxi mi,1 ,on
i=1
a en fait N m̄ = 0 dans la décomposition de Jordan.
Démonstration On applique pour 1 ≤ n ≤ i à l’endomorphisme Ni de Eλi (A)
induit par la partie nilpotente N de A (celui qui a pour matrice Ti dans la base
(ei,1 , . . . , ei,mi ) de Eλi (A) initialement choisie) le
Lemme A.9. Pour tout endomorphisme nilpotent N d’un espace vectoriel E de
dimension finie m > 0 sur un corps K, il existe une base (e1 , . . . , em ) de E où


Jm1 0
0
la matrice de N est de la forme  0 . . . 0  , m1 ≥ · · · ≥ mp ≥ 1,
0
0 Jmp
Pp
m
=
m.
k
k=1
Preuve du lemme Par récurrence sur m : si m = 1, alors N = 0 et il n’y a
rien à prouver. Pour N 6= 0, le noyau de N étant non trivial, son image Im N
est de dimension r < m strictement positive ; comme elle est stable par N , on
peut appliquer l’hypothèse de récurrence à l’endomorphisme N0 de Im N induit
par N et noter (f1 , . . . , fr ) une base de Im N où la matrice de N0 est de la forme


Jn1 0
0
P
 0 . . . 0  , n1 ≥ · · · ≥ nq ≥ 1, q nk = r. Pour 1 ≤ k ≤ q, le vecteur
k=1
0
0 Jnq
fn1 +···+nk de la base correspondant à la dernière colonne du k-ième bloc est pas
définition l’image par N d’un vecteur vk ∈ E, qui n’appartient pas à Im N car la
(n1 + · · · + nk )-ième ligne de la matrice de N0 est nulle. Les q vecteurs vk ainsi
obtenus sont indépendants car, s’ils ne l’étaient pas, leurs images fn1 +···+nk par N ne
le seraient pas non plus. Par ailleurs, le sous-espace qu’ils engendrent ne rencontre
Im N qu’en 0 car un vecteur de Im N dont l’image est combinaison linéaire des
fn1 +···+nk a forcément une image nulle , la (n1 + · · · + nk )-ième ligne de la matrice
de N0 étant nulle. On obtient donc la base cherchée en prenant mk = nk + 1 pour
1 ≤ k ≤ q, ej = fj pour 1 ≤ j ≤ n1 , em1 = v1 et, si l’on a n1 < r et donc q > 1,
em1 +j = fn1 +j pour 1 ≤ j ≤ n2 , em1 +m2 = v2 , . . ., em1 +···+mq−1 +j = fn1 +···+nq−1 +j
pour 1 ≤ j ≤ nq , em1 +···+mq = vq ;
– si m1 + · · · + mq = m, on prend p = q et c’est terminé ;
– sinon, on prend p = q + m − m1 − · · · − mq , mq+1 = · · · = mp = 1 et pour
(em1 +···+mq +1 , . . . , em ) une base d’un supplémentaire de ker N0 = ker N ∩Im N
dans ker N .
Les vérifications de détail sont laissées au lecteur.
Les affirmations sur le polynôme minimal et l’entier minimal m̄ tel que la partie
nilpotente N de A vérifie N m̄ = 0 résultent aussitôt des faits suivants : pour k > 0,
ÉQUATIONS DIFFÉRENTIELLES, II
25

T1k
0
..
.
0

la matrice de N k dans la base que nous venons de construire, est  0
0 ,
0 0 Tnk
 k

Jmi,1 0
0


..
k
avec Tik =  0
.
0  ; or, pour m ≥ 1, on voit aisément que Jm est la
k
0
0 Jm
i,pi
matrice m × m qui s’écrit par blocs

pour k ≥ m,

0
!
k
(8)
Jm =
0 Im−k

6= 0 sinon.  0
0
A.2. Décomposition et forme normale de Jordan : le cas réel.
Théorème A.10. Pour tout endomorphisme A d’un espace vectoriel réel E de
dimension finie d > 0, il existe r, c ∈ N avec r + 2c = d et un isomorphisme
d’espaces vectoriels réels P : E → Rr × Cc tels que l’endomorphisme P AP −1 de
Rr × Cc soit défini par une matrice de la forme (6), où les matrices triangulaires
Ti sont sous forme normale de Jordan (7). Plus précisément,
i) il existe un entier ρ tel que les valeurs propres réelles de A soient λ1 , . . . , λρ ,
et r = m1 + · · · + mρ est la somme de leurs multiplicités ;
ii) les nombres complexes λρ+1 , . . . , λn sont les valeurs propres de A qui ont une
partie imaginaire strictement positive16, et c = mρ+1 + · · · + mn est la somme
de leurs multiplicités ;
iii) si l’on écrit chaque x = (x1 , . . . , xr+c ) ∈ Rr × Cc sous forme de colonne,



x1
λ1 Im1 + T1 0
0
..
  ...  .
P AP −1 x = 
.
0
0
0
0 λn Imn + Tn
xr+c
Remarques importantes. Si A n’a pas de valeur propre imaginaire, c’est-à-dire
si r = d, c = 0 et ρ = n, ce théorème se démontre comme dans le cas complexe,
les théorèmes A.1 et A.8 étant alors vrais en remplaçant C par R.
Sinon, le théorème A.10 est déjà très intéressant pour d = 2 : dans ce cas,
quand A n’a pas de valeur propre réelle, il admet deux valeurs propres imaginaires
conjuguées λ, λ̄ (où l’on a noté λ celle dont la partie imaginaire est > 0) et P est
un isomorphisme de E sur C tel que P AP −1 z = λz pour tout z ∈ C.
16Dans
chaque couple de valeurs propres imaginaires (racines non réelles du polynôme caractéristique PA ∈ R[X]) conjuguées de A, on sélectionne donc celle dont la partie imaginaire est
> 0 ; par conséquent, les valeurs propres de A sont λ1 , . . . , λn , λ̄ρ+1 , . . . , λ̄n .
26
MARC CHAPERON
Notre insistance sur la forme normale de Jordan ne doit pas cacher le fait que,
pour presque tout A, les valeurs propres de
A sont simples,
 auquel cas la matrice
λ1 0 0
donnant P AP −1 est la matrice diagonale  0 . . . 0  et d = n + c.
0 0 λn
Démonstration du théorème. L’idée est de complexifier l’espace E et l’endomorphisme A pour utiliser les résultats précédents. La complexification n’est pas une
chose bien effrayante : si E = Rd , l’endomorphisme A s’identifie à sa matrice M
dans la base canonique ; une matrice réelle étant une matrice complexe particulière, M est la matrice dans la base canonique de Cd (qui est aussi celle de Rd )
d’un endomorphisme AC de l’espace vectoriel complexe Cd .
Cette construction peut se faire en général comme suit : on introduit le complexifié EC de E, qui est à E ce que C est à R : c’est l’ensemble de tous les couples
(v, w) de vecteurs v, w ∈ E, écrits sous la forme v + iw, muni de la structure
d’espace vectoriel complexe « évidente » : pour v, w, v0 , w0 ∈ E et λ, µ ∈ R,
(v + iw) + (v0 + iw0 ) = (v + v0 ) + i(w + w0 )
(λ + iµ)(v + iw) = (λv − µw) + i(λw + µv);
on dit alors que v est la partie réelle de v + iw, que w est sa partie imaginaire,
et l’on identifie E au sous-espace vectoriel réel de EC formé des vecteurs dont la
partie imaginaire est nulle en identifiant chaque v ∈ E à v + i0. Pour v, w ∈ E,
le conjugué de u = v + iw est par définition ū = v − iw. Toute base de l’espace
vectoriel réel E étant évidemment une base de l’espace vectoriel complexe EC ,
celui-ci est de dimension d.
Le complexifié AC : EC → EC de A est défini lui aussi de la manière évidente
AC (v + iw) := Av + iAw;
il est immédiat que AC ū = AC u pour tout u ∈ EC et que AC est l’unique extension
de A en une application C-linéaire de EC dans lui-même ; sa matrice dans une base
de E étant évidemment celle de A, son polynôme caractéristique est celui de A.
Numérotons les valeurs propres de A de façon que les valeurs propres réelles
λ1 , . . . , λρ viennent en premier, suivies des valeurs propres λρ+1 , . . . , λn à partie
imaginaire > 0 et enfin de λn+1 := λ̄ρ+1 , . . . , λ2n−ρ := λ̄n .
L’identité AC ū = AC u entraîne que Eλj (AC ) = Eλ̄j (AC ) pour tout j. Comme
EC = Eλ1 (AC ) ⊕ · · · ⊕ Eλ2n−ρ (AC ), tout vecteur v ∈ E s’écrit de manière unique
vλ1 +· · ·+vλ2n−ρ avec vλj ∈ Eλj (AC ) pour tout j ; puisque v = v̄ = vλ1 +· · ·+vλ2n−ρ ,
l’unicité de la décomposition entraîne que vλj = vλ̄j pour tout j, d’où le
Lemme A.11. Tout v ∈ E s’écrit de manière unique
v = vλ1 + · · · + vλρ + (vλρ+1 + vλρ+1 ) + · · · + (vλn + vλn )
avec vλj ∈ Eλj (A) := ker(A − λj )mj pour j ≤ ρ et vλj ∈ Eλj (AC ) pour ρ < j ≤ n.
ÉQUATIONS DIFFÉRENTIELLES, II
27
Avec ces notations,
Av = AC v
= AC vλ1 + · · · + AC vλρ + (AC vλρ+1 + AC vλρ+1 ) + · · · + (AC vλn + AC vλn )
= Avλ1 + · · · + Avλρ + (AC vλρ+1 + AC vλρ+1 ) + · · · + (AC vλn + AC vλn ),
d’où le
Lemme A.12. La formule
P0−1 (v1 , . . . , vn ) := vλ1 + · · · + vλρ + (vλρ+1 + vλρ+1 ) + · · · + (vλn + vλn )
définit une bijection R-linéaire P0 : E →
ρ
Y
Eλj (A) ×
j=1
n
Y
Eλj (AC ) telle que
j=ρ+1
P0 AP0−1 (v1 , . . . , vn ) = Aλ1 v1 , . . . , Aλρ vρ , AC,λρ+1 vρ+1 , . . . , AC,λn vn ,
où Aλj (resp. AC,λj ) désigne l’endomorphisme du sous-espace caractéristique Eλj (A)
(resp. Eλj (AC )) défini par Aλj vj := Avj (resp. AC,λj vj := AC vj ).
En appliquant les théorèmes A.1 et A.8 à chaque AC,λj et leurs versions réelles17
à chaque Aλj , on obtient finalement le résultat cherché :
Lemme A.13. Pour 1 ≤ j ≤ ρ (resp. ρ < j ≤ n), l’espace vectoriel réel (resp.
complexe) Eλj (A) (resp. Eλj (AC )) admet une base (ej,1 , . . . , ej,mj ) où la matrice
de Aλj (resp. AC,λj ) est de la forme λj Imj + Tj avec Tj sous forme normale de
Jordan (7). En d’autres termes, la formule
P1−1 (xj,k )1≤k≤mj 1≤j≤n := xj,1 ej,1 + · · · + xj,mj ej,mj 1≤j≤n
définit une bijection R-linéaire18
P1 :
ρ
Y
Eλj (A) ×
j=1
n
Y
Eλj (AC ) →
j=ρ+1
ρ
Y
mj
×
R
j=1
n
Y
Cmj
j=ρ+1
telle que
P1 P0 AP0−1 P1−1
:
ρ
Y
j=1
mj
R
×
n
Y
j=ρ+1
C
mj
→
ρ
Y
mj
R
j=1
×
n
Y
Cmj
j=ρ+1
soit défini par une matrice de la forme (6) avec des Tj de la forme (7), d’où le
ρ
n
Y
Y
mj
r
théorème avec P = P1 P0 en écrivant
R = R et
Cmj = Cc .
j=1
17Voir
j=ρ+1
la première des « remarques importantes » qui suivent l’énoncé du théorème.
si ρ = 0.
18C-linéaire
28
MARC CHAPERON
Définition. Un endomorphisme A de E est dit semi-simple lorsque son complexifié
est diagonalisable ; en d’autres termes, la matrice (réelle) de A dans n’importe
quelle base de E est diagonalisable comme matrice complexe.
Corollaire A.14. Sous les hypothèses et avec les notations du théorème A.10 et
de sa démonstration, les propriétés suivantes sont vérifiées :
i) Le polynôme minimal
PA =
Y
(X − λi )mi,1
1≤i≤ρ
=
Y
1≤i≤ρ
Y
(X − λi )mi,1 (X − λ̄i )mi,1
ρ<i≤n
mi,1
(X − λi )
Y
X 2 − 2 <e(λi )X + |λi |2
mi,1
ρ<i≤n
de A est celui de AC .
ii) Il existe un unique endomorphisme semi-simple S et un unique endomorphisme nilpotent N de E tels que A = S + N et SN = N S ; on les appelle
respectivement partie semi-simple et partie nilpotente de A ; le complexifié de
S (resp. N ) est la partie semi-simple (resp. nilpotente) du complexifié de A.
−1
−1
r
c
Les endomorphismes
 respectivement
 P SP et P N P de R×C sont définis
T1 0 0
λ1 Im1 0
0
..
..
par les matrices  0
. 0 .
.
0  et  0
0 0 Tn
0
0 λn Imn
iii) On a E = Eλ1 (A)⊕· · ·⊕Eλn (A), où les sous-espaces caractéristiques Eλj (A)
de A sont donnés par
(
pour 1 ≤ j ≤ ρ,
ker(A − λj IdE )mj,1
Eλj (A) :=
mj,1
2
2
ker (A − 2 <e(λj )A + |λj | IdE )
pour ρ < j ≤ n.
En d’autres termes,
– pour ρ < j ≤ n, Eλj (A) est l’image E ∩ Eλj (AC ) ⊕ Eλ̄j (AC ) de Eλj (AC )
par l’isomorphisme vj 7→ vj + v̄j induit par P0−1
ρ
n
Y
Y
mi
r
c
– pour 1 ≤ j ≤ n, P Eλj (A) ⊂ R ×C =
R ×
Cmi est le facteur
i=1
i=ρ+1
Rmj ou Cmj de ce produit, c’est-à-dire celui qui correspond au j-ième bloc
diagonal de la matrice donnant P AP −1 .
Démonstration Comme A et AC ont la même matrice dans une base de E, ils ont
le même polynôme minimal. En outre, si les matrices ν, σ des parties nilpotente
et semi-simple de AC dans une telle base n’étaient pas réelles, leurs conjuguées
ν̄, σ̄ fourniraient une autre décomposition de Jordan de AC , exclue par unicité ; les
matrices réelles ν, σ sont celles de N, S. Le reste est laissé en exercice.
ÉQUATIONS DIFFÉRENTIELLES, II
29
Annexe B. Application aux équations différentielles linéaires
Corollaire B.1. Sous les hypothèses et avec les notations du théorème A.10, pour
tout réel t,


 tλ1 tT1
x1
e e
0
0
..
  ... 
(9)
P etA P −1 x = 
.
0
0
xr+c
0
0 etλn etTn
 tJ

0
e mi,1 0
X tk 0 Im−k 

tTi
tJ
.
m
..
e = 0
e
= Im +
.
,
0
0
0
k!
tJmi,p
1≤k≤m−1
i
0
0 e
En particulier, pour 1 ≤ j ≤ n,
i) le vecteur
xj,1 ∈ Rr × Cc dont toutes les composantes sont nulles sauf la
P
(1 + 1≤i<j mi )-ième19, égale à 1, vérifie P etA P −1 xj,1 = etλi xj,1
r
c
ii) pour mP
j > 1, le vecteur xj,2 ∈ R × C dont les composantes sont nulles sauf
20
la (2 + 1≤i<j mi )-ième , égale à 1, vérifie P etA P −1 xj,2 = etλi (xj,2 + txj,1 ) .
Démonstration D’après la proposition 1.6, avec les notations du corollaire A.14,
−1
−1
on a etA = etN etS et donc P etA P −1 = etP N P etP SP (en revenant à la définition
de l’exponentielle).
Le résultat suivant est particulièrement utilisé en théorie de la stabilité :
Corollaire B.2. Sous les hypothèses et avec les notations du théorème A.10, soient
C0 := max{− <e z : z ∈ SpecA} et c0 := min{− <e z : z ∈ SpecA}, où SpecA
désigne l’ensemble des valeurs propres de A ; pour c1 < c0 et C0 < C1 , il existe un
produit scalaire euclidien (v, w) 7→ v · w sur E tel que l’on ait
∀v ∈ E
− C1 |v|2 ≤ v · Av ≤ −c1 |v|2
et donc
∀v ∈ E
∀t ≥ 0
e−C1 t |v| ≤ |etA v| ≤ e−c1 t |v|,
pour la norme définie par le produit scalaire considéré.
Démonstration Il suffit de prendre le produit scalaire défini par v·w = (P v)·(P w),
où le produit scalaire sur Rr ×Rc est défini comme suit : pour x = (xi,k )1≤k≤mi ,1≤i≤n
ρ
n
Y
Y
mi
r
c
et y = (yi,k )1≤k≤mi ,1≤i≤n dans R × R =
R ×
Cmi , on a
i=1
x · y = <e
mi
n X
X
i=ρ+1
ε1−k xi,k ȳi,k
i=1 k=1
19Avec
20Avec
les notations du lemme A.13, l’image par P1 du vecteur propre ej,1 .
les notations du lemme A.13, l’image par P1 du vecteur ej,2 .
30
MARC CHAPERON
avec ε > 0 petit. Si x = P v, cela donne
mi
n X
X
v · Sv =
ε1−k <e λi |xi,k |2
i=1 k=1
donc
−C0 |v|2 ≤ v · Sv ≤ −c0 |v|2 ,
de même, le décalage d’indices produit par N sous forme de Jordan donne21
n
n
X
X
X
X
1−k
k
1
1−k
2
(ε 2 |xi,k |) (ε− 2 |xi,k+1 |)
|v · N v| ≤
ε |xi,k | |xi,k+1 | = ε
i=1 1≤k<mi
i=1 1≤k<mi
n
X
X
≤ ε
1
2
1
≤ ε2
ε
1−k
2
|xi,k |
n
21 X
X
i=1 1≤k<mi
n
X X
−k
2
ε |xi,k+1 |
12
i=1 1≤k<mi
1
ε1−k |xi,k |2 = ε 2 |v|2 ,
i=1 1≤k≤mi
et donc finalement, puisque A = S + N ,
1
1
−(C0 + ε 2 )|v|2 ≤ v · Av ≤ −(c0 − ε 2 )|v|2 ,
1
d’où les deux premières inégalités du corollaire pour ε 2 ≤ min{C1 − C0 , c0 − c1 }.
On en déduit les deux dernières inégalités du corollaire de la manière habituelle :
puisque dtd |etA v|2 = 2(etA v) · (AetA v), on a
−2C1 |etA v|2 ≤
d tA 2
|e v| ≤ −2c1 |etA v|2 ,
dt
c’est-à-dire
d 2c1 t tA 2 d 2C1 t tA 2 e |e v| ≤ 0 ≤
e
|e v| ,
dt
dt
donc e2c1 t |etA v|2 ≤ e2c1 0 |e0A v|2 = |v|2 et e2C1 t |etA v|2 ≥ e2C1 0 |e0A v|2 = |v|2 pour
t ≥ 0.
Théorème B.3. Soit A un endomorphisme d’un espace vectoriel réel ou complexe
E de dimension finie.
i) Les trois conditions suivantes sont équivalentes :
a) 0 est un point stationnaire stable du champ de vecteurs linéaire A.
b) L’ensemble {etA : t ≥ 0} est borné.
c) Les parties réelles des valeurs propres λ1 , . . . , λn de A sont ≤ 0 et, lorsque
<e λi = 0, la restriction de A à Eλi (A) est semi-simple.
ii) Les trois conditions suivantes sont équivalentes :
d) 0 est un point stationnaire asymptotiquement stable du champ de vecteurs
linéaire A.
21Grâce
à l’inégalité de Cauchy-Schwartz.
ÉQUATIONS DIFFÉRENTIELLES, II
31
e) On a lim etA = 0.
t→+∞
f ) Les parties réelles des valeurs propres λ1 , . . . , λn de A sont < 0.
Démonstration i) b)⇒a) Une norme | · | étant choisie sur E, la propriété a)
signifie que pour tout ε > 0 il existe δ > 0 tel que, si v ∈ E vérifie |v| < δ, on ait
|etA v| < ε quel que soit t ≥ 0. La propriété b) signifie, L(E, E) étant muni de la
norme d’opérateurs associée à la norme donnée sur E, qu’il existe une constante
C (nécessairement ≥ 1 puisque |e0A | = |IdE | = 1) telle que l’on ait |etA | ≤ C pour
tout t ≥ 0 ; comme on a |etA v| ≤ |etA | |v|, il suffit donc de prendre δ = ε/C.
a)⇒c) Montrons que si c) n’est pas vérifiée, a) ne l’est pas non plus. Si A a une
valeur propre λi à partie réelle > 0 alors, avec les notations du corollaire B.122 la
norme de P etA P −1 xi,1 = etλi xi,1 tend vers l’infini quant t → +∞ ; il en va donc de
δ P −1 xi,1
même de etA P −1 xi,1 ; en particulier, pour tout δ > 0, le vecteur v =
2 |P −1 xi,1 |
tA
vérifie |v| < δ et |e v| ≥ 1 pour t ≥ 0 assez grand, donc a) n’est pas vérifiée.
De même, si A a une valeur propre λi à partie réelle nulle telle que Ti 6= 0 alors,
avec les notations du corollaire B.1 la norme de P etA P −1 xj,2 = etλi (xj,2 + txj,1 ) .
tend vers l’infini quant t → +∞, donc a) n’est pas vérifiée.
c)⇒b) Comme la notion d’ensemble borné est invariante par isomorphisme, il
suffit de montrer que {P etA P −1 : t ≥ 0} est borné, ce qui est à peu près évident :
d’après (9), il s’agit de montrer que chaque {etλi etTi : t ≥ 0} est borné ;
– pour <e λi < 0, c’est évident car lim etλi etTi = 0 puisque etTi est polynômiale
t→+∞
en t et que lim tk etλi = 0 pour tout k ∈ N.
t→+∞
– si <e λi = 0, c’est évident aussi puisque |etλi | = 1 pour tout t ≥ 0 et que
l’hypothèse (c) signifie que etλi etTi = etλi Imi .
ii), tout à fait analogue, est laissé au lecteur.
Références
[1] Marc Chaperon. Calcul différentiel et calcul intégral, Dunod, Paris 2003. Deuxième édition
corrigée et augmentée, 2008, 438 pages plus une trentaine en ligne.
22Une
norme quelconque étant choisie sur Rr × Cc ; comme elles sont toutes équivalentes, le
résultat n’en dépend pas.
Téléchargement