ANALYSE DE HILBERT ET DE FOURIER, IV ET V On désigne par E

publicité
ANALYSE DE HILBERT ET DE FOURIER, IV ET V
MARC CHAPERON
On désigne par E un espace préhilbertien sur K = R ou C. Dans les
deux cas, sa norme est définie par le produit scalaire réel
v · w := <ehv|wi.
Celui-ci vérifie « les » identités remarquables (a + b)2 = a2 + 2ab + b2 et
(a−b)2 = a2 −2ab+b2 donc, par addition, (a+b)2 +(a−b)2 = 2a2 +2b2 ;
en divisant le tout par 4, on obtient l’identité de la médiane1
(22)
∀v, w ∈ E
v + w 2 v − w 2 |v|2 + |w|2
.
+
=
2
2
2
12. Le théorème de projection sur un convexe complet
Une partie C d’un espace vectoriel réel est dite convexe lorsque, quels
que soient a, b ∈ C, le segment fermé
[a, b] := {a + t(b − a) : t ∈ [0, 1]} = {(1 − t)a + tb : t ∈ [0, 1]}
est contenu dans C. Par exemple, tout sous-espace vectoriel est convexe.
Proposition et définition. Pour tout convexe C de E, tout a ∈ E et
tout x̄ ∈ C, les deux propriétés suivantes sont équivalentes :
(23)
(24)
∀x ∈ C
<eha − x̄|x − x̄i ≤ 0
|x̄ − a| = inf |x − a| =: d(x, a).
x∈C
Elles sont satisfaites par au plus un x̄ ∈ C ; s’il existe, on l’appelle
projection de a sur C et nous le noterons πC (a).
Date: 22 février au 15 mars 2013.
1Dans un triangle (ici 0uv), la somme du carré de la longueur d’une médiane et
du carré de la moitié de la longueur du côté auquel elle aboutit est la moyenne des
carrés des longueurs des deux autres côtés.
34
ANALYSE DE HILBERT ET DE FOURIER, IV ET V
35
Démonstration. Si x̄ ∈ C vérifie (23), autrement dit (x− x̄)·(a− x̄) ≤ 0
quel que soit x ∈ C, on a
|x − a|2 = |x − x̄ + x̄ − a|2 = |x − x̄|2 + 2(x − x̄) · (x̄ − a) + |x̄ − a|2
(25)
≥ |x − x̄|2 + |x̄ − a|2
≥ |x̄ − a|2 pour tout x ∈ C,
c’est-à-dire (24).
Réciproquement, si (24) est satisfaite alors, pour tout x ∈ C, le
segment [x̄, x] est contenu dans C, d’où
2
d(a, C)2 ≤ |tx + (1 − t)x̄ − a|2 = x̄ − a + t x − x̄ =
≤ |x̄ − a|2 + 2t(x̄ − a) · (x − x̄) + t2 |x − x̄|2 =
≤ d(a, C)2 + 2t(x̄ − a) · (x − x̄) + t2 |x − x̄|2
pour tout t ∈ [0, 1], donc 2(x̄ − a) · (x − x̄) + t|x − x̄|2 ≥ 0 pour 0 < t ≤ 1
et par conséquent (x̄ − a) · (x − x̄) ≥ 0, c’est-à-dire (23) ; d’après (25),
l’inégalité |x − a| ≥ |x̄ − a| est donc stricte pour x 6= x̄, d’où l’unicité.
Exemple. Si C est un intervalle réel [b, c[, alors πC (a) n’existe que pour
a < c ; on a πC (a) = a pour a ∈ C et πC (a) = b pour a ≤ b.
Théorème. Si C est un convexe complet non vide de l’espace préhilbertien E, alors
i) la projection πC (a) ∈ C existe pour tout a ∈ E
ii) l’application πC : E → C ainsi définie est lipschitzienne, de
constante de Lipschitz égale à 1 dès que C contient plus d’un
point2.
Démonstration. i) Par définition (24) de d(a, C), on a d(a, C) ∈ R+
et, pour tout n ∈ N, il existe xn ∈ C tel que l’on ait |xn − a| ∈
[d(a, C), d(a, C) + 2−n ], de sorte que la suite (|xn − a|)n∈N converge vers
d(a, C).
Lemme. Une telle suite minimisante (xn )n∈N dans C est de Cauchy.
L’existence de πC (a) en résulte aussitôt : comme C est complet, la
suite de Cauchy (xn ) converge vers un x̄ ∈ C, qui vérifie donc
d(a, C) ≤ |x̄ − a| = lim |xn − a| ≤ lim d(a, C) + 2−n = d(a, C),
n→∞
c’est-à-dire |x̄ − a| = d(a, C).
2Et
à 0 sinon.
n→∞
36
MARC CHAPERON
Preuve du lemme. Pour n, p ∈ N, l’identité de la médiane, appliquée à
v = xn − a et w = xn+p − a, donne
1
2 1
2 |x − a|2 + |x
2
n
n+p − a|
;
(xn + xn+p ) − a + (xn − xn+p ) =
2
2
2
et donc, puisque 21 (xn + xn+p ) appartient à C,
1
2 |x − a|2 + |x
2
n
n+p − a|
d(a, C)2 + (xn − xn+p ) ≤
;
2
2
comme lim |xn − a| = d(a, C), on a lim |xn − a|2 = d(a, C)2 ; pour tout
2
ε > 0, il existe donc nε ∈ N tel que l’on ait |xn − a|2 < d(a, C)2 + ε4
pour n ≥ nε ; quels que soient n ≥ nε et p ∈ N, on en déduit
2
1
|xn − a|2 + |xn+p − a|2
d(a, C)2 + (xn − xn+p ) ≤
2
2
ε2
< d(a, C)2 + ,
4
c’est-à-dire |xn − xn+p | < ε.
ii) Si x̄ = πC (a) et ȳ = πC (b), on a
|b − a|2 = |ȳ − x̄ + b − ȳ + x̄ − a|2
= |ȳ − x̄|2 + 2(ȳ − x̄) · (b − ȳ + x̄ − a) + |b − ȳ + x̄ − a|2
≥ |x̄ − ȳ|2
car (23) et son analogue pour b, ȳ donnent
(ȳ − x̄) · (b − ȳ + x̄ − a) = (ȳ − x̄) · (b − ȳ) + (ȳ − x̄) · (x̄ − a) ≥ 0;
on a donc |πC (b) − πC (a)| ≤ |b − a|, d’où Lip πC ≤ 1 ; si C contient
deux points distincts ā et b̄, alors Lip πC = 1 puisque πC (ā) = ā et
πC (b̄) = b̄.
Corollaire 0. Si C est un convexe fermé non vide d’un espace de
Hilbert E, alors la projection πC (a) ∈ C existe pour tout a ∈ E, ce qui
définit une application πC : E → C de constante de Lipschitz 1 si C
contient plus d’un point.
Démonstration. Un espace de Hilbert est par définition un espace préhilbertien complet, dont les parties fermées sont donc complètes.
Corollaire 1. Si F est un sous-espace vectoriel complet de l’espace
préhilbertien3 E, alors la projection orthogonale πF (a) ∈ F de a sur F
existe pour tout a ∈ E, et (23) s’écrit
(26)
3C’est-à-dire
∀v ∈ F
hv|a − πF (a)i = 0.
un sous-espace vectoriel fermé si E est un espace de Hilbert.
ANALYSE DE HILBERT ET DE FOURIER, IV ET V
37
Démonstration. Un sous-espace vectoriel étant convexe, il s’agit simplement de montrer que (23) se traduit par (26) ; comme F est un
sous-espace vectoriel et contient πF (a), l’ensemble des x − πF (a) avec
x ∈ F est exactement F , donc (23) s’écrit
∀v ∈ F
<ehv|a − πF (a)i ≤ 0;
pour tout v ∈ F , on a −v ∈ F et donc <eh−v|a − πF (a)i ≤ 0, c’est-àdire <ehv|a − πF (a)i ≥ 0, d’où finalement
∀v ∈ F
<ehv|a − πF (a)i = 0;
si K = R, c’est (26) ; sinon, pour tout v ∈ F , on a −iv ∈ F et donc
<eh−iv|a − πF (a)i = 0, c’est-à-dire =mhv|a − πF (a)i = 0, d’où (26).
Corollaire 2. Sous les hypothèses du corollaire 1,
i) la projection orthogonale πF : E → F est linéaire et continue, de
norme 1 pour F 6= {0} ;
ii) son noyau est un sous-espace fermé, l’ orthogonal
F ⊥ := {a ∈ F : ∀v ∈ F hv|ai = 0};
de F , et
E = F ⊕ F ⊥;
(27)
iii) l’orthogonal F ⊥⊥ de F ⊥ est F lui-même, et l’isomorphisme
(v, w) 7→ v + w
F × F⊥ → E
est une isométrie si l’on munit F × F ⊥ de son produit scalaire
d’espace préhilbertien produit4, défini par
h(v, w)|(v 0 , w0 )i := hv|v 0 i + hw|w0 i;
l’isométrie inverse est a 7→ πF (a), πF ⊥ (a) = πF (a), a − πF (a) .
Démonstration. i)-ii) La caractérisation (26) de la projection orthogonale sur F entraı̂ne les faits suivants :
– la projection πF est linéaire : en effet, quels que soient a, b ∈ E et
λ ∈ K, on a pour tout v ∈ F
hv|πF (a) + λπF (b) − (a + λb)i = hv|πF (a) − ai + λ̄hv|πF (b) − bi = 0;
– en prenant πF (a) = 0 dans (26), on voit que ker πF = F ⊥ ;
– pour tout v ∈ F , le seul vecteur v̄ ∈ F tel que v − v̄ ∈ F ⊥ est
πF (v), ce qui prouve (27).
4Qui
définit une norme équivalente à la norme d’espace produit.
38
MARC CHAPERON
Comme πF est linéaire et lipschitzienne, elle est continue et |πF | =
Lip πF = 1 pour F 6= {0}.
iii) Pour v, v 0 ∈ F et w, w0 ∈ F ⊥ ,
hv + w|v 0 + w0 i = hv|v 0 i + hw|v 0 i + hv|w0 i + hw|w0 i
= hv|v 0 i + hw|w0 i
puisque hw|v 0 i = hv|w0 i = 0.
13. Dualité
L’isométrie canonique de E dans son dual. Pour tout v ∈ E, on
définit un élément v[ du dual5 E 0 := L(E, K) de E par
∀x ∈ E
v[ (x) := hx|vi.
L’application v 7→ v[ est une isométrie de E dans E 0 , semi-linéaire
(c’est-à-dire que (v + λw)[ = v[ + λ̄w[ pour v, w ∈ E et λ ∈ K)6.
Démonstration. Pour tout v ∈ E, la linéarité du produit scalaire par
rapport à son premier facteur entraı̂ne que v[ est une application linéaire
bien définie de E dans K (« forme linéaire ») ; l’inégalité de CauchySchwartz s’écrivant |v[ (x)| ≤ |v| |x|, cette forme linéaire est continue, de
norme au plus |v| ; en prenant x = v pour v 6= 0, on voit que |v[ | = |v|
et donc |v[ − w[ | = |(v − w)[ | = |v − w| quels que soient v, w ∈ E, ce
qui prouve que v 7→ v[ est une isométrie ; elle est semi-linéaire car le
produit scalaire est semi-linéaire par rapport à son second facteur.
Théorème (Riesz). Si E est un espace de Hilbert, l’isométrie canonique v 7→ v[ de E dans son dual est bijective.
Démonstration. Un isométrie étant forcément injective, il s’agit de
montrer qu’elle est surjective. Étant donnée p ∈ E 0 r {0}, son noyau
H est un sous-espace fermé qui n’est pas E tout entier, donc a un
supplémentaire orthogonal H ⊥ 6= {0} ; il y a donc un u ∈ H ⊥ de
norme 1, qui vérifie u 6∈ H, c’est-à-dire p(u) 6= 0 ; pour tout x ∈ E, on
p(x)
p(x)
a donc p(x) = p p(u)
u , d’où par linéarité x − p(u)
u ∈ ker p = H ; il en
⊥
résulte que H = Ku et que la projection orthogonale hx|uiu de x sur
p(x)
u, d’où p(x) = hx|uip(u) et donc p = v[ avec v = p(u)u.
Ku est p(u)
5Espace
vectoriel des formes linéaires continues sur E ; on le munit de la norme
habituelle |p| := sup{p(v) : v ∈ E, |v| = 1}, qui en fait un espace de Banach.
La notation musicale est un hommage à Einstein, qui notait les coordonnées d’un
vecteur v avec des indices supérieurs et celles d’un « covecteur » p avec des indices
inférieurs : l’application v 7→ v[ fait donc « descendre les indices ».
6Si K = R, elle est donc linéaire.
ANALYSE DE HILBERT ET DE FOURIER, IV ET V
39
Corollaire 1. Si E est un espace de Hilbert, il est réflexif, c’est-à-dire
que l’ isométrie canonique
I
v 7−→ E 0 3 p 7→ p(v)
E
→
(E 0 )0 =: E 00
est un isomorphisme.
Démonstration. Les p ∈ E 0 étant linéaires, I est une application linéaire
de E dans l’espace vectoriel des formes linéaires sur E 0 ; de l’inégalité
|p(v)| ≤ |p| |v|, on déduit que l’on a I(E) ⊂ E 00 et |I(v)| ≤ |v|, c’està-dire que I est continue, de norme au plus 1 ; en prenant p = v[ pour
v 6= 0, on voit que I est une isométrie7. Montrons qu’elle est surjective,
c’est-à-dire que pour tout ξ ∈ E 00 , il existe v ∈ E tel que ξ(p) = p(v)
pour tout p ∈ E 0 ; d’après le théorème de Riesz les p ∈ E 0 sont exactement les w[ avec w ∈ E, donc il s’agit de prouver qu’il existe v ∈ E
tel que, pour tout w ∈ E, on ait ξ(w[ ) = hv|wi, autrement dit ξ(w[ ) =
hw|vi ; or, l’application w 7→ ξ(w[ ) est une forme linéaire continue sur
E (la linéarité vient de l’antilinéarité
de w 7→ w[ et de la linéarité de
ξ, la continuité de l’inégalité ξ(w[ )| = |ξ(w[ )| ≤ |ξ| |w[ | = |ξ| |w|) ;
d’après le théorème de Riesz, il existe donc bien un unique v ∈ E tel
que ξ(w[ ) = hw|vi pour tout w ∈ E.
Corollaire 2. Pour tout espace préhilbertien E,
i) l’image de l’isométrie canonique v 7→ v[ de E dans son dual est
dense dans E 0
ii) l’image de l’isométrie canonique I de E dans son bidual est dense
dans E 00 .
Démonstration. Si E est complet, ce sont les deux résultats précédents.
Sinon, rappelons que E, comme tout espace normé, a un complété,
c’est-à-dire un espace de Banach Ê dans lequel E est dense et tel que
la restriction à E de la norme de Ê soit la norme initiale8. Étant donné
un tel complété, on utilise alors le très important résultat suivant :
7C’est
vrai pour un espace normé E quelconque : voir les exercices.
peut soit le définir « abstraitement » comme le quotient de l’espace des suites
de Cauchy à valeurs dans E (qui forment un sous-espace vectoriel de `∞ (N, E))
par le sous-espace c0 (N, E) formé des suites convergeant vers 0 dans E, soit,
plus simplement, prendre pour Ê l’adhérence de I(E) dans l’espace de Banach
E 00 , en considérant I comme une identification—même dans la définition « abstraite », on plonge E dans Ê comme ensemble des classes modulo c0 (N, E) de suites
constantes ; l’essentiel est que, d’après le lemme ci-dessus, chacun de ces complétés
soit isométrique à chacun des autres par une isométrie égale à l’identité sur E.
8On
40
MARC CHAPERON
Lemme 1. Toute application linéaire continue L de E dans un espace
de Banach F se prolonge en une unique application continue L̂ de Ê
dans F , qui est linéaire, de même norme que L.
Preuve. Pour tout x̄ ∈ Ê, il existe une suite (xn )n∈N dans E qui
converge vers x̄ ; comme c’est une suite de Cauchy,
l’inégalité |L(xn+p )−
L(xn )| ≤ |L| |xn+p −xn | montre que L(xn ) n∈N est une suite de Cauchy
dans l’espace complet F , donc converge vers une limite ȳ ∈ F ; cette
limite est la même quel que soit le choix de la suite (xn )n∈N dans E
0
convergeant vers x̄ : si (x0n )n∈N en est une autre,
on a lim(xn − x0 n ) = 0
0
0
et donc lim L(xn − xn ) = lim L(xn ) − L(xn ) = 0, d’où lim L(xn ) = ȳ.
Bref, l’unique L̂ possible est bien défini par la formule
L̂(lim xn ) = lim L(xn ) si (xn )n∈N ∈ E N converge dans Ê.
et c’est bien un prolongement de L puisque, L étant continue, L(lim xn ) =
lim L(xn ) lorsque xn converge dans E. La linéarité de L̂ vient de ce que
L̂(lim xn + λ lim x0n ) = = L̂ lim(xn + λx0n ) = lim L(xn + λx0n )
= lim L(xn ) + λL(x0n )
= lim L(xn ) + λ lim L(x0n )
= L̂(lim xn ) + λL̂(lim x0n ).
pour λ ∈ K si (xn )n∈N , (x0n )n∈N ∈ E N convergent dans Ê. Finalement,
L̂ est continue, de même norme que L, puisqu’on a
|L̂(lim xn )| = lim |L(xn )| ≤ lim |L| |xn | = |L| lim |xn | = |L| | lim xn |. Lemme 2. Le complété Ê est un espace de Hilbert dont le produit
scalaire prolonge celui de E.
Preuve. Le lemme 1, appliqué pour chaque w ∈ E à la forme linéaire
continue w[ : v 7→ hv|wi sur E, permet d’étendre le produit scalaire en
une forme sesquilinéaire h·|·i sur Ê × E vérifiant |hv|wi| ≤ |v| |w| ; en
appliquant alors le lemme 1 à la forme linéaire continue w 7→ hv|wi sur
E pour chaque v ∈ Ê, on obtient un produit scalaire hermitien continu
sur Ê prolongeant celui de E et définissant donc la norme de Ê.
Fin de la démonstration. i) D’après le lemme 1, toute forme linéaire
continue p sur E a une unique extension à Ê, de même norme ; comme
tout p̂ ∈ Ê 0 est l’extension de p := p̂|E , on peut donc affirmer que
Ê 0 = E 0 ; par suite, l’isométrie canonique v 7→ v[ de E dans E 0 se
prolonge par l’isométrie canonique de Ê sur Ê 0 = E 0 , donc a une
image dense car E est dense dans Ê.
ANALYSE DE HILBERT ET DE FOURIER, IV ET V
41
ii) Puisque Ê 0 = E 0 , on a Ê 00 = E 00 ; par conséquent, l’isométrie
canonique I de E dans E 00 se prolonge par l’isométrie canonique de Ê
sur Ê 00 = E 00 , donc a une image dense.
14. Intermède : l’équation de la chaleur
On cherche les fonctions complexes u(t, x) « assez dérivables » sur
R+ ×R, de période 1 par rapport à la variable x, satisfaisant à l’équation
de la chaleur
∂ 2u
∂u
=
(28)
∂t
∂x2
et telles que u0 : x 7→ u(0, x) soit une fonction donnée. L’idée de Fourier
est de développer u en série de Fourier de la variable x,
X
u(t, x) =
ûm (t)e2πimx ,
m∈Z
de remarquer que (si tout va bien) les dérivées partielles intervenant
dans l’équation s’obtiennent par dérivation terme à terme :
X
∂u
û0m (t)e2πimx
(t, x) =
∂t
m∈Z
X
∂ 2u
−4π 2 m2 ûm (t)e2πimx ,
(t,
x)
=
∂x2
m∈Z
d’écrire donc (28) sous la forme
X
û0m (t) + 4π 2 m2 ûm (t) e2πimx = 0,
m∈Z
de remarquer que (si tout va bien) cela équivaut aux équations différentielles
û0m (t) + 4π 2 m2 ûm (t) = 0, m ∈ Z
et de les résoudre, ce qui donne
ûm (t) = ûm (0)e−4π
2 m2 t
,
m ∈ Z,
où les ûm (0) sont les coefficients de Fourier de la donnée initiale u0 .
Il reste à vérifier que la formule
X
2 2
u(t, x) =
ûm (0)e−4π m t+2πimx
m∈Z
ainsi obtenue définit bien une solution du problème et que c’est la seule,
ce qui nécessitera d’en savoir un peu plus sur les séries de Fourier.
Téléchargement