ANALYSE DE HILBERT ET DE FOURIER, VI 15. Interm`ede (suite

publicité
ANALYSE DE HILBERT ET DE FOURIER, VI
MARC CHAPERON
15. Intermède (suite) : espaces de Sobolev sur le cercle
Appelons série de Fourier toute famille (am em )m∈Z de « monômes
trigonométriques
», où les am sont des constantes complexes, et notonsP
la
am em .
P
Proposition. Pour tout s > 1/2, si la série de Fourier
am em vérifie
X
(29)
(1 + m2 )s |am |2 < ∞
m∈Z
alors elle est normalement sommable dans C(T) et a donc une somme
f ∈ C(T) telle que fc
m = am pour tout m ∈ Z.
s
Démonstration. La famille u = (um )m∈Z définie par um := (1+m2 ) 2 |am |
appartient à `2 (Z) ; il en va X
de même de laX
famille v = (vm )m∈Z donnée
2
2 − 2s
(1 + n2 )−s < ∞ ; comme
par vm := (1 + m ) car
|vm | = 2
n∈N
m∈Z
|am | = um v̄m pour tout m, on a donc
X
|am | = hu|vi2 ≤ |u|2 |v|2 < ∞ ,
m∈Z
d’où l’uniforme sommabilité puisque |am em |∞ = |am |.
L’identité fc
m = am s’obtient donc immédiatement en appliquant à
la suite (a−n e−n + · · · + an en )n∈N le
Lemme. Si une suite (g n ) converge uniformément vers f dans C(T),
n
c
alors fc
m = lim g
m pour tout m ∈ Z.
n→∞
n
c
Preuve. On a |fc
m−g
m| ≤
R1
0
|f (t) − g n (t)| dt = |f − g n |1 ≤ |f − g n |∞ .1
Date: 15 et 22 mars 2013.
1On voit donc que l’on peut remplacer la convergence uniforme par la convergence L1 , ce qui améliore le lemme.
42
ANALYSE DE HILBERT ET DE FOURIER, VI
43
Espaces
de Sobolev. Pour tout réel s, l’ensemble des séries de Fourier
P
am em vérifiantP(29) est l’espace de Sobolev
H s (T).
s
L’application
am em 7→ (1 + m2 ) 2 am m∈Z étant une bijection de
s
H s (T) sur `2 (Z), on
que HP
(T) est unPespace vectoriel si l’on pose
P voit m
(comme de juste)
am e + λ bm em = (am + λbm )em pour λ ∈ C,
ce qui fait de la bijection précédente un isomorphisme d’espaces vectoriels complexes ; l’image réciproque du produit scalaire `2 par cet isomorphisme est un produit scalaire hermitien sur H s (T) appelé produit
scalaire H s et donné par
X
P
P
hf |giH s =
(1 + |m|2 )s am bm pour f = am em et g = bm em ;
m∈Z
l’isomorphisme précédent étant par définition une isométrie de l’espace
préhilbertien H s (T) sur l’espace de Hilbert `2 (Z), on voit que H s (T),
muni du produit scalaire H s , est un espace de Hilbert2.
s
Pour s > 1/2, d’après la proposition précédente, HP
(T) s’identifie à
un sous-espace de C(T), la notation « formelle » f = am em pouvant
alors désigner la somme de la famille absolument sommable (am em )m∈Z
dans C(T) ; cela se généralise ainsi :
Théorème. Pour tout entier k ≥ 0, soit C k (T) l’espace vectoriel des
fonctions complexes d’une variable réelle périodiques de période 1 et de
classe C k . Quel que soit s > 1/2, on a H s+k (T) ⊂ C k (T) ⊂ H k (T), la
première inclusion au sens que nous venons de définir, la seconde par
l’identification de chaque f ∈ C k (T) à sa série de Fourier3.
Démonstration. L’inclusion C k (T) ⊂ H k (T) va résulter de l’important
Scolie . Quelle que soit f ∈ C 1 (T), la série de Fourier de f 0 est
obtenue par dérivation terme à terme de celle de f , c’est-à-dire que
0
c
fc
m = 2πimfm pour tout m ∈ Z.
Preuve. Simple intégration par parties :
Z 1
Z 1
t=1
−2πimt 0
−2πimt
0
c
fm =
e
f (t) dt = e
f (t) t=0 −
−2πim e−2πimt f (t) dt
0
0
Z 1
= 2πim
e−2πimt f (t) dt = 2πimfc
m
0
−2πimt
puisque e
2Si
t=1
f (t)]t=0 = f (1) − f (0) = 0.
s = 0, il s’appelle L2 (T) et la théorie de l’intégrale de Lebesgue montre qu’il
est formé de classes de fonctions mesurables.
3Le problème ne se pose que si k = 0, où l’inclusion résulte de l’identité de
Bessel-Parseval ; pour k ≥ 1 et f ∈ C k (T), en effet, la série de Fourier de f converge
normalement vers f d’après l’inclusion C k (T) ⊂ H k (T) et la proposition précédente.
44
MARC CHAPERON
d
(k)
(k)
est continue,
Pour f ∈ C k (T), on a donc fm = (2πim)k fc
m ; comme f
P
(k) 2
2 k
2k c 2
on a |f |2 = (4π )
m |fm | < ∞ (Bessel-Parseval) d’où4
X
X (1 + m2 )k
2
2
2
b
(1 + m2 )k |fc
|
=
|
f
|
+
m2k |fc
m
0
m|
2k
m
m∈Z
m∈Z∗
X
2
≤ |fb0 |2 + 2k
m2k |fc
m | < ∞,
m∈Z
k
c’est-à-dire f ∈ H (T), ce qui prouve l’inclusion C k (T) ⊂ H k (T).
Étant donnée f ∈ H s+k (T) avec s > 1/2, le même calcul montre que,
P
m (j)
pour tout j ∈ N, la série de Fourier (fc
obtenue en dérivant j
me )
fois terme à terme la série de Fourier de f appartient à H s+k−j (T) ; pour
0 ≤ j ≤ k, elle est donc normalement sommable dans C(T) d’après la
proposition
précédente car on a s + k − j > 1/2, ; en particulier, la suite
(Sn f )(j) n∈N converge uniformément pour 0 ≤ j ≤ k, donc la suite
(Sn f )n∈N converge au sens C k (annexe F, p. 50) ; par conséquent, sa
limite f appartient à C k (T), ce qui prouve l’inclusion H s+k (T) ⊂ C k (T).
Corollaire. L’intersection de tous les
H s (T) avec s > 1/2 est égale à
P
C ∞ (T), qui est donc l’ensemble des
am em telles que
∀α > 0
lim |m|α am = 0 .
|m|→∞
La démonstration est laissée en exercice.
16. Application à l’équation de la chaleur
Rappelons qu’il s’agit de résoudre le problème de Cauchy
(
2
∂u
= ∂∂xu2
∂t
(30)
u(0, x) = u0 (x),
c’est-à-dire de trouver une fonction complexe u des variables t ∈ R+ et
x ∈ R, de période 1 par rapport à x et égale à une fonction donnée u0
pour t = 0.
Théorème. Si u0 ∈ H s (T) avec s > 25 , le problème (30) a une solution,
donnée par
X
2 2
(31)
u(t, x) =
ûm (0)e−4π m t+2πimx ,
m∈Z
où les nombres complexes ûm (0) sont les coefficients de Fourier de la
donnée initiale u0 . La solution u est C ∞ dans R∗+ × R et la fonction
4Puisque
supm∈Z∗
(1+m2 )k
m2k
= supn≥1 ( n12 + 1)k = 2k .
ANALYSE DE HILBERT ET DE FOURIER, VI
45
ut : x 7→ u(t, x) converge au sens C ∞ vers la constante û0 (0) quand
t → +∞. Plus précisément, u(t, x) converge uniformément vers û0 (0)
et ses dérivées partielles ∂ α u avec |α|1 > 0 vers 0 quand t → +∞.
La démonstration est laissée en exercice (lire l’annexe G). En fait, le
résultat vaut (au sens des distributions) pour toute distribution5 u0 et
(31) en définit, nous le verrons, l’unique solution.
17. Existence de bases hilbertiennes
Théorème. Tout espace de Hilbert E a des bases hilbertiennes.
Démonstration. Soit B l’ensemble des familles orthonormales B ⊂ E,
ordonné par inclusion.
Lemme. Cet ordre est inductif : B est non vide et toute partie A de
B totalement ordonnée par inclusion possède un majorant.
Preuve. L’ensemble B est non vide puiqu’il contient l’ensemble vide !
Si A ⊂ B est totalement ordonnée par inclusion, la réunion BA de tous
les B ∈ A est une famille orthonormale : en effet, tout v ∈ BA est
évidemment de norme 1 puisqu’il appartient à un B ∈ A ; tout vecteur
w ∈ BA r {v} est aussi de norme 1 car il appartient à un B 0 ∈ A ;
en outre, l’ensemble A étant totalement ordonné par inclusion, on a
B ⊂ B 0 ou B 0 ⊂ B ; les vecteurs v, w appartiennent donc à un même
élément de A, ce qui implique qu’ils sont orthogonaux et prouve que
BA est une famille orthonormale ; c’est le majorant cherché puisqu’elle
contient par définition tous les B ∈ A.
Il résulte donc du lemme de Zorn que B possède un élément Bmax
maximal pour l’inclusion. Si le sous-espace EBmax engendré par Bmax
n’était pas dense dans E, son adhérence EBmax serait un sous-espace
strict de E, donc son orthogonal serait non trivial ; ledit orthogonal
contiendrait donc un vecteur u de norme 1, orthogonal à EBmax et en
particulier à tous les éléments de Bmax ; par conséquent, Bmax ∪ {u}
serait une famille orthonormale et Bmax ne serait pas maximale. Il en
résulte bien que Bmax est une base hilbertienne.
Remarque. Cet argument de « récurrence transfinie » donne lorsque
E est de dimension finie n une preuve légèrement différente du théorème
5Annexe
H, hors programme mais instructive.
46
MARC CHAPERON
p. 6 : on considère une famille B = {u1 , . . . , up } orthonormale—c’està-dire vérifiant (5)—dont le nombre d’éléments p est maximal6, et l’argument qui termine la preuve ci-dessus montre que le sous-espace EB
engendré par B est forcément E tout entier.
Le lemme de Zorn repose sur une version assez forte de l’axiome du
choix que certains mathématiciens, ayant peur que le ciel leur tombe
sur la tête, répugnent à utiliser. Nous y reviendrons dans le cas de loin
le plus courant, celui des espaces séparables.
Annexe E. Intégrale des fonctions continues7
On se donne un intervalle compact I = [a, b] avec a < b, un espace de
Banach E, et l’on note S = S(I, E) le sous-espace vectoriel (exercice8)
de `∞ (I, E) formé des fonctions en escalier, définies comme suit : on
a f ∈ S si et seulement s’il existe k ∈ N, a0 , · · · , ak+1 ∈ I avec a =
a0 ≤ · · · ≤ ak+1 = b et v0 , · · · , vk ∈ E tels que f (t) = vj pour tout
t ∈]aj , aj+1 [ et tout j ∈ {0, · · · , k}.
Etant donné un tel f , son intégrale de a à b
Z b
k
X
f (t) dt =
(aj+1 − aj ) vj ∈ E
a
j=0
ne dépend que de f , et non du choix d’une « subdivision » (a0 , · · · , ak+1 )
de I : le résultat sera le même pour toute autre subdivision (a00 , · · · , a0k0 +1 )
telle que f soit constante sur chaque ]a0j , a0j+1 [ (exercice).
Rb
L’application J : S → E donnée par J (f ) = a f (t) dt est lineaire
(autre exercice) ; en outre, elle vérifie
Z b
Z b
≤
(32)
|f (t)| dt ≤ (b − a) |f |∞
f
(t)
dt
a
a
et est donc continue de S muni de la norme L∞ dans E.
Les fonctions en escalier présentent un intérêt limité, mais nous allons
exploiter le fait que S n’est pas fermé pour la norme L∞ :
6Ce
qui a un sens car B est un système libre, d’où p ≤ n.
7On fait ici à la fois beaucoup moins que dans la théorie de l’intégrale de Lebesgue
et un peu plus, les fonctions considérées étant à valeurs dans un espace de Banach.
8L’idée-clé de presque toutes les démonstrations concernant les fonctions en escalier est la suivante : si f ∈ S (resp. g ∈ S) est constante sur les intervalles ouverts
entre deux points successifs d’une subdivision (a0 , · · · , ak+1 ) (resp. (b0 , · · · , bm+1 ))
de I, alors f et g sont constantes sur les intervalles ouverts entre deux points
successifs de la subdivision dont les points sont les ai et les bj .
ANALYSE DE HILBERT ET DE FOURIER, VI
47
Lemme. Toute f ∈ C(I, E) est la limite uniforme d’une suite (fn ) à
valeurs dans S(I, E). Si E = R et que f est positive, les fn peuvent
être choisies positives.
Démonstration. Par continuité uniforme de f (annexe D p. 33), pour
tout n ∈ N, il existe kn ∈ N tel qu’on ait |f (t) − f (s)| ≤ 2−n pour |t −
(n)
(n)
s| ≤ (b−a)2−kn et l’on peut supposer (kn ) croissante. Soit (a0 , · · · , a2kn )
(n)
la subdivision de I définie par aj = a + j(b − a)2−kn ; si l’on définit
(n)
(n) (n)
fn ∈ S par fn (b) = f (b) et fn (t) = f (aj ) pour tout t ∈ [aj , aj+1 [ et
(n) (n)
tout j, on voit que |fn − f |∞ ≤ 2−n puisque chaque [aj , aj+1 ] est de
longueur (b − a)2−kn . La suite (fn ) converge donc uniformément vers
f . Si f est positive, les fn aussi.
Proposition et définition . Etant donnée f ∈ C(I, E), pour toute
suite (fn ) dans S qui converge uniformément vers f , la suite (J (fn ))
Rb
tend vers le même élément J (f ) = a f (t) dt de E, appelé l’ intégrale
de a à b de f . L’intégrale J : C(I, E) → E ainsi définie est linéaire et
continue, de norme b − a.
Démonstration. D’après le lemme précédent, l’adhérence S ⊂ `∞ (I, E)
de S contient C(I, E). Il suffit d’appliquer le lemme 1 p. 419, en y remplaçant E par S, Ê par S et L par J , qui est continue et de norme
b − a d’après (32)10.
Etant donnée f dans S(I, E) (resp. C(I, E)), sa restriction à un
intervalle compact J = [c, d] ⊂ I appartient à S(J, E) (resp. C(J, E)),
Rd
et l’intégrale de c à d de ladite restriction est notée c f (t) dt. On note
Rc
Rc
Rd
f (t) dt = 0 et d f (t) dt = − c f (t) dt.
c
Proposition. L’intégrale des fonctions continues vérifie (32) et possède
les propriétés suivantes :
i) Pour a ≤ c ≤ b,
Z b
Z c
Z b
(33)
f (t) dt =
f (t) dt +
f (t) dt .
a
a
c
Rb
ii) Si E = R et que f ∈ C(I, R) est positive,on a a f (t) dt ≥ 0, avec
égalité si et seulement si f est identiquement nulle.
iii) On définit une norme f 7→ |f |1 sur C(I, E), la norme L1 , par
Rb
|f |1 = a |f (t)| dt ; elle vérifie |f |1 ≤ (b − a)|f |∞ d’après (32).
9Qui
10On
n’utilise absolument pas le fait que E est un espace de Hilbert.
voit qu’elle est de norme exactement b−a en prenant pour f une constante.
48
MARC CHAPERON
Démonstration. Étant donnée une suite
(fn ) dans S tendant uniformé
ment vers f ∈ C(I, E), l’inégalité |f (t)| − |fn (t)| ≤ |f (t) − fn (t)|
entraı̂ne que la suite des fonctions en escalier t 7→ |fn (t)| converge
uniformément vers t 7→ |f (t)| ; on déduit donc (32) dans C(I, E) de
(32) dans S(I, E). On procède de même pour (33).
ii) D’après le lemme, f est la limite uniforme d’une suite (fn ) de
fonctions en escalier positives,
dont l’intégrale est positive ; la limite
J (f ) de la suite J (fn ) est donc bien positive. Comme I est compact
et f continue, il existe α ∈ I tel qu’on ait f (t) ≤ f (α) = M pour
tout t ∈ I, et l’on a M ≥ 0, avec égalité si et seulement si f est
identiquement nulle. Si l’on suppose f 6= 0, la continuité de f au point
α entraı̂ne l’existence d’un intervalle fermé J = [c, d] ⊂ I contenant α
tel qu’on ait c < d et f (t) ≥ M/2 > 0 pour tout t ∈ J, d’où
Z
b
Z
c
f (t) dt =
a
d
Z
Z
f (t) dt +
a
Z
f (t) dt +
c
d
d
Z
c
f (t) dt
d
f (t) dt ≥
≥
b
c
M
M (d − c)
dt =
> 0.
2
2
iii) L’inégalité triangulaire est laissée en exercice. Pour voir que
|f |1 = 0 entraı̂ne f = 0 lorsque f est continue11, il suffit d’appliquer
(ii) à la fonction continue t 7→ |f (t)|.
Annexe F. Le théorème fondamental du calcul
infinitésimal et quelques conséquences
Théorème fondamental du calcul infinitésimal. Soient I un intervalle et E un espace normé complet.
Rt
i) Pour g ∈ C(I, E) et a ∈ I, l’application G : t 7→ a g(s) ds est de
classe C 1 et a pour dérivée g.
ii) Si f ∈ C(I, E) est de classe C 1 alors, quels que soient a, b ∈ I,
Z
f (b) − f (a) =
b
f 0 (t) dt .
a
11C’est
évidemment faux dans S, une fonction en escalier pouvant être nulle sauf
en un nombre fini de points.
ANALYSE DE HILBERT ET DE FOURIER, VI
49
Démonstration. i) Pour t, t + h ∈ I,
Z t
Z t+h
g(s) ds − h g(t)
g(s) ds −
G(t + h) − G(t) − h g(t) =
a
a
Z t+h
Z t+h
=
g(s) ds −
g(t) ds
t
t
Z t+h
g(s) − g(t) ds
=
t
d’où, d’après (32), en posant [t, t + h] := [t + h, t] pour h < 0,
|G(t + h) − G(t) − h g(t)| ≤ |h| max |g(s) − g(t)|
s∈[t,t+h]
et donc, pour h 6= 0,
G(t + h) − G(t)
− g(t) ≤ max |g(s) − g(t)| ,
s∈[t,t+h]
h
qui tend vers 0 quand h → 0 parce que g estRcontinue au point t.
t
ii) D’après (i), l’application f1 : t 7→ f (a)+ a f 0 (s) ds est continue, de
classe C 1 et a pour dérivée f 0 . En d’autres termes, f − f1 est continue,
de classe C 1 et sa dérivée est partout nulle. Il en résulte qu’elle est
constante12. Comme elle est nulle au point a, on a donc bien f = f1 .
Proposition. Soit (fn ) une suite de fonctions continues sur un intervalle J ⊂ R, à valeurs dans un espace de Banach Y et telle que (fn |K )
converge uniformément quel que soit le compact K ⊂ J (en particulier,
(fn ) converge simplement vers une fonction continue f ). Alors, pour
chaque a R∈ J, la suite (Fn ) de fonctions J → Y de classe C 1 définie par
t
Fn (t) = a fn (s) ds converge simplement vers la fonction F : J → Y
Rt
de classe C 1 définie par F (t) = a f (s) ds ; en outre, la convergence de
(Fn |K ) vers (F |K ) est uniforme quel que soit le compact K ⊂ J.
Démonstration. Il suffit de prouver que (Fn |[α,β] ) converge uniformément
vers (F |[α,β] ) quels que soient α, β ∈ J avec α ≤ a ≤ β, tout compact
K ⊂ J étant contenu dans un tel [α, β]. Or, pour tout t ∈ [α, β], on a
Z t
|F (t) − Fn (t)| = (f (s) − fn (s)) ds ≤ |t − a| max |f (s) − fn (s)|
α≤s≤β
a
≤ (β − α) max |f (s) − fn (s)|;
α≤s≤β
comme le second membre de cette inégalité ne dépend pas de t et tend
vers 0 par hypothèse, la proposition en résulte.
12« Théorème
fondamental du calcul différentiel », conséquence du théorème des
accroissements finis.
50
MARC CHAPERON
Corollaire 1. Soit (fn ) une suite de fonctions de classe C 1 sur un
intervalle J ⊂ R, à valeurs dans un espace de Banach Y et possédant
les deux propriétés suivantes :
i) Il existe a ∈ J tel que la suite fn (a) ait pour limite un f (a) ∈ Y .
ii) La suite (fn0 |K ) converge uniformément quel que soit le compact
K ⊂ J (en particulier, (fn0 ) converge simplement et a pour limite
une fonction continue g).
Alors (fn ) converge simplement et a pour limite une fonction f : J → Y
de classe C 1 telle que f 0 = g ; en outre, la convergence de la suite (fn |K )
vers (f |K ) est uniforme quel que soit le compact K ⊂ J.
Démonstration. Il résulteRde la proposition que la suite (hn ) définie par
t
hn (t) = fn (t) − fn (a) = a fn0 (s) ds (point (ii) du théorème) converge
Rt
uniformément sur tout compact vers G : t 7→ a g(s) ds ; la suite (fn )
converge donc uniformément
R t sur tout compact1 vers l’application f
donnée par f (t) = f (a) + a g(s) ds, qui est C et a pour dérivée g
d’après le point (i) du théorème.
Corollaire 2. Soit (fn ) une suite de fonctions C k (1 ≤ k < ∞) sur un
intervalle J ⊂ R, à valeurs dans un espace de Banach Y et possédant
les deux propriétés suivantes :
(j)
i) Pour 0 ≤ j < k, il existe aj ∈ J tel que la suite fn (aj )) ait pour
limite un f (j) (aj ) ∈ Y .
(k)
ii) La suite (fn |K ) converge uniformément quel que soit le compact
(k)
K ⊂ J (en particulier, (fn ) converge simplement et a pour limite
une fonction continue g).
Alors (fn ) converge simplement vers une fonction f : J → Y de classe
C 1 telle que f (k) = g ; en outre, pour 0 ≤ j < k, la convergence de la
(j)
suite (fn |K ) vers (f (j) |K ) est uniforme quel que soit le compact K ⊂ J.
Démonstration. Si k = 1, c’est le corollaire 1. Sinon, on peut faire
l’hypothèse de récurrence que c’est vrai pour k − 1, l’appliquer à la
suite (fn0 ) et conclure grâce au corollaire 1.
Définition. Sous les hypothèses du corollaire 1, on dit que la suite
(fn ) converge au sens C 1 . Plus généralement, elle converge au sens C k ,
(j)
1 ≤ k ≤ ∞, lorsque la suite (fn ) de ses dérivées j-ièmes converge
uniformément sur tout compact pour 0 ≤ j ≤ k. Quand k est fini, le
(k)
corollaire 2 nous dit que c’est le cas si et seulement si la suite (fn )
converge uniformément
sur tout compact et qu’en outre chacune des
(j) suites fn avec 0 ≤ j < k converge en un point de J.
ANALYSE DE HILBERT ET DE FOURIER, VI
51
Corollaire 3. Soit (fn ) une suite dans C k (T) (1 ≤ k < ∞) possédant
les deux propriétés suivantes :
(j)
i) Pour 0 ≤ j < k, il existe aj ∈ R tel que la suite fn (aj )) ait pour
limite un f (j) (aj ) ∈ Y .
(k)
ii) La suite (fn ) converge uniformément13, et a donc pour limite
une fonction g ∈ C(T).
Alors (fn ) converge simplement vers une fonction f ∈ C k (T) telle que
(j)
f (k) = g ; en outre, pour 0 ≤ j < k, la convergence de la suite (fn )
vers (f (j) ) est uniforme.
Démonstration. Cela résulte du cas particulier J = R, Y = C du
corollaire 2 et de la remarque qu’une limite simple de fonctions de
période 1 est de période 1.
Annexe G. Application aux fonctions de plusieurs
variables
Rappels et compléments. Soient X un ouvert non vide de Rn , et
Y un espace normé complet. On dit14 que f : X → Y est de classe C 1
lorsqu’il existe des applications continues ∂1 f, · · · , ∂n f : X → Y telles
que, pour toute application γ : t 7→ (γ1 (t), · · · , γn (t)) de classe C 1 d’un
intervalle [t0 , t1 ] ⊂ R dans X (« arc C 1 dans X »), l’application f ◦ γ
de [t0 , t1 ] dans Y soit de classe C 1 et vérifie
(f ◦ γ)0 (t) = γ10 (t) ∂1 f γ(t) + · · · + γn0 (t) ∂n f γ(t) ,
d’où, par le théorème fondamental p. 48,
n Z t1
X
(34)
f γ(t1 ) − f γ(t0 ) =
γj0 (t) ∂j f γ(t) dt .
j=1
t0
On en déduit que f est continue15 et que ses dérivées partielles ∂j f
sont définies de manière unique.
Exemple : fonctions holomorphes. Si X est un ouvert de C et Y
un espace normé complexe (par exemple C), on dit que f : X → Y est
13Pour
cela, il suffit évidemment que ce soit le cas sur [a, a + 1] pour un réel a.
définition n’est pas habituelle, mais elle est très commode
15Etant donnés a ∈ X et (une norme étant choisie sur Rn ) r > 0 tel que X
contienne la boule ouverte de centre a et de rayon r, il suffit d’appliquer la formule
précédente aux chemins γ : [0, 1] → X définis par γ(t) = a + th avec |h| < r, puis
d’utiliser la continuité des ∂j f .
14Cette
52
MARC CHAPERON
holomorphe lorsqu’elle est de classe C 1 (en considérant C comme R2 ) et
vérifie ∂2 f = i∂1 f , ce qui s’écrit aussi (équation de Cauchy-Riemann)
¯ := 1 (∂1 f + i∂2 f ) = 0.
∂f
2
(35)
On dit alors que f 0 := ∂1 f : X → Y est la dérivée de f , et la formule
(34) se lit
Z b
f (γ(b)) − f (γ(a)) =
γ 0 (t) f 0 (γ(t)) dt.
a
En considérant les chemins γ(t) = z + th et en utilisant la continuité
de f 0 , on en déduit que
∀z ∈ U
f (z + h) − f (z)
,
h→0
h
f 0 (z) = lim
ce qui est la définition classique de Cauchy.
Pour montrer qu’une fonction est bien de classe C 1 , il peut être utile
d’appliquer le critère suivant, qui fait le lien avec la définition habituelle
des dérivées partielles et que nous admettrons sans démonstration16 (le
« seulement si » est clair) :
Proposition. Soit (e1 , · · · , en ) la base canonique de Rn . Sous les hypothèses précédentes, une application f : X → Y est de classe C 1 si et
seulement si elle possède les deux propriétés suivantes :
a) Pour tout a ∈ X et 1 ≤ j ≤ n, le chemin t 7→ f (a + tej ) est
f (a+tej )−f (a)
dérivable en 0, c’est-à-dire que
tend vers une limite
t
gj (a) ∈ Y quand t ∈ R \ {0} tend vers 0.
b) Les applications g1 , · · · , gn : X → Y ainsi définies sont continues.
On a alors gj = ∂j f pour tout j.
Remarque. On définit inductivement la notion d’application de classe
C k+1 , k > 1, comme suit : f est de classe C k+1 quand elle est de
classe C 1 et que ses dérivées partielles sont de classe C k . Le théorème
de Schwarz affirmant que ∂j ∂` f = ∂` ∂j f pour 1 ≤ j ≤ ` ≤ n si f
est C 2 , on en déduit que si elle est C k avec k quelconque, ses dérivées
partielles d’ordre k (obtenues en appliquant les opérateurs de dérivation
partielle ∂j dans un ordre quelconque) sont les ∂ α f := ∂1α1 · · · ∂nαn f avec
α = (α1 , . . . , αn ) ∈ Nn (« multi-indice ») et |α|1 := α1 + · · · + αn = k.
16Pour
un traitement concis et assez complet du sujet, voir par exemple mon
livre Calcul différentiel et calcul intégral, deuxième édition, Dunod, Paris, 2008.
ANALYSE DE HILBERT ET DE FOURIER, VI
53
Dérivation terme à terme des suites de fonctions de plusieurs
variables. Un ouvert X de Rm est connexe quand il est « d’une seule
pièce », ce qui s’exprime comme suit17 : quels que soient a, b ∈ X, il
existe un arc C ∞ joignant a à b dans X, c’est-à-dire une application
γ : [0, 1] → X de classe C ∞ telle que γ(0) = a et γ(1) = b. Les seuls
ouverts connexes de R sont les intervalles ouverts, mais les ouverts
connexes de Rm sont très loin de se ressembler tous pour m > 1.
Théorème. Soit (fn ) une suite de fonctions de classe C 1 sur un ouvert connexe X ⊂ Rm , à valeurs dans un espace normé complet Y et
possédant les deux propriétés suivantes : i) Il existe a ∈ X tel que la suite fn (a) converge vers un f (a) ∈ Y .
ii) Pour tout j ∈ {1, · · · , m}, la suite (∂j fn |K ) converge uniformément
quel que soit le compact K ⊂ X (en particulier, (∂j fn ) converge
simplement et a pour limite une fonction continue gj ).
Alors (fn ) converge simplement vers une fonction f : X → Y de classe
C 1 telle que ∂j f = gj pour tout j ; en outre, la convergence de la suite
(fn |K ) vers (f |K ) est uniforme quel que soit le compact K ⊂ X.
Démonstration. Pour tout x ∈ X et tout arc γ de classe C ∞ joignant
a à x dans X, l’image γ([0, 1]) est compacte. Notre hypothèse entraı̂ne
donc en particulier que les suites (∂1 fn ) ◦ γ, . . . , (∂m fn ) ◦ γ sont uniformément convergentes ; la suite (fn ◦ γ) vérifie donc les hypothèses du
corollaire 1 p. 50 ; en particulier, (fn (x)) converge, d’où la convergence
simple.
La limite simple f de la suite (fn ) est de classe C 1 et admet pour
dérivées partielles les gj : en effet, pour tout x ∈ X, 1 ≤ j ≤ n, il existe
Tj > 0 tel qu’on ait [x, x + Tj ej ] ⊂ X ; la suite [0, Tj ] 3 t 7→ fn (x + tej )
vérifie les hypothèses du corollaire 1 p. 50, puisque fn (x) tend vers f (x)
et que [0, Tj ] 3 t 7→ dtd fn (x+tej ) = ∂j fn (x+tej ) converge uniformément
vers [0, Tj ] 3 t 7→ gj (x + tej ) ; par conséquent, [0, Tj ] 3 t 7→ f (x + tej )
est C 1 et a pour dérivée gj (x) en t = 0, d’où le résultat cherché.
Reste à prouver que la convergence de (fn ) vers f est uniforme sur
tout compact K ⊂ X. Comme K est contenu dans la réunion d’un
nombre fini de boules fermées Br (y) = {x ∈ Rm : |x − y|∞ ≤ r}
contenues dans X (en prenant donc sur Rm la norme `∞ ), il suffit de
montrer que la convergence est uniforme sur chacune d’entre elles ; or,
17Voir
par exemple la référence citée.
54
MARC CHAPERON
pour chaque x = (x1 , · · · , xm ) ∈ Br (y), on a
Z 1
m
X
j
j
(∂j fn − gj )(y + t(x − y))dt
(x − y )
|fn (x) − f (x)| = 0
j=0
≤ |x − y|∞
m
X
j=0
max |(∂j fn − gj )(z)| ,
z∈Br (y)
qui tend vers 0 quand n → ∞, les boules fermées étant compactes.
Corollaire. Soit (fn ) une suite de fonctions C k , 1 ≤ k < ∞, sur un
ouvert connexe X ⊂ Rm , à valeurs dans un espace normé complet Y
et possédant les deux propriétés suivantes :
i) Pour tout multi-indice β ∈ Nn avec |β|1 < k, il existe aβ ∈ X tel
que la suite ∂ β fn (aβ ) soit convergente.
ii) Pour tout multi-indice α ∈ Nn avec |α|1 = k, la suite (∂ α fn |K )
converge uniformément quel que soit le compact K ⊂ X (en particulier, (∂ α fn ) converge simplement et a pour limite une fonction
continue gα ).
Alors (fn ) converge simplement vers une fonction f : X → Y de classe
C k telle que ∂ α f = gα pour tout multi-indice α ∈ Nn avec |α|1 = k ; en
outre, la convergence de la suite (∂ β fn |K ) vers (∂ β f |K ) est uniforme
quels que soient le multi-indice β avec |β|1 < k et le compact K ⊂ X.
Démonstration. Si k = 1, c’est le théorème précédent ; sinon, on peut
supposer qu’il est vrai pour k − 1, l’appliquer aux ∂j f et conclure en
l’appliquant à f .
Définition. Sous les hypothèses du corollaire, on dit que (fn ) converge
vers f au sens C k , et au sens C ∞ si c’est le cas pour tout k.
Annexe H. Distributions sur le cercle
Les notations sont celles de la section 15.
L’espace P (T)∗ . C’est le dual algébrique de l’espace vectoriel complexe P (T), c’est-à-dire l’espace vectoriel complexe des applications
C–linéaires de P (T) dans C ; pour T ∈ P (T)∗ et ϕ ∈ P (T), on notera
< T, ϕ >:= T (ϕ). On définit un plongement linéaire f 7→ Tf de C(T)
dans P (T)∗ par
Z 1
X
< Tf , ϕ >=
f (t)ϕ(t) dt =< f |ϕ >2 =
fbm ϕ
b−m .
0
On identifiera souvent Tf à f .
m∈Z
ANALYSE DE HILBERT ET DE FOURIER, VI
55
La transformation de Fourier. Définissons le coefficient de Fourier
d’ordre m de T ∈ P (T)∗ par Tbm =< T, e−m > (ce qui donne le même
pour Tf que pour f ). L’application T 7→ Tb := (Tbm )m∈Z est un isomorphisme de P (T)∗ sur l’espace vectoriel CZ , appelé transformation de
Fourier, et l’on a
X
(36)
< T, ϕ >=
Tbm ϕ
b−m
m∈Z
pour T ∈ P (T)∗ et ϕ ∈ P (T).
Espaces de Sobolev et distributions. On voit donc que P (T)∗
s’identifie à l’espace vectoriel de toutes les séries de Fourier. L’espace de
Hilbert H s (T) de la section 15 est
le sous-espace de P (T)∗ formé
donc
2
P
(1 + m2 )s Tbm < ∞. Pour s > 1/2, il s’identifie
des T tels que
m∈Z
donc par le plongement g 7→ Tg à un sous-espace de C(T). Les H s (T)
formant une famille décroissante (par rapport à s) de sous-espaces vectoriels de P (T)∗ , leur réunion est aussi un sous-espace vectoriel, noté
D0 (T) et dont les éléments sont les distributions sur le cercle. Il est clair
que T ∈ P (T)∗ appartient à D0 (T) si et seulement s’il existe un réel α
tel que la famille (|m|α Tbm )m6=0 soit bornée.
Les espaces H s (T) comme complétés. Pour tout réel s, l’inclusion
naturelle f 7→ Tf identifie P (T) au sous-espace de H s (T) formé des T
tels que Tbm = 0 sauf pour un nombre fini d’indices m, et ce sous-espace
est dense18 pour la norme H s ; en termes concis, P (T) est dense dans
H s (T). C’est donc a fortiori le cas de H t (T) pour t > s.
Les distributions comme opérateurs sur les espaces de Sobolev. Pour tout réel s et tout T ∈ H −s (T), (36) s’écrit
X
2 −s/2 b
< T, ϕ >=
(1 + m )
Tm (1 + m2 )s/2 ϕ
b−m , ϕ ∈ P (T)
m∈Z
et l’inégalité de Cauchy-Schwarz donne donc | < T, ϕ > | ≤ |T |H −s |ϕ|H s ;
en d’autres termes, la forme linéaire T sur P (T) est continue pour la
norme H s ; elle s’étend donc en une unique forme linéaire continue (encore notée T ) sur H s (T), de norme |T |H −s . Inversement, si T ∈ P (T)∗
est continue pour la norme H s , on a forcément T ∈ H −s (T).
18Son
s
image par l’isométrie T 7→ (1 + m2 ) 2 Tbm
de H s (T) sur `2 (Z) est le
m∈Z
sous-espace engendré par les vecteurs de la base hilbertienne canonique.
56
MARC CHAPERON
Démonstration. Appliquons (36) à la suite de polynômes trigonométriques
ϕ = ϕ(k) définis par
(
2 −s b
d = (1 + m ) T−m pour |m| ≤ k,
ϕ(k)
m
0
sinon.
la continuité de T s’exprime par l’existence d’une constante C ≤ 0 telle
que | < T, ϕ(k) > | ≤ C|ϕ(k)|H s pour tout k ; si T n’est pas nulle, cela
s’écrit
s
2
2
X
X
2 −s b (1 + m2 )−s Tbm 0<
(1 + m ) Tm ≤ C
|m|≤k
|m|≤k
pour k assez grand, d’où à la limite |T |H −s ≤ C.
En résumé, pour tout réel s, H −s (T) est le dual de H s (T), c’està-dire que (36) vaut pour T ∈ H −s (T) et ϕ ∈ H s (T). En particulier,
L2 (T) := H 0 (T) est son propre dual, et toute distribution est une forme
linéaire continue sur H s (T) pour s assez grand.
Commentaire. Pour s > 1/2, nous avons vu que les éléments de H s (T)
étaient des fonctions continues. Pour s ≥ 0, ce sont des (classes de)
fonctions mesurables périodiques d’après la théorie de Lebesgue. Pour
s < 0, ce sont des opérateurs, auxquels nous pourrons néanmoins
généraliser les opérations du calcul différentiel.
Digression : transposée d’une application linéaire. Soit L une
application linéaire d’un espace vectoriel E dans un espace vectoriel F ,
et soient E ∗ et F ∗ les duaux (algébriques) de ces espaces ; la transposée
de L est l’application t L : F ∗ → E ∗ définie par t L(A) = A ◦ L. Lorsque
E et F sont normés et que L est continue, la restriction de t L au dual
topologique F 0 de F est une application linéaire continue à valeurs
dans F 0 (en vertu de l’inégalité |A ◦ L| ≤ |A| |L|), qui est injective si
et seulement si L(E) est dense dans F . Dans le cas particulier où L
est l’inclusion de E comme sous-espace dense dans F (sa continuité
signifiant que la norme donnée sur E est plus fine que la restriction de
celle de F ), t L : F 0 → E 0 (qui n’est autre que l’application restriction
A 7→ A|E ) est donc une injection linéaire continue, autrement dit une
inclusion qui va en sens inverse de l’inclusion E ⊂ F . Ce phénomène
est visible dans le paragraphe précédent, puisqu’on a H s ⊂ H t et H −t ⊂
H −s pour s > t.
Distributions comme opérateurs sur les C k (T). Pour k ∈ N et
s > 1/2, les inclusions H s+k (T) ⊂ C k (T) ⊂ H k (T), continues et
d’image dense, donnent par transposition d’après 6.6 des inclusions
H k (T)0 ⊂ C k (T)0 ⊂ H s+k (T)0 , bref H −k (T) ⊂ C k (T)0 ⊂ H −(s+k) (T).
ANALYSE DE HILBERT ET DE FOURIER, VI
57
Toute distribution T ∈ D0 (T) appartient donc à C k (T)0 pour k assez grand ; le plus petit de ces k est l’ordre de la distribution T . Par
exemple, la masse de Dirac δ : ϕ 7→ ϕ(0) en 0 ∈ T est une distribution
d’ordre 0, ou mesure de Radon.
Remarque. L’avantage de notre premier point de vue est que les H s (T)
sont des espaces de Hilbert, d’une structure beaucoup plus simple et
maniable que les espaces de Banach plus généraux. En outre, pour
k < ∞, il est impossible de caractériser simplement les transformées de
Fourier d’éléments de C k (T), alors qu’une telle caractérisation constitue
la définition même de H s (T). Enfin, on a le
Théorème . Pour s > 1/2, H s (T) est une algèbre normée pour la
multiplication, c’est-à-dire que la fonction continue ϕψ appartient à
H s (T) quelles que soient ϕ, ψ ∈ H s (T), et qu’en outre l’application
bilinéaire (ϕ, ψ) 7→ ϕψ de H s (T) dans lui-même est continue.
Démonstration. Il suffit de montrer l’existence d’une constante C ≥ 0
telle qu’on ait |ϕψ|H s ≤ C |ϕ|H s |ψ|H s quels que soient les polynômes
trigonométriques ϕ, ψ ; en effet, si ϕ, ψ ∈ H s (T) sont respectivement limites de suites (ϕk ), (ψk ) de polynômes trigonométriques pour la norme
H s , la suite (ϕk ψk ) sera une suite de Cauchy dans H s (T), donc y aura
une limite ; celle-ci sera forcément ϕψ, car pour la norme de la convergence uniforme (moins fine que la norme H s ), ϕk → ϕ et ψk → ψ, donc
ϕk ψk → ϕψ. Soient donc ϕ, ψ ∈ P (T) ; en effectuant la multiplication
[ =P ϕ
b
de ϕ et ψ, on voit que (ϕψ)
m
p bp ψm−p , d’où
!2
|ϕψ|2H s
X
X
[ |2 ≤
=
(1 + m2 )s |(ϕψ)
(1 + m2 )s
m
m
m
X
|ϕ
bp | |ψbm−p |
;
p
comme il existe c > 0 telle qu’on ait (1 + m2 )s/2 ≤ c[(1 + p2 )s/2 + (1 +
(m − p)2 )s/2 ] pour m, p ∈ Z (exercice), on en déduit
s
|ϕψ |H s ≤ c
XX
m

≤ c
(1 + p )
2
2 s/2 b
b
|ϕ
bp | |ψm−p | + |ϕ
bp | (1 + (m − p) ) |ψm−p |
p
s
XX
m
2 s/2
p

s
X
X
2
2
s
s
(1 + p2 ) 2 |ϕ
bp | |ψbm−p | +
|ϕ
bp | (1 + (m − p)2 ) 2 |ψbm−p | 
m
p
58
MARC CHAPERON
par l’inégalité triangulaire. Majorons la seconde racine carrée :
!
2
X
X
s
|ϕ
bp | (1 + (m − p)2 ) 2 |ψbm−p |
=
m
p
X
s
s
bq | (1 + (m − q)2 ) 2 |ψbm−q | =
|ϕ
bp | (1 + (m − p)2 ) 2 |ψbm−p | |ϕ
m,p,q
X
X
s
s
=
|ϕ
bp | |ϕ
bq |
(1 + (m − p)2 ) 2 |ψbm−p | (1 + (m − q)2 ) 2 |ψbm−q |
=
p,q
m
d’où, par l’inégalité de Cauchy-Schwarz,
X
m
!
2
|ϕ
bp | (1 + (m − p)2 ) |ψbm−p |
≤
p
s
s
X
X
X
(1 + (m − p)2 )s |ψbm−p |2
(1 + (m − q)2 )s |ψbm−q |2 =
|ϕ
bp | |ϕ
bq |
≤
X
s
2
m
p,q
m
!2
≤
X
X
|ϕ
bp | |ϕ
bq | |ψ|2H s =
p,q
|ϕ
bp |
|ψ|2H s ;
p
comme on obtient la même majoration pour la première racine carrée
(en échangeant les rôles de ϕ et ψ) et que l’on a, par Cauchy-Schwarz,
! 21
X
X
X
−s
s
bp | ≤
(1 + p2 )−s
|ϕ
bp | =
(1 + p2 ) 2 (1 + p2 ) 2 |ϕ
|ϕ|H s ,
p
p
p
on en déduit finalement bien l’inégalité
! 12
|ϕψ|H s ≤ 2c
X
(1 + p2 )−s
|ϕ|H s |ψ|H s .
p
Remarque importante. Ce théorème est résolument faux pour s < 1/2 :
une des rares choses que l’on ne puisse pas faire en général avec des
distributions est de les multiplier.
Dérivation des distributions. On sait que, pour ϕ ∈ C 1 (T) la série
de Fourier de ϕ0 s’obtient par dérivation terme à terme de celle de ϕ ;
il est donc raisonnable, pour chaque T ∈ P (T)∗ de définir sa dérivée
d0 ) = 2πimTbm .
T 0 par la formule (T
m
Si T est une distribution, il en va de même de T 0 , qui est dans
H s−1 (T) si et seulement si T ∈ H s (T). D’après (36), on a
(37)
< T 0 , ϕ >= − < T, ϕ0 >
ANALYSE DE HILBERT ET DE FOURIER, VI
59
pour toute « fonction d’essai » ϕ (dans P (T) ou, pour T ∈ D0 (T), dans
C ∞ (T)), ce qui est usuellement pris pour définition (« la dérivation des
distributions est l’opposé de la transposée de la dérivation des fonctions »).
Remarque. L’équation T 0 = 0 a les mêmes solutions dans P (T)∗ que
dans C ∞ (T).
Toute S ∈ D0 (T) est la somme d’une constante et de la dérivée
j–ième au sens des distributions d’une fonction continue f . En effet,
supposons S ∈ H s (T) ; pour tout j ∈ N, il existe une unique T ∈
P (T)∗ telle que Tb0 = 0 et T (j) = S − Sb0 , et on a T ∈ H s+j (T) car
Tbm = (2πim)−j Sbm pour m 6= 0. Il suffit donc de choisir j > −s + 1/2
pour que cette distribution T soit une fonction continue f .
Multiplication d’une distribution par une fonction. Pour chaque
f dans C k (T), k ∈ N (resp. H s (T), s > 1/2) l’application linéaire
ϕ 7→ f ϕ de C k (T) (resp. H s (T)) dans lui-même est continue ; sa transposée est donc une endomorphisme continu de C k (T)0 (resp. H −s (T)),
appelé multiplication par f et noté T 7→ f T . La distribution f T est
donc définie par ce que
(38)
< f T, ϕ >=< T, f ϕ >
pour toute fonction d’essai ϕ. Puisqu’on peut multiplier une distribution d’ordre k par une fonction C k , on peut toujours multiplier une
distribution par une fonction C ∞ . De (38), (37) et de la formule de
Leibniz pour les fonctions, on déduit la formule de Leibniz
k X
k
(k)
(f T ) =
f (j) T (k−j) ,
j
j=0
valide lorsque T est d’ordre k et f de classe C k .
Images directes de distributions. Si F : R → R est de la forme t 7→
pt + g(t) avec p ∈ Z et g ∈ C k (T) (c’est-à-dire définit une application
C k du cercle T = R/Z dans lui-même), l’application F ∗ : ϕ 7→ ϕ ◦ F
(image inverse par F ) est linéaire et continue de C k (T) dans lui-même.
Sa transposée F∗ : C k (T)0 → C k (T)0 s’appelle image directe par F ; elle
est donc définie par ce que
(39)
< F∗ T, ϕ >=< T, ϕ ◦ F >
pour toute fonction d’essai ϕ et toute distribution T d’ordre k. En
particulier, si F est C ∞ , on peut définir F∗ T pour toute distribution
T.
60
MARC CHAPERON
Remarques. Lorsque F définit un difféomorphisme de T sur lui-même
(ce qui signifie que p = ±1 et que F 0 ne s’annule pas), F −1 est du même
type que F et l’on peut donc définir l’image inverse par F comme étant
l’image directe par F −1 .
−2πmiα b
\
Si F est la translation t 7→ t + α, on a (F
Tm d’après
∗ T )m = e
d
b
(39), mais il faut savoir que le lien entre F∗ T et T est loin d’être aussi
simple en général : c’est une des difficultés de l’analyse de Fourier.
Convolution des distributions. Pour ϕ, ψ ∈ P (T), rappelons que
\
(ϕ
∗ ψ)m = ϕ
bm ψbm .
Cette formule garde un sens pour ϕ, ψ ∈ P (T)∗ : le produit de convolution ∗ ainsi défini est une application bilinéaire de P (T)∗ × P (T)∗ dans
P (T)∗ , et son élément neutre est la masse de Dirac δ, puisque δbm = 1
pour tout m. La convolée de deux distributions est une distribution ;
plus précisément, pour S ∈ H s (T) et T ∈ H t (T), on a S ∗ T ∈ H s+t (T)
et |S ∗ T |s+t,2 ≤ |S|H s |T |t,2 (exercice facile) ; en particulier, quelles que
soient ϕ ∈ C ∞ (T) et T ∈ D0 (T), on a ϕ ∗ T ∈ C ∞ (T).
Téléchargement