MATH-H-402 Introduction `a l`analyse fonctionnelle et

publicité
Université Libre de Bruxelles
Faculté des Sciences Appliquées
MA1 en Ingénieur Civil Physicien
MATH-H-402
Introduction à l’analyse
fonctionnelle et applications
Frédéric Bourgeois
Table des matières
Introduction
7
1 Espaces métriques et topologiques
1.1
1.2
11
Espaces métriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1
Définitions
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2
Suites convergentes et applications continues . . . . . . . . . . . . . 12
1.1.3
Espaces métriques complets . . . . . . . . . . . . . . . . . . . . . . . 14
Espaces topologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1
Définitions
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2
Convergence et continuité . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.3
Compacité
1.2.4
Théorème de Baire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Exercices sur le Chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Espaces normés. Espaces de Banach
23
2.1
Espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2
Espaces normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3
2.2.1
Définitions
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.2
Normes équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.3
Applications linéaires bornées . . . . . . . . . . . . . . . . . . . . . . 30
2.2.4
Opérateurs linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2
2.3.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.2
Théorèmes de l’application ouverte et du graphe fermé . . . . . . . . 34
2.3.3
Projecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4
Fonctionnelles linéaires et dualité . . . . . . . . . . . . . . . . . . . . . . . . 37
2.5
Topologies faibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6
Espaces d’opérateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Exercices sur le Chapitre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3 Espaces à produit interne. Espaces de Hilbert
43
3.1
Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2
Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3
Suites et bases orthonormées . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4
Théorème de représentation de Riesz . . . . . . . . . . . . . . . . . . . . . . 50
3.5
Opérateurs particuliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.6
3.5.1
Opérateurs adjoints . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5.2
Opérateurs auto-adjoints
3.5.3
Opérateurs unitaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.5.4
Opérateurs normaux . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
. . . . . . . . . . . . . . . . . . . . . . . . 52
Projecteurs orthogonaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Exercices sur le Chapitre 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4 Distributions
57
4.1
Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2
Opérations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.1
Translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.2
Dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.3
Intégration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.4
Multiplication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.5
Image directe, inverse et changement de variables . . . . . . . . . . . 63
3
4.2.6
Propriétés des opérations . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3
Lissage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4
Régularisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5
Propriétés locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.6
4.5.1
Egalités et inégalités locales . . . . . . . . . . . . . . . . . . . . . . . 68
4.5.2
Recollement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.5.3
Structure locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Produit tensoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Exercices sur le Chapitre 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5 Distributions tempérées
73
5.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2
Transformée de Fourier dans S(Rn ) . . . . . . . . . . . . . . . . . . . . . . . 75
5.3
5.4
5.5
5.2.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.2
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.3
Théorème de Paley-Wiener . . . . . . . . . . . . . . . . . . . . . . . 79
Transformée de Fourier dans S ′ (Rn ) . . . . . . . . . . . . . . . . . . . . . . 81
5.3.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.3.2
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.3.3
Théorème de Paley-Wiener . . . . . . . . . . . . . . . . . . . . . . . 82
Produit de convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.1
Produit de convolution dans S(Rn ) . . . . . . . . . . . . . . . . . . . 85
5.4.2
Produit de convolution entre S(Rn ) et S ′ (Rn ) . . . . . . . . . . . . . 87
5.4.3
Produit de convolution dans S ′ (Rn ) . . . . . . . . . . . . . . . . . . 89
Equations aux dérivées partielles . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5.1
Problèmes aux limites . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5.2
Problèmes d’évolution . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Exercices sur le Chapitre 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4
6 Espaces de Lebesgue
6.1
6.2
6.3
6.4
6.5
95
Espaces L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.1.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.1.2
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.1.3
Autres espaces L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Espaces Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.2
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Espaces L1 et L∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.3.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.3.2
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Opérations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4.1
Multiplication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4.2
Intégration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.4.3
Lissage
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Note sur la théorie de la mesure . . . . . . . . . . . . . . . . . . . . . . . . . 110
Exercices sur le Chapitre 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7 Espaces de Sobolev
7.1
112
Espaces H m (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.1.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.1.2
Régularité du domaine . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.1.3
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.2
Dualité et espaces H −m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.3
Autres espaces de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.3.1
Espaces W m,p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.3.2
Espaces H s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Exercices sur le Chapitre 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5
8 Problèmes aux limites
8.1
8.2
8.3
122
Formulation variationnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.1.1
Fonctionnelle de Ritz . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.1.2
Problème de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.1.3
Problème de Poisson-Neumann . . . . . . . . . . . . . . . . . . . . . 127
8.1.4
Conditions aux limites essentielles et naturelles . . . . . . . . . . . . 128
8.1.5
Généralisation
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
Méthodes approchées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.2.1
Méthode de Ritz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.2.2
Eléments finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Problèmes aux valeurs propres . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.3.1
Quotient de Rayleigh . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.3.2
Valeurs propres du laplacien . . . . . . . . . . . . . . . . . . . . . . . 136
Exercices sur le Chapitre 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
Notations
140
Bibliographie
142
6
Introduction
“Logic is the hygiene the mathematician practices
to keep his ideas healthy and strong”
Hermann Weyl (1885 - 1955)
L’analyse fonctionnelle est l’étude des espaces de fonctions. Pour situer ce domaine des
mathématiques par rapport au calcul différentiel et intégral, on peut penser intuitivement
à l’étude des fonctions comme à une succession de trois niveaux, du plus élémentaire au
plus abstrait.
Le premier niveau consiste à étudier les propriétés de fonctions individuelles, telles que
leur domaine, leurs extrema, leur concavité, leurs asymptotes, . . . Ces propriétés peuvent
alors être représentées sur le graphe de ces fonctions.
Le deuxième niveau consiste à étudier des propriétés plus générales portant sur des collections de fonctions, telles que diverses notions de continuité, de convergence pour des
suites de fonctions, ainsi que les liens entre ces propriétés. Ceci est typiquement l’objet
d’un cours d’analyse, ou de calcul différentiel et intégral.
Le troisième niveau consiste à étudier non plus les fonctions elles-mêmes, mais bien certains
espaces de fonctions. De ce cadre, certaines propriétés abstraites pour des collections de
fonctions peuvent être reformulées comme des propriétés de certains espaces de fonctions.
Par exemple, le fait que la convergence uniforme implique la convergence au sens L2 d’une
suite de fonctions pourra s’exprimer par le fait qu’une certaine inclusion entre espaces de
fonctions est continue.
L’objectif de ce cours est d’appliquer certaines notions d’analyse fonctionnelle à l’étude
des équations aux dérivées partielles. Pour atteindre ce but, le cours est divisé en trois
parties.
La première partie de ce cours (chapitres 1 à 3) est consacrée aux notions de base
nécessaires pour travailler avec des espaces abstraits aussi généraux que des espaces topologiques, avec des espaces vectoriels de dimension infinie, et plus particulièrement avec
des espaces de Banach et de Hilbert.
La deuxième partie de ce cours (chapitres 4 à 7) est consacrée à l’étude de certains espaces
de fonctions ou de distributions. On étudiera ainsi l’espace des distributions, l’espace des
distributions tempérées, appelé aussi espace de Schwartz, les espaces de Lebesgue et les
7
espaces de Sobolev.
La troisième partie de ce cours (chapitre 8) est consacrée aux applications des deux
premières parties à l’étude de certaines équations aux dérivées partielles. En effet, l’analyse
fonctionnelle permet d’étudier certaines propriétés des solutions d’équations aux dérivées
partielles, telles que leur existence, leur régularité et éventuellement leur unicité. Il est
remarquable que ces mêmes techniques jouent un rôle central en analyse numérique,
c’est-à-dire pour la résolution numérique d’équations aux dérivées partielles. En effet,
l’analyse fonctionnelle permet de formuler rigoureusement des algorithmes numériques,
de démontrer la convergence de processus itératifs, d’obtenir des bornes supérieures sur
l’écart entre la solution approchée (qui a été calculée numériquement) et la solution réelle
(qui est inconnue).
Ce cours n’est toutefois qu’une petite introduction au vaste domaine qu’est l’analyse fonctionnelle. Ainsi, certains résultats fondamentaux seront omis, tels que les théorèmes de
Hahn-Banach et de Banach-Steinhaus. On n’abordera pas non plus toute une série de
thèmes classiques en analyse fonctionnelle, tels que les opérateurs compacts, la théorie
de Fredholm, les propriétés générales des opérateurs elliptiques, la théorie spectrale, les
semi-groupes, . . .
Le lecteur désirant dépasser le cadre de ce cours pourra satisfaire sa curiosité en consultant
les ouvrages cités dans la bibliographie, qui sont tous disponibles à la Bibliothèque des
Sciences et Techniques de l’ULB.
8
Liste des notions à réviser
– Chapitre 1 : Espaces métriques et topologiques
MATH-H-100, Chap 1 : topologie dans Rn (boule ouverte, fermée, intérieur, . . . )
MATH-H-100, Chap 2 : convergence des suites numériques, continuité des fonctions
MATH-H-100, Chap 8 : propriétés des fonctions continues
– Chapitre 2 : Espaces normés. Espaces de Banach
MATH-H-101 : espaces vectoriels, applications linéaires, normes
MATH-H-200, Chap 12 : convergence uniforme
– Chapitre 3 : Espaces à produit interne. Espaces de Hilbert
MATH-H-101 : espaces euclidiens
MATH-H-200, Chap 14 : séries de Fourier
– Chapitre 4 : Distributions
MATH-H-201 : introduction aux distributions
– Chapitre 5 : Distributions tempérées
MATH-H-100, Chap 10 : intégrales multiples, théorème de Fubini
MATH-H-201 : transformée de Fourier, fonctions analytiques complexes
– Chapitre 6 : Espaces de Lebesgue
MATH-H-200, Chap 14 : fonctions de carré sommable
– Chapitre 7 : Espaces de Sobolev
Bien relire et comprendre le chapitre 6
– Chapitre 8 : Problèmes aux limites
MATH-H-301, Chap 26 : quotient de Rayleigh
9
Espaces topologiques
(chap 1, sec 1.2)
Espaces vectoriels topologiques
(chap 2, sec 2.2)
D(Ω), D ′ (Ω), S(Ω), S ′ (Ω), E(Ω), E ′ (Ω)
Espaces métriques
(chap 1, sec 1.1)
Espaces normés
(chap 2, sec 2.2)
B(X, E)
Espaces préhilbertiens
(chap 3, sec 3.1)
Espaces métriques complets
(chap 1, sec 1.1)
Espaces de Banach
(chap 2, sec 2.3)
m (Ω), Lp (Ω), W m,p (Ω)
lp (E), C0m (Ω), Cbm (Ω), CK
Espaces de Hilbert
(chap 3, sec 3.2)
l2 (E), L2 (Ω), L2σ (R), L2 (S),
H m (Ω), H0m (Ω), H s (Rn )
Espaces rencontrés dans ce cours
Espaces vectoriels
(chap 2, sec 2.1)
Kn , KX
10
Ensembles
Chapitre 1
Espaces métriques et topologiques
“A topologist is one who doesn’t know the difference
between a doughnut and a coffee cup.”
John Kelley (1916 - 1999)
1.1
Espaces métriques
1.1.1
Définitions
Définition 1.1. Un espace métrique (E, d) est un ensemble E muni d’une distance
d, c’est-à-dire une application d : E × E → R+ telle que, pour tout x, y, z ∈ E,
(i) d(x, y) = 0 ⇐⇒ x = y,
(ii) d(x, y) = d(y, x),
(iii) d(x, z) ≤ d(x, y) + d(y, z) (inégalité triangulaire).
Pour alléger les notations, on note quelquefois un espace métrique simplement par E, en
omettant la distance, lorsque celle-ci est identifiable d’après le contexte.
Exemples.
1. L’ensemble F n , avec F = Z, Q, R ou C, muni de la distance d donnée par
v
u n
uX
|xi − yi |2 ,
x = (x1 , . . . , xn ), y = (y1 , . . . , yn ),
d(x, y) = t
i=1
est un espace métrique.
2. Soit E un ensemble et d : E × E → R+ la métrique discrète, définie par
0 si x = y,
d(x, y) =
1 si x 6= y.
Alors (E, d) est un espace métrique, qualifié de discret.
11
N
Soient A, B ⊂ E non vides et x ∈ E. La distance d(x, A) entre x et A est définie par
d(x, A) = inf d(x, y).
y∈A
La distance d(A, B) entre A et B est définie par
d(A, B) = inf d(y, z).
y∈A
z∈B
Le diamètre δ(A) est défini par
δ(A) = sup d(y, z).
y,z∈A
L’ensemble A est dit borné si δ(A) < ∞.
Tout sous-ensemble F ⊂ E d’un espace métrique (E, d) est encore un espace métrique : il
suffit de le munir de la distance dF = d|F ×F induite par d sur F .
La boule ouverte (resp. fermée) de rayon r > 0 et de centre x ∈ E est l’ensemble
B(x, r) (resp. B(x, r)) des points y ∈ E tels que d(x, y) < r (resp. d(x, y) ≤ r).
Un sous-ensemble A ⊂ E est dit dense dans E si pour tout x ∈ E et pour tout ǫ > 0,
B(x, ǫ) ∩ A 6= ∅. En d’autres termes, tout élément de E peut être approximé d’aussi près
que l’on veut par des éléments de A.
Une application bijective f : E → F entre deux espaces métriques (E, dE ) et (F, dF )
telle que dE (x, y) = dF (f (x), f (y)) pour tout x, y ∈ E est appelée une isométrie. Si il
existe une isométrie f : E → F , les espaces métriques E et F sont dits isométriques.
Deux espaces métriques isométriques sont tout-à-fait équivalents, au sens où ils possèdent
exactement les mêmes propriétés.
1.1.2
Suites convergentes et applications continues
Définition 1.2. Une suite (xn ) d’éléments d’un espace métrique E est dite convergente
si il existe x ∈ E tel que d(xn , x) → 0 lorsque n → ∞. L’élément x ∈ E est appelé limite
de la suite (xn ) et est unique.
Une suite qui n’est pas convergente est dite divergente.
Exemples.
1. La suite xn =
1
n
dans R converge vers 0.
2. Les suites xn = (−1)n et yn = n dans R sont divergentes.
N
Définition 1.3. Soit f : E → F une application entre deux espaces métriques (E, dE ) et
(F, dF ) et soit x ∈ E. On dit que f est continue en x si, pour tout ǫ > 0, il existe δ > 0
tel que f (B(x, δ)) ⊂ B(f (x), ǫ). On dit que f est continue si f est continue en y pour
tout y ∈ E. On dit que f est uniformément continue si pour tout ǫ > 0, il existe δ > 0
tel que dE (y, z) < δ implique dF (f (y), f (z)) < ǫ.
12
En d’autres termes, une application continue est uniformément continue si δ > 0 peut être
choisi indépendamment de x ∈ E.
Exemples.
1. L’application f : R → R : x 7→ x2 est continue, mais pas uniformément continue.
2. Une isométrie f : E → F entre deux espaces métriques est une application uniformément continue.
3. Soit (E, d) un espace métrique. Pour tout x0 ∈ E, l’application dx0 : E → R : x 7→
d(x0 , x) est une application uniformément continue.
4. Si (E, d) est un espace métrique discret, alors toute application f : E → F vers un
autre espace métrique F est uniformément continue.
N
Proposition 1.4. Une application f : E → F entre deux espaces métriques est continue
si et seulement si pour toute suite (xn ) convergente dans E, on a
lim f (xn ) = f lim xn .
n→∞
n→∞
Démonstration. Supposons que f est continue et que (xn ) est une suite dans E convergeant
vers x. Pour tout δ > 0, il existe N ∈ N tel que n > N implique d(xn , x) < δ. Si f
est continue, pour tout ǫ > 0, il existe δ > 0 tel que si y ∈ E avec d(x, y) < δ alors
d(f (x), f (y)) < ǫ. Par conséquent, si n > N alors d(f (x), f (xn )) < ǫ de sorte que la suite
(f (xn )) converge vers f (x).
Inversement, supposons par l’absurde que f ne soit pas continue en un certain x ∈ E.
Alors il existe ǫ > 0, une suite δn → 0 et une suite (xn ) dans E telle que d(x, xn ) < δn
et d(f (x), f (xn )) > ǫ. Comme (xn ) converge vers x et que (f (xn )) ne peut converger vers
f (x), on obtient une contradiction.
Proposition 1.5. Soient f : E → F et g : E → F deux applications continues entre les
espaces métriques E et F . Si A ⊂ E est dense et f (x) = g(x) pour tout x ∈ A, alors
f = g.
Démonstration. Soit x ∈ E. Comme A est dense dans E, il existe une suite (xn ) dans A
qui converge vers x. Par la proposition 1.4, les suites images (f (xn )) et (g(xn )) convergent
vers f (x) et g(x) respectivement. Par hypothèse, f (xn ) = g(xn ) pour tout n ∈ N, de sorte
que ces deux suites sont égales. Par unicité de la limite, on doit donc avoir f (x) = g(x).
Définition 1.6. Soit α ∈ [0, 1]. Une application f : E → F entre deux espaces métriques
(E, dE ) et (F, dF ) est dite hölderienne d’ordre α si il existe k ∈ R tel que dF (f (x), f (y)) ≤
k dE (x, y)α pour tout x, y ∈ E. Si α = 0, on dit que f est bornée. Si α = 1, on dit que
f est lipschitzienne.
Toute fonction hölderienne d’ordre α > 0 est uniformément continue, mais la réciproque
est fausse.
Exemple. La fonction f : [0, 21 ] → R : x 7→ log1 x est uniformément continue, mais elle
n’est pas hölderienne d’ordre α, quel que soit α > 0.
N
13
1.1.3
Espaces métriques complets
Définition 1.7. Une suite (xn ) d’éléments d’un espace métrique E est appelée suite de
Cauchy si d(xn , xm ) → 0 lorsque m et n → ∞.
Clairement, toute suite convergente est de Cauchy, mais la réciproque n’est pas toujours
vraie.
Exemple. Pour tout x ∈ R, on désigne par ⌊x⌋ la partie entière
√ de x, c’est-à-dire le plus
grand entier inférieur ou égal à x. La suite xn = 10−n ⌊10n 2⌋ dans Q est une suite de
Cauchy divergente.
N
Définition 1.8. Deux suites de Cauchy (xn ) et (x′n ) dans E sont dites équivalentes si
d(xn , x′n ) → 0 lorsque n → ∞.
Si deux suites de Cauchy (xn ) et (x′n ) sont équivalentes, alors (xn ) est convergente si et
seulement si (x′n ) est convergente, et dans ce cas ces deux suites ont la même limite.
Définition 1.9. Un espace métrique E est dit complet si toute suite de Cauchy dans E
est convergente.
Exemple. Zn , Rn et Cn sont des espaces métriques complets, mais pas Qn .
N
Proposition 1.10. Soient A ⊂ E un sous-ensemble dense d’un espace métrique E et
F un espace métrique complet. Soit f : A → F une application uniformément
continue.
Alors il existe une unique application continue f : E → F telle que f A = f . De plus, f
est uniformément continue.
Démonstration. Soit x ∈ E. Comme A est dense dans E, il existe une suite (xn ) dans A
qui converge vers x ; en particulier, la suite (xn ) est de Cauchy dans A. Montrons que la
suite image (f (xn )) est de Cauchy dans F .
En effet, pour tout ǫ > 0 il existe δ > 0 tel que d(x, y) < δ implique d(f (x), f (y)) < ǫ.
Comme la suite (xn ) est de Cauchy, il existe N ∈ N tel que si m, n ≥ N alors d(xn , xm ) < δ.
Par conséquent, on a bien d(f (xn ), f (xm )) < ǫ.
On montre de même que, si (yn ) est une suite de Cauchy équivalente à (xn ), alors les
suites (f (xn )) et (f (yn )) sont équivalentes. En particulier, la limite de la suite de Cauchy
(f (xn )) ne dépend que de x. On définit donc
f (x) = lim f (xn ).
n→∞
Si x ∈ A, alors f (x) = f (x) car on peut choisir xn = x dans la définition de f . Par la
proposition 1.4, l’application f est continue. Elle est unique avec ces propriétés par la
proposition 1.5.
Montrons que f est uniformément continue. Comme f est uniformément continue, pour
tout ǫ > 0, il existe δ > 0 tel que si d(x, y) < 2δ, alors d(f (x), f (y)) < 3ǫ . Soient x, y ∈ E
tels que d(x, y) < δ. Soit comme avant une suite de Cauchy dans A convergeant vers x
14
dans E. Pour N ∈ N suffisamment grand, d(x, xN ) < 2δ et d(f (x), f (xN )) < 3ǫ ; on pose
xN = x′ . De même, il existe y ′ ∈ A tel que d(y, y ′ ) < 2δ et d(f (y), f (y ′ )) < 3ǫ . Alors on a
d(x′ , y ′ ) ≤ d(x′ , x) + d(x, y) + d(y, y ′ ) < 2δ
de sorte que d(f (x′ ), f (y ′ )) < 3ǫ . Par conséquent,
d(f (x), f (y)) ≤ d(f (x), f (x′ )) + d(f (x′ ), f (y ′ )) + d(f (y ′ ), f (y)) < ǫ
comme souhaité.
Tout espace métrique (E, d) peut être complété, c’est-à-dire qu’il existe un espace métrie tel que E ⊂ E
e E×E = d. Un tel espace métrique
e d)
e est dense dans E
e et d|
que complet (E,
′
e
e
(E, d) est unique (à isométrie près). En effet, si (E , d′ ) en est un autre, l’identité id :
e → E ⊂ E ′ s’étend par la proposition 1.10 de manière unique en une application
E ⊂E
e → E ′ qui préserve les distances. Comme on peut faire la même chose en échangeant
f :E
e et E ′ , f est bijective, donc aussi une isométrie.
E
e appelé complétion de (E, d), de la manière
e d),
On peut construire l’espace métrique (E,
suivante.
e l’ensemble des classes d’équivalence de suites de Cauchy dans E, au sens de la
Soit E
e en tant que classe
définition 1.8. Un élément x ∈ E peut être vu comme un élément de E
d’équivalence [xn ] de la suite constante (xn = x) dans E.
On définit une distance d((xn ), (x′n )) entre deux suites de Cauchy (xn ) et (x′n ) dans E par
d((xn ), (x′n )) = lim d(xn , x′n ).
n→∞
La limite dans le membre de droite existe, car la suite de réels d(xn , x′n ) est une suite de
Cauchy dans R.
Comme cette distance reste identique lorsque l’on remplace (xn ) ou (x′n ) par une suite de
e
Cauchy qui lui est équivalente, la distance d induit bien une distance de sur E.
e défini ci-dessus est la complétion de l’espace
e d)
Proposition 1.11. L’espace métrique (E,
métrique (E, d).
e c’est-à-dire des classes
Démonstration. Si [xn ] et [x′n ] sont des éléments de E ⊂ E,
′
′
d’équivalence de suites constantes (xn = x) et (xn = x ), alors
e n ], [x′ ]) = d((xn ), (x′ )) = lim d(x, x′ ) = d(x, x′ ),
d([x
n
n
n→∞
e E×E = d.
de sorte que d|
e car, toute classe d’équivalence [xn ] ∈ E
e de suite de
L’espace original E est dense dans E
(k)
(k)
Cauchy (xn ), il existe des suites constantes (yn = y ) d’éléments de E telles que
e n ], [y (k) ]) → 0
d([x
n
15
lorsque k → ∞.
Il suffit en effet de prendre y (k) = xk pour tout k ∈ N.
e ainsi obtenu est complet, car si les éléments [x(k)
e d)
e
L’espace métrique (E,
n ] ∈ E forment
e
e
une suite de Cauchy dans E, alors cette suite converge vers la classe d’équivalence [yn ] ∈ E
(n)
de la suite (yn ) définie par yn = xn , pour tout n ∈ N.
Exemple. La complétion de Qn est Rn .
1.2
1.2.1
N
Espaces topologiques
Définitions
Définition 1.12. Un espace topologique (E, T ) est un ensemble E muni d’une topologie T , c’est-à-dire une collection T ⊂ 2E de parties de E, appelées ouverts, telle
que
(i) ∅, E ∈ T ,
(ii) si Oi ∈ T , i ∈ I alors ∪i∈I Oi ∈ T ,
(iii) si Oi ∈ T , i ∈ I avec I fini, alors ∩i∈I Oi ∈ T .
Soit A ⊂ E. Un voisinage de A est un ensemble V contenant un ouvert qui contient A.
Ainsi, un ouvert est un voisinage de chacun de ses points. L’intérieur int(A) (et noté
o
quelquefois A) de A est l’ensemble des points intérieurs de A, c’est-à-dire dont A est un
voisinage. On vérifie aisément que int(A) est l’union des ouverts de E contenus dans A.
Un ensemble F ⊂ E est appelé fermé si c’est le complémentaire d’un ouvert de E. On
vérifie aisément que les fermés possèdent les propriétés suivantes :
(i) les ensembles ∅ et E sont fermés,
(ii) si les ensembles Fi ⊂ E, i ∈ I, sont fermés alors ∩i∈I Fi est fermé,
(iii) si les ensembles Fi , i ∈ I, avec I fini, sont fermés alors ∪i∈IFi est fermé.
Soit A ⊂ E. L’adhérence de A est l’ensemble A des points de E adhérents à A, c’està-dire dont tout voisinage intersecte A. On vérifie aisément que l’adhérence A de A dans
E est l’intersection des fermés de E contenant A.
Un point x ∈ A est dit isolé si il existe un voisinage V de x dans E tel que A ∩ V = {x}.
On dit que x ∈ A est un point d’accumulation de A si x n’est pas isolé dans A et
si x est adhérent à A. Par conséquent, tout voisinage d’un point d’accumulation x de A
contient une point de A distinct de x.
Un ensemble A ⊂ E est dit dense dans E si A = E. Un espace topologique E est dit
séparable si il contient un sous-ensemble dénombrable et dense.
Le bord ∂A de A est la différence A \ intA.
16
Soit (E, T ) un espace topologique et A ⊂ E. La topologie induite TA par T sur A est
la collection des traces O ∩ A des ouverts O de E sur A.
Pour définir une topologie T sur un ensemble E, il est parfois malaisé d’énumérer tous
les éléments de E. Une base d’une topologie T est un sous-ensemble B ⊂ T tel que tout
élément de T peut s’écrire comme l’union de certains éléments de B. Comme une topologie
est entièrement déterminée par l’une de ses bases, il suffit de décrire une base de topologie
pour spécifier une topologie sur un ensemble. Une collection B ⊂ 2E de parties de E est
une base d’une topologie sur E si et seulement si
(i) tout élément x ∈ E est contenu dans un élément B ∈ B,
(ii) pour tout B1 , B2 ∈ B, l’intersection B1 ∩ B2 peut s’écrire comme l’union de certains
éléments de B.
Soient (E1 , T1 ) et (E2 , T2 ). La topologie produit T sur E = E1 × E2 est la topologie
ayant pour base B = {O1 × O2 ⊂ E | O1 ∈ T1 , O2 ∈ T2 }.
Soient T1 et T2 deux topologies sur un ensemble E. On dit que T1 est plus fine que T2 si
T2 ⊂ T1 . La topologie la plus fine sur E est la topologie discrète T = 2E , alors que la
topologie la moins fine sur E est la topologie grossière T = {∅, E}.
La notion d’espace topologique généralise la notion d’espace métrique.
Exemple. Tout espace métrique (E, d) est un espace topologique. Il suffit de prendre la
collection des boules ouvertes pour d comme base Bd d’une topologie Td sur E. Il s’agit de
la topologie utilisée sur un espace métrique, sauf mention explicite du contraire.
On vérifie alors que
(i) toute boule ouverte (resp. fermée) est ouverte (resp. fermée),
(ii) si F ⊂ E et dF = d|F ×F , la topologie induite TF par Td coı̈ncide avec la topologie
TdF naturelle sur (F, dF ),
(iii) A ⊂ E est dense dans (E, d) si et seulement si A ⊂ E est dense dans (E, Td ).
N
En revanche, les espaces topologiques sont bien plus généraux que les espaces métriques,
car de nombreux espaces topologiques ne peuvent être obtenus de cette manière.
Définition 1.13. Un espace topologique E est dit Hausdorff ou séparé si pour tout
x, y ∈ E, il existe des voisinages disjoints pour x et y.
Tout espace métrique E est séparé, car pour tout x, y ∈ E avec x 6= y, les boules ouvertes
B(x, r) et B(y, r) sont disjointes dès que r < 12 d(x, y).
Exemples.
1. Si E est un espace topologique séparé et A ⊂ E, alors la topologie induite sur A est
séparée.
2. Le produit d’espaces topologiques séparés est séparé.
3. Si E contient plus qu’un point, la topologie grossière sur E n’est pas séparée.
4. La topologie de Zariski sur R est la collection des parties de R dont le complémentaire
est fini. Cette topologie n’est pas séparée.
N
17
1.2.2
Convergence et continuité
Définition 1.14. Une suite (xn )dans un espace topologique E est dite convergente si il
existe x ∈ E tel que, pour tout voisinage V de x, il existe n0 ∈ N tel que xn ∈ V pour
tout n ≥ n0 . L’élément x ∈ E est appelé limite de la suite (xn ). Si E est séparé, la limite
d’une suite convergente dans E est unique.
Si E est un espace métrique, les notions de suite convergente au sens métrique (définition
1.2) et au sens topologique (définition 1.14) coı̈ncident. En revanche, la notion de suite de
Cauchy est de nature métrique, car elle n’a pas d’équivalent topologique.
Définition 1.15. Soit f : E → F une application entre deux espaces topologiques, et soit
x ∈ E. On dit que f est continue en x si pour tout voisinage W de f (x) dans F , il
existe un voisinage V de x dans E tel que f (V ) ⊂ W . On dit que f est continue si f est
continue en y pour tout y ∈ E.
Si E et F sont des espaces métriques, les notions de continuité au sens métrique (définition
1.3) et au sens topologique (définition 1.15) coı̈ncident. En revanche, la notion de continuité
uniforme est de nature métrique, car elle n’a pas d’équivalent topologique.
Proposition 1.16. Une application f : E → F entre deux espaces topologiques est continue si et seulement si f −1 (O) est ouvert dans E pour tout ouvert O de F .
Démonstration. Supposons que f est continue et O est un ouvert de F . Pour tout x ∈
f −1 (O), l’ouvert O est un voisinage de f (x). Par conséquent, il existe un voisinage V de
x tel que f (V ) ⊂ O, ou encore V ⊂ f −1 (O). Donc f −1 (O) est un voisinage de chacun de
ses points, autrement dit un ouvert.
Inversement, supposons que f −1 (O) est ouvert dans E pour tout ouvert O de F . Soit x ∈ E
et soit W un voisinage de f (x) dans F . Alors W contient un ouvert O de F qui contient
f (x), et f −1 (W ) contient l’ouvert f −1 (O) qui contient x. Autrement dit, V = f −1 (O) est
un voisinage de x tel que f (V ) ⊂ W .
Une application bijective f : E → F entre espaces topologiques E et F telle que f et
f −1 sont continues est appelée homéomorphisme. Une telle application induit donc une
bijection entre les ouverts de E et ceux de F . Si il existe un homéomorphisme f : E → F ,
les espaces topologiques E et F sont dits homéomorphes. De tels espaces topologiques
sont alors tout-à-fait équivalents, car ils possèdent exactement les même propriétés.
Exemple. La sphère S 2 = {(x, y, z) ∈ R3 | x2 +y 2 +z 2 = 1} et l’ellipsoı̈de E = {(x, y, z) ∈
2
2
2
R3 | xa2 + yb2 + zc2 = 1}, munis de la topologie induite par la topologie naturelle sur R3 ,
sont des espaces topologiques homéomorphes. Par contre, avec la restriction de la distance
usuelle sur R3 , ce ne sont pas des espaces métriques isométriques.
N
Dans le cadre des espaces topologiques, la proposition 1.4 n’est plus vraie sans hypothèses
supplémentaires, mais il reste vrai que l’image par une application continue d’une suite
convergente est convergente. Par conséquent, la proposition 1.5 reste vraie pour des espaces
topologiques séparés.
18
1.2.3
Compacité
Un recouvrement d’un espace topologique E par des ouverts est une collection {Ui , i ∈
I} d’ouverts Ui de E telle que ∪i∈I Ui = E. Un sous-recouvrement d’un tel recouvrement
est une sous-collection {Ui , i ∈ I ′ } avec I ′ ⊂ I telle que ∪i∈I ′ Ui = E. Ce sous-recouvrement
est dit fini si l’ensemble I ′ est fini.
Définition 1.17. Un espace topologique E séparé est dit compact si de tout recouvrement
de E par des ouverts, on peut extraire un sous-recouvrement fini.
Soit A ⊂ E un sous-ensemble d’un espace topologique E. On dit que A est compact si
A, muni de la topologie induite, est un espace topologique compact. On dit que A est
relativement compact si son adhérence A ⊂ E est compacte.
Exemple. Dans Rn muni de sa topologie usuelle, les ensembles compacts sont exactement
les ensembles fermés et bornés.
N
Proposition 1.18. Soit f : E → F une application continue d’un espace topologique
compact E vers un espace topologique séparé F . Alors f (E) ⊂ F , muni de la topologie
induite, est compact.
Démonstration. Soit {Ui , i ∈ I} un recouvrement de f (E) par des ouverts. Il suffit d’en
extraire un sous-recouvrement fini pour montrer que f (E) est compact. La collection
{f −1 (Ui ), i ∈ I} est un recouvrement de E par des ouverts. Comme E est compact, on peut
en extraire un recouvrement fini {f −1 (Ui1 ), . . . , f −1 (Uik )}. Par conséquent, Ui1 , . . . , Uik est
un sous-recouvrement fini de f (E).
Proposition 1.19. Soit A ⊂ E un sous-ensemble fermé d’un espace topologique compact.
Alors A, muni de la topologie induite, est compact.
Démonstration. Soit {Ui , i ∈ I} un recouvrement de A par des ouverts. Pour tout i ∈ I,
ei de E tel que Ui = U
ei ∩ A. Comme A est fermé, la collection
il existe un ouvert U
ei , i ∈ I} ∪ {E \ A} est un recouvrement de E par des ouverts. Comme E est compact,
{U
ei , . . . , U
ei } ∪ {E \ A}.
on peut extraire de cette collection un sous-recouvrement fini {U
1
k
Par conséquent, {Ui1 , . . . , Uik } recouvre A.
Enfin, on peut montrer que le produit de toute collection d’espaces topologiques compacts
est encore un espace topologique compact.
Il existe d’autres notions de compacité, basées sur des propriétés fort utiles pour des
espaces topologiques ou métriques.
Une sous-suite d’une suite (xn )n∈ N dans un espace topologique E est une suite dans E
de la forme (xnk )k∈N , où (nk )k∈N est une suite strictement croissante dans N.
Définition 1.20. Un espace topologique séparé E est dit séquentiellement compact si
toute suite (xn )n∈N dans E admet une sous-suite convergente.
19
Définition 1.21. Un espace métrique E est précompact si pour tout ǫ > 0 il existe un
recouvrement de E par un nombre fini de boules de rayon ǫ.
Exemples.
1. Un espace métrique discret E est précompact si et seulement si E est fini.
2. Un espace métrique compact est précompact.
N
Pour le reste de cette section, on se restreindra aux espaces métriques.
Proposition 1.22. Soit E un espace métrique. Les propriétés suivantes sont équivalentes :
(i) E est compact ;
(ii) E est séquentiellement compact ;
(iii) E est précompact et complet.
Démonstration.
(i) ⇒ (ii). Soit Fn l’adhérence de l’ensemble {xn , xn+1 , . . .} et F = ∩n∈N Fn . Montrons par
l’absurde que F 6= ∅.
Si F = ∅, alors la collection d’ouverts {E \Fn , n ∈ N} forme un recouvrement de E par des
ouverts, dont on peut extraire un recouvrement fini E \ Fi1 , . . . E \ Fik avec i1 < . . . < ik .
Par conséquent, E = E \ Fik , ce qui est absurde, donc F n’est pas vide.
Soit x ∈ F , autrement dit x est adhérent à l’ensemble {xn , xn+1 , . . .} pour tout n ∈ N.
On définit inductivement une suite (nk )k∈N , en posant n1 = 1, puis en prenant pour nk le
plus petit entier tel que nk > nk−1 et xnk ∈ B(x, k1 ). Un tel entier existe toujours puisque
x ∈ F . Alors la sous-suite (xnk )k∈N converge vers x.
(ii) ⇒ (iii). Montrons que E est complet. Toute suite de Cauchy (xn ) dans E admet une
sous-suite convergeant vers un certain x ∈ E. Mais comme (xn ) est de Cauchy, l’inégalité
triangulaire implique qu’elle convergera alors elle-même vers x.
Montrons ensuite par l’absurde que E est précompact. Supposons qu’il existe ǫ > 0 pour
lequel E n’admet aucun recouvrement fini par des boules de rayon ǫ. On peut alors définir
k−1
inductivement une suite (xn ) dans E, en choisissant x1 ∈ E, puis xk ∈
/ ∪i=1
B(xi , ǫ). Un
k−1
tel xk existe car ∪i=1 B(xi , ǫ) 6= E en vertu de l’hypothèse de contradiction. La suite (xn )
possède alors la propriété d(xn , xm ) > ǫ pour tout m, n ∈ N. Mais alors (xn ) ne peut
contenir aucune sous-suite convergente.
(iii) ⇒ (i). Argumentant par contradiction, soit {Ui , i ∈ I} un recouvrement ouvert de E
qui n’admet pas de sous-recouvrement fini. On peut alors définir inductivement une suite
(xn ) dans E de la manière suivante.
Soit B(y1,1 , 12 ), . . . B(y1,N1 , 12 ) un recouvrement fini de E par des boules de rayon 1/2.
Pour un certain j ∈ {1, . . . , N1 }, la boule B(y1,j , 21 ) ne peut être recouverte par une souscollection finie de {Ui , i ∈ I}. On prend alors x1 = y1,j et on pose B1 = B(y1,j , 12 ).
Pour k > 1, soit B(yk,1 , 2−k ), . . . , B(yk,Nk , 2−k ) un recouvrement fini de E par des boules
de rayon 2−k . Pour un certain j ∈ {1, . . . , Nk }, l’ensemble B1 ∩ . . . ∩ Bk−1 ∩ B(yk,j , 2−k ) ne
peut être recouvert par une sous-collection finie de {Ui , i ∈ I}. On prend alors xk = yk,j
et on pose Bk = B(yk,j , 2−k ).
Par construction, la suite (xn ) satisfait d(xk , xk+1 ) < 2−k + 2−(k+1) < 2−(k−1) et donc
20
d(xn , xn+k ) < 2−(n−1) + . . . + 2−(n+k−2) < 2−(n−2) . Par conséquent, la suite (xn ) est de
Cauchy ; soit x sa limite. Soit i ∈ I tel que x ∈ Ui . Alors B(x, δ) ⊂ Ui pour δ > 0
suffisamment petit, de sorte que Bk ⊂ Ui pour k suffisamment grand. Mais ceci contredit
la définition de Bk .
Cette proposition permet de mieux caractériser les espaces métriques compacts. Remarquons toutefois que, contrairement au cas de Rn , un ensemble fermé et borné dans un
espace métrique plus général n’est pas toujours compact.
Exemples.
1. L’ensemble Q ∩ [0, 1] est fermé dans Q, mais pas compact car il n’est pas complet.
2. La boule unité fermée B(0, 1) dans un espace vectoriel de dimension infinie est bornée
mais pas compacte, car elle n’est pas précompacte.
N
En revanche, tout ensemble compact dans un espace métrique est fermé et borné.
Proposition 1.23. Toute application continue f : E → F entre espaces métriques, avec
E compact, est uniformément continue.
Démonstration. Comme f est continue, pour tout ǫ > 0, pour tout x ∈ E, il existe δ(x) > 0
tel que d(x, y) < δ(x) implique d(f (x), f (y)) < ǫ/2. La collection des boules ouvertes
{B(x, δ(x)/2), x ∈ E} forme un recouvrement ouvert de E, dont on peut extraire un recouvrement fini B(x1 , δ(x1 )/2), . . . , B(xk , δ(xk )/2). Soit δ = min{δ(x1 )/2, . . . , δ(xk )/2} > 0.
Pour tout x ∈ E, x ∈ B(xi , δ(xi )/2) de sorte que B(x, δ) ⊂ B(xi , δ(xi )) pour un certain
i ∈ {1, . . . , k}. Mais alors, pour tout y ∈ B(x, δ), on a d(f (y), f (xi )) < ǫ/2. Comme d’autre
part d(f (x), f (xi )) < ǫ/2, on en déduit que d(f (x), f (y)) < ǫ/2 + ǫ/2 = ǫ.
1.2.4
Théorème de Baire
Nous terminons ce chapitre par une propriété topologique importante des espaces métriques complets.
Définition 1.24. Un sous-ensemble A ⊂ E d’un espace topologique E est dit nulle part
dense si int(A) = ∅.
Théorème 1.25 (Baire). Soit E un espace métrique complet. Si {An , n ∈ N} est une
collection dénombrable de sous-ensembles An ⊂ E nulle part denses, alors
[
An ( E.
n∈N
Démonstration. Il suffit de montrer que l’intersection des ouverts denses Un = E \ An ,
n ∈ N, est non vide.
Construisons par récurrence des éléments xn ∈ E et ρn > 0 tels que ρn < 21n et B(xn , ρn ) ⊂
Un ∩ B(xn−1 , ρn−1 ).
Comme U0 est non vide, on peut choisir x0 ∈ U0 . Soit ρ0 > 0 tel que ρ0 < 1 et B(x0 , 2ρ0 ) ⊂
21
U0 , de sorte que B(x0 , ρ0 ) ⊂ U0 .
Pour n ≥ 0, étant donnés xn ∈ E et ρn > 0 comme ci-dessus, l’ouvert Un+1 ∩ B(xn , ρn ) est
non vide car Un+1 est dense. On peut donc choisir xn+1 ∈ Un+1 ∩ B(xn , ρn ), puis ρn+1 > 0
1
et B(xn+1 , ρn+1 ) ⊂ B(xn+1 , 2ρn+1 ) ⊂ Un+1 ∩ B(xn , ρn ).
tel que ρn+1 < 2n+1
La suite (xn ) est de Cauchy, car d(xn , xn+k ) < ρn < 21n pour tout n, k ≥ 0. Comme E est
complet, la suite (xn ) converge vers x ∈ E. Comme xn+k ∈ B(xn , ρn ) pour tout n, k ≥ 0,
on a x ∈ B(xn , ρn ) ⊂ Un pour tout n ≥ 0. L’intersection des Un est donc non vide.
Exercices sur le Chapitre 1
1. (a) Montrer que l’image d’une suite de Cauchy par une application continue entre
espaces métriques n’est pas forcément une suite de Cauchy.
(b) Montrer qu’une application continue entre espaces métriques qui transforme
toute suite de Cauchy en une suite de Cauchy n’est pas forcément uniformément
continue.
2. Soit E un espace métrique et ∅ =
6 A ⊂ E.
(a) Montrer que l’application dA : E → R : x 7→ d(x, A) est uniformément continue.
(b) Si A est compact, montrer que, pour tout x ∈ E, il existe y ∈ A tel que
d(x, A) = d(x, y).
3. On considère l’ensemble B(X, R) des fonctions bornées sur un ensemble X.
(a) Définir sur B(X, R) une topologie pour laquelle la convergence est équivalente
à la convergence simple (ou ponctuelle) des fonctions : fn → f ssi fn (x) → f (x)
pour tout x ∈ X.
(b) Montrer que cette topologie est moins fine que la topologie induite par la norme
k · k∞ sur B(X, R).
22
Chapitre 2
Espaces normés. Espaces de
Banach
“Mathematics is the most beautiful
and most powerful creation of the human spirit.
Mathematics is as old as Man. ”
Stefan Banach (1892 - 1945)
2.1
Espaces vectoriels
Pour la facilité du lecteur, nous commençons par les définitions de base pour les espaces
vectoriels.
Définition 2.1. Un espace vectoriel V sur un corps K est un ensemble muni de deux
applications : l’addition V × V → V : (v, w) 7→ v + w et la multiplication scalaire
K × V → V : (k, v) 7→ kv, telles que
(i) (V, +) est un groupe commutatif,
(ii) 1 v = v,
(iii) c(v + w) = cv + cw,
(iv) (c1 + c2 )v = c1 v + c2 v,
(v) c1 (c2 v) = (c1 c2 )v,
pour tout c, c1 , c2 ∈ K et v, w ∈ V .
Exemples.
1. L’ensemble Kn , muni de l’addition (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
et de la multiplication scalaire c(x1 , . . . , xn ) = (cx1 , . . . , cxn ), est un espace vectoriel
sur le corps K.
23
2. Soit X un ensemble et E un espace vectoriel sur K. L’ensemble E X des fonctions
de X dans E, muni de l’addition (f + g)(x) = f (x) + g(x) et de la multiplication
scalaire (cf )(x) = cf (x), est un espace vectoriel sur K.
N
Les éléments d’un espace vectoriel sont appelés vecteurs, alors que les éléments de K sont
appelés scalaires. Le neutre du groupe (V, +) est le vecteur nul, noté 0.
Soit S ⊂ V . Une combinaison linéaire d’éléments de S est un vecteur de V s’écrivant
c1 v1 + . . . + ck vk ,
avec c1 , . . . , ck ∈ K et v1 , . . . , vk ∈ S. Insistons bien sur le fait qu’une combinaison linéaire
n’implique qu’un nombre fini de vecteurs.
L’ensemble S est appelé partie génératrice de V si tout vecteur de V est une combinaison linéaire d’éléments de S. L’ensemble S est appelé partie libre de V si, pour tout
c1 , . . . , ck ∈ K et v1 , . . . , vk ∈ S, on a
c1 v1 + . . . + ck vk = 0
=⇒
c1 = . . . = ck = 0.
Les éléments d’une partie libre sont dits linéairement indépendants.
Une base de V est une partie libre et génératrice de V . On montre que tout espace vectoriel
admet une base, et que deux bases de V ont même cardinal (il existe une bijection entre
elles). La dimension de V , notée dim V , est le nombre d’éléments d’une base de V .
Exemples.
1. La dimension de Kn , en tant qu’espace vectoriel sur K, est n. Mais la dimension de
Cn , en tant qu’espace vectoriel sur R, est 2n.
2. Soit X un ensemble de cardinal infini et E un espace vectoriel sur K. Alors l’espace
vectoriel E X sur K est de dimension infinie.
N
Un sous-espace vectoriel W de V est un sous-ensemble W ⊂ V qui est un espace
vectoriel sur le même corps que V . Soit S ⊂ V . L’espace vectoriel engendré par S est
le plus petit sous-espace vectoriel de V contenant S ; on vérifie aisément que c’est aussi
l’ensemble des combinaisons linéaires d’éléments de S. Si W est un sous-espace vectoriel
de V , alors dim W ≤ dim V .
Définition 2.2. Une application A : V → W entre deux espaces vectoriels V et W sur le
même corps K est dite linéaire si
(i) A(v1 + v2 ) = A(v1 ) + A(v2 ),
(ii) A(cv) = cA(v),
pour tout c ∈ K et v, v1 , v2 ∈ V .
Le noyau ker A d’une application linéaire A : V → W est défini par
ker A = {v ∈ V | A(v) = 0}.
C’est un sous-espace vectoriel de V . L’image im A de A est définie par
im A = {Av ∈ W | v ∈ V }.
24
C’est un sous-espace vectoriel de W . Une application linéaire A : V → W est un isomorphisme si A est bijective, ou de manière équivalente si ker A = {0} et im A = W . L’inverse
A−1 d’un isomorphisme A est encore un isomorphisme. Deux espaces vectoriels sont isomorphes si il existe un isomorphisme entre eux. Deux espaces vectoriels isomorphes sont
tout-à-fait équivalents, au sens où ils possèdent exactement les mêmes propriétés.
Exemples.
1. Tout espace vectoriel sur K de dimension finie n est isomorphe à Kn .
2. Toute application linéaire A : Kn → Km correspond à la donnée d’une matrice m × n
à coefficients dans K.
N
Soient W1 et W2 deux sous-ensembles de V . La somme W1 + W2 de W1 et W2 est définie
par
W1 + W2 = {w1 + w2 | w1 ∈ W1 , w2 ∈ W2 }.
Si W1 et W2 sont des sous-espaces vectoriels de V , leur somme W1 + W2 est le sous-espace
vectoriel de V engendré par W1 ∪ W2 . De plus, dim(W1 + W2 ) = dim W1 + dim W2 −
dim(W1 ∩ W2 ). Cette somme est dite directe et notée W1 ⊕ W2 si de plus tout élément
de W1 + W2 s’écrit de manière unique comme la somme w1 + w2 d’un élément de w1 ∈ W1
et d’un élément de w2 ∈ W2 , ou de manière équivalente si W1 ∩ W2 = {0}. Dans ce cas,
dim(W1 ⊕ W2 ) = dim W1 + dim W2 .
L’application linéaire
P1 : W1 ⊕ W2 → W1 : w1 + w2 7→ w1
est appelée projection sur W1 parallèlement à W2 . On définit P2 : W1 ⊕ W2 → W2 de
manière analogue.
Si W1 ⊕ W2 = V , on dit que W1 et W2 sont supplémentaires algébriques. Dans ce cas,
la codimension de W1 est la dimension de W2 et vice versa.
Soit W un sous-espace vectoriel de V et v ∈ V . La classe latérale v + W de v dans V
est l’ensemble
v + W = {v + w | w ∈ W }.
Ainsi, deux classes latérales v1 + W et v2 + W sont égales si et seulement si v1 − v2 ∈ W .
De plus, deux classes latérales de W qui ne sont pas égales sont disjointes, de sorte que
les classes latérales de W forment une partition de V .
Le quotient V /W de V par W est l’ensemble des classes latérales de W dans V . C’est
naturellement un espace vectoriel, avec l’addition définie par
(v1 + W ) + (v2 + W ) = (v1 + v2 ) + W,
pour tout v1 , v2 ∈ V , et la multiplication scalaire définie par
c(v + W ) = cv + W,
pour tout c ∈ K et v ∈ V . Si W est de dimension finie, alors dim V /W = dim V − dim W .
Proposition 2.3. Toute application linéaire A : V → W induit un isomorphisme
e : V / ker A → im A : v + ker A 7→ Av.
A
25
e est bien définie, car si v + ker A = v ′ + ker A, alors v − v ′ ∈
Démonstration. L’application A
e + ker A) = Av = Av ′ + A(v − v ′ ) = Av ′ = A(v
e ′ + ker A).
ker A et donc A(v
e est linéaire car A((v
e
e +
L’application A
+ v ′ ) + ker A) = A(v + v ′ ) = Av + Av ′ = A(v
′
e + ker A).
ker A) + A(v
e est injective, car si A(v
e + ker A) = 0 alors Av = 0 donc v ∈ ker A
L’application linéaire A
et v + ker A = 0 + ker A ∈ V / ker A.
e coı̈ncide avec celle de A, l’application linéaire A
e : V / ker A → im A
Comme l’image de A
est un isomorphisme.
Soient V1 et V2 deux espaces vectoriels sur K. Alors leur produit V1 × V2 est également
un espace vectoriel sur K, avec l’addition définie par
(v1 , v2 ) + (v1′ , v2′ ) = (v1 + v1′ , v2 + v2′ ),
pour tout v1 , v1′ ∈ V1 , v2 , v2′ ∈ V2 , et la multiplication scalaire définie par
c(v1 , v2 ) = (cv1 , cv2 ),
pour tout v1 ∈ V1 , v2 ∈ V2 et c ∈ K. De plus, dim(V1 × V2 ) = dim V1 + dim V2 .
Exemples.
1. Soient Y ⊂ X deux ensembles et E un espace vectoriel sur K. Soit V le sous-espace
vectoriel de E X constitué des fonctions de X dans E s’annulant sur Y . Alors le
quotient E X /V est isomorphe à E Y .
2. Soient X1 , X2 deux ensembles disjoints et E un espace vectoriel sur K. Alors le
produit E X1 × E X2 est isomorphe à E X1 ∪X2 .
N
2.2
2.2.1
Espaces normés
Définitions
Dans la suite, le corps K désignera R ou C, de sorte que pour tout c ∈ K, la notation |c|
désignera la valeur absolue ou le module de c respectivement.
Définition 2.4. Un espace normé est un espace vectoriel V sur un corps K muni d’une
norme, c’est-à-dire une application V → R+ : v 7→ kvk telle que
(i) si kvk = 0 alors v = 0,
(ii) kcvk = |c| kvk,
(iii) kv + wk ≤ kvk + kwk,
pour tout c ∈ K et v, w ∈ V .
26
Exemples.
1. Pour 1 ≤ p ≤ ∞, on définit une norme k · kp sur Kn par
!1
n
p
X
kxkp =
|xi |p
,
1 ≤ p < ∞,
i=1
kxk∞ =
max |xi |,
1≤i≤n
pour tout x = (x1 , . . . , xn ) ∈ Kn .
2. Si E est un espace normé et 1 ≤ p ≤ ∞, on note par lp (E) l’espace vectoriel des
suites x = (xn )n∈N dans E (ou encore le sous-espace vectoriel de E N ) telles que
!1
∞
p
X
< ∞,
1 ≤ p < ∞,
|xn |p
kxkp =
n=0
kxk∞ = sup |xn | < ∞.
n∈N
lp (E)
Alors
est un espace normé avec la norme k · kp .
3. Si X est un ensemble et E est un espace normé, on note par B(X, E) l’ensemble
des applications bornées de X vers E. Alors B(X, E) est un sous-espace vectoriel de
E X . On définit une norme k · k∞ sur B(X, E) à partir de la norme k · kE sur E par
kf k∞ = sup kf (x)kE
x∈X
pour tout f ∈ B(X, E).
N
Une norme pour V permet de définir une distance d sur V par d(v, w) = kv − wk. Ainsi,
un espace normé est également un espace métrique (et donc aussi un espace topologique).
Par ailleurs, un espace normé est un cas particulier pour la définition suivante.
Définition 2.5. Un espace vectoriel topologique est un espace vectoriel V sur le corps
K muni d’une topologie telle que
(i) l’addition V × V → V : (v, w) 7→ v + w est continue,
(ii) la multiplication scalaire K × V → V : (k, v) 7→ kv est continue.
Un sous-espace vectoriel de V , muni de la topologie induite, est encore un espace vectoriel
topologique.
Proposition 2.6. L’adhérence W d’un sous-espace vectoriel W de V est encore un sousespace vectoriel.
Démonstration. Soient w ∈ W , c ∈ K et (wn ) une suite dans W convergeant vers w. Alors
cwn ∈ W et limn→∞ cwn ∈ W . Par continuité de la multiplication scalaire, cette limite
s’écrit également limn→∞ cwn = c limn→∞ wn = cw de sorte que cw ∈ W .
Soient w, w′ ∈ W et (wn ), (wn′ ) deux suites dans W convergeant vers w et w′ respectivement. Alors wn + wn′ ∈ W et limn→∞ wn + wn′ ∈ W . Par continuité de l’addition, cette
limite s’écrit également limn→∞ wn + wn′ = limn→∞ wn + limn→∞ wn′ = w + w′ , de sorte
que w + w′ ∈ W .
27
Soit S ⊂ V . L’espace vectoriel fermé engendré par S est le plus petit sous-espace
vectoriel fermé de V contenant S. C’est aussi l’adhérence de l’espace vectoriel engendré
par S.
Soient W1 et W2 deux sous-espaces vectoriels de V tels que W1 ∩ W2 = {0}. Leur somme
W1 + W2 est dite topologique et est notée W1 ⊕ W2 si les projections P1 : W1 + W2 → W1
et P2 : W1 + W2 → W2 sont continues. Si V = W1 ⊕ W2 , on dit que W1 et W2 sont
supplémentaires topologiques. Dans ce cas, W1 et W2 sont nécessairement fermés.
Exemples.
1. Tout sous-espace vectoriel de Kn est fermé. Plus généralement, tout sous-espace
vectoriel de dimension finie dans un espace vectoriel topologique est fermé.
2. Si X est un espace topologique et E est un espace normé, on note par Cb0 (X, E)
l’ensemble des applications continues et bornées de X vers E. Alors Cb0 (X, E) est
un sous-espace vectoriel fermé dans B(X, E).
N
2.2.2
Normes équivalentes
Définition 2.7. Deux normes k·k1 et k·k2 sur un espace vectoriel V sont dites équivalentes si il existe des constantes α, β > 0 telles que
αkvk1 ≤ kvk2 ≤ βkvk1 ,
pour tout v ∈ V .
Soit Bi (x, r) = {y ∈ V | ky − xki < r} la boule ouverte de centre x ∈ V et de rayon
r > 0 pour la norme k · ki , avec i = 1, 2. La double inégalité dans la définition ci-dessus
est équivalente à l’emboitement des boules suivantes :
B2 (0, α) ⊂ B1 (0, 1) ⊂ B2 (0, β).
Ceci est illustré par la figure 2.1 pour les normes kxk1 = |x1 |+|x2 | et kxk2 =
avec x = (x1 , x2 ) ∈ R2 .
p
|x1 |2 + |x2 |2
B2 (0, β)
B1 (0, 1)
B2 (0, α)
Fig. 2.1 – Emboitement de boules dans le plan.
Cette notion d’équivalence se justifie à la fois d’un point de vue topologique et d’un point
de vue métrique.
28
Proposition 2.8. Deux normes pour un espace vectoriel V sont équivalentes si et seulement si elles induisent la même topologie sur V .
Démonstration. Noton encore Bi (x, r) = {y ∈ V | ky − xki < r} la boule ouverte de centre
x ∈ V et de rayon r > 0 pour la norme k · ki , avec i = 1, 2.
Si les normes k · k1 et k · k2 sont équivalentes, il suffit de montrer que toute boule ouverte
centrée à l’origine pour k · k1 est un ouvert pour k · k2 et vice versa. Soit x ∈ B1 (0, r), et
posons s = kxk1 < r. Alors B2 (x, α(r − s)) ⊂ B1 (0, r). En effet, si ky − xk2 < α(r − s),
alors ky − xk1 < r − s et kyk1 ≤ kxk1 + ky − xk1 < r.
Inversement, si les normes k · k1 et k · k2 induisent la même topologie sur V , alors B1 (0, 1)
est un voisinage de l’origine pour la topologie induite par k · k2 . Par conséquent, il existe
β > 0 satisfaisant B2 (0, β2 ) ⊂ B1 (0, 1). Par conséquent, pour tout r > 0, on a B2 (0, 2r) ⊂
B1 (0, βr), et donc si kxk2 = r alors kxk1 < βr = βkxk2 . L’autre inégalité s’obtient en
échangeant les rôles des normes k · k1 et k · k2 .
D’autre part, si deux normes pour un espace vectoriel V sont équivalentes, toute suite
qui est de Cauchy pour l’une de ces normes est également de Cauchy pour l’autre norme.
De même, une fonction uniformément continue pour l’une de ces normes est également
uniformément continue pour l’autre norme.
Les considérations ci-dessus sont sans importance dans le cas des espaces vectoriels de
dimension finie.
Théorème 2.9. Sur un espace vectoriel de dimension finie, toutes les normes sont équivalentes.
Démonstration. Prenons V = Kn , muni de la base canonique e1 , . . . , en . Pour tout x =
P
n
n
n
i=1 xi ei ∈ K , on définit kxk∞ = max1≤i≤n |xi |. Alors k · k∞ est une norme sur K et il
suffit de montrer que toute norme k · k sur Kn lui est équivalente.
P
Pour tout x = ni=1 xi ei ∈ Kn , on a
kxk = k
≤
où on a posé β =
continue.
Pn
i=1 kei k
n
X
i=1
n
X
i=1
xi ei k
|xi |kei k
≤ βkxk∞ ,
> 0. En particulier, l’application N : V → R+ : x 7→ kxk est
L’ensemble S = {x ∈ Kn | kxk∞ = 1} est un compact. Comme N est continue sur S et
ne s’y annule pas, il existe α > 0 tel que N (x) ≥ α pour tout x ∈ S. Autrement dit, si
kxk∞ = 1 alors kxk ≥ α = αkxk∞ .
29
Les espaces normés de dimension finie jouissent donc de propriétés bien plus agréables
que ceux de dimension infinie. En fait, les espaces normés de dimension finie peuvent être
caractérisés parmi tous les espaces normés au moyen d’une propriété topologique de ses
parties bornées. Pour montrer cela, nous avons besoin du lemme suivant.
Lemme 2.10 (Riesz). Soit V un espace normé et F ( V un sous-espace vectoriel fermé
de V . Alors, pour tout ǫ > 0, il existe v ∈ V tel que kvk = 1 et kv − xk ≥ 1 − ǫ pour tout
x ∈ F.
Démonstration. Soit w ∈ V \ F . Comme F est fermé, d = d(w, F ) > 0. Choisissons x0 ∈ F
tel que
d
.
d ≤ kw − x0 k ≤
1−ǫ
Alors v =
w−x0
kw−x0 k
convient. En effet, pour tout x ∈ F ,
kv − xk = k
1
1−ǫ
w − x0
− xk =
kw − (x0 + kw − x0 kx)k ≥
d,
kw − x0 k
kw − x0 k
d
puisque x0 + kw − x0 kx ∈ F .
Théorème 2.11 (Riesz). Un espace normé V est de dimension finie si et seulement si
la boule unité B V (0, 1) est compacte.
Démonstration. Si V est de dimension finie, comme la boule unité B V (0, 1) est bornée et
fermée, elle est compacte.
Si V est de dimension infinie, il existe collection infinie de sous-espaces vectoriels Vn ,
n = 1, 2, . . ., de dimension finie tels que Vn ( Vn+1 . En appliquant le lemme 2.10 au
sous-espace fermé Vn ⊂ Vn+1 avec ǫ = 12 , on obtient vn+1 ∈ Vn+1 ∩ B V (0, 1) tel que
d(vn+1 , Vn ) > 12 . En particulier, kvn+k − vn k > 21 , de sorte que l’on ne peut extraire
aucune sous-suite convergente de la suite (vn ) dans B V (0, 1). Par conséquent, B V (0, 1)
n’est pas compacte.
2.2.3
Applications linéaires bornées
Définition 2.12. Une application linéaire A : V → W entre deux espaces normés est dite
bornée si il existe une constante α > 0 telle que
kAvkW ≤ αkvkV ,
pour tout v ∈ V .
Proposition 2.13. Soit A : V → W une application linéaire entre espaces normés. Les
propriétés suivantes sont équivalentes :
(i) A est bornée ;
(ii) A est uniformément continue ;
30
(iii) A est continue ;
(iv) A est continue en un point v0 ∈ V ;
(v) A est continue à l’origine ;
(vi) l’image par A de tout sous-ensemble borné de V est bornée dans W ;
(vii) l’image par A de toute suite bornée dans V est bornée dans W .
Démonstration. Les implications (ii) ⇒ (iii), (iii) ⇒ (iv) et (vi) ⇒ (vii) sont évidentes.
L’implication (iv) ⇒ (v) est une conséquence immédiate de la linéarité de A.
(i) ⇒ (ii). Si A est bornée, alors il existe α > 0 tel que kAvkW ≤ αkvkV pour tout
v ∈ V . Par conséquent, pour tout ǫ > 0, si v1 , v2 ∈ V avec kv1 − v2 kV < ǫ/α, alors
kAv1 − Av2 kW < ǫ comme souhaité.
(v) ⇒ (i). Si A est continue à l’origine, il existe α > 0 tel que A(BV (0, α−1 )) ⊂ BW (0, 1).
Autrement dit, si kvkV = α−1 k avec k ∈ [0, 1], alors kAvkW ≤ k = αkvkV .
(i) ⇒ (vi). Si kAvkW ≤ αkvkV pour tout v ∈ V et kvkV ≤ M , alors kAvkW ≤ αM .
(vii) ⇒ (i). Supposons par contradiction que A n’est pas bornée. Pour tout n ∈ N, il
existe donc vn ∈ V tel que kAvn kW > nkvn kV . Par conséquent, l’image de la suite bornée
vn /kvn kV n’est pas bornée dans W , une contradiction.
La norme kAk d’une application linéaire bornée A : V → W est définie par
kAk = sup
v∈V
v6=0
kAvk
.
kvk
Proposition 2.14. Soient U , V et W des espaces normés ; soient A : U → V , B : V → W
et C : V → W des applications linéaires bornées. Alors
(i) kB + Ck ≤ kBk + kCk,
(ii) kB ◦ Ak ≤ kBk kAk.
Démonstration.
(i) Par l’inégalité triangulaire, on a
kB + Ck = sup
v∈V
v6=0
k(B + C)vk
kBvk
kCvk
≤ sup
+ sup
= kBk + kCk.
kvk
v∈V kvk
v∈V kvk
v6=0
v6=0
(ii) Pour tout v ∈ V , on a kBvk ≤ kBk kvk. Par conséquent,
kB ◦ Ak = sup
v∈V
v6=0
kAvk
kB ◦ Avk
≤ sup kBk
= kBk kAk.
kvk
kvk
v∈V
v6=0
31
Proposition 2.15. Une application linéaire A : V → W surjective possède un inverse
borné A−1 : W → V si et seulement si il existe une constante m > 0 telle que
kAvkW ≥ mkvkV ,
pour tout v ∈ V . Dans ce cas, kA−1 k ≤
(2.1)
1
m.
Démonstration. Si (2.1) est satisfaite, A est injective car kAvkW = 0 implique kvkV = 0.
Donc A−1 existe. En posant w = Av, l’équation (2.1) devient
kwkW ≥ mkA−1 wkV ,
de sorte que kA−1 k ≤
1
m.
Inversement, si A−1 existe et est borné, on a
kA−1 wkW ≤ kA−1 kkwkW ,
pour tout w ∈ W . En posant v = A−1 w, ceci devient (2.1) avec m =
1
.
kA−1 k
Exemples.
1. Toute application linéaire A : Km → Kn est bornée, quelles que soient les normes
sur Km et Kn .
2. Soit X un ensemble, E un espace normé sur K et f ∈ B(X, K). On définit une
application linéaire Mf : B(X, E) → B(X, E) par Mf g = f g pour tout g ∈ B(X, E).
Alors Mf est bornée et kMf k = kf k.
Si de plus il existe m > 0 tel que |f (x)| ≥ m pour tout x ∈ X, alors Mf possède un
1
.
N
inverse Mf−1 = Mf −1 et kMf−1 k ≤ m
2.2.4
Opérateurs linéaires
Pour généraliser la notion d’application linéaire, nous allons maintenant considérer certaines fonctions entre espaces normés qui ne sont pas définies sur tout l’espace normé de
départ.
Définition 2.16. Un opérateur linéaire T entre deux espaces normés E et F est une
application linéaire T : D(T ) ⊂ E → F définie sur un sous-espace vectoriel D(T ) ⊂ E
appelé domaine de T .
Le graphe G(T ) d’un opérateur linéaire T : D(T ) ⊂ E → F est le sous-espace vectoriel
de E × F défini par
G(T ) = {(x, T x) ∈ E × F | x ∈ D(T )}.
Définition 2.17. On dit qu’un opérateur linéaire T : D(T ) ⊂ E → F est borné si il
existe une constante α > 0 telle que
kT vkW ≤ αkvkV ,
pour tout v ∈ D(T ).
32
On peut toujours remplacer l’étude d’un opérateur linéaire borné T : D(T ) ⊂ E → F par
celle de l’application linéaire bornée A : D(T ) → F : v 7→ T v, où l’espace vectoriel D(T )
est muni de la norme induite par E. Par conséquent, toutes les propriétés des applications
linéaires bornées s’appliquent aux opérateurs linéaires bornés.
Théorème 2.18. Soit T : D(T ) ⊂ E → F un opérateur linéaire borné. Si F est complet,
alors T possède une unique extension linéaire bornée T : D(T ) ⊂ E → F . De plus,
kT k = kT k.
Démonstration. La définition de T est semblable à celle de f dans la preuve de la proposition 1.10. Soit v ∈ D(T ) et soit (vn ) une suite dans D(T ) qui converge vers v. Alors (T vn )
est une suite de Cauchy dans F . En effet,
kT vn − T vm k ≤ kT k kvn − vm k → 0,
n, m → ∞.
Comme F est complet, cette suite est convergente. On vérifie aisément que la limite ne
dépend pas du choix de la suite (vn ) convergeant vers v. On peut donc définir T : D(T ) ⊂
E → F par
T v = lim T vn .
n→∞
Cette application est linéaire car T l’est. De plus,
kT vk = lim kT vn k ≤ kT k lim kvn k = kT k kvk
n→∞
n→∞
pour tout v ∈ D(T ), de sorte que kT k ≤ kT k. Une telle extension continue de T est unique
par la proposition 1.5. Enfin, on a
kT vk
kT vk
≥ sup
= kT k,
kvk
v∈D(T ) kvk
v∈D(T )
kT k = sup
v6=0
v6=0
de sorte que kT k ≥ kT k. Donc kT k = kT k.
Un opérateur linéaire qui n’est pas borné ne s’étend en général pas à l’adhérence de son
domaine. Un cas très intéressant en pratique est celui des opérateurs linéaires non bornés
dont le domaine est dense dans l’espace normé de départ.
Exemple. Considérons l’opérateur linéaire
px : D(px ) ⊂ Cb0 (R3 , C) → Cb0 (R3 , C) : f 7→ −i~
∂
f
∂x
ayant pour domaine D(px ) l’espace vectoriel Cb1 (R3 , C) des fonctions différentiables bornées
et de différentielle bornée. Le domaine D(px ) est dense dans Cb0 (R3 , C) et l’opérateur px
n’est pas borné pour la norme k · k∞ sur Cb0 (R3 , C) car kpx sin nxk∞ → ∞ lorsque n → ∞.
Cet opérateur apparaı̂t naturellement en mécanique quantique, mais sur un espace normé
plus grand que Cb0 (R3 , C).
33
Remarquons que cet opérateur linéaire peut aussi être considéré comme une application
linéaire
∂
p′x : Cb1 (R3 , C) → Cb0 (R3 , C) : f 7→ −i~ f
∂x
∂f
∂f
1
3
qui est bornée pour la norme kf k1,∞ = kf k∞ + k ∂f
∂x k∞ + k ∂y k∞ + k ∂z k∞ sur Cb (R , C).
Ce point de vue n’est pas toujours utile, car on s’intéresse en mécanique quantique aux
valeurs propres de tels opérateurs. Or, pour les étudier, il faut garder espace de départ et
d’arrivée identiques.
N
2.3
Espaces de Banach
2.3.1
Définition
Définition 2.19. Un espace de Banach est un espace normé complet.
Exemples.
1. Par le théorème 2.9, tout espace normé de dimension finie est un espace de Banach.
2. Si E est un espace de Banach et 1 ≤ p ≤ ∞, alors lp (E), muni la norme k · kp , est
un espace de Banach.
3. Soit X un ensemble et E est un espace de Banach. L’espace vectoriel B(X, E), muni
de la norme k · k∞ , est un espace de Banach.
Si de plus X est un espace topologique, alors Cb0 (X, E) muni de la norme induite
par k · k∞ (que l’on notera encore k · k∞ ) est aussi un espace de Banach.
4. RSoit 1 ≤ p < ∞ ; l’espace vectoriel des fonctions f : Rn → K continues telles que
p
Rn |f (x)| dx < ∞ peut être muni de la norme
kf kp =
Z
p
Rn
|f (x)| dx
1
p
.
La complétion de cet espace normé est un espace de Banach noté Lp (Rn , K).
2.3.2
N
Théorèmes de l’application ouverte et du graphe fermé
Théorème 2.20 (Théorème de l’application ouverte). Soient V et W deux espaces
de Banach et soit A : V → W une application linéaire bornée et surjective. Alors l’image
par A d’un ouvert de V est un ouvert de W .
Démonstration. Il suffit de montrer que l’image par A de BV (0, 1) contient BW (0, r)
lorsque r > 0 est suffisamment petit. Commençons par montrer qu’il existe r > 0 tel
que
(2.2)
BW (0, 2r) ⊂ A(BV (0, 1)).
34
Posons Wn = A(BV (0, n)), de sorte que ∪n>0 Wn = W . Par le théorème de Baire, il existe
donc n0 > 0 tel que int(Wn0 ) 6= ∅. Par conséquent, int(A(BV (0, 1))) 6= ∅, et il existe r > 0
et y ∈ W tels que BW (y, 4r) ⊂ A(BV (0, 1)). Par symétrie, on a −y ∈ A(BV (0, 1)), de
sorte que
BW (0, 4r) = −y + BW (y, 4r) ⊂ A(BV (0, 1)) + A(BV (0, 1)) = A(BV (0, 2)).
Montrons ensuite que
BW (0, r) ⊂ A(BV (0, 1)).
Fixons y ∈ BW (0, r) et cherchons par approximation successives un élément x ∈ BV (0, 1)
tel que Ax = y. Pour cela, construisons par récurrence une suite (zn ) dans V telle que
zn ∈ BV (0, 21n ) et ky − A(z1 + . . . + zn )kW < 2rn .
En vertu de (2.2), pour tout ye ∈ BW (0, rL), pour tout ǫ > 0, il existe z ∈ BV (0, 12 L) tel
que ky − AzkW < ǫ. Soit z1 ∈ BV (0, 12 ) un tel vecteur pour ye = y ∈ BW (0, r) et ǫ = 2r .
1
, soit zk ∈ BV (0, 21k ) un tel vecteur pour
Lorsque k > 1 et L = 2k−1
ye = y − A(z1 + . . . + zk−1 ) ∈ BW (0,
r
2k−1
)
et ǫ = 2rk .
La suite xn = z1 + . . . + zn est de Cauchy dans V , car
kxn+k − xn kV ≤
n+k
X
i=n+1
kzi kV <
1
.
2n
Soit x ∈ V la limite de la suite (xn ). Alors kxkV = limn→∞ kxn kV < 1 et comme A est
continue, ky − AxkW = limn→∞ ky − Axn kW = 0, de sorte que x ∈ V est bien l’élément
recherché.
Corollaire 2.21. Soient V et W deux espaces de Banach et soit A : V → W une application linéaire continue et bijective. Alors A−1 est également continue.
Théorème 2.22 (Théorème du graphe fermé). Soient V et W deux espaces de Banach
et soit A : V → W une application linéaire. Si le graphe G(A) de A est fermé dans V × W ,
alors A est continue.
Bien entendu, la réciproque est également vraie, puisque toute fonction continue a un
graphe fermé.
Démonstration. L’espace vectoriel V est muni de la norme k · k1 = k · kV qui en fait un
espace de Banach. On peut définir une autre norme k · k2 sur V par
kvk2 = kvkV + kAvkW ,
pour tout v ∈ V . Vérifions que V , muni de la norme k · k2 , est encore un espace de Banach.
Soit (vn ) une suite de Cauchy pour k · k2 . Comme kvk1 ≤ kvk2 pour tout v ∈ V , la suite
(vn ) dans V est de Cauchy pour k · k1 . De même, comme kAvkW ≤ kvk2 pour tout v ∈ V ,
35
la suite (Avn ) dans W est de Cauchy pour k·kW . Comme V et W sont complets, ces suites
convergent respectivement vers v ∈ V et w ∈ W . Comme G(A) est fermé, (v, w) ∈ G(A)
de sorte que w = Av. Par conséquent, la suite (vn ) converge vers v au sens de la norme
k · k2 , comme désiré.
L’inégalité kvk1 ≤ kvk2 pour tout v ∈ V signifie également que l’application linéaire
surjective
I : (V, k · k2 ) → (V, k · k1 ) : v 7→ v
entre espaces de Banach est bornée. Par le théorème de l’application ouverte, il existe c > 0
tel que kvk2 ≤ ckvk1 pour tout v ∈ V . Les normes k · k1 et k · k2 sont donc équivalentes.
En particulier, on a kAvkW ≤ (c − 1)kvkV comme souhaité.
2.3.3
Projecteurs
Définition 2.23. Un projecteur P sur un ensemble V est une application P : V → V
idempotente, c’est-à-dire telle que P 2 = P .
Nous nous intéresserons particulièrement aux projecteurs linéaires bornés sur un espace
de Banach V .
Proposition 2.24. Soit V un espace de Banach et P un projecteur linéaire borné sur V .
Alors
(i) I − P est aussi un projecteur linéaire borné,
(ii) im P = ker(I − P ) et ker P = im(I − P ),
(iii) V = ker P ⊕ im P ,
(iv) ker P et im P sont des sous-espaces vectoriels fermés de V ,
(v) si P 6= 0, alors kP k ≥ 1.
Démonstration.
(i) (I − P )2 = I − 2P + P 2 = I − P .
(ii) x ∈ im P ssi x = P x, car x = P y implique P x = P 2 y = P y = x. Or, x = P x ssi
x ∈ ker(I − P ). La deuxième relation s’obtient en remplaçant P par I − P dans la
première.
(iii) V = im P + im(I − P ) car tout v ∈ V se décompose en v = P v + (I − P )v. Cette
somme est directe car im P ∩ im(I − P ) = im P ∩ ker P = {0}. En effet, si y = P x
et P y = 0 alors 0 = P 2 x = P x = y. Enfin, cette somme est topologique car P est
continu.
(iv) ker P est fermé car P est continu, et de même pour im P = ker(I − P ).
(v) kP k = kP 2 k ≤ kP k2 .
36
Inversement, si un espace vectoriel V est une somme directe V = W1 ⊕ W2 , alors la
projection P1 : V → W1 parallèlement à W2 et la projection P2 : V → W2 parallèlement
à W1 sont des projecteurs linéaires tels que P1 + P2 = I.
Proposition 2.25. Soient W1 et W2 des sous-espaces vectoriels fermés dans un espace de
Banach V . Si W1 et W2 sont supplémentaires algébriques, alors les projecteurs linéaires
P1 et P2 sont bornés. En particulier, W1 et W2 sont supplémentaires topologiques.
Démonstration. Il suffit de prouver que P1 est borné, la preuve pour P2 étant identique.
Soit (vn , P1 vn ) une suite dans G(P1 ) convergeant vers (v, w) ∈ V ×V . Comme W1 est fermé
et P1 vn ∈ W1 , on doit avoir w ∈ W1 . De plus, comme W2 est fermé et vn − P1 vn ∈ W2 ,
on a v − w ∈ W2 , de sorte que P1 (v − w) = 0. Par conséquent, P1 v = P1 w = w et
(v, w) = (v, P1 v) ∈ G(P1 ). Donc G(P1 ) est fermé et, par le théorème du graphe fermé, P1
est borné.
2.4
Fonctionnelles linéaires et dualité
Définition 2.26. Une fonctionnelle linéaire sur un espace vectoriel V sur un corps K est
une application linéaire f : V → K.
Proposition 2.27. Soit f : V → K une fonctionnelle linéaire non identiquement nulle.
Le noyau H = ker f de f est un sous-espace vectoriel de codimension 1 dans V . Si f est
continue, H est fermé, sinon H est dense dans V .
Démonstration. Soit a ∈ V tel que f (a) 6= 0, et soit Ka ⊂ V le sous-espace vectoriel
engendré par v. Alors H ⊕ Ka = V . En effet, pour tout v ∈ V , on peut écrire v = v1 + v2
(v)
a ∈ Ka et v1 = v − v2 ∈ H. Comme H ∩ Ka = {0}, on a bien une somme
avec v2 = ff (a)
directe et H est de codimension 1.
Comme H ⊂ H ⊂ V , on a soit H = H, soit H = V . Il ne reste plus qu’à montrer que f
est continue si et seulement si H est fermé.
Si f est continue, H = f −1 (0) est fermé car c’est l’image inverse du fermé {0} par f
continue.
Inversement, si H est fermé alors a + H ⊂ V l’est aussi. Comme 0 ∈
/ a + H, il existe r > 0
tel que B(0, r) ∩ (a + H) = ∅. Par conséquent, pour tout v ∈ B(0, r), on a |f (v)| < 1. En
effet, si f (v) = α > 1 alors αv ∈ B(0, r) ∩ (a + H). On a donc montré que si kvk < r alors
|f (v)| < 1, c’est-à-dire que f est bornée.
L’ensemble des fonctionnelles linéaires sur un espace vectoriel V est un espace vectoriel
appelé dual algébrique de V , que l’on note V ∗ .
Soit V un espace vectoriel topologique. L’ensemble des fonctionnelles linéaires continues
sur V est un espace vectoriel appelé dual topologique de V , que nous noterons V ′ .
37
Lorsque V est de dimension finie, les notions de dual algébrique et topologique coı̈ncident,
puisque toute fonctionnelle linéaire est bornée dans ce cas. C’est pourquoi on parle alors
simplement de dual.
La norme des opérateurs devient, dans le cas d’une fonctionnelle linéaire continue, la norme
kf kV ′ = sup
v∈V
v6=0
|f (v)|
,
kvkV
appelée norme duale. L’espace vectoriel V ′ , muni de la norme duale, est un espace normé.
La dualité entre les espaces normés V et V ′ s’exprime par la forme bilinéaire canonique
h·, ·i : V ′ × V → K
définie par hf, vi = f (v). Il s’agit bien d’une application à la fois linéaire en f ∈ V ′ et en
v ∈ V . Par ailleurs, la définition de la norme duale donne
|hf, vi| = |f (v)| ≤ kf kV ′ kvkV ,
(2.3)
pour tout f ∈ V ′ et v ∈ V .
Bien que la relation de dualité entre V et V ′ semble symétrique, le dual topologique V ′
possède en général de meilleures propriétés que l’espace V original.
Proposition 2.28. Pour tout espace normé V , le dual topologique V ′ est un espace de
Banach.
Démonstration. Soit (fn ) une suite de Cauchy dans V ′ . Pour tout v ∈ V , on a
|fn (v) − fm (v)| = |hfn − fm , vi| ≤ kfn − fm kV ′ kvkV ,
de sorte que fn (v) est une suite de Cauchy dans R. On peut donc définir une application
f : V → R par
f (v) = lim fn (v),
n→∞
pour tout v ∈ V . Clairement, f est linéaire. D’autre part, f est bornée. En effet, pour tout
v ∈ V , on a
|f (v)| = lim |fn (v)| ≤ lim kfn kV ′ kvkV .
n→∞
n→∞
Comme la suite (fn ) est de Cauchy, elle est bornée et limn→∞ kfn kV ′ = α < ∞.
Vérifions maintenant que la suite (fn ) converge vers f dans V ′ . Pour tout ǫ > 0 il existe
N ∈ N tel que si m, n > N , alors kfn − fm kV ′ < ǫ. Par conséquent,
|fn (v) − fm (v)| ≤ ǫkvkV ,
pour tout v ∈ V . En faisant tendre m vers l’infini dans cette inégalité, on obtient
|fn (v) − f (v)| ≤ ǫkvkV ,
de sorte que kf − fn kV ′ → 0 lorsque n → ∞.
38
Le dual topologique de V ′ , noté V ′′ , est appelé bidual de V . Pour tout v ∈ V , on peut
définir une fonctionnelle linéaire continue V ′ → K : f 7→ hf, vi = f (v). En vertu de
l’équation (2.3), la norme de cette fonctionnelle est donnée par kvk. Modulo l’identification
de v avec cette fonctionnelle, on a donc une inclusion V ⊂ V ′′ .
Contrairement à ce qui se passe en dimension finie, il n’est pas toujours vrai que V = V ′′ .
On dit qu’un espace de Banach V est réflexif si V = V ′′ (en effet, un espace normé qui
n’est pas de Banach ne peut avoir cette propriété, au vu de la proposition 2.28).
2.5
Topologies faibles
Nous aurons quelquefois besoin de considérer des suites divergentes, mais qui convergent
dans un sens plus faible.
Définition 2.29. Une suite (xn ) dans un un espace normé V converge faiblement vers
x ∈ V si, pour tout f ∈ V ′ , la suite f (xn ) converge vers f (x) ∈ R.
Cette notion de convergence vient en fait d’une topologie sur V , définie autrement qu’avec
les boules ouvertes.
Définition 2.30. La topologie faible ou topologie σ(V, V ′ ) sur un espace normé V est
la topologie la moins fine rendant continues les fonctionnelles linéaires f ∈ V ′ .
On peut vérifier qu’une base de la topologie faible est donnée par les intersections finies
d’ensembles de la forme f −1 (I), où f ∈ V ′ et I ⊂ K est un ouvert.
La topologie habituelle sur V , ayant pour base les boules ouvertes, est parfois appelée
topologie forte, pour bien la distinguer de la topologie faible. De même, la notion de
convergence habituelle (définition 1.2) est appelée convergence forte. La définition 2.30
implique que la topologie faible est moins fine que la topologie forte. En particulier, toute
suite fortement convergente est faiblement convergente.
On peut définir une topologie encore plus faible que la topologie faible, sur certains espaces
normés.
Définition 2.31. Soit V un espace normé. La topologie faible ∗ ou topologie σ(V ′ , V )
sur l’espace normé V ′ est la topologie la moins fine rendant continues les fonctionnelles
linéaires v ∈ V ⊂ V ′′ .
Comme V ⊂ V ′′ , la topologie σ(V ′ , V ) est plus faible que la topologie σ(V ′ , V ′′ ). Bien
entendu, si V est un espace de Banach réflexif, ces deux topologies coı̈ncident. De plus, en
dimension finie, les trois topologies sont identiques.
Proposition 2.32. Soit V un espace normé de dimension finie. Alors la topologie faible
est identique à la topologie forte.
39
Démonstration. Il suffit de montrer que toute boule ouverte est un ensemble ouvert pour
la topologie faible. En vertu du théorème 2.9, on peut se restreindre à Kn muni de la
norme k · k∞ . Considérons les fonctionnelles linéaires continues
fi : Kn → K : x = (x1 , . . . , xn ) 7→ xi ,
i = 1, . . . , n,
formant la base duale de la base canonique de Kn . Alors on a
B(x, r) =
n
\
i=1
fi−1 (]xi − r, xi + r[)
comme souhaité.
On peut montrer que les topologies faible et faible ∗ sont séparées. En particulier, la limite
d’une suite faiblement convergente est unique.
On peut se demander pourquoi on s’acharne à rendre moins fine la topologie d’un espace
normé de dimension infinie. La raison est qu’une topologie possédant moins d’ouverts
possède plus de compacts. Or, ceux-ci permettent d’obtenir des suites convergentes. Ainsi,
on peut montrer que, en contraste avec le théorème de Riesz, la boule unité B V ′ (0, 1) de
l’espace normé V ′ est compacte pour la topologie faible ∗.
2.6
Espaces d’opérateurs
Soient V et W deux espaces normés. On note par L(V, W ) l’ensemble des applications
linéaires bornées de V dans W . Muni de la norme des application linéaires, il s’agit encore
un espace normé. Lorsque V = W , l’espace L(V, V ) est noté plus simplement L(V ).
Proposition 2.33. Soient V et W des espaces normés. Si W est un espace de Banach,
alors L(V, W ) est également un espace de Banach.
Démonstration. Il suffit de transcrire la preuve de la proposition 2.28, en remplaçant K
par W et f ∈ V ′ par A ∈ L(V, W ).
La topologie induite par la norme des applications linéaires est appelée topologie uniforme.
On dit qu’une suite (An ) dans L(V, W ) converge uniformément vers A ∈ L(V, W ) si
limn→∞ kAn − Ak = 0, c’est-à-dire si (An ) converge vers A pour la topologie uniforme.
Soit X un espace topologique ; on dit qu’une fonction A : X → L(V, W ) est uniformément continue en x0 ∈ X si kA(x) − A(x0 )k → 0 lorsque x → x0 dans X,
c’est-à-dire si A est continue pour la topologie uniforme sur L(V, W ).
On peut définir naturellement deux topologies sur L(V, W ) qui sont plus faibles que la
topologie uniforme. Ces topologies sont utiles car la convergence uniforme des opérateurs
est très restrictive.
40
La topologie opérateur forte (ou simplement topologie forte si il n’y a pas de risque
de confusion) est la topologie la plus faible sur L(V, W ) pour laquelle les applications
linéaires L(V, W ) → W : A 7→ Av sont continues, pour tout v ∈ V .
La convergence dans L(V, W ) pour cette topologie est appelée convergence forte. Ainsi,
une suite (An ) dans L(V, W ) converge fortement vers A ∈ L(V, W ) si, pour tout v ∈ V ,
kAn v − AvkW → 0 lorsque n → ∞.
Soit X un espace topologique ; on dit qu’une fonction A : X → L(V, W ) est fortement
continue en x0 ∈ X si, pour tout v ∈ V , kA(x)v − A(x0 )vkW → 0 lorsque x → x0 dans
X, c’est-à-dire si A est continue pour la topologie forte sur L(V, W ).
La topologie opérateur faible (ou simplement topologie faible si il n’y a pas de risque
de confusion) est la topologie la plus faible sur L(V, W ) pour laquelle les applications
linéaires L(V, W ) → K : A 7→ hl, Avi sont continues, pour tout v ∈ V et l ∈ W ′ .
La convergence dans L(V, W ) pour cette topologie est appelée convergence faible. Ainsi,
une suite (An ) dans L(V, W ) converge faiblement vers A ∈ L(V, W ) si, pour tout v ∈ V
et tout l ∈ W ′ , |hl, An vi − hl, Avi| → 0 dans K lorsque n → ∞.
Soit X un espace topologique ; on dit qu’une fonction A : X → L(V, W ) est faiblement
continue en x0 ∈ X si, pour tout v ∈ V et tout l ∈ W ′ ,
|hl, A(x)vi − hl, A(x0 )vi| → 0
dans K lorsque x → x0 dans X, c’est-à-dire si A est continue pour la topologie faible sur
L(V, W ).
Exemples.
1. Soit A ∈ L(V, W ) tel que kAk < 1. Alors la suite des puissances successives An
converge vers 0 uniformément (donc aussi fortement et faiblement) car kAn k ≤
kAkn → 0.
2. Considérons l’opérateur de shift vers la gauche L ∈ L(l2 (K)) défini par (Lx)n = xn+1 ,
n ∈ N, pour tout x = (xn ) ∈ l2 (K). Alors la suite des puissances successives Ln
converge vers 0 fortement (et donc faiblement), mais pas uniformément car kLn k = 1
pour tout n ∈ N.
3. Considérons l’opérateur de shift vers la droite R ∈ L(l2 (K)) défini par
xn−1 si n ≥ 1,
(Rx)n =
0
si n = 0,
pour tout x = (xn ) ∈ l2 (K). Alors la suite des puissances successives Rn converge
vers 0 faiblement, mais pas fortement (ni donc uniformément) car kRn xk = kxk pour
tout x ∈ l2 (K).
N
Exercices sur le Chapitre 2
1. Calculer les constantes d’équivalence optimales pour les normes
kxk1 =
n
X
i=1
|xi |
et
41
kxk∞ = max |xi |
1≤i≤n
sur Cn .
2. Soit X un espace topologique et E un espace de Banach. On considère l’espace
Cb0 (X, E) des fonctions continues et bornées de X dans E. Montrer que, muni de la
norme supremum, définie par
kf k∞ = sup kf (x)kE ,
x∈X
l’espace Cb0 (X, E) est un espace de Banach.
3. Soit 1 ≤ p ≤ ∞ ; on considère l’espace lp (R) des suites x = (xn )n∈N dans R telles
que
kxkp =
∞
X
n=0
!1
p
p
|xn |
< ∞,
1 ≤ p < ∞,
kxk∞ = sup |xn | < ∞.
n∈N
(a) Montrer que l’espace lp (R), muni de la norme k · kp , est un espace de Banach.
(b) Montrer qu’on a une inclusion lp (R) ⊂ lq (R) continue, lorsque 1 ≤ p ≤ q ≤ ∞.
(c) Montrer que lp (R) est dense dans lq (R) lorsque 1 ≤ p ≤ q < ∞.
(d) Montrer que lp (R) n’est pas dense dans l∞ (R) lorsque 1 ≤ p < ∞.
4. (a) Montrer qu’une suite dans l1 (R) est fortement convergente si et seulement si
elle est faiblement convergente.
(b) Montrer qu’aucune boule ouverte pour la topologie forte sur l1 (R) n’est un
ouvert pour la topologie faible sur l1 (R).
5. Les sous-espaces suivants de l’espace de Banach (Cb0 (Rn , K), k · k∞ ) sont-ils fermés ?
(a) C00 (Rn , K) = {f ∈ Cb0 (Rn , K) | supp f est compact} ;
0 (Rn , K) = {f ∈ C 0 (Rn , K) | supp f ⊂ K}, pour un compact K ⊂ Rn ;
(b) CK
b
0 (Rn , K) = {f ∈ C 0 (Rn , K) | lim
(c) C∞
kxk→∞ f (x) = 0} ;
b
(d) Cb1 (Rn , K) = {f ∈ Cb0 (Rn , K) |
∂f
∂xi
∈ Cb0 (Rn , K)}.
42
Chapitre 3
Espaces à produit interne. Espaces
de Hilbert
“Mathematics is a game
played according to certain simple rules
with meaningless marks on paper.”
David Hilbert (1862 - 1943)
3.1
Produit scalaire
Soient V et W deux espaces vectoriels sur K = R ou C. Une application f : V × W → K
est dite bilinéaire si f est linéaire en chacun de ses arguments. Une forme bilinéaire
f : V × V → K est dite symétrique si f (v1 , v2 ) = f (v2 , v1 ) pour tout v1 , v2 ∈ V .
Une application f : V → K est dite semi-linéaire si f (c1 v1 + c2 v2 ) = c1 f (v1 ) + c2 f (v2 )
pour tout v1 , v2 ∈ V , c1 , c2 ∈ K. Une application f : V × W → K est dite sesquilinéaire
si f est semi-linéaire en le premier argument et linéaire en le second argument. Lorsque
K = R, semi-linéaire est équivalent à linéaire et sesquilinéaire revient à bilinéaire.
Une application f : V × V → C est dite hermitienne si f est linéaire en le second
argument et si f (v1 , v2 ) = f (v2 , v1 ) pour tout v1 , v2 ∈ V . Dans ce cas, f (v, v) ∈ R pour
tout v ∈ V .
On dit qu’une application f : V × V → K, bilinéaire symétrique si K = R et hermitienne
si K = C, est définie positive si f (v, v) > 0 pour tout vecteur v 6= 0 dans V .
Définition 3.1. Soit V un espace vectoriel sur K. Si K = R, un produit scalaire sur
V est une forme bilinéaire symétrique et définie positive ; si K = C, c’est une forme
hermitienne définie positive.
Un produit scalaire sur V sera habituellement noté
V × V → K : (v1 , v2 ) 7→ hv1 , v2 i.
43
Un espace vectoriel muni d’un produit scalaire est appelé espace préhilbertien.
Proposition 3.2. Soit V un espace préhilbertien. Alors
(i) |hv, wi|2 ≤ hv, vihw, wi (inégalité de Cauchy-Schwarz), avec égalité si et seulement
si v et w sont linéairement dépendants,
p
p
p
hv + w, v + wi ≤
hv, vi + hw, wi (inégalité triangulaire), avec égalité si et
(ii)
seulement si il existe c ∈ R+ tel que v = cw ou si w = 0,
pour tout v, w ∈ V .
Démonstration.
(i) Soient v, w ∈ V non nuls. Pour tout c ∈ K, on a
hv + cw, v + cwi = hv, vi + chv, wi + chw, vi + |c|2 hw, wi
= hv, vi + 2Re(chv, wi) + |c|2 hw, wi.
Choisissons c ∈ K de sorte que chv, wi ∈ R et posons t = |c|. Comme un produit
scalaire est défini positif, on obtient
hv, vi + 2t|hv, wi| + t2 hw, wi ≥ 0
pour tout t ∈ R. Par conséquent, le discriminant de ce second degré est négatif ou
nul :
4|hv, wi|2 − 4hv, vihw, wi ≤ 0,
ce qui donne bien l’inégalité cherchée. Si on a l’égalité, alors le second degré a une
racine, ce qui signifie qu’il existe c ∈ K tel que hv + cw, v + cwi = 0, ou encore
v + cw = 0.
(ii) Comme précédemment, on a
hv + w, v + wi = hv, vi + 2Re(hv, wi) + hw, wi.
Par l’inégalité de Cauchy-Schwarz, on a
Re(hv, wi) ≤ |(hv, wi)|
p
p
hv, vi hw, wi.
≤
En combinant ces deux inégalités, on obtient
p
p
hv + w, v + wi ≤ ( hv, vi + hw, wi)2 ,
qui est le carré de l’inégalité recherchée. Si on a l’égalité, alors (i) donne v = cw avec
c ∈ K. La première inégalité est une égalité si et seulement si hv, wi ∈ R+ , ce qui
donne c ∈ R+ .
44
La deuxième propriété peut se reformuler de la manière suivante. Soit V un p
espace vectoriel
+
muni d’un produit scalaire h·, ·i ; alors l’application V → R : v 7→ kvk = hv, vi est une
norme sur V . L’inégalité de Cauchy-Schwarz se réécrit donc |hv, wi| ≤ kvk kwk pour tout
v, w ∈ V .
Une norme dérivant d’un produit scalaire jouit de propriétés particulières, dont la preuve
constitue un exercice facile.
Proposition 3.3. Soit V un espace préhilbertien sur K. Alors
(i) si hv, wi = 0 alors kv + wk2 = kvk2 + kwk2 (théorème de Pythagore),
(ii) kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 (loi du parallélogramme),
(iii) si K = C, alors hv, wi =
si K = R, alors hv, wi =
1
4
1
4
kv + wk2 − kv − wk2 + ikv + iwk2 − ikv − iwk2
kv + wk2 − kv − wk2 (identité de polarisation),
(iv) si vn → v et wn → w, alors hvn , wn i → hv, wi,
pour tout v, w ∈ V .
Soit S un sous-ensemble de V . L’orthogonal S ⊥ à S est l’ensemble
S ⊥ = {v ∈ V | hw, vi = 0, pour tout w ∈ S}
des vecteurs de V orthogonaux à S.
Proposition 3.4. Soit S un sous-ensemble de V . Alors
(i) S ⊥ est un sous-espace vectoriel fermé de V ;
(ii) si S est dense dans V , alors S ⊥ = {0}.
Démonstration.
(i) Le fait que S ⊥ est un sous-espace vectoriel est une conséquence de la linéarité du
produit scalaire en le second argument. Soit v dans l’adhérence de S ⊥ et (vn )n∈N
une suite dans S ⊥ convergeant vers v. Alors hw, vi = limn→∞ hw, vn i = 0 pour tout
w ∈ S. Donc v ∈ S ⊥ et S ⊥ est fermé.
(ii) Soit v ∈ S ⊥ . Choisissons une suite (vn )n∈N dans S convergeant vers v ∈ S = H.
Alors hvn , vi = 0 pour tout n ∈ N, de sorte que hv, vi = kvk = 0. Par conséquent,
v = 0.
3.2
Espaces de Hilbert
Définition 3.5. Un espace de Hilbert est un espace de Banach dont la norme dérive
d’un produit scalaire.
45
Exemples.
P
1. L’espace vectoriel Kn , muni du produit scalaire usuel hv, wi = ni=1 vi wi , avec v =
(v1 , . . . , vn ) et w = (w1 , . . . , wn ) ∈ Kn , est un espace de Hilbert.
P
2
2. L’espace vectoriel l2 (K) des suites a = (an )n∈N dans K telles que ∞
n=1 |an | < ∞,
muni du produit scalaire
∞
X
ha, bi =
an bn
n=1
est un espace de Hilbert sur K.
3. L’espace de Banach L2 (Rn , K) obtenu par complétion au moyen de la norme k · k2
de l’espace des fonctions f : Rn → K continues et de carré sommable, est un espace
de Hilbert avec le produit scalaire
Z
f (x)g(x)dx.
hf, gi =
Rn
N
Théorème 3.6. Soit S un sous-espace vectoriel fermé d’un espace de Hilbert H. Alors
H = S ⊕ S ⊥ (somme directe topologique) et, pour tout v ∈ H, la projection PS v de v sur
S le long de S ⊥ est la meilleure approximation de v dans S :
kv − PS vk = inf kv − wk.
w∈S
Démonstration. Pour tout v ∈ H, il existe v1 ∈ S tel que kv − v1 k = inf w∈S kv − wk = d.
En effet, par définition de d, il existe une suite wi ∈ S telle que kv − wi k → d, i → ∞.
Fixons ǫ > 0 ; soit I ∈ N tel que kv − wi k ≤ d + ǫ si i > I. Pour tout i, j > I on a, par la
loi du parallélogramme,
k(v − wi ) − (v − wj )k2 + k(v − wi ) + (v − wj )k2 = 2kv − wi k2 + 2kv − wj k2
≤ 4(d + ǫ)2 .
Par conséquent,
1
kwi − wj k2 ≤ 4(d + ǫ)2 − 4kv − (wi + wj )k2
2
≤ 4(d + ǫ)2 − 4d2
= 4ǫ(2d + ǫ).
La suite wi est donc de Cauchy dans H ; soit v1 ∈ S sa limite. On a bien
kv − v1 k = lim kv − wi k = d
i→∞
comme souhaité.
Montrons que v − v1 ∈ S ⊥ . Pour tout u ∈ S et λ ∈ R+ , on a
d2 ≤ kv − v1 ± λuk2 = kv − v1 k2 ± 2λRehu, v − v1 i + λ2 kuk2 .
46
Par conséquent,
λ
kuk2 ,
2
ce qui force Rehu, v −v1 i = 0. En remplaçant λ par iλ, on obtient de même Imhu, v −v1 i =
0, de sorte que hu, v − v1 i = 0 comme souhaité.
∓Rehu, v − v1 i ≤
On peut donc écrire v = v1 +(v−v1 ) avec v1 ∈ S et v−v1 ∈ S ⊥ . D’autre part, si w ∈ S∩S ⊥ ,
alors hw, wi = kwk2 = 0, de sorte que S et S ⊥ sont supplémentaires algébriques dans H.
De plus, comme v1 = PS v et v − v1 = (I − PS )v, le théorème de Pythagore donne
kPS vk2 + k(I − PS )vk2 = kvk2 .
En particulier, kPS vk ≤ kvk et k(I − PS )vk ≤ kvk, de sorte que les projecteurs PS et
I − PS sont bornés et la somme directe H = S ⊕ S ⊥ est topologique.
Corollaire 3.7. Soit S un sous-ensemble d’un espace de Hilbert H. Alors S ⊥⊥ = (S ⊥ )⊥
est le sous-espace vectoriel fermé de H engendré par S.
Démonstration. Soit V le sous-espace vectoriel fermé de H engendré par S. Remarquons
que S ⊥ = V ⊥ par linéarité et continuité du produit scalaire. Par le théorème 3.6 appliqué
à V, V ⊥ ⊂ H, on a les décompositions orthogonales H = V ⊕ V ⊥ = V ⊥⊥ ⊕ V ⊥ . Par
conséquent, V ⊥⊥ = S ⊥⊥ = V .
3.3
Suites et bases orthonormées
Soit V un espace préhilbertien sur K. Deux éléments v, w ∈ V sont dits orthogonaux si
hv, wi = 0. Une famille E = (ei )i∈I d’éléments de V forme un système orthogonal si ei et
ej sont orthogonaux pour tout i, j ∈ I. Une telle famille forme un système orthonormé
si hei , ej i = δij pour tout i, j ∈ I. Lorsque I = N, on parle de suite orthogonale et de
suite orthonormée respectivement.
L’algorithme de Gram-Schmidt, bien connu du lecteur dans le cadre d’un espace vectoriel
de dimension finie muni d’un produit scalaire, peut être appliqué ici pour construire des
suites orthonormales (ei )i∈N à partir de suites (vi )i∈N dans V telles que, pour tout n ∈ N,
vn+1 est linéairement indépendant de v1 , . . . , vn .
En effet, posons e1 = v1 /kv1 k. Ensuite, pour tout n > 1, on projette vn sur le sous-espace
{v1 , . . . vn−1 }⊥ = {e1 , . . . , en−1 }⊥ :
n−1
X
hei , vn iei
ebn = vn −
i=1
et on normalise le résultat :
en = ebn /kb
en k.
Soit E = (ei )i∈I un système orthonormé dans V et v ∈ V . Les nombres hei , vi ∈ K, i ∈ I,
sont appelés coefficients de Fourier de v par rapport à E.
47
Proposition 3.8. Soit E = (ei )i∈N une suite orthonormée dans un espace préhilbertien
V , et soit v ∈ V . Alors, pour tout n ∈ N,
P
(i) la meilleure approximation de v de la forme ni=1 ci ei est donnée par ci = hei , vi ;
Pn
2
2
(ii)
i=1 |hei , vi| ≤ kvk (inégalité de Bessel).
Démonstration.
(i) Posons ci = hei , vi, pour tout i ∈ N. Alors
kv −
n
X
i=1
ai ei k2 = kvk2 − 2Re
= kvk2 +
Par conséquent, l’erreur kv −
Pn
i=1 ai ei k
n
X
i=1
n
X
i=1
ai ci +
n
X
|ai − ci |2 −
|ai |2
i=1
n
X
i=1
|ci |2 .
est minimale lorsque ai = ci , i = 1, . . . , n.
(ii) Lorsque l’erreur ci-dessus est minimale, son carré est donné par
kv −
n
X
i=1
2
2
hei , viei k = kvk −
n
X
i=1
|hei , vi|2 ≥ 0.
P
La somme ni=1 hei , viei donne de meilleures approximations de vPlorsque n croit. Il est
donc naturel d’étudier la convergence d’expressions de la forme ni=1 ai ei avec ai ∈ K,
lorsque n → ∞.
Théorème 3.9 (Riesz-Fisher). Soit E = (ei )i∈N une suite orthonormée
dans un espace
P∞
dans K. Alors la série i=1 ai ei converge dans
de Hilbert H sur K. Soit (ai )i∈N
P une suite
2 converge dans K.
H si et seulement si la série ∞
|a
|
i
i=1
P
Démonstration. Comme H est complet, la série ∞
i=1 ai ei converge dans H si et seulement
Pn+k
si i=n ai ei converge vers 0 ∈ H lorsque n → ∞, pour tout k ≥ 0.
P
2
D’autre part, comme K = R ou C est complet, la série ∞
i=1 |ai | converge dans K si et
Pn+k
seulement si i=n |ai |2 converge vers 0 ∈ K lorsque n → ∞, pour tout k ≥ 0.
Ces deux convergences sont équivalentes, car
k
n+k
X
i=n
2
ai ei k =
n+k
X
i=n
|ai |2 ,
puisque la suite (ei )i∈N est orthonormée.
P
Le théorème de Riesz-Fisher et l’inégalité de Bessel garantissent que la série ni=1 hei , viei
converge dans un espace de Hilbert H lorsque n → ∞. Cependant, pour garantir que la
limite de cette série soit v, il est nécessaire d’introduire une hypothèse supplémentaire sur
la suite orthonormée (ei )i∈N .
48
Définition 3.10. Soit V un espace préhilbertien. Un système orthogonal ou orthonormé
(vi )i∈I est dit complet si l’unique v ∈ V satisfaisant hv, vi i = 0 pour tout i ∈ I est le
vecteur nul v = 0.
Une suite orthonormée dans un espace de Hilbert H formant un système complet est
appelée base hilbertienne de H.
Proposition 3.11. Tout espace de Hilbert séparable admet une base hilbertienne.
Démonstration. Soit V = {v1 , v2 , . . .} un sous-ensemble dense et dénombrable de H et
soit {v1′ , v2′ , . . .} ⊂ V le sous-ensemble dénombrable obtenu en omettant les vecteurs vi de
V qui sont linéairement dépendants de {v1 , . . . , vi−1 }. En appliquant le procédé de GramSchmidt aux vecteurs {v1′ , . . . , vn′ }, pour tout n ∈ N, on obtient une suite orthonormée
(wi )i∈N dans H. Soit En le sous-espace vectoriel de H engendré par {v1′ , . . . , vn′ }, ou encore
par {w1 , . . . , wn }. Alors En ⊂ En+1 pour tout n ∈ N et S = ∪n∈N En est dense dans H.
Par le corollaire 3.7, S ⊥⊥ = H et donc S ⊥ = {0}, autrement dit la suite orthonormée
(wi )i∈N est complète.
Proposition 3.12. Soit E = (ei )i∈N une suite orthonormale dans un espace de Hilbert
H. Les propriétés suivantes sont équivalentes :
(i)
(ii)
(iii)
(iv)
E est complète ;
P
v= ∞
i=1 hei , viei , pour tout v ∈ H ;
P
hv, wi = ∞
hv, ei ihei , wi, pour tout v, w ∈ H ;
P∞i=1
2
kvk = i=1 |hei , vi|2 , pour tout v ∈ H (identité de Parseval).
Démonstration.
P
2
2
(i) ⇒ (ii). Par l’inégalité de Bessel,
a ∞
i=1 |hei , vi| ≤ kvk . Par conséquent, par le
Pon
∞
théorème de Riesz-Fischer,
la série i=1 hei , viei converge dans H. Comme les coefficients
P∞
de Fourier de
P v − i=1 hei , viei par rapport à E sont tous nuls et que E est complète, on
a bien v = ∞
i=1 hei , viei .
P
P
(ii) ⇒ (iii). Comme v = limn→∞ ni=1 hei , viei et w = limn→∞ nj=1 hej , wiej , on obtient
par continuité du produit scalaire
+
* n
n
X
X
hej , wiej
hei , viei ,
hv, wi = lim
n→∞
=
lim
n→∞
i=1
n
X
i,j=1
j=1
hei , vihej , wiδij
∞
X
hv, ei ihei , wi
=
i=1
comme souhaité.
(iii) ⇒ (iv). Il suffit de choisir w = v.
(iv) ⇒ (i). Si hei , vi = 0 pour tout i ∈ N, alors kvk2 = 0 et donc v = 0.
49
Corollaire 3.13. Tout espace de Hilbert séparable sur K est isométrique à l2 (K).
Démonstration. Soit H un espace de Hilbert séparable sur K et (vi )i∈N une base hilbertienne
P de H. Par la proposition 3.12 (ii), tout élément
P∞ v ∈ H 2peut s’écrire sous la forme
v= ∞
he
,
vie
,
et
par
la
proposition
3.12
(iv),
i
i=1 i
i=1 |hei , vi| < ∞. Par conséquent, on
2
peut définir une application linéaire Φ : H → l (K) par
Φ(v) = (hei , vi)i∈N
pour tout v ∈ H. Par le théorème de Riesz-Fisher,
tout élément a = (ai )i∈N ∈ l2 (K)
P∞
permet de définir un élément v ∈ H par v = i=1 ai ei . Par conséquent, Φ est inversible.
Enfin, la proposition 3.12 (iii) montre que Φ est une isométrie.
3.4
Théorème de représentation de Riesz
Soit V un espace préhilbertien. Alors tout élément a ∈ V permet de définir une fonctionnelle linéaire continue l ∈ V ′ par l(v) = ha, vi, pour tout v ∈ V . La continuité de l est une
conséquence immédiate de l’inégalité de Cauchy-Schwarz.
Le théorème suivant montre que, dans un espace de Hilbert H, toute fonctionnelle linéaire
continue est de cette forme.
Théorème 3.14 (Représentation de Riesz). Soit H un espace de Hilbert et l ∈ H ′ .
Alors il existe un unique a ∈ H tel que l(v) = ha, vi pour tout v ∈ H. De plus, on a
kakH = klkH ′ .
Démonstration. Vérifions qu’un tel a ∈ H est forcément unique. Si a et a′ ∈ H satisfont
l(v) = ha, vi = ha′ , vi pour tout v ∈ H, alors ha−a′ , vi = 0, de sorte que a−a′ ∈ H ⊥ = {0}.
Si l = 0 alors on peut prendre a = 0. Si l 6= 0 alors par la proposition 2.27, S = l−1 (0) est
un sous-espace vectoriel fermé de codimension 1 dans H. Comme H = S ⊕S ⊥ , l’orthogonal
S ⊥ est de dimension 1. Soit b un élément non nul de S ⊥ , de sorte que l(b) 6= 0. Posons
a=
l(b)
b ∈ S⊥.
kbk2
Alors, pour tout v ∈ S, on a ha, vi = 0 = l(v). Si v ∈ S ⊥ , alors v = λb pour un certain
l(b)
2
λ ∈ K, de sorte que ha, vi = kbk
2 λkbk = l(λb) = l(v) comme souhaité.
Enfin, on calcule que
klkH ′ = sup
v∈H
v6=0
|ha, vi|
|l(v)|
= sup
= kakH
kvkH
v∈H kvkH
v6=0
par l’inégalité de Cauchy-Schwarz, puisque l’égalité est réalisée lorsque a et v sont linéairement dépendants.
50
Une reformulation de ce théorème est que tout espace de Hilbert H est naturellement
isométrique à son dual H ′ .
Corollaire 3.15. Tout espace de Hilbert est réflexif.
Le théorème de représentation de Riesz permet également de reformuler la notion de
convergence faible, associée à la topologie faible sur H.
Corollaire 3.16. Une suite (vn )n∈N dans un espace de Hilbert H sur K converge faiblement vers v ∈ H si, pour tout u ∈ H, hu, vn i → hu, vi dans K.
Cette reformulation permet, à son tour, de dériver les propriétés suivantes de la convergence faible dans un espace de Hilbert.
Proposition 3.17. Soit (vn )n∈N une suite dans un espace de Hilbert H.
(i) si (vn )n∈N est orthonormée, alors (vn )n∈N converge faiblement vers 0 ;
(ii) (vn )n∈N converge fortement vers v ∈ H si et seulement si (vn )n∈N converge faiblement vers v et kvn k converge vers kvk.
Démonstration.
(i) En vertu de l’inégalité de Bessel, on a
k
X
n=1
|hvn , vi|2 ≤ kvk2
pour tout k ∈ N. Par conséquent, hvn , vi → 0 = hvn , 0i lorsque n → ∞.
(ii) L’implication directe est évidente dans tout espace normé. Inversement, kv − vn k2 =
kvk2 − 2Rehv, vn i + kvn k2 converge vers kvk2 − 2Rehv, vi + kvk2 = 0.
3.5
3.5.1
Opérateurs particuliers
Opérateurs adjoints
Définition 3.18. Soient H1 et H2 deux espaces de Hilbert et A ∈ L(H1 , H2 ). L’opérateur
adjoint de A est l’opérateur linéaire A∗ : H2 → H1 caractérisé par
hA∗ v2 , v1 iH1 = hv2 , Av1 iH2
pour tout v1 ∈ H1 , v2 ∈ H2 .
Proposition 3.19. Soient A ∈ L(H1 , H2 ) et B ∈ L(H2 , H3 ). Alors
(i) A∗ est borné et kA∗ k = kAk ;
(ii) (A∗ )∗ = A ;
51
(iii) ker A = (im A∗ )⊥ et im A = (ker A∗ )⊥ ;
(iv) (B ◦ A)∗ = A∗ ◦ B ∗ ;
(v) si A a un inverse, (A−1 )∗ = (A∗ )−1 .
Démonstration.
(i) Remarquons que
kAk = sup
v1 ∈H1
v2 ∈H2
hv2 , Av1 i
.
kv1 k kv2 k
(3.1)
En effet, le suprémum dans (3.1) n’excède par kAk par l’inégalité de Cauchy-Schwarz.
nk
D’autre part, il existe une suite un ∈ H1 telle que kAu
kun k → kAk. En prenant v1 = un
et v2 = Aun dans (3.1), on voit que le suprémum coı̈ncide avec kAk.
Par conséquent, on a
kAk = sup
v1 ∈H1
v2 ∈H2
hA∗ v2 , v1 i
hv2 , Av1 i
= sup
= kA∗ k.
kv1 k kv2 k v1 ∈H1 kv1 k kv2 k
v2 ∈H2
(ii) Pour tout v1 ∈ H1 , v2 ∈ H2 , on a
hv2 , Av1 iH2 = hA∗ v2 , v1 iH1 = hv2 , (A∗ )∗ v1 iH2 .
Par conséquent, A = (A∗ )∗ .
(iii) v1 ∈ ker A si et seulement si hAv1 , v2 iH2 = hv1 , A∗ v2 iH1 = 0 pour tout v2 ∈ H2 ,
c’est-à-dire v1 ∈ (im A∗ )⊥ . On obtient la deuxième relation en remplaçant A par A∗
et en utilisant (ii).
(iv) Pour tout v1 ∈ H1 , v3 ∈ H3 , on a
hv3 , B ◦ Av1 iH3 = hB ∗ v3 , Av1 iH2 = hA∗ ◦ B ∗ v3 , v1 iH1 .
D’autre part, on a aussi
hv3 , B ◦ Av1 iH3 = h(B ◦ A)∗ v3 , v1 iH1 .
Par conséquent, A∗ ◦ B ∗ = (B ◦ A)∗ .
(v) En remplaçant B par A−1 dans (iv) on obtient I ∗ = I = A∗ ◦ (A−1 )∗ . En échangeant
les rôles de A et B on obtient I = (A−1 )∗ ◦ A∗ . Par conséquent, A∗ admet pour
inverse (A−1 )∗ .
3.5.2
Opérateurs auto-adjoints
Définition 3.20. Soit H un espace de Hilbert. Un opérateur A ∈ L(H) est dit autoadjoint si A∗ = A.
Proposition 3.21. Soit H un espace de Hilbert sur K et A ∈ L(H).
52
(i) Si A est auto-adjoint alors hAv, vi ∈ R pour tout v ∈ H ;
(ii) Si K = C et hAv, vi ∈ R pour tout v ∈ H alors A est auto-adjoint.
Démonstration.
(i) Si A est auto-adjoint alors, pour tout v ∈ H,
hAv, vi = hv, A∗ vi = hv, Avi = hAv, vi.
(ii) Si hAv, vi ∈ R pour tout v ∈ H alors
hAv, vi = hv, Avi = hv, Avi = hA∗ v, vi,
de sorte que h(A − A∗ )v, vi = 0. En prenant v = v1 + cv2 avec v1 , v2 ∈ H et c ∈ C,
on obtient
h(A − A∗ )v1 , v1 i + ch(A − A∗ )v1 , v2 i + ch(A − A∗ )v2 , v1 i + |c|2 h(A − A∗ )v2 , v2 i = 0.
Le premier et le quatrième terme de cette somme sont nuls. Si c = 1, on obtient
h(A − A∗ )v1 , v2 i + h(A − A∗ )v2 , v1 i = 0
et si c = i, on obtient
h(A − A∗ )v1 , v2 i − h(A − A∗ )v2 , v1 i = 0,
de sorte que h(A − A∗ )v1 , v2 i = 0 et donc A = A∗ .
Exemple. Pour tout A ∈ L(H1 , H2 ), l’opérateur A∗ A ∈ L(H1 ) est auto-adjoint, car
(A∗ A)∗ = A∗ A∗∗ = A∗ A.
N
Proposition 3.22. Soit A ∈ L(H1 , H2 ). Alors
(i) kA∗ Ak = kAA∗ k = kAk2 ;
(ii) A∗ A = 0 ou AA∗ = 0 implique A = 0.
Démonstration.
(i) En utilisant l’équation (3.1), on calcule
kA∗ Ak = sup
v1 ∈H1
v2 ∈H2
kAvk2
hAv2 , Av1 i
hv2 , A∗ Av1 i
= sup
≥ sup
= kAk2 .
2
kv1 k kv2 k
kv
k
kv
k
kvk
1
2
v1 ∈H1
v∈H1
v2 ∈H2
Mais d’autre part, kA∗ Ak ≤ kA∗ k kAk = kAk2 , donc kA∗ Ak = kAk2 . L’autre égalité
s’obtient en échangeant les rôles de A et A∗ .
(ii) Si A∗ A = 0 alors 0 = kA∗ Ak = kAk2 , donc A = 0. On procède de même pour AA∗ .
53
3.5.3
Opérateurs unitaires
Définition 3.23. Soit H un espace de Hilbert et U ∈ L(H). On dit que U est un opérateur
unitaire si U est inversible et U −1 = U ∗ .
D’autre part, on dit qu’un opérateur T ∈ L(H) est isométrique si T préserve les longueurs : kT vk = kvk pour tout v ∈ H.
Proposition 3.24. Soient U, V ∈ L(H) des opérateurs unitaires. Alors
(i) U est isométrique ;
(ii) kU k = 1 ;
(iii) U −1 et U ∗ sont unitaires ;
(iv) U V est unitaire.
Démonstration.
(i) Pour tout v ∈ H, on a bien
kU vk2 = hU v, U vi = hU ∗ U v, vi = hv, vi = kvk2 .
(ii) Si kU vk = kvk pour tout v ∈ H, alors
kU k = sup
v∈H
kU vk
= 1.
kvk
(iii) C’est une conséquence immédiate de la proposition 3.19 (v).
(iv) On a bien (U V )−1 = V −1 U −1 = V ∗ U ∗ = (U V )∗ .
Par contre, une application linéaire isométrique n’est pas forcément unitaire.
Exemple. Considérons l’opérateur de shift vers la droite R ∈ L(l2 (K)). Alors R est
isométrique et son adjoint R∗ est l’opérateur de shift vers la gauche L. Ainsi, R∗ R = LR =
I. Par contre, R n’est pas unitaire car R n’est pas surjectif, de sorte que RR∗ = RL 6= I.
N
3.5.4
Opérateurs normaux
Définition 3.25. Soit H un espace de Hilbert et N ∈ L(H). On dit que N est un opérateur
normal si N ∗ N = N N ∗ .
Clairement, un opérateur T ∈ L(H) auto-adjoint ou unitaire est normal, mais la réciproque
est fausse.
Exemple. L’opérateur T = 2iI a pour adjoint T ∗ = −2iI = −T , de sorte que T n’est ni
auto-adjoint ni unitaire. Par contre, T est normal car T ∗ T = T T ∗ = −T 2 .
N
54
3.6
Projecteurs orthogonaux
Définition 3.26. Un projecteur linéaire P ∈ L(H) dans un espace de Hilbert H est dit
orthogonal si ker P ⊥ im P .
Proposition 3.27. Un projecteur linéaire P ∈ L(H) est orthogonal si et seulement si P
est auto-adjoint.
Démonstration. Si P est orthogonal, alors pour tout u, v ∈ H,
hu, P vi = hP u + (I − P )u, P vi = hP u, P vi.
Comme on a de même hP u, vi = hP u, P vi, l’opérateur P est auto-adjoint.
Inversement, si P est un projecteur auto-adjoint, alors pour tout u, v ∈ H,
hP u, (I − P )vi = hu, P (I − P )vi = 0.
Par conséquent, ker P ⊥ im P et P est un projecteur orthogonal.
Proposition 3.28. Soit P ∈ L(H) un projecteur orthogonal. Alors
(i) P est non négatif, c’est-à-dire hv, P vi ≥ 0 pour tout v ∈ H ;
(ii) kP k = 1 si P 6= 0.
Démonstration.
(i) Comme P est auto-adjoint, on a
hv, P vi = hv, P 2 vi = hP v, P vi = kP vk2 ≥ 0
pour tout v ∈ H.
(ii) Par le théorème de Pythagore,
kP vk2 + k(I − P )vk2 = kvk2
pour tout v ∈ H. Par conséquent, kP vk ≤ kvk et kP k ≤ 1. La conclusion suit alors
de la proposition 2.24 (v), puisque kP k ≥ 1 lorsque P 6= 0.
Exercices sur le Chapitre 3
1. (a) Démontrer la loi du parallélogramme dans un espace de Hilbert H :
kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 ,
pour tout v, w ∈ H.
(b) Trouver deux vecteurs v et w d’un espace de Banach B qui ne satisfont pas à
la loi du parallélogramme.
55
2. Soient V1 et V2 deux sous-espaces vectoriels d’un espace de Hilbert H. Démontrer
les propriétés suivantes :
(a) V1 ⊂ V2 ⇒ V2⊥ ⊂ V1⊥ ,
(b) (V1 + V2 )⊥ = V1⊥ ∩ V2⊥ .
(c) (V1 ∩ V2 )⊥ = V1⊥ + V2⊥ .
3. Pour chacun des sous-espaces vectoriels Vi de l2 (R) ci-dessous, déterminer si Vi est
fermé. Si non, quelle est son adhérence ?
(a) V1 = {x = (xn ) ∈ l2 (R) | xn = 0 si n > 10},
(b) V2 = {x = (xn ) ∈ l2 (R) | ∃n0 > 0 ∀n > n0 , xn = 0},
P∞ 1
(c) V3 = {x = (xn ) ∈ l2 (R) |
n=1 n xn = 0},
P
∞
(d) V4 = {x = (xn ) ∈ l2 (R) |
n=1 xn = 0}.
4. Soit V un sous-espace vectoriel fermé d’un espace de Hilbert H séparable. Soit
P ∈ L(H) le projecteur orthogonal sur V . Soit (ei )i∈I un système orthonormal
complet pour V .
P
(a) Montrer que P v = i∈I hei , viei pour tout v ∈ H.
(b) Si V ⊂ H = Cn est le sous-vectoriel engendré par f1 = (1, . . . , 1) et f2 =
(1, 0, . . . , 0), calculer la matrice de P .
R
5. Soit K ∈ C 0 (Rn × Rn , K) une fonction telle que Rn ×Rn |K(x, y)|2 dx dy < ∞. On
définit un opérateur linéaire A : C 0 (Rn , K) ⊂ L2 (Rn , K) → L2 (Rn , K) par
Z
K(x, y)f (y) dy,
(Af )(x) =
Rn
pour tout f ∈ C 0 (Rn , K).
(a) Montrer que A s’étend en une application linéaire bornée A : L2 (Rn , K) →
L2 (Rn , K) et calculer sa norme.
∗
(b) Déterminer l’adjoint A de A.
(c) Donner un exemple de K tel que A est un opérateur normal, mais pas autoadjoint ni unitaire.
56
Chapitre 4
Distributions
“Everything of importance has been said before
by somebody who did not discover it. ”
Alfred Whitehead (1861 - 1947)
4.1
Définitions
Soit Ω un ouvert de Rn . Le support d’une fonction ϕ : Ω → K est défini par supp(ϕ) =
{x ∈ Ω | ϕ(x) 6= 0}.
Un multi-indice est un n-uple
= (α1 , . . . , αn ) d’entiers αi ≥ 0. L’ordre d’un multiPα
n
indice α est défini par |α| =
i=1 αi . A tout multi-indice α, on associe un opérateur
∂ α1
∂ αn
n
α = xα1 . . . xαn ∈ K.
différentiel ∂ α = ∂x
αn . Pour tout x ∈ K , on définit x
α1 . . .
n
1
∂x
1
n
Soit 0 ≤ m ≤ ∞ un entier. Une fonction ϕ : Ω → K est de classe C m si ∂ α ϕ est continue
pour tout multi-indice α tel que |α| ≤ m. On note C m (Ω) l’espace vectoriel des fonctions
ϕ : Ω → K de classe C m , et C0m (Ω) ⊂ C m (Ω) le sous-espace vectoriel des fonctions de
classe C m dont le support est compact et contenu dans Ω. Soit K un ensemble compact
m ⊂ C m (Ω) le sous-espace vectoriel des fonctions de classe C m dont le
dans Ω. On note CK
0
m est un espace de Banach pour la norme k · k
support est contenu dans K. Si m < ∞, CK
m
définie par
kϕkm =
sup |∂ α ϕ(x)|.
x∈K,|α|≤m
Remarquons que
∞
CK
=
\
m
CK
et C0∞ (Ω) =
m≥0
[
∞
,
CK
K⊂Ω
où l’union porte sur les sous-ensembles compacts K de Ω.
Ces considérations motivent la définition suivante sur l’espace vectoriel C0∞ (Ω). On dit
qu’une suite (ϕn ) dans C0∞ (Ω) converge vers ϕ ∈ C0∞ (Ω) au sens D si et seulement si
(i) il existe un compact K ⊂ Ω tel que supp(ϕn ) ⊂ K pour tout n ∈ N ;
57
(ii) pour tout multi-indice α, limn→∞ k∂ α (ϕn − ϕ)k∞ = 0.
∞ pour tout n ∈ N
Ceci revient à demander qu’il existe un compact K de Ω tel que ϕn ∈ CK
D
m pour tout m ≥ 0. Dans ce cas, on notera ϕ → ϕ.
et que (ϕn ) converge vers ϕ dans CK
n
On peut montrer que cette notion de convergence est induite par une topologie sur C0∞ (Ω).
L’espace vectoriel C0∞ (Ω), muni de cette topologie, est un espace vectoriel topologique noté
D(Ω). Les éléments de D(Ω) sont appelés fonctions test.
Exemple. La fonction ρ : Rn → R définie par
(
1
−
1−kxk2
e
ρ(x) =
0
si kxk < 1,
sinon
est un élément de D(Rn ). En précédant ρ par des translations et des homothéties de Rn ,
on obtient une grande collection de fonctions test dans D(Ω), pour tout ouvert Ω ⊂ Rn . N
Définition 4.1. Une distribution f sur l’ouvert Ω est une fonctionnelle linéaire
f : D(Ω) → K : ϕ 7→ f (ϕ) = hf, ϕi
(4.1)
telle que, pour tout compact K de Ω, il existe un entier m ≥ 0 et une constante C > 0 tels
que
|hf, ϕi| ≤ C
sup |∂ α ϕ(x)|.
x∈K,|α|≤m
L’espace vectoriel des distributions sur Ω est noté D ′ (Ω).
L’estimation (4.1) exprime la continuité de la fonctionnelle linéaire f . On peut en effet
montrer que cette inégalité est équivalente à la propriété suivante : pour toute suite (ϕn )
dans D(Ω) convergeant vers ϕ ∈ D(Ω) au sens D, on a
hf, ϕn i → hf, ϕi.
Ainsi, l’espace D ′ (Ω) joue le rôle de dual topologique pour D(Ω).
Comme pour l’espace D(Ω), introduisons une notion de convergence sur l’espace D ′ (ω).
Définition 4.2. On dit qu’une suite (fn ) dans D ′ (Ω) converge vers f ∈ D ′ (Ω) si
hfn , ϕi → hf, ϕi
pour tout ϕ ∈ D(Ω). Dans ce cas, on parle de convergence au sens D ′ et on note
D′
fn → f .
Comme pour l’espace D(Ω), on peut montrer que cette notion de convergence est induite
par une topologie sur D ′ (Ω). La définition ci-dessus rappelle la notion de topologie faible ∗
pour le dual d’un espace normé. En fait, en partant de la topologie de D(Ω), on peut définir
une topologie forte sur D ′ (Ω), puis montrer que la convergence pour cette topologie est
équivalente à la convergence définie ci-dessus. C’est pourquoi on dit parfois qu’une suite
58
qui converge au sens faible ou faible ∗, même dans un autre contexte que celui-ci, converge
au sens des distributions.
Etant donnée une fonction continue f ∈ C 0 (Ω), on peut lui associer une distribution dans
D ′ (Ω), que l’on désignera encore par f , au moyen de la formule
Z
f (x)ϕ(x) dx,
(4.2)
hf, ϕi =
Ω
pour tout ϕ ∈ D(Ω). L’intégrale dans le membre de droite a bien un sens car l’intégrand
D
est continu et a un support compact. De plus, si ϕn → ϕ, alors il existe un compact K
contenant supp(ϕn ) pour tout n ∈ N. Soit M le maximum de |f | sur K. Alors
Z
|f (x)| |ϕn (x) − ϕ(x)| dx ≤ M Vol(K) kϕn − ϕk∞ → 0,
|hf, ϕn i − hf, ϕi| ≤
Ω
de sorte que la fonctionnelle linéaire f est bien continue.
En fait, certaines fonctions
R discontinues permettent également de définir une distribution :
il suffit que l’intégrale Ω f (x)ϕ(x) dx soit bien définie pour tout ϕ ∈ D(Ω). Dans ce cas,
on dit que la fonction f : Ω → K est localement intégrable.
Par contre, il existe des distributions qui ne sont pas obtenues de cette manière à partir
de fonctions sur Ω.
Exemple. La distribution de Dirac δ est définie par
δ : D(Ω) → K : ϕ 7→ hδ, ϕi = ϕ(0).
On peut montrer qu’il n’existe pas de fonction δ : Ω → K telle que
Z
δ(x)ϕ(x) dx
hδ, ϕi =
Ω
pour tout ϕ ∈ D(Ω). On peut néanmoins obtenir la distribution de Dirac comme la
limite dans D ′ (Ω) d’une suite de distributions obtenues à partir de fonctions localement
intégrables, et même C ∞ . Par exemple, pour Ω = R, on peut prendre
2 2
n
fn (x) = √ e−n x ,
π
et l’on a bien
Z
∞
−∞
fn (x) =
1 sin(nx)
π
x
fn (x)ϕ(x) dx → ϕ(0),
ou
fn (x) =
1
n
π 1 + n2 x2
lorsque n → ∞.
N
Malgré la remarque ci-dessus, on parle dans la littérature en physique de la fonction
de Dirac δ(x) en faisant comme si une telle fonction existait, de manière à garder les
discussions à un niveau élémentaire. Cependant, il faut se méfier de ce point de vue,
qui mène rapidement à des contradictions si l’on manipule une distribution comme une
véritable fonction. En particulier, on ne peut pas parler de la valeur d’une distribution
f ∈ D ′ (Rn ) en un point x ∈ Rn .
59
4.2
Opérations
Dans cette section, nous allons introduire diverses opérations permettant de manipuler
les distributions de manière rigoureuse. Ces opérations sur les distributions généralisent
diverses opérations sur des fonctions localement intégrables (ou encore plus régulières)
dans Ω ⊂ Rn , en se basant sur l’équation (4.2).
4.2.1
Translation
Soient f ∈ D ′ (Rn ) et a ∈ Rn . La translatée Ta f ∈ D ′ (Rn ) de f par a est définie par
hTa f, ϕi = hf, T−a ϕi
pour tout ϕ ∈ D(Rn ), avec T−a ϕ(x) = ϕ(x + a).
Cette définition est motivée par le cas où f ∈ C 0 (Rn ), pour lequel
Z
Z
f (y)ϕ(y + a) dy = hf, T−a ϕi
f (x − a)ϕ(x) dx =
hTa f, ϕi =
Rn
Rn
avec le changement de variables y = x − a.
Exemple. Soit δ ∈ D ′ (Rn ) la distribution de Dirac. Alors, pour tout ϕ ∈ D(Rn ),
hTa δ, ϕi = hδ, T−a ϕi = ϕ(a).
Dans la littérature en physique, de la même manière que δ correspond à la “fonction” de
Dirac δ(x), on écrit plus simplement que Ta δ correspond à δ(x − a).
N
4.2.2
Dérivation
Soit Ω ⊂ Rn ), f ∈ D ′ (Ω) et α = (α1 , . . . , αn ) un multi-indice. La dérivée ∂ α f ∈ D ′ (Ω) de
f , par rapport à x1 (α1 fois), . . . , à xn (αn fois), est définie par
h∂ α f, ϕi = (−1)|α| hf, ∂ α ϕi
pour tout ϕ ∈ D(Ω). La fonctionnelle linéaire ∂ α f est bien continue sur D(Ω) car ϕn → ϕ
implique ∂ α ϕn → ∂ α ϕ dans D(Ω).
Cette définition est motivée par le cas où f ∈ C 1 (R) et α = α1 = 1, pour lequel
Z
Z
f ′ (x)ϕ(x) dx = − f (x)ϕ′ (x) dx = −hf, ϕ′ i
hf ′ , ϕi =
R
R
en vertu de l’intégration par parties.
Pour tout f ∈ D ′ (R), on vérifie facilement, à partir des définitions ci-dessus, que
f ′ = lim
a→0
1
(Ta f − f )
a
60
dans D ′ (R).
Exemples.
1. Soit H : R → R la fonction de Heaviside définie par
1 si x ≥ 0,
H(x) =
0 si x < 0.
On associe à cette fonction une distribution dans D ′ (R), encore notée H, définie par
Z ∞
Z +∞
ϕ(x) dx
H(x)ϕ(x) dx =
hH, ϕi =
0
−∞
pour tout ϕ ∈ D(R). Alors la dérivée H ′ ∈ D ′ (R) satisfait
Z ∞
′
′
ϕ(x) dx = ϕ(0)
hH , ϕi = −hH, ϕ i = −
0
pour tout ϕ ∈ D(R). Par conséquent, H ′ n’est autre que la distribution de Dirac δ.
2. Soit α ∈ Z+ et δ ∈ D ′ (R) la distribution de Dirac. Alors δ(α) ∈ D ′ (R) est la distribution définie par
dα ϕ
hδ(α) , ϕi = (−1)α α (0).
dx
N
Comme le montre cet exemple, toute distribution est dérivable (autant de fois que l’on
veut), même si une distribution provient d’une fonction qui n’est pas dérivable (voire
discontinue) en tant que fonction, ou si une distribution ne correspond pas à une fonction.
4.2.3
Intégration
Soit f ∈ D ′ (R). Une distribution g ∈ D ′ (R)R satisfaisant
x
f.
ou intégrale indéfinie de f et est notée
∂g
∂x
= f est appelée une primitive
Si f est une fonction continue, on sait qu’une primitive existe toujours et n’est définie qu’à
une constante près. On appelle distribution constante une distribution associée à une
fonction constante.
Proposition 4.3. Toute distribution f ∈ D ′ (R) admet une primitive g ∈ D ′ (R), définie
à une distribution constante près.
Démonstration. Fixons une fois pour toutes ψ ∈ D(R) telle que
Z +∞
ψ(x) dx = 1.
−∞
En d’autres termes, h1, ψi = 1, où 1 désigne la distribution associée à la fonction constante
1 ∈ C 0 (R).
61
Décomposons ϕ ∈ D(R) sous la forme ϕ = ϕ0 + h1, ϕiψ, de sorte que h1, ϕ0 i = 0. Alors la
formule
Z x
ϕ0 (y) dy
φ(x) =
−∞
définit une fonction test φ ∈ D(R), puisque φ(x) = 0 lorsque x est suffisamment grand.
De plus, l’application linéaire D(R) → D(R) : ϕ 7→ φ est continue.
Par conséquent, si une primitive g ∈ D ′ (R) existe pour f , elle doit satisfaire
hg, ϕi = hg, ϕ0 i + h1, ϕihg, ψi.
Posons c = hg, ψi. Alors
hg − c, ϕi = hg, ϕ0 i = hg, φ′ i = −hf, φi.
Comme le membre de droite est continu en φ, qui dépend continument de ϕ, cette équaton
définit bien une distribution g − c, à une constante c ∈ K près. Par construction, la
distribution g est une primitive de f .
4.2.4
Multiplication
On ne peut en général pas définir le produit de deux distributions arbitraires f, g ∈ D ′ (Ω).
En effet, si f et g sont induites par des fonctions localement intégrables sur Ω, encore
notées f et g, le produit f g pourrait ne pas être localement intégrable.
Exemple. Soit f = g : R → R : x 7→ f (x) = √1 . Alors f = g est localement intégrable,
|x|
car
Z 1
√ 1
f (x) dx = 2 2 x 0 = 4.
Par contre, f g =
f2
−1
n’est pas localement intégrable car
Z 1
Z 1
1
f 2 (x) dx = 2
dx = +∞.
x
0
−1
N
Par contre, si f et g sont des distributions jouissant de propriétés suffisamment agréables,
leur produit f g pourra être défini. En effet, si f et g sont induites par des fonctions dont le
produit f g est localement intégrable, alors f g induit une distribution f g ∈ D ′ (Ω), appelée
produit des distributions f et g.
Nous nous intéresserons plus particulièrement au cas où f ∈ D ′ (Ω) est une distribution
arbitaire et g ∈ D ′ (Ω) est induite par une fonction infiniment différentiable, de sorte que
g ∈ C ∞ (Ω). Le produit f g ∈ D ′ (Ω) de f et g est alors défini par
hf g, ϕi = hf, gϕi
pour tout ϕ ∈ D(Ω). Ceci définit bien une fonctionnelle linéaire continue, car la multiplication par g est une application linéaire D(Ω) → D(Ω) : ϕ 7→ gϕ qui est continue.
62
4.2.5
Image directe, inverse et changement de variables
Soient Ω et Ω′ deux ouverts de Rn et u : Ω → Ω′ : x 7→ y = u(x) une application C ∞ et
propre, c’est-à-dire telle que u−1 (K) est un compact de Ω pour tout compact K de Ω′ .
Dans ce cas, une fonction test ϕ ∈ D(Ω′ ) peut être reparamétrisée par u en considérant
la composition ϕ ◦ u. Comme u est propre, le support de ϕ ◦ u est compact, de sorte que
ϕ ◦ u ∈ D(Ω).
Ainsi, une distribution f ∈ D ′ (Ω) donne lieu à une distribution u(f ) ∈ D ′ (Ω′ ) définie par
hu(f ), ϕi = hf, ϕ ◦ ui,
pour tout ϕ ∈ D(Ω′ ). On dit que u(f ) est l’image directe de f par u.
Exemples.
1. Soient Ω = Ω′ = Rn et u(x) = x + a, alors l’image directe d’une distribution
f ∈ D ′ (Rn ) est la translation u(f ) = Ta f de cette distribution.
2. Soient Ω = Ω′ = R, δ ∈ D ′ (R) la distribution de Dirac et y = u(x). L’image directe
u(δ) de δ par u est définie par
hu(δ), ϕi = hδ, ϕ ◦ ui = ϕ(u(0)).
Par conséquent, la distribution u(δ) est la translation Tu(0) δ de la distribution δ de
Dirac.
N
Dans certaines circonstances, il est possible de définir l’image inverse u∗ f d’une distribution f . Lorsque celle-ci est donnée par une fonction localement intégrable f dépendant
de y ∈ Ω′ , cela revient à effectuer le changement de variables f (u(x)) dans f . En
particulier, lorsque u est un difféomorphisme, c’est-à-dire que u est bijective et que u et
u−1 sont C ∞ , on peut écrire
Z
∗
f (u(x))ϕ(x) dx
hu f, ϕi = hf (u(x)), ϕi =
ZΩ
f (y)ϕ(u−1 (y))|J(u)|−1 dy
=
Ω′
= h|J(u)|−1 f, ϕ ◦ u−1 i
pour tout ϕ ∈ D(Ω), où |J(u)| ∈ C ∞ (Ω) est le Jacobien de u, c’est-à-dire le déterminant
∂ui
. Par conséquent,
de la matrice Jacobienne J(u) de u, ayant pour coefficients J(u)ij = ∂x
j
∗
−1
la distribution u f est obtenue à partir de la fonction |J(u)| f localement intégrable sur
Ω′ .
On peut ensuite utiliser la relation
hu∗ f, ϕi = h|J(u)|−1 f, ϕ ◦ u−1 i
pour tout ϕ ∈ D(Ω), afin de définir l’image inverse u∗ f de distributions f ∈ D ′ (Ω′ ) plus
générales, comme par exemple la distribution de Dirac.
63
Exemples.
1. Soient Ω = Ω′ = R, δ ∈ D(Ω′ ) la distribution, de Dirac et u(x) = ax. Alors, pour
tout ϕ ∈ D(Ω),
Z
Z
y 1
1
δ(y)ϕ( )
δ(ax)ϕ(x) dx =
dy = ϕ(0) .
hu∗ δ, ϕi = hδ(ax), ϕi =
a |a|
|a|
R
R
On en déduit que δ(ax) =
1
|a| δ(x).
2. Soient Ω = R3 , δ ∈ D ′ (R3 ) la distribution de Dirac, (r, θ, ϕ) les coordonnées sphériques et (x, y, z) les coordonnées cartésiennes. Le lien entre ces coordonnées s’écrit
sous la forme (x, y, z) = u(r, θ, ϕ), et le Jacobien de ce changement de coordonnées
est donné par J(u) = r 2 sin θ. En procédant comme ci-dessus, on obtient
δ(r − r0 , θ − θ0 , ϕ − ϕ0 ) =
1
δ(x − x0 , y − y0 , z − z0 ),
r 2 sin θ
où (r0 , θ0 , ϕ0 ) et (x0 , y0 , z0 ) sont les coordonnées sphériques et cartésiennes d’un
même point de R3 .
N
La définition de l’image inverse d’une distribution peut être étendue au cas où u : Ω → Ω′
n’est pas un difféomorphisme, mais où le Jacobien J(u) 6= 0 lorsque u(x) ∈ supp f . Dans
ce cas, il faut remplacer ϕ ◦ u−1 dans la définition de u∗ f par l’image directe u(ϕ) de ϕ
en tant que distribution sur Ω.
Exemple. Soit Ω = Ω′ = R, δ ∈ D ′ (R) la distribution de Dirac et y = u(x) avec u′ (x) 6= 0
lorsque u(x) = 0. On obtient
δ(u(x)) =
k
X
1
|u′ (ai )|
i=1
δ(x − ai )
avec u−1 (0) = {a1 , . . . , ak }.
4.2.6
N
Propriétés des opérations
Les opérations introduites ci-dessus sont des applications linéaires continues dans D ′ . En
D′
d’autres termes, si fn → f , alors
D′
Ta fn → Ta f,
D′
∂ α f → ∂ α f,
Z x n
Z x
D′
fn →
f,
D′
gfn → gf,
D′
u(fn ) → u(f ),
D′
u∗ fn → u∗ f,
pour tout a ∈ Rn ,
pour tout multi-indice α,
pour tout g ∈ C ∞ (Ω),
pour toute application u C ∞ et propre,
pour tout difféomorphisme u.
64
En effet, ces opérations sont toutes définies en faisant agir la distribution f (ou fn ) sur le
résultat d’une autre opération sur la fonction test ϕ. Par exemple,
lim hTa fn , ϕi = lim hfn , T−a ϕi = hf, T−a ϕi = hTa f, ϕi.
n→∞
n→∞
D′
Par ailleurs, si an → a dans Rn , alors Tan f → Ta f , car la translation est une opération
continue dans D(Rn ).
4.3
Lissage
Fixons une fonction
test ρ ∈ D(Rn ) dont le support est la boule unité B(0, 1) et qui est
R
normalisée : Rn ρ(x) dx = 1. On peut prendre par exemple
(
1
−
1−kxk2
si kxk < 1,
Ce
ρ(x) =
0
si kxk ≥ 1,
où C ∈ R est la constante de normalisation appropriée.
Soit δ > 0. A toute distribution f ∈ D ′ (Rn ) on associe une fonction Jδ f : Rn → R, appelée
lissage de f , et définie par
Jδ f (y) = hf,
1
ρ ◦ uδ,y i,
δn
avec uδ,y (x) =
x−y
.
δ
L’opérateur Jδ est appelé opérateur de lissage.
Lorsque f est induite par une fonction localement intégrable, on a
Z
Z
1 x−y
f (y + δx)ρ(x) dx.
f (x) n ρ(
) dx =
Jδ f (y) =
δ
δ
Rn
Rn
Dans ce cas, la valeur de la fonction Jδ f en y est une moyenne pondérée des valeurs prises
par f dans la boule B(y, δ).
Proposition 4.4. Soit f ∈ D ′ (Rn ) et δ > 0. Alors
(i) hJδ f, ϕi = hf, Jδ ϕi pour tout ϕ ∈ D(Rn ) ;
(ii) Jδ ∂ α f = ∂ α Jδ f pour tout multi-indice α ;
(iii) Jδ f ∈ C ∞ (Rn ) ;
D
(iv) pour tout ϕ ∈ D(Rn ), Jδ ϕ → ϕ lorsque δ → 0 ;
D′
(v) Jδ f → f lorsque δ → 0 ;
D′
D′
(vi) si fn → f alors Jδ fn → Jδ f ;
(vii) Jδ1 Jδ2 f = Jδ2 Jδ1 f pour tout δ1 , δ2 > 0 ;
(viii) Jδ Ta f = Ta Jδ f pour tout a ∈ Rn .
65
Démonstration.
R
(i) L’expression hJδ f, ϕi = K Jδ f (y)ϕ(y) dy où K ⊂ Rn est un compact contenant le
support de ϕ a un sens car la fonction Jδ f est continue. En écrivant cette intégrale
comme la limite d’une somme de Riemann, on obtient
hJδ f, ϕi =
=
=
lim
N →∞
lim
N →∞
N
X
Jδ f (yi )ϕ(yi ) ∆yi
i=1
N
X
i=1
lim hf,
N →∞
hf,
1
ρ ◦ uδ,yi iϕ(yi ) ∆yi
δn
N
X
1
ρ ◦ uδ,yi ϕ(yi ) ∆yi i.
δn
i=1
D’autre part,
Z
N
X
x−y
1 x − yi
D
ρ(
)ϕ(yi ) ∆yi →
)ϕ(y) dy = Jδ ϕ(x)
ρ(
δn
δ
δ
K
i=1
lorsque N → ∞, puisque l’on peut dériver sous le signe intégral. On en déduit que
hJδ f, ϕi = hf, Jδ ϕi.
(ii) La propriété est vérifiée lorsque f ∈ C0∞ (Rn ), puisque
Z
f (y + δx)ρ(x) dx
Jδ f (y) =
B(0,1)
et comme on peut différentier sous le signe intégral. Dans le cas général, on procède
par dualité : pour tout ϕ ∈ D(Ω), on a
hJδ ∂ α f, ϕi =
h∂ α f, Jδ ϕi
= (−1)|α| hf, ∂ α Jδ ϕi
|α|
α
= (−1) hf, Jδ ∂ ϕi = (−1)|α| hJδ f, ∂ α ϕi
=
h∂ α Jδ f, ϕi.
(iii) Comme ∂ α Jδ f = Jδ ∂ α f est continue pour tout multi-indice α, on a bien Jδ f ∈
C ∞ (Rn ).
(iv) Tout d’abord, le support de Jδ ϕ est contenu dans un δ0 -voisinage du support de ϕ
pour tout δ ∈]0, δ0 [. Montrons ensuite que Jδ ϕ converge uniformément vers ϕ lorsque
δ → 0. On a
Z
|Jδ ϕ(y) − ϕ(y)| = ϕ(y + δx)ρ(x) dx − ϕ(y)
B(0,1)
Z
≤
|ϕ(y + δx) − ϕ(y)|ρ(x) dx
B(0,1)
≤
sup |ϕ(y + δx) − ϕ(y)|.
x∈B(0,1)
Comme ϕ est uniformément continue, le membre de droite peut être rendu arbitrairement petit en réduisant δ > 0. Enfin, ∂ α Jδ ϕ = Jδ ∂ α ϕ converge uniformément vers
∂ α ϕ.
66
(v) On procède par dualité en exploitant (iv) :
hJδ f, ϕi = hf, Jδ ϕi → hf, ϕi
lorsque δ → 0, pour tout ϕ ∈ D(Rn ).
(vi) De même,
hJδ fn , ϕi = hfn , Jδ ϕi → hf, Jδ ϕi = hJδ f, ϕi
lorsque n → ∞, pour tout ϕ ∈ D(Rn ).
(vii) La propriété est vérifiée lorsque f ∈ C0∞ (Rn ), puisque l’on peut permuter les signes
intégraux. Ensuite, par dualité,
hJδ1 Jδ2 f, ϕi = hJδ2 f, Jδ1 ϕi = hf, Jδ2 Jδ1 ϕi
= hf, Jδ1 Jδ2 ϕi = hJδ1 f, Jδ2 ϕi = hJδ1 Jδ2 f, ϕi.
(viii) La propriété se vérifie par calcul direct lorsque f ∈ C0∞ (Rn ), puis par dualité dans
le cas général.
En particulier, toute distribution peut être approximée par une fonction infiniment différentiable. Nous avions déjà vu que c’était le cas pour la distribution de Dirac.
4.4
Régularisation
A toute fonction localement intégrable, nous avons associé une distribution. Cependant,
certaines distributions sont associées à des fonctions non localement intégrables. Nous nous
limiterons au cas des fonctions ayant une singularité non intégrale en un point, comme
par exemple x1 .
Définition 4.5. Soit Ω un ouvert de Rn et f : Ω → K une fonction intégrable sur tout
compact K ⊂ Ω ne contenant pas le point x0 ∈ Ω. Une régularisation de f est une
distribution fr ∈ D ′ (Ω) telle que
Z
f (x)ϕ(x)dx,
hfr , ϕi =
Ω
pour toute fonction test ϕ ∈ D(Ω) telle que x0 ∈
/ supp ϕ.
Bien entendu, ni l’existence, ni l’unicité d’une régularisation n’est garantie.
Exemples.
1
1. La fonction f (x) = e x2 n’admet pas de régularisation dans D ′ (R).
2. Si il existe une régularisation fr pour f , alors fr + Cα Tx0 δ(α) est également une
régularisation pour f pour tout α ∈ Z+ et Cα ∈ K.
N
67
Lorsque la singularité de f en x0 n’est pas trop forte, l’existence d’une régularisation est
garantie.
Définition 4.6. Une fonction f : R → K a une singularité algébrique en x0 si il existe
m ∈ Z+ tel que (x−x0 )m f (x) est intégrable dans un voisinage de x0 . L’entier m est appelé
l’ordre de la singularité.
Dans le cas d’une fonction f possédant une unique singularité algébrique en x0 , on peut
définir une régularisation fr ∈ D ′ (R) par
!
Z
Z
m−1
X (x − x0 )k dk ϕ
f (x) ϕ(x) −
f (x)ϕ(x)dx +
hfr , ϕi =
(x0 ) dx
k!
dxk
|x−x0 |<a
[x−x0 |>a
k=0
pour tout ϕ ∈ D(R), avec a > 0. Bien entendu, le résultat dépend en général de la valeur
de a choisie. Il est donc d’autant plus souhaitable de pouvoir identifier une régularisation
préférée.
On peut montrer que, pour toute fonction f n’ayant que des singularités algébriques, il
existe une unique régularisation canonique frc ∈ D ′ (R), telle que
(i) pour tout a, b ∈ K, afrc + bgrc = (af + bg)rc ;
d
d
f rc = dx
frc ;
(ii) dx
(iii) pour tout g ∈ C ∞ (R), (gf )rc = gfrc .
Exemple. La fonction x1 a une singularité algébrique d’ordre 1 à l’origine. On peut lui
associer une régularisation vp( x1 ) ∈ D ′ (R) appelée valeur principale de x1 et définie par
1
hvp( ), ϕi = lim
x
ǫ→0+
Z
−ǫ
−∞
1
ϕ(x)dx +
x
Z
ǫ
∞
1
ϕ(x)dx
x
pour tout ϕ ∈ D(R). On peut vérifier grâce aux propriétés ci-dessus qu’il s’agit en fait de
la régularisation canonique de x1 .
N
4.5
Propriétés locales
Comme nous l’avons déjà mentionné, on ne peut en général pas parler de la valeur d’une
distribution f ∈ D ′ (Ω) en un point x ∈ Ω. Cependant, certaines propriétés locales des
fonctions peuvent être étendues aux distributions.
4.5.1
Egalités et inégalités locales
Nous commençons par donner un sens à des égalités entre distributions f, g ∈ D ′ (Ω) sur
un sous-ensemble de Ω.
Définition 4.7. Soient f, g ∈ D ′ (Ω) et O un ouvert de Ω. On dit que f = g sur O si
hf, ϕi = hg, ϕi pour tout ϕ ∈ D(Ω) tel que supp ϕ ⊂ O.
68
Dans le cas de distributions à valeurs réelles, on peut aussi parler d’inégalités entre distributions.
Définition 4.8. Soient f, g ∈ D ′ (Ω) et O un ouvert de Ω. On dit que f ≤ g sur O si
hf, ϕi ≤ hg, ϕi pour tout ϕ ∈ D(Ω) tel que ϕ ≥ 0 et supp ϕ ⊂ O.
A partir de la notion d’égalité locale, on peut définir le support d’une distribution.
Définition 4.9. Le support d’une distribution f ∈ D ′ (Ω) est le complémentaire du plus
grand ouvert O ⊂ Ω tel que f = 0 sur O.
Pour les fonctions continues sur Ω, le support en tant que fonction dans C 0 (Ω) coincide
avec le support en tant que distribution D ′ (Ω). En revanche, ceci n’est pas forcément vrai
pour les fonctions localement intégrables avec des discontinuités.
Grâce aux inégalités, on peut également parler de la notion de distributions bornées.
Lorsque f ∈ D ′ (Ω) est à valeurs complexes, on définit sa partie réelle Re(f ) par
1
hRe(f ), ϕi = (hf, ϕi + hf, ϕi)
2
pour tout ϕ ∈ D(Ω). La partie imaginaire Im(f ) de f est définie par Im(f ) = Re(−if ).
Définition 4.10. Soit f ∈ D ′ (Ω). On dit que f est bornée si
(i) lorsque K = R, il existe une constante M > 0 telle que −M ≤ f ≤ M sur Ω ;
(ii) lorsque K = C, il existe une constante M > 0 telle que, pour tout θ ∈ R, Re(eiθ f ) ≤
M sur Ω.
On peut montrer que l’espace L∞ (Ω) ⊂ D ′ (Ω) des distributions bornées sur Ω, muni de
la norme
kf k∞ = inf{M ∈ R+ | Re(eiθ f ) ≤ M, pour tout θ ∈ R},
est un espace de Banach. Nous étudierons cet espace plus en détails ultérieurement.
4.5.2
Recollement
Soit f ∈ D ′ (Ω) et (Ωi )i∈I un recouvrement de Ω par des ouverts. Alors f induit par
restriction à D(Ωi ) ⊂ D(Ω) des distributions fi ∈ D ′ (Ωi ). Inversement, on voudrait pouvoir
recoller les distributions fi ∈ D ′ (Ωi ) en une distribution f ∈ D ′ (Ω).
Soit (Ωi )i=1,...,N un recouvrement fini par des ouverts d’un ensemble compact K ⊂ Ω. Une
partition de l’unité sur K subordonnée au recouvrement (Ωi )i=1,...,N est une famille de
fonctions ρi ∈ D(Ω), i = 1, . . . , N , telle que
(i) supp ρi ⊂ Ωi , pour tout i = 1, . . . , N ;
PN
(ii)
i=1 ρi (x) = 1 pour tout x ∈ K.
69
On peut montrer qu’il existe toujours une telle partition de l’unité.
Soient fi ∈ D ′ (Ωi ) telles que fi = fj sur Ωi ∩ Ωj , pour tout i, j ∈ I. On définit leur
recollement f ∈ D ′ (Ω) en choisissant, pour tout ϕ ∈ D(Ω), un sous-recouvrement fini
Ω′i , i = 1, . . . , N du compact K = supp ϕ et une partition de l’unité ρi , i = 1, . . . , N sur
K subordonnée au recouvrement (Ω′i )i=1,...,N , et en posant
hf, ϕi =
N
X
i=1
hfi , ρi ϕi.
On vérifie que le membre de droite est indépendant du choix du sous-recouvrement et de
la partition de l’unité ci-dessus.
4.5.3
Structure locale
Les distributions généralisent la notion de fonction. En effet, à toute fonction localement
intégrable on peut associer une distribution, mais il existe également des distributions qui
ne correspondent à aucune fonction, comme la distribution de Dirac.
Dès lors, il est important de savoir jusqu’à quel point les distributions sont plus générales
que les fonctions, ou encore comment obtenir toutes les distributions à partir des seules
fonctions. Le résultat suivant, dû à Laurent Schwartz, répond à ces questions, mais sa
démonstration sort largement du cadre de ce cours.
Théorème 4.11. Une distribution f ∈ D ′ (Rn ) est égale, dans tout ouvert borné Ω de Rn ,
à une dérivée ∂ α g (au sens des distributions) d’une fonction continue g dont le support
peut être choisi dans un voisinage arbitraire de Ω.
4.6
Produit tensoriel
Soient ϕ : Ω ⊂ Rm → K et ψ : Ω′ ⊂ Rn → K deux fonctions. Leur produit tensoriel est
la fonction ϕ ⊗ ψ : Ω × Ω′ ⊂ Rm+n → K définie par
ϕ ⊗ ψ(x, y) = ϕ(x)ψ(y)
pour tout x ∈ Ω, y ∈ Ω′ .
On désire étendre cette définition à des distributions f ∈ D ′ (Ω) et g ∈ D ′ (Ω).
Définition 4.12. Soient f ∈ D ′ (Ω) et g ∈ D ′ (Ω′ ). Leur produit tensoriel est la distribution f ⊗ g ∈ D ′ (Ω × Ω′ ) telle que
hf ⊗ g, ϕ ⊗ ψi = hf, ϕi hg, ψi
pour tout ϕ ∈ D(Ω), ψ ∈ D(Ω′ ).
70
Cette définition est motivée par le cas où les distributions f et g sont induites par des
fonctions localement intégrables, pour lesquelles
Z
Z
Z
g(y)ψ(y) dy
f (x)ϕ(x) dx
f (x)g(y)ϕ(x)ψ(y) dx dy =
Ω×Ω′
Ω′
Ω
pour tout ϕ ∈ D(Ω), ψ ∈ D(Ω′ ).
De plus, cette définition caractérise bien la distribution f ⊗ g, c’est-à-dire spécifie de
manière unique hf ⊗ g, χi ∈ K pour tout χ ∈ D(Ω × Ω′ ). En effet, on peut montrer que
l’espace vectoriel D(Ω) ⊗ D(Ω′ ) engendré par les produits tensoriels ϕ ⊗ ψ avec ϕ ∈ D(Ω)
et ψ ∈ D(Ω′ ) est dense dans D(Ω × Ω′ ). Ainsi, pour tout χ ∈ D(Ω × Ω′ ), il existe donc
D
une suite χk ∈ D(Ω) ⊗ D(Ω′ ) telle que χk → χ, et on a hf ⊗ g, χi = limk→∞ hf ⊗ g, χk i.
Comme dans le Théorème 2.18, on peut montrer que cette limite ne dépend pas du choix
de la suite χk approximant χ, malgré le fait que D(Ω) n’est pas un espace métrique.
De même, on peut aussi montrer que l’espace vectoriel engendré par les produits tensoriels
f ⊗ g avec f ∈ D ′ (Ω) et g ∈ D ′ (Ω′ ) est dense dans D ′ (Ω × Ω′ ).
Le produit tensoriel des distributions possède les propriétés suivantes, qui sont facilement
vérifiables.
Proposition 4.13. Soient f ∈ D ′ (Ω), g ∈ D ′ (Ω′ ) et h ∈ D ′ (Ω′′ ). Alors
(i) f ⊗ g = g ⊗ f ∈ D ′ (Ω × Ω′ ) ;
(ii) (f ⊗ g) ⊗ h = f ⊗ (g ⊗ h) ∈ D ′ (Ω × Ω′ × Ω′′ ) ;
(iii) supp (f ⊗ g) = (supp f ) × (supp g).
Exercices sur le Chapitre 4
1. Montrer que les suites de distributions suivantes convergent vers la distribution de
Dirac δ au sens D ′ :
1
,
n si |x| < 2n
(a) fn (x) =
0 sinon;
(b) gn (x) =
2 2
√n e−n x .
π
2. Calculer les distributions suivantes :
1
si x > 0,
d
(a) dx sign(x), avec sign(x) =
−1 si x < 0;
(b)
d
dx
log |x| ∈ D ′ (R) ;
1
(c) ∆ log kxk
∈ D ′ (R2 ).
∂
1 ∂
r ∂r (r ∂r ψ)
fonction x1 .
Rappel : en coordonnées polaires (r, θ), ∆ψ =
Déduire de (b) la régularisation canonique de la
71
+
1 ∂2
ψ.
r 2 ∂θ 2
3. (a) Montrer que toute distribution f ∈ D ′ (R) telle que xf = 0 est de la forme
f = cδ avec c ∈ K.
i
d
(b) Calculer x dx
i δ pour tout entier i > 0.
(c) En déduire la solution générale de l’équation xk f = 0 dans D ′ (R).
72
Chapitre 5
Distributions tempérées
“The shortest path between two truths in the real domain
passes through the complex domain.”
Jacques Hadamard (1865 - 1963)
5.1
Définition
Une fonction ϕ ∈ C ∞ (Rn ) est dite à décroissance rapide si pour tout multi-indice α et
tout entier k ≥ 0, il existe une constante Kα,k telle que
sup kxkk |∂ α ϕ(x)| < Kα,k .
x∈Rn
En d’autres termes, la fonction ϕ et toutes ses dérivées décroissent plus vite que l’inverse
de tout polynôme lorsque kxk → ∞.
On dit qu’une suite (ϕn ) de fonctions à décroissance rapide converge vers ϕ ∈ C ∞ (Rn )
au sens S si
sup kxkk |∂ α ϕn (x) − ∂ α ϕ(x)| → 0
x∈Rn
lorsque n → ∞,
pour tout multi-indice α et tout entier k > 0. Dans ce cas, la limite ϕ est également une
fonction à décroissance rapide.
On peut montrer que l’ensemble des fonctions à décroissance rapide forme un espace
vectoriel, qui peut être muni d’une topologie induisant la convergence au sens S. Cet
espace vectoriel topologique est appelé espace de Schwartz et noté S(Rn ).
Soit S ′ (Rn ) le dual topologique de S(Rn ). Un élément de S ′ (Rn ) est appelé distribution
tempérée. Il s’agit d’une fonctionnelle linéaire f sur S(Rn ) qui est continue pour la
convergence S, c’est-à-dire
S
hf, ϕn i → hf, ϕi ∈ K si ϕn → ϕ.
73
En d’autres termes, une distribution f ∈ D ′ (Rn ) est tempérée si et seulement si il existe
m ∈ Z+ et C > 0 tels que
|hf, ϕi| ≤ C sup kxkk |∂ α ϕ(x)|.
x∈Rn
k,|α|≤m
Comme pour D ′ (Ω), on munit S ′ (Rn ) de la topologie la moins fine rendant continues les
fonctionnelles linéaires S ′ (Rn ) → K : f 7→ hf, ϕi, avec ϕ ∈ S(Rn ). Ainsi, une suite de
distributions tempérées fn ∈ S ′ (Rn ) converge vers f ∈ S(Rn ) si et seulement si
hfn , ϕi → hf, ϕi
pour tout ϕ ∈ S(Rn ). Dans ce cas, on parle de convergence au sens S ′ et on note
S′
fn → f .
Toute fonction test est à décroissance rapide : D(Rn ) ⊂ S(Rn ). De plus, l’injection i :
D
D(Rn ) ֒→ S(Rn ) est continue, c’est-à-dire que si ϕn , ϕ ∈ D(Rn ), la convergence ϕn → ϕ
S
au sens D implique la convergence ϕn → ϕ au sens S. Par conséquent, toute distribution
tempérée f ∈ S(Rn ) induit par restriction à D(Rn ) une distribution f |D(Rn ) ∈ D ′ (Rn ).
Inversement, une distribution f ∈ D ′ (Rn ) est tempérée si et seulement si elle peut être
étendue en une fonctionnelle linéaire continue sur S(Rn ). Ceci justifie la terminologie
utilisée. En particulier, on a S ′ (Rn ) ⊂ D ′ (Rn ).
Enfin, à toute fonction f ∈ S(Rn ) à décroissance rapide on peut associer une distribution
tempérée dans S ′ (Rn ), encore notée f , comme on l’a fait avec les fonctions localement
intégrables pour D ′ (Rn ) :
Z
hf, ϕi =
f (x)ϕ(x)dx,
(5.1)
Rn
pour tout ϕ ∈ S(Rn ). En résumé, nous avons donc
D(Rn ) ⊂ S(Rn ) ⊂ S ′ (Rn ) ⊂ D ′ (Rn )
et toutes les injections sont continues. On vérifie également qu’elles sont denses.
Ainsi, les opérations définies sur les distributions dans D ′ (Rn ) s’étendent aux distributions tempérées dans S ′ (Rn ). On peut en effet vérifier que la translation, la dérivation,
l’intégration, le lissage et le produit tensoriel de distributions tempérées est tempérée. Le
produit tensoriel de distributions tempérées se définit comme au chapitre 4 et est une
distribution tempérée, car l’espace vectoriel S(Rm ) ⊗ S(Rn ) engendré par les produits
tensoriels de fonctions à décroissance rapide est dense dans S(Rm+n ). Par contre, pour la
multiplication et le changement de variables, il faut restreindre la classe des fonctions et
de difféomorphismes utilisés dans ces opérations, pour garder des distributions tempérées.
Définition 5.1. Une fonction f : Rn → K est dite à croissance lente si il existe un
polynôme P : R → R tel que
pour tout x ∈ Rn .
|f (x)| ≤ P (kxk)
74
Ainsi, la multiplication d’une distribution tempérée et d’une fonction C ∞ à croissance lente
est encore une distribution tempérée. De plus, à toute fonction f ∈ C ∞ (Rn ) à croissance
lente on peut associer une distribution tempérée f ∈ S ′ (Rn ), définie par la formule (5.1).
Bien entendu, il existe des distributions tempérées qui ne correspondent pas à une fonction
à croissance lente, comme par exemple la distribution de Dirac δ ∈ S ′ (Rn ) ⊂ D ′ (Rn ).
Les distributions tempérées peuvent être caractérisées parmi toutes les distributions au
moyen du résultat suivant, dû à L. Schwartz.
Théorème 5.2. Soit f ∈ D ′ (Rn ). Les propriétés suivantes sont équivalentes :
(i) f est une distribution tempérée ;
(ii) la fonction Jδ f est à croissance lente, pour tout opérateur de lissage Jδ ;
(iii) f = ∂ α g où g est continue et à croissance lente.
5.2
5.2.1
Transformée de Fourier dans S(Rn )
Définition
Soit ϕ ∈ S(Rn ). On définit sa transformée de Fourier F(ϕ) : Rn → C par
n Z
1
e−iy·x ϕ(x) dx,
F(ϕ)(y) = √
n
2π
R
Pn
où y · x = i=1 yi xi . On notera quelquefois F(ϕ) = ϕ.
b Vérifions que l’intégrale définissant
F(ϕ) est bien convergente. Posons
n Z
1
e−iy·x ϕ(x) dx,
ϕ
bk (y) = √
2π
B(0,k)
où B(0, k) ⊂ Rn est la boule fermée de centre 0 et de rayon k. Alors, lorsque k < l, on a
n Z
1
|ϕ
bk (y) − ϕ
bl (y)| = √
e−iy·x ϕ(x) dx
2π
B(0,l)\B(0,k)
n Z
1
1
√
≤
dx
p+n
kxk
2π
B(0,l)\B(0,k)
C
≤
,
kp
pour tout entier p > 0, pour une certaine constante C > 0. Par conséquent, la suite ϕ
bk (y)
est de Cauchy, et converge donc vers ϕ(y).
b
De plus, cette convergence est uniforme sur
Rn .
5.2.2
Propriétés
Proposition 5.3. Soit ϕ ∈ S(Rn ).
75
(i) règles de calcul : pour tout multi-indice α,
∂ α F(ϕ) = F((−i)|α| xα ϕ)
i|α| y α F(ϕ) = F(∂ α ϕ);
et
(ii) F(ϕ) ∈ S(Rn ) ;
(iii) formule d’inversion :
ϕ(x) =
1
√
2π
S
n Z
Rn
eiy·x F(ϕ)(y) dy;
S
(iv) si ϕn ∈ S(Rn ) et ϕn → ϕ alors F(ϕn ) → F(ϕ) ;
(v) pour tout ϕ1 , ϕ2 ∈ S(Rn ), hF(ϕ1 ), ϕ2 i = hϕ1 , F(ϕ2 )i (relation de Parseval) ;
(vi) F(F(ϕ))(x) = ϕ(−x) pour tout x ∈ Rn ;
(vii) si ϕ1 ∈ S(Rm ), ϕ2 ∈ S(Rn ) alors
F(ϕ1 ⊗ ϕ2 ) = F(ϕ1 ) ⊗ F(ϕ2 ).
Démonstration.
(i) Il suffit de démontrer les règles de calcul pour |α| = 1. En reprenant la suite de
fonctions ϕ
bk ci-dessus, on a
n Z
1
∂
−ixj e−iy·x ϕ(x) dx,
ϕ
bk (y) = √
∂yi
2π
B(0,k)
en dérivant sous le signe intégral. Comme on a l’estimation |xj ϕ(x)| ≤ kxk1p+n
lorsque kxk est suffisamment grand, pour tout entier p > 0, la suite de fonctions
∂
bk converge uniformément sur Rn lorsque k → ∞. Comme ϕ
bk converge uni∂yj ϕ
formément vers ϕ,
b on en déduit que
∂
b
∂yj ϕ
= F(−ixj ϕ).
∂
bk
∂yj ϕ
converge vers
∂
b
∂yj ϕ.
On en déduit que
D’autre part, en intégrant par parties, on obtient
n Z
∂
1
∂
√
F(
e−iy·x
ϕ) =
ϕ(x) dx
∂xj
∂xj
2π
Rn
n Z 1
∂ −iy·x
= − √
e
ϕ(x) dx
∂xj
2π
Rn
n Z
1
−iyj e−iy·x ϕ(x) dx
= − √
n
2π
R
= iyj F(ϕ).
(ii) Par application combinée des règles de calcul (i), on a
i|β| y β ∂ α F(ϕ) = F(∂ β ((−i)|α| xα ϕ)),
76
pour tous multi-indices α et β. Remarquons que ∂ β ((−i)|α| xα ϕ) est à décroissance
rapide puisque ϕ ∈ S(Rn ). Par conséquent,
X Z
k α
|∂ β ((−i)|α| xα ϕ)|dx
kyk |∂ F(ϕ)| ≤ C
|β|≤2k
≤ C
Rn
X Z
|β|≤2k
Rn
1
dx,
1 + kxkp+n
pour une certaine constante C > 0 et pour tout entier p > 0. Comme cette dernière
expression est finie et indépendante de y, pour tout entier k ≥ 0 et tout multi-indice
α, on en déduit que F(ϕ) ∈ S(Rn ).
(iii) Nous souhaitons calculer
n Z
n Z
Z
1
1
√
eiy·x
e−iy·ξ ϕ(ξ) dξ dy.
eiy·x F(ϕ)(y) dy =
2π
n
n
n
2π
R
R
R
Nous ne pouvons cependant pas permuter les intégrales, car la fonction eiy·(x−ξ) ϕ(ξ)
n’est pas intégrable sur Rn ×Rn . Pour contourner ce problème, multiplions l’intégrand
2
2
par la fonction e−ǫ kyk /4 qui tend vers 1 lorsque ǫ → 0. On peut maintenant calculer
n Z
2
2
1
√
eiy·x e−ǫ kyk /4 F(ϕ)(y) dy
Iǫ (x) =
n
2π
n Z Z R
1
2
2
=
eiy·(x−ξ) e−ǫ kyk /4 ϕ(ξ) dξ dy
2π
2n
n Z R
Z
1
2
2
eiy·(x−ξ) e−ǫ kyk /4 dy dξ
ϕ(ξ)
=
2π
Rn
Rn
√ !n
n Z
2
1
2 2
√
=
ϕ(ξ)
e−kx−ξk /ǫ dξ
ǫ
n
2π
R
n
Z
1
2 2
e−kx−ξk /ǫ dξ.
ϕ(ξ) √
=
πǫ
Rn
2
2
Nous avons utilisé le calcul de F(e−ǫ kyk /4 ) qui sera effectué dans un exemple plus
bas. D’une part, par définition de Iǫ (x),
n Z
1
lim Iǫ (x) = √
eiy·x F(ϕ)(y) dy.
ǫ→0
n
2π
R
n
2 2 D
D’autre part, nous avons vu au chapitre 4 que √1πǫ e−kx−ξk /ǫ → Tξ δ lorsque
ǫ → 0. Par conséquent, le calcul de Iǫ (x) ci-dessus montre que limǫ→0 Iǫ (x) = ϕ(x)
comme désiré.
(iv) Quitte à remplacer ϕn par ϕn − ϕ, nous pouvons supposer sans perte de généralité
que ϕ = 0. Dans ce cas, nous devons montrer que
sup kykk |∂ α ϕ
bn (y)| → 0
y∈Rn
77
lorsque n → ∞, pour tout entier k ≥ 0 et tout multi-indice α. Dans la preuve de
(ii), nous avons vu que
X Z
k α
|∂ β (xα ϕn (x))| dx
kyk |∂ ϕ
bn (y)| ≤ C
|β|≤2k
Rn
S
pour une certaine constante C > 0. Mais le fait que ϕn → 0 implique que
sup (1 + kxkp+n )|∂ β (xα ϕn (x))| → 0,
x∈Rn
pour tout entier p > 0, lorsque n → ∞. On obtient donc le resultat souhaité.
(v) En permutant les intégrales, on calcule que
n Z
Z
1
ϕ2 (y) √
hF(ϕ1 ), ϕ2 i =
e−iy·x ϕ1 (x) dx dy
n
n
2π
R
n ZR
Z
1
e−iy·x ϕ2 (y) dy dx
ϕ1 (x) √
=
2π
Rn
Rn
= hϕ1 , F(ϕ2 )i.
(vi) Il suffit de remplacer x par −x dans la formule d’inversion.
(vii) On calcule directement que
m+n Z Z
1
√
e−i(y1 ·x1 +y2 ·x2 ) ϕ1 (x1 )ϕ2 (x2 ) dx1 dx2
F(ϕ1 ⊗ ϕ2 ) =
m+n
2π
R
m Z
n Z
1
1
−iy1 ·x1
√
=
e
ϕ1 (x1 ) dx1 √
e−iy2 ·x2 ϕ(x2 ) dx2
2π
2π
Rm
Rn
= F(ϕ1 ) ⊗ F(ϕ2 ).
En particulier, les propriétés (ii), (iii) et (iv) de cette proposition montrent que la transformée de Fourier induit une application linéaire
F : S(Rn ) → S(Rn )
qui est inversible et continue (pour la convergence S). En fait, c’est un isomorphisme
d’espaces vectoriels topologiques.
Exemples.
2
1. Calculons F(ϕ) pour ϕ(x) = e−αx ∈ S(R). On a
Z ∞
1
2
e−iyx−αx dx
F(ϕ)(y) = √
2π −∞
Z
√
iy
1 − y2 ∞ −( 2√
− αx)2
α
dx
e
= √ e 4α
2π
−∞
Z ∞
y2
1
2
− 4α
= √
e−u du
e
2πα
−∞
1 − y2
= √ e 4α .
2α
78
Comme cette fonction est paire en y, on voit de même que
y2
1
F −1 (ϕ)(y) = √ e− 4α .
2α
2
2. Calculons maintenant F(ϕ) pour ϕ(x) = e−αkxk ∈ S(Rn ). On a
ϕ(x) =
n
Y
2
e−αxj
j=1
de sorte que
F(ϕ)(y) =
n
Y
2
yj
1
√ e− 4α =
2α
j=1
1
√
2α
n
e−
kyk2
4α
.
N
5.2.3
Théorème de Paley-Wiener
Comme D(Rn ) ⊂ S(Rn ), nous avons F(D(Rn )) ⊂ S(Rn ). Au vu de l’importance de
l’espace D(Rn ), il est intéressant de caractériser les éléments de l’espace F(D(Rn )).
Rappelons tout d’abord qu’une fonction f : Ω ⊂ Cn → C est dite holomorphe si sa
partie réelle u = Ref et sa partie imaginaire v = Imf satisfont les équations de CauchyRiemann, pour tout z = (z1 , . . . , zn ) ∈ Ω avec zj = xj + iyj :
(
∂v
∂u
= 0,
∂xj − ∂yj
∂v
∂u
= 0,
∂yj + ∂xj
pour j =, . . . , n. Dans ce cas, la fonction f est de classe C ∞ et même analytique : pour
tout z0 ∈ Ω, il existe un voisinage V de z0 dans Ω et des coefficients aα ∈ C, |α| ≥ 0, tels
que
X
f (z) =
aα (z − z0 )α ,
α
pour tout z ∈ V . Lorsque f est holomorphe sur tout Cn , on dit que f est entière.
Soit ϕ ∈ D(Rn ). Alors sa transformée de Fourier F(ϕ) peut être prolongée sur Cn , en
remplaçant y ∈ Rn par z = σ + iτ ∈ Cn , avec σ, τ ∈ Rn , dans sa définition :
n Z
1
F(ϕ)(z) = √
e−iσ·x eτ ·x ϕ(x) dx.
2π
Rn
Cette intégrale est en effet bien définie puisque eτ ·x ϕ(x) ∈ D(Rn ) pour tout τ ∈ Rn . De
plus, la fonction prolongée F(ϕ) : Cn → C est une fonction entière, car on peut dériver
sous le signe intégral pour vérifier les équations de Cauchy-Riemann.
79
Ensuite, la fonction entière F(ϕ) peut être majorée de la manière suivante :
n Z
1
√
eτ ·x |ϕ(x)| dx
|F(ϕ)(z)| ≤
n
2π
n Z R
1
√
≤
eτ ·x |ϕ(x)| dx
2π
B(0,a)
≤ C0 eakτ k ,
(5.2)
pour une certaine constante C0 > 0, en choisissant a > 0 de sorte que supp ϕ ⊂ B(0, a).
De même, pour tout q > 0, on montre la majoration suivante :
X 1 n Z
√
kzkq |F(ϕ)(z)| ≤ C
eτ ·x |∂ α ϕ(x)| dx
n
2π
R
|α|≤2q
Z
n
X
1
√
≤ C
eτ ·x |∂ α ϕ(x)| dx
2π
B(0,a)
|α|≤2q
≤ Cq eakτ k ,
(5.3)
pour une certaine constante Cq > 0.
En résumé, la transformée de Fourier d’une fonction ϕ ∈ D(Rn ) s’étend en une fonction entière satisfaisant aux majorations (5.2) et (5.3). Le résultat suivant montre que la
réciproque est vraie, nous donnant ainsi la caractérisation souhaitée pour F(D(Rn )).
Théorème 5.4 (Paley-Wiener). Toute fonction ψ : Rn → C prolongeable en une fonction entière de z ∈ Cn satisfaisant
kzkq |ψ(z)| ≤ Cq ea kIm(z)k
(5.4)
pour certaines constantes a, Cq > 0, pour tout entier q ≥ 0, est la transformée de Fourier
d’une fonction ϕ ∈ D(Rn ).
Démonstration. L’inégalité (5.4) pour z = σ ∈ Rn montre que la fonction ψ : Rn → C est
la transformée de Fourier d’une fonction ϕ ∈ C ∞ (Rn ) définie par
n Z
1
eiσ·x ψ(σ) dσ.
ϕ(x) = √
2π
Rn
Comme eiz·x ψ(z) est une fonction entière, son intégrale par rapport à une composante
zj ∈ C de z le long d’une courbe fermée du plan complexe est nulle. Comme par (5.4)
|eiz·x ψ(z)| tend vers 0 lorsque |Re(z)| → ∞ plus vite que l’inverse de tout polynôme, on en
déduit en particulier que l’intégrale de eiz·x ψ le long d’une droite Im(zj ) = τj ne dépend
par de τj ∈ R. Par conséquent,
n Z
1
eiσ·x e−x·τ ψ(σ + iτ ) dσ.
ϕ(x) = √
n
2π
R
80
En appliquant (5.4) pour q = 0 et q = 2, on obtient, en posant C = C0 + C2 ,
Z
e−x·τ
|eiσ·x ψ(σ + iτ )| dσ
|ϕ(x)| ≤ √ n
2π
Rn
Z
e−x·τ
Ceakτ k
≤ √ n
dσ
2
2π
Rn 1 + kσ + iτ k
≤ C ′ eakτ k−x·τ ,
x
pour une certaine constante C ′ > 0. Choisissons τ = t kxk
avec t ≥ 0 ; on obtient
|ϕ(x)| ≤ C ′ et(a−kxk)
pour tout t ≥ 0. Comme le membre de droite peut être rendu arbitrairement petit lorsque
kxk > a, on en déduit que supp ϕ ⊂ B(0, a), de sorte que ϕ ∈ D(Rn ).
Transformée de Fourier dans S ′ (Rn )
5.3
5.3.1
Définition
On définit la transformée de Fourier d’une distribution tempérée f ∈ S ′ (Rn ) en s’inspirant de la relation de Parseval :
hF(f ), ϕi = hf, F(ϕ)i,
pour tout ϕ ∈ S(Rn ). Ceci définit bien une fonctionnelle linéaire F(f ) continue sur S(Rn ),
car F : S(Rn ) → S(Rn ) est continue.
5.3.2
Propriétés
Les propriétés de la transformée de Fourier dans S(Rn ) se généralisent à S ′ (Rn ).
Proposition 5.5.
(i) F : S ′ (Rn ) → S ′ (Rn ) est une application linéaire continue ;
(ii) F a un inverse F −1 défini par
hF −1 (f ), ϕi = hf, F −1 (ϕ)i,
pour tout f ∈ S ′ (Rn ), ϕ ∈ S(Rn ) ;
(iii) pour tout f ∈ S ′ (Rn ), F(F(f )) = u∗ f avec u : Rn → Rn : x 7→ −x ;
(iv) si f1 ∈ S ′ (Rm ) et f2 ∈ S ′ (Rn ), alors
F(f1 ⊗ f2 ) = F(f1 ) ⊗ F(f2 ).
81
(5.5)
Démonstration.
S′
(i) F est continue car, si fn → f , on a par dualité
hF(fn ), ϕi = hfn , F(ϕ)i → hf, F(ϕ)i = hF(f ), ϕi,
pour tout ϕ ∈ S(Rn ).
(ii) La formule (5.5) permet de définir, tout comme F, une application linéaire F −1 :
S ′ (Rn ) → S ′ (Rn ). Celle-ci est l’inverse de F car, par dualité,
hF −1 (F(f )), ϕi = hF(f ), F −1 (ϕ)i = hf, F(F −1 (ϕ))i = hf, ϕi,
pour tout f ∈ S ′ (Rn ), ϕ ∈ S(Rn ). De même, F(F −1 (f )) = f pour tout f ∈ S ′ (Rn ).
(iii) Par dualité, et comme u−1 = u et |J(u)| = 1, on a
hF(F(f )), ϕi = hf, F(F(ϕ))i = hf, ϕ ◦ ui = hu∗ f, ϕi
pour tout f ∈ S ′ (Rn ), ϕ ∈ S(Rn ).
(iv) Par dualité,
hF(f1 ⊗ f2 ), ϕ1 ⊗ ϕ2 i = hf1 ⊗ f2 , F(ϕ1 ⊗ ϕ2 )i
= hf1 ⊗ f2 , F(ϕ1 ) ⊗ F(ϕ2 )i
= hf1 , F(ϕ1 )ihf2 , F(ϕ2 )i
= hF(f1 ), ϕ1 ihF(f2 ), ϕ2 i
= hF(f1 ) ⊗ F(f2 ), ϕ1 ⊗ ϕ2 i,
pour tout f1 ∈ S ′ (Rm ), f2 ∈ S ′ (Rn ), ϕ1 ∈ S(Rm ) et ϕ2 ∈ S(Rn ). Ensuite, comme
S(Rm ) ⊗ S(Rn ) est dense dans S(Rm+n ), cette égalité s’étend à tout ϕ ∈ S(Rm+n ).
5.3.3
Théorème de Paley-Wiener
Remarquons que l’espace S ′ (Rn ) des distributions tempérées contient l’espace E ′ (Rn ) des
distributions à support compact. Cherchons donc à caractériser les distributions de
F(E ′ (Rn )) ⊂ S ′ (Rn ).
Tout d’abord, une distribution tempérée f à support compact s’étend naturellement sur
C ∞ (Rn ) par la formule
hf, ϕi = hf, ρϕi,
pour tout ϕ ∈ C ∞ (Rn ), en choisissant une fonction ρ ∈ D(Rn ) telle que ρ(x) = 1 pour tout
x ∈ supp f . En effet, le membre de droite ne dépend pas du choix d’une telle fonction. En
fait, on peut munir C ∞ (Rn ) d’une topologie pour en faire un espace vectoriel topologique
E(Rn ) dont le dual topologique est l’espace des distributions (tempérées ou non) à support
compact. Ceci explique la notation E ′ (Rn ) pour cet espace.
82
Ensuite, étant donnée une distribution à support compact f ∈ E ′ (Rn ), on peut définir une
fonction F : Rn → C par
n
1
hf, e−iy·x i.
F (y) = √
2π
Comme f est continue, on peut dériver par rapport à y avant l’application de f :
n
1
∂
d
hf, e−iy·x i.
F (y) = √
dy
∂y
2π
Par conséquent, F ∈ C ∞ (Rn ). De plus, si on prolonge F en une fonction sur Cn , ce
prolongement est une fonction entière, car les équations de Cauchy-Riemann peuvent être
vérifiées directement.
En appliquant le théorème 5.2, on peut montrer qu’il existe une fonction polynômiale
p : R → R et une constante a > 0 telle que
|F (z)| ≤ p(kzk)eakIm(z)k .
(5.6)
Montrons que la distribution (donc tempérée) associée à F : Rn → C n’est autre que la
transformée de Fourier de f . On a
Z
F (y)ϕ(y) dy
hF, ϕi =
n
n Z
R
1
√
hf, e−iy·x iϕ(y) dy
=
n
2π
Rn Z
1
−iy·x
e
ϕ(y) dy
=
f, √
2π
Rn
= hf, F(ϕ)i
= hF(f ), ϕi,
pour tout ϕ ∈ S(Rn ). La permutation de l’intégration et de l’application de f se justifie
comme dans la preuve de la proposition 4.4 (i).
En résumé, la transformée de Fourier d’une distribution à support compacte se prolonge
en une fonction entière satisfaisant (5.6). Le théorème de Paley-Wiener se généralise à
cette situation pour donner la réciproque.
Théorème 5.6 (Paley-Wiener). Toute fonction F : Rn → C prolongeable en une fonction entière de z ∈ Cn satisfaisant
|F (z)| ≤ C(1 + kzkN )eakIm(z)k
(5.7)
pour certaines constantes a, C > 0 et un certain entier N > 0, est la transformée de
Fourier d’une distribution à support compact f ∈ E ′ (Rn ) ⊂ S ′ (Rn ).
La démonstration de ce résultat est postposée à la section 5.4.2.
83
Exemples.
1. Soit f = Ta δ ∈ S ′ (Rn ). Comme f est à support compact, sa transformée de Fourier
est donnée par hf, e−iy·x i. On obtient donc
n
n
1
1
−iy·x
hTa δ, e
i= √
e−iy·a .
fb(y) = √
2π
2π
√
Inversement, la transformée de Fourier de eia·x ∈ S ′ (Rn ) est ( 2π)n Ta δ.
2. Soit f = ∂ α Ta δ ∈ S ′ (Rn ). En calculant comme dans l’exemple précédent, on obtient
n
1
b
√
f (y) =
h∂ α Ta δ, e−iy·x i
2π
n
1
|α|
√
hTa δ, ∂ α e−iy·x i
= (−1)
2π
n
1
|α|
√
= (i)
hTa δ, y α e−iy·x i
2π
n
1
|α|
√
y α e−iy·a .
= (i)
2π
Inversement, la transformée de Fourier de xα ∈ S ′ (Rn ) est
√
√
(−i)|α| ( 2π)n u∗ (∂ α δ) = (i)|α| ( 2π)n ∂ α δ
avec u(y) = −y.
3. Soit f (x) = 21 e−κ|x| ∈ S(R) ⊂ S ′ (R). Par la définition de la transformée de Fourier
dans S(R), on obtient
Z ∞
1
√
fb(y) =
e−iyx e−κ|x| dx
2 2π −∞
Z ∞
1
√
(cos(yx) − i sin(yx))e−κ|x| dx
=
2 2π −∞
Z ∞
1
cos(yx)e−κx dx.
= √
2π 0
En intégrant par parties deux fois de suite, on obtient
Z ∞
1 1
y 1
fb(y) = √
− √
sin(yx)e−κx dx
κ
κ
2π
2π 0
Z ∞
y2 1
1 1
√
−
= √
cos(yx)e−κx dx
2π κ κ2 2π 0
y2
1 1
− 2 fb(y).
= √
2π κ κ
Par conséquent,
κ
1
.
fb(y) = √
2
2π κ + y 2
Inversement, la transformée de Fourier de
84
κ
√1
2π κ2 +x2
est 12 e−κ|y| .
−κr
4. Soit f (x) = e4πr ∈ S ′ (R3 ) avec r = kxk. Utilisons pour x les coordonnées sphériques
(r, θ, ϕ) telles que r = kyk et θ = 0 correspondent au point y ∈ R3 . Notons kyk = k.
En calculant comme dans l’exemple précédent, on obtient
fb(y) =
=
=
1
√
2π
1
√
2π
1
√
2π
3 Z
3
0
1
2
3 Z
∞Z π
Z
0
∞
Z
2π
−π 0
∞Z 1
e−κr −ikr cos θ 2
e
r sinθ dr dθ dϕ
4πr
e−κr e−ikru r dr du
−1
e−κr
0
sin(kr)
r dr.
kr
En intégrant par parties deux fois de suite, on obtient
fb(y) =
Par conséquent,
k
κ
=
1
κ2
=
1
κ2
3 Z ∞
cos(kr)
1
√
e−κr
dr
k
2π
0
3
3 Z ∞
1
1
k2
sin(kr)
√
√
− 2
e−κr
dr
κ
k
2π
2π
0
3
1
k2
√
− 2 fb(y).
κ
2π
fb(y) =
1
√
2π
3
En particulier, la transformée de Fourier de
5.4
5.4.1
k2
1
4πr
1
.
+ κ2
3
est √12π
1
.
k2
N
Produit de convolution
Produit de convolution dans S(Rn )
Soient ϕ, ψ ∈ S(Rn ). On définit leur produit de convolution ϕ ∗ ψ : Rn → K par
Z
ϕ(x − y)ψ(y) dy.
ϕ ∗ ψ(x) =
Rn
Cette intégrale est convergente, puisque ϕ et ψ sont à décroissance rapide.
Proposition 5.7.
(i) Pour tout ϕ, ψ ∈ S(Rn ) et pour tout multi-indice α, on a
∂ α (ϕ ∗ ψ) = (∂ α ϕ) ∗ ψ = ϕ ∗ (∂ α ψ);
(ii) pour tout ϕ, ψ ∈ S(Rn ), ϕ ∗ ψ ∈ S(Rn ) ;
(iii) pour tout ψ ∈ S(Rn ), l’application linéaire S(Rn ) → S(Rn ) : ϕ 7→ ψ ∗ϕ est continue ;
85
(iv) pour tout ϕ, ψ, χ ∈ S(Rn ), on a
ϕ ∗ ψ = ψ ∗ ϕ,
(ϕ ∗ ψ) ∗ χ = ϕ ∗ (ψ ∗ χ);
(v) pour tout ϕ, ψ, χ ∈ S(Rn ), on a
hϕ ∗ ψ, χi = hϕ, ψe ∗ χi,
e
avec ψ(x)
= ψ(−x) pour tout x ∈ Rn ;
(vi) pour tout ϕ, ψ ∈ S(Rn ), on a
n
F(ϕ ∗ ψ) = (2π) 2 F(ϕ)F(ψ),
n
F(ϕψ) = (2π)− 2 F(ϕ) ∗ F(ψ).
Démonstration.
(i) La première égalité s’obtient en dérivant sous le signe intégral. La deuxième égalité
est alors une conséquence de la commutativité du produit de convolution, que l’on
prouvera en (iv).
(ii) Pour tout entier k ≥ 0 et tout multi-indice α, on a l’estimation
Z
k α
α
k
kxk |∂ (ϕ ∗ ψ)(x)| = kxk
(∂ ϕ)(x − y)ψ(y) dy Rn
Z
kxkk |(∂ α ϕ)(x − y)| |ψ(y)| dy
≤
Rn
Z
C
dy < ∞,
= Kα,k (ϕ)
p+n
Rn 1 + kyk
pour tout entier p > 0.
(iii) Il suffit de vérifier la continuité en ϕ = 0. Or l’estimation ci-dessus est de la forme
avec C ′ =
R
C
Rn 1+kykp+n
kxkk |∂ α (ϕ ∗ ψ)(x)| ≤ C ′ Kα,k (ϕ),
dy, comme souhaité.
(iv) En faisant le changement de variables ye = x − y, on obtient
Z
Z
ϕ(e
y )ψ(x − ye) de
y = ψ ∗ ϕ(x),
ϕ(x − y)ψ(y) dy =
ϕ ∗ ψ(x) =
Rn
Rn
pour tout x ∈
Rn .
D’autre part, en permutant les intégrations, on obtient
Z
(ψ ∗ ϕ)(x − y)χ(y) dy
(ϕ ∗ ψ) ∗ χ(x) =
Rn
Z Z
ψ(x − y − ye)ϕ(e
y )χ(y) de
y dy
=
n Rn
R
Z
(ψ ∗ χ)(x − y)ϕ(y) dy
=
Rn
pour tout x ∈ Rn .
= ϕ ∗ (ψ ∗ χ)(x),
86
(v) En permutant encore les intégrations, on obtient
Z
(ψ ∗ ϕ)(x)χ(x) dx
hϕ ∗ ψ, χi =
n
ZR Z
ψ(x − y)ϕ(y)χ(x) dx dy
=
n
n
ZR R
ϕ(y)(ψe ∗ χ)(y) dy
=
Rn
= hϕ, ψe ∗ χi.
(vi) Par changement de variables et factorisation des intégrales, on obtient
n Z
1
√
F(ϕ ∗ ψ)(y) =
e−iy·x (ϕ ∗ ψ)(x) dx
n
2π
n Z R Z
1
√
=
e−iy·(x−ey) e−iy·ey ϕ(x − ye)ψ(e
y ) dx de
y
n
n
2π
R
R
n Z
Z
1
−iy·u
√
e−iy·ey ψ(e
y ) de
y
e
ϕ(u) du
=
2π
Rn
Rn
n
= (2π) 2 F(ϕ)(y) F(ψ)(y),
n
bψb peut se réécrire, en appliquant
pour tout y ∈ Rn . La relation F(ϕ ∗ ψ) = (2π) 2 ϕ
−1
F membre à membre,
b
b = (2π) n2 F −1 (ϕ
bψ).
F −1 (ϕ)
b ∗ F −1 (ψ)
b
En remplaçant ϕ(x)
b
par ϕ(−x) et ψ(x)
par ψ(−x), on obtient la deuxième relation.
5.4.2
Produit de convolution entre S(Rn ) et S ′ (Rn )
Soient f ∈ S ′ (Rn ) et ψ ∈ S(Rn ). On définit leur produit de convolution f ∗ ψ ∈ S ′ (Rn )
en étendant la propriété (v) de la proposition 5.7 :
hf ∗ ψ, ϕi = hf, ψe ∗ ϕi,
(5.8)
e
pour tout ϕ ∈ S(Rn ), avec ψ(x)
= ψ(−x) pour tout x ∈ Rn .
Les propriétés de ce produit de convolution s’obtiennent aisément par dualité à partir de
celles du produit de convolution dans S(Rn ).
Proposition 5.8.
(i) Pour tout f ∈ S ′ (Rn ), ψ ∈ S(Rn ) et pour tout multi-indice α, on a
∂ α (f ∗ ψ) = (∂ α f ) ∗ ψ = f ∗ (∂ α ψ);
(ii) pour tout ψ ∈ S(Rn ), l’application linéaire S ′ (Rn ) → S ′ (Rn ) : f 7→ f ∗ψ est continue ;
87
(iii) pour tout f ∈ S ′ (Rn ) et ψ, ϕ ∈ S(Rn ), on a
(f ∗ ψ) ∗ ϕ = f ∗ (ψ ∗ ϕ);
(iv) pour tout f ∈ S ′ (Rn ) et ψ ∈ S(Rn ), on a
n
F(f ∗ ψ) = (2π) 2 F(f )F(ψ),
n
F(f ψ) = (2π)− 2 F(f ) ∗ F(ψ).
De plus, ce produit de convolution est plus régulier qu’une distribution tempérée.
Proposition 5.9. Soient f ∈ S ′ (Rn ) et ψ ∈ S(Rn ). La distribution tempérée f ∗ ψ est
une fonction C ∞ à croissance lente, donnée par
e
(f ∗ ψ)(y) = hf, Ty ψi,
pour tout y ∈ Rn .
Démonstration. Soit Jδ l’opérateur de lissage associé à la fonction ρ ∈ D(Rn ) comme dans
la section 4.3. Remarquons tout d’abord que
pour tout f ∈ S ′ (Rn ),
Jδ f (y) = hf, Ty ρδ i,
pour tout ψ ∈ S(Rn ),
Jδ ψ(y) = ψ ∗ ρδ ,
avec δ > 0 et ρδ (x) =
x
1
δn ρ( δ ).
On calcule alors
Jδ (f ∗ ψ)(y) = hf ∗ ψ, Ty ρδ i
= hf, ψe ∗ Ty ρδ i
e
= hf, Ty Jδ ψi
e
= hJδ f, Ty ψi.
e lorsque δ → 0. Cette fonction de y est
Cette dernière expression converge vers hf, Ty ψi
∞
clairement C , et elle est à croissance lente car la fonction Jδ (f ∗ ψ) l’est, par le théorème
5.2.
En particulier, le lissage Jδ f de f ∈ S ′ (Rn ) est un produit de convolution :
Jδ f (y) = hf, Ty ρδ i = (f ∗ ρδ )(y),
pour tout y ∈ Rn .
Exemple. La distribution de Dirac δ ∈ S ′ (Rn ) est le neutre pour ce produit de convolution. En effet, pour tout ψ ∈ S(Rn ), on a
hδ ∗ ψ, ϕi = hδ, ψe ∗ ϕi
= (ψe ∗ ϕ)(0)
Z
ψ(0 − (−x))ϕ(x) dx
=
Rn
= hψ, ϕi,
88
pour tout ϕ ∈ S(Rn ), de sorte que δ ∗ ψ = ψ.
N
Nous sommes maintenant en mesure de démontrer la généralisation du théorème de PaleyWiener.
Démonstration du théorème 5.6. Soit F : Rn → C une fonction prolongeable en une fonction entière sur Cn satisfaisant (5.7). En particulier, F ∈ S ′ (Rn ) car c’est une fonction à
croissance lente. Par conséquent, F est la transformée de Fourier F(f ) d’une distribution
tempérée f ∈ S ′ (Rn ). En utilisant l’opérateur de lissage Jδ comme ci-dessus, on a
n
F(Jδ f ) = F(f ∗ ρδ ) = (2π) 2 F(f )F(ρδ ).
Comme ρδ ∈ D(Rn ), la transformée de Fourier F(ρδ ) satisfait (5.4) avec a = δ. D’autre
part, la fonction F(f ) = F satisfait (5.7) par hypothèse. Par conséquent,
kzkq |F(Jδ f )(z)| ≤ Cq′ (1 + kzkN )e(a+δ)kIm(z)k .
pour tout entier q > 0. On obtient donc une estimation de la forme
kzkr |F(Jδ f )(z)| ≤ Cr′ e(a+δ)kIm(z)k ,
pour tout entier r > 0. Par le théorème de Paley-Wiener 5.4, la fonction Jδ f a donc son
S′
support dans B(0, a + δ). Comme Jδ f → f lorsque δ → 0, on en déduit que le support de
f est contenu dans B(0, a).
5.4.3
Produit de convolution dans S ′ (Rn )
Nous voulons étendre encore le produit de convolution en généralisant (5.8). Pour tout
ψ, ϕ ∈ S(Rn ), on a
Z
ψ(e
y − x)ϕ(e
y ) de
y
(ψe ∗ ϕ)(x) =
n
R
Z
ψ(y)ϕ(x + y) dy
=
Rn
= hψ, ϕ ◦ ux i,
avec ux : Rn → Rn : y 7→ x + y. Par conséquent, si f ∈ S ′ (Rn ),
hf ∗ ψ, ϕi = hf, ψe ∗ ϕi = hf ⊗ ψ, ϕ ◦ ui,
avec u : Rn × Rn → Rn : (x, y) 7→ x + y. L’expression dans le membre de droite peut avoir
un sens si on prend ψ ∈ S ′ (Rn ), mais sous certaines conditions. En effet, la fonction ϕ ◦ u
n’est pas à décroissance rapide dans R2n , car elle est constante sur les n-plans d’équation
x + y = c avec c ∈ Rn . Il existe diverses conditions sur f et ψ permettant de rendre
l’expression hf ⊗ ψ, ϕ ◦ ui bien définie, mais nous nous intéresserons plus particulièrement
au cas où l’une des distributions tempérées f et ψ est à support compact.
89
Soient f, g ∈ S ′ (Rn ). Supposons que f ou g au moins est à support compact. On définit
leur produit de convolution f ∗ g ∈ S ′ (Rn ) par
hf ∗ g, ϕi = hf ⊗ g, ϕ ◦ ui,
pour tout ϕ ∈ S(Rn ), avec u : Rn × Rn → Rn : (x, y) 7→ x + y. Le membre de droite est à
interpréter comme
hf ⊗ g, ϕ ◦ ui = hf ⊗ g, χ(ϕ ◦ u)i,
où χ ∈ D(R2n ) est égale à 1 sur le compact (supp f × supp g) ∩ supp (ϕ ◦ u).
Comme avant, les propriétés de ce produit de convolution s’obtiennent aisément par dualité.
Proposition 5.10. Soient f, g ∈ S ′ (Rn ). Supposons que f ou g au moins est à support
compact.
(i) Pour tout multi-indice α, on a
∂ α (f ∗ g) = (∂ α f ) ∗ g = f ∗ (∂ α g);
(ii) l’application linéaire S ′ (Rn ) → S ′ (Rn ) : f 7→ f ∗ g est continue ;
(iii) pour tout h ∈ S ′ (Rn ) telle que le support de 2 distributions au moins parmi f , g et
h est compact, on a
f ∗ g = g ∗ f,
(f ∗ g) ∗ h = f ∗ (g ∗ h);
(iv)
n
F(f ∗ g) = (2π) 2 F(f )F(g).
Remarquons que le membre de droite dans la propriété (iv) est bien défini, car l’un des
facteurs F(f ) ou F(g) est une fonction C ∞ à croissance lente, par le théorème de PaleyWiener 5.6.
Nous avons vu qu’il faut imposer des conditions sur la décroissance de f et g ∈ S ′ (Rn )
à l’infini pour que leur produit de convolution soit bien défini en tant que distribution
tempérée. Par contre, pour que la multiplication de f et g ∈ S ′ (Rn ) soit bien définie en
tant que distribution tempérée, il faut imposer à f et g des conditions de régularité. Ceci
n’est pas surprenant, au vu de la propriété (iv) ci-dessus, car la transformée de Fourier
échange les propriétés locales avec le comportement à l’infini. Par exemple, en effet, la
dérivation par ∂ α (opérateur local) est échangée avec la multiplication (à un facteur près)
par xα (affectant le comportement à l’infini).
90
5.5
Equations aux dérivées partielles
La transformée de Fourier est un outil formidable pour résoudre des équations aux dérivées
partielles à coefficients constants sur Rn tout entier, car elle transforme ces équations en
équations algébriques. Au vu des sections précédentes, nous pourrons donc résoudre ces
équations aux dérivées partielles dans S(Rn ) ou dans S ′ (Rn ). Nous allons illustrer ces
applications avec des exemples d’équations aux dérivées partielles rencontrées en physique,
dont nous chercherons les solutions dans l’espace S ′ (Rn ) ⊃ S(Rn ).
5.5.1
Problèmes aux limites
Soit f ∈ S ′ (Rn ) et A =
cients constants Cα .
P
|α|≤p Cα ∂
α
un opérateur différentiel linéaire d’ordre p, à coeffi-
On considère l’équation aux dérivées partielles Au = f dans S ′ (Rn ) et on désire trouver
toutes les solutions u de cette équation dans S ′ (Rn ). Souvent, on ne s’intéressera qu’au
cas où f ∈ C ∞ (Rn ), dans l’espoir que les solutions u sont également dans C ∞ (Rn ). Il
s’agit bien d’un problème aux limites, dans la condition u ∈ S ′ (Rn ) impose un certain
comportement pour u à l’infini.
Le fait que l’on considère f ∈ S ′ (Rn ) plutôt que C ∞ (Rn ) permet de définir la notion de
solution élémentaire : il s’agit d’une distribution G ∈ S ′ (Rn ) telle que AG = δ. Si on a
trouvé la solution élémentaire la plus générale, on peut alors résoudre le problème initial
en posant u = G ∗ f , car
A(G ∗ f ) = (AG) ∗ f = δ ∗ f = f.
Exemple. Considérons le problème −∆u + κ2 u = f avec κ ∈ R et κ 6= 0.
Toute solution élémentaire satisfait −∆G+κ2 G = δ. En prenant la transformée de Fourier
membre à membre, on obtient
n
b + κ2 G
b = √1
.
kyk2 G
2π
Par conséquent,
b
G(y)
=
1
√
2π
n
Lorsque n = 1, on en déduit que
G(x) = F
−1
1
.
kyk2 + κ2
1
1
√
2
2π kyk + κ2
=
e−κ|x|
,
2κ
de sorte que la solution du problème est donnée par
Z ∞ −κ|x−x0|
e−κ|x|
e
u=
∗f =
f (x0 ) dx0 .
2κ
2κ
−∞
91
Lorsque n = 3, on en déduit que
G(x) = F
−1
1
√
2π
3
1
kyk2 + κ2
!
=
e−κr
,
4πr
avec r = kxk, de sorte que la solution du problème est donnée par
e−κr
u=
∗f =
4πr
Lorsque κ → 0, on obtient
Z
R3
b=
kyk G
2
e−κk~r−~r0 k
f (~r0 ) d~r0 .
4πk~r − ~r0 k
1
√
2π
n
,
de sorte que la solution élémentaire n’est plus unique. En effet, on montre que toute
b0 = 0 est de la forme
distribution tempérée dans Rn satisfaisant kyk2 G
X
b0 = C0 δ +
G
Cα ∂ α δ.
|α|=1
P
On en déduit que G0 (x) = C0 + ni=1 Ci xi . Il s’agit bien de la solution générale de
l’équation homogène ∆G0 = 0, qui satisfait également aux conditions aux limites puisque
G0 est à croissance lente.
N
5.5.2
Problèmes d’évolution
Soit v ∈ S ′ (Rn ) et A un opérateur différentiel linéaire à coefficients constants.
On considère le problème d’évolution suivant :
d
dt u(t) = Au(t),
u(0) = v.
t ≥ 0,
On cherche toutes les solutions u régulir̀es en t et telles que u(t) ∈ S ′ (Rn ) pour tout t ≥ 0.
Formellement, on demande que u ∈ C ∞ (R+ , S ′ (Rn )).
Exemples.
1. Considérons l’équation de la chaleur avec dissipation :
∂
2
t ≥ 0, x ∈ Rn ,
∂t u(t, x) = ∆u − κ u,
u(0, x) = v(x).
En appliquant la transformée de Fourier à cette équation aux dérivées partielles, on
obtient
d
u
b = −(kyk2 + κ2 )b
u.
dt
Par conséquent,
2
2
2
2
u
b(t) = e−(kyk +κ )t u
b(0) = e−(kyk +κ )t vb.
92
On en déduit
n
n 1
1
1 n −κ2 t − kxk2
−1 −(kyk2 +κ2 )t
√
u(t) = √
F (e
)∗v = √
e
e 4t ∗ v,
2π
2π
2t
ou encore
u(t, x) =
1
√
4πt
n
e−κ
2t
Z
e−
kx−x0 k2
4t
Rn
v(x0 ) dx0 .
2. Considérons l’équation des ondes :
(
Pn
∂
∂
j=1 cj ∂xj u = −c · ∇u,
∂t u(t, x) = −
u(0, x) = v(x).
t ≥ 0, x ∈ Rn ,
En appliquant la transformée de Fourier à cette équation aux dérivées partielles, on
obtient
d
u
b = −ic · yb
u.
dt
Par conséquent,
u
b(t) = e−ic·yt u
b(0) = e−ic·yt vb.
On en déduit
u(t) =
1
√
2π
n
F −1 (e−ic·yt ) ∗ v = Tct δ ∗ v = Tct v,
ou encore u(t, x) = v(x − ct).
3. Considérons l’équation de Schrödinger :
∂
i ∂t u(t, x) = −∆u,
u(0, x) = v(x).
t ≥ 0, x ∈ Rn ,
En appliquant la transformée de Fourier à cette équation aux dérivées partielles, on
obtient
d
i u
b = kyk2 u
b.
dt
Par conséquent,
2
2
u
b(t) = e−ikyk t u
b(0) = e−ikyk t vb.
On en déduit
u(t) =
n
F
u(t, x) =
1
√
2π
ou encore
−1
−ikyk2 t
)∗v =
(e
1
√
4πit
n Z
Rn
ei
1
√
4πit
kx−x0 k2
4t
n
ei
kxk2
4t
∗ v,
v(x0 ) dx0 .
N
93
Exercices sur le Chapitre 5
1. (a) Montrer que ex n’est pas une distribution tempérée, en l’appliquant à la fonction
Ta ϕ ∈ D(R) avec a grand ;
(b) Montrer que ex cos(ex ) est une distribution tempérée, en l’exprimant au moyen
d’une autre distribution tempérée.
2. (a) On dit qu’une distribution f ∈ D ′ (R) est paire (resp. impaire) si hf, ϕi = 0
pour toute fonction test ϕ impaire (resp. paire). Montrer que la transformée
de Fourier d’une distribution tempérée paire (resp. impaire) est paire (resp.
impaire).
(b) Montrer la règle de calcul
∂
F(f ) = F(−ixj f )
∂yj
pour tout f ∈ S ′ (Rn ).
(c) En déduire la transformée de Fourier de vp( x1 ).
3. Résoudre le problème d’évolution suivant :
∂
∂t u(t, x) = ∆u(t, x) − c · ∇u(t, x),
u(0, x) = v(x).
avec (t, x) ∈ R+ × Rn et c ∈ Rn .
94
Chapitre 6
Espaces de Lebesgue
“Analysis takes back with one hand what it gives with the other.
I recoil in fear and loathing from that deplorable evil :
continuous functions with no derivatives.”
Charles Hermite (1822 - 1901)
6.1
6.1.1
Espaces L2
Définition
Soit Ω un ouvert de Rn . Commençons par rappeler la définition de l’espace L2 (Ω, K) =
L2 (Ω) esquissée dans la section 3.2 avant de la préciser.
On munit l’espace vectoriel C0∞ (Ω) d’un produit scalaire défini par
Z
ϕ(x)ψ(x) dx,
hϕ, ψiL2 =
Ω
pour tout ϕ, ψ ∈
C0∞ (Ω).
On obtient ainsi un espace préhilbertien, qui a pour norme
p
kϕkL2 = hϕ, ϕi.
Avec cette norme, on dit qu’une suite (ϕk ) converge vers ϕ au sens L2 , ce que l’on note
L2
ϕk → ϕ, si et seulement si kϕk − ϕkL2 → 0 lorsque k → ∞, c’est-à-dire si et seulement si
ϕk converge en moyenne quadratique vers ϕ.
Définition 6.1. L’espace de Lebesgue L2 (Ω) est la complétion de l’espace préhilbertien
C0∞ (Ω) muni du produit scalaire h·, ·iL2 . La norme k · kL2 étendue à l’espace L2 (Ω) est
appelée norme L2 .
Les éléments rajoutés à C0∞ (Ω) pour obtenir la complétion L2 (Ω) sont plus généraux
que des fonctions localement intégrables (au sens de Riemann). Pour mieux comprendre
l’espace L2 (Ω), nous allons interpréter ces éléments comme des distributions.
95
Soit (ϕk ) une suite de Cauchy dans C0∞ (Ω) pour la norme L2 . Cette suite n’a en général
pas de limite dans C0∞ (Ω). En revanche, pour tout ψ ∈ C0∞ (Ω), la suite hϕk , ψiL2 est une
suite de Cauchy dans K, car
|hϕk , ψiL2 − hϕl , ψiL2 | = |hϕk − ϕl , ψiL2 | ≤ kϕk − ϕl kL2 kψkL2 .
Par conséquent, cette suite est convergente et on peut poser
hf, ψi = lim hϕk , ψiL2 ,
k→∞
ce qui définit clairement une fonctionnelle linéaire f sur C0∞ (Ω). De plus, f est continue
L2
D
au sens D car si ψk → ψ alors ψk → ψ et donc hf, ψk i → hf, ψi, car
|hf, ψk i − hf, ψi| = |hf, ψk − ψi| =
j→∞
lim |hϕj , ψk − ψiL2 |
≤
j→∞
lim kϕj kL2 kψk − ψkL2 = Ckψk − ψkL2 .
Par conséquent, à toute suite de Cauchy (ϕk ) au sens L2 dans C0∞ (Ω) correspond une
distribution f ∈ D ′ (Ω).
Lemme 6.2. Deux suites de Cauchy au sens L2 dans C0∞ (Ω) sont équivalentes (au sens
de la définition 1.8) si et seulement si elles déterminent la même distribution dans D ′ (Ω).
Démonstration. Si (ϕk ) et (ϕ
ek ) sont deux suites de Cauchy équivalentes, alors elles déterminent la même distribution car
lorsque k → ∞.
|hϕk , ψi − hϕ
ek , ψi| ≤ kϕk − ϕ
ek kL2 kψkL2 → 0,
Inversement, si deux suites de Cauchy (ϕk ) et (ϕ
ek ) déterminent la même distribution,
alors la suite des différences χk = ϕk − ϕ
ek est aussi de Cauchy car
ek − ϕ
el kL2 .
ek ) − (ϕl − ϕ
el )kL2 ≤ kϕk − ϕl kL2 + kϕ
kχk − χl kL2 = k(ϕk − ϕ
En particulier, la suite kχk kL2 dans R est convergente.
Par hypothèse, la suite (χk ) détermine la distribution nulle, de sorte que
lim hχk , ψiL2 = 0,
k→∞
pour tout ψ ∈ C0∞ (Ω).
On a alors
lim kχk − ψk2L2
k→∞
=
=
≥
lim hχk , χk iL2 − 2 lim Rehχk , ψiL2 + lim hψ, ψiL2
k→∞
k→∞
lim kχk k2L2
k→∞
+ lim kψk2L2
k→∞
lim kχk k2L2 .
k→∞
96
k→∞
Mais comme C0∞ (Ω) est dense dans L2 (Ω), la limite limk→∞ kχk − ψk2L2 peut être rendue
aussi petite que possible par un choix approprié de ψ ∈ C0∞ (Ω). Par conséquent,
lim kχk kL2 = lim kϕk − ϕ
ek kL2 = 0,
k→∞
k→∞
de sorte que les deux suites de Cauchy (ϕk ) et (ϕ
ek ) sont équivalentes.
Nous obtenons donc une définition équivalente, mais plus explicite, de l’espace L2 (Ω).
Définition 6.3. L’espace L2 (Ω) est l’espace des distributions de D ′ (Ω) qui sont limites
au sens D ′ de suites de Cauchy au sens L2 dans D(Ω). Cet espace est muni du produit
scalaire
hf, giL2 = lim hϕk , ψk i,
(6.1)
k→∞
où (ϕk ) et (ψk ) sont des suites de Cauchy convergeant vers f et g ∈ L2 (Ω) comme cidessus.
Remarquons en effet que, si (ϕk ) et (ψk ) sont des suites de Cauchy au sens L2 dans D(Ω),
alors la suite hϕk , ψk i dans K est convergente, et sa limite ne change pas si on remplace
(ϕk ) et (ψk ) par des suites de Cauchy équivalentes. En particulier, on a
kf kL2 = lim kϕk kL2
k→∞
et
lim kf − ϕk kL2 = 0,
k→∞
pour tout f ∈ L2 (Ω), si (ϕk ) est une suite de Cauchy dans D(Ω) convergeant vers f .
Remarquons qu’un élément f ∈ L2 (Ω) ⊂ D ′ (Ω) est une fonctionnelle linéaire ayant pour
domaine D(Ω). Cependant, ce domaine peut être étendu à L2 (Ω) par (6.1), en posant
hf, gi = hf , giL2 ,
pour tout g ∈ L2 (Ω). De plus, cette fonctionnelle linéaire étendue est continue au sens L2 .
6.1.2
Propriétés
Au vu de la construction de L2 (Ω) par complétion de C0∞ (Ω) muni de la norme k · kL2 et
de la proposition 1.11, nous avons le résultat suivant.
Théorème 6.4. L’espace L2 (Ω), muni du produit scalaire h·, ·iL2 , est un espace de Hilbert.
Parmi les distributions de D ′ (Ω) figurent les fonctions continues. Il est intéressant de savoir
lesquelles d’entre elles sont dans L2 (Ω).
Proposition 6.5. Une fonction continue f : Ω → K est un élément de L2 (Ω) si et
seulement si
Z
|f (x)|2 dx < ∞.
(6.2)
Ω
97
Démonstration. Supposons que f ∈ L2 (Ω). Dans ce cas, il existe une suite de Cauchy (ϕk )
dans C0∞ (Ω) convergeant au sens L2 vers f . En particulier, kf kL2 = limk→∞ kϕk kL2 < ∞.
Inversement, soit f une fonction localement intégrable de module carré sommable. Pour
tout R > 0, on définit un sous-ensemble compact KR ⊂ Ω par
KR = {x ∈ Ω ∩ B(0, R) | B(x, 1/R) ⊂ Ω},
de sorte que KR ⊂ KR′ si R ≤ R′ et ∪R>0 KR = Ω. On définit alors fR : Rn → K par
f (x) si x ∈ KR ,
fR (x) =
0
si x ∈
/ KR .
Pour δ > 0 suffisamment petit, on définit ensuite fR,δ ∈ C0∞ (Ω) par fR,δ = Jδ fR , où Jδ
est un opérateur de lissage comme dans la section 4.3.
Alors
lim
Z
R→∞ Ω
2
|f (x) − fR (x)| dx = lim
Z
R→∞ Ω\KR
au vu de (6.2) et des propriétés de KR .
|f (x)|2 dx = 0,
De plus, comme fR,δ (x) = Jδ fR (x) converge vers fR (x) lorsque δ → 0, pour tout x ∈ Ω,
on a
Z
Z
|fR (x) − fR,δ (x)|2 dx = 0.
|fR (x) − fR,δ (x)|2 dx = lim
lim
δ→0 Ω∩B(0,R+δ)
δ→0 Ω
Par conséquent, en choisissant Rk → ∞ et δk → 0, on obtient une suite de fonctions
ϕk = fRk ,δk ∈ C0∞ (Ω) convergeant au sens L2 vers f . Ceci montre bien que f ∈ L2 (Ω).
En particulier, l’ensemble des fonctions localement intégrables et de module carré sommable est dense dans L2 (Ω), puisque cet ensemble contient C0∞ (Ω). Lorsque Ω = Rn , on
a aussi le résultat suivant.
Proposition 6.6. Les inclusions
D(Rn ) ⊂ S(Rn ) ⊂ L2 (Rn ) ⊂ S ′ (Rn ) ⊂ D ′ (Rn )
sont continues et denses.
Démonstration. Au vu des conclusions de la section 5.1, il ne reste qu’à considérer les 2
inclusions du milieu. L’inclusion S(Rn ) ⊂ L2 (Rn ) est une conséquence de la proposition
6.5, puisque toute fonction à décroissance rapide est de module carré sommable.
Cette inclusion est dense par construction de L2 (Rn ), puisque C0∞ (Rn ) ⊂ S(Rn ). De plus,
cette inclusion est continue, car la convergence S implique la convergence uniforme sur
tout compact, qui implique à son tour la convergence L2 .
A partir de l’inclusion continue S(Rn ) ⊂ L2 (Rn ), on obtient l’inclusion continue entre
les espaces duaux (L2 (Rn ))′ ⊂ S ′ (Rn ), puisque la restriction d’une fonctionnelle linéaire
continue de L2 (Rn ) à S(Rn ) est continue au sens S. Par le théorème de représentation
de Riesz 3.14, on a (L2 (Rn ))′ = L2 (Rn ). Enfin, l’inclusion L2 (Rn ) ⊂ S ′ (Rn ) est dense car
l’inclusion S(Rn ) ⊂ S ′ (Rn ) l’est.
98
Comme L2 (Rn ) ⊂ S ′ (Rn ), on peut définir par restriction la transformée de Fourier sur
L2 (Rn ). Le résultat suivant donne les propriétés de F sur L2 (Rn ).
Théorème 6.7 (Plancherel). Soient f, g ∈ L2 (Rn ).
(i) F(f ) ∈ L2 (Rn ) ;
(ii) hF(f ), F(g)iL2 = hf, giL2 .
Démonstration. Commençons par démontrer (ii) lorsque f, g ∈ S(Rn ). On a en effet
hF(f ), F(g)iL2 = hF(f ), F(g)i = hF(F(f )), gi = hf , gi = hf, giL2 .
La deuxième égalité suit de la relation de Parseval et la troisième égalité est une conséquence du fait que F(f ) = F −1 (f ).
Pour montrer (i), soit (ϕk ) une suite de Cauchy au sens L2 dans C0∞ (Rn ), convergeant
vers f ∈ L2 (Rn ). Alors (c
ϕk ) est une suite de Cauchy au sens L2 dans S(Rn ), qui converge
donc vers un élément h ∈ L2 (Rn ). Il reste à montrer que h = F(f ).
Par la proposition 6.6, (ϕk ) converge vers f dans S ′ (Rn ). Par la continuité de F sur S ′ (Rn ),
ceci implique que (c
ϕk ) converge vers fb dans S ′ (Rn ). Or cette suite converge au sens L2 ,
′
donc au sens S , vers h. Par unicité de la limite dans S ′ (Rn ), on a donc h = F(f ).
Enfin, la propriété (ii) dans tout L2 (Rn ) est une conséquence de la continuité jointe du
produit scalaire.
6.1.3
Autres espaces L2
Espaces L2σ
Soit σ : R → R une fonction croissante et soit ϕ ∈ C0∞ (R). L’intégrale de RiemannStieltjes
Z
ϕ(x) dσ(x)
R
de ϕ par rapport à σ est définie comme la limite des sommes de Riemann
N
X
i=1
ϕ(ξi ) (σ(ai+1 ) − σ(ai ))
lorsque maxi |ai+1 − ai | → 0. Si σ ∈ C 1 (R), on a simplement
Z
Z
ϕ(x)σ ′ (x) dx,
ϕ(x) dσ(x) =
R
R
ce qui revient à intégrer ϕ par rapport à une densité σ ′ . Par contre, si σ est discontinue
au point a ∈ R, alors le singleton {a} aura un poids σ(a+) − σ(a−) > 0.
Lorsque limx→−∞ σ(x) = 0 et limx→∞ σ(x) = 1, on peut interpréter σ comme la fonction
de répartition de la variable aléatoire x. Si de plus σ ∈ C 1 , sa dérivée σ ′ est la densité
99
de probabilité de x. Dans ce cas, l’intégrale de Riemann-Stieltjes d’une fonction ϕ est la
moyenne, ou espérance mathématique, de la variable aléatoire ϕ(x).
Soient ϕ, ψ ∈ C0∞ (R) ; on pose
hϕ, ψiL2σ =
Z
ϕ(x)ψ(x) dσ(x)
R
et
kϕkL2σ =
q
hϕ, ϕiL2σ .
Alors k · kL2σ a les propriétés (ii) et (iii) de la définition 2.4 d’une norme, mais pas la
propriété (i). En effet, kϕkL2σ = 0 dès que σ est constante sur le support de ϕ. On dit alors
que k · kL2σ est une semi-norme.
On dit qu’une suite (ϕk ) dans C0∞ (R) est de Cauchy au sens L2σ si
kϕk − ϕl kL2σ → 0
lorsque k, l → ∞. Dans ce cas, (ϕk ) détermine une distribution f ∈ D ′ (R) définie par
hf, ψi = lim hϕk , ψiL2σ
k→∞
pour tout ψ ∈ C0∞ (R). On définit alors l’espace L2σ (R) comme l’espace des distributions
de D ′ (R) obtenues comme limites au sens D ′ de suites de Cauchy au sens L2σ dans C0∞ (R).
Cet espace vectoriel, muni du produit scalaire
hf, giL2σ = lim hϕk , ψk iL2σ ,
k→∞
et de la norme
kf kL2σ =
q
L2
L2
(ϕk ) →σ f, (ψk ) →σ g,
hf, f iL2σ
est un espace de Hilbert. Remarquons en particulier que k · kL2σ est définie positive sur
L2σ (R), car toute fonction ϕ ∈ C0∞ (R) telle que kϕkL2σ = 0 correspond à la distribution
nulle dans D ′ (R). Ceci signifie par contre qu’il n’y a pas d’inclusion de C0∞ (R) dans L2σ (R).
De plus, si σ est constante sur un intervalle ouvert I alors f = 0 sur I pour tout f ∈ L2σ (R).
Enfin, il est possible de définir de manière semblable l’espace L2σ (Rn ) avec n > 1, lorsque
σ : Rn → R est une fonction croissante de chaque composante xj de x = (x1 , . . . , xn ) ∈ Rn .
Espaces L2 (S)
On voudrait maintenant définir des espaces L2 lorsque le domaine est un sous-ensemble
suffisamment régulier de Rm , tel qu’une sphère, un tore, . . .
On dit qu’un sous-ensemble S de Rm est une sous-variété de dimension n de Rm
si pour tout x ∈ S, il existe un voisinage U de x dans S, un ouvert V de Rn et un
homéomorphisme φ : V ⊂ Rn → U ⊂ S ⊂ Rm de classe C ∞ . Un couple (U, φ) avec U et φ
comme ci-dessus est une carte locale pour S. Cette notion est illustrée par la figure 6.1.
100
R3
R2
U
φ
S
V
Fig. 6.1 – Carte locale pour une sous-variété S de dimension 2 de R3 .
On dit qu’une fonction continue ϕ : S → K est de classe C ∞ si, pour toute carte locale
(U, φ) de S, la composition ϕ ◦ φ : φ−1 (U ) ⊂ Rn → K est C ∞ . On définit alors l’espace
C0∞ (S) comme l’espace des fonctions de classe C ∞ sur S et à support compact. On dit
qu’une suite (ϕk ) dans C0∞ (S) converge vers ϕ ∈ C0∞ (S) au sens D si
(i) il existe un compact K ⊂ S tel que supp ϕk ⊂ K pour tout k ∈ N ;
(ii) pour toute carte locale (U, φ) de S, la suite (ϕk ◦ φ) et ses dérivées convergent
uniformément sur tout compact de φ−1 (U ) vers ϕ ◦ φ et ses dérivées.
On obtient ainsi l’espace D(S) ; son dual topologique est noté D ′ (S).
Soient ϕ, ψ ∈ C0∞ (S) et (U, φ) une carte locale de S telles que supp ϕ, supp ψ ⊂ U . On
pose
Z
ϕ ◦ φ(x) ψ ◦ φ(x)kdφk dx
hϕ, ψiL2 =
φ−1 (U )
Notons que cette expression peut être interprétée comme une intégrale de RiemannStieltjes sur Rn avec σ ∈ C 1 (Rn ) et σ ′ = kdφk.
On étend ensuite ce produit scalaire à tout ϕ, ψ ∈ C0∞ (S) en utilisant une partition de
l’unité comme dans la section 4.5.2. On peut alors définir L2 (S) comme la complétion de
C0∞ (S) pour la norme k · kL2 associée au produit scalaire ci-dessus, comme précédemment.
6.2
6.2.1
Espaces Lp
Définition
Soit Ω un ouvert de Rn . Pour définir les espaces Lp (Ω) avec 1 < p < ∞, comme dans la
section 2.3.1, on munit l’espace vectoriel C0∞ (Ω) de la norme k · kLp définie par
kϕkLp =
Z
p
Ω
|ϕ(x)| dx
1
p
,
pour tout ϕ ∈ C0∞ (Ω). Cette norme possède les propriétés suivantes.
Proposition 6.8. Soient ϕ, ψ ∈ C0∞ (Ω) ; les inégalités suivantes sont satisfaites :
101
(i) (inégalité de Hölder)
Z
ϕ(x)ψ(x) dx ≤ kϕkLp kψkLq ,
Ω
pour tout 1 < p, q < ∞ tels que
1
p
+
1
q
= 1;
(ii) (inégalité de Minkowski)
kϕ + ψkLp ≤ kϕkLp + kψkLp
pour tout 1 < p < ∞.
Démonstration.
(i) La fonction log étant concave
1 p
a +
log
p
sur R+
0 , on a
1 q
1
1
b ≥ log ap + log bq = log ab,
q
p
q
pour tout a, b > 0. En prenant a = ϕ(x) et b = ψ(x), puis en exponentiant et en
intégrant membre à membre, on obtient
Z
1
1
|ϕ(x)ψ(x)| dx ≤ kϕkpLp + kψkqLq .
p
q
Ω
En remplaçant ϕ par λϕ avec λ > 0, on obtient
Z
λp−1
1
|ϕ(x)ψ(x)| dx ≤
kϕkpLp +
kψkqLq .
p
qλ
Ω
q/p
Le membre de droite est minimum lorsque λ = kϕk−1
Lp kψkLq et pour cette valeur de
λ, on obtient l’inégalité de Hölder.
(ii) On a
Z
Z
Z
p−1
p
|ψ(x)| |ϕ(x) + ψ(x)|p−1 dx.
|ϕ(x)| |ϕ(x) + ψ(x)|
dx +
|ϕ(x) + ψ(x)| dx ≤
Ω
Ω
Ω
En appliquant l’inégalité de Hölder aux deux termes du membre de droite, on obtient
p−1
kϕ + ψkpLp ≤ kϕkLp kϕ + ψkp−1
Lp + kψkLp kϕ + ψkLp
soit, après division par kϕ + ψkp−1
Lp , l’inégalité de Minkowski.
Comme l’inégalité de Minkowski n’est autre que l’inégalité triangulaire pour k · kLp , la
proposition ci-dessus montre en fait que k · kLp est une norme.
Soit (ϕk ) une suite de Cauchy au sens Lp dans C0∞ (Ω). Par l’inégalité de Hölder, on a
Z
(ϕk (x) − ϕl (x))ψ(x) dx ≤ kϕk − ϕl kLp kψkLq ,
Ω
102
pour tout ψ ∈ C0∞ (Ω) avec
1
p
+
1
q
= 1. Par conséquent, la suite
Z
ϕk (x)ψ(x) dx
Ω
converge dans K et (ϕk ) converge au sens D ′ vers une distribution f ∈ D ′ (Ω) définie par
Z
ϕk (x)ψ(x) dx,
hf, ψi = lim
k→∞ Ω
pour tout ψ ∈ C0∞ (Ω). On vérifie comme dans le lemme 6.2 que deux suites de Cauchy
au sens Lp dans C0∞ (Ω) sont équivalentes si et seulement si elles déterminent la même
distribution dans D ′ (Ω).
On obtient donc la définition suivante de Lp (Ω), équivalente à celle de la section 2.3.1.
Définition 6.9. L’espace Lp (Ω) est l’espace des distributions de D ′ (Ω) qui sont limites
au sens D ′ de suites de Cauchy au sens Lp dans D(Ω). Cet espace est muni de la norme
kf kLp = lim kϕk kLp ,
k→∞
où (ϕk ) est une suite de Cauchy convergeant vers f ∈ Lp (Ω) comme ci-dessus.
6.2.2
Propriétés
Certaines propriétés de L2 (Ω) s’étendent aux espaces Lp (Ω). Nous les listons ici en ne
donnant les preuves que lorsqu’elles diffèrent du cas L2 .
Théorème 6.10. L’espace Lp (Ω), muni de la norme k · kLp , est un espace de Banach.
Par contre, Lp (Ω) n’est pas un espace Hilbert lorsque p 6= 2. On peut le vérifier aisément
en trouvant un contre-exemple à l’identité du parallélogramme dans Lp (Ω).
Proposition 6.11. Une fonction continue f : Ω → K est un élément de Lp (Ω) si et
seulement si
Z
|f (x)|p dx < ∞.
Ω
La première étape dans la détermination du dual de Lp (Ω) consiste à généraliser l’inégalité
de Hölder.
Proposition 6.12. Soient f ∈ Lp (Ω) et g ∈ Lq (Ω) avec 1 < p, q < ∞ tels que
Alors
|hf, gi| ≤ kf kLp kgkLq ,
1
p
+
1
q
= 1.
avec
hf, gi = lim hϕk , ψk i,
k→∞
où (ϕk ) et (ψk ) sont des suites dans
C0∞ (Ω)
convergeant au sens Lp et Lq vers f et g.
103
Démonstration. Il suffit d’appliquer l’inégalité de Hölder à ϕk , ψk ∈ C0∞ (Ω), puis de
prendre la limite lorsque k → ∞.
En particulier, tout élément f ∈ Lp (Ω) peut être vu comme une fonctionnelle linéaire
continue sur Lq (Ω). Le résultat suivant, qui généralise le théorème de représentation de
Riesz, donne la réciproque. Nous omettrons sa démonstration, qui fait appel aux propriétés
des espaces de Banach uniformément convexes.
Théorème 6.13. Soit F : Lp (Ω) → K une fonctionnelle linéaire continue, avec 1 < p <
∞. Alors il existe un unique g ∈ Lq (Ω) avec 1p + 1q = 1, tel que
hF, f i = hf, gi,
pour tout f ∈ Lp (Ω). De plus,
kF k =
|hF, f i|
= kgkLq .
f ∈Lp (Ω) kf kLp
sup
On en déduit donc le dual de l’espace Lp (Ω).
Corollaire 6.14.
(i) Le dual de Lp (Ω) avec 1 < p < ∞ est Lq (Ω) avec
(ii) Les espaces
Lp (Ω)
1
p
+
1
q
= 1.
avec 1 < p < ∞ sont réflexifs.
Lorsque Ω = Rn , on a également des inclusions analogues au cas L2 , mais qui se démontrent
un peu différemment.
Proposition 6.15. Les inclusions
D(Rn ) ⊂ S(Rn ) ⊂ Lp (Rn ) ⊂ S ′ (Rn ) ⊂ D ′ (Rn )
sont continues et denses.
Démonstration. L’inclusion S(Rn ) ⊂ Lp (Rn ) continue et dense s’obtient comme dans le cas
p = 2. Par les espaces duaux, on obtient l’inclusion continue (Lp (Rn ))′ = Lq (Rn ) ⊂ S ′ (Rn )
avec 1p + 1q = 1. Comme on a la première inclusion pour tout p ∈ R+
0 , on a la seconde pour
+
n
p
n
tout q ∈ R0 . On a donc des inclusions continues S(R ) ⊂ L (R ) ⊂ S ′ (Rn ). La deuxième
inclusion est dense car l’inclusion S(Rn ) ⊂ S ′ (Rn ) l’est.
6.3
6.3.1
Espaces L1 et L∞
Définition
On considère sur l’espace C0∞ (Ω) les normes k · kL1 et k · k∞ définies par
Z
|ϕ(x)| dx
kϕkL1 =
Ω
104
et
kϕk∞ = sup |ϕ(x)|,
x∈Ω
C0∞ (Ω).
La convergence pour la norme k · kL1 est appelée convergence au
pour tout ϕ ∈
sens L1 , tandis que la convergence pour la norme k · k∞ est la convergence uniforme.
L’inégalité de Hölder s’étend à ces valeurs de p et q (notons que
Z
|ϕ(x)ψ(x)| dx ≤ kϕkL1 kψk∞ ,
1
1
+
1
∞
= 1), car
Ω
pour tout ϕ, ψ ∈ C0∞ (Ω).
On construit l’espace L1 (Ω) exactement comme les espaces Lp (Ω) avec 1 < p < ∞, de
sorte que l’on obtient la définition suivante, équivalente à la définition de la section 2.3.1.
Définition 6.16. L’espace L1 (Ω) est l’espace des distributions de D ′ (Ω) qui sont limites
au sens D ′ de suites de Cauchy au sens L1 dans D(Ω). Cet espace est muni de la norme
kf kL1 = lim kϕk kL1 ,
k→∞
où (ϕk ) est une suite de Cauchy convergeant vers f ∈ L1 (Ω) comme ci-dessus.
Par contre, la complétion de C0∞ (Ω) pour la norme k·k∞ est l’espace des fonctions continues
sur Ω et s’annulant sur ∂Ω. On ne peut donc pas définir un espace L∞ (Ω) constitué
d’éléments aussi généraux que les espaces Lp (Ω) avec 1 ≤ p < ∞ par complétion.
On procèdera donc comme dans la section 4.5.1 pour définir l’espace L∞ (Ω).
Définition 6.17. L’espace L∞ (Ω) est l’espace des distributions bornées de D ′ (Ω), muni
de la norme k · kL∞ définie par
kf kL∞ = inf{M ∈ R+ | Re(eiθ f ) ≤ M, pour tout θ ∈ R},
pour tout f ∈ L∞ (Ω).
Remarquons que la norme k · kL∞ de cette définition étend bien la norme supremum k · k∞
sur C0∞ (Ω).
6.3.2
Propriétés
De nouveau, certaines propriétés des espaces Lp (Ω) se généralisent à L1 (Ω) et L∞ (Ω).
Théorème 6.18. Les espaces L1 (Ω) et L∞ (Ω), munis respectivement de la norme k · kL1
et de la norme k · kL∞ , sont des espaces de Banach.
Comme les espaces Lp (Ω) avec p 6= 2, les espaces L1 (Ω) et L∞ (Ω) ne sont pas des espaces
de Hilbert.
105
Proposition 6.19. Une fonction continue f : Ω → K est un élément de L1 (Ω) si et
seulement si
Z
|f (x)| dx < ∞.
D’autre part, f est un élément de
Ω
∞
L (Ω)
si et seulement si |f | est bornée sur Ω.
Pour déterminer le dual de L1 (Ω), étendons l’inégalité de Hölder au cas p = 1 et q = ∞.
Proposition 6.20. Soient f ∈ L1 (Ω) et g ∈ L∞ (Ω). Alors
|hf, gi| ≤ kf kL1 kgkL∞ ,
avec
hf, gi = lim hg, ϕk i,
k→∞
où (ϕk ) est une suite dans C0∞ (Ω) convergeant au sens L1 vers f .
Démonstration. L’inégalité pour f = ϕk ∈ C0∞ (Ω) est équivalente au fait que g est une
distribution bornée. Il suffit donc de prendre la limite lorsque k → ∞.
En particulier, tout élément f ∈ L∞ (Ω) peut être vu comme une fonctionnelle linéaire
continue sur L1 (Ω) et inversément.
Théorème 6.21. Soit F : L1 (Ω) → K une fonctionnelle linéaire continue. Alors il existe
un unique g ∈ L∞ (Ω), tel que
hF, f i = hf, gi,
pour tout f ∈ L1 (Ω). De plus,
kF k =
|hF, f i|
= kgkL∞ .
f ∈L1 (Ω) kf kL1
sup
On en déduit donc le dual de l’espace L1 (Ω).
Corollaire 6.22. Le dual de L1 (Ω) est L∞ (Ω) .
Par contre, on peut montrer que le dual de L∞ (Ω) contient strictement L1 (Ω). En particulier, les espaces L1 (Ω) et L∞ (Ω) ne sont pas réflexifs.
Lorsque Ω = Rn , on a encore des chaines d’inclusions.
Proposition 6.23. Les inclusions
D(Rn ) ⊂ S(Rn ) ⊂ L1 (Rn ) ⊂ S ′ (Rn ) ⊂ D ′ (Rn )
D(Rn ) ⊂ S(Rn ) ⊂ L∞ (Rn ) ⊂ S ′ (Rn ) ⊂ D ′ (Rn )
sont continues et denses, sauf l’inclusion S(Rn ) ⊂ L∞ (Rn ) qui est seulement continue.
106
Démonstration. Les inclusions continues S(Rn ) ⊂ Lp (Rn ) avec p = 1, ∞ s’obtiennent
comme pour les autres valeurs de p. L’inclusion dans L1 (Rn ) est clairement dense par
définition de L1 (Rn ).
En revanche, l’adhérence de S(Rn ) dans L∞ (Rn ) est l’ensemble des fonctions continues
qui tendent vers 0 à l’infini. Par dualité, on obtient l’inclusion continue L∞ (Rn ) ⊂ S ′ (Rn ).
L’inclusion continue L1 (Rn ) ⊂ S ′ (Rn ) s’obtient en étendant le domaine de f ∈ L1 (Rn ) à
S(Rn ) ⊂ L∞ (Rn ). Ces deux inclusions sont denses car l’inclusion S(Rn ) ⊂ S ′ (Rn ) l’est.
Nous terminons avec une propriété de la transformée de Fourier dans les espaces L1 (Rn )
et L∞ (Rn ).
Théorème 6.24 (Riemann-Lebesgue). Si f ∈ L1 (Rn ), alors F(f ) ∈ Cb0 (Rn ) et
n
1
kf kL1 .
kF(f )k∞ ≤ √
2π
Démonstration. Démontrons d’abord l’inégalité de l’énoncé lorsque f = ϕ ∈ S(Rn ). On a
n Z
n Z
n
1
1
1
−iy·x
|ϕ(x)| dx = √
kϕkL1 .
ϕ(x) dx ≤ √
|F(ϕ)(y)| = √
ne
2π
2π
2π
Rn
R
Par conséquent,
kF(ϕ)k∞ = sup |F(ϕ)(y)| ≤
y∈Rn
1
√
2π
n
kϕkL1 .
(6.3)
Soit maintenant f ∈ L1 (Rn ), et soit (ϕk ) une suite dans C0∞ (Rn ) convergeant vers f au
sens L1 . Alors (ϕk ) converge vers f au sens S ′ , de sorte que (F(ϕk )) converge vers F(f )
au sens S ′ .
D’autre part, l’inégalité (6.3) montre que (F(ϕk )) converge uniformément vers une certaine
fonction continue g. Ceci implique que (F(ϕk )) converge vers g au sens S ′ . Par unicité
de la limite dans S ′ (Rn ), on doit avoir g = F(f ). En prenant la limite pour k → ∞
dans (6.3) avec ϕ = ϕk , on obtient l’inégalité recherchée, qui implique en particulier que
F(f ) ∈ Cb0 (Rn ).
6.4
Opérations
Les opérations sur les distributions peuvent s’appliquer en particulier aux espaces de Lebesgue. Dans ce cas, nous allons voir que ces opérations ont de meilleures propriétés que
pour des distributions générales.
6.4.1
Multiplication
Soient f ∈ Lp (Ω) et g ∈ Lq (Ω), et soient (ϕk ) et (ψk ) des suites dans C0∞ (Ω) convergeant
vers f au sens Lp et vers g au sens Lq . Si la suite produit (ϕk ψk ) est de Cauchy dans
Lr (Ω) et converge au sens D ′ dans D ′ (Ω), quel que soit le choix des suites (ϕk ) et (ψk )
107
comme ci-dessus, on note sa limite f g ∈ Lr (Ω). Par construction, cette limite ne dépend
pas du choix des suites (ϕk ) et (ψk ).
La proposition suivante décrit des circonstances dans laquelle la situation ci-dessus se
produit, et donc où l’on peut multiplier f ∈ Lp (Ω) avec g ∈ Lq (Ω) pour obtenir f g ∈ Lr (Ω).
Proposition 6.25. Soient f ∈ Lp (Ω) et g ∈ Lq (Ω) avec 1 ≤ p, q < ∞ et
f g ∈ Lr (Ω) avec 1r = 1p + 1q et
1
p
+ 1q ≤ 1. Alors
kf gkLr ≤ kf kLp kgkLq .
Démonstration. Commençons par montrer l’inégalité ci-dessus lorsque f = ϕ et g = ψ
avec ϕ, ψ ∈ C0∞ (Ω). L’inégalité de Hölder appliquée à |ϕ|r et |ψ|r avec les exposants
conjugués p/r et q/r donne en effet
kϕψkrLr ≤ kϕkrLp kψkrLq .
Dans le cas général f ∈ Lp (Ω) et g ∈ Lq (Ω), soient (ϕk ) et (ψk ) des suites dans C0∞ (Ω)
convergeant vers f et g au sens Lp et Lq respectivement. Alors
kϕk ψk − ϕl ψl kLr
≤ kϕk (ψk − ψl )kLr + k(ϕk − ϕl )ψl kLr
≤ kϕk kLp kψk − ψl kLq + kϕk − ϕl kLp kψl kLq ,
qui tend vers 0 lorsque k, l → ∞. Par conséquent, (ϕk ψk ) est une suite de Cauchy au sens
Lr . Le même argument montre que si (ϕk ) et (ϕ′k ) sont des suites de Cauchy équivalentes
au sens Lp , alors (ϕk ψk ) et (ϕ′k ψk ) sont équivalentes au sens Lr ; il en va de même pour
(ψk ). Par conséquent, la suite (ϕk ψk ) converge vers f g ∈ Lr (Ω), et l’inégalité recherchée
est obtenue en prenant la limite k → ∞ dans
kϕk ψk kLr ≤ kϕk kLp kψk kLq .
En particulier, le produit de deux éléments de L2 (Ω) est un élément de L1 (Ω). On peut
aussi montrer que le produit d’un élément de L∞ (Ω) par un élément de Lp (Ω) est encore
dans Lp (Ω).
6.4.2
Intégration
Proposition 6.26. Soient f ∈ Lp (R) avec 1 ≤ p ≤ ∞ et F =
si on normalise F en posant F (a) = 0, on a
1− p1
kF k∞ = sup |F (x)| ≤ (b − a)
a≤x≤b
108
Rx
kf kLp .
f . Alors F ∈ C 0 (R) et
Démonstration. Soit (ϕk ) une
suite dans C0∞ (R) convergeant vers f au sens Lp . On définit
R
x
p
. Alors, pour tout x ∈ [a, b], en vertu
ψk ∈ C ∞ (R) par ψk (x) = a ϕk (y) dy. Soit q = p−1
de l’inégalité de Hölder, on a
Z x
|ψk (x) − ψl (x)| = (ϕk (y) − ϕl (y)) dy a
1 Z x
Z x
1
q
p
q
p
1 dy
≤
|ϕk (y) − ϕl (y)| dy
a
a
1
q
≤ (b − a) kϕk − ϕl kLp .
Par conséquent, la suite (ψk ) converge uniformément sur [a, b], de sorte que sa limite Fe
est une fonction continue. D’autre part, l’intégration étant une opération continue dans
D ′ (R), la suite (ψk ) converge vers F au sens D ′ . Comme la convergence uniforme implique
la convergence au sens D ′ et par unicité de la limite, F = Fe est bien continue.
Comme ci-dessus, on a l’inégalité
1
|ψk (x)| ≤ (b − a) q kϕk kLp .
En passant à la limite pour k → ∞ et en prenant le supremum pour x ∈ [a, b], on obtient
l’inégalité souhaitée.
6.4.3
Lissage
L’opérateur de lissage Jδ permet de construire des suites explicites dans C0∞ (Rn ) convergeant au sens L2 vers un élément donné dans L2 (Rn ).
Proposition 6.27. Soit f ∈ L2 (Rn ). Alors Jδ f ∈ L2 (Rn ) et kJδ f kL2 ≤ kf kL2 pour tout
L2
δ ≥ 0. De plus, Jδ f → f lorsque δ → 0.
Démonstration. Par le théorème 6.7 et les propriétés de la transformée de Fourier, on a
√
√
kJδ f kL2 = kF(Jδ f )kL2 = ( 2π)n kF(ρδ )F(f )kL2 ≤ ( 2π)n kF(ρδ )k∞ kF(f )kL2 .
Par ailleurs,
n Z
n
1
1
−iy·x
|F(ρδ )(y)| = √
ρδ (x) dx ≤ √
.
ne
2π
2π
R
On en déduit que kJδ f kL2 ≤ kf kL2 comme souhaité.
D’autre part, pour tout ψ ∈ C0∞ (Rn ), on a
kJδ f − f kL2 ≤ kJδ f − Jδ ψkL2 + kJδ ψ − ψkL2 + kψ − f kL2 .
Soit ǫ > 0. On peut choisir ψ ∈ C0∞ (Rn ) de sorte que kψ − f kL2 < ǫ et donc aussi
kJδ f − Jδ ψkL2 < ǫ. Pour δ > 0 suffisamment petit, on a kJδ ψ − ψkL2 < ǫ. Par conséquent,
L2
kJδ f − f kL2 < 3ǫ et ainsi Jδ f → f lorsque δ → 0.
On peut également montrer que si f ∈ Lp (Rn ) avec 1 ≤ p < ∞, alors Jδ f ∈ Lp (Rn ) et
Lp
Jδ f → f lorsque δ → 0.
109
6.5
Note sur la théorie de la mesure
Il existe une autre approche explicite des espaces de Lebesgue, très répandue dans la
littérature, et faisant appel à la théorie de la mesure plutôt qu’à la théorie des distributions.
Nous esquissons cette approche ci-dessous, pour donner une autre perpective sur les espaces
de Lebesgue au lecteur.
L’idée consiste à généraliser l’intégrale de Riemann de manière à pouvoir intégrer des
fonctions bien plus générales. Cette nouvelle intégrale, appelée intégrale de Lebesgue,
est définie en subdivisant l’ensemble d’arrivée plutôt que l’ensemble de départ. Les sommes
de Riemann sont donc remplacées par des expressions de la forme
X
ai µ({x ∈ Rn | ai−1 < f (x) ≤ ai }),
(6.4)
i
dans laquelle µ(A) désigne la mesure (intuitivement, le volume) de l’ensemble A. Contrairement aux sommes de Riemann, les ensembles apparaissant dans (6.4) sont bien plus
généraux que des produits d’intervalles.
Il n’est pas possible d’associer un nombre µ(A) ≥ 0 à tout sous-ensemble de Rn en satisfaisant à des propriétés simples qu’une notion de volume devrait intuitivement posséder. On
doit donc se restreindre à certains sous-ensembles A, appelés mesurables, pour lesquels
µ(A) sera défini. Une fonction f : Rn → R est dite mesurable si les ensembles de la forme
{x ∈ Rn |f (x) ≤ a} sont mesurables, pour tout a ∈ R.
Sur Rn , il existe une unique mesure µ définie au moins sur tous les ouverts, invariante par
translation et normalisée par µ([0, 1]n ) = 1 : c’est la mesure de Lebesgue. L’intégrale
de Lebesgue est définie pour toute fonction mesurable sur Rn et s’obtient en utilisant pour
µ la mesure de Lebesgue dans (6.4), avant de prendre la limite sur des partitions de plus
en plus fines du domaine d’arrivée R.
Soit Ω un ouvert de Rn . De manière analogue à la proposition 6.11, on considère l’ensemble
des fonctions mesurables sur Ω telles que
1
Z
p
p
< ∞,
(6.5)
|f (x)| dx
kf kLp =
Ω
où l’intégrale est à prendre au sens de Lebesgue. Alors k · kLp n’est qu’une semi-norme,
car toute fonction f telle que f (x) = 0 sauf sur un ensemble de mesure nulle (comme par
exemple un ensemble fini ou dénombrable) satisfait kf kLp = 0.
Pour obtenir un espace normé, on définit donc l’espace Lp (Ω) comme l’ensemble des classes
d’équivalences de fonctions mesurables sur Ω satisfaisant (6.5), en définissant que f et g
sont équivalentes si et seulement si f (x) = g(x) sauf sur un ensemble de mesure nulle. On
montre alors que cet espace normé est complet, de sorte qu’il coı̈ncide avec la complétion
de C0∞ (Ω) pour la norme k · kLp .
De cette manière, les éléments de Lp (Ω) sont réalisés par des classes d’équivalences de
fonctions, plutôt que par des distributions, ce qui offre un autre point de vue sur ces
espaces.
110
Exercices sur le Chapitre 6
1. Soit f ∈ Lp (Ω) ∩ Lq (Ω) avec 1 ≤ p ≤ q < ∞. Montrer que f ∈ Lr (Ω) pour tout
r ∈ [p, q] et que
kf kLr ≤ kf kαLp kf k1−α
Lq
avec α ∈ [0, 1] satisfaisant
1
r
=
α
p
+
1−α
q .
2. Montrer par contradiction que la distribution de Dirac δ n’est pas un élément de
Lp (Rn ), pour tout 1 < p < ∞, en utilisant l’inégalité de Hölder.
3. Montrer que le produit de convolution ϕ ∗ ψ ∈ C0∞ (Rn ) pour ϕ, ψ ∈ C0∞ (Rn ) s’étend
0 (Rn ), avec f ∈ Lp (Rn ),
de manière unique en un produit de convolution f ∗ g ∈ C∞
g ∈ Lq (Rn ), 1 < p, q < ∞ et p1 + 1q = 1, satisfaisant
kf ∗ gk∞ ≤ kf kLp kgkLq .
0 (Rn ) désigne l’espace des fonctions continues sur Rn qui tendent vers
La notation C∞
zéro à l’infini.
4. Montrer que le produit de convolution s’étend de manière unique en un produit
de convolution f ∗ g ∈ Lr (Rn ), avec f ∈ Lp (Rn ), g ∈ Lq (Rn ), 1 ≤ p, q < ∞ et
1
1
1
p + q − 1 = r > 0, satisfaisant l’inégalité de Young
kf ∗ gkLr ≤ kf kLp kgkLq ,
via les étapes suivantes :
(a) lorsque p = 1 et 1 ≤ r = q < ∞, montrer que
Z
Rn
|ψ(x − y)||ϕ(y)| dy ≤
Z
Rn
q
|ψ(x − y)| |ϕ(y)| dy
1/q Z
Rn
|ϕ(y)| dy
1−1/q
,
puis conclure dans ce cas.
(b) lorsque 1 < p, q < ∞, vérifier que max(p, q) < r < ∞ et appliquer deux fois
l’inégalité de Hölder à
|ϕ(x − y)||ψ(y)| = |ϕ(x − y)|p/r |ψ(y)|q/r |ϕ(x − y)|1−p/r |ψ(y)|1−q/r
avec des exposants bien choisis.
111
Chapitre 7
Espaces de Sobolev
“In mathematics you don’t understand things.
You just get used to them.”
John von Neumann (1903-1957)
7.1
7.1.1
Espaces H m (Ω)
Définition
Soit Ω un ouvert de Rn .
Définition 7.1. Pour tout entier positif m, l’espace de Sobolev H m (Ω) est défini par
H m (Ω) = {f ∈ L2 (Ω) | ∂ α f ∈ L2 (Ω), pour tout α tel que |α| ≤ m},
et est muni du produit scalaire H m, noté h·, ·im , défini par
X
hf, gim =
h∂ α f, ∂ α giL2
|α|≤m
pour tout f, g ∈ H m (Ω).
En particulier, l’espace H m (Ω) est muni de la norme H m, notée k · km , définie par
p
kf km = hf, f im .
Par conséquent, la convergence de (fk ) vers f ∈ H m (Ω) au sens H m est équivalente à la
convergence de (∂ α fk ) vers ∂ α f au sens L2 pour tout multi-indice α tel que |α| ≤ m.
Par ailleurs, on définit d’autres espaces H0m (Ω) par complétion à partir de C0∞ (Ω) pour la
norme k · km , de manière analogue à la définition des espaces de Lebesgue.
112
Définition 7.2. Pour tout entier positif m, l’espace H0m (Ω) est l’ensemble des distributions de D ′ (Ω) qui sont limites au sens D ′ de suites de Cauchy pour la norme H m dans
C0∞ (Ω). Cet espace est muni du produit scalaire
hf, gim = lim hϕk , ψk im ,
k→∞
où (ϕk ) et (ψk ) sont des suites de Cauchy convergeant vers f et g ∈ H0m (Ω) comme
ci-dessus.
Exemple. Considérons l’espace de Sobolev H m (Ω) avec Ω =] − 1, +1[⊂ R et m = 1.
1. Soit f : ] − 1, +1[ → R la fonction définie par f (x) = 1 si x < 0 et f (x) = −1 si x ≥ 0.
Alors f ′ = δ, de sorte que f ∈
/ H 1 (Ω) puisque δ ∈
/ L2 (Ω).
2. Soit g : ] − 1, +1[ → R la fonction définie par g(x) = 1 + x si x < 0 et g(x) = 1 − x
si x ≥ 0. Alors g′ = f , de sorte que g ∈ H 1 (Ω) puisque f, g ∈ L2 (Ω). En fait, nous
verrons plus loin que g ∈ H01 (Ω), puisque g(−1) = g(1) = 0.
N
7.1.2
Régularité du domaine
Les propriétés des espaces H m (Ω) et H0m (Ω) dépendent fortement de la régularité du
domaine Ω, ou plus précisément de son bord ∂Ω. Nous regroupons ci-dessous différentes
notions de régularités, qui seront utilisées dans les divers résultats de ce chapitre.
Définition 7.3. On dit qu’un ouvert Ω de Rn possède la propriété du segment si pour
tout x ∈ ∂Ω, il existe un voisinage Ux de x dans Rn et un vecteur non nul vx ∈ Rn tels
que
{y + tvx | y ∈ Ω ∩ Ux , 0 < t < 1} ⊂ Ω.
Dans ce cas, Ω ⊂ Rn a un bord ∂Ω de dimension n − 1 et se trouve d’un seul côté de ce
bord.
Pour la définition suivante, nous aurons besoin d’un cône de rayon r > 0, de hauteur
h > 0 et ayant son sommet à l’origine, défini par
q
n h
2
2
C(r, h) = (x1 , . . . , xn ) ∈ R
x1 + . . . + xn−1 ≤ xn ≤ h .
r
Définition 7.4. On dit qu’un ouvert Ω de Rn possède la propriété du cône si il existe
un cône C(r, h) avec r, h > 0 tel que, pour tout x ∈ Ω il existe un cône Cx ⊂ Ω de sommet
x et isométrique à C(r, h).
Pour la définition suivante, nous aurons besoin d’un hypercube Q ∈ Rn et de certaines de
ses parties Q0 et Q+ , définies par
Q = {(x1 , . . . , xn ) ∈ Rn | |xi | ≤ 1, pour 1 ≤ i ≤ n},
Q0 = {(x1 , . . . , xn ) ∈ Q |xn = 0},
Q+ = {(x1 , . . . , xn ) ∈ Q |xn > 0}.
113
Définition 7.5. On dit qu’un ouvert Ω de Rn est à frontière lipschitzienne (resp. de
classe C k , avec k ≥ 0) si pour tout x ∈ ∂Ω, il existe un voisinage Ux de x dans Rn et
k
une bijection hx : Q → Ux tels que hx et h−1
x sont lipschitziennes (resp. de classe C ),
hx (Q0 ) = ∂Ω ∩ Ux
hx (Q+ ) = Ω ∩ Ux .
et
Cette définition est illustrée par la figure 7.1.
Rn
Q+
Q
h
Ux
Q0
Ω
Fig. 7.1 – Paramétrisation de ∂Ω par h : Q → Ux .
Ces différentes conditions de régularité ne sont pas indépendantes. mais sont reliées de la
manière suivante.
frontière de classe C k , k ≥ 1
frontière
lipschitzienne
RR
kk
RRRR
RRRR
RRR
RR $,
kk
kkk
kkk
k
k
kk
qy kk
propriété du cône
frontière deKS classe C 0
propriété du segment
Ceci est illustré par les ouverts bornés de R2 représentés sur la figure 7.2. Le domaine Ωa a
la propriété du cône, mais pas celle du segment. Le domaine Ωb a la propriété du segment,
mais pas celle du cône. Le domaine Ωc n’a aucune de ces deux propriétés. Le domaine Ωd
est à frontière lipschitzienne.
7.1.3
Propriétés
Théorème 7.6. L’espace H m (Ω), muni du produit scalaire h·, ·im , est un espace de Hilbert.
Démonstration. Soit (fk ) une suite de Cauchy dans H m (Ω). Comme
k∂ α fk − ∂ α fl kL2 ≤ kfk − fl km
114
Ωa
Ωb
Ωc
Ωd
Fig. 7.2 – Domaines avec diverses propriétés de régularité.
pour tout multi-indice α avec |α| ≤ m, les suites (∂ α fk ) sont de Cauchy dans L2 (Ω). Soient
donc fα ∈ L2 (Ω) leurs limites respectives. Lorsque |α| = 0, on écrira simplement fα = f .
Pour tout ϕ ∈ D(Ω), comme la convergence L2 implique la convergence D ′ , on a :
hfα , ϕi = lim h∂ α fk , ϕi = (−1)|α| lim hfk , ∂ α ϕi = (−1)|α| hf, ∂ α ϕi = h∂ α f, ϕi.
k→∞
k→∞
Par conséquent, fα = ∂ α f ∈ L2 (Ω) pour tout multi-indice α avec |α| ≤ m. Ainsi, la suite
(fk ) converge au sens H m vers f ∈ H m .
Corollaire 7.7. L’espace H0m (Ω) est un sous-espace fermé de H m (Ω).
Démonstration. L’espace H m (Ω) est complet et contient l’espace C0∞ (Ω), donc il contient
sa complétion H0m (Ω). Ce dernier étant complet par définition, il est fermé dans H m (Ω).
Contrairement aux espaces de Lebesgue, nous n’avons pas défini les espaces de Sobolev
H m (Ω) par complétion. Les deux résultats suivants montrent néanmoins que certains
espaces de fonctions très régulières sont denses dans H m (Ω).
Théorème 7.8 (Meyers-Serrin). L’espace
C ∞ (Ω) ∩ H m (Ω) = {ϕ ∈ C ∞ (Ω) | kϕkm < ∞}
est dense dans H m (Ω).
Théorème 7.9. Si Ω possède la propriété du segment, alors l’ensemble des restrictions à
Ω des fonctions de C0∞ (Rn ) est dense dans H m (Ω).
Le résultat suivant est un critère de compacité dans H m−1 (Ω), qui permet de démontrer
des théorèmes d’existence.
115
Théorème 7.10 (Rellich). Si Ω est borné, alors de toute suite bornée dans H0m (Ω) on
peut extraire une sous-suite convergente dans H m−1 (Ω).
Si Ω possède la propriété du cône, il en va de même pour les suites bornées dans H m (Ω).
Le résultat suivant permet d’interpréter H m (Ω) comme un sous-espace de H m (Rn ).
Théorème 7.11 (Calderón). Si Ω est borné et à frontière lipshiptzienne, il existe un
opérateur de prolongement P : H m (Ω) → H m (Rn ) linéaire et borné, tel que P f |Ω = f .
Le résultat suivant montre que l’on peut restreindre un élément de H m (Ω) pour obtenir
une distribution le long de ∂Ω.
Théorème 7.12 (Théorème de trace). Si Ω est borné et à frontière lipschitzienne,
alors pour tout multi-indice α avec |α| ≤ m − 1, il existe une unique application linéaire
bornée
γα : H m (Ω) → L2 (∂Ω)
telle que pour tout x ∈ ∂Ω et f ∈ C ∞ (Ω),
(γα (f )) (x) = ∂ α f (x).
Lorsque |α| = 0, on écrira simplement γα = γ. Pour f ∈ H m (Ω), la distribution γ(f ) ∈
L2 (∂Ω) est appelée trace de f sur ∂Ω.
Démonstration. Pour éviter les complications techniques, nous donnons la démonstration
dans le cas où Ω est à frontière de classe C 1 .
Remarquons que l’on doit avoir γα = γ ◦ ∂ α , avec l’application linéaire bornée ∂ α :
H m (Ω) → H m−|α| (Ω) : f 7→ ∂ α f . Par conséquent, il suffit de démontrer le cas m = 1.
Pour p ∈ ∂Ω, soient Up le voisinage de p dans Rn et hp : Q → Up la bijection de classe C 1
comme dans la définition 7.5. Notons x = (x′ , xn ) ∈ Q avec x′ = (x1 , . . . , xn−1 ) ∈ Rn−1 .
Soit ϕ ∈ C ∞ (Ω) ; posons u = ϕ ◦ hp ∈ C ∞ (Q+ ). Pour tout τ ∈]0, 1[, on a
Z τ
∂u ′
′
u(x , 0) = −
(x , xn )dxn + u(x′ , τ ).
0 ∂xn
Par conséquent,
′
2
|u(x , 0)|
Z τ
2
∂u ′
≤ 2
(x , xn )dxn + 2|u(x′ , τ )|2
0 ∂xn
2
Z τ
Z τ
∂u ′
′
2
2
≤ 2
1 dxn
∂xn (x , xn ) dxn + 2|u(x , τ )|
0
0
2
Z 1
∂u ′
′
2
= 2
∂xn (x , xn ) dxn + 2|u(x , τ )| .
0
En multipliant membre à membre par l’élément de surface dS = kd(hp |Q0 )k dx′ pour
116
S = hp (Q0 ) ⊂ ∂Ω et en intégrant sur Q0 , on obtient
Z
Z
2
|u(x′ , 0)|2 kd(hp |Q0 )k dx′
|ϕ| dS =
S
Q0
≤ C
= C
Z
Z
Q0
Q+
Z
0
2
Z
∂u (x′ , xn ) dxn dx′ +
∂xn
1
2
Z
∂u
∂xn (x) dx +
Q0
Q0
|u(x′ , τ )|2 dx′
|u(x′ , τ )|2 dx′
!
!
.
En intégrant membre à membre par rapport à τ ∈]0, 1[, puis en introduisant l’élément de
volume dV = kdhp k dx pour V = hp (Q+ ), il vient alors
!
2
Z Z
Z 1Z
∂u
(x) dx +
|ϕ|2 dS ≤ C
|u(x′ , τ )|2 dx′ dτ
Q+ ∂xn
S
0
Q0
!
2
Z
Z
∂h
p
|u(x)|2 dx
(x) dx +
= C
|∇ϕ|2 ∂xn Q+
Q+
Z
Z
2
′
2
|ϕ| dV
≤ C
|∇ϕ| dV +
V
V
≤ C ′ kϕk21 .
En sommant membre à membre de telles inégalités pour un nombre fini d’ouverts Upi
recouvrant le compact ∂Ω, on obtient finalement
kϕ|∂Ω kL2 ≤ C ′′ kϕk1 .
En d’autres termes, l’application linéaire de restriction à ∂Ω de C ∞ (Ω) muni de la norme
H 1 vers C ∞ (∂Ω) ⊂ L2 (∂Ω) muni de la norme L2 est uniformément continue. Par conséquent, elle admet une unique extension linéaire continue γ : H 1 (Ω) → L2 (∂Ω) comme
souhaité.
Signalons toutefois que l’opérateur de trace γ n’est pas surjectif : on a une inclusion stricte
γ(H 1 (Ω)) ⊂ L2 (∂Ω).
Corollaire 7.13. Si Ω est borné et à frontière lipschitzienne, H01 (Ω) est le noyau de
l’application de trace γ : H 1 (Ω) → L2 (∂Ω).
La trace n’est définie que pour des ouverts Ω suffisamment réguliers. En revanche, on peut
définir la notion de trace nulle sur ∂Ω pour tout ouvert Ω, en disant que f ∈ H 1 (Ω) est
de trace nulle sur ∂Ω si et seulement si f ∈ H01 (Ω).
Le résultat suivant montre que, lorsque m est suffisamment grand, les distributions de
H m (Rn ) ont de suffisamment bonnes propriétés que pour être induites par des fonctions
continues et bornées via (4.2).
Théorème 7.14 (Plongement de Sobolev). Si m > n2 , alors on a une injection continue
H m (Rn ) ⊂ Cb0 (Rn ).
117
Démonstration. Si f ∈ H m (Rn ), alors y α F(f ) et donc aussi |y|α F(f ) ∈ L2 (Rn ) pour tout
multi-indice α tel que |α| ≤ m. En particulier,
n
X
m F(f ) ∈ L2 (Rn ).
|yj |
1+
j=1
Puisque kyk =
qP
n
2
j=1 |yj |
≤
Pn
j=1 |yj |,
ceci implique aussi
(1 + kykm )F(f ) ∈ L2 (Rn ).
1
Posons F(g) = (1 + kykm )F(f ) et χ(y) = 1+kyk
m , de sorte que F(f ) = χF(g) avec F(g)
2
n
et χ ∈ L (R ). En effet,
2
Z 1
dy < ∞,
1 + kykm
Rn
puisque 2m > n. Ceci implique que F(f ) = χF(g) ∈ L1 (Rn ). Par le théorème de RiemannLebesgue, F(F(f )) ∈ Cb0 (Rn ). Comme F(F(f ))(x) = f (−x), on a aussi f ∈ Cb0 (Rn )
comme souhaité.
La continuité de l’injection est une conséquence des inégalités
1
kf k∞ = kF(F(f ))k∞ ≤ ( √ )n kF(f )kL1
2π
1 n
≤ ( √ ) kχkL2 kF(g)kL2
2π
1 n
≤ ( √ ) kχkL2 Ckf km .
2π
Bien entendu, lorsque m augmente encore , les éléments de H m (Rn ) deviennent d’autant
plus réguliers.
Corollaire 7.15. Si m >
n
2
et j ≥ 0, alors on a une injection continue
H m+j (Rn ) ⊂ Cbj (Rn ).
Démonstration. Appliquons le théorème du plongement de Sobolev à f ∈ H m+j (Rn ) et à
ses dérivées ∂ α f pour tout multi-indice α tel que |α| ≤ j. On obtient
k∂ α f k∞ ≤ Ck∂ α f km+j−|α| .
Or, la norme de l’espace de Banach Cbj (Rn ) est définie par
kf kj,∞ = sup sup |∂ α f (x)|.
|α|≤j x∈Rn
D’autre part, k∂ α f km+j−|α| ≤ kf km+j . Par conséquent, on a bien
kf kj,∞ ≤ Ckf km+j
comme désiré.
118
Ce type de résultat est également valable lorsque le domaine est un ouvert Ω suffisamment
régulier, en vertu du théorème de Calderón.
Corollaire 7.16. Si m > n2 , j ≥ 0 et Ω ⊂ Rn est un ouvert borné à frontière lipschitzienne,
alors on a une injection continue
H m+j (Ω) ⊂ Cbj (Ω).
7.2
Dualité et espaces H −m
Etudions les propriétés du dual topologique (H0m (Ω))′ de H0m (Ω).
Proposition 7.17. On a une injection continue
(H0m (Ω))′ ⊂ D ′ (Ω),
même si (H0m (Ω))′ est muni de la topologie faible.
Démonstration. Comme d’habitude, l’injection continue D(Ω) ⊂ H0m (Ω) induit l’injection
continue souhaitée, lorsque (H0m (Ω))′ est muni de la topologie forte.
Dans ce cas, la topologie faible sur (H0m (Ω))′ suffit, car la topologie dont nous avons muni
D ′ (Ω) est aussi une topologie faible.
L’espace (H0m (Ω))′ a une description explicite en termes de distributions de L2 (Ω).
Proposition 7.18. L’espace (H0m (Ω))′ est l’espace vectoriel engendré par les distributions
g ∈ D ′ (Ω) de la forme g = ∂ α f avec f ∈ L2 (Ω) et |α| ≤ m.
Démonstration. Toute distribution g ∈ D ′ (Ω)de la forme g = ∂ α f avec f ∈ L2 (Ω) et
|α| ≤ m est un élément de (H0m (Ω))′ . En effet, pour tout ϕ ∈ C0∞ (Ω), on a
|h∂ α f, ϕi| = |hf, ∂ α ϕi| ≤ kf kL2 k∂ α ϕkL2 ≤ kf kL2 kϕkm .
Par conséquent, g = ∂ α f s’étend de manière unique en une fonctionnelle linéaire continue
sur la complétion H0m (Ω) de C0∞ (Ω) pour la norme H m .
Inversement, tout élément de (H0m (Ω))′ est une combinaison linéaire de distributions de
la forme ∂ α f avec f ∈ L2 (Ω) et |α| ≤ m. En effet, soit g ∈ (H0m (Ω))′ . Par le théorème de
représentation de Riesz, il existe h ∈ H0m (Ω) tel que
hg, ϕi = hh, ϕim
pour tout ϕ ∈ C0∞ (Ω). On a donc
X
X
X
(−1)|α| h∂ α (∂ α h), ϕi
hg, ϕi =
h∂ α h, ∂ α ϕiL2 =
h∂ α h, ∂ α ϕi =
|α|≤m
|α|≤m
|α|≤m
avec ∂ α h ∈ L2 (Ω), ce qui est de la forme souhaitée.
119
Ce résultat justifie la notation usuelle
(H0m (Ω))′ = H −m (Ω).
L’étude du dual topologique (H m (Ω))′ de H m (Ω) est plus compliquée. Si f ∈ (H m (Ω))′ ,
alors f se restreint en une fonctionnelle linéaire continue sur H0m (Ω) ⊂ H m (Ω).
En revanche, deux éléments distincts f, g ∈ (H m (Ω))′ peuvent avoir la même restriction
f0 = g0 dans (H0m (Ω))′ , si ils ne diffèrent que sur l’orthogonal H0m (Ω)⊥ de H0m (Ω) dans
H m (Ω).
Inversement, on a le résultat suivant.
Proposition 7.19. Toute distribution dans H −m (Ω) admet une extension, en général non
unique, à l’espace H m (Ω).
Le caractère non unique de cette extension n’est pas surprenant, au vu du théorème de
trace.
Les espaces de Sobolev H m (Ω) avec m ∈ Z forment une chaı̂ne doublement infinie d’espaces
fonctionnels emboités. On peut y penser comme à une échelle de régularité plus générale
que celle correspondant aux fonctions de classe C m , m ≥ 0 :
C0∞ (Ω) ⊂ . . . ⊂ H 2 (Ω) ⊂ H 1 (Ω) ⊂ L2 (Ω) ⊂ H −1 (Ω) ⊂ H −2 (Ω) ⊂ . . .
7.3
7.3.1
Autres espaces de Sobolev
Espaces W m,p
On peut généraliser la définition des espaces de Sobolev H m (Ω), basée sur L2 (Ω), en
travaillant plutôt avec les espaces Lp (Ω), pour 1 ≤ p ≤ ∞.
Définition 7.20. Pour tout un entier positif m et 1 ≤ p ≤ ∞, l’espace de Sobolev
W m,p (Ω) est défini par
W m,p (Ω) = {f ∈ Lp (Ω) | ∂ α f ∈ Lp (Ω), pour tout α tel que |α| ≤ m},
et est muni de la norme W m,p , notée k · km,p , définie par
 1
 P
p
α f kp
si p < ∞,
k∂
|α|≤m
Lp
kf km,p =
 max
α
si p = ∞.
|α|≤m k∂ f kL∞
Les espaces W m,p (Ω) sont des espaces de Banach. On définit ensuite l’espace W0m,p (Ω)
comme l’adhérence de C0∞ (Ω) dans W m,p (Ω).
Enfin, on définit les espaces W −m,q (Ω) avec
W −m,q (Ω) =
1
p
1
q = 1 en
m,p
(W0 (Ω))′ .
+
posant
Lorsque p = 2, les espaces W m,2 (Ω), W0m,2 (Ω) et W −m,2 (Ω) sont des espaces de Hilbert,
qui sont couramment notés H m (Ω), H0m (Ω) et H −m (Ω).
120
7.3.2
Espaces H s
La définition des espaces de Sobolev H m (Rn ) peut être reformulée au moyen de la transformée de Fourier, comme dans la preuve du théorème de plongement de Sobolev. En effet,
en vertu du théorème de Plancherel, la norme H m peut se réécrire
sX
k|y α |fbk2L2 .
kf km =
|α|≤m
Cette norme est équivalente à la norme
m
kf k∗m = k(1 + kyk2 ) 2 fbkL2 ,
qui est induite par le produit scalaire
m
m
giL2 .
hf, gi∗m = h(1 + kyk2 ) 2 fb, (1 + kyk2 ) 2 b
Dans ces dernières expressions, il n’y a aucune raison de se limiter à des valeurs entières
de m. On peut donc définir des espaces de Sobolev d’ordre fractionnaire.
Définition 7.21. Pour tout s ∈ R+ , l’espace de Sobolev H s (Rn ) est défini par
s
H s (Rn ) = {f ∈ L2 (Rn ) | (1 + kyk2 ) 2 fb ∈ L2 (Rn )},
et est muni du produit scalaire H s , noté h·, ·is , défini par
pour tout f, g ∈ H s (Rn ).
s
s
hf, gis = h(1 + kyk2 ) 2 fb, (1 + kyk2 ) 2 gbiL2
Les espaces H s (Rn ) sont encore des espaces de Hilbert.
Exercices sur le Chapitre 7
1. Soit Ω =] − 1, 1[⊂ R.
(a) Montrer que la distribution de Dirac δ ∈ H −1 (Ω).
Par le théorème de représentation de Riesz, il existe un unique f ∈ H01 (Ω) tel que
hδ, ui = hf, ui1 pour tout u ∈ H01 (Ω).
′′
(b) Montrer que f − f = δ dans D ′ (Ω) et en déduire f .
121
Chapitre 8
Problèmes aux limites
“God does not care about our mathematical difficulties.
He integrates empirically. ”
Albert Einstein (1879 - 1955)
8.1
Formulation variationnelle
Nous allons reformuler des problèmes aux limites sous la forme de problèmes de minimisation d’une fonctionnelle, c’est-à-dire sous une forme variationnelle. Cette formulation, dite
faible, joue un rôle clé dans la résolution de ces problèmes aux limites, tant d’un point de
vue théorique que dans les calculs numériques.
8.1.1
Fonctionnelle de Ritz
Soit A : D(A) ⊂ H → H un opérateur linéaire (au sens de la définition 2.16) dans un
espace de Hilbert H. On considère l’équation
Au = f
(8.1)
avec f ∈ H donné, à résoudre dans H. Nous allons nous restreindre à des opérateurs A
jouissant de propriétés particulières.
Définition 8.1. On dit que l’opérateur linéaire A est symétrique si D(A) est dense dans
H et
hAu, vi = hu, Avi
pour tout u, v ∈ D(A).
En particulier, si A est symétrique, alors hAu, ui ∈ R pour tout u ∈ H.
122
Définition 8.2. On dit qu’un opérateur linéaire symétrique A est coercif si il existe
ρ > 0 tel que
hAu, ui ≥ ρkuk2
pour tout u ∈ D(A).
Lorsque A est symétrique et coercif, on associe au problème (8.1) une fonctionnelle (non
linéaire) F : D(A) ⊂ H → R appelée fonctionnelle de Ritz et définie par
1
F (v) = hv, Avi − Rehf, vi
2
pout tout v ∈ D(A).
Théorème 8.3. Soit H un espace de Hilbert et A un opérateur linéaire symétrique et
coercif dans H. Alors l’équation (8.1) a au plus une solution dans D(A). De plus, les
propriétés suivantes sont équivalentes :
(i) u ∈ D(A) est l’unique solution de Au = f ;
(ii) u minimise la fonctionnelle de Ritz F associée sur D(A) ;
(iii) hAu, vi = hf, vi pour tout v ∈ D(A).
Démonstration. Supposons que u et v ∈ D(A) sont des solutions de (8.1). Alors A(u−v) =
0 et hA(u − v), u − vi = 0. Comme A est coercif, ceci implique que ku − vk = 0, c’est-à-dire
que u = v. Il existe donc bien au plus une solution.
Pour tout u, v ∈ D(A), on a
1
F (u + v) = F (u) + RehAu − f, vi + hv, Avi.
2
(8.2)
En particulier, si u est solution de (8.1), alors
1
ρ
F (u + v) = F (u) + hv, Avi ≥ F (u) + kvk2 .
2
2
Par conséquent, u minimise F sur D(A).
Inversement, u ne peut minimiser F que si le deuxième terme du membre de droite de
(8.2) est nul. On a donc RehAu − f, vi = 0 pour tout v ∈ D(A). Lorsque K = C, en
remplaçant v par iv on a aussi ImhAu − f, vi = 0 pour tout v ∈ D(A). Par conséquent,
Au−f ∈ D(A)⊥ = {0}, puisque D(A) est dense dans H. En d’autres termes, u est solution
de (8.1).
L’équivalence de (i) ou (ii) avec (iii) est maintenant immédiate.
La formulation variationnelle du problème aux limites (8.1) consiste à minimiser la
fonctionnelle de Ritz F sur D(A). Cependant, l’existence d’une solution n’est pas garantie.
Ceci n’est pas surprenant, car il se pourrait que f ∈ H dans (8.1) ne soit pas un élément
de im A ⊂ H.
123
Pour éviter cette difficulté, nous allons étendre la fonctionnelle de Ritz F sur un espace
plus grand que l’espace D(A) de manière à pouvoir y garantir l’existence d’un minimum.
Comme A est symétrique et coercif, la forme sesquilinéaire
a(u, v) = hAu, vi
définit un produit scalaire sur D(A). Soit Va la complétion de l’espace D(A) pour ce
produit scalaire. Par construction, Va est un espace de Hilbert, est muni d’un produit
scalaire h·, ·ia et de la norme induite k · ka . De plus, la coercivité de A implique qu’une
suite de Cauchy pour k · ka est une suite de Cauchy pour k · k, de sorte que Va ⊂ H.
Comme la fonctionnelle de Ritz F est uniformément continue sur l’espace D(A) muni de
la norme k · ka , elle s’étend de manière unique en une fonctionnelle continue F : Va → R.
Cette extension permet de garantir l’existence d’un minimum.
Théorème 8.4. Sous les hypothèses du théorème 8.3,
(i) F : Va → R est donnée par
1
F (v) = a(v, v) − Rehf, vi
2
pour tout v ∈ Va ⊂ H;
(ii) F : Va → R possède un et un seul minimum ;
(iii) u ∈ Va minimise F si et seulement si
a(u, v) = hf, vi
pour tout v ∈ Va .
Démonstration. La fonctionnelle de Ritz F : D(A) → R s’écrit
1
1
F (v) = hAv, vi − Rehf, vi = a(v, v) − Rehf, vi,
2
2
pour tout v ∈ D(A). Le premier terme de la dernière expression s’étend bien à Va , puisqu’il
s’agit de 12 kvk2a . Le deuxième terme est défini sur tout H, et est uniformément continu
pour la norme k · ka car
1
|Rehf, vi| ≤ |hf, vi| ≤ kf k kvk ≤ √ kf k kvka
ρ
pour tout v ∈ D(A).
L’équation hu, via = hf, vi possède une unique solution u ∈ Va en conséquence du théorème
de représentation de Riesz appliqué à l’espace de Hilbert Va , puisque le membre de droite
y définit une fonctionnelle linéaire continue.
En injectant cette unique solution u ∈ Va dans l’expression de F (v), on obtient
1
1
1
F (v) = kvk2a − Rehu, via =
kvk2a − hu, via − hv, uia =
ku − vk2a − kuk2a .
2
2
2
L’élément u ∈ Va est donc l’unique minimum de F .
124
Remarquons que, dans ce dernier résultat, on peut généraliser la condition f ∈ H en la
remplaçant par la condition plus faible f ∈ Va′ . En effet, la démonstration ci-dessus utilise
seulement le fait que Rehf, vi est une fonctionnelle linéaire continue sur Va .
De plus, la norme de l’unique solution u ∈ Va du problème variationnel est donnée par
kuka = kf k∗a , où k · k∗a désigne la norme dans l’espace dual Va′ . Par conséquent, la solution
u ∈ Va dépend continument de la donnée du problème f ∈ Va′ .
De manière générale, on dit qu’un problème est bien posé si il a une et une seule solution,
qui dépend des données du problèmes de manière continue. On voit donc que la formulation
variationnelle du problème aux limites (8.1), étendue à Va , permet d’obtenir un problème
bien posé.
Cette formulation possède également une interprétation physique dans le cas de nombreux
problèmes. Par exemple, supposons que (8.1) est l’équation permettant de déterminer
la déformation u d’un corps élastique soumis à une force extérieure f . Dans ce cas, la
forme quadratique 12 a(u, u) est l’énergie interne de déformation du corps élastique, tandis
que hf, ui est l’énergie potentielle de la force extérieure. Ainsi, la fonctionnelle de Ritz
représente l’énergie totale du système, et le corps élastique se déformera de manière à minimiser cette énergie totale. La condition a(u, v) = hf, vi est alors équivalente au principe
des travaux virtuels : à l’équilibre un déplacement virtuel produit un travail virtuel nul.
Pour cette raison, le produit scalaire h·, ·ia et la norme k · ka sont quelquefois appelés
produit scalaire énergie et norme énergie.
8.1.2
Problème de Poisson
Considérons le problème aux limites suivant, appelé problème de Poisson :
−∆u = f
dans Ω,
u = 0
sur ∂Ω,
avec f ∈ L2 (Ω) et où Ω est un ouvert borné de Rn .
Nous pouvons reformuler ce problème sous forme variationnelle en prenant H = L2 (Ω) et
A : D(A) = C0∞ (Ω) ⊂ H → H : u 7→ Au = −∆u.
L’opérateur linéaire A est symétrique car
−hu, ∆viL2 = h∇u, ∇viL2 = −h∆u, viL2
pour tout u, v ∈ C0∞ (Ω). Le résultat suivant permet de vérifier que A est coercif.
Théorème 8.5 (Première inégalité de Friedrichs). Soit Ω un ouvert borné de Rn .
Alors il existe une constante C > 0 telle que
kϕk2L2 ≤ Ck∇ϕk2L2
pour tout ϕ ∈ C0∞ (Ω).
125
Démonstration. Soit U =] − a, a[n un hypercube contenant Ω. On peut considérer ϕ ∈
C0∞ (Ω) comme un élément de C0∞ (U ) en l’étendant par 0 hors de Ω. On a
Z x1
∂
ϕ(t, x2 , . . . , xn ) dt.
ϕ(x1 , . . . , xn ) =
−a ∂t
Par l’inégalité de Schwarz, on obtient
Z
2
|ϕ(x1 , . . . , xn )| ≤
Z
x1
1 dt
−a
Z
a
x1
−a
|
∂
ϕ(t, x2 , . . . , xn )|2 dt
∂t
∂
| ϕ(t, x2 , . . . , xn )|2 dt.
≤ 2a
−a ∂t
En intégrant membre à membre sur U , il vient
Z
Z
∂
2
2
|ϕ(x)| dx ≤ 4a
|
ϕ(x)|2 dx
U
U ∂x1
et donc aussi
Z
2
U
2
|ϕ(x)| dx ≤ 4a
Z
U
|∇ϕ(x)|2 dx.
Cette inégalité s’étend, par densité, à tout H01 (Ω). En effet, soit (ϕk ) une suite dans C0∞ (Ω)
L2
L2
convergeant en norme H 1 vers u ∈ H01 (Ω). Alors ϕk → u et ∇ϕk → ∇u, de sorte qu’en
appliquant la première inégalité de Friedrichs et en prenant la limite pour k → ∞, on
obtient kuk2L2 ≤ Ck∇uk2L2 .
Par conséquent, l’opérateur linéaire symétrique A est coercif. En effet, pour tout u ∈ D(A),
on a
1
−hu, ∆uiL2 = h∇u, ∇uiL2 ≥ kuk2L2 .
C
p
De plus, la norme correspondante a(u, u) = k∇ukL2 est équivalente à la norme H 1 sur
D(A). En effet, pour tout u ∈ D(A), on a
k∇ukL2 ≤ kuk1 ≤ (1 + C)k∇ukL2 .
Ainsi, la complétion Va de D(A) = C0∞ (Ω) pour cette norme coincide avec la complétion
de cet espace pour la norme H 1 , c’est-à-dire H01 (Ω). Enfin, le produit scalaire énergie h·, ·ia
et la norme énergie k · ka sur Va = H01 (Ω) sont donnés par
hu, via = h∇u, ∇viL2
et
kuka = k∇ukL2 .
La formulation variationnelle du problème de Poisson consiste donc à minimiser la fonctionnelle de Ritz F : H01 (Ω) → R définie par
F (v) =
1
k∇vk2L2 − Rehf, viL2 .
2
L’unique élément u ∈ H01 (Ω) minimisant F vérifie la relation
pour tout v ∈ H01 (Ω).
h∇u, ∇viL2 − Rehf, viL2 = 0
126
8.1.3
Problème de Poisson-Neumann
Considérons maintenant le problème aux limites suivant, appelé problème de PoissonNeumann :
−∆u = f
dans Ω,
n · ∇u = 0
sur ∂Ω,
avec f ∈ L2 (Ω), où Ω est un ouvert borné de Rn à frontière de classe C 1 et n est la normale
extérieure unité à ∂Ω.
Pour reformuler ce problème sous forme variationnelle, prenons H = L2 (Ω) et D(A) =
{u ∈ C ∞ (Ω) | n · ∇u|∂Ω = 0}, de sorte que l’opérateur linéaire A de ce problème soit
encore
A : D(A) ⊂ L2 (Ω) → L2 (Ω) : u 7→ −∆u.
Cet opérateur linéaire est symétrique car en vertu du théorème de la divergence,
−h∆u, viL2 = h∇u, ∇uiL2 + hn · ∇u|∂Ω , v|∂Ω iL2 = h∇u, ∇viL2
pour tout u, v ∈ D(A).
En revanche, cet opérateur n’est pas coercif car hAu, uiL2 = 0 pour toute fonction constante
u sur Ω. Ceci n’est pas surprenant, car la solution du problème de Poisson-Neumann ne
peut être déterminée qu’à une constante près. D’autre part, en intégrant l’équation aux
dérivées partielles sur Ω et en appliquant le théorème de la divergence, on obtient
hf, 1iL2 = −h∇u, 1iL2 + hn · ∇u|∂Ω , 1iL2 = 0,
de sorte que l’on ne peut espérer pouvoir trouver un solution au problème de PoissonNeumann que lorsque hf, 1iL2 = 0. Pour éviter ces difficultés, restreignons l’espace de
Hilbert H à {1}⊥ ⊂ L2 (Ω). Ainsi, le domaine de A devient
D(A) = {u ∈ C ∞ (Ω) | n · ∇u|∂Ω = 0, hu, 1iL2 = 0}.
Pour montrer que cet opérateur restreint est bien coercif, nous aurons besoin de l’inégalité
suivante.
Théorème 8.6 (Inégalité de Poincaré). Soit Ω un ouvert borné de Rn possédant la
propriété du cône. Alors il existe une constante C > 0 telle que
kuk21 ≤ C k∇uk2L2 + |hu, 1iL2 |2
pour tout u ∈ H 1 (Ω).
Démonstration. Supposons par l’absurde que, pour tout k ∈ Z+ , il existe uk ∈ H 1 (Ω) tel
que
kuk k21 > k k∇uk k2L2 + |huk , 1iL2 |2 .
Puisque cette inégalité est homogène de degré 2 en uk , on peut supposer sans perte de
généralité que kuk k1 = 1. Par conséquent, la condition ci-dessus implique que
k∇uk k2L2 + |huk , 1iL2 |2 → 0,
127
n → ∞.
Comme (uk ) est bornée dans H 1 (Ω), on peut en extraire par le théorème de Rellich une
sous-suite convergente dans L2 (Ω). Pour simplifier les notations, nous désignerons toujours
L2
cette sous-suite par (uk ), de sorte que uk → u
e pour un certain u
e ∈ L2 (Ω).
L2
L2
H1
Comme uk → u
e et ∇uk → 0, on a uk → u
e et ∇e
u = 0. De plus, la propriété huk , 1iL2 → 0
implique he
u, 1iL2 = 0.
Mais ces deux propriétés de u
e impliquent que u
e = 0, ce qui contredit le fait que ke
uk1 =
limk→∞ kuk k1 = 1.
Par conséquent, l’opérateur linéaire symétrique A est coercif. En effet, pour tout u ∈ D(A),
on a
1
−hu, ∆uiL2 = h∇u, ∇uiL2 ≥ kuk2L2 ,
C
car hu, 1iL2 = 0.
p
De plus, la norme correspondante a(u, u) = k∇ukL2 est équivalente à la norme H 1 sur
D(A). La complétion Va de D(A) pour cette norme coincide donc la complétion de cet
espace pour la norme H 1 , c’est-à-dire avec
Va = {u ∈ H 1 (Ω) | hu, 1iL2 = 0}.
Comme ∇1 = 0, on peut remplacer le produit scalaire L2 par le produit scalaire H 1 dans
l’expression ci-dessus, de sorte que Va = {1}⊥ ⊂ H 1 (Ω).
Enfin, le produit scalaire énergie h·, ·ia et la norme énergie k · ka sur Va = H01 (Ω) sont
donnés par
hu, via = h∇u, ∇viL2
et
kuka = k∇ukL2 .
La formulation variationnelle du problème de Poisson-Neumann consiste donc à minimiser
la fonctionnelle de Ritz F : {1}⊥ ⊂ H 1 (Ω) → R définie par
F (v) =
1
k∇vk2L2 − Rehf, viL2 .
2
L’unique élément u ∈ {1}⊥ ⊂ H 1 (Ω) minimisant F vérifie la relation
h∇u, ∇viL2 − Rehf, viL2 = 0
pour tout v ∈ {1}⊥ ⊂ H 1 (Ω).
8.1.4
Conditions aux limites essentielles et naturelles
Les deux problèmes aux limites traités ci-dessus sont très semblables, car l’expression de la
fonctionnelle de Ritz est la même dans les deux cas. Par contre, les espaces de Hilbert Va
sur lesquels on minimise cette fonctionnelle diffèrent : on travaille sur Va = H01 (Ω) pour le
problème de Poisson, et sur Va = {1}⊥ ⊂ H 1 (Ω) pour le problème de Poisson-Neumann.
128
En particulier, les conditions aux limites satisfaites par u sur ∂Ω apparaı̂ssent de manières
différentes dans les formulations variationnelles de ces problèmes aux limites.
Dans le cas du problème de Poisson, tous les éléments de l’espace Va = H01 (Ω) satisfont à
la condition aux limites u|∂Ω = 0. Comme cette condition est exigée de manière explicite
dans la formulation variationnelle, on parle de conditions aux limites essentielles ou
principales.
Par contre, dans le cas du problème de Poisson-Neumann, les éléments de l’espace Va =
{1}⊥ ⊂ H 1 (Ω) ne satisfont pas forcément à la condition aux limites n · ∇u|∂Ω = 0. Ces
conditions sont en fait automatiquement satisfaites par le fait que la solution u ∈ Va
minimise la fonctionnelle de Ritz. On parle alors de conditions aux limites naturelles.
8.1.5
Généralisation
Une fois un problème aux limites formulé dans l’espace de Hilbert approprié Va muni
du produit scalaire énergie h·, ·ia , l’espace de Hilbert initial H devient inutile. On peut
donc reformuler le théorème 8.4 et ses hypothèses directement dans l’espace Va , noté V
ci-dessous.
Théorème 8.7. Soient V un espace de Hilbert, a : V × V → K une forme hermitienne
définie positive, continue et coercive, et f ∈ V ′ . Alors la fonctionnelle F : V → R définie
par
1
F (v) = a(v, v) − Rehf, vi
2
possède un unique minimum u ∈ V , qui est l’unique solution de
a(u, v) = hf, vi,
pour tout v ∈ V.
En pratique, il est parfois préférable de formuler un problème aux limites sous sa formulation variationnelle que sous sa formulation différentielle, car la formulation variationnelle
requiert peu de conditions de régularité pour les diverses fonctions définissant le problème.
Exemple. Soient Ω un ouvert borné de Rn , V = H01 (Rn ), f ∈ H −1 (Rn ) et a : V × V → K
définie par
n Z
X
∂u
∂v
(x)
(x) dx,
p(x)
a(u, v) =
∂xi
∂xi
Ω
i=1
avec p ∈ C 0 (Ω) satisfaisant p(x) ≥ p0 > 0 pour tout x ∈ Ω.
La fonctionnelle F : V → R associée à ces données s’écrit
2
n Z
∂u
1X
(x) dx − Rehf, vi.
p(x) F (v) =
2
∂xi
Ω
i=1
La condition satisfaite par l’unique élément u ∈ V minimisant F est
n Z
X
∂v
∂u
p(x)
(x)
(x) dx = hf, vi,
pour tout v ∈ V.
∂xi
∂xi
Ω
i=1
129
En revanche, la formulation différentielle de ce problème est donnée par
( P
∂
∂u
− ni=1 ∂x
(x)
= f (x)
dans Ω,
p(x)
∂xi
i
u = 0
ce qui n’a de sens que si p et
8.2
∂u
∂xi
sur ∂Ω,
sont de classe C 1 .
N
Méthodes approchées
Nous allons maintenant appliquer la formulation variationnelle des problèmes aux limites
à leur résolution numérique approchée.
8.2.1
Méthode de Ritz
Considérons un problème aux limites donné sous sa formulation variationnelle comme dans
le théorème 8.7. La méthode de Ritz consiste à remplacer le problème de minimisation
de F sur V par le problème de minimisation de F sur un sous-espace fermé Vh ⊂ V . En
pratique, on choisit cet espace Vh de dimension finie.
Le but est d’approcher le minimum u ∈ V de F sur V par le minimum uh ∈ Vh de F
sur Vh . L’espace Vh sera choisi de manière à pouvoir calculer numériquement la solution
approchée uh ∈ Vh . Cette solution approchée satisfait à la condition
a(uh , v) = hf, vi,
pour tout v ∈ Vh .
(8.3)
Remarquons que, pour obtenir dette formulation approchée du problème aux limites, il
n’est pas nécessaire de discrétiser d’opérateurs différentiels (en les remplaçant par des
différences finies, par exemple). De plus, l’espace Vh peut être choisi librement dans l’espace
de Hilbert V . En particulier, Vh ne doit pas être un sous-espace du domaine D(A) de
l’opérateur A de la formulation forte du problème.
Lorsque Vh est de dimension finie N , cette condition s’exprime sous la forme d’un système
de N équations linéaires à N inconnues, que l’on peut résoudre par ordinateur. En effet,
tout élément v ∈ Vh peut s’écrire
N
X
ξj φj ,
v=
j=1
où (φj )1≤j≤N est une base de Vh . La condition (8.3) devient alors
N
X
j=1
a(φj , φi )ξj = hf, φi i,
i = 1, . . . , N.
En posant A = (aij ) ∈ RN ×N avec aij = a(φi , φj ), ξ = (ξ1 , . . . , ξN ) ∈ RN et b =
(b1 , . . . , bN ) ∈ RN avec bi = hf, φi i, ce système déquation se réécrit sous la forme compacte
Aξ = b.
130
Ce système d’équations linéaires est appelé système de Ritz et la matrice A est appelée
matrice de rigidité. Par symétrie et coercivité de l’opérateur linéaire correspondant,
c’est une matrice symétrique et définie positive.
On voudrait maintenant savoir si la solution approchée uh ∈ Vh est proche de la solution
exacte u ∈ V . Comme la fonctionnelle de Ritz F peut s’écrire
1
ku − vk2a − kuk2a ,
F (v) =
2
on en déduit que
ku − uh ka = min ku − vka .
v∈Vh
En d’autres termes, la solution approchée uh est l’approximation optimale de la solution
exacte u dans le sous-espace Vh , au sens de la norme énergie k · ka . Cependant, cette norme
dépend du problème considéré et on préfère mesurer l’erreur commise lors de la résolution
approchée au moyen de la norme usuelle k · k sur V . Pour cela, on aura besoin du résultat
suivant.
Théorème 8.8 (Lemme de Céa). Sous les hypothèses du théorème 8.7, soit uh ∈ Vh
l’approximation du minimum u ∈ V de F obtenue par la méthode de Ritz dans le sousespace fermé Vh ⊂ V . Alors il existe une constante C ≥ 1 telle que
ku − uh k ≤ C min ku − vk.
v∈Vh
(8.4)
Démonstration. Soit Ph : V → V le projecteur linéaire orthogonal sur l’espace Vh ⊂ V .
On a donc
ku − Ph uk = min ku − vk.
v∈Vh
Par continuité et coercivité de a, la norme énergie k · ka est équivalente à la norme usuelle
k · k sur V : il existe α, β > 0 tels que
αkvk2 ≤ a(v, v) ≤ βkvk2 ,
pour tout v ∈ V . Par conséquent, on a
αku − uh k2 ≤ a(u − uh , u − uh ) = min a(u − v, u − v)
v∈Vh
≤ a(u − Ph u, u − Ph u)
≤ βku − Ph uk2 .
On en déduit que
ku − uh k ≤
r
β
ku − Ph uk =
α
r
β
min ku − vk.
α v∈Vh
En général, la solution approchée uh ∈ Vh n’est pas la meilleure approximation de u ∈ V
dans le sous-espace Vh . Cependant, l’inégalité (8.4) montre que, lorsque la constante C
n’est pas trop grande, la solution approchée uh presque aussi bonne que la meilleure
approximation Ph u de u ∈ V dans Vh . On dit que cette solution approchée est quasioptimale pour la norme k · k de V .
131
8.2.2
Eléments finis
La méthode des éléments finis repose sur l’application de la méthode de Ritz dans
le cas où l’espace Vh consiste en des fonctions polynomiales par morceaux, continues sur
Ω ainsi que certaines de leurs dérivées. Nous détaillons cette métode dans le cas d’un
problème aux limites formulé sur un ouvert borné Ω du plan R2 .
On décompose l’ouvert Ω en une juxtapositions de domaines élémentaires Ωl , l ∈ L,
appelés éléments finis. On travaille sur chaque Ωl avec des fonctions polynomiales, qui
se raccordent continument le long des frontières de ces domaines élémentaires, ainsi que
certaines de leurs dérivées. On doit avoir Vh ⊂ V , où V est typiquement un sous-espace
fermé de l’espace de Sobolev H m (Ω). On peut montrer qu’une fonction vh polynomiale par
morceaux est dans H m (Ω) si et seulement si vh ∈ C m−1 (Ω). Dans le cas d’un problème
du second ordre, on a m = 1, de sorte que les fonctions vh doivent être continues.
Sur chaque élément Ωl , une fonction polynomiale sera déterminée par ses valeurs (ainsi
que celles de certaines de ses dérivées), appelées valeurs nodales, en certains points de
Ωl , appelés points nodaux ou noeuds. Les noeuds, les valeurs nodales et le degré des
polynômes utilisés doivent être choisis de sorte que le nombre total Σ de valeurs nodales
de coefficients dans un
suir un élément fini coincide avec le nombre C(d) = (d+1)(d+2)
2
polynôme de degré d en 2 variables. Une fonction dans Vh sera alors représentée sur
ordinateur par le vecteur ξ constitué de toutes ses valeurs nodales sur Ω.
Pour affiner cette représentation, dans le but d’obtenir une meilleure solution approchée
uh ∈ Vh , on peut soit subdiviser les éléments Ωl en des domaines plus petits (version h),
soit augmenter le degré des polynômes utilisés (version p).
Etudions maintenant quelques manières de choisir les noeuds, les valeurs nodales et le
degré des polynômes utilisés dans le cas d’éléments finis triangulaires.
Interpolation de Lagrange
Dans ce cas, les valeurs nodales sont uniquement les valeurs de la fonction polynômiale
aux noeuds (et de ses dérivées). Pour obtenir des fonctions polynomiales par morceaux
continues, il suffira d’imposer que les valeurs nodales sur chaque côté de Ωl suffisent exactement à déterminer le polynôme sur ce côté. Par contre, il ne sera pas possible d’obtenir
des fonctions polynomiales par morceaux de classe C k sur Ω avec k > 0.
Interpolation linéaire
Lorsque d = 1 et donc C(d) = 3, il suffit de choisir comme noeuds les sommets du triangle.
Les valeurs nodales aux deux noeuds sur chaque côté déterminent bien une fonction linéaire
sur ce côté.
132
Interpolation quadratique
Lorsque d = 2 et donc C(d) = 6, on choisit comme noeuds les sommets et les milieux des
côtés du triangle. Les valeurs nodales aux trois noeuds sur chaque côté déterminent bien
une fonction quadratique sur ce côté.
Interpolation cubique
Lorsque d = 3 et donc C(d) = 10, on choisit comme noeuds les sommets du triangle,
les points subdivant chaque côté du triangle en 3 parties égales et le centre de gravité
du triangle. Les valeurs nodales aux quatre noeuds sur chaque côté déterminent bien une
fonction cubique sur ce côté.
Σ=3
d=1
Σ=6
d=2
Σ = 10
d=3
Fig. 8.1 – Interpolation de Lagrange.
Interpolation d’Hermite
Dans ce cas, les valeurs nodales comprennent également les valeurs de certaines dérivées du
polynôme φ en certains noeuds. Suivant les cas, on obtiendra divers types de raccordement
pour les dérivées le long des côtés des triangles.
Interpolation cubique
Lorsque d = 3 et donc C(d) = 10, on choisit comme noeuds les sommets du triangle, où
∂φ
l’on utilise comme valeurs nodales les valeurs de φ, ∂φ
∂x et ∂y , ainsi que le centre de gravité
du triangle, où l’on utilise comme valeur nodale la valeur de φ.
On peut montrer qu’une telle fonction polynômiale par morceaux est continue, mais que
ses dérivées premières ne se raccordent contnument qu’aux sommets des triangles.
Interpolation quintique
Lorsque d = 5 et donc C(d) = 21, on choisit comme noeuds les sommets du triangle, où
∂φ ∂ 2 φ ∂ 2 φ
∂2φ
l’on utilise comme valeurs nodales les valeurs de φ, ∂φ
∂x , ∂y , ∂x2 , ∂x∂y et ∂y 2 , ainsi que les
milieux des côtés du triangle, où l’on utilise comme valeur nodale la valeur de la dérivé
∂φ
de φ.
normale ∂n
133
On peut montrer que, de cette manière, on obtient des fonctions polynômiales par morceaux de classe C 1 sur Ω.
Interpolation quintique réduite
Dans la méthode précédente, au lieu d’utiliser les milieux des côtés du triangle pour y
∂φ
récolter les 3 dernières valeurs nodales, on impose que la dérivée normale ∂n
de φ sur
chaque côté soit une cubique.
De cette manière, on obtient encore des fonctions polynômiales par morceaux de classe C 1
sur Ω.
Σ = 10
d=3
Σ = 21
d=5
Σ = 18 (+3 conditions)
d=5
Fig. 8.2 – Interpolation d’Hermite.
Assemblage de la matrice de rigidité
Une fois que les noeuds et valeurs nodales ont été choisis, et donc que l’espace Vh et une
base (φj )1≤j≤N sont déterminés, il faut calculer la matrice de rigidité du système de Ritz.
(l)
Les coefficients aij peuvent être calculés en sommant des contributions locales aij pour
P
(l)
chaque élément fini Ωl : aij = L
l=1 aij , avec
(l)
aij
=
Z
Ωl
!
2
X
∂φj
∂φi
(x)
(x) dx,
p(x)
∂xk
∂xk
k=1
dans le cas de l’exemple de la section 8.1.5.
(l)
La matrice A(l) = (aij ) est appelée matrice de rigidité élémentaire ou locale. Le
calcul de A à partir des matrices A(l) s’appelle l’assemblage. Cette méthode s’applique
aussi au calcul du vecteur b à partir de f ∈ V ′ .
Pour assembler la matrice A, on parcourt d’abord tous les éléments dans Ω et on somme
leurs contributions provenant d’intégrales de volume (sur Ωl ). La matrice ainsi obtenue est
appelée matrice de rigidité primitive. Ensuite, on parcourt tous les éléments adjacents
à ∂Ω et on somme encore leurs contributions de frontières, provenant d’intégrales de bord
(sur ∂Ω ∩ ∂Ωl ).
La matrice ainsi obtenue incorpore automatiquement les conditions aux limites naturelles
du problème. Par contre, il faut imposer explicitement les conditions aux limites essen-
134
tielles. Pour cela, il faut donner des valeurs prescrites à certaines valeurs nodales (composantes de ξ), puis déplacer les termes correspondants dans le membre de droite. Enfin,
on élimine les équations dans lesquelles une valeur nodale connue est multipliée par un
coefficient diagonal de A.
8.3
Problèmes aux valeurs propres
Nous allons maintenant formuler des problèmes aux valeurs propres sous une forme variationnelle.
8.3.1
Quotient de Rayleigh
Soit A : D(A) ⊂ H → H un opérateur linéaire symétrique dans un espace de Hilbert H.
On considère l’équation
Au = λu
avec λ ∈ R et u ∈ H. Cette équation a en général de nombreuses solutions, qui sont les
valeurs propres et vecteurs propres de l’opérateur A.
Le quotient de Rayleigh de A est la fonctionnelle R : D(A) \ {0} → R définie par
R(u) =
hu, Aui
.
hu, ui
Considérons le problème variationnel qui consiste à minimiser sur D(A) \ {0} le quotient
de Rayleigh.
Comme la fonctionnelle de Ritz, lorsque l’opérateur A est coercif, le quotient de Rayleigh
s’étend de manière unique en une fonctionnelle définie sur Va \ {0}, où Va ⊂ H est la
complétion de D(A) pour la norme énergie k · ka .
Lorsque l’opérateur A est symétrique, coercif et possède une base orthonormée de vecteurs
propres, on peut montrer que
λ0 = inf R(u)
u∈Va \{0}
est la plus petite valeur propre de A et que cette valeur est atteinte par un vecteur propre
u0 ∈ Va \ {0} correspondant à la valeur propre λ0 : R(u0 ) = λ0 .
En minimisant ensuite le quotient de Rayleigh sur l’orthogonal des espaces propres déjà
obtenus, on peut trouver toutes les valeurs propres et vecteurs propres de l’opérateur A
par cette méthode variationnelle.
135
8.3.2
Valeurs propres du laplacien
Nous allons illustrer la méthode variationnelle ci-dessus dans le cas de l’opérateur laplacien.
Soit Ω un ouvert borné de Rn , et considérons donc le problème aux valeurs propres
−∆u = λ u
dans Ω,
u = 0
sur ∂Ω,
où u ∈ L3 (Ω) et λ ∈ R.
Pour reformuler ce problème sous forme variationnelle, prenons H = L2 (Ω) et
A : D(A) = C0∞ (Ω) ⊂ H → H : u 7→ Au = −∆u.
Nous avons vu dans la section 8.1.2 que cet opérateur linéaire est symétrique et coercif, et
que la norme énergie k · ka correspondante est équivalente à la norme H 1 sur D(A). Par
conséquent, la complétion de D(A) = C0∞ (Ω) pour cette norme est Va = H01 (Ω).
Le quotient de Rayleigh étendu est donc la fonctionnelle R : H01 (Ω) → R donnée par
R(u) =
k∇uk2L2
.
kuk2L2
Le numérateur de cette expression est appelé intégrale de Dirichlet :
Z X
n ∂u 2
2
k∇ukL2 =
∂xi dx.
Ω
i=1
Nous devons maintenant montrer que l’infimum du quotient de Rayleigh est atteint par
un élément de H01 (Ω).
Théorème 8.9. Soit S = {uj ∈ H01 (Ω) | j ∈ J ⊂ N} une collection de vecteur propres du
laplacien : −∆uj = λj uj pour des valeurs propres λj ∈ R. Alors il existe u
e ∈ S ⊥ \ {0} tel
que
k∇uk2L2
k∇e
uk2L2
e
=
inf
= λ.
2
ke
uk2L2
u∈S ⊥ \{0} kukL2
eu.
De plus, −∆e
u = λe
e ∈ R par
Démonstration. Définissons λ
e=
λ
k∇uk2L2
.
2
u∈S ⊥ \{0} kukL2
inf
Par définition de l’infimum, il existe une suite minimisante (vk ) dans S ⊥ \ {0} pour le
quotient de Rayleigh, c’est-à-dire telle que R(vk ) → 0 lorsque k → ∞. Sans perte de
généralité, nous pouvons supposer que kvk kL2 = 1. Par conséquent,
kvk k2H 1 = kvk k2L2 + k∇vk k2H 1 = 1 + R(vk ) → 1,
136
k → ∞,
de sorte que la suite (vk ) est bornée dans H01 (Ω). Par le théorème de Rellich, on peut en
extraire une sous-suite, que nous noterons encore (vk ), qui est convergente dans L2 (Ω).
Soit u
e ∈ L2 (Ω) sa limite. On a donc en particulier
ke
ukL2 = lim kvk kL2 = 1
k→∞
et
he
u, ul iL2 = lim hvk , ul iL2 = 0.
k→∞
e Comme R(u) ≥ λ
e pour tout u ∈ S ⊥ \ {0}, on a
Vérifions maintenant que R(e
u) = λ.
e k + ǫwk2 2 ≥ 0,
k∇vk + ǫ∇wk2L2 − λkv
L
pour tout w ∈ S ⊥ et ǫ ∈ R. En développant, on obtient
2
2
2
e
e
e k k2 2 + 2Re ǫh∇vk , ∇wiL2 − 2λRe
+
|ǫ|
k∇wk
−
λkwk
ǫhv
,
wi
k∇vk k2L2 − λkv
2
k
L
L2 ≥ 0.
L
2 . En prenant la limite inférieure pour k → ∞, on obtient
e
Posons c = k∇wk2 − λkwk
L2
e
lim inf 2Re ǫh∇vk , ∇wiL2 − 2λRe
ǫhe
u, wiL2 ≥ −|ǫ|2 c.
k→∞
Lorsque ǫ = ǫ0 > 0, ceci donne
e
u, wiL2 ≥ −
lim inf Reh∇vk , ∇wiL2 − λRehe
k→∞
ǫ0
c,
2
alors que pour ǫ = −ǫ0 < 0, on a
e
u, wiL2 ≤ −
lim sup Reh∇vk , ∇wiL2 − λRehe
k→∞
ǫ0
c.
2
Comme ǫ0 > 0 est arbitraire, on en déduit que
e
u, wiL2 = 0.
lim Reh∇vk , ∇wiL2 − λRehe
k→∞
En remplaçant w par iw, on obtient aussi
e
u, wiL2 = 0,
lim Imh∇vk , ∇wiL2 − λImhe
k→∞
de sorte que finalement
e u, wiL2 ,
lim h∇vk , ∇wiL2 = λhe
k→∞
pour tout w ∈ S ⊥ .
En prenant w = vj dans (8.5), et en prenant la limite pour j → ∞, on obtient
e
e uk2 2 = λ.
lim lim h∇vk , ∇vj iL2 = λke
L
j→∞ k→∞
En particulier, la suite (∇vk ) est une suite de Cauchy dans L2 (Ω) car
kvk − vj k2L2 = k∇vk k2L2 − 2Reh∇vk , ∇vj iL2 + k∇vj k2L2 .
137
(8.5)
u) =
e ∈ H01 (Ω) et R(e
La suite (vk ) est donc de Cauchy dans H01 (Ω). Par conséquent, u
e
limk→∞ R(vk ) = λ.
L’équation (8.5) devient alors
e u, wiL2 ,
h∇e
u, ∇wiL2 = λhe
pour tout w ∈ S ⊥ . Soit ϕ ∈ C0∞ (Ω) ; alors
X
w =ϕ−
huj , ϕiL2 uj ∈ S ⊥
j∈J
et donc, comme
on obtient
e u, uj iL2 = 0,
u, uj iL2 = −λhe
h∇e
u, ∇uj iL2 = −h∆e
e u, ϕiL2 ,
−h∆e
u, ϕiL2 = λhe
eu.
pour tout ϕ ∈ C0∞ (Ω). Ceci montre bien que −∆e
u = λe
Corollaire 8.10. Les vecteurs propres de l’opérateur −∆ sur H01 (Ω) forment une suite
orthogonale complète dans H01 (Ω) et dans L2 (Ω).
Démonstration. L’application répétée du Théorème 8.9 permet de construire une suite
orthonormée dans L2 (Ω) de vecteurs propres uj ∈ H01 (Ω), correspondant aux valeurs
propres λj et satisfaisant
0 < λ1 ≤ λ2 ≤ λ3 ≤ . . .
Il suffit en effet d’appliquer le Théorème 8.9 avec S = {u1 , . . . , uj } pour obtenir uj+1 et
λj+1 .
Remarquons que, pour tout λ ∈ R, on a max{j ∈ N | λj = R(uj ) < λ} < ∞, ce qui revient
à dire que limj→∞ λj = ∞. En effet, si ce n’était pas le cas, la suite (uj ) serait bornée dans
H01 (Ω) et par le théorème de Rellich on pourrait en extraire une sous-suite convergente
dans L2 (Ω). Mais une suite orthonormée ne peut être convergente, une contradiction.
Soit v ∈ H01 (Ω) \ {0}, et soit k ∈ N tel que λk > R(u). Si hv, uj iL2 = 0 pour tout
j = 1, . . . , k alors par construction de la suite (uj ), on doit avoir R(u) ≥ R(uk ) = λk , une
contradiction. Comme H01 (Ω) est dense dans L2 (Ω), ceci implique que la suite (uj ) est
complète dans L2 (Ω).
Enfin, remarquons que
hui , uj iH 1 = hui , uj iL2 + h∇ui , ∇uj iL2 = δij (1 + λj ),
de sorte que la suite (uj ) est également orthogonale et complète dans H01 (Ω).
138
Exercices sur le Chapitre 8
1. On considère le problème aux limites
−∆u = f
n · ∇u + u = 0
dans Ω,
sur ∂Ω,
où Ω ⊂ Rn est un ouvert borné à frontière de classe C 1 , n est la normale extérieure
unité à ∂Ω et f ∈ L2 (Ω).
(a) Montrer avec un raisonnement par l’absurde la deuxième inégalité de Friedrichs :
il existe une constante C > 0 telle que
kϕk2L2 ≤ C k∇ϕk2L2 + kγ(ϕ)k2L2
pour tout ϕ ∈ C ∞ (Ω).
(b) Montrer que l’opérateur A de ce problème est symétrique et coercif.
(c) Donner la formulation variationnelle de ce problème.
139
Notations
|·|
k·k
h·, ·i
∗
⊗
⊕
α
∂α
∂A
γα
δ
δ(A)
σ(V, V ′ )
σ(V ′ , V )
Ω
A∗
A
B(x, r)
B(x, r)
B(X, E)
C m (Ω)
C0m (Ω)
Cbm (Ω)
m (Ω)
CK
m (Rn )
C∞
d(·, ·)
D(T )
D(Ω)
D ′ (Ω)
EX
E(Ω)
E ′ (Ω)
fr
frc
F
G(T )
module.
norme.
crochet de dualité ou produit scalaire, d’après le contexte.
produit de convolution.
produit tensoriel.
somme directe algébrique ou topologique, d’après le contexte.
multi-indice (α1 , . . . , αn ).
dérivée par rapport au multi-indice α.
bord de l’ensemble A.
application de trace pour espaces de Sobolev.
distribution de Dirac.
diamètre de l’ensemble A.
topologie faible sur V .
topologie faible * sur V ′ .
ouvert de Rn .
adjoint de l’application linéaire A.
adhérence de l’ensemble A.
boule ouverte de centre x et de rayon r.
boule fermée de centre x et de rayon r.
espace des fonctions bornées de X dans E.
espace des fonctions de classe C m dans Ω.
espace des fonctions de classe C m à support compact dans Ω.
espace des fonctions de classe C m à dérivées bornées sur Ω.
espace des fonctions de classe C m à support dans K ⊂ Ω.
espace des fonctions de classe C m qui tendent vers 0 à l’infini.
distance.
domaine de l’opérateur linéaire T .
espace des fonctions test sur Ω.
espace des distributions sur Ω.
espace des fonctions de X dans E.
espace des fonctions de classe C ∞ sur Ω.
espace des distributions à support compact dans Ω.
régularisation de la distribution f .
régularisation canonique de la distribution f .
transformation de Fourier.
graphe de l’opérateur linéaire T .
140
H
H m (Ω)
H0m (Ω)
H s (Rn )
im A
Im(z)
int(A)
Jδ
ker A
K
lp (E)
L2 (S)
L2σ (R)
Lp (Ω)
L(V, W )
P
Re(z)
supp(f )
S(Rn )
S ′ (Rn )
S⊥
Ta
T
vp(f )
W m,p (Ω)
espace de Hilbert ou fonction de Heaviside, d’après le contexte.
espace de Sobolev d’ordre m sur Ω.
espace de Sobolev d’ordre m à trace nulle sur Ω.
espace de Sobolev d’ordre fractionnaire s sur Rn .
image de l’application linéaire A.
partie imaginaire de z.
intérieur de l’ensemble A.
opérateur de lissage.
noyau de l’application linéaire A.
corps des scalaires : R ou C.
espace des suites dans E de norme à la pème puissance sommable.
espace de Lebesgue d’exposant 2 sur la sous-variété S.
espace de Lebesgue d’exp. 2 pour l’intégrale de Riemann-Stieltjes sur R.
espace de Lebesgue d’exposant p sur Ω.
espace des applications linéaires bornées de V dans W .
projecteur.
partie réelle de z.
support de la fonction ou de la distribution f .
espace de Schwartz des fonctions à décroissance rapide sur Rn .
espace des distributions tempérées.
orthogonal de S.
opérateur de translation par a ∈ Rn .
topologie.
valeur principale de la fonction f .
espace de Sobolev d’ordre m et d’exposant p sur Ω.
141
Bibliographie
[1] H. Brézis, Analyse fonctionnelle : théorie et applications, Masson (1983).
[2] D.H. Griffel, Applied functional analysis, Dover (2002).
[3] E. Kreyszig, Introductory functional analysis with applications, Wiley (1978).
[4] L. Schwartz, Analyse I : théorie des ensembles et topologie, Hermann (1991).
[5] L. Schwartz, Méthodes mathématiques pour les sciences physiques, Hermann (1965).
142
Téléchargement