Telechargé par diages

poly2010

publicité
Notes de cours
ANALYSE FONCTIONNELLE
Guillaume CARLIER
ENS, 2009-2010
2
3
Table des matières
1 Espaces vectoriels topologiques localement convexes
1.1 Définitions et propriétés premières . . . . . . . . . . . .
1.2 Bornitude, continuité, suites . . . . . . . . . . . . . . .
1.3 Applications linéaires continues . . . . . . . . . . . . .
1.4 Limites inductives et topologie de D(Ω) . . . . . . . . .
1.5 Théorèmes de Hahn-Banach . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
15
17
23
30
2 Introduction à la théorie des distributions
2.1 Quelques résultats préliminaires . . . . . . . . . . .
2.2 Définitions et propriétés premières des distributions
2.3 Convolution et régularisation . . . . . . . . . . . . .
2.4 Transformation de Fourier . . . . . . . . . . . . . .
2.5 Solution fondamentale du Laplacien . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
39
45
51
57
64
.
.
.
.
.
67
67
71
72
76
78
4 Opérateurs linéaires, opérateurs compacts
4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Conséquences de la théorie de Baire . . . . . . . . . . . . . . .
4.3 Opérateurs compacts, alternative de Fredholm . . . . . . . . .
4.4 Décomposition spectrale des opérateurs compacts autoadjoints
81
81
82
84
89
3 Espaces de Banach et topologies faibles
3.1 Topologie faible . . . . . . . . . . . . . .
3.2 Topologie faible-∗ . . . . . . . . . . . . .
3.3 Espaces réflexifs . . . . . . . . . . . . . .
3.4 Espaces séparables . . . . . . . . . . . .
3.5 Espaces uniformément convexes . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Espaces Lp
91
5.1 Rappels d’intégration . . . . . . . . . . . . . . . . . . . . . . . 91
5.2 Propriétés élémentaires des espaces Lp . . . . . . . . . . . . . 93
5.3 Dualité, réflexivité, séparabilité . . . . . . . . . . . . . . . . . 97
4
5.4
5.5
Compacité dans Lp . . . . . . . . . . . . . . . . . . . . . . . . 105
Compacité faible dans L1 . . . . . . . . . . . . . . . . . . . . . 107
6 Espaces de mesures
6.1 Rappels sur les espaces de fonctions continues . . . . . . . .
6.2 Théorème de Riesz et mesures de Radon dans le cas compact
6.3 Mesures de Radon dans le cas localement compact . . . . . .
6.4 Théorème de Radon-Nikodym, désintégration des mesures .
6.5 Dualité convexe et transport optimal . . . . . . . . . . . . .
.
.
.
.
.
110
110
112
121
128
132
7 Espaces de Sobolev et EDP’s elliptiques linéaires
141
7.1 Cas de la dimension 1 . . . . . . . . . . . . . . . . . . . . . . 141
7.2 Définitions et propriétés premières en dimension quelconque . 148
7.3 Injections de Sobolev . . . . . . . . . . . . . . . . . . . . . . . 154
7.4 Espace W01,p et traces de fonctions W 1,p . . . . . . . . . . . . . 160
7.5 Formulation variationnelle de quelques pro- blèmes aux limites 163
7.6 Principe du maximum et régularité elliptique . . . . . . . . . . 167
8 Calcul des variations et EDP’s elliptiques non-linéaires
174
8.1 Méthode directe du calcul des variations . . . . . . . . . . . . 175
8.2 Théorèmes de point-fixe et applications . . . . . . . . . . . . . 178
5
Chapitre 1
Espaces vectoriels topologiques
localement convexes
1.1
Définitions et propriétés premières
Dans tout ce qui suit, E désignera un espace vectoriel sur R, les définitions
et résultats qui suivent s’étendent au cas complexe (une fois correctement
étendues les notions de convexité et de symétrie).
Définition 1.1 On appelle espace vectoriel topologique (evt) tout ev E muni
d’une topologie rendant continues les applications
(x, y) ∈ E × E 7→ x + y, et (λ, x) ∈ R × E 7→ λx.
Si E est un evt, alors les translations τy (τx (y) := x + y) sont des
homéomorphismes de E, et donc si V est un système fondamental de voisinages de 0, {τx (V ) = x+V, V ∈ V} est un système fondamental de voisinages
de x. De même, si λ ∈ R∗ , l’homothétie y 7→ λy est un homéomorphisme de
E. Si U est un voisinage de 0 et x ∈ E alors pour λ ∈ R suffisamment petit en
valeur absolue λx ∈ U , on dit alors que les voisinages de 0 sont absorbants.
On notera également qu’une application linéaire entre evt est continue si et
seulement si elle l’est en 0. Enfin, on rappelle qu’un espace topologique est
séparé dès que tout couple de points distincts possède des voisinages disjoints
(ce qui est toujours le cas dans les espaces métriques).
Exercice 1.1 (Histoire de manipuler la définition) Montrer que si E est
un evt, 0 possède un système fondamental de voisinages équilibrés (V est
équilibré si λV ⊂ V pour λ ∈ [−1, 1]). L’evt E est séparé si et seulement si
{0} est fermé.
6
Exercice 1.2 Montrer qu’un evt séparé localement compact (i.e. tel que
chaque point admet un voisinage compact) est nécessairement de dimension
finie.
Exercice 1.3 (Histoire de régler une bonne fois pour toutes le cas de la
dimension finie) Soit E un evt séparé de dimension finie, montrer que sa
topologie coı̈ncide avec celle définie par une norme.
Evidemment, la topologie induite par une norme sur E fait de E un evt
mais dans les applications la structure d’espace vectoriel normé s’avère parfois trop rigide et inadaptée (car, par exemple, la boule unité n’est jamais
relativement compacte dans un espace vectoriel de dimension infinie...). Inversement, la notion d’evt seule est souvent trop générale pour les analystes
et en pratique, les espaces fonctionnels que nous rencontrerons auront en fait
davantage de structure. Avant d’aller plus loin, considérons le cas (important
et pas si particulier que cela comme nous le verrons au Théorème 1.1) d’une
topologie engendrée par une famille de semi-normes.
Définition 1.2 Soit E un R-ev, on appelle semi-norme sur E toute application p : E → R+ , vérifiant :
p(x + y) ≤ p(x) + p(y), ∀(x, y) ∈ E × E, p(λx) = |λ|p(x), ∀(x, λ) ∈ E × R.
Soit P une famille de semi-normes sur E, on dit que P sépare les points (ou
est séparante) de E si
p(x) = 0, ∀p ∈ P ⇒ x = 0.
Soit P = {pi , i ∈ I}, une famille de semi-normes sur E, x ∈ E, r > 0 et
J ⊂ I, finie, on définit la P-boule ouverte de centre x, BJ (x, r) par
\
BJ (x, r) =
Bpj (x, r) = {y ∈ E : pj (x − y) < r, ∀j ∈ J}.
j∈J
Notons que BJ (x, r) = x + BJ (0, r) et que par définition même les P-boules
BJ (x, r) sont des ensembles convexes de E (on rappelle qu’un sous ensemble
C de E est convexe si tx + (1 − t)y ∈ C pour tout (t, x, y) ∈ [0, 1] × C × C).
La topologie associée à une famille de semi-normes est définie comme
suit :
7
Définition 1.3 Soit E un R-ev et P = {pi , i ∈ I}, une famille de seminormes sur E, les ouverts de la topologie associée à P sont les parties U
de E telles que pour tout x ∈ U , il existe r > 0 et J ⊂ I fini tels que
BJ (x, r) ⊂ U .
Autrement dit, la topologie associée à P est celle dont les P-boules ouvertes centrées en x forment un système fondamental de voisinages de x. Il
est aisé de voir que E muni de cette topologie est un evt et qu’il est séparé si
et seulement si la famille P est séparante. Notons que si P et P 0 sont deux
familles de semi-normes sur E vérifiant P ⊂ P 0 alors la topologie associée
à P 0 est plus fine que celle associée à P. Par ailleurs, chaque point de E
possède pour cette topologie un système fondamental de voisinages formé
d’ensembles convexes. La topologie associée à une famille de semi-normes est
donc localement convexe au sens de la définition suivante :
Définition 1.4 Un R-espace vectoriel topologique localement convexe (evtlc)
est un evt dont chaque point possède un système fondamental de voisinages
formé d’ensembles convexes.
On peut évidemment dans la définition précédente remplacer ”chaque
point” par ”un point”. Notez aussi que l’evt E est un evtlc ssi 0 possède
une système fondamental de voisinages convexes et symétriques (un sous ensemble C de E est dit symétrique si C = −C). En remarquant que dans un
evtlc, l’intérieur d’un convexe d’intérieur non vide est encore convexe (exercice facile), on notera qu’on peut aussi rajouter ”ouverts” dans la définition
qui précède.
Lemme 1.1 Soit E un evtlc de topologie T définie par la famille de seminormes P et soit q une semi-norme sur E alors q est continue (pour T ) si
et seulement s’il existe C ≥ 0, k ∈ N∗ et p1 , . . . , pk dans P telles que
q ≤ C sup pi .
i=1,...,k
Preuve:
Si q est continue, il existe un voisinage de 0 sur lequel q ≤ 1, il existe donc
aussi une P-boule sur laquelle q ≤ 1, l’inégalité cherchée s’obtient alors
facilement par homogénéité. Réciproquement, supposons qu’il existe C ≥ 0,
k ∈ N∗ et p1 , . . . , pk dans P telles que
q ≤ C sup pi .
i=1,...,k
8
Soit x ∈ E et ε > 0, alors on a |q(x) − q(y)| ≤ q(x − y) ≤ ε pour tout y dans
la P-boule
{y ∈ E, pi (x − y) < (1 + C)−1 ε, i = 1, . . . , k}
ce qui montre la continuité de q.
2
Remarque. Une combinaison linéaire à coefficients posititifs de semi-normes
est encore une semi-norme de même qu’un supremum d’un nombre fini de
semi-normes, si p est une semi-norme sur E et T un application linéaire de
F vers E alors p ◦ T est une semi-norme sur F . Si P est une famille de seminormes sur E, la topologie qu’elle définit est la même que celle définie par la
famille (dite filtrante) P 0 formée par les suprema de familles finies d’éléments
de P.
Exemples
Passons maintenant en revue quelques exemples de familles de seminormes naturellement associées à quelques espaces fonctionnels usuels. Dans
ce qui suit Ω désigne un ouvert de Rd et K un compact d’intérieur non vide
inclus dans Ω, une suite exhaustive de compacts Kj de Ω est une suite de
compacts inclus dans Ω tels que Kj ⊂ int(Kj+1 ) et Ω = ∪j Kj (par exemple
Kj := {x ∈ Rd : |x| ≤ j, d(x, Rd \ Ω) ≥ 1/j}). Un multi indices α
est unPélément (α1 , ..., αd ) de Nd , sa longueur notée |α| est par définition
|α| = di=1 αi . Pour α = (α1 , ..., αd ) et β = (β1 , ..., βd ) deux multi-indices, on
notera
– α ≤ β si αi ≤ βi , pour i = 1, ..., d,
– α ± β = (α1 ± β1 , . . . , αd ± βd ),
– α! = α1 ! . . . αd !, et pour β ≤ α
Cαβ =
α!
,
β!(α − β)!
– si x ∈ Rd , xα = xα1 1 . . . xαd d ,
– si f ∈ C ∞ (Rd )(= C ∞ (Rd , R) ou C ∞ (Rd , C)), et α 6= (0, . . . , 0),
∂αf =
∂ |α| f
,
∂ α1 x 1 . . . ∂ αd x d
et ∂ α f = f si α = (0, . . . , 0).
On rappelle aussi, à toutes fins utiles, la formule de Leibniz : si f, g ∈
C ∞ (Rd )2 :
X
∂ α (f g) =
Cαβ ∂ α−β f ∂ β g.
(1.1)
β≤α
9
Si f ∈ C(Ω)(= C(Ω, R) ou C(Ω, C)), on appelle support de f et l’on note
supp(f ) le complémentaire du plus grand ouvert sur lequel f est nulle, qui
est aussi l’adhérence de {x ∈ Ω : f (x) 6= 0}.
– Si K est un compact de Rd , on note C(K) l’espace des fonctions continues de K à valeurs dans R ou C, on le munit classiquement de la
norme uniforme
kf k := sup kf (x)k
x∈K
(qui en fait un Banach). On peut également munir C(K) de la famille
de semi-normes px (f ) := |f (x)| avec x ∈ K.
– Si Ω est un ouvert de Rd , m ∈ N et K un compact de Ω pour f ∈
C ∞ (Ω), posons
pm,K (f ) :=
sup
α∈Nd
sup |Dα f (x)|.
:|α|≤m x∈K
L’espace C(Ω)(= C(Ω, R) ou C(Ω, C)) des fonctions continues sur Ω est
muni de la famille de semi normes pK = p0,K avec K compact de Ω (ou
simplement la famille p0,Kj avec une suite exhaustive de compacts Kj de
Ω). CK (Ω) désigne l’espace des fonctions continues sur Ω à support dans
K (i.e. nulles en dehors de K) et Cc (Ω) désigne l’espace des fonctions
continues sur Ω à support compact i.e. :
Cc (Ω) = ∪j CKj (Ω)
Pour m ∈ N ∪ {+∞}, on définit de même l’espace C m (Ω) des fonctions
de classe C m sur Ω, on le munit de la famille pm,Kj . On définit de
m
même les espaces de fonctions de classe C m à support compact, CK
(Ω)
et Ccm (Ω).
– On note de même DK (Ω) l’espace des fonctions C ∞ à support dans K et
D(Ω) := Cc∞ (Ω) l’espace des fonctions C ∞ à support compact. La topologie de DK (Ω) est définie par la famille de semi normes {pm,K , m ∈ N}
(nous verrons plus loin que DK (Ω) est métrisable et complet pour cette
topologie). Une ”bonne” topologie sur D(Ω) (de même que sur Cc (Ω)
ou Ccm (Ω)) est plus subtile à définir (voir le paragraphe 1.4).
– Soit p ∈ [1, ∞), Lploc (Ω) est l’espace des fonctions fonctions mesurables
f telles que pour tout compact K de Ω
Z
1/p
p
qK,p (f ) :=
|f |
< ∞.
K
On munit Lploc (Ω) de la famille de semi-normes qK,p où K parcourt
l’ensemble des compacts de Ω (une suite exhaustive suffit évidemment).
10
– Considérons l’espace de Schwartz S des fonctions régulières à décroissance
rapide
S = {f ∈ C ∞ (Rd ) : sup (1 + |x|k )|∂ β f (x)| < ∞, ∀k ∈ N, ∀β ∈ Nd }
x∈Rd
on le munit naturellement de la famille de semi-normes
f 7→
sup
β∈Nd ,
sup (1 + |x|k )|∂ β f (x)|.
|β|≤m x∈Rd
2
Un exemple typique de fonction de S est la gaussienne f (x) = e−|x| /2 .
– Si E est un evn et E 0 son dual topologique, la famille de semi-normes
pf (x) := |f (x)|, f ∈ E 0 , x ∈ E
définit la topologie faible σ(E, E 0 ) sur E, cette famille est séparante
en vertu du théorème de Hahn-Banach que nous verrons plus loin. De
même la famille de semi-normes
qx (f ) := |f (x)|, f ∈ E 0 , x ∈ E
définit la topologie faible ∗ σ(E 0 , E) sur E 0 , elle est séparante par
définition même.
Un autre exemple de semi-normes nous est fourni par la jauge d’un ouvert
convexe symétrique. Soit E un evt et C un ouvert convexe contenant 0, la
jauge de C est alors définie par :
jC (x) := inf{t > 0 :
x
∈ C}, ∀x ∈ E.
t
Pour tout x on a jC (x) ∈ R, par ailleurs il est évident que jC (λx) = λx pour
tout λ > 0 et x ∈ E. De plus, jC vérifie l’inégalité triangulaire, en effet soit
x et y dans E, pour ε > 0, (jC (x) + ε)−1 x et (jC (y) + ε)−1 )y sont dans C, en
remarquant que
jC (x) + ε
x
x+y
=
jC (x) + jC (y) + 2ε jC (x) + jC (y) + 2ε jC (x) + ε
jC (y) + ε
y
+
jC (x) + jC (y) + 2ε jC (y) + ε
comme ε > 0 est arbitraire on déduit de la convexité de C :
jC (x + y) ≤ jC (x) + jC (y).
11
(1.2)
Si x ∈ C alors comme C est ouvert (1 + ε)x ∈ C pour ε > 0 assez petit et
donc jC (x) < 1. Si réciproquement jC (x) < 1 alors il est évident que x ∈ C,
si bien que l’on a
C = {x ∈ E : jC (x) < 1}.
(1.3)
Enfin, si C est de plus supposée symétrique, alors sa jauge est clairement paire
et donc c’est une semi-norme (dont la boule unité ouverte est précisément
C).
Exercice 1.4 Soit E un evt et C un sous ensemble convexe de E montrer
que l’adhérence de C est convexe.
Théorème 1.1 Soit E un evtlc alors il existe une famille de semi-normes
P sur E qui induit la topologie de E. En outre, la topologie de E est séparée
si et seulement si la famille P sépare les points de E.
Preuve:
Nous avons déja vu que la topologie associée à une famille de semi-normes
munit E d’une structure d’evtlc. Réciproquement, soit E un evtlc et notons
T sa topologie. Posons
C := {C ∈ T : C convexe, 0 ∈ C, C = −C}
on sait que C est un système fondamental de voisinages de 0 et que x + C
est un système fondamental de voisinages de x, pour tout x ∈ E. On pose
maintenant
P := {jC , C ∈ C}.
Nous avons vu que P est une famille de semi-normes sur E et nous allons
montrer que T coı̈ncide avec la topologie associée à P. Soit U ∈ T et x ∈ U ,
il existe C ∈ C tel que x+C ⊂ U ce qui est équivalent à BjC (x, 1) ⊂ U ainsi U
est un ouvert pour la topologie associée à P. Soit maintenant U ouvert dans
la topologie associée à P, pour tout x dans U il existe donc k ∈ N∗ , C1 , ..., Ck
dans C et r > 0 tel que ∩ki=1 BjCi (x, r) ⊂ U ce qui est encore équivalent à
x + C ⊂ U avec
C = r ∩ki=1 Ci
et puisque C ∈ C, on en déduit que U ∈ T . La seconde assertion du théorème
a déja été vue.
2
On retiendra donc que la topologie d’un evtlc (respectivement d’evtlcs)
est déterminée par une famille de semi-normes (respectivement une famille
de semi-normes séparante). Une question naturelle à ce stade est de savoir si
12
l’on peut métriser une topologie d’evtlcs (le caractère séparé est évidemment
nécessaire). En effet, dans le cadre métrique, les objets topologiques de base
(ensembles compacts, continuité, ensembles fermés, adhérence....) peuvent
être caractérisés en termes séquentiels et sont ainsi bien plus aisés à manipuler
que dans le cadre des espaces topologiques généraux.
Théorème 1.2 Soit E un evtlcs dont la topologie est associée à la famille
dénombrable (et séparante) de semi-normes P = {pn }n∈N . Alors la distance
∞
X
1
(pn (x − y) ∧ 1)
d(x, y) :=
2n
n=0
est invariante par translation (i.e. d(x+z, y+z) = d(x, y) pour tout (x, y, z) ∈
E 3 ) et métrise la topologie de E.
Preuve:
Le fait que d est une distance est facile à voir, de même que l’invariance
par translation. Montrons que la topologie induite par d coı̈ncide avec celle
induite par P. Soit x ∈ E, J un sous ensemble fini de N et r > 0, montrons
qu’il existe ε > 0 tel que la P-boule ouverte BJ (x, r) contienne la boule
ouverte pour d, Bd (x, ε) : posons ε = 2−K−1 (r ∧ 1) avec K = max J si bien
que Bd (x, ε) ⊂ BJ (x, r). Montrons maintenant que Bd (x, r)
une PPcontient
−n
boule ouverte de centre x : on choisit d’abord N tel que n≥N 2 ≤ r/2,
on pose J = {0, ..., N } de sorte que BJ (x, r/4) ⊂ Bd (x, r).
2
A titre d’exercice, on montrera que la topologie d’evtlcs associée à une
famille (séparante) de semi-normes P sur E est métrisable si et seulement si
l’une des propriétés équivalentes suivantes est satisfaite :
– 0 possède un système fondamental de voisinages dénombrable,
– il existe une famille dénombrable de semi-normes induisant la topologie
de E.
L’importance de la compétude dans les espaces métriques (théorème du
point fixe de Banach, théorie de Baire...) justifie la définition suivante :
Définition 1.5 On appelle espace de Fréchet tout evtlcs métrisable par une
distance invariante par translation (ce qui revient à dire que sa topologie
peut être définie par une famille dénombrable et séparante de semi-normes)
et complet.
Soit P = {pn }n∈N une suite de semi-normes (séparante) définissant la
topologie de E, on remarque que dire que la suite (xk )k converge vers x
(la limite x étant unique car E est séparé) revient à l’une des assertions
équivalentes suivantes
13
1. pour tout voisinage U de 0, il existe K tel que xk − x ∈ U pour tout
k ≥ K (c’est la définition dans un evt général)
2. pour tout n, pn (xk − x) → 0 quand k → ∞,
3. d(xk , x) → 0 quand k → ∞ avec d distance invariante par translation
métrisant la topologie de E.
Notons aussi que (xk )k est de Cauchy dans l’espace métrique (E, d) (avec
d invariante par translation métrisant la topologie de E définie par P) est
équivalent aux assertions équivalentes suivantes
1. pour tout voisinage U de 0, il existe K tel que xk − xl ∈ U pour tout
k, l ≥ K (c’est la définition dans un evt général),
2. pour tout n, et tout ε > 0 il existe K tel que pn (xk − xl ) ≤ ε pour tout
k, l ≥ K,
3. supk,l≥K d(xk , xl ) → 0 quand K → ∞.
Exemples Voici quelques exemples à retenir (la complétude est dans
chaque cas aisée à obtenir et donc laissée en exercice au lecteur) :
– C(Ω) muni de la famille {p0,Kj }j (convergence uniforme sur tout compact) est un espace de Fréchet, il en est de même pour C m (Ω) pour la
famille {pm,Kj }j et de E(Ω) := C ∞ (Ω) pour la famille {pm,Kj }m,j .
– Lploc est un espace de Fréchet pour la famille de semi-normes f 7→
kf kLp (Kj ) ,
– DK (Ω) est un espace de Fréchet pour la famille de semi-normes {pm,K }m .
– L’espace de Schwartz S est de Fréchet pour la famille de semi-normes
f 7→
sup
β∈Nd ,
sup (1 + |x|k )|∂ β f (x)|.
|β|≤m x∈Rd
Exercice 1.5 Montrer que L1loc (Ω) et DK (Ω), munis de leurs topologies usuelles
ne sont pas normables.
Exercice 1.6 Soit (En , pn ) une suite décroissantes d’espaces de Banach avec
injections (de En+1 dans En évidemment) continues, montrer que E = ∩n En
muni de la famille de semi-normes {pn }n est un espace de Fréchet.
14
1.2
Bornitude, continuité, suites
Il s’agit dans ce paragraphe de définir quelques notions topologiques de
base dans les evt (en fait rappeler puisque ces notions sont déja bien connues
dans le cadre des espaces topologiques quelconques) mais aussi d’introduire
leur pendant séquentiel. Il est bien connu que dans les espaces métriques, on
peut développer la topologie indifféremment soit à partir de la topologie associée à la distance, soit à partir de la notion de convergence de suites. Autrement dit, dans les espaces métriques, les deux points de vue sont équivalents.
Cela n’est malheureusement pas le cas dans les espaces topologiques généraux
(et en particulier ni dans les evt, ni dans les evtlcs) et pourtant, il est souvent
bien utile de manier des notions séquentielles. Nous allons définir ici certaines
de ces notions séquentielles en avertissant d’emblée le lecteur qu’en dehors du
cas métrisable, il ne faudra pas les confondre avec les notions topologiques.
Définition 1.6 Soit E un evt, (xn )n une suite à valeurs dans E et x ∈ E.
On dit que (xn ) converge vers x (ou encore que x est limite de la suite (xn )n ,
ce que l’on notera simplement xn → x) si et seulement si pour tout voisinage
U de 0, il existe N tel que (xn − x) ∈ U pour tout n ≥ N .
Evidemment, la définition précédente n’a véritablement d’intérêt que dans
le cas où E est séparé ce qui assure que si (xn )n converge, sa limite est
uniquement déterminée. Dans le cas d’un evtlc de topologie associée à la
famille de semi-normes P, la définition précédente se traduit simplement
par : ∀p ∈ P, p(xn − x) → 0 quand n → +∞.
Par définition, un fermé de E est une partie dont le complémentaire est
ouvert. Une partie A de E est dite séquentiellement fermée si pour toute suite
à valeurs dans A et convergeant dans E vers une limite x on a x ∈ A. On
dira qu’une partie de E est séquentiellement ouverte si son complémentaire
est séquentiellement fermé. Il est évident qu’une partie fermée (ouverte) est
séquentiellement fermée (ouverte) mais l’inverse n’est en général pas vrai.
L’adhérence d’une partie est le plus petit fermé contenant cette partie (ou
encore l’intersection des fermés contenant cette partie) et une partie de E
est dite dense dans E si son adhérence est E tout entier (ou encore si elle
rencontre tout ouvert non vide). L’adhérence séquentielle d’une partie A de
E est l’ensemble des limites de suites à valeurs dans A convergentes dans
E. Une partie de E est dite séquentiellement dense dans E si son adhérence
séquentielle est E entier. Une partie A de E est dite séquentiellement compacte si de toute suite à valeurs dans A on peut extraire une sous suite
convergeant dans A (la notion coı̈ncide avec la compacité usuelle dans le cas
métrique mais en général il n’y a pas d’implication entre les deux notions).
15
Soit (E1 , T1 ) et (E2 , T2 ) deux espaces topologigues et ϕ : E1 → E2 , ϕ est
continue sur E1 (respectivement continue en x ∈ E1 ) si ϕ−1 (U ) ∈ T1 pour
tout U ∈ T2 (respectivement ϕ−1 (U ) est voisinage de x pour tout U voisinage
de ϕ(x)). Dans le cas où E1 et E2 sont deux evtlcs de topologies associées
respectivement aux familles de semi-normes P1 et P2 , la continuité de ϕ en x
s’exprime par : pour tout ε > 0 et p2 ∈ P2 il existe δ > 0 et une semi-norme
continue sur E1 , p tels que pour tout y ∈ E1 tel que p(x − y) ≤ δ on a
p2 (ϕ(x) − ϕ(y)) ≤ ε. L’application ϕ : E1 → E2 est dite séquentiellement
continue en x ∈ E1 si pour toute suite (xn )n convergeant vers x dans E1 ,
la suite (ϕ(xn ))n converge vers ϕ(x) dans E2 ; ϕ est dite séquentiellement
continue sur E1 si elle est séquentiellement continue en chaque point de E1 .
Soit (E, T ) un espace topologique et ϕ : E → R ∪ {+∞}, on rappelle
que ϕ est semi-continue inférieurement (sci en abrégé) sur E si l’une des
conditions équivalentes suivantes est satisfaite :
– pour tout λ ∈ R, l’ensemble {x ∈ E : ϕ(x) ≤ λ} est fermé dans E,
– l’ensemble (épigraphe de ϕ) {(x, λ) ∈ E × R : ϕ(x) ≤ λ} est fermé
dans E × R,
– pour tout x ∈ E et tout ε > 0, il existe U voisinage de x dans E tel
que ϕ(y) ≥ ϕ(x) − ε, pour tout y ∈ U .
Enfin, ϕ est dite séquentiellement continue, si pour tout x ∈ E et toute suite
(xn )n convergeant vers x dans E on a :
ϕ(x) ≤ lim inf ϕ(xn ).
n
On vérifie facilement que la continuité (la semi-continuité inférieure) implique
la continuité (la semi-continuité inférieure) séquentielle mais la réciproque
n’est pas vraie en général, nous aurons l’occasion d’y revenir.
Définition 1.7 Soit E un evt, on dit que la partie B de E est bornée si et
seulement si pour tout U voisinage de 0, il existe λ > 0 tel que B ⊂ λU .
Si E est un evtlc de topologie associée à la famille de semi-normes P =
{pi , i ∈ I}, on vérifie facilement que la bornitude de B ⊂ E équivaut à l’une
des assertions équivalentes suivantes :
– pour tout p ∈ P, supx∈B p(x) < +∞,
– pour tout J ⊂ I, fini, il existe R > 0 tel que B ⊂ BJ (0, R).
Dans le cas où E est un evtlcs métrisable, il ne faut pas confondre la
bornitude au sens précédent et la bornitude au sens d’une distance métrisant
la topologie de E (remarquons d’ailleurs que pour la distance construite au
théorème 1.2, E est borné).
16
Exercice 1.7 Soit E un evtlcs montrer que E est normable si et seulement
si 0 possède un voisinage (convexe) borné.
Définition 1.8 Soit E un evt et (xn )n une suite à valeurs dans E, on dit
que (xn )n est de Cauchy si et seulement si pour tout U voisinage de 0, il
existe N tel que xk − xl ∈ U pour tout k ≥ N et tout l ≥ N . Un evt est dit
complet si toute suite de Cauchy de E converge dans E.
Dans le cas où la topologie de E est définie par la famille de semi-normes P,
dire que (xn )n est de Cauchy se traduit par : pour tout p ∈ P, et tout ε > 0,
il existe N tel que p(xk − xl ) ≤ ε pour tout k ≥ N et tout l ≥ N .
1.3
Applications linéaires continues
Lemme 1.2 Soit E et F deux evtlc de topologies respectivement définies par
les familles de semi-normes P et Q et soit T une application linéaire de E
dans F . On a les équivalences :
1. T est continue,
2. T est continue en 0,
3. pour tout q ∈ Q, il existe C ≥ 0, k ∈ N∗ et p1 , . . . pk dans P tels que
q(T x) ≤ C sup pi (x), ∀x ∈ E.
i=1,...,k
Preuve:
1 et 2. sont clairement équivalents. Supposons 2. et soit q ∈ Q alors il existe
U voisinage de 0 tel que q(T (x)) ≤ 1 pour tout x ∈ U . Il existe k ∈ N∗ et
p1 , . . . pk dans P et ε > 0 tels que la P-boule {x ∈ E : pi (x) ≤ ε, i =
1, . . . , k} soit incluse dans U . Par homogénéité on en déduit facilement l’assertion 3. avec C = ε−1 . Supposons 3 satisfaite, alors soit x ∈ E et U un
voisinage de T (x) dans F , soit B une Q-boule ouverte de centre T (x) incluse
dans U , il découle de 3. qu’il existe une P-boule ouverte, C de centre x telle
que T (y) ∈ B ⊂ U pour tout y ∈ C. 2
Définition 1.9 Soit E et F deux evt et soit T une application linéaire de
E dans F . On dit que T est bornée si et seulement si T envoie les parties
bornées de E dans des parties bornées de F .
17
On rappelle que si E et F deux evtlc de topologies associée aux familles
de semi-normes P et Q et T est une application linéaire de E dans F , T est
séquentiellement continue revient à dire qu’elle est séquentiellement continue
en 0 ce qui s’exprime par :
si p(xn ) → 0, ∀p ∈ P, alors q(T (xn )) → 0, ∀q ∈ Q.
On a alors :
Lemme 1.3 Soit E et F deux evtlc de topologies associée aux familles de
semi-normes P et Q et T est une application linéaire de E dans F , on a les
implications : T continue ⇒ T séquentiellement continue ⇒ T bornée.
Preuve:
Seule la dernière implication est à démontrer. Suposons T séquentiellement
continue et supposons par l’absurde que T ne soit pas bornée : ∃B borné de
E tel que T (B) n’est pas borné. Ceci implique qu’il existe une semi-norme
q continue sur F telle que pour tout n ∈ N∗ , il existe xn ∈ B vérifiant
q(T (xn )) ≥ n. Comme B est borné, yn := n−1/2 xn tend vers 0 dans E, avec
la continuité séquentielle de T , ceci implique que q(T (yn )) tend vers 0 ce qui
est contredit par q(T (yn )) ≥ n1/2 .
2
En général, les implications précédentes sont strictes, nous verrons plus
tard des exemples de formes linéaires séquentiellement continues et non continues. Dans L2 (0, 1), il est assez facile de voir que la suite fn : t 7→ fn (t) :=
sin(2nπt) converge faiblement mais pas fortement vers 0, ce qui montre que
l’application identité n’est pas séquentiellement continue de L2 muni de la
topologie faible dans L2 muni de sa topologie forte (celle de la norme) et
pourtant elle est bornée (utiliser Banach-Steinhaus). Il existe donc des applications linéaires bornées et non séquentiellement continues. Dans le cas où
E est métrisable toutefois, la bornitude est équivalente à la continuité (on
laisse au lecteur le soin de prouver cette assertion).
L’important théorème de Banach-Steinhaus (aussi souvent appelé Principle of Uniform Boundedness) permet de déduire pour les opérateurs linéaires
des estimations uniformes à partir d’estimations ponctuelles :
Théorème 1.3 (Théorème de Banach-Steinhaus ou Principle of Uniform
Boundedness) Soit E un espace de Fréchet (de topologie associée à la famille
de semi-normes P), F un evtlc (de topologie associée à la famille de seminormes Q) et (Ti )i∈I une famille d’applications linéaires continues de E dans
F tels que
∀q ∈ Q, ∀x ∈ E, sup q(Ti (x)) < +∞
i∈I
18
alors pour tout q ∈ Q, il existe C ≥ 0, J ∈ N∗ et p1 , . . . , pJ ∈ P J tels que
∀i ∈ I, ∀x ∈ E, q(Ti (x)) ≤ C sup pj (x).
j=1,...,J
Preuve:
Pour n ∈ N∗ , posons
An := {x ∈ E : sup q(Ti (x)) ≤ n}.
i∈I
Comme An est une suite de fermés dont la réunion est E et comme E est
de Fréchet, il résulte du théorème de Baire qu’il existe n0 tel que An0 est
d’intérieur non vide. Il existe donc x0 ∈ E, J ∈ N∗ et p1 , . . . , pJ ∈ P J et
r > 0 tels que pour tout y dans la P boule B de centre 0 et de rayon 1 définie
par les semi-normes p1 , ..., pJ , on a q(Ti (x0 + ry)) ≤ n0 , ∀i ∈ I. On a donc
pour tout y ∈ B et tout i ∈ I, q(Ti (y)) ≤ C := r−1 (n0 + supi∈I q(Ti (x0 ))), on
conclut par homogénéité.
2
Nous allons maintenant nous intéresser plus en détail au cas des formes
linéaires continues. Dans ce qui suit étant donné un ev E on notera E ∗
son dual algébrique c’est à dire l’ensemble des formes linéaires sur E. Si E
est muni d’une structure d’evt (a fortiori d’evtlc), on notera E 0 son dual
topologique, i.e. l’espace des formes linéaires continues sur E.
Exemple Etant donné un espace métrique compact K, on appelle mesure de Radon sur K toute forme linéaire continue sur C(K) et l’on note
M(K) l’espace des mesures de Radon sur K (la terminologie sera justifiée
au Chapitre 6). Le dual topologique de l’espace de Schwartz S, S 0 est appelé
espace des distributions tempérées, celui de E(Ω) := C ∞ (Ω), E 0 (Ω) est appelé
espace des distributions à support compact.
On rappelle qu’un hyperplan H de E est un sev strict maximal de E, ce
qui revient à dire que pour tout x ∈
/ H, E = H ⊕ Rx ou encore qu’il existe
f ∈ E ∗ \ {0} telle que H = ker(f ). On définit de même les hyperplans affines
comme étant les ensembles de la forme {f = α} = {x ∈ E : f (x) = α}
pour un certain f ∈ E ∗ \ {0} et un certain α ∈ R.
Lemme 1.4 Soit E un evt, f ∈ E ∗ \ {0} et α ∈ R alors f est continue si et
seulement si l’hyperplan {f = α} est fermé.
Preuve:
Si f est continue l’hyperplan f −1 ({α}) est évidemment fermé. Pour la réciproque,
on suppose sans perte de généralité que α = 0 et que l’hyperplan H = ker(f )
19
est fermé. Soit x0 tel que f (x0 ) = 1, il existe un voisinage de 0, U0 tel que
x0 + U0 ⊂ {f 6= 0}, on peut aussi supposer que U0 est équilibré (c’est à dire
λU0 ⊂ U0 pour λ ∈ [−1, 1]) et donc en particulier symétrique (U0 = −U0 ).
Supposons par l’absurde qu’il existe u0 ∈ U0 tel que f (x0 + u0 ) < 0, alors il
existerait λ ∈ (0, 1) tel que f (x0 + λu0 ) = 0 or x0 + λU0 ∈ x0 + U0 ⊂ {f 6= 0}
ce qui constitue la contradiction recherchée. On a donc x0 + U0 ⊂ {f > 0}
et comme U0 = −U0 on en déduit que |f | ≤ 1 sur U0 de sorte que f est
continue.
2
Exercice 1.8 Il s’agit ici de montrer un lemme algébrique élémentaire mais
fort utile. Soit E un ev et f, f1 , . . . , fn des éléments de E ∗ . Montrer que
ker(fi ) ⊂ ker(f ) si et seulement s’il existe λ1 , . . . , λn ∈ Rn tels que
∩ni=1 P
f = ni=1 λi fi .
Une question naturelle est maintenant de savoir de quelle topologie muniton le dual topologique E 0 d’ un evtlcs E. Nous avons déja vu que dans le cas
d’un evn, deux choix ”raisonnables” étaient possibles : la topologie forte (celle
donnée par la norme duale) et la topologie faible ∗ (donnée par la famille de
semi-normes {qx }x∈E avec qx (f ) = |f (x)|). Cela se généralise comme suit aux
evt (même si ici nous nous limiterons aux evtlcs) :
Définition 1.10 Soit E un evtlcs et E 0 son dual. On appelle topologie forte
sur E 0 , la topologie définie par la famille de semi-normes
qB (f ) := sup |f (x)|, ∀f ∈ E 0 B ⊂ E, B borné.
x∈B
On appelle topologie faible-∗ sur E 0 et l’on note ∗-σ(E 0 , E), la topologie définie
par la famille de semi-normes
qx (f ) := |f (x)|, ∀f ∈ E 0 , x ∈ E.
On notera que les deux topologies précédemment définies sur E 0 le munissent d’une structure d’evtlcs. En termes séquentiels, on dit qu’une suite
fn de E 0 converge fortement vers f dans E 0 , ce que l’on note fn → f si et
seulement si qB (fn − f ) → 0 pour tout borné B de E. On dit qu’une suite
(fn )n de E 0 converge faiblement-∗ (ou simplement faiblement s’il n’y a pas
∗
d’ambiguité) vers f , ce que l’on note fn * f si et seulement si fn (x) → f (x),
pour tout x ∈ E. Par construction, une base de voisinages de f ∈ E 0 pour la
topologie faible-∗ est donnée par les ensembles de la forme :
Vε,x1 ,...xk := {g ∈ E 0 : |(f − g)(xi )| < ε, i = 1, . . . , k}
20
avec ε > 0, k ∈ N∗ et x1 , . . . , xk ∈ E k .
On a la caractérisation importante suivante de la topologie faible-∗ sur
0
E :
Théorème 1.4 La topologie faible-∗ sur E 0 , ∗-σ(E 0 , E) est la topologie la
moins fine sur E 0 rendant continue les applications f ∈ E 0 7→ f (x) ∈ R,
x ∈ E.
La notion de topologie la moins fine rendant continue une famille d’applications et sa construction ont déja été vus dans le cours de topologie du
premier semestre et nous reviendrons dessus au chapitre 3, on omet donc ici
la preuve du résultat précédent. On peut bien se demander pourquoi chercher
à affaiblir la topologie forte de E 0 , c’est à dire considérer une topologie ayant
moins d’ouverts. La réponse est qu’une topologie ayant moins d’ouverts a des
chances d’avoir plus de compacts, et, effectivement, on a l’important résultat
de compacité suivant :
Théorème 1.5 (Banach-Alaoglu-Bourbaki) Soit E un evtlcs, U un voisinage
de 0 et
K := {f ∈ E 0 : |f (x)| ≤ 1, ∀x ∈ U }
alors K est compact pour la topologie faible-∗ de E 0 .
Preuve:
Soit p une semi-norme continue sur E telle que B := {p ≤ 1} ⊂ U on a alors
K ⊂ K0 avec
K0 := {f ∈ E 0 : |f (x)| ≤ 1, ∀x ∈ B} = {f ∈ E 0 : |f (x)| ≤ p(x), ∀x ∈ E}.
Comme K est clairement fermé dans K0 il nous suffit de montrer que K0 est
compact pour la topologie faible-∗ de E 0 . Soit Y = RE = {(ωx )x∈E , ωx ∈
R, ∀x ∈ E} muni de la topologie produit (i.e. la moins fine rendant continues
les projections canoniques) et Φ : E 0 → Y définie par Φ(f ) := (f (x))x∈E
pour tout f ∈ E 0 , Φ est une application linéaire injective, continue de E 0
muni de la topologie faible-∗ vers Y muni de la topologie produit. Montrons
maintenant que Φ−1 : Φ(E 0 ) → E 0 est continue, pour cela il suffit de montrer
que pour tout x ∈ E, ω 7→ Φ−1 (ω)(x) est continue sur Φ(E 0 ), ce qui est
évident puisque Φ−1 (ω)(x) = ωx . Il nous suffit donc désormais de montrer
que Φ(K0 ) est compact. Or, on a :
Φ(K0 ) = A1 ∩ A2
21
avec
A1 := {ω ∈ Y : |ωx | ≤ p(x), ∀x ∈ E} =
Y
[−p(x), p(x)],
x∈E
et
A2 := {ω ∈ Y : ωx+λy = ωx + λωy , ∀(x, y, λ) ∈ E 2 × R}.
Il résulte du théorème de Tychonov que A1 est compact et de la continuité
des projections canoniques que A2 est fermé de sorte que Φ(K0 ) est compact.
2
Ce résultat de compacité explique que sur E 0 , on utilisera presque systématiquement la topologie faible-∗ et le mode de convergence associé. Dans le
cas où E est séquentiellement séparable (i.e. possède une partie dénombrable
séquentiellement dense), la topologie faible ∗ jouit de bonnes propriétés de
métrisabilité :
Proposition 1.1 Soit E un evtlcs séquentiellement séparable et p une seminorme continue sur E, alors la topologie faible-∗ est métrisable sur l’ensemble
K := {f ∈ E 0 : |f (x)| ≤ p(x), ∀x ∈ E}.
Preuve:
Soit {xn }n dense dans B = {p ≤ 1}, pour tout f et g dans K, on pose
d(f, g) :=
∞
X
1
|(f − g)(xn )|
n
2
n=0
il est facile de voir que d est une distance sur K. Montrons que cette distance
métrise la topologie faible sur K. Soit f ∈ K, r > 0, montrons que la boule
ouverte B(f, r) (dans K pour la distance
est voisinage de f dans K pour
P d) −n
la topologie faible-∗. Soit N tel que n≥N 2 ≤ r/4, et
V = Vr/4,x1 ,...,xN := {g ∈ E 0 : |(g − f )(xi )| < r/4, i = 1, . . . , N }
alors V ∩ K est un voisinage de f dans K pour la topologie faible-∗ contenu
dans B(f, r). Soit maintenant ε > 0, k ∈ N et y1 , . . . , yk ∈ E k et soit
U = Vε,y1 ,...,yk := {g ∈ E 0 : |(g − f )(yi )| < ε, i = 1, . . . , k}
il s’agit de montrer qu’il existe r > 0 tel que B(f, r) ⊂ U ∩ K. Pour i =
1, . . . , k soit ni tel que p(yi − xni ) ≤ ε/4 et soit r = mini=1,...,k ε2−ni −1 . Pour
g ∈ B(f, r), on a pour tout i = 1, .., k
|(f − g)(yi )| ≤ |(f − g)(xni )| + 2p(yi − xni ) < 2ni r + ε/2 ≤ ε
22
et donc B(f, r) ⊂ U ∩ K.
2
En combinant la proposition 1.1 et le théorème de Banach-Alaoglu-Bourbaki,
on obtient le résultat de compacité séquentiel, fort utile en pratique suivant :
Théorème 1.6 Soit E un evtlcs séquentiellement séparable, soit (fn )n une
suite de E 0 telle qu’il existe p une semi-norme continue sur E vérifiant
|fn (x)| ≤ p(x), ∀n ∈ N et ∀x ∈ E alors (fn )n possède une sous suite convergente pour la topologie faible-∗.
Lorsque E est en outre un espace de Fréchet (respectivement une limite
inductive d’espaces de Fréchet), le théorème de Banach-Steinhaus (respectivement la proposition 1.7) sera fort utile évidemment pour obtenir l’estimation requise dans le théorème précédent.
De même que l’on a défini la topologie faible-∗ sur E 0 , on peut définir
la topologie faible sur E comme étant la topologie associée à la famille de
semi-normes :
pf (x) := |f (x)|, ∀x ∈ E
avec f ∈ E 0 . La topologie faible sur E est notée σ(E, E 0 ), on déduit du
Théorème de Hahn-Banach qu’elle est séparée. Par construction, une base de
voisinages de x ∈ E pour la topologie faible est donnée par les ensembles de
la forme :
Vε,f1 ,...fk := {y ∈ E : |fi (x − y)| < ε, i = 1, . . . , k}
avec ε > 0, k ∈ N∗ et f1 , . . . , fk ∈ (E 0 )k . La topologie faible sur E est aussi
la topologie la moins fine sur E rendant continus les éléments de E 0 . En
termes séquentiels, on dit que xn converge faiblement dans x, ce que l’on
note xn * x si et seulement si f (xn ) → f (x) pour tout f ∈ E 0 . Sauf dans
le cas où E est un Banach (et en particulier un espace de Banach réflexif),
nous utiliserons assez peu cette topologie et ce mode de convergence.
1.4
Limites inductives et topologie de D(Ω)
Soit E un ev, réunion d’une famille d’ev (Ei )i∈I , on suppose que chaque
Ei est muni d’une topologie d’evtlc Ti (définie par une famille de semi-normes
Pi = {pij }j∈Ji ). La topologie limite inductive des topologies (Ti )i∈I est alors
la topologie T définie par la famille de semi-normes
P := {p semi-norme sur E dont la restriction à Ei est continue pour tout i ∈ I}.
23
Autrement dit, une semi-norme p appartient à P si et seulement si pour tout
i ∈ I, il existe C ≥ 0, J ⊂ Ji finie telle que
p ≤ C sup pij sur Ei .
j∈J
Notons que la caractérisation précédente exprime exactement le fait que
toutes les injections canoniques Ei → E sont continues de (Ei , Ti ) vers (E, T ).
On a alors la caractérisation suivante
Théorème 1.7 La topologie T limite inductive des (Ti )i∈I est la topologie
d’evtlc sur E la plus fine rendant continues les injections canoniques Ei → E
∀i ∈ I.
Preuve:
Nous avons déja remarqué que T est une topologie d’evtlc qui rend continue les injections canoniques Ei → E, ∀i ∈ I. Soit T 0 une topologie d’evtlc
qui rend continue toutes ces injections canoniques et soit P 0 la famille des
semi-normes continues pour la topologie T 0 . La continuité des injections canoniques implique que P 0 ⊂ P et donc que T est plus fine que T 0 .
2
Lemme 1.5 Soit (E, T ) limite inductive des evtlc (Ei , Ti ) définie comme cidessus, F un evtlc et T linéaire E → F , pour que T soit continue il faut et
il suffit que sa restriction T |Ei soit continue pour Ti , pour tout i ∈ I.
Preuve:
Si T est continue alors T |Ei l’est aussi comme composée de T et de l’injection
canonique Ei → E. Réciproquement, suposons T |Ei est continue pour Ti ,
pour tout i ∈ I. Soit Q une famille de semi-normes définissant la topologie
de F et soit q ∈ Q, q ◦ T est alors une semi-norme sur E continue sur chaque
Ei elle appartient donc à P. La continuité de T en découle immédiatement.
2
Lemme 1.6 Soit E un evtlc, F un sev de E, U un ouvert convexe de F
pour la topologie induite par celle de E, il existe C ouvert convexe de E tel
que U = C ∩ F .
Preuve:
On peut supposer sans perte de généralité que 0 ∈ U . Par définition, il existe
un ouvert V de E tel que U = V ∩ F , comme E est un evtlc, il existe W
ouvert convexe de E contenant 0 tel que W ⊂ V . Posons
C := ∪t∈[0,1] (tW + (1 − t)U ) = ∪t∈]0,1] (tW + (1 − t)U )
24
Le fait que l’on puisse exclure la valeur t = 0 dans la réunion provient du
fait que W est absorbant (pour x ∈ U on a x = (1 − ε)(1 + ε)x + ε2 x et pour
ε > 0 assez petit le premier terme est dans (1 − ε)U et le second dans εW ) et
ceci montre que C est ouvert ; C est évidemment convexe. Puisque U ⊂ C,
on a U ⊂ C ∩ F . Pour l’inclusion inverse, il suffit de remarquer que pour
t ∈ (0, 1], (tW + (1 − t)U ) ∩ F = tW ∩ F + (1 − t)U ⊂ tV ∩ F + (1 − t)U ⊂ U
(car U est convexe).
2
Nous ne rencontrerons en pratique par la suite que le cas d’une topologie
limite inductive d’une suite (croissante) d’evtlc (Ek , Tk )k∈N (la topologie Tk
étant associée à la famille de semi-normes Pk ), vérifiant en outre les conditions suivantes :
– pour tout k, Ek ⊂ Ek+1 et Ek est fermé dans (Ek+1 , Tk+1 ),
– Tk = Tk+1 |Ek (c’est à dire que la topologie de Ek est celle induite par
celle de Ek+1 sur Ek ).
On munit alors
E := ∪∞
k=0 Ek
de la topologie T limite inductive des topologies Tk et l’on appellera (E, T )
(ou simplement E) limite inductive de la suite d’evtlc (Ek , Tk )k (ou (Ek )k
si cela n’engendre pas de confusion). Dans toute la suite de ce paragraphe,
nous nous placerons dans ce cadre.
Notons que sous les hypothèses précédentes on vérifie immédiatement par
récurrence que pour m > k on a Tk = Tm |Ek . Remarquons aussi Ek est fermé
dans Em pour tout m > k. En effet, soit x ∈ Em \ Ek , soit l > k tel que
x ∈ El \ El−1 , comme El−1 est fermé dans El il existe Ul ∈ Tl tel que x ∈ Ul
et Ul ∩ El−1 = ∅. Comme Tl = Tm |El , il existe Um ∈ Tm tel que Ul = Um ∩ El ,
on a alors Um ∩ Ek = ∅. Il existe donc un voisinage de x dans Em disjoint de
Ek et donc Ek est fermé dans Em .
Lorsqu’en plus, les inclusions Ek ⊂ Ek+1 sont strictes on dit que (E, T )
est limite inductive stricte de la suite (Ek , Tk )k .
Exemple Les espaces Cc (Ω), Ccm (Ω) et D(Ω) = Cc∞ (Ω) sont naturellem
ment limites inductives respectives des suites (CKj (Ω))j , (CK
(Ω))j et (DKj (Ω))
j
où Kj est une suite exhaustive de compacts. On vérifie sans peine que la topologie définie par limite inductive définie sur ces espaces ne dépend pas de
la suite exhaustive de compacts choisie. A partir de maintenant, nous supposerons la plupart du temps, sans nécessairement le préciser, Cc (Ω), Ccm (Ω)
et D(Ω) munis de ces topologies. Le dual de l’espace Cc (Ω) (muni de sa topologie de limite inductive) est appelé espace des mesures de Radon sur Ω et
noté Mloc (Ω), ainsi une forme linéaire T sur Cc (Ω) est une mesure de Radon
25
sur Ω si et seulement si pour tout K ⊂ Ω, compact,
∃ CK ≥ 0 tel que |T (ϕ)| ≤ CK supx∈K |ϕ(x)|, ∀ϕ ∈ Cc (Ω), supp(ϕ) ⊂ K.
Evidemment, on munit Mloc (Ω) de la topologie faible ∗ et de la convergence
associée : Tn converge vers T si et seulement si Tn (ϕ) → T (ϕ), ∀ϕ ∈ Cc (Ω).
Passons en revue quelques propriétés de base des limites inductives d’une
suite d’evtlc :
Proposition 1.2 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k
définie comme précédemment, on a :
1. Si U est un convexe symétrique non vide de E tel que U ∩ Ek ∈ Tk pour
tout k alors U est voisinage de 0 dans (E, T ),
2. T |Ek = Tk i.e. la topologie induite par celle de E sur Ek coı̈ncide avec
celle de Ek ,
3. si chaque (Ek , Tk ) est séparé, alors (E, T ) l’est aussi,
4. Ek est fermé dans (E, T ) pour tout k.
Preuve:
1. Pour tout k, il existe une Pk -boule ouverte centrée en 0, Bk telle que
Bk ⊂ U ∩ Ek . On a donc jU |Ek ≤ jBk de sorte que jU est une semi-norme
continue sur (E, T ). Comme {jU < 1} ⊂ U , on a bien que U est voisinage
de 0 dans (E, T ).
2. Si U ∈ T alors par continuité de l’injection canonique Jk : Ek → E,
U ∩ Ek = Jk−1 (U ) ∈ Tk de sorte que T |Ek ⊂ Tk . Soit maintenant Uk un
voisinage de 0 dans (Ek , Tk ), il s’agit de montrer qu’il existe U voisinage
de 0 dans (E, T ) tel que Uk = U ∩ Ek . Sans perte de généralité, on peut
supposer en outre que Uk est convexe symétrique et Uk ∈ Tk . En utilisant
le fait que Tk = Tk+1 |Ek et par application itérée du lemme 1.6, il existe
une suite croissante de convexes (qu’on peut aussi supposer symétriques)
(Uk+l )l≥1 telle que chaque Uk+l est ouvert dans Ek+l et Uk = Uk+l ∩ Ek . On
pose alors U := ∪l≥1 Uk+l , comme la suite Uk+l est croissante, U est convexe,
Uk = U ∩ Ek , enfin U est voisinage de 0 dans E en vertu du point 1 de la
proposition.
3. Soit x ∈ E, x 6= 0, il s’agit de montrer qu’il existe U voisinage de 0
dans T tel que x ∈
/ U . Il existe k tel que x ∈ Ek et Uk un ouvert convexe
symétrique de (Ek , Tk ) tel que x ∈
/ Uk . Comme dans le point précédent,
on construit une suite croissante de convexes symétriques (Uk+l )l≥1 telle que
chaque Uk+l est ouvert dans Ek+l et Uk = Uk+l ∩Ek et on pose U := ∪l≥1 Uk+l .
26
Comme précédemment, U est voisinage de 0 dans E et U ∩ Ek = Uk de sorte
que U ne contient pas x.
4. Soit x ∈ E \ Ek et m > k tel que x ∈ Em , comme Ek est fermé
dans (Em , Tm ) il existe Um ∈ Tm , convexe symétrique tel que (x + Um ) ∩
Ek = ∅. Comme précédemment, on construit une suite croissante de convexes
symétriques (Um+l )l≥1 telle que chaque Um+l est ouvert dans Em+l et Um =
Um+l ∩ Em et on pose U := ∪l≥1 Um+l . Comme dans le point précédent, U est
un voisinage de 0 dans (E, T ) et (x + U ) ∩ Ek = ∅. Ceci montre bien que Ek
est fermé dans (E, T ).
2
Théorème 1.8 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k ,
définie comme précédemment, (xn )n une suite de E et x ∈ E, on a alors
les équivalences entre :
1. (xn )n converge vers x dans (E, T ),
2. il existe k tel que x ∈ Ek , xn ∈ Ek pour tout n et (xn )n converge vers
x dans (Ek , Tk ).
Preuve:
Supposons que (xn )n converge vers x dans (E, T ) et commencons par montrer
qu’il existe k tel que xn ∈ Ek pour tout n (ce qui impliquera en particulier
que x ∈ Ek car Ek est fermé donc séquentiellement fermé). Si un tel k n’existe
pas alors il existerait des sous-suites (nl )l et (kl )l tel que pour tout l ∈ N,
xnl ∈ Ekl+1 \ Ekl . Comme Ekl est fermé, on déduit du théorème de séparation
1.11 (que nous verrons à la section suivante) qu’il existe Tl ∈ E 0 telle que
Tl ≡ 0 sur Ekl et Tl (xnl ) 6= 0. Pour tout x ∈ E, posons alors
∞
X
|Tl (x)|
.
p(x) :=
l
|Tl (xnl )|
l=0
En remarquant que la somme précédente est en fait finie sur chaque Ej ,
on en déduit que p est une semi-norme continue sur chaque Ej et donc sur
E (autrement dit p ∈ P). En particulier, on devrait avoir que (p(xnl ))l est
bornée ce qui est contredit par le fait que par construction
p(xnl ) ≥ l, ∀l ∈ N.
On a donc montré qu’il existe k tel que xn ∈ Ek pour tout n et x ∈ Ek .
Ceci implique en particulier que (xn )n converge vers x dans T |Ek et donc
dans (Ek , Tk ), en vertu du point 2. de la proposition 1.2.
27
L’implication 2. ⇒ 1. découle immédiatement du point 2. de la proposition 1.2.
2
En particulier une suite (ϕn )n de D(Ω) converge vers ϕ si et seulement s’il
existe un compact K de Ω tel que toutes les fonctions ϕn et ϕ soient à support
dans K et ϕn − ϕ ainsi que toutes ses dérivées convergent uniformément vers
0 sur K.
Lemme 1.7 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k . Si
chaque (Ek , Tk ) est séquentiellement séparable, alors (E, T ) l’est aussi.
Preuve:
Soit Dk dénombrable séquentiellement dense dans Ek et D := ∪k Dk . Montrons que D est séquentiellement dense dans E. Soit x ∈ E et k tel que
x ∈ Ek , il existe alors une suite de Dk convergeant dans (Ek , Tk )k vers x et
donc cette suite converge aussi vers x dans (E, T ). 2
Proposition 1.3 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k .
Si chaque (Ek , Tk ) est complet, alors (E, T ) l’est aussi.
Preuve:
Soit (xn )n une suite de Cauchy de (E, T ). On montre d’abord qu’il existe k
tel que xn ∈ Ek pour tout n. Pour cela, on remarque que pour tout p ∈ P,
la suite (p(xn ))n est bornée puis on procède par l’absurde exactement de la
même manière que dans la preuve du Théorème 1.8. Utilisant à nouveau le
fait que T |Ek = Tk , on en déduit que (xn )n est de Cauchy dans (Ek , Tk ) dont
la complétude permet de conclure.
2
En particulier on a :
Proposition 1.4 D(Ω), muni de sa topologie usuelle (limite inductive des
topologies de DKj (Ω) avec Kj suite exhaustive de compacts de Ω) est complet.
On a vu qu’une limite inductive d’evtlc complets était encore complète,
en particulier, une limite inductive stricte d’espaces de Fréchet est complète.
Il est naturel de se demander si cette limite inductive est métrisable (donc de
Fréchet) : pour une limite inductive stricte la réponse est toujours négative :
Proposition 1.5 Une limite inductive stricte d’une suite d’espaces de Fréchet
n’est jamais métrisable.
28
Preuve:
Notons E la limite inductive stricte de la suite d’espaces de Fréchet (Ek )k .
Chaque Ek est fermé dans E et d’intérieur vide (sans quoi Ek contiendrait un
voisinage de 0 et ce dernier étant absorbant ceci impliquerait que Ek = E).
Puisque E est complet, s’il était métrisable, il résulterait du Lemme de Baire
que E = ∪k Ek est lui-même d’intérieur vide, ce qui est absurde.
2
En particulier, D(Ω) muni de sa topologie usuelle (limite inductive stricte
de la suite d’espaces de Fréchet DKj (Ω) avec Kj suite exhaustive de compacts de Ω) n’est pas métrisable. Noter que la preuve précédente fournit des
exemples d’espaces topologiques complets et non de Baire et montre que la
propriété ”être de Baire” ne passe pas à la limite inductive.
On peut être déçu par le caractère non métrisable d’une limite inductive
stricte d’espaces de Fréchet, néanmoins on a :
Proposition 1.6 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k et
soit T ∈ E ∗ . Si chaque Ek est métrisable alors T ∈ E 0 si et seulement si T
est séquentiellement continue.
Preuve:
Si T est séquentiellement continue alors T |Ek est séquentiellement continue
pour tout k et comme Tk est métrisable on en déduit que T |Ek est continue
pour tout k et donc T ∈ E 0 en vertu du lemme 1.5.
2
En particulier, une forme linéaire T sur D(Ω) est continue sur D(Ω) (autrement dit c’est une distribution c’est à dire un élément de D0 (Ω)) si et
seulement si T est séquentiellement continue.
Indiquons une application immédiate mais utile du théorème de BanachSteinhaus aux limites inductives d’espaces de Fréchet :
Proposition 1.7 Soit (E, T ) limite inductive de la suite d’espaces de Fréchet
(Ek , Tk )k (de topologie associée à la famille de semi-normes Pk ), F un evtlc
(de topologie associée à la famille de semi-normes Q) et (Ti )i∈I une famille
d’applications linéaires continues de E dans F tels que
∀q ∈ Q, ∀x ∈ E, sup q(Ti (x)) < +∞
i∈I
alors pour tout q ∈ Q et tout k, il existe C ≥ 0, J ∈ N∗ et p1 , . . . , pJ ∈ PkJ
tels que
∀i ∈ I, ∀x ∈ Ek , q(Ti (x)) ≤ C sup pj (x).
j=1,...,J
29
On notera au passage que sous les hypothèses précédentes
x ∈ E 7→ sup q(Ti (x))
i∈I
est une semi-norme continue sur E (puisqu’elle l’est sur chaque Ek ).
Exercice 1.9 Montrer que les fermés bornés de DK (Ω) sont séquentiellement
compacts et qu’il en est de même dans D(Ω) (propriété de Montel).
Exercice 1.10 (E, T ) limite inductive de la suite d’evtlc (Ek )k , montrer que
B ⊂ E est borné si et seulement s’il existe k tel que B ⊂ Ek et B est borné
dans Ek .
Exercice 1.11 Montrer que D0 (Ω) muni de la topologie faible ∗ est complet.
1.5
Théorèmes de Hahn-Banach
Avant de prouver le Théorème de Hahn-Banach sous sa forme analytique,
procédons à quelques rappels sur les ensembles ordonnés. Soit A un ensemble
non vide muni d’un ordre (partiel) 4. Un élément m de A est dit maximal si
{x ∈ A : m 4 x} = {m}. Une partie B de A est dite totalement ordonnée
si pour tout (x, y) ∈ B 2 on a x 4 y ou y 4 x ; on dit que m ∈ A est un
majorant de B si et seulement si x 4 m pour tout x ∈ B. Enfin, on dit que A
est inductif si toute partie totalement ordonnée de A admet un majorant. Le
lemme de Zorn (que nous admettrons ici, voir [11] pour une démonstration
à partir de l’axiome du choix) s’énonce comme suit.
Lemme 1.8 Tout ensemble ordonné, inductif non vide possède un élément
maximal.
Il va sans dire qu’on peut aussi utiliser le lemme de Zorn sous la forme
suivante : tout ensemble ordonné, inductif décroissant (i.e. telle que toute
partie totalement ordonnée de A admet un minorant) non vide possède un
élément minimal (c’est à dire un élément qui n’a d’autre minorant que luimême).
30
Théorème 1.9 (Hahn-Banach, forme analytique) Soit E un R-ev et p :
E → R vérifiant
p(λx) = λp(x), ∀x ∈ E, ∀λ > 0, p(x + y) ≤ p(x) + p(y), ∀(x, y) ∈ E 2 .
Soit G un sev de E et g une forme linéaire sur G telle que
g(x) ≤ p(x), ∀x ∈ G
alors il existe un forme linéaire f sur E prolongeant g (f (x) = g(x), ∀x ∈ G)
telle que
f (x) ≤ p(x), ∀x ∈ E.
Preuve:
Soit A l’ensemble des couples (H, h) avec H sev de E contenant G, h forme
linéaire sur H prolongeant g et tels que h ≤ p sur H. Evidemment (G, g) ∈ A
ce qui en assure la non vacuité. Munissons A de la relation d’ordre 4 :
(H1 , h1 ) 4 (H2 , h2 ) ⇐⇒ H1 ⊂ H2 et h2 prolonge h1 .
Si (Hi , hi )i∈I est une partie totalement ordonnée de E alors elle admet pour
majorant
H := ∪i∈I Hi , h(x) = hi (x), ∀x ∈ Hi .
Ainsi A est inductif, et possède donc un élément maximal (H, h) en vertu
du Lemme de Zorn rappelé plus haut. Si l’on montre que H = E, la preuve
sera achevée. Supposons au contraire que H 6= E, soit alors x0 ∈ E \ H et
H0 := H ⊕ Rx0 , si l’on arrive à prolonger h en une forme linéaire h0 sur H0
majorée par p, on aura la contradiction souhaitée à la maximalité de (H, h).
Tout prolongement h0 de h à H0 est de la forme
h0 (x + tx0 ) = h(x) + tα, ∀(x, t) ∈ H × R
pour un certain α ∈ R. Si bien que h0 ≤ p sur H0 si et seulement si
h(x) + tα ≤ p(x + tx0 ), ∀t ∈ R, ∀x ∈ H
ce qui par homogénéité revient à
h(x) + α ≤ p(x + x0 ), et h(x) − α ≤ p(x − x0 ), ∀x ∈ H
(1.4)
sup{h(x) − p(x − x0 )} ≤ α ≤ inf {p(y + x0 ) − h(y)}.
(1.5)
ou encore
x∈H
x∈H
31
Or si (x, y) ∈ H 2 on a
h(x + y) = h(x) + h(y) ≤ p(x + y) ≤ p(x − x0 ) + p(y + x0 )
et donc
sup{h(x) − p(x − x0 )} ≤ inf {p(y + x0 ) − h(y)}
x∈H
x∈H
ainsi on peut choisir α vérifiant (1.5), ce qui achève la preuve.
2
On déduit immédiatement du Théorème de Hahn-Banach, quelques conséquences utiles comme le prolongement de formes linéaires continues dans
les evn. Rappelons que si E est un evn, on munit canoniquement son dual
topologique E 0 de le norme duale :
kf kE 0 := sup{|f (x)|, x ∈ E, kxk ≤ 1}
qui fait de E 0 un espace de Banach.
Corollaire 1.1 Soit E un evn, G un sev de E et g ∈ G0 , il existe f ∈ E 0 ,
prolongeant g et telle que
kf kE 0 = kgkG0 .
Preuve:
On applique le Théorème 1.9 avec p(x) := kgkG0 kxk. 2
Corollaire 1.2 Soit E un evn et x0 ∈ E il existe f ∈ E 0 tel que kf kE 0 = 1
et f (x0 ) = kx0 k. On a donc pour tout x ∈ E,
kxk = max{f (x), f ∈ E 0 , kf kE 0 ≤ 1}.
Preuve:
On applique le corollaire 1.1 avec G = Rx0 , g(tx0 ) = tkx0 k pour tout t ∈ R
si bien que kgkG0 = 1. La deuxième assertion s’en déduit immédiatement.
2
On déduit trivialement de ce corollaire :
Corollaire 1.3 Soit E un evn, la topologie faible σ(E, E 0 ) est séparée.
On s’intéresse maintenat aux formes géométriques du théorème de HahnBanach ou théorèmes de séparation des convexes. Expliquons ce que nous
entendons par le terme de ”séparation” : on dit que deux parties A et B de
32
l’evt E sont séparées (au sens large) par l’hyperplan affine fermé H = {f =
α} (avec f ∈ E 0 \ {0}) si
f (x) ≤ α, ∀x ∈ A, et f (y) ≥ α ∀y ∈ B
ce qui exprime géométriquement le fait que A et B se situent ”de part et
d’autre” de H. On parle de séparation stricte si il existe ε > 0 tel que
f (x) ≤ α − ε, ∀x ∈ A, et f (y) ≥ α ∀y ∈ B.
Par la suite on appellera demi-espace fermé tout ensemble de la forme {f ≥
α} = {x ∈ E : f (x) ≥ α} avec f ∈ E 0 \ {0} et α ∈ R.
On commence par le cas d’un point et d’un convexe ouvert ne contenant
pas ce point (et ce, dans le cadre d’un evt général) :
Lemme 1.9 Soit E un evt, C un ouvert convexe non vide et x0 ∈
/ C alors il
existe f ∈ E 0 tel que f (x) < f (x0 ) pour tout x ∈ C. En particulier l’hyperplan
{f = f (x0 )} sépare {x0 } et C au sens large.
Preuve:
Quitte à effectuer une translation nous pouvons supposer que 0 ∈ C si bien
que C est un voisinage ouvert de 0 et nous en notons jC la jauge. Posons
G = Rx0 et g(tx0 ) = t pour tout t ∈ R. Comme x0 ∈
/ C, on a jC (x0 ) ≥ 1 =
g(x0 ) et par homogénéité on a donc jC (tx0 ) ≥ g(tx0 ) pour tout t ≥ 0, cette
dernière inégalité étant évidemment satisfaite pour les t < 0 ainsi g ≤ jC sur
G. Par le Théorème de Hahn-Banach 1.9, il existe f ∈ E ∗ telle que f ≤ jC sur
E et f = g sur G. Si x ∈ C on a alors f (x) ≤ jC (x) < 1 = f (x0 ). Il ne nous
reste donc qu’à montrer que f est continue. Or si x appartient au voisinage
ouvert de 0, C ∩ (−C) on a f (x) ≤ jC (x) < 1 et f (−x) ≤ jC (−x) < 1 de
sorte que |f | ≤ 1 sur C ∩ (−C). 2
Théorème 1.10 (Hahn-Banach, première forme géométrique) Soit E, un
evt, A et B deux convexes non vides disjoints de E, A étant ouvert alors il
existe un hyperplan fermé qui sépare A et B au sens large.
Preuve:
On remarque que A − B est convexe et ouvert car A − B = ∪b∈B (A − b) et
que 0 ∈
/ (A − B). Ainsi il résulte du lemme 1.9 qu’il existe f ∈ E 0 telle que
f (a) − f (b) < f (0) = 0, ∀(a, b) ∈ A × B
Ceci implique que f 6= 0 et
sup{f (a), a ∈ A} ≤ inf{f (b), b ∈ B}
33
de sorte que {f = α} sépare A de B au sens large pour tout α compris entre
les deux membres de l’inégalité précédente.
2
Pour la séparation stricte, on a le théorème suivant (bien noter la différence
dans les hypothèses) :
Théorème 1.11 (Hahn-Banach, deuxième forme géométrique) Soit E, un
evtlc, A et B deux convexes non vides disjoints de E, A étant compact et
B étant fermé alors il existe un hyperplan fermé qui sépare A et B au sens
strict.
Preuve:
Comme B est fermé et A ⊂ E \ B pour tout a ∈ A, il existe Ua voisinage
ouvert convexe de 0 tel que (a+Ua )∩B = ∅ et par continuité de (x, y) 7→ x+y
en (0, 0), il existe Va voisinage ouvert convexe de 0 tel que Va + Va ⊂ Ua .
Puisque A est compact il existe n et a1 , ..., an dans A tels que A ⊂ ∪ni=1 (ai +
Vai ). Soit maintenant V := ∩ni=1 Vai et x ∈ (A + V ), alors il existe un i tel que
x ∈ ai + Vai + V ⊂ ai + Vai + Vai ⊂ E \ B et donc (A + V ) ∩ B = ∅. Comme
A + V est un ouvert convexe disjoint de B, d’aprés le théorème 1.11, il existe
f ∈ E 0 \ {0} telle que
f (a) + f (v) ≤ f (b), ∀(a, b, v) ∈ A × B × V.
Comme V est absorbant et f 6= 0 il existe v ∈ V telle que f (v) > 0, ce qui
achève la preuve.
2
On en déduit :
Corollaire 1.4 Soit E un evtlcs alors la topologie faible σ(E, E 0 ) est séparée.
Preuve:
Comme la topologie de E est séparée, les points sont fermés, ils sont également
compacts, on peut donc les séparer strictement par un hyperplan fermé, ce
qui prouve que la topologie faible σ(E, E 0 ) est séparée.
2
Une seconde application immédiate nous est fournie par le
Corollaire 1.5 Soit E un evtlc alors tout convexe fermé C de E est l’intersection des demi-espaces fermés le contenant. En particulier, tout convexe
fermé C de E est intersection de demi-espaces fermés.
34
Preuve:
Le cas où C est vide est évident. Supposons C non vide et appelons C 0
l’intersection des demi-espaces fermés contenant C. S’il existe x ∈ C 0 \ C, en
vertu du théorème 1.11 (appliqué au convexe fermé C et au convexe compact
{x}), il existe un demi-espace fermé contenant C et non x ce qui contredit
x ∈ C 0.
2
Le théorème 1.11 peut s’avérer très utile pour montrer qu’un sev est
dense :
Corollaire 1.6 Soit E un evtlc et F un sev de E si F 6= E il existe f ∈
E 0 \ {0} telle que f ≡ 0 sur F .
Preuve:
Si x ∈ E et x ∈
/ F , le théorème 1.11 appliqué à {x} et F fournit l’existence
0
d’un f ∈ E \ {0} et d’un α ∈ R tels que f (x) < α ≤ f (y), pour tout y ∈ F ,
ceci implique que f ≡ 0 sur F .
2
Ainsi pour montrer qu’un sev F est dense dans E il suffit de montrer que
toute forme linéaire continue sur E nulle sur F est identiquement nulle sur
E.
Avant d’énoncer et démontrer le théorème de Krein-Milman comme conséquence du théorème 1.11, définissons la notion de point extrémal
Définition 1.11 Soit E un ev, C un convexe de E et x ∈ C, on dit que x
est un point extrémal de C si et seulement s’il vérifie :
∀(t, y, z) ∈]0, 1[×C × C, x = ty + (1 − t)z ⇒ y = z.
On note ext(C) l’ensemble des points extrémaux de C.
Il s’agit d’une notion purement géométrique, on vérifie sans peine que les
points extrémaux de la boule euclidienne de Rd forment la sphère, que les
points extrémaux d’un pavé de Rd sont ses sommets etc... On notera aussi
que x est un point extrémal de C est équivalent à dire que C \{x} est convexe.
Proposition 1.8 Soit E un evtlcs et C un convexe compact de E alors
ext(C) 6= ∅.
Preuve:
Soit A l’ensemble des fermés non vides de C, F tels que pour tout (x, y) ∈ C×
C, si ]x, y[∩F 6= ∅ alors ]x, y[⊂ F . Comme C ∈ A, A 6= ∅, par ailleurs, il est
35
clair que toute intersection non vide d’éléments de A est encore dans A, enfin
dire que x ∈ ext(C) revient à dire que {x} ∈ A. Pour montrer que ext(C) 6= ∅
nous allons montrer (en utilisant le lemme de Zorn) que A admet un élément
minimal pour l’inclusion et que ce dernier est nécessairement réduit à un
singleton. Montrons d’abord que A est inductif décroissant pour l’inclusion
(c’est à dire que toute partie totalement ordonnée de A possède un minorant).
Soit donc (Fi )i∈I une partie totalement ordonnée de A, F := ∩i∈I Fi , pour
montrer que F est un minorant de (Fi )i∈I , il nous suffit de montrer que F 6= ∅
mais si F était vide, par compacité de C une intersection finie de Fi serait
vide, ce qui comme la famille est ordonnée, impliquerait que l’un des Fi soit
vide contredisant ainsi le fait que chaque Fi est dans A. Le lemme de Zorn
permet de conclure à l’existence d’un élément minimal F de A.
Il s’agit maintenant de montrer que F est un singleton, si tel n’était
pas le cas il existerait x et y distincts dans F . E étant un evtlcs il existe un
voisinage ouvert convexe de y ne contenant pas x et donc, avec le lemme 1.9 il
existe f ∈ E 0 telle que f (x) < f (y) en particulier f n’est pas constante sur F .
Posons α := minF f et G := F ∩{f = α} (fermé non vide par compacité de F
et continuité de f ) comme G est inclus strictement dans F , si nous montrons
que G ∈ A, nous aurons la contradiction recherchée à la minimalité de F .
Soit donc x et y dans C et t ∈]0, 1[ tels que z = tx + (1 − t)y ∈ G comme
G ⊂ F ∈ A, comme F est fermé, x et y apartiennent à F donc en particulier
f (x) ≥ α et f (y) ≥ α et comme f (z) = α on en déduit que ces inégalités
sont en fait des égalités et donc x et y sont dans G, par convexité de G, on
en déduit que G ∈ A.
2
En notant co(A) l’enveloppe convexe fermée d’une partie A de E, i.e. le
plus petit convexe fermé contenant A, on a :
Théorème 1.12 (Krein-Milman) Soit E un evtlcs et C un convexe compact
de E alors C = co(ext(C)).
Preuve:
Posons C 0 = co(ext(C)), il est clair que C 0 ⊂ C. Pour l’inclusion inverse,
supposons par l’absurde qu’il existe x ∈ C \ C 0 , en utilisant le Théorème
1.11, il existe f ∈ E 0 tel que
f (x) > max0 f (y)
y∈C
si bien qu’en particulier
α := max f (z) > max0 f (y)
z∈C
y∈C
36
(1.6)
En appliquant la proposition 1.8, l’ensemble convexe compact Cα = {z ∈
C : f (z) = α} possède au moins un point extrémal z dont on vérifie facilement qu’il est aussi un point extrémal de C, ce qui contredit (1.6).
2
Notons que si f est une forme linéaire continue (ou plus généralement
une fonction concave sci) sur le convexe compact C alors elle atteint son
minimum en au moins un point extrémal de C. Cette remarque est à la base
de la programmation linéaire et prend tout son sens lorsque C a peu de points
extrémaux et notamment quand elle en a un nombre fini comme c’est le cas
des polyèdres convexes, dans ce cas il suffit de déterminer et explorer (si
possible intelligemment) l’ensemble des points extrémaux de C (algorithme
du simplexe etc...).
Exercice 1.12 Soit E un evn séparable (i.e. admettant une famille dénombrable
dense) montrer qu’il existe une famille dénombrable de formes linéaires continues séparant les points de E. En déduire une preuve de la proposition 1.8
n’utilisant pas le lemme de Zorn.
Exercice 1.13 Soit C un convexe (quelconque) de Rd et x ∈
/ C, montrer
que l’on peut séparer au sens large x de C. Trouver un contre-exemple en
dimension infinie.
Exercice 1.14 (Birkhoff ) Soit A ∈ Mn (R), on dit que A est bistochastique,
si ses coefficients sont positifs et que la somme de ses coefficients sur chaque
ligne et chaque colonne est 1. Montrer que les matrices bistochastiques sont
les combinaisons convexes des matrices de permutation.
Exercice 1.15 Dans le cas d’un espace de Hilbert, donner une preuve élémentaire du Théorème 1.11 à partir du théorème de projection sur un convexe
fermé.
Exercice 1.16 Soit l1 := l1 (N) muni de sa structure usuelle d’espace de
Banach. Montrer que (l1 )0 = l∞ . Montrer que si une suite converge faiblement dans l1 alors elle converge fortement (Schur). Montrer que l’application identité (l1 , σ(l1 , l∞ )) → (l1 , k.kl1 ) est séquentiellement continue mais
pas continue et conclure.
37
Chapitre 2
Introduction à la théorie des
distributions
Une des idées de base de la théorie des distributions est de ne pas voir une
fonction f (disons L1loc (Rd )) ”ponctuellement” mais à partir de son action sur
des fonctions-test c’est à dire à travers les quantités
Z
f (x)ϕ(x)dx, ϕ ∈ D(Rd ).
Rd
Un des intérêts de ce point de vue est que par dualité-ou transpositionon va en fait faire porter un certain nombre d’opérations (la dérivation en
particulier) sur les fonctions-test et non sur f a priori trop peu régulière
pour que ces opérations puissent lui être licitement directement appliquées.
Le choix de D(Rd ) comme espace de fonctions-test est assez naturel (mais
d’autres peuvent aussi être judicieux) : on peut dériver licitement autant
qu’on veut, intégrer autant qu’on veut ces dérivées et les termes de bord
dans les intégrations par parties seront nuls. On disposera donc d’un cadre
très général dans lequel on pourra dériver ”au sens des distributions” des
objets relativement pathologiques comme des mesures.
Nous verrons dans ce chapitre un certain nombre d’opérations naturelles
(dérivation, multiplication, convolution, transformée de Fourier) sur les distributions et comment elles permettent de résoudre certaines équations aux
dérivées partielles. Néanmoins, toutes ces opérations (et donc les EDP’s que
nous verrons dans ce chapitre) sont linéaires et cela est dans la nature des
choses : la théorie des distributions permet-entre autres choses- de donner un
sens aux dérivées d’une masse de Dirac mais pas à son carré ou son exponentielle....
38
2.1
Quelques résultats préliminaires
On se propose de regrouper dans ce paragraphe divers résultats classiques
d’approximation (régularisation par convolution, troncature) et d’établir quelques
formules d’intégration par parties qui nous seront utiles par la suite. Dans
tout ce qui suit, Ω désigne un ouvert de Rd et les fonctions en jeu dans ce
chapitre seront à valeurs dans R ou dans C. On commence par le classique
lemme de densité, vu dans le cours d’Intégration :
Lemme 2.1 Cc (Ω) est dense dans L1 (Ω).
Pour f ∈ L1 (Rd ) et g dans L1 (Rd ) on définit la convolution de f et g par
Z
(f ? g)(x) :=
f (x − y)g(y)dy, ∀x ∈ Rd
Rd
on vérifie sans peine que f ? g = g ? f , que f ? g ∈ L1 (Rd ) et que
kf ? gkL1 ≤ kf kL1 kgkL1 .
Il est clair par ailleurs que la définition précédente de f ? g fait sens dès que
y 7→ f (x − y)g(y) est L1 pour presque tout x, on peut donc en particulier
définir f ? g pour f ∈ L1 à support compact (i.e. nulle p.p. en dehors d’un
compact) et g ∈ L1loc . Pour f ∈ L1 (Rd ) et g ∈ Lp (Rd ) on a :
Lemme 2.2 Soit f ∈ L1 (Rd ) et g ∈ Lp (Rd ) (1 ≤ p ≤ ∞) alors pour presque
tout x ∈ Rd , y 7→ f (x − y)g(y) est L1 , f ? g ∈ Lp (Rd ) avec
kf ? gkLp ≤ kf kL1 kgkLp .
Preuve:
Le résultat est évident pour p = ∞ et p = 1. On supposera donc que p ∈]1, ∞[
et on note p∗ l’exposant conjugué de p (i.e. p∗ = p/(p−1)). Puisque |g|p ∈ L1 ,
on déduit du cas L1 que pour presque tout x on a y 7→ |f (x−y)|1/p |g(y)| ∈ Lp ,
∗
∗
comme y 7→ |f (x − y)|1/p est Lp , on déduit de l’inégalité de Hölder que
y 7→ |f (x − y)g(y)| est L1 pour presque tout x avec :
Z
∗
1/p∗
|f ? g|(x) ≤
|f (x − y)|1/p |f (x − y)|1/p |g(y)|dy ≤ kf kL1 (|f | ? |g|p )1/p (x).
Rd
Puisque |f | ? |g|p ∈ L1 avec k|f | ? |g|p kL1 ≤ kf kL1 kgkpLp , on en déduit
immédiatement que f ? g ∈ Lp avec kf ? gkLp ≤ kf kL1 kgkLp . 2
39
Exercice 2.1 Montrer que S ? S ⊂ S.
Le support d’une fonction Lp étant par définition le complémentaire du
plus grand ouvert sur lequel cette fonction s’annule presque partout alors, on
vérifie facilement que pour f ∈ L1 (Rd ) et g ∈ Lp (Rd ), on a :
supp(f ? g) ⊂ supp(f ) + supp(g).
Ainsi, en particulier si f et g sont à support compact, alors f ? g aussi avec
supp(f ? g) ⊂ supp(f ) + supp(g).
R
Soit ρ ∈ C ∞ (Rd ) tel que Rd ρ = 1, ρ ≥ 0 et supp(ρ) ⊂ B(0, 1). Un
exemple typique de fonction vérifiant ces conditions étant :
(
1
|x|2 −1
Ce
si
|x| < 1
ρ(x) =
0
sinon.
R
avec C constante choisie de sorte que Rd ρ = 1. Pour ε > 0, on définit alors ρε
par ρε (x) = ε−d ρ(ε−1 x), ∀x ∈ Rd . On appelle (ρε )ε > 0 famille régularisante
(mollifying en anglais), cette terminologie étant justifiée par le fait que si
f ∈ L1 , ρε ? f est C ∞ (et à support compact si f l’est) avec
∂ β (ρε ? f ) = (∂ β ρε ) ? f, ∀β ∈ Nd .
Lemme 2.3 D(Ω) est dense dans L1 (Ω).
Preuve:
Soit f ∈ L1 et ε > 0, il existe fε ∈ Cc (Ω) tel que kf − fε kL1 ≤ ε/2. Soit
(ρδ )δ une suite régularisante, pour δ < dist(supp(fε ), Rd \ Ω)), ρδ ? fε est
correctement définie et appartient à D(Ω). Il est aisé de déduire de l’uniforme
continuité de fε que pour δ assez petit on a kρδ ? fε − fε kL1 ≤ ε/2 ce qui
achève la preuve. 2
L’approximation de f par ρε ? f s’appelle régularisation par convolution
ou par noyau régularisant. Notons que dans certains cas, on peut souhaiter
approcher f non pas par des fonctions de D(Rd ) comme précedemment mais
par des fonctions analytiques, on peut alors procéder par convolution en
considérant ρε ? f avec (par exemple) ρε gaussienne centrée de variance ε2 id.
Il faut retenir le procédé de régularisation par convolution qui permet
d’approcher des fonctions à support compact par des fonctions C ∞ à support compact. Un autre procédé important dans les applications est celui de
40
troncature qui permet d’approcher une fonction par une fonction à support
compact. Ce procédé consiste à approcher f ∈ L1 (Ω) (par exemple) par ηn f
avec ηn une fonction plateau (ou cut-off ) c’est-à dire une fonction continue
comprise entre 0 et 1 valant 1 sur Kn et 0 sur Ω \ Kn+1 (avec Kn une suite
exhaustive de compacts de Ω). L’existence de telles fonctions-plateau résulte
du lemme d’Urysohn et l’on peut bien sûr les choisir C ∞ par régularisation
par convolution.
Lemme 2.4 (Partition de l’unité) Soit Γ un compact de Rd et U1 , . . . Uk
un recouvrement ouvert de Γ, il existe des fonctions C ∞ à support
compact
P
θ1 , . . . , θk vérifiant supp(θi ) ⊂ Ui , 0 ≤ θi ≤ 1, i = 1, . . . , k et ki=1 θi = 1 sur
un voisinage de Γ (on appelle alors θ1 , . . . , θk partition de l’unité subordonnée
au recouvrement U1 , . . . Uk ) .
Le lemme précédent est classique et peut se démontrer par récurrence sur
k, on en laisse la démonstration au lecteur.
Exercice 2.2 Ce qui suit est évident mais il est essentiel de l’avoir en tête
pour comprendre les dérivées au sens des distributions. Soit ϕ ∈ Cc1 (Rd )
montrer que
Z
∇ϕ = 0.
Rd
Soit ϕ et ψ sont dans C 1 (Rd ) avec ϕ à support compact montrer que
Z
Z
∂i ϕ ψ = −
ϕ ∂i ψ, i = 1, . . . , d.
Rd
Rd
Soit Ω un ouvert de Rd , et k ∈ N∗ , on dira que Ω est un ouvert de classe
C k s’il existe Φ ∈ C k (Rd , R) tel que
Ω = {x ∈ Rd : Φ(x) < 0}, ∂Ω = {x ∈ Rd : Φ(x) = 0}
(2.1)
∇Φ(x) 6= 0, ∀x ∈ ∂Ω.
(2.2)
et
Pour tout x ∈ ∂Ω, on définit alors la normale extérieure à ∂Ω en x par
n(x) :=
∇Φ(x)
.
|∇Φ(x)|
La mesure de surface σ sur ∂Ω est alors construite de la manière suivante.
d−1
Soit x0 ∈ ∂Ω et ed := n(x0 ), on identifie l’hyperplan e⊥
et on note
d à R
41
x ∈ Rd sous la forme x = (x0 , xd ) avec xd = x · ed et x0 les coordonnées
de la projection orthogonale de x dans une base orthonormée de e⊥
d . On a
alors ∂d Φ(x0 ) = ∇Φ(x0 ) · ed = 1 et donc il résulte du théorème de l’inversion
locale qu’il existe U un ouvert de Rd contenant x0 , Q0 un ouvert de Rd−1
contenant x00 et ε > 0 tels que x 7→ (x0 , Φ(x)) soit un C 1 -difféormorphisme
de U sur Q0 ×]−ε, ε[. On note l’inverse de ce C 1 -difféomorphisme sous la forme
(x0 , t) ∈ Q0 ×] − ε, ε[7→ (x0 , g(x0 , t)) et g0 (x0 ) := g(x0 , 0) pour tout x0 ∈ Q0 , de
sorte que l’on a
{Φ = t} ∩ U = {(x0 , g(x0 , t)), x0 ∈ Q0 }, ∀t ∈] − ε, ε[
(2.3)
Ω ∩ U = {(x0 , g(x0 , t)), x0 ∈ Q0 , t ∈] − ε, 0[}.
(2.4)
∂Ω ∩ U = {(x0 , g0 (x0 )), x0 ∈ Q0 }.
(2.5)
et donc
et
Pour f ∈ Cc (U ), on pose alors
Z
Z
p
f (x0 , g0 (x0 )) 1 + |∇g0 (x0 )|2 dx0 .
f (x)dσ(x) :=
(2.6)
Q0
∂Ω
Pour f ∈ Cc (Rd ), on recouvre ∂Ω ∩ supp(f ) par un nombre fini d’ouverts Uj
sur chacun desquels ∂Ω se représente comme un graphe sous la forme (2.3),
et on note θj une partition de l’unité subordonnée au recouvrement
par les
R
Uj . Comme chaque terme θj f est à support dans Uj , on définit ∂Ω θj f dσ de
manière analogue à (2.6), et on pose enfin
Z
XZ
f dσ =
θj f dσ.
∂Ω
j
∂Ω
A ce stade, le fait que cette définition ne dépende pas du choix des Uj , des
paramétrisations locales gj et de la partition de l’unité n’est pas totalement
clair. Cela résulte en particulier du résultat suivant :
Lemme 2.5 (Mesure de surface sur le bord d’un ouvert régulier comme
dérivée d’une intégrale de volume) Soit Ω un ouvert de classe C 1 , Φ et la
mesure de surface σ définies comme précédemment et f ∈ Cc (Rd ), on a
alors
Z
Z
1
|∇Φ(x)|f (x)dx
f (x)dσ(x) = lim+
δ→0 δ Ω
∂Ω
δ
où
Ωδ := {x ∈ Ω : Φ(x) > −δ}.
42
Preuve:
On peut supposer sans perte de généralité que supp(f ) ⊂ U où U est un
ouvert tel que U ∩ {Φ = t} soit de la forme donnée par (2.3) pour tout
t ∈]−ε, ε[. Pour δ < ε on a alors Ωδ ∩U = {(x0 , g(x0 , t)), x0 ∈ Q0 , t ∈]−δ, 0[}.
En notant que le Jacobien du changement de variables (x0 , t) 7→ (x0 , g(x0 , t))
est ∂t g(x0 , t), il vient donc
Z
Z 0Z
|∇Φ(x)|f (x)dx =
|∇Φ(x0 , g(x0 , t))|f (x0 , g(x0 , t))|∂t g(x0 , t)|dx0 dt.
Ωδ
−δ
Q0
(2.7)
Par construction on a Φ(x0 , g(x0 , t)) = t, pour tout (x0 , t) ∈ Q0 ×] − ε, ε[, en
dérivant cette relation par rapport à t et à x0 on a en particulier
∂d Φ(x0 , g(x0 , t))∂t g(x0 , t) = 1, ∇x0 Φ(x0 , g(x0 , t)) = −∂d Φ(x0 , g(x0 , t))∇x0 g(x0 , t).
(2.8)
On en déduit alors que
|∇Φ(x0 , g(x0 , t))|2 = |∂d Φ(x0 , g(x0 , t))|2 + |∇x0 Φ(x0 , g(x0 , t))|2
= |∂d Φ(x0 , g(x0 , t))|2 1 + |∇x0 g(x0 , t)|2
.
1 + |∇x0 g(x0 , t)|2
.
=
|∂t g(x0 , t)|2
En substituant la relation précédente dans (2.7), il vient
Z
Z Z
p
1 0
1
|∇Φ(x)|f (x)dx =
f (x0 , g(x0 , t)) 1 + |∇x0 g(x0 , t)|2 dx0 dt.
δ Ωδ
δ −δ Q0
On conclut aisément à partir de l’expression précédente, en utilisant les
théorèmes de Fubini et de convergence dominée de Lebesgue. 2
On rappelle que la divergence d’un champ de vecteurs ϕ = (ϕ1 , . . . , ϕd ) ∈
C 1 (Rd , Rd ) est par définition donnée par
d
X
∂
ϕi (x) = tr(Dϕ(x)), ∀x ∈ Rd .
div(ϕ(x)) :=
∂x
i
i=1
Notons que si ϕ ∈ Cc1 (Ω, Rd ), alors
Z
div(ϕ) = 0.
Ω
43
Théorème 2.1 (Formule de Stokes) Soit Ω un ouvert de classe C 1 de Rd et
ϕ ∈ Cc1 (Rd , Rd ), on a
Z
Z
div(ϕ) =
ϕ(x) · n(x)dσ(x)
Ω
∂Ω
Preuve:
Notons d’abord que si η ∈ C 1 (Rd , R) et η ≡ 1 sur un voisinage de ∂Ω on a
Z
Z
Z
div(ϕ) =
div(ηϕ) =
η div(ϕ) + ∇η · ϕ
Ω
Ω
Ω
car (η − 1)ϕ|Ω est à support compact dans Ω.
Soit maintenant pour ε > 0 et δ > 0, ηε,δ = fδ (ε−1 Φ) avec fδ = ρδ/2 ? gδ
et gδ paire, à support dans [−1, 1], valant 1 sur [−δ, δ] et affine entre δ et 1.
On a donc
Z
Z
ηε,δ div(ϕ) + ∇ηε,δ · ϕ.
div(ϕ) =
Ω
Ω
Le théorème de convergence dominée implique que le premier terme dans le
membre de droite de l’égalité précédente tend vers 0 quand ε → 0+ (et ce
uniformément en δ ∈ [0, δ0 ], δ0 > 0). Quant au second terme, il se réecrit
sous la forme :
Z
1
f˙δ (ε−1 Φ)∇Φ · ϕ.
ε Ωε(1+δ/2)
Pour ε > 0 assez petit, il est facile de voir que {Φ = −ε} ∩ supp(ϕ) est de
mesure nulle, ainsi, pour un tel ε, en appliquant à nouveau le théorème de
convergence dominée, la quantité précédente converge quand δ → 0+ vers
Z
1
∇Φ · ϕ.
ε Ωε
En vertu du lemme 2.5, on a enfin
Z
Z
Z
1
∇Φ
lim
∇Φ · ϕ =
· ϕdσ =
ϕ · ndσ
ε→0+ ε Ωε
∂Ω |∇Φ|
∂Ω
ce qui achève la preuve.
2
Mentionnons maintenant quelques formules d’intégration par parties, corollaires immédiats de la formule de Stokes. Pour u et v dans Cc1 (Rd , R), et
i = 1, . . . , d, on a d’abord la formule d’intégration par parties
Z
Z
Z
u ∂i v = − ∂i u v +
uv ni dσ.
(2.9)
Ω
Ω
∂Ω
44
Pour ϕ ∈ Cc1 (Rd , Rd ) et u ∈ Cc1 (Rd , R), en utilisant div(uϕ) = u div(ϕ) +
∇u · ϕ, on obtient
Z
Z
Z
u div(ϕ) = − ∇u · ϕ +
u ϕ · ndσ.
(2.10)
Ω
Ω
∂Ω
En particulier, lorsque ϕ = ∇v avec v ∈ Cc2 (Rd , R), et en rappelant que
∆v := div(∇v) et que ∂v/∂n := ∇v · n, on obtient les formules de Green :
Z
Z
Z
∂v
∇v · ∇u = − ∆v u +
u dσ,
(2.11)
Ω
Ω
∂Ω ∂n
et
Z
Z
∆v u =
Ω
2.2
Z
∆u v +
Ω
∂Ω
∂v
∂u
u
−v
∂n
∂n
dσ.
(2.12)
Définitions et propriétés premières des
distributions
Définition 2.1 On appelle distribution sur Ω toute forme linéaire continue
sur l’espace des fonctions-test D(Ω) (muni de sa topologie usuelle telle que
définie au chapitre précédent) et l’on note D0 (Ω) l’ensemble des distributions
sur Ω.
Pour T forme linéaire sur D(Ω) et ϕ ∈ D(Ω), on notera désormais hT, ϕi
plutôt que T (ϕ).
Au risque de nous répéter, rappelons que les résultats du chapitre précédent,
impliquent en particulier que si T est une forme linéaire sur D(Ω) on a les
équivalences entre :
– T ∈ D0 (Ω) (T est une distribution sur Ω),
– pour tout compact K ⊂ Ω il existe m ∈ N et C ≥ 0 tels que
| hT, ϕi | ≤ C pm,K (ϕ)
= C sup{|∂ α ϕ(x)|, x ∈ K, α ∈ Nd , |α| ≤ m},
∀ϕ ∈ D(Ω) : supp(ϕ) ⊂ K,
– T est séquentiellement continue sur D(Ω) : i.e. si ϕn → ϕ dans D(Ω)
(ce qui rappelons le signifie qu’il existe un compact K tel que pour tout
n, ϕn et ϕ soient à support dans K et ∂ α ϕn converge uniformément
vers ∂ α ϕ pour tout α ∈ Nd ) alors hT, ϕn i → hT, ϕi.
– T est séquentiellement continue en 0,
45
– pour tout compact K ⊂ Ω, la restriction de T à DK (Ω) est continue.
On munit D0 (Ω) de la topologie faible-∗, i.e. de la topologie d’evtlcs associée à la famille de semi-normes T 7→ | hT, ϕi | pour ϕ ∈ D(Ω). On dira
qu’une suite (Tn )n de distributions sur Ω converge au sens des distributions
vers T ∈ D0 (Ω) (ce que l’on notera simplement Tn → T dans D0 (Ω)) si
hTn , ϕi → hT, ϕi, ∀ϕ ∈ D(Ω).
Exemples
Soit f ∈ L1loc (Ω) alors f définit une distribution {f } via :
Z
f ϕ, ∀ϕ ∈ D(Ω).
h{f }, ϕi :=
Ω
Soit a ∈ Ω, on appelle masse de Dirac en a et l’on note δa la distribution
définie par hδa , ϕi := ϕ(a),P∀ϕ ∈ D(Ω). De même pour α ∈ Nd , ϕ 7→ ∂ α ϕ(a)
(j)
est une distribution ; ϕ 7→ ∞
j=0 ϕ (j) est une distribution sur R... On notera
aussi que si (ρε )ε est une famille régularisante, alors {ρε } → δ0 quand ε → 0
dans D0 (Rd ).
(Valeur principale de 1/x) Pour ϕ ∈ D(R),
Z
ϕ(x)
dx
x
|x|>ε
admet une limite quand ε → 0, que l’on note hVP(1/x), ϕi ; VP(1/x) est une
distribution sur R appelée valeur principale de 1/x.
Comme D(Ω) s’injecte continûment dans E(Ω) = C ∞ (Ω), les éléments de
E 0 (Ω) définissent (par restriction à D(Ω)) des distributions sur Ω appelées distribution à support compact (cette terminologie sera justifiée ultérieurement).
Rappelons ici qu’une forme linéaire T sur E(Ω) appartient à E 0 (Ω) si et seulement s’il existe un compact K de Ω, m ∈ N et C ≥ 0 tels que
| hT, ϕi | ≤ Cpm,K (ϕ) = C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ E(Ω).
x∈K |α|≤m
De la même manière, les éléments de S 0 (dual topologique de l’espace de
Schwartz S) sont des distributions sur Rd appelées distributions tempérées
(cadre naturel comme nous le verrons plus loin pour la transformation de
Fourier). Par définition même, une forme linéaire T sur S appartient à S 0 si
et seulement s’il existe m et k dans N et C ≥ 0 tels que
| hT, ϕi | ≤ C sup sup (1 + |x|k )|∂ α ϕ(x)|, ∀ϕ ∈ S.
x∈Rd |α|≤m
Par exemple VP(1/x) est une distribution tempérée sur R.
46
Enfin, pour m ∈ N, les (restrictions à D(Ω) des) éléments de (Ccm (Ω))0
sont appelées distributions d’ordre au plus m (les distributions d’ordre 0
étant appelées mesures de Radon sur Ω, le terme ”mesure” sera justifié et
explicité au chapitre 6). Une forme linéaire T sur Ccm (Ω) (muni comme au
m
chapitre 1 de sa topologie, limite inductive des CK
(Ω)) est continue si pour
j
tout compact K ⊂ Ω il existe C ≥ 0 telle que
| hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ Ccm (Ω) : supp(ϕ) ⊂ K.
x∈K |α|≤m
Lemme 2.6 Soit (ϕn )n ∈ D(Ω)N , Tn ∈ D0 (Ω)N , ϕ ∈ D(Ω) et T ∈ D0 (Ω) tels
que ϕn → ϕ dans D(Ω) et Tn → T dans D0 (Ω) alors hTn , ϕn i → hT, ϕi.
Preuve:
On écrit hTn , ϕn i−hT, ϕi = hTn − T, ϕi+hTn , ϕn − ϕi, le premier terme tend
vers 0 par convergence de Tn vers T et le second aussi en vertu du Théorème
de Banach-Steinhaus (sous la forme de la proposition 1.7). 2
Lemme 2.7 Soit f ∈ L1loc (Ω) alors {f } = 0 dans D0 (Ω) si et seulement si
f = 0 p.p.
Preuve:
Supposons {f } = 0 dans D0 (Ω) et soit K un compact de Ω. Soit ε > 0 avec
ε < d(K, Rd \ Ω) et fε := ρε ? (χK f /(|f | + ε)). Par le théorème de convergence
Rdominée de Lebesgue, en passant à la limite dans h{f }, fε i = 0 on obtient
|f | = 0.
K
2
Définition 2.2 Soit U un ouvert inclus dans Ω, x0 ∈ Ω et T1 et T2 deux
distributions sur Ω. On dit que T1 = T2 sur U si hT1 , ϕi = hT2 , ϕi pour tout
ϕ ∈ D(Ω) telle que supp(ϕ) ⊂ U . On dit que T1 et T2 sont égales au voisinage
de x0 s’il existe un voisinage ouvert de x0 dans Ω sur lequel T1 = T2 .
On a alors :
Lemme 2.8 Soit T1 et T2 deux distributions sur Ω. Si T1 et T2 sont égales
au voisinage de tout point de Ω alors T1 = T2 .
Preuve:
Soit ϕ ∈ D(Ω) et K := supp(ϕ). Il existe alors un nombre fini d’ouverts
U1 , ..., Uk de Ω recouvrant K et tels que T1 = T2 sur chacun des Ui . Soit θi
47
une partition de l’unité subordonnée au recouvrement de K par les Ui , on a
alors
k
X
hT1 − T2 , ϕi =
hT1 − T2 , θi ϕi
i=1
et chacun des termes de la somme précédente est nul car θi ϕ ∈ D(Ω) et
supp(θi ϕ) ⊂ Ui . 2
La réunion de tous les ouverts sur lesquels une distribution est nulle est
ainsi le plus grand ouvert sur lequel cette distribution est nulle. Le support
d’une distribution est alors défini comme suit
Définition 2.3 (Support d’une distribution) Soit T ∈ D0 (Ω) on appelle support de T et l’on note supp(T ) le complémentaire dans Ω du plus grand ouvert
sur lequel T est nulle. On dit que T est à support compact si son support est
compact.
Exemples Si f ∈ L1loc , supp{f } est le complémentaire du plus grand
ouvert sur lequel f = 0 p.p, supp(δa ) = {a}, sur R, supp(VP(1/x) = R...
Le résultat suivant permet d’identifier l’ensemble des distributions à support compact à E 0 (Ω)(= ∪m (C m (Ω)0 )) :
Proposition 2.1 Soit T ∈ E 0 (Ω) alors la restriction de T à D(Ω) est une
distribution à support compact. Réciproquement si T est une distribution à
support compact, alors T se prolonge de manière unique en une forme linéaire
continue sur E(Ω).
Preuve:
Si T ∈ E 0 (Ω) alors il existe un compact K ⊂ Ω, m ∈ N et C ≥ 0 tels que :
| hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ E(Ω)
x∈K |α|≤m
ce qui implique évidemment que supp(T ) ⊂ K.
Réciproquement, soit T une distribution à support compact supp(T ) :=
K. Soit ψ ∈ D(Ω) une fonction plateau valant 1 sur un voisinage de K. Pour
ϕ ∈ E(Ω), posons alors
D
E
Te, ϕ := hT, ψϕi .
En utilisant la formule de Leibniz, il est facile de voir que Te ∈ E 0 (Ω) et par
construction, Te prolonge T à E(Ω). Pour montrer l’unicité de ce prolongement, il suffit de remarquer que D(Ω) est séquentiellement dense dans E(Ω)
(troncature par multiplication par fonction plateau). 2
Passons maintenant à la notion d’ordre d’une distribution :
48
Définition 2.4 (Distributions d’ordre fini) Soit T ∈ D0 (Ω) et m ∈ N, on dit
que T est une distribution d’ordre ≤ m si et seulement si pour tout compact
K ⊂ Ω, il existe une constante C telle que
| hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ D(Ω) supp(ϕ) ⊂ K.
x∈K |α|≤m
Il est clair à partir de la définition précédente que T est une distribution
d’ordre ≤ m si et seulement si T se prolonge continûment à Ccm (Ω) qu’on
identifie souvent l’espace des distributions d’ordre ≤ m à (Ccm (Ω))0 . Rappelons aussi que l’espace des distributions d’ordre 0 (identifié à (Cc0 (Ω))0 ) est
l’espace des mesures de Radon sur Ω. Par définition, les distributions d’ordre
fini sont les distributions d’ordre ≤ m pour un certain m ∈ N. Enfin, on
dit qu’une distribution est d’ordre m si elle est d’ordre ≤ m mais n’est pas
d’ordre ≤ m − 1.
On déduit immédiatement de la proposition 2.1 le résultat suivant :
Proposition 2.2 Toute distribution à support compact est d’ordre fini.
Exemples Si f ∈ L1loc alorsP{f } est d’ordre 0, de même que δa . Sur R,
VP(1/x) est d’ordre 1, et ϕ 7→ j ϕ(j) (j) est d’ordre infini.
Soit ψ ∈ E(Ω), alors l’application ”multiplication par ψ” :
ϕ ∈ D(Ω) 7→ ψϕ
est un endomorphisme continu de D(Ω). On peut donc définir la multiplication d’une distribution et d’une fonction C ∞ par transposition comme suit :
Définition 2.5 Soit ψ ∈ E(Ω) et T ∈ D0 (Ω) on appelle produit de T et ψ et
l’on note ψT la distribution définie par :
hψT, ϕi := hT, ψϕi , ∀ϕ ∈ D(Ω).
On remarque que pour ψ ∈ E(Ω) et T ∈ D0 (Ω) on a supp(ψT ) ⊂
supp(ψ) ∩ supp(T ). En considérant une suite de fonction-plateaux ηn et
Tn = ηn T , il est facile de voir que Tn est une suite de distributions à support
compact convergeant vers T . Ainsi E 0 (Ω) est séquentiellement dense dans
D0 (Ω).
La dérivation des distributions se définit aussi par transposition :
Définition 2.6 (Dérivées d’une distribution) Soit T ∈ D0 (Ω) et α ∈ Nd on
définit la distribution ∂ α T par :
h∂ α T, ϕi := (−1)|α| hT, ∂ α ϕi , ∀ϕ ∈ D(Ω).
49
Il résulte de la définition précédente que si Tn → T dans D0 (Ω) alors ∂ α T →
∂ α T dans D0 (Ω) pour tout α ∈ Nd . On notera ∂i T les dérivées partielles
premières de T , ∇T = (∂1 T, ..., ∂d T ). Notons également que si T est d’ordre
≤ m alors ∂ α T est d’ordre ≤ |α| + m.
L’intérêt de la définition précédente est évident : il permet de dériver les
distributions et donc en particulier les fonctions de L1loc , les mesures etc....
Evidemment si T = {f } avec f ∈ C 1 (Ω) alors ∂i {f } = {∂i f } autrement dit
les dérivées partielles au sens des distributions et au sens classique coı̈ncident
dans ce cas. Il convient de retenir que l’idée dans la définition précédente est
de faire porter les dérivées sur les fonctions-test (nous retrouverons cette idée
quand nous verrons la formulation variationnelle de certains problèmes aux
limites). On peut ainsi chercher à résoudre des EDP’s linéaires dans un espace
beaucoup plus gros (et donc dans lequel on a plus de chance d’effectivement
trouver des solutions) que l’espace des fonctions pour lesquelles les dérivées
intervenant dans l’équation ont un sens classique.
Exemples Soit H la fonction de Heaviside : H(x) = 0 pour x < 0 et
H(x) = 1 pour x ≥ 0, un calcul immédiat donne {H}0 = δ0 . De même la
dérivée de {|x|} est la fonction signe.
Exercice 2.3 Montrer que x 7→ log(|x|) est une distribution tempérée sur
R et que sa dérivée est VP(1/x). Pour ϕ ∈ D(R) on pose :
Z
ϕ(x) − ϕ(0)
1
dx
PF( 2 ), ϕ := lim+
ε→0
x
x2
|x|≥ε
montrer que PF( x12 ) est une distribution (appelée partie finie de 1/x2 ) et que
c’est la dérivée de VP( x1 ). Donner une formule générale pour la dérivée d’une
fonction C 1 par morceaux d’une variable.
On remarquera que supp(∂ α T ) ⊂ supp(T ) et qu’évidemment le théorème
de Schwarz se transpose aux distributions : ∂i (∂j T ) = ∂j (∂j T ). De même la
formule de Leibniz se transpose immédiatement au produit ψT avec ψ ∈ E(Ω)
et T ∈ D0 (Ω) :
X
∂ α (ψT ) =
Cαβ ∂ α−β ψ ∂ β T.
β≤α
On définit alors les espaces de Sobolev (que nous étudierons plus en détail
au chapitre 7) de la manière suivante :
Définition 2.7 Soit p ∈ [1, +∞], on définit l’espace de Sobolev d’ordre 1 :
W 1,p (Ω) := {f ∈ Lp (Ω) : ∂i {f } ∈ Lp , ∀i ∈ {1, ..., d}}
50
pour m ∈ N, m ≥ 1, on définit l’espace de Sobolev d’ordre m
W m,p (Ω) := {f ∈ Lp (Ω) : ∂ α {f } ∈ Lp , ∀α : |α| ≤ m}.
Exercice 2.4 Soit T ∈ E 0 (Ω) une distribution à support compact d’ordre
≤ m et ϕ ∈ E(Ω) telle que ∂ α ϕ = 0 sur supp(T ) pour tout |α| ≤ m. Montrer
que hT, ϕi = 0.
Exercice 2.5 L’objectif de cet exercice est de montrer que toute distribution
à support dans {x} est combinaison linéaire de δx et ses dérivées (utiliser
l’exercice précédent et un développement de Taylor).
2.3
Convolution et régularisation
Dans ce paragraphe, sauf mention explicite du contraire nous nous placerons dans le cas de l’espace Rd tout entier et ce afin de ne pas avoir à
discuter des questions (parfois plus subtiles qu’il n’y parait) des domaines
de définition. Pour ϕ ∈ D(Rd ) on définit ϕ̌ par ϕ̌(x) := ϕ(−x) pour tout
x ∈ Rd . Pour T ∈ D0 (Rd ) on définit alors Ť ∈ D0 (Rd ) (symétrique de T ) par
Ť , ϕ = hT, ϕ̌i , ∀ϕ ∈ D(Rd ).
Evidemment la définition précédente fait aussi sens sur un ouvert symétrique
Ω. Pour h ∈ Rd et ϕ ∈ D(Rd ) on note τh ϕ la translatée de ϕ définie par
τh ϕ(x) := ϕ(x +h), ∀x ∈ Rd . Pour T ∈ D0 (Rd ) on définit alors la distribution
translatée τh T ∈ D0 (Rd ) par
hτh T, ϕi = hT, τ−h ϕi , ∀ϕ ∈ D(Rd ).
Lemme 2.9 Soit ϕ ∈ E(Rd × RN ) telle que tout r > 0 il existe M (r) > 0
tel que supp(ϕ(., y)) ⊂ B d (M (r)) pour tout y ∈ B N (r) et soit T ∈ D0 (Rd ).
L’application y ∈ RN 7→ hT, ϕ(., y)i est de classe C ∞ sur RN et l’on a
∂ α (hT, ϕ(., y)i) = T, ∂yα ϕ(., y) , ∀α ∈ NN , ∀y ∈ RN .
51
Preuve:
Posons pour tout y ∈ RN G(y) := hT, ϕ(., y)i. Soit h ∈ Rd et t ∈ R 6=
0, on a alors t−1 (G(y + th) − G(y)) = hT, t−1 (ϕ(., y + th) − ϕ(., y))i. On
montre aisément sous les hypothèses précédentes que t−1 (ϕ(., y+th)−ϕ(., y))
converge dans D(Rd ) vers ∇y ϕ(., y) · h de sorte que G est Gâteaux dérivable
avec G0 (y)(h) = hT, ∇y ϕ(., y) · hi. Comme y 7→ ∇y ϕ(., y) est continue de RN
dans D(Rd ), on en déduit que G est de classe C 1 et ∇G(y) = hT, ∇y ϕ(., y)i.
En itérant l’argument précédent, on obtient que G est de classe C ∞ et
∂ α G(y) = T, ∂yα ϕ(., y) , ∀α ∈ NN , ∀y ∈ RN .
2
Lemme 2.10 (Lemme fondamental du calcul intégral) Soit T ∈ D0 (Rd ),
ϕ ∈ D(Rd ) et x ∈ Rd , on a :
Z 1
hT, τx ϕi − hT, ϕi =
hT, τtx ∇ϕ · xi dt.
0
Preuve:
Posons pour tout t ∈ [0, 1] g(t) := hT, τtx ϕi. Soit t ∈ (0, 1) et h 6= 0 tel
que t + h ∈ (0, 1) on a alors h−1 (g(t + h) − g(t)) = hT, ψh i avec ψh =
h−1 (τ(t+h)x ϕ − τtx ϕ) et il est facile de voir que ψh → τtx ∇ϕ · x dans D(Rd )
quand h → 0 de sorte que g est dérivable (et même de classe C ∞ ) avec
g 0 (t) = hT, τtx ∇ϕ · xi. Ainsi
Z 1
Z 1
0
hT, τx ϕi − hT, ϕi = g(1) − g(0) =
g (t)dt =
hT, τtx ∇ϕ · xi dt.
0
0
2
On cherche maintenant à définir la convolution d’une distribution et d’une
fonction-test et ce, évidemment de manière à étendre la convolution des fonctions telle que définie au début de ce chapitre. Soit f ∈ L1loc pour g ∈ D, f ? g
est la fonction C ∞ définie pour tout x ∈ Rd par :
Z
(f ? g)(x) =
f (y)g(x − y)dy = h{f }, g(x − .)i = h{f }, τ−x ǧi , ∀x ∈ Rd .
Rd
Une première stratégie pour définir T ? g (avec T ∈ D0 et g ∈ D) est donc
de considérer (T ? g) comme la fonction x 7→ hT, τ−x ǧi (qui, en vertu du
lemme 2.9 est C ∞ ). Revenant au cas f ∈ L1loc , on peut aussi considérer f ? g
52
comme une distribution c’est à dire à partir de son action sur les fonctionstest ϕ ∈ D :
Z
Z
h{f ? g}, ϕi =
ϕ(x)
f (y)g(x − y)dydx
d
d
R
R
Z
Z
f (y)
ϕ(x)ǧ(y − x)dxdy = h{f }, ǧ ? ϕi .
=
Rd
Rd
Ce qui suggère une deuxième stratégie pour définir T ? g comme une distribution. Nous verrons un peu plus loin qu’en fait ces deux points de vue
coı̈ncident.
Définition 2.8 Soit T ∈ D0 (Rd ) et g ∈ D(Rd ). On définit la convolée de T
et de g en tant que fonction C ∞ (i.e. (T ?1 g) ∈ E(Rd )) par :
(T ?1 g)(x) := hT, τ−x ǧi , ∀x ∈ Rd .
On définit la convolée de T et de g en tant que distribution (i.e. (T ?2 g) ∈
D0 (Rd )) par :
h(T ?2 g), ϕi := hT, ǧ ? ϕi , ∀ϕ ∈ D(Rd ).
En posant G := Zd l’ensemble des points de Rd à coordonnées entières,
un exercice standard sur les sommes de Riemann, laissé au lecteur, donne
Lemme 2.11 Soit F ∈ Cc (Rd × Rd ), et soit
Z
X
f (y) :=
F (x, y)dx, fε (y) := εd
F (εx, y), ∀ε > 0, ∀y ∈ Rd
Rd
x∈G
alors fε converge uniformément vers f .
Pour g et ϕ dans D(Rd ), on déduit facilement du lemme précédent que
X
εd
τ−εx ǧ ϕ(εx) → ǧ ? ϕ dans D(Rd )
(2.13)
x∈G
quand ε → 0. Ceci permet de conclure que les deux notions de convolution
définies plus haut coı̈ncident :
Lemme 2.12 Soit T ∈ D0 (Rd ) et g ∈ D(Rd ), on a {T ?1 g} = T ?2 g.
53
Preuve:
Soit ϕ ∈ D(Rd ), on a d’abord
Z
X
hT, τ−εx ǧi ϕ(εx).
h{T ?1 g}, ϕi =
hT, τ−x ǧi ϕ(x)dx = lim εd
ε→0
Rd
x∈G
Par continuité et linéarité de T , on a ensuite en utilisant (2.13) :
*
+
X
lim+ T,
εd τ−εx ǧ ϕ(εx) = hT, ǧ ? ϕi = hT ?2 g, ϕi .
ε→0
x∈G
2
Evidemment par la suite, nous noterons la convolution de T ∈ D0 (Rd ) et
g ∈ D(Rd ) simplement sous la forme T ? g.
Lemme 2.13 Soit T ∈ D0 (Rd ), g ∈ D(Rd ) et α ∈ Nd , on a alors
∂ α (T ? g) = ∂ α T ? g = T ? ∂ α g.
Preuve:
Soit ϕ ∈ D(Rd ), on a
h∂ α (T ? g), ϕi = (−1)|α| hT, ǧ ? ∂ α ϕi = (−1)|α| hT, ∂ α (ǧ ? ϕ)i = h∂ α T ? g, ϕi .
et donc ∂ α (T ? g) = ∂ α T ? g. Pour l’autre identité, on remarque que ∂ˇα g =
(−1)|α| ∂ α ǧ et donc
h∂ α (T ? g), ϕi = (−1)|α| hT, ∂ α ǧ ? ϕ)i = T, ∂ˇα g ? ϕ = hT ? ∂ α g, ϕi .
2
Lemme 2.14 Soit T ∈ D0 (Rd ), g ∈ D(Rd ) et α ∈ Nd , on a alors
supp(T ? g) ⊂ supp(T ) + supp(g).
Preuve:
Soit ω un ouvert inclus dans Rd \ (supp(T ) + supp(g)) et ϕ ∈ D(Rd ) avec
supp(ϕ) ⊂ ω ; il s’agit de montrer que hT ? g, ϕi = 0. Or hT ? g, ϕi =
hT, ǧ ? ϕi et supp(ǧ ?ϕ) ⊂ ω −supp(g) ⊂ Rd \supp(T ) et donc hT ? g, ϕi = 0.
2
54
Le lemme précédent montre que si S ∈ E 0 (Rd ) et ϕ ∈ D(Rd ) alors S ? g ∈
D(Rd ) ce qui permet de définir le produit de convolution de deux distributions
dont l’une est à support compact S ∈ E 0 (Rd ) et T ∈ D0 (Rd ) par
hT ? S, ϕi = T, Š ? ϕ , ∀ϕ ∈ D(Rd ).
On a alors E 0 ? D0 ⊂ D0 et E 0 ? E 0 ⊂ E 0 . Notons aussi que T ? δ0 = T pour
tout T ∈ D0 (Rd ). En utilisant le fait que S ? S ⊂ S et en définissant pour
T ∈ S 0 et g ∈ S la convolution de T ?g comme précédemment (i.e. hT ? g, ϕi =
hT, ǧ ? ϕi , ∀ϕ ∈ D(Rd )) il est facile de voir qu’en fait cette définition coı̈ncide
avec la convolution de T et g en tant que fonction ((T ? g(x)) := hT, τ−x ǧi
pour tout x) et que T ? g ∈ S 0 ∩ E. Enfin, pour m ∈ Mloc (Rd ) et ϕ ∈ Cc (Rd )
la convolution de m et ϕ est la fonction continue définie par :
Z
ϕ(x − y)dm(y).
(m ? ϕ)(x) :=
Rd
Lemme 2.15 Soit T ∈ D(Rd ) et (ρε )ε une famille régularisante alors T ? ρε
converge vers T dans D0 (Rd ) quand ε → 0+ .
Preuve:
Soit ϕ ∈ D(Rd ) on a
hT ? ρε , ϕi = hT, ρˇε ? ϕi
et on conclut en utilisant le fait que ρˇε ? ϕ converge vers ϕ dans D(Rd ). 2
Comme T ? ρε ∈ E(Rd ), on déduit du lemme précédent que E(Rd ) est
séquentiellement dense dans D0 (Rd ). Par des argument classiques de troncature, on en déduit le résultat de densité suivant :
Théorème 2.2 Soit Ω un ouvert de Rd alors D(Ω) est séquentiellement
dense dans D0 (Ω).
Preuve:
Soit Kn une suite exhaustive de compacts de Ω, ηn ∈ D(Ω) avec supp(ηn ) ⊂
Kn+1 et ηn ≡ 1 sur Kn et soit ρn une suite régularisante telle qu’en outre
supp(ρn ) + Kn+1 ⊂ Ω. Soit T ∈ D0 (Ω) et Tn := (ηn T ) ? ρn , on a alors
Tn ∈ D(Ω) et Tn converge vers T dans D0 (Ω) quand n → +∞. 2
Lemme 2.16 (Lemme de Dubois-Reymond) Soit T ∈ D0 (Ω) telle que ∇T
soit une fonction continue alors T est une fonction de classe C 1 et ses
dérivées premières au sens des distributions et au sens classique coı̈ncident.
55
Preuve:
Notons ∇T = {G} (avec G continue sur Ω). Soit x0 ∈ Ω et r > 0 tels
que B(x0 , r) ⊂ Ω, soit r0 ∈ (0, r) et ε ∈ (0, r − r0 ). On peut alors définir
Tε := ρε ?T à la fois comme distribution sur B(x0 , r0 ) (étant entendu que l’on
prolonge par 0 en dehors de B(x0 , r0 ) les fonctions-test de D(B(x0 , r0 ))) et
comme fonction C ∞ sur B(x0 , r0 ). En particulier sur B(x0 , r0 ), on a ∇Tε =
Gε = ρε ? G, de sorte que pour tout x, y dans B(x0 , r0 ), on a :
Z 1
Gε (x + t(y − x)) · (y − x)dt.
(2.14)
Tε (y) − Tε (x) =
0
Comme r0 + ε < r, et G est bornée sur B(x0 , r), on a aussi
sup |Gε | ≤ sup |G| := K < +∞.
B(x0 ,r0 )
(2.15)
B(x0 ,r)
On déduit de (2.16) et (2.15) que Tε est une famille équilipschitzienne sur
B(x0 , r0 ). Comme Tε converge dans D0 (B(x0 , r0 )) il est facile d’en déduire
que Tε est uniformément bornée sur B(x0 , r0 ) (sans quoi il existerait une sous
suite qui convergerait uniformémentRvers +∞ ou −∞ ce qui est incompatible
avec la convergence des intégrales B(x0 ,r0 ) Tε ϕ avec ϕ ∈ D(B(x0 , r0 ))). On
déduit donc du théorème d’Ascoli qu’il existe une suite εn tendant vers 0
telle que Tn := Tεn converge uniformément sur B(x0 , r0 ) vers une fonction
continue f . On a évidemment h{f }, ϕi = hT, ϕi pour tout ϕ ∈ D(Ω) avec
supp(ϕ) ⊂ B(x0 , r0 ) de sorte que T coı̈ncide avec une fonction continue sur
B(x0 , r0 ). Enfin, en passant à la limite dans (2.16), on obtient que pour tout
x, y dans B(x0 , r0 ), on a :
Z 1
f (y) − f (x) =
G(x + t(y − x)) · (y − x)dt
(2.16)
0
de sorte que f est de classe C 1 et ∇f = G sur B(x0 , r0 ). Le résultat cherché
étant de nature locale, sa preuve en est achevée.
2
Comme corollaire immédiat du résultat précédent, on a :
Lemme 2.17 Soit Ω un ouvert connexe de Rd et T ∈ D0 (Ω) telle que ∇T = 0
alors il existe une constante C telle que T = {C}.
Exercice 2.6 Montrer que S ne possède pas d’élément neutre pour ?.
56
2.4
Transformation de Fourier
Définition 2.9 Soit f ∈ L1 := L1 (Rn ), la transformée de Fourier de f est
la fonction notée fˆ (ou F(f )) définie pour tout ξ ∈ Rd par
Z
ˆ
F(f )(ξ) = f (ξ) =
e−ix·ξ f (x)dx.
Rd
Dans la définition précédente, x · ξ est le produit scalaire usuel de x et ξ.
On rencontre dans la littérature un certain nombre d’autres définitions de la
transformée de Fourier, consistant par exemple à considérer e−2iπx·ξ plutôt
que e−ix·ξ dans la définition précédente, ou encore à diviser l’expression de
F(f ) donnée ci-dessus par (2π)d ou (2π)d/2 ... Il s’agit là d’une affaire de
convention ou de commodité d’écriture sans grande importance.
En notant C0 = C0 (Rd ) l’espace des fonctions continues sur Rd tendant
vers 0 à l’infini, on a alors :
Lemme 2.18 Pour tout f ∈ L1 , on a fˆ ∈ C0 (i.e. fˆ est continue et tend
vers 0 à l’infini) et
kfˆk∞ ≤ kf kL1 .
Preuve:
La continuité de fˆ découle immédiatement du théorème de convergence dominée de Lebesgue et l’estimation uniforme est évidente. Seul le fait que fˆ
tend vers 0 à l’infini (c’est le lemme de Riemann-Lebesgue) est réellement à
démontrer. Un calcul immédiat donne le résultat dans le cas où f est l’indicatrice d’un pavé, on conclut le cas général par densité des combinaisons
linéaires de telles indicatrices dans Cc puis par densité de Cc dans L1 .
2
Notons que pour f ∈ L1 , on n’a pas en général fˆ ∈ L1 . En effet, si f est
l’indicatrice de [−a, a]d , un calcul immédiat donne
sin(ξj a)
fˆ(ξ) = 2d Πdj=1
ξj
qui n’est pas (Lebesgue) intégrable.
Un changement de variable et le théorème de Fubini impliquent immédiatement
que si f et g sont dans L1 (Rd ) on a l’identité :
F(f ? g) = F(f )F(g).
57
(2.17)
Lemme 2.19 (Dérivation et transformée de Fourier) Soit f ∈ L1 (Rd ) telle
que xj f ∈ L1 (Rd ) alors F(f ) admet une dérivée partielle par rapport à ξj et
F(xj f ) = i∂j F(f ).
Soit f ∈ L1 (Rd ) telle que ∂j f ∈ L1 (Rd ) alors F(∂j f ) = iξj F(f ).
Preuve:
Le premier point découle simplement du théorème de Lebesgue de dérivation
sous le signe somme. Pour le second point, on raisonne par approximation
et on se contente de montrer le résultat pour f ∈ Cc1 (Rd ), dans ce cas en
effectuant une intégration par parties on a
Z
Z
−ix·ξ
F(∂j f )(ξ) =
e
∂j f (x)dx = iξj
e−ix·ξ f (x)dx.
Rd
2
Rd
Lemme 2.20 (Transformée de Fourier de la gaussienne) Soit θ > 0 et
2
fθ (x) := e−|x| /(2θ) , ∀x ∈ Rd , alors on a
2
θ|ξ|
fˆθ (ξ) = (2πθ)d/2 e− 2 , ∀ξ ∈ Rd .
Preuve:
Par produit et un argument d’homogénéité, il suffit de démontrer le résultat
pour d = 1 et θ = 1, dans ce cas on considère l’équation différentielle ordinaire
linéaire :
g 0 (x) + xg(x) = 0, x ∈ R
(2.18)
dont les solutions sont de la forme Cf1 . En utilisant le lemme 2.19 on a
0 = F(f10 + xf1 ) = i(ξF(f1 ) + F(f1 )0 )
2
ainsi F(f1 ) résout (2.18) et donc est de la forme Ce−ξ /2 on conclut en notant
que
Z
Z
√
x2
C = fˆ1 (0) =
f1 =
e− 2 dx = 2π.
R
2
R
Lemme 2.21 Soit f et g dans L1 (Rd ), on a
Z
Z
ix·ξ
e f (ξ)ĝ(ξ)dξ =
fˆ(ξ)g(x + ξ)dξ, ∀x ∈ Rd
Rd
Rd
et donc en particulier
Z
Z
f (ξ)ĝ(ξ)dξ =
Rd
Rd
58
fˆ(ξ)g(ξ)dξ.
Preuve:
Comme (y, ξ) → g(y)f (ξ) ∈ L1 , on appliquant le théorème de Fubini on a :
Z Z
Z
ix·ξ
i(x−y)·ξ
e ĝ(ξ)f (ξ)dξ =
e
g(y)dy f (ξ)dξ
Rd
Rd
Rd
Z Z
i(x−y)·ξ
=
e
f (ξ)dξ g(y)dy
Rd
Rd
Z
Z
ˆ
=
f (y − x)g(y)dy =
fˆ(ξ)g(x + ξ)dξ.
Rd
Rd
2
Théorème 2.3 (Inversion de la transformation de Fourier) Soit f ∈ L1 (Rd )
telle que fˆ ∈ L1 (Rd ) on a alors
Z
1
f (x) =
eix·ξ fˆ(ξ)dξ, ∀x ∈ Rd
(2π)d Rd
si bien qu’en particulier f ∈ C0 (Rd ).
Preuve:
ε2 |x|2
Pour ε > 0, soit gε (x) := e− 2 , avec les lemmes 2.21 et 2.20, on a :
Z
Z
ε2 |ξ|2
− 2
ix·ξ ˆ
e f (ξ)e
ĝε (ξ)f (x + ξ)dξ
dξ =
Rd
Rd
Z
|ξ|2
d/2
= (2π)
ε−d e− 2ε2 f (x + ξ)dξ
d
ZR
|y|2
e− 2 f (x + εy)dy.
= (2π)d/2
Rd
Comme fˆ ∈ L1 , il découle du théorème de convergence dominée de Lebesgue
que
Z
Z
ε2 |ξ|2
ix·ξ ˆ
− 2
dξ =
eix·ξ fˆ(ξ)dξ.
lim
e f (ξ)e
ε→0+
Rd
Rd
Par ailleurs, il est facile de voir (en procédant par approximation comme au
lemme 2.3) que
Z
|y|2
x 7→
e− 2 f (x + εy)dy
Rd
converge dans L1 vers (2π)d/2 f quand ε → 0+ , ce qui achève la preuve. 2
On notera aussi que que la formule d’inversion de la transformée de Fourier peut s’écrire sous la forme
F ◦ F(f ) = (2π)d fˇ, ∀f ∈ L1 (Rd ) : F(f ) ∈ L1 .
59
avec fˇ(x) = f (−x), ∀x ∈ Rd .
On rappelle que l’espace de Schwartz est défini par :
S = {f ∈ C ∞ (Rd ) : sup (1 + |x|k )|∂ β f (x)| < ∞, ∀k ∈ N, ∀β ∈ Nd }.
x∈Rd
On munit, comme au chapitre 1, S de la famille de semi normes
f 7→ sup (1 + |x|k )|∂ β f (x)|, k ∈ N, β ∈ Nd }.
x∈Rd
Il est facile de voir que les applications suivantes sont des endomorphismes
continus de S :
f→
7 ∂ β f (β ∈ Nd ), f →
7 xα f (α ∈ Nd ),
f 7→ ψf (ψ ∈ S), f →
7 (1 + |x|2 )s f (s ∈ R).
Il résulte du lemme 2.19 que la transformée de Fourier d’un élément de l’espace de Schwartz S est encore dans S et que pour tout f ∈ S et α ∈ Nd on
a:
F(xα f ) = i|α| ∂ α F(f ), F(∂ α f ) = i|α| ξ α F(f ).
(2.19)
Autrement dit, F échange la dérivation ∂ α et la multiplication par ξ α . Par
ailleurs il est facile de voir que F est un automorphisme continu de S et il
découle du théorème 2.3 que
F ◦ F(f ) = (2π)d fˇ, ∀f ∈ S.
Proposition 2.3 (Formule de Parseval) Soit f ∈ S et g ∈ L1 , alors on a :
Z
Z
−d
¯
f ḡ = (2π)
fˆĝ.
Rd
Rd
(Formule de Plancherel) En particulier, pour tout f ∈ S on a
kf k2L2 = (2π)−d kfˆk2L2 .
Preuve:
En utilisant le lemme 2.21 et la formule d’inversion de la transformée de
Fourier dans S on a :
Z
Z
Z
Z
1 ˆ
1
−1
ˆ
f (−ξ)ḡˆ(ξ)dξ =
f ḡ =
F (f )F(ḡ) =
f (ξ)ḡˆ(−ξ)dξ
d
d
(2π) Rd
Rd (2π)
Rd
Rd
¯
et on conclut en remarquant que ḡˆ(−ξ) = ĝ(ξ).
60
2
La formule de Plancherel permet de prolonger la transformée de Fourier
2
à L . En effet, en notant J l’injection (continue et dense) de S dans L2 , on a
k(J ◦ F)(f )kL2 = (2π)d/2 kf kL2 , ∀f ∈ S
de sorte que J ◦ F est une application linéaire de S munie de la topologie
trace de L2 dans L2 . Par densité de S dans L2 , J ◦ F admet un unique
prolongement linéaire continu à L2 , que l’on notera encore F (ou fˆ avec
f ∈ L2 ) et qu’on appelle transformée de Fourier dans L2 . Pour f ∈ L2 ∩ L1 ,
F(f ) est évidemment défini par
Z
F(f )(ξ) =
e−ix·ξ f (x)dx
Rd
mais cette formule intégrale n’a pas de sens si f est seulement L2 , dans ce
cas F(f ) est la limite dans L2 de F(fn ) avec (fn ) suite de S convergeant
dans L2 vers f . Par prolongement/densité, on obtient immédiatement que la
transformée de Fourier dans L2 hérite des propriétés suivantes :
Proposition 2.4 F est un automorphisme bicontinu de L2 et l’on a la formule d’inversion :
F ◦ F(f ) = (2π)d fˇ, ∀f ∈ L2 (Rd )
Pour tous f et g dans L2 on a
hf, giL2 = (2π)−d hF(f ), F(g)iL2 (avec hf, giL2 =
R
Rd
f ḡ)
et donc en particulier
kf kL2 = (2π)−d/2 kF(f )kL2 .
Notons qu’il peut parfois être utile d’écrire la formule d’inversion de la transformée de Fourier sous la forme plus explicite :
F −1 (f ) = (2π)−d F(fˇ).
Nous avons vu que la transformée de Fourier est un automorphisme bicontinu de S, la transformée de Fourier sur S 0 est donc définie par transposition
comme suit :
61
Définition 2.10 Soit T ∈ S 0 on appelle transformée de Fourier et l’on note
F(T ) ou T̂ la distribution tempérée définie par
hF(T ), ϕi = hT, F(ϕ)i , ∀ϕ ∈ S.
On vérifie sans peine les propriétés suivantes de la transformée de Fourier
dans S 0 :
Proposition 2.5 F est un automorphisme (faiblement) bicontinu de S 0 et
l’on a la formule d’inversion :
F ◦ F(T ) = (2π)d Ť , ∀T ∈ S 0
(avec Ť , ϕ := hT, ϕ̌i, ∀ϕ ∈ S). Pour tout T ∈ S 0 et α ∈ Nd , on a :
F(xα T ) = i|α| ∂ α F(T ), F(∂ α T ) = i|α| ξ α F(T ).
Evidemment si T ∈ L1 les transformées de Fourier dans L1 et dans S 0
coı̈ncident. Plus généralement si T est une mesure bornée, sa transformée
de Fourier est définie par
Z
e−ix·ξ dT (x), ∀ξ ∈ Rd
T̂ (ξ) :=
Rd
et l’on vérifie sans peine que T̂ ∈ Cb (Rd ) et que pour T mesure bornée, la
définition précédente coı̈ncide avec F(T ) au sens de S 0 . Un calcul immédiat
donne en particulier δˆ0 = 1 ce qui montre que la transformée de Fourier d’une
mesure n’est généralement pas dans C0 (Rd ).
Nous avons vu que le fait que la transformée de Fourier d’une fonction
possède des moments finis se traduit en terme de dérivabilité. On peut donc
(dans un cadre L2 ) définir des dérivées fractionnaires par transformée de
Fourier, c’est ce qui motive la définition suivante. Pour tout s ∈ R, on définit
l’espace de Sobolev H s = H s (Rd ) par
H s := {u ∈ S 0 : (1 + |ξ|2 )s/2 û ∈ L2 }
on vérifie sans peine que H s est un espace de Hilbert séparable muni du
produit scalaire
Z
s
hu, viH s :=
û(ξ)v̂(ξ)) 1 + |ξ|2 dξ
Rd
62
et la norme associée
2 s/2
kukH s := k(1 + |ξ| )
Z
2
|û(ξ)|
ûkL2 =
2 s
1 + |ξ|
1/2
dξ
.
Rd
On a évidemment que H 0 = L2 et pour s ∈ N on vérifie sans peine que H s
défini précédemment coı̈ncide avec l’espace de Sobolev W s,2
H s = W s,2 = {f ∈ L2 : ∂ α f ∈ L2 , ∀α : |α| ≤ s}.
Pour (s, t) ∈ R2 on définit
(I − ∆)t/2 : H s+t → H s
T 7→ F −1 ((1 + |ξ|2 )t/2 T̂ )
Pour T ∈ H s+t on a alors par définition :
k(I − ∆)t/2 T kH s = k(1 + |ξ|2 )(s+t)/2 T̂ kL2 = kT kH s+t
de sorte que (I −∆)t/2 est une isométrie linéaire de H s+t dans H s pour tout s
(et donc en particulier de H t sur L2 ). On vérifie immédiatement que l’inverse
de (I − ∆)s/2 est (I − ∆)−s/2 .
Exercice 2.7 Montrer que pour s > d/2, H s ⊂ C0 (Rd ) avec injection continue.
Exercice 2.8 Montrer que δ0 ∈ H s dès que s < −d/2. Montrer que l’injection de H s dans S 0 est continue et dense. Soit s1 ≥ s2 montrer que l’injection
de H s1 dans H s2 est continue.
Exercice 2.9 Montrer que si u ∈ H s et f ∈ S alors uf ∈ H s . Montrer que
si u ∈ H s alors ∂ α u ∈ H s−|α| . Montrer que E 0 ⊂ ∪s H s et ∩s H s ⊂ E.
Exercice
2.10 Soit m ∈ N∗ montrer que T ∈ H−m si et seulement T =
P
α
2
|α|≤m ∂ Tα pour des Tα dans L .
63
2.5
Solution fondamentale du Laplacien
L’objet de ce paragraphe est de montrer comment ce que nous avons vu
dans ce chapitre (convolution et transformée de Fourier notamment) permet
de résoudre quelques EDP’s linéaires ”modèle”.
Théorème 2.4 Soit d un entier d ≥ 3 et
f (x) :=
1
, ∀x ∈ Rd ,
|x|d−2
alors on a
−∆f = (d − 2)sd δ0 dans D0 (Rd )
avec sd la mesure superficielle de la sphère unité S d−1 (sd = d|ωd | avec ωd la
mesure de Lebesgue de la boule unité). Pour d = 2, soit
g(x) := ln(|x|), ∀x ∈ R2
alors on a
−∆g = 2πδ0 dans D0 (R2 ).
Preuve:
On se contentera ici de démontrer le cas d ≥ 3, le cas d = 2 étant similaire.
Pour x 6= 0 on a, ∂i |x| = xi /|x| et donc ∂i f (x) = (2 − d)|x|−d xi , ∂ii2 f (x) =
(2 − d)|x|−d − d(2 − d)|x|−d−2 x2i , de sorte que
∆f (x) = d(2 − d)|x|−d − d(2 − d)|x|−d−2 |x|2 = 0, ∀x ∈ Rd \ {0}.
Comme f ∈ L1loc , on a pour ϕ ∈ D(Rd ),
Z
Z
h−∆f, ϕi = −
∆ϕf = lim+
ε→0
Rd
(2.20)
−∆ϕf
|x|>ε
comme f est C ∞ sur Rd \ Bε , en utilisant la formule de Green et (2.20), on
a:
Z
Z
Z
∂ϕ
∂f
1−d
2−d ∂ϕ
−f
dσ =
ϕ(d − 2)ε
−ε
dσ.
−
∆ϕf =
ϕ
∂n
∂n
∂n
|x|=ε
|x|>ε
|x|=ε
On conclut en remarquant que
Z
Z
1−d
lim+ ε
ϕdσ = sd ϕ(0),
ε→0
|x|=ε
|x|=ε
64
∂ϕ
dσ = O(εd−1 ).
∂n
2
Le Théorème précédent nous ayant fourni la solution fondamentale du
laplacien :
g2 (x) =
1
1
ln(|y|), gd (y) =
, d ≥ 3,
2π
(d − 2)sd |y|d−2
nous pouvons en déduire qu’une solution au sens des distributions de l’équation
−∆u = f, dans D0 (Rd )
avec f ∈ E 0 est donnée par convolution avec la solution fondamentale, c’est
à dire u = gd ? f . En effet, ∆(gd ? f ) = (∆gd ) ? f = δ0 ? f = f . Notons que
l’on n’a pas unicité de la solution au sens des distributions pour l’équation
précédente (ajouter à u déterminée précédemment une fonction harmonique
quelconque). Si f a davantage de régularité, par exemple f ∈ S, alors u ∈ E
et on a la formule explicite :
Z
1
ln(|x − y|)f (y)dy
u(x) =
2π R2
en dimension 2 et
1
u(x) =
(d − 2)sd
Z
Rd
1
f (y)dy
|x − y|d−2
en dimension supérieure.
Considérons maintenant l’EDP linéaire :
−∆u + u = f
avec f ∈ S et dont on cherche une solution dans S. En prenant la transformée
de Fourier de cette équation on obtient une équation algébrique en û :
(1 + |ξ|2 )û = fˆ
dont la solution est évidemment donnée par u = F −1 ((1 + |ξ|2 )−1 fˆ). Notons
que l’on a û ∈ S et donc on a bien u ∈ S. Pour calculer effectivement u, on
utilise le fait que (1 + |ξ|2 )−1 ∈ S 0 et l’identité
F −1 (gh) = F −1 (g) ? F −1 (h), ∀g ∈ S, ∀h ∈ S 0
de sorte qu’en définissant B (noyau de Bessel) par :
B := F −1 (1 + |ξ|2 )−1 = (2π)−d F (1 + |ξ|2 )−1
65
on a
u = B ? f.
Pour clore ce chapitre, indiquons formellement comment les notions vues
dans ce chapitre permettent également de résoudre certaines équations d’évolution
linéaires standard (mais importantes) comme l’équation de la chaleur. Nous
nous bornerons ici au cas de l’équation de la chaleur et à une description heuristique pour ne pas avoir à introduire le cadre fonctionnel rigoureux mais
un peu lourd permettant de traiter la variable temporelle. Le problème de
Cauchy pour l’équation de la chaleur homogène s’écrit
∂t u − ∆u = 0
u(0, .) = u0 ,
avec une condition initiale u0 ∈ L2 . En prenant la transformée de Fourier de
cette équation par rapport à la seule variable spatiale on obtient une équation
différentielle ordinaire pour t 7→ û(t, ξ) :
∂t û = −|ξ|2 û
et donc
û(t, ξ) = û(0, ξ)e−t|ξ|
2
de sorte que
Z
u(t, x) = (Gt ? u0 )(x) =
2
Gt (x − y)u0 (y)dy avec Gt = F −1 (e−t|ξ| ).
Rd
On a l’expression explicite suivante pour Gt (noyau de la chaleur) :
Z
|x|2
1
1
ix·ξ −t|ξ|2
− 4t
e
e
dξ
=
e
Gt (x) =
(2π)d Rd
(4πt)d/2
d’où la formule de représentation pour la solution de l’équation de la chaleur :
Z
|x−y|2
1
− 4t
u(t, x) =
e
u0 (y)dy.
(4πt)d/2 Rd
Le fait que le noyau de la chaleur soit la densité d’une gaussienne centrée de
variance t ne doit rien au hasard étant donné le lien très étroit entre cette
équation (et plus généralement les équations paraboliques) et le mouvement
Brownien (et plus généralement les processus de diffusion).
66
Chapitre 3
Espaces de Banach et
topologies faibles
3.1
Topologie faible
Soit E un espace de Banach et E 0 son dual topologique, muni de sa norme
duale. La topologie faible sur E est alors définie de la manière suivante :
Définition 3.1 La topologie faible sur E, notée σ(E, E 0 ) est la topologie la
moins fine (i.e. ayant le moins d’ouverts) rendant continus les éléments de
E 0.
La topologie faible sur E, σ(E, E 0 ), est donc un cas particulier de topologie la moins fine rendant continues une famille d’applications définies sur E à
valeurs réelles. La construction de telles topologies a déja été vue dans le cours
de topologie. Rappelons-en simplement les grandes lignes. Il est clair que la
topologie σ(E, E 0 ) est la topologie la moins fine contenant (ou encore la topologie engendrée par) la famille Λ := {f −1 (ω), f ∈ E 0 , ω ouvert de R}. La
topologie engendrée par cette famille est formée par les réunions quelconques
d’intersections finies d’éléments de Λ. Pour montrer que cette nouvelle famille est effectivement une topologie (et donc la moins fine contenant Λ), il
suffit de montrer qu’elle est stable par intersection finie, ce qui résulte de :
!
!
\ [ \
\
[
\
Oij =
Oi1j
Oi2j
k=1,2
i∈Ik j∈Jk
(i1 ,i2 )∈I1 ×I2
j∈J1
j∈J2
Lemme 3.1 Soit X un espace topologique et ϕ une application de X vers
E, alors ϕ est continue pour la topologie σ(E, E 0 ) si et seulement si pour tout
f ∈ E 0 , f ◦ ϕ est continue sur X.
67
Preuve:
Si ϕ est continue de X dans (E, σ(E, E 0 )) comme par définition tout f ∈ E 0
est continue pour (E, σ(E, E 0 )) alors par composition pour tout f ∈ E 0 , f ◦ ϕ
est continue sur X. Réciproquement, supposons que f ◦ ϕ soit continue sur
X pour tout f ∈ E 0 , il s’agit de montrer que ϕ est continue de X dans
(E, σ(E, E 0 )). Pour cela, il s’agit de montrer que ϕ−1 (U ) est un ouvert de X
pour tout ouvert U pour σ(E, E 0 ). Or nous savons que U est de la forme :
[\
U=
fi−1 (ωi )
j∈J i∈Ij
où chaque Ij est fini, fi ∈ E 0 et ωi est un ouvert de R. On a alors
[\
ϕ−1 (U ) =
(fi ◦ ϕ)−1 (ωi )
j∈J i∈Ij
qui est bien ouvert puisque chaque fi ◦ ϕ est continue.
2
Lemme 3.2 Soit x ∈ E, un système fondamental de voisinages de x ∈ E
pour la topologie faible σ(E, E 0 ) est donné par les ensembles de la forme :
Vε,f1 ,...fk := {y ∈ E : |fi (x − y)| < ε, i = 1, . . . , k}
avec ε > 0, k ∈ N∗ et f1 , . . . , fk ∈ (E 0 )k .
Preuve:
Par définition de la topologie σ(E, E 0 ), Vε,f1 ,...fk est un ouvert de la topologie
faible contenant x. Soit maintenant U un voisinage de x pour σ(E, E 0 ), il
existe alors un ensemble fini I, des formes linéaires continues (fi )i∈I et des
ouverts de R, (ωi )i∈I tels que fi (x) ∈ ωi et ∩i∈I fi−1 (ωi ) ⊂ U . On choisit alors
ε > 0 suffisamment petit pour que (fi (x) − ε, fi (x) + ε) ⊂ ωi pour tout i ∈ I
de sorte que V := {y ∈ E : |fi (x − y)| < ε, ∀i ∈ I} ⊂ U .
2
La topologie σ(E, E 0 ) est ainsi une topologie d’evtlc puisqu’elle peut de
manière équivalente être définie par la famille de semi-normes {pf , f ∈ E 0 }
avec pf (x) := |f (x)| pour tout (x, f ) ∈ E × E 0 . Nous avons déja vu au
chapitre 1 qu’il résulte du théorème de Hahn-Banach que :
Lemme 3.3 La topologie σ(E, E 0 ) est séparée.
68
Par définition même tout ouvert pour la topologie faible est ouvert pour
la topologie forte et l’on vérifie sans peine que les deux topologies coı̈ncident
lorsque E est de dimension finie (pour s’en convaincre, il suffit de considérer
la base duale d’une base de E). Lorsque E est de dimension infinie, les deux
topologies sont distinctes et il existe toujours des fermés ”fort” (i.e. pour la
topologie de la norme) qui ne sont pas fermés faibles (i.e. pour σ(E, E 0 )).
En effet, supposons E de dimension infinie et définissons S := {x ∈ E :
kxk = 1} la sphère unité de E, alors S n’est pas faiblement fermée est plus
précisément l’adhérence de S pour σ(E, E 0 ) contient la boule fermée BE
toute entière. En effet soit x0 ∈ E avec kx0 k < 1 et soit V un voisinage
de x0 pour σ(E, E 0 ), on peut sans perte de généralité supposer que V est
de la forme V = {y ∈ E : |fi (y − x0 )| < ε, i = 1, ..., k} pour un certain
ε > 0 et une famille finie d’éléments de E 0 , f1 , ...., fk . Comme E est de
dimension infinie il existe y0 ∈ E, y0 6= 0 tel que fi (y0 ) = 0 pour i = 1, ..., k
(faute de quoi E s’injecterait dans Rk ). On peut alors choisir t ∈ R tel que
x0 + ty0 ∈ S comme x0 + ty0 ∈ V on en déduit bien que x0 est adhérent à
S pour σ(E, E 0 ). En dimension infinie, il convient de retenir de l’argument
précédent que les parties d’intérieur non vides pour σ(E, E 0 ) ” contiennent
toujours un sous-espace affine (de dimension infinie !) de E, et donc sont non
bornées. En particulier tout borné de E est d’intérieur vide pour σ(E, E 0 ).
σ(E,E 0 )
l’adhérence de A pour la topologie faible et
Pour A ⊂ E, on notera A
A son adhérence pour la topologie forte, comme les fermés faibles sont fermés
σ(E,E 0 )
, l’inclusion étant en générale stricte. Pour
forts on a toujours A ⊂ A
les sous-ensembles convexes toutefois on a le résultat suivant :
Proposition 3.1 Soit C un convexe fermé de E alors C est faiblement
fermé.
Preuve:
Soit x ∈ E \ C il s’agit de montrer que E \ C est voisinage de x pour σ(E, E 0 )
or il résulte du théorème de Hahn-Banach 1.11 qu’il existe f ∈ E 0 et ε > 0
tels que le voisinage de x pour σ(E, E 0 ), V := {y ∈ E : |f (x) − f (y)| < ε}
ne rencontre pas C.
2
Par la suite nous dirons qu’une suite (xn ) de E converge faiblement vers
x ∈ E (ou au sens de σ(E, E 0 )), ce que nous noterons xn * x lorsque f (xn ) →
f (x) pour tout f ∈ E 0 . Passons en revue quelques propriétés élémentaires de
la convergence faible :
– si (xn ) converge faiblement sa limite faible est unique,
– si xn → x alors xn * x
69
– toute suite faiblement convergente de E est bornée (conséquence immédiate
du théorème de Banach-Steinhaus),
– si xn * x alors kxk ≤ lim inf n kxn k (utiliser le fait que kxk = sup{f (x), f ∈
E 0 , kf kE 0 ≤ 1}),
– si xn * x et si fn → f dans E 0 alors fn (xn ) → f (x).
On se persuade aisément que la convergence faible n’entraine en général
pas la convergence forte (sauf en dimension finie et dans quelques cas ”pathologiques” comme celui de l1 ). On a cependant comme première conséquence
de la proposition 3.1 :
Lemme 3.4 (Lemme de Mazur) Soit (xn ) une suite convergeant faiblement
vers x dans E alors il existe une suite (yn ) avec chaque yn combinaison
convexe des {xk , k ≥ n} convergeant fortement vers x dans E.
Preuve:
σ(E,E 0 )
pour tout
Posons Cn := co({xk , k ≥ n}) comme xn * x on a x ∈ Cn
n. Comme Cn est convexe, il découle facilement de la proposition 3.1 que l’on
σ(E,E 0 )
= Cn et donc x ∈ Cn il existe donc yn ∈ Cn tel que kx−yn k ≤ 1/n
a Cn
ce qui achève la preuve. 2
Une autre conséquence de la proposition 3.1 est donnée par :
Proposition 3.2 Soit f : E → R∪{+∞} une fonction convexe s.c.i pour la
topologie forte de E alors f est s.c.i. pour σ(E, E 0 ). En particulier, si xn * x
alors
f (x) ≤ lim inf f (xn ).
Preuve:
Il suffit de remarquer que les sous-niveaux de f (i.e. {f ≤ λ}, λ ∈ R) sont
convexes fermés donc faiblement fermés. Le deuxième point résulte du fait
que la semi-continuité inférieure faible implique la semi-continuité inférieure
faible séquentielle.
2
Si E est un espace de Banach de dimension infinie, la topologie faible
σ(E, E 0 ) n’est jamais métrisable. C’est l’objet de l’exercice suivant :
Exercice 3.1 Soit E un espace de Banach de dimension infinie dont on suppose que la topologie faible σ(E, E 0 ) est métrisable par la distance d. Montrer
qu’il existe alors une suite xn telle que kxn k → +∞ et xn * 0 et conclure.
70
Exercice 3.2 Soit E un espace de Banach de dimension infinie, montrer
que toute base algébrique de E est non dénombrable (utiliser le théorème de
Baire). Supposons maintenant que σ(E, E 0 ) soit métrisable montrer que ceci
implique l’existence d’une famille au plus dénombrable de E 0 engendrant E 0 .
Conclure.
Exercice 3.3 Soit E un espace de Banach, (xn ) ∈ E N et x ∈ E tels que
xn * x. Montrer que pour tout n, il existe zn ∈ co({xk , k ≤ n}) tel que zn →
x (on pourra raisonner par l’absurde et utiliser un argument de séparation).
Exercice 3.4 Soit E un espace de Banach,P(xn ) ∈ E N et x ∈ E tels que
xn * x. Pour tout n ≥ 1 on pose zn := n−1 ( ni=1 xi ), montrer que zn * x.
Proposition 3.3 Soit E et F deux espaces de Banach et T une application
linéaire de E dans F . Alors T est continue de E (fort) dans F (fort) si et
seulement si elle est continue de (E, σ(E, E 0 )) dans (F, σ(F, F 0 )).
Preuve:
Supposons d’abord T continue de E fort dans F fort. Pour tout f ∈ F 0 , f ◦ T
appartient à E 0 et donc est continue pour σ(E, E 0 ), on en déduit que T est
continue de (E, σ(E, E 0 )) dans (F, σ(F, F 0 )) grâce au lemme 3.1.
Supposons maintenant que T est continue de (E, σ(E, E 0 )) dans (F, σ(F, F 0 ))
alors son graphe est fermé pour σ(E × F, E 0 × F 0 ) et donc aussi fortement
fermé dans E × F . Comme E et F sont de Banach, grâce au théorème du
graphe fermé (voir chapitre 4) on en déduit bien que T est continue de E
fort dans F fort. 2
3.2
Topologie faible-∗
La topologie faible-∗ sur E 0 , est définie comme suit :
Définition 3.2 La topologie faible-∗ sur E 0 , notée σ(E 0 , E) est la topologie
la moins fine (i.e. ayant le moins d’ouverts) rendant continus les formes
linéaires f 7→ f (x) pour tout x ∈ E.
Il est à noter qu’on dispose désormais de trois topologies sur E 0 : la topologie forte, la topologie faible-∗, σ(E 0 , E) et la topologie faible σ(E 0 , E 00 ).
En dimension finie, évidemment ces trois topologies coı̈ncident. De plus
71
comme E s’injecte continûment dans E 00 , σ(E 0 , E) est toujours moins fine
que σ(E 0 , E 00 ).
En transposant ce que nous avons vu sur la topologie faible σ(E, E 0 ), on
montre aisément qu’un système fondamental de voisinages de f ∈ E 0 pour la
topologie faible ∗ σ(E, E 0 ) est donné par les ensembles de la forme :
Vε,x1 ,...xk := {g ∈ E 0 : |(g − f )(xi )| < ε, i = 1, . . . , k}
avec ε > 0, k ∈ N∗ et x1 , . . . , xk ∈ E k . La topologie faible-∗ sur E 0 est donc
une topologie d’evtlcs sur E 0 associée à la famille de semi-normes f ∈ E 0 7→
qx (f ) := |f (x)|, pour x ∈ E.
On a naturellement une notion de convergence pour la topologie faible-∗
sur E 0 qui se définit comme suit. On dit qu’une suite (fn )n de E 0 converge
∗
faiblement-∗ vers f , ce que l’on note fn * f si et seulement si fn (x) →
f (x), pour tout x ∈ E. On vérifie sans peine les propriétés suivantes de la
convergence faible-∗ :
– si (fn ) converge faiblement-∗, sa limite faible-∗ est unique,
∗
– si fn → f (i.e. kfn − f k → 0) alors fn * f ,
∗
– si fn * f pour σ(E 0 , E 00 ) alors fn * f ,
– toute suite faiblement-∗ convergente de E 0 est bornée,
∗
– si fn * f alors kf k ≤ lim inf n kfn k,
∗
– si fn * f et si xn → x dans E (fort) alors fn (xn ) → f (x).
Le résultat de compacité suivant découle du théorème de Banach-AlaogluBourbaki que nous avons établi au chapitre 1 dans le cadre plus général des
evtlc :
Théorème 3.1 (Banach-Alaoglu-Bourbaki) La boule unité fermée de E 0 ,
BE 0 est compacte pour la topologie faible ∗ σ(E 0 , E).
Terminons ce paragraphe par un critère utile de fermeture faible ∗ dont
on omettra ici la preuve (le lecteur pourra consulter par exemple [22])
Théorème 3.2 (Krein-Smulian) Soit E un espace de Banach et C un convexe
de E 0 tel que C ∩ rBE 0 soit fermé pour la topologie faible ∗ pour tout r > 0,
alors C est fermé pour la topologie faible ∗.
3.3
Espaces réflexifs
72
Etant donné un espace de Banach E (ou plus généralement un evn), on
rappelle que E s’injecte dans son bidual E 00 via l’injection canonique J :
E → E 00 définie par :
J(x)(f ) := f (x), ∀x ∈ E, ∀f ∈ E 0 .
Il résulte du corollaire 1.2 que J est une isométrie de E sur E 00 , en particulier
J est une injection continue.
Définition 3.3 On dit que l’evn E est réflexif si J est surjective.
Autrement dit, dire que E est réflexif revient à dire qu’on peut identifier
E 00 à E. Evidemment tout espace de Hilbert est réfexif (ceci découle du
théorème de Riesz qui permet d’identifier un espace de Hilbert à son dual
topologique). Pour tout p ∈ (1, ∞) les espaces lp , Lp et W 1,p (Ω) sont réflexifs.
Par contre l1 , L1 , W 1,1 , l∞ , L∞ , W 1,∞ , C 0 , les espaces de mesures ne sont
pas réflexifs.
L’importance fondamentale de la réflexivité provient du résultat de compacité énoncé dans le théorème de Kakutani 3.3 plus bas. Avant d’énoncer
et de démontrer ce résultat important nous aurons besoin de deux lemmes
préliminaires :
Lemme 3.5 (Helly) Soit E un espace de Banach, f1 , ...., fn dans E 0 et α1 , ...., αn
des réels on a équivalence entre les assertions suivantes :
1. pour tout ε > 0, il existe xε ∈ BE tel que
|fi (xε ) − αi | < ε, ∀i = 1, ..., n
2. pour tout β1 , ...., βn ∈ Rn on a
|
n
X
βi αi | ≤ k
i=1
n
X
βi fi k.
i=1
Preuve:
Supposons d’abord 1., et soit β1 , ..., βn ∈ Rd , on a alors
|
X
i=1
βi αi | ≤ |
n
X
βi fi (xε )| + ε
i=1
≤k
n
X
|βi |
i=1
n
X
i=1
73
βi fi k + ε
n
X
i=1
|βi |
d’où l’on déduit 2. en faisant tendre ε vers 0.
Pour établir la réciproque remarquons que 1 signifie exactement que
α := (α1 , ...., αn ) ∈ F (BE ) avec F (x) := (f1 (x), ..., fn (x)) pour tout x ∈ E.
Supposons donc que α ∈
/ F (BE ), comme F (BE ) est convexe fermé dans Rn ,
en utilisant le théorème de séparation stricte, il existe β1 , ..., βn ∈ Rn et γ ∈ R
tels que
n
n
X
X
βi fi (x) < γ <
βi αi , ∀x ∈ BE
i=1
i=1
ce qui implique en particulier
k
n
X
βi fi k < |
i=1
n
X
βi αi |
i=1
contredisant ainsi la seconde assertion.
2
Lemme 3.6 (Goldstine) Soit E un espace de Banach, alors J(BE ) est dense
dans BE 00 pour la topologie σ(E 00 , E 0 ).
Preuve:
Soit η ∈ BE 00 et V un voisinage de η pour σ(E 00 , E 0 ), il s’agit de montrer que
V ∩ J(BE ) 6= ∅. Sans perte de généralité, on peut supposer qu’il existe n,
ε > 0 et f1 , ..., fn ∈ (E 0 )n tels que
V = {ξ ∈ E 00 : |(ξ − η)(fi )| < ε, ∀i = 1, ..., n}.
Posons αi := η(fi ) pour i = 1, ..., n et soit β1 , ..., βn ∈ Rn , on a alors puisque
η ∈ BE 00 :
n
n
X
X
X
|
βi αi | = |η(
βi fi )| ≤ k
βi fi k.
i=1
i=1
i=1
On déduit alors du lemme 3.5 qu’il existe xε ∈ BE tel que |fi (xε ) − αi | < ε
pour i = 1, ..., n ce qui signifie exactement que J(xε ) ∈ V et donc on a bien
V ∩ J(BE ) 6= ∅.
2
Théorème 3.3 (Kakutani) Soit E un espace de Banach alors E est réflexif
si et seulement si BE est compacte pour σ(E, E 0 ).
Preuve:
Supposons d’abord que E est réflexif on a alors J(BE ) = BE 00 et il résulte du
74
théorème de Banach-Alaoglu-Bourbaki que BE 00 est compacte pour σ(E 00 , E 0 ).
Il suffit donc de montrer que J −1 est continue de (E 00 , σ(E 00 , E 0 )) vers
(E, σ(E, E 0 )) pour en conclure que BE est compacte pour σ(E, E 0 ). Avec
le lemme 3.1, il s’agit donc de montrer que pour tout f ∈ E 0 , f ◦ J −1 est
continue pour σ(E 00 , E 0 ). Or si η ∈ E 00 il existe x ∈ E tel que η = J(x) on
a donc f (J −1 (η)) = f (x) = η(f ) et comme f ∈ E 0 , on en déduit bien que
f ◦ J −1 est continue pour σ(E 00 , E 0 ).
Réciproquement, supposons que BE soit compacte pour σ(E, E 0 ). Comme
J est continue de E (fort) dans E 00 (fort), il découle de la proposition 3.3
que J est continue de (E, σ(E, E 0 )) vers (E 00 , σ(E 00 , E 000 )). Comme σ(E 00 , E 0 )
est moins fine que σ(E 00 , E 000 ), J est aussi continue de (E, σ(E, E 0 )) vers
(E 00 , σ(E 00 , E 0 )). Cela implique que J(BE ) est compact pour σ(E 00 , E 0 ) mais
comme, par le lemme 3.6, J(BE ) est dense dans BE 00 pour σ(E 00 , E 0 ) on doit
avoir BE 00 = BE et donc E 00 = J(E).
2
Examinons maintenant quelques conséquences du théorème de Kakutani.
Corollaire 3.1 Soit E un espace de Banach réflexif et F un sev fermé de E
alors F muni de la topologie induite par la topologie forte de E est réflexif.
Preuve:
Il est facile de voir que la topologie faible σ(F, F 0 ) coı̈ncide avec la trace de
σ(E, E 0 ) à F de sorte que BF est compacte pour σ(F, F 0 ) car F est fermé
pour σ(E, E 0 ) et BE est compacte pour σ(E, E 0 ). D’après le théorème de
Kakutani, F est donc réflexif. 2
Corollaire 3.2 Soit E un espace de Banach, alors E est réflexif si et seulement si E 0 est réflexif.
Preuve:
Supposons d’abord E réflexif. Il résulte du théorème de Banach-AlaogluBourbaki que BE 0 est compacte pour σ(E 0 , E) mais comme E est réflexif,
σ(E 0 , E) = σ(E 0 , E 00 ) donc on déduit du théorème de Kakutani que E 0 est
réflexif.
Si E 0 est réflexif alors d’après ce qui précède E 00 est réflexif. Comme J
est une isométrie de E sur E 00 , on vérifie facilement que J(E) est un sev
fermé de E 00 et donc que J(E) est réflexif. Comme J −1 : J(E) → E est un
isomorphisme isométrique entre espaces de Banach on en déduit aisément
que E est réflexif.
2
75
Corollaire 3.3 Soit E un espace de Banach réflexif et K une partie convexe
fermée bornée de E alors K est compacte pour σ(E, E 0 ).
Preuve:
K est fermé faible en vertu de la proposition 3.1 et inclus dans une boule
fermée laquelle est faiblement compacte en vertu du théorème de Kakutani.
2
Corollaire 3.4 Soit E un espace de Banach réflexif, C un convex non vide
fermé de E, f : C → R ∪ +∞ une fonction convexe s.c.i. non identiquement
égale à +∞, si C est bornée ou si
f (x) → +∞ quand x ∈ C, kxk → +∞.
(3.1)
alors il existe x ∈ C tel que f (x) ≤ f (x), ∀x ∈ C.
Preuve:
Soit x ∈ C tel que f (x) < +∞ alors A := {y ∈ C : f (y) ≤ f (x)} est compact
pour σ(E, E 0 ) d’après le corollaire 3.3 et f est faiblement s.c.i. sur A d’après
la proposition 3.2 ; f atteint donc son mimimum sur A qui est aussi son
minimum sur C.
2
3.4
Espaces séparables
Définition 3.4 On dit que l’espace de Banach E est séparable si et seulement si E possède une partie dénombrable dense.
Proposition 3.4 Soit E un espace de Banach tel que E 0 soit séparable alors
E est séparable.
Preuve:
Soit (fn )n∈N ∈ E 0N dense dans E 0 . Pour n ∈ N, soit xn ∈ E tel que kxn k = 1
et
1
fn (xn ) ≥ kfn k.
2
Soit F l’ensemble des combinaisons linéaires à coefficients dans Q de {xn , n ∈
N}. Notons que F est dénombrable, montrons maintenant que F est dense
dans E. Pour cela, comme F est dense dans G := vect({xn , n ∈ N} il suffit de
montrer que G est dense dans E. D’après le corollaire 1.6 il suffit de montrer
que si f ∈ E 0 vérifie f (x) = 0 pour tout x ∈ G alors f ≡ 0. Soit donc f
76
vérifiant la propriété précédente ε > 0 et n ∈ N tel que kf − fn k ≤ ε/3, on
a alors
kf k ≤
ε
ε
ε
ε
+ kfn k ≤ + 2fn (xn ) = + 2(fn − f )(xn ) ≤ + 2kfn − f k ≤ ε
3
3
3
3
comme ε > 0 est arbitraire, on, en déduit bien que f ≡ 0.
2
Il est à noter que la séparabilité de E n’entraine généralement pas celle
de E 0 (par exemple L1 (Ω) est séparable tandis que son dual L∞ (Ω) ne l’est
pas, nous renvoyons le lecteur au chapitre 5 pour plus de détails). Dans le
cas où E est réflexif on a cependant :
Corollaire 3.5 Soit E un espace de Banach alors E est réflexif et séparable
si et seulement si E 0 est réflexif et séparable.
Preuve:
Si E 0 est réflexif alors E aussi (proposition 3.4) et si E 0 est séparable alors
E aussi (corollaire 3.2). Réciproquement si E est réflexif et séparable alors
E 00 = J(E) est réflexif et séparable et donc E 0 aussi. 2
Théorème 3.4 Soit E un espace de Banach alors E est séparable si et seulement si la trace de la topologie faible-∗ σ(E 0 , E) à BE 0 est métrisable.
Preuve:
Le fait que si E est séparable alors la trace de la topologie faible-∗ σ(E 0 , E)
à BE 0 est métrisable résulte de la proposition 1.1.
Réciproquement supposons que la distance d métrise σ(E 0 , E) sur BE 0 .
Pour tout n ∈ N∗ , B(0, 1/n) := {f ∈ BE 0 : d(0, f ) < 1/n} est un voisinage de 0 pour σ(E 0 , E) de sorte qu’il existe εn , In fini et (xi )i∈In tels que
Vn := {f ∈ BE 0 : |f (xi )| < εn , ∀i ∈ In } ⊂ B(0, 1/n). Pour montrer que E
est séparable il nous suffit de montrer que l’espace vectoriel engendré par
∪n {xi , i ∈ In }, F est dense dans E. Soit f ∈ BE 0 telle que f (x) = 0 pour
tout x ∈ F alors f ∈ Vn pour tout n ∈ N et donc d(0, f ) = 0 de sorte que
f = 0, on conclut alors avec le corollaire 1.6.
2
De manière symétrique on a :
Proposition 3.5 Soit E un espace de Banach, si E 0 est séparable alors la
trace de la topologie faible σ(E, E 0 ) à BE est métrisable.
77
La réciproque est également vraie mais sa démonstration est plus difficile.
Noter que la proposition précédente n’est pas contradictoire avec le fait que
σ(E, E 0 ) ne soit jamais métrisable sur E tout entier lorsque E est de dimension infinie. La métrisabilité de la topologie faible-∗ sur les bornés combinée
au théorème de Banach-Alaoglu-Bourbaki fournit immédiatement le résultat
de compacité séquentielle suivant :
Corollaire 3.6 Soit E un espace de Banach séparable et soit (fn )n une suite
bornée de E 0 , alors (fn )n possède une sous-suite qui converge pour la topologie
faible-∗ σ(E 0 , E).
Preuve:
Sans perte de généralité nous pouvons supposer tous les fn dans BE 0 qui est
un compact métrisable pour σ(E 0 , E), d’où le résultat.
2
Dans le cas où E est réflexif, on a de même le résultat de compacité
séquentielle suivant :
Théorème 3.5 Soit E un espace de Banach réflexif et (xn )n une suite bornée
de E alors (xn )n possède une sous-suite qui converge faiblement.
Preuve:
Soit M := vect{xn , n ∈ N}, M est un sev fermé de E donc est réflexif (corollaire 3.1) et M est séparable par construction. Ainsi M 0 est séparable et donc
pour tout r > 0, σ(M, M 0 ) est métrisable sur rBM qui est compacte pour
σ(M, M 0 ) d’après le théorème de Kakutani. La suite (xn )n admet donc une
sous-suite convergente pour σ(M 0 , M ), cette sous-suite est aussi évidemment
convergente pour σ(E 0 , E) (par restriction des éléments de E 0 à M ).
2
3.5
Espaces uniformément convexes
Définition 3.5 Soit E un espace de Banach, on dit que E est dit uniformément convexe si pour tout ε > 0 il existe δ > 0 tel que pour tout x
et y dans BE si kx − yk ≥ ε alors
x+y
≤ 1 − δ.
2
78
La définition précédente est de nature géométrique et exprime le fait que
la boule unité de E doit être ”bien ronde”. Cette propriété n’est pas stable
par passage à une norme équivalente (Rd est uniformément convexe lorsque
muni de la norme euclidienne il ne l’est pas lorsque muni de la norme 1
ou de la norme du max). Tout espace de Hilbert est uniformément convexe
(conséquence facile de l’identité du parallélogramme), les espaces Lp et lp
sont uniformément convexes pour 1 < p < ∞, L1 , l1 , L∞ et l∞ ne sont pas
uniformément convexes.
Théorème 3.6 (Milman-Pettis) Tout espace de Banach uniformément convexe
est réflexif.
Preuve:
Supposons E uniformément convexe et montrons que J(BE ) = BE 00 . Comme
J(BE ) est clairement fermée, il suffit par homogénéité de montrer que J(BE )
est dense (fort) dans SE 00 := {η ∈ E 00 : kη| = 1}. Soit η ∈ SE 00 et ε >
0 montrons qu’il existe x ∈ BE tel que kJ(x) − ηk ≤ ε. Comme E est
uniformément convexe, il existe δ ∈ (0, 1) tel que kx + yk ≤ 2 − 2δ pour tout
(x, y) ∈ BE2 tels que kx − yk ≥ ε. Choisissons f ∈ E 0 tel que
kf k = 1 et η(f ) ≥ 1 −
δ
2
d’après le lemme de Goldstine, il existe x ∈ BE tel que
δ
|η(f ) − f (x)| < .
2
Supposons que η ∈
/ B(J(x), ε) alors comme E 00 \ B(J(x), ε) est ouvert pour
00
0
σ(E , E ), il résulte du lemme de Goldstine qu’il existe y ∈ BE tel que
kJ(y) − J(x)k = kx − yk > ε et |η(f ) − f (y)| <
on a alors d’une part
1
kx + yk ≥ 1 − δ
2
et d’autre part
1−
δ
1
δ
1
δ
≤ η(f ) < f (x + y) + ≤ kx + yk +
2
2
2
2
2
d’où la contradiction recherchée. 2
79
δ
2
Théorème 3.7 Soit E un espace de Banach uniformément convexe et (xn )
une suite convergeant faiblement vers x dans E, si kxn k converge vers kxk
alors (xn ) une suite converge fortement vers x dans E.
Preuve:
Si x = 0, le résultat est évident, on peut donc sans perte de généralité
supposer x 6= 0. En posant λn := max(kxn k, kxk), on a λn → kxk > 0. En
définissant alors yn := λ−1
n xn et y := x/kxk, on a (yn + y)/2 * y et donc
kyk = 1 ≤ lim inf
n
yn + y
2
et comme kyn k ≤ 1 on a en fait k yn2+y k → 1. Avec l’uniforme convexité de E
ceci implique que kyn − yk → 0 ce qui implique aussi que kxn − xk → 0.
2
80
Chapitre 4
Opérateurs linéaires,
opérateurs compacts
On rappelle dans ce chapitre un certain nombre de résultats, pour la
plupart déja vus au premier semestre dans le cours de Frédéric Paulin, sur
les opérateurs linéaires dans les espaces de Banach et en particulier sur les
opérateurs compacts. Dans tout ce chapitre E et F désigneront des espaces
de Banach, nous noterons L(E, F ) (respectivement L(E)) l’espace des applications linéaires continues de E dans F (respectivement des endomorphismes
continus de E) muni de sa norme d’opérateur habituelle.
4.1
Généralités
Par la suite pour f ∈ E 0 et x ∈ E, nous noterons parfois hf, xi au lieu
de f (x). Soit T ∈ L(E, F ) l’adjoint de T noté T ∗ est l’opérateur linéaire
F 0 → E 0 défini par :
hT ∗ f, xi = hf, T xi , ∀f ∈ F 0 , ∀x ∈ E.
On vérifie immédiatement que T ∗ ∈ L(F 0 , E 0 ) (et que T et T ∗ ont même
norme). Pour A ⊂ E, on note
A⊥ := {f ∈ E 0 : f (x) = 0, ∀x ∈ A}
et de même pour B ⊂ E 0 , on note
B ⊥ := {x ∈ E : f (x) = 0, ∀f ∈ B}.
Notons que si T ∈ L(E, F ) on a
ker(T ) = (Im(T ∗ ))⊥ , ker(T ∗ ) = (Im(T ))⊥
et de plus :
81
(4.1)
Lemme 4.1 Soit T ∈ L(E, F ) alors Im(T ) est fermé si et seulement si
Im(T ) = (kerT ∗ )⊥ .
(4.2)
Preuve:
Si (4.2) a lieu alors Im(T ) est évidemment fermé. Par ailleurs, l’inclusion
Im(T ) ⊂ (ker(T ∗ ))⊥
est évidente. Supposons Im(T ) fermé et que l’inclusion précédente soit stricte,
alors il existe y ∈ (ker(T ∗ ))⊥ \ Im(T ). Par le théorème de séparation stricte,
il existe alors f ∈ F 0 telle que f (y) > 0 et f ≡ 0 sur Im(T ) c’est à dire
f ∈ ker(T ∗ ) ce qui contredit le fait que y ∈ (ker(T ∗ ))⊥ . 2
Le lemme 4.1 découle évidemment de l’énoncé (légèrement) plus général :
Exercice 4.1 Soit A une partie de E, montrer que (A⊥ )⊥ = vect(A).
Exercice 4.2 Soit B une partie de E 0 , montrer que vect(B) ⊂ (B ⊥ )⊥ . Montrer qu’il y a égalité dans le cas où E est réflexif, est ce le cas en général ?
Caractériser dans le cas général (B ⊥ )⊥ en terme de la topologie faible ∗
σ(E 0 , E).
4.2
Conséquences de la théorie de Baire
On rappelle dans cette section quelques résultats sur les applications
linéaires continues entre espaces de Banach qui ont déja été vus et résultent
du théorème de Baire.
Théorème 4.1 (Banach-Steinhaus ou principle of uniform boudedness) Soit
E un espace de Banach, F un evn et (fi )i∈I une famille d’éléments de
L(E, F ). Si,
∀x ∈ E, sup kfi (x)kF < +∞
i∈I
alors
sup kfi kL(E,F ) < +∞.
i∈I
82
Preuve:
Soit En := {x ∈ E : kfi (x)kF ≤ n, ∀i ∈ I}, chaque En est fermé et par
hypothèse on a ∪n En = E. Il résulte donc du théorème de Baire qu’il existe
n0 tel que En0 soit d’intérieur non vide : soit donc r > 0 et x0 ∈ E tels que
kfi (x0 + ru)kF ≤ n0 , ∀i ∈ E, ∀u ∈ BE .
Pour tout u ∈ BE et tout j ∈ I, on a alors
1
n0 + sup kfi (x0 )kF .
kfj (u)kF ≤
r
i∈I
2
Une autre conséquence du théorème de Baire est le théorème de l’application ouverte :
Théorème 4.2 (Théorème de l’application ouverte) Soit E et F deux espaces de Banach et soit f ∈ L(E, F ) surjective. Alors f est une application
ouverte au sens où pour tout U ouvert de E, f (U ) est un ouvert de F .
Preuve:
Par linéarité de f , il suffit de montrer qu’il existe r0 > 0 tel que BF (0, r0 ) ⊂
f (BE (0, 1)). Soit Fn := nf (BE (0, 1)), comme f est surjective, F = ∪n Fn et
donc il résulte du théorème de Baire qu’il existe n0 tel que Fn0 soit d’intérieur
non vide. Ainsi, il existe y0 ∈ E et ρ > 0 tels que BF (y0 , ρ) ⊂ f (BE (0, n0 )),
par linearité, on a aussi BF (−y0 , ρ) ⊂ f (BE (0, n0 )) de sorte que BF (0, ρ) =
−y0 + BF (y0 , ρ) ⊂ f (BE (0, 2n0 )). Par homogénéité, on a donc BF (0, r) ⊂
f (BE (0, 1)) avec r = ρ/2n0 .
Prouvons maintenant que BF (0, r) ⊂ f (B E (0, 2)). Soit y ∈ BF (0, r),
il existe x1 ∈ BE (0, 1) tel que y − f (x1 ) ∈ BF (0, r/2), comme BF (0, r/2) ⊂
f (BE (0, 1/2)), il existe x2 ∈ BE (0, 1/2) tel que y−f (x1 )−f (x2 ) ∈ BF (0, r/4).
En itérant l’ argument, on construit une suite (xn )n de E telle que kxn kE ≤
1/2n−1 et ky − f (x1 + .... + xn )kF ≤ r/2n pour tout n. Comme la suite
des sommes partielles x1 + .... + xn est de Cauchy sequence, elle converge
vers un certain x ∈ B E (0, 2) et par continuité y = f (x), ce qui prouve que
BF (0, r) ⊂ f (B E (0, 2)) ⊂ f (BE (0, 5/2)) et donc BF (0, r0 ) ⊂ f (BE (0, 1))
avec r0 = 2r/5.
2
Une application immédiate du théorème précédent est que si E est de
Banach muni de n’importe laquelle des deux normes k.k1 et k.k2 et s’il existe
C ≥ 0 tel que k.k1 ≤ Ck.k2 alors k.k1 et k.k2 sont en fait équivalentes. Une
autre conséquence du résultat précédent est le théorème suivant de continuité
automatique dû à Banach :
83
Théorème 4.3 (Théorème de continuité de l’inverse de Banach) Soit E et
F deux espaces de Banach f ∈ L(E, F ) une bijection alors f −1 ∈ L(F, E).
Une conséquence classique du théorème de Banach nous est fournie par :
Théorème 4.4 (Théorème du graphe fermé) Soit E et F deux espaces de
Banach, f ∈ L(E, F ) tel que le graphe de f soit fermé dans E × F (muni sa
structure d’evn produit) alors f ∈ L(E, F ).
Preuve:
Soit G le graphe de f muni de la norme induite par celle de E × F , comme
G est fermé dans E × F c’est un espace de Banach. L’application linéaire
(x, y) = (x, f (x)) ∈ G 7→ x est une bijection linéaire continue, il résulte donc
du théorème de Banach que son inverse : x ∈ E 7→ (x, f (x)) est continue, la
continuité de f en découle trivialement.
2
Le résultat suivant est classique mais peut s’avérer utile :
Proposition 4.1 Soit E un espace de Banach et f ∈ L(E) tel que kf kL(E) <
1 alors id + f est inversible avec
−1
(id + f )
=
∞
X
(−1)k f k
k=0
Preuve:
Comme L(E) est de Banach et kf kL(E) < 1, la suite des sommes partielles
Sn :=
n
X
(−1)k f k
k=0
étant de Cauchy, elle converge. De plus Sn ◦ (id + f ) = id + (−1)n f n+1 , ce
dont on tire le résultat voulu en faisant tendre n vers ∞. 2
4.3
Opérateurs compacts, alternative de Fredholm
Par la suite, nous noterons BE la boule unité fermée de E.
Définition 4.1 Soit T ∈ L(E, F ) on dit que T est un opérateur compact si
et seulement si T (BE ) est relativement compact. On note K(E, F ) l’ensemble
des opérateurs compacts de E vers F et K(E) l’ensemble des endomorphismes
compacts de E.
84
Il découle immédiatement de la définition précédente que la composition
(à droite ou à gauche) d’un opérateur compact et d’un opérateur linéaire
continu est compacte.
Lemme 4.2 K(E, F ) est un sous-espace vectoriel fermé de L(E, F ).
Preuve:
Le seul point à établir est la fermeture de K(E, F ). Supposons donc que Tn ∈
K(E, F ) et Tn → T , il s’agit de montrer que T (BE ) est relativement compact.
Comme F est complet, ceci revient à montrer que T (BE ) est precompact.
Soit ε et n tel que kTn − T k ≤ ε/2, comme Tn est compact, il existe k et
y1 , . . . , yk ∈ F k tels que Tn (BE ) ⊂ ∪ki=1 B(yi , ε/2) de sorte que T (BE ) ⊂
∪ki=1 B(yi , ε). 2
Proposition 4.2 Soit E et F deux espaces de Banach et T ∈ K(E, F ) alors
si (xn ) est une suite de E convergeant faiblement vers x, T xn converge fortement dans F vers T x.
Preuve:
Comme (xn ) est bornée et T est compact, T xn prend ses valeurs dans un
compact (fort) de F . Comme par ailleurs T xn converge faiblement vers T x
on en déduit que T x est l’unique valeur d’adhérence forte de la suite (T xn )
et donc que toute la suite converge fortement vers T x. 2
Les opérateurs de rang fini (i.e. dont l’image est de dimension finie) sont
évidemment compacts et donc les limites dans L(E, F ) d’opérateurs de rang
fini sont des opérateurs compacts. Réciproquement, il n’est pas vrai en général
qu’un opérateur compact soit limite d’opérateurs de rang fini (mais cette
propriété est vraie dans les espaces de Hilbert).
Théorème 4.5 Soit T ∈ K(E, F ) alors T ∗ ∈ K(F 0 , E 0 ). Réciproquement, si
T ∗ ∈ K(F 0 , E 0 ) alors T ∈ K(E, F ).
Preuve:
Soit (vn ) une suite de BF 0 il s’agit de montrer que T ∗ (vn ) possède une sous
suite convergente (ou de manière équivalente, de Cauchy) dans E 0 . Soit K :=
T (BE ), K est un compact de F , et posons
fn (y) = hvn , yi , ∀y ∈ K.
Comme les vn sont dans BF 0 , chaque fn est 1-Lipschitzienne sur K et fn (0) =
0 de sorte qu’avec le théorème d’Ascoli, la suite (fn ) possède une sous-suite
85
(encore notée fn par simplicité) convergeant uniformément sur K vers f ∈
C(K, R). Par construction, on a
kT ∗ vn − T ∗ vm kE 0 ≤ sup |(fn − fm )(y)|
y∈K
si bien que la suite (T ∗ vn ) est de Cauchy dans E 0 .
Réciproquement, si T ∗ ∈ K(F 0 , E 0 ), on déduit de ce qui précède T ∗∗ ∈
K(E 00 , F 00 ) c’est-à dire que T ∗∗ (BE 00 ) est relativement compact dans F 00 .
Comme T (BE ) ⊂ T ∗∗ (BE 00 ) et F est fermé dans F 00 , on en déduit bien que
T (BE ) est relativement compact dans F .
2
Lemme 4.3 (Lemme de Riesz) Soit E un evn et F un sev fermé strict de
E, pour tout ε ∈ (0, 1), il existe u ∈ E tel que kuk = 1 et d(u, F ) ≥ 1 − ε.
Preuve:
Soit v ∈
/ F , d := d(v, F ) > 0 (car F est fermé) et u0 ∈ F tel que
d ≤ kv − u0 k ≤
posons alors
u :=
d
1−ε
(4.3)
v − u0
kv − u0 k
et montrons que d(u, F ) ≥ 1 − ε. Soit f ∈ F , on a alors en utilisant (4.3) et
le fait que u0 + kv − u0 kf ∈ F :
ku − f k =
d
1
v − u0 − kv − u0 kf ≥
≥ 1 − ε.
kv − u0 k
kv − u0 k
2
Théorème 4.6 (Alternative de Fredholm) Soit T ∈ K(E), alors on a :
1. ker(I − T ) est de dimension finie,
2. Im(I − T ) est fermé et
Im(I − T ) = (ker(I − T ∗ ))⊥ ,
3. ker(I − T ) = {0} si et seulement si Im(I − T ) = E,
4. dim ker(I − T ) = dim ker(I − T ∗ ).
86
Preuve:
1. Soit F := ker(I − T ) on a BF = T (BF ) ⊂ T (BE ) et donc BF est relativement compacte ce qui implique que F est de dimension finie.
2. Soit fn := un − T un une suite de Im(I − T ) convergeant vers f ∈ E,
montrons que f ∈ Im(I − T ). Comme ker(I − T ) est de dimension finie, il
existe vn ∈ ker(I − T ) tel que
kun − vn k = d(un , ker(I − T )).
Et évidemment on a
fn = un − vn − T (un − vn ).
(4.4)
Montrons que (un − vn ) est bornée, si tel n’était pas le cas, à une extraction
près, on aurait kun − vn k → ∞. En posant wn := (un − vn )/kun − vn k, et en
utilisant (4.4) et le fait que fn est borné, ceci implique que wn − T wn → 0.
Comme T est compact, on peut, à nouveau à une extraction près supposer
que T wn converge vers z ∈ E et donc wn → z et z ∈ ker(I − T ). Mais par
ailleurs, on a :
d(wn , ker(I − T )) =
1
d(un , ker(I − T )) = 1
kun − vn k
et donc en passant à la limite quand n → ∞, on obtient d(z, ker(I − T )) = 1
ce qui est absurde. Ainsi, on a bien que (un − vn ) est bornée, comme T est
compacte on peut à une extraction près supposer que T (un − vn ) converge
vers un certain g ∈ E de sorte que un − vn converge vers f + g et donc
f = (f + g) − T (f + g) ∈ Im(I − T ). Comme Im(I − T ) est fermé, on déduit
du lemme 4.1 que
Im(I − T ) = (ker(I − T ∗ ))⊥ .
3. Supposons d’abord que ker(I − T ) = {0} et supposons par l’absurde
que E1 := Im(I − T ) 6= E. On a T (E1 ) ⊂ E1 et il découle du point précédent
que E1 est fermé et donc que T |E1 est compact. Posons E2 := (I − T )2 (E) =
(I − T )(E1 ), comme (I − T ) est injective E2 est un sev strict de E1 et est
fermé d’après le point 2. ; en posant En := (I −T )n (E), En est ainsi une suite
strictement décroissante de sev fermés de E. Il résulte du lemme de Riesz
qu’il existe xn ∈ En tel que kxn k = 1 et
d(xn , En+1 ) ≥ 1/2.
Soit n > m, on a
T xm − T xn = T xm − xm − (T xn − xn ) + xm − xn
87
(4.5)
et par construction, les vecteurs T xm − xm , T xn − xn et xn appartiennent à
Em+1 , de sorte qu’avec (4.5), on a :
kT xm − T xn k ≥ d(xm , Em+1 ) ≥
1
2
ce qui est absurde puisque T est compact et (xn ) est bornée.
Réciproquement supposons que Im(I − T ) = E, il découle alors du lemme
4.1 que ker(I −T ∗ ) = {0} et donc, en utilisant ce qui précède, Im(I −T ∗ ) = E 0
et donc avec (4.1) :
ker(I − T ) = (Im(I − T ∗ ))⊥ = {0}.
4. Posons d := dim ker(I − T ) et d∗ := dim ker(I − T ∗ ) et montrons
tout d’abord que d∗ ≤ d. Supposons par l’absurde que d < d∗ . Comme
ker(I − T ) est de dimension finie, il existe un projecteur continu P de E
sur ker(I − T ) (voir [2] pour les détails). De plus Im(I − T ) = ker(I − T ∗ )⊥
est de codimension finie d∗ et admet donc un supplémentaire F fermé de
dimension d∗ dans E. Comme d < d∗ , il existe un opérateur linéaire Λ :
ker(I − T ) → F injectif et non surjectif. Posons alors S := T + Λ ◦ P , S
est un opérateur compact car Λ ◦ P est de rang fini. Soit u ∈ ker(I − S) :
0 = (u − T u) − (Λ ◦ P )(u) on a alors u − T u ∈ Im(I − T ) ∩ F et donc
u − T u = 0 et Λ(P u) = 0. Comme u ∈ ker(I − T ), P u = u et donc u = 0
car Λ est injective. On a donc ker(I − S) = {0} si bien, qu ’en vertu du
point 3., Im(I − S) = E. Soit f ∈ F avec f ∈
/ Im(Λ), s’il existait u ∈ E tel
que (I − S)(u) = u − T u − (Λ ◦ P )(u) = f alors on aurait u − T u ∈ F et
donc u − T u = 0 ce qui impliquerait que f ∈ Im(Λ). Donc (I − S) n’est pas
surjective ce qui constitue la contradiction cherchée. On a donc bien d∗ ≤ d.
Appliquant le même argument que précédemment à T ∗ , il vient
dim ker(I − T ∗∗ ) ≤ dim ker(I − T ∗ ) ≤ dim ker(I − T )
comme par ailleurs il est évident que ker(I − T ) ⊂ ker(I − T ∗∗ ), ceci permet
d’en conclure que d = d∗ .
2
Le théorème précédent appelle quelques commentaires. Tout d’abord le
point 3. exprime que les opérateurs de la forme (I − T ) avec T compact
sont injectifs si et seulement si ils sont surjectifs, cette propriété (automatique et familière en dimension finie) est remarquable en dimension infinie.
Ensuite, l’alternative de Fredholm proprement dite concerne la solvabilité de
l’équation u − T u = f . Elle exprime que :
– ou bien pour tout f ∈ E, l’équation u − T u = f possède une unique
solution
88
– ou bien l’équation homogène u − T u = 0 possède d = dim ker(I − T )
solutions linéairement indépendantes et dans ce cas, l’équation non homogène u−T u = f est résoluble si et seulement si f vérifie d conditions
d’orthogonalité correspondant à f ∈ ker(I − T ∗ )⊥ .
4.4
Décomposition spectrale des opérateurs
compacts autoadjoints
Pour la preuve des résultats de ce paragraphe et en particulier l’important
théorème spectral, nous renvoyons le lecteur au cours de Frédéric Paulin [15].
Soit T ∈ L(E), l’ensemble résolvant de T , ρ(T ) est donné par définition
par :
ρ(T ) := {λ ∈ R : T − λI bijective}.
Le spectre de T , noté σ(T ) est le complémentaire de l’ensemble résolvant
de T . On dit que λ ∈ R est une valeur propre de T (notation : λ ∈ VP(T ))
si et seulement si (T − λI) n’est pas injective et dans ce cas on appelle
ker(T − λI) 6= {0} l’espace propre associé à la valeur propre λ.
On a toujours VP(T ) ⊂ σ(T ) mais (hormis évidemment en dimension
finie) l’inclusion est en général stricte. Par exemple pour T ∈ L(lp ) défini par
T ((xn )n ) = (0, x0 , x1 , ....), 0 est dans le spectre de T car T n’est pas surjective
mais n’est pas valeur propre de T car T est injective.
Proposition 4.3 Soit T ∈ L(E), le spectre de T est un ensemble compact
inclus dans l’intervalle [−kT k, kT k].
Pour un opérateur compact en dimension infinie on a :
Théorème 4.7 Soit E un espace de Banach de dimension infinie et soit
T ∈ K(E). Alors on a :
1. 0 ∈ σ(T ),
2. σ(T ) \ {0} = VP(T ) \ {0},
3. l’une des situations suivantes
– ou bien σ(T ) = {0},
– ou bien σ(T ) \ {0} est fini,
– ou bien σ(T ) \ {0} est une suite qui tend vers 0.
Dans le cas où E = H est un espace de Hilbert, pour T ∈ L(H), en
identifiant H 0 à H, on peut identifier T ∗ à un élément de L(H). Dans ce
cadre Hilbertien, les opérateurs autoajoints sont alors définis par :
89
Définition 4.2 Soit H un espace de Hilbert et T ∈ L(H) on dit que T est
autoajoint si T ∗ = T c’est-à-dire si
hT u, vi = hu, T vi , ∀(u, v) ∈ H × H.
Une première propriété spectrale des opérateurs autoadjoints nous est
fournie par la
Proposition 4.4 Soit H un espace de Hilbert et T ∈ L(H) un opérateur
autoadjoint. On pose
m := inf{hT u, ui , u ∈ H, kuk ≤ 1}, M := sup{hT u, ui , u ∈ H, kuk ≤ 1}.
Alors σ(T ) ⊂ [m, M ] et (m, M ) ∈ σ(T )2 .
On termine ce chapitre avec une propriété fondamentale des opérateurs
compacts et autoadjoints :
Théorème 4.8 (Théorème spectral pour les opérateurs compacts autoadjoints) Soit H un espace de Hilbert séparable et T un opérateur autoadjoint
compact de H, alors il existe une base hilbertienne de H formée de vecteurs
propres de T .
90
Chapitre 5
Espaces Lp
On suppose le lecteur familier avec les résultats de base de la théorie de
la mesure. On se limitera dans ce chapitre aux espaces de Lebesgue pour la
mesure de Lebesgue (ce qui signifie que dans ce chapitre quand on parlera de
”presque partout”, ce sera au sens de la mesure de Lebesgue) sur un ouvert Ω
de Rd , en laissant le soin au lecteur de généraliser les résultats à des espaces
plus généraux. Enfin, on notera |A| la mesure de Lebesgue de la partie A de
Rd et χA son indicatrice. On note L1 (Ω) l’espace des fonctions intégrables
à valeurs réelles (en fait des classes d’équivalence pour la relation d’égalité
presque partout, c’est à dire que l’on identifie naturellement deux fonctions
intégrables qui coı̈ncident presque partout). Pour f ∈ L1 (Ω) on note
Z
kf kL1 :=
|f (x)|dx.
Ω
Quand cela n’engendrera pas de confusion, on notera simplement par la suite
R
p
1
1
L1 (et de même
pour
L
)
plutôt
que
L
(Ω)
et
pour
f
∈
L
(Ω),
on
notera
f
R
au lieu de Ω f (x)dx.
5.1
Rappels d’intégration
Passons en revue quelques résultats de base qu’il faut absolument connaitre.
Théorème 5.1 (Théorème de convergence monotone Rde Beppo Levi) Soit
(fn )n une suite croissante d’éléments de L1 . Si supn fn < ∞ alors (fn )
converge presque partout vers f = supn fn . De plus f ∈ L1 et kfn − f kL1 → 0
quand n → ∞.
91
1
Lemme 5.1 (Lemme de Fatou)
R Soit (fn ) une suite de fonctions L 1 telle que
chaque fn est positive et supn fn < ∞. Alors f := lim inf n fn ∈ L et
Z
Z
f ≤ lim inf fn .
n
Théorème 5.2 (Théorème de convergence dominée de Lebesgue) Soit (fn )n
une suite d’éléments de L1 . Si (fn (x)) converge p.p. vers une limite f (x) et
s’il existe g ∈ L1 telle que pour tout n, |fn | ≤ g p.p. (on dit qu’un tel g est
une majorante intégrable de (fn )) alors f ∈ L1 et kfn − f kL1 → 0 quand
n → ∞.
Lemme 5.2 (Densité des fonctions continues à support compact) Soit f ∈
L1 (Ω), pour tout ε > 0, il existe g ∈ Cc (Ω) tel que kf − gkL1 ≤ ε.
Par convolution avec un noyau régularisant, on en déduit immédiatement
Théorème 5.3 (Densité des fonctions C ∞ à support compact) Soit f ∈
L1 (Ω), pour tout ε > 0, il existe g ∈ Cc∞ (Ω) tel que kf − gkL1 ≤ ε.
Soit maintenant Ω et U respectivement des ouverts de Rd et Rq et f une
fonction mesurable Ω × U → R. Dans ce qui suit, on notera g(x) ∈ L1x au
lieu de x 7→ g(x) est dans L1 . On a alors
Théorème
5.4 (Fubini) Si f ∈ L1 (Ω×U ) alors pour presque tout x, f (x, y) ∈
R
L1y (U ) et U f (x, y)dy ∈ L1x (Ω) et on a
Z Z
Z Z
f (x, y)dy dx.
f (x, y)dxdy =
Ω
U
Ω
U
Théorème 5.5 (Tonelli) Si pour presque tout x, f (x, .) ∈ L1y (U ) et
Z Z
|f (x, y)|dy dx < +∞
Ω
U
alors f ∈ L1 (Ω × U ).
92
Exercice 5.1 Soit f ∈ L1 (Rd ) montrer que
Z +∞
kf kL1 =
|{|f | > t}|dt.
0
Exercice 5.2 Soit f ∈ L1 (Ω) montrer que pour tout ε > 0, il existe δ > 0
tel que
Z
|f | ≤ ε
A
pour tout mesurable A tel que |A| ≤ δ.
5.2
Propriétés élémentaires des espaces Lp
Soit p : 1 ≤ p < ∞, on définit :
Lp (Ω) := {f : Ω → R : f mesurable et |f |p ∈ L1 (Ω)}
et pour f ∈ Lp (Ω)
Z
p
1/p
|f |
kf kLp :=
.
Ω
Pour p = ∞, L∞ est par définition l’ensemble des fonctions mesurables f
telles qu’il existe C ≥ 0 tel que |f | ≤ C p.p. et pour f ∈ L∞
kf kL∞ := inf{C : |f | ≤ C p.p.}.
Notons que si f ∈ L∞ alors on a p.p :
|f (x)| ≤ kf kL∞ .
Nous vérifierons ultérieurement que k.kLp est bien une norme sur Lp , cela
est évident pour p = 1 et p = ∞ mais aussi pour pR = 2 car dans ce cas, k.kL2
est la norme associé au produit scalaire (f, g) 7→ Ω f g.
Pour p : 1 ≤ p ≤ ∞, on note p0 l’exposant conjugué de p. Pour p ∈]1, ∞[
p
1
1
+ 0 = 1 i.e. p0 =
p p
p−1
et évidemment 10 = ∞, ∞0 = 1.
93
0
Théorème 5.6 (Inégalité de Hölder) Soit f ∈ Lp et g ∈ Lp alors f g ∈ L1
et
kf gkL1 ≤ kf kLp kgkLp0 .
Preuve:
La conclusion est évidente si p = 1 ou p = ∞ supposons donc 1 < p < ∞.
Par concavité de log on a pour a et b strictement positifs
1 p 1 p0
a + 0b
≥ log(ab)
log
p
p
et donc
1 0
1
ab ≤ ap + 0 bp
p
p
cette inégalité étant évidente pour a = 0 ou b = 0. On a donc (en supposant
f et g non nulles, ce qui est le cas où l’inégalité de Hölder n’est pas triviale) :
0
|f (x)g(x)|
1 |f (x)|p
1 |g(x)|p
≤
+
0
kf kLp kgkLp0
p kf kpLp
p0 kgkp p0
L
on en déduit que f g ∈ L1 et on obtient en intégrant l’inégalité précédente :
Z
|f g|
≤ 1.
Ω kf kLp kgkLp0
2
Théorème 5.7 Soit p ∈ [1, ∞], Lp (Ω) est un espace vectoriel et k.kLp est
une norme sur Lp (Ω).
Preuve:
A nouveau, la conclusion est évidente si p = 1 ou p = ∞ supposons donc
1 < p < ∞. Soit donc f et g dans Lp on a par convexité de t 7→ tp :
|f (x) + g(x)|p ≤ (|f (x)| + |g(x)|)p ≤ 2p−1 (|f (x)|p + |g(x)|p )
de sorte que f + g ∈ Lp . Pour montrer que k.kLp est une norme sur Lp (Ω), il
nous suffit de montrer l’inégalité triangulaire. Soit f et g dans Lp , on a
Z
Z
Z
p
p−1
p−1
kf + gkLp = |f + g| |f + g| ≤ |f + g| |f | + |f + g|p−1 |g|
94
0
et comme |f + g|p−1 ∈ Lp/(p−1) = Lp , il résulte de l’inégalité de Hölder que
kf +
Z
gkpLp
≤ (kf kLp + kgkLp )
p
(p−1)/p
|f + g|
= (kf kLp + kgkLp )kf + gkLp−1
p
de sorte que l’on a bien
kf + gkLp ≤ kf kLp + kgkLp .
2
Avant d’aller plus loin, voici quelques applications ou variantes faciles
mais qu’il est bon de connaitre de l’inégalité de Hölder :
Exercice 5.3 Soit Ω un ouvert de Rd de mesure finie, p > q ≥ 1 et u ∈
Lq (Ω) montrer que
kukLq (Ω) ≤ kukLp (Ω) |Ω|1/q−1/p .
Exercice 5.4 Soit gi ∈ Lpi (Ω) pour i = 1, ..., k avec
que g = g1 ....gk ∈ L1 (Ω) avec
kgkL1 ≤
k
Y
P
i
1/pi = 1 montrer
kgi kLpi .
i=1
Montrer que si fi ∈ Lpi (Ω) pour i = 1, ..., k avec
f = f1 ....fk ∈ Lp (Ω) avec
kf kLp ≤
k
Y
P
i
1/pi = 1/p ≤ 1, alors
kfi kLpi .
i=1
Exercice 5.5 Soit f ∈ Lp (Ω) ∩ Lq (Ω) (1 ≤ p ≤ q ≤ ∞). Montrer que
f ∈ Lr (Ω), pour tout r ∈ [p, q] et que
kf kLr ≤ kf kαLp kf k1−α
Lq
où α ∈ [0, 1] satisfait
1
α (1 − α)
= +
.
r
p
q
95
Théorème 5.8 Lp (Ω) est un espace de Banach pour tout p, 1 ≤ p ≤ ∞.
Preuve:
Traitons d’abord le cas p = ∞. Soit (fn ) une suite de Cauchy de Lp , pour
tout k ∈ N∗ il existe nk tel que pour tout m et n ≥ nk on a
kfm − fn kL∞ ≤
1
.
k
Ceci implique qu’il existe Ek négligeable tel que
|fm (x) − fn (x)| ≤
1
, ∀m, n ≥ nk , ∀x ∈ Ω \ Ek .
k
(5.1)
Ainsi pour tout x ∈ Ω \ Ek , (fn (x))n est de Cauchy et converge donc vers
une limite notée f (x). En posant E = ∪k Ek (de sorte que E est négligeable)
et en passant à la limite m → ∞ dans (5.1) on a
|f (x) − fn (x)| ≤
1
, ∀n ≥ nk ∀x ∈ Ω \ E
k
ce qui prouve que f − fn (et donc f ) est dans L∞ et que kfn − f kL∞ tend
vers 0 quand n → ∞.
Supposons maintenant 1 ≤ p < ∞ et soit (fn ) une suite de Cauchy de Lp .
Pour montrer que (fn ) converge dans Lp , il nous suffit de montrer que (fn )
possède une valeur d’adhérence dans Lp . Soit (fnk )k une sous-suite vérifiant
kfnk+1 − fnk kLp ≤
1
, ∀k ≥ 1.
2k
(5.2)
Posons alors gk := fnk et
hn :=
n
X
|gk+1 − gk |.
k=1
Par construction, (hn ) est une suite croissante vérifiant
khn kLp ≤ 1, ∀n.
Il résulte du théorème de convergence monotone de Beppo-Levi que (hn )
converge p.p. vers h ∈ Lp . Pour m ≥ n ≥ 2 on a
|gm (x) − gn (x)| ≤ h(x) − hn−1 (x)
(5.3)
et donc pour presque tout x, (gn (x)) est une suite de Cauchy de limite g(x).
En faisant m → ∞ dans (5.3), on a
|gn − g| ≤ h p.p.
96
(5.4)
et comme h ∈ Lp , on déduit du théorème de convergence dominée de Lebesgue que kgn − gkLp → 0 ce qui achève la preuve.
2
Il convient de distinguer le cas p = 2, en effet L2 (Ω) est un espace de
Hilbert pour le produit scalaire
Z
hf, gi :=
f (x)g(x)dx, ∀(f, g) ∈ L2 (Ω) × L2 (Ω).
Ω
Proposition 5.1 Soit (fn )n une suite de Lp et f ∈ Lp . Si fn converge vers
f dans Lp alors (fn ) possède une sous-suite qui admet une majorante Lp et
qui converge vers f presque partout.
Preuve:
Le cas p = ∞ étant évident on suppose p ∈]1, ∞[ et on construit comme dans
la preuve précédente (gk ) = (fnk ) de sorte que (5.2) soit satisfaite. Comme
dans la preuve précédente on a (5.4) avec h ∈ Lp et (gn ) converge vers g p.p.
et dans Lp . On a donc f = g et il résulte de (5.4) que |gn | ≤ h + |f | ∈ Lp ce
qui fournit la majorante Lp recherchée.
2
5.3
Dualité, réflexivité, séparabilité
Lemme 5.3 (Inégalité de Clarkson) Soit p ∈ [2, ∞[, pour tout f et g dans
Lp , on a :
f +g p
f −g p
1
+
≤
kf kpLp + kgkpLp .
2
2
2
Lp
Lp
Preuve:
On commence par remarquer que t 7→ (t2 + 1)p/2 − tp − 1 est croissante sur
R+ et donc
tp + 1 ≤ (t2 + 1)p/2 , ∀t ≥ 0
(en remplaçant t par t/s dans l’inégalité précédente) il en résulte que
tp + sp ≤ (t2 + s2 )p/2 ∀t ≥ 0, ∀s ≥ 0
et donc pour tout (f, g) ∈ R2 :
f +g
2
p
+
f −g
2
p
97
≤
f2
2
+
g 2 p/2
2
en utilisant la convexité de t 7→ tp/2 pour p ≥ 2, il vient donc
f +g p
f −g p 1 p 1 p
+
≤ |f | + |g|
2
2
2
2
et l’inégalité recherchée en découle immédiatement.
2
Notons que p = 2 est un cas limite dans lequel l’inégalité de Clarkson est
une égalité (c’est l’identité du parallélogramme !). On déduit immédiatement
du lemme précédent :
Lemme 5.4 Lp est uniformément convexe pour 2 ≤ p < ∞.
Preuve:
Soit ε > 0, f et g dans Lp avec kf kLp ≤ 1, kgkLp ≤ 1 et kf − gkLp ≥ ε, il
résulte du lemme 5.3 que
εp 1/p
f +g
≤ 1 − δ, avec δ := 1 − 1 − p
2
2
Lp
p
ce qui prouve L est uniformément convexe.
2
Dans le cas où 1 < p ≤ 2, Lp est également uniformément convexe,
la preuve est cependant un peu plus compliquée et repose sur l’inégalité
suivante :
Lemme 5.5 (Inégalité de Hanner) Soit p ∈]1, 2], pour tout f et g dans Lp ,
on a :
p
p
kf kLp + kgkLp + kf kLp − kgkLp ≤ kf + gkpLp + kf − gkpLp .
Preuve:
On commence par remarquer que la fonction F : (x, y) ∈ R+ × R+ 7→
F (x, y) = (x1/p + y 1/p )p + |x1/p − y 1/p |p est convexe et homogène de degré 1.
On a donc par l’inégalité de Jensen :
Z
Z
Z
p
p
F ( |f | , |g| ) ≤ F (|f |p , |g|p )
c’est à dire :
p
p
p
kf kL + kgkL
+ kf kLp − kgkLp
p
≤
Z p Z
|f | + |g| +
|f | − |g|
p
on conclut en remarquant (en distinguant le cas où f et g ont même signe
de celui où f et g sont de signes opposés) que l’on a
p
p
|f | + |g| + |f | − |g| = |f + g|p + |f − g|p .
2
98
Lemme 5.6 Lp est uniformément convexe pour 1 < p ≤ 2.
Preuve:
Soit ε > 0, f et g dans Lp avec kf kLp ≤ 1, kgkLp ≤ 1 et kf − gkLp ≥ ε.
Appliquant ’inégalité de Hanner à (f + g)/2 et (f − g)/2, il vient
f +g
2
Lp
+
f −g
2
p
Lp
f +g
2
+
Lp
−
f −g
2
p
Lp
≤ kf kpLp +kgkpLp ≤ 2.
(5.5)
Posons ϕ(t) := t pour tout t ≥ 0, soit a ≥ b ≥ 0, la formule de Taylor avec
reste intégral donne
Z
1
b2 1
1
ϕ(a + b) + ϕ(a − b) = ϕ(a) +
(1 − t)(ϕ00 (a + tb) + ϕ00 (a − tb))dt
2
2
2 0
Z 1
1
p
2
= a + p(p − 1)b
(1 − t) ((a + tb)p−2 + (a − tb)p−2 )dt
2
0
p
utilisant le fait que comme p ≤ 2, s > 0 7→ sp−2 est convexe, il vient donc
que pour a ≥ b ≥ 0, on a :
1
1
p(p − 1)b2 ap−2
(a + b)p + (a − b)p ≥ ap +
.
2
2
2
(5.6)
Dans le cas où kf + gkLp ≥ kf − gkLp , avec (5.5) et (5.6), il vient donc
1≥
f +g
2
p
Lp
+
p(p − 1) f − g
2
2
2
Lp
f +g
2
p−2
Lp
en multipliant par k f +g
k2−p
Lp on obtient
2
1≥
f +g
2
2−p
Lp
≥
f +g
2
2
Lp
+
p(p − 1) f − g
2
2
2
Lp
de sorte que
f +g 2
p(p − 1)ε2
≤1−
.
2
8
Lp
Dans le cas où kf + gkLp ≤ kf − gkLp , on tire immédiatement de (5.5) que
f +g
2
p
Lp
ce qui achève la preuve.
2
Pour résumer, on a donc établi :
99
≤ 21−p
Théorème 5.9 Pour tout p ∈]1, ∞[, Lp (Ω) est uniformément convexe.
On vérifie très facilement ”à la main” que L1 et L∞ ne sont pas uniformément convexes. Il résulte du théorème précédent et du théorème de
Milman-Pettis 3.6 :
Théorème 5.10 Lp (Ω) est un espace réflexif pour tout p, 1 < p < ∞.
Une autre conséquence utile en pratique de l’uniforme convexité de Lp
nous est fournie par le théorème 3.7 qui ici se traduit par :
Théorème 5.11 Soit p ∈]1, ∞[, (fn ) une suite de Lp (Ω) et f ∈ Lp (Ω). Si
(fn ) converge faiblement vers f dans Lp et si
lim kfn k = kf k
n
alors (fn ) converge fortement dans Lp vers f .
Exercice 5.6 Monter que le résultat précédent est faux dans L1 (faible) et
L∞ (faible ∗).
Le résultat de représentation suivant montre que si 1 < p < ∞, on peut
0
identifier (Lp )0 à Lp :
Théorème 5.12 (Théorème de représentation de Riesz) Soit p : 1 < p < ∞
0
et soit ϕ ∈ (Lp (Ω))0 alors il existe un unique u ∈ Lp tel que
Z
hϕ, f i =
uf, ∀f ∈ Lp (Ω)
Ω
de plus on a
kϕk(Lp )0 = kukLp0 .
Preuve:
0
Définissons T : Lp → (Lp )0 par
Z
0
hT u, f i :=
uf, ∀u ∈ Lp , ∀f ∈ Lp .
Ω
Il résute de l’inégalité de Hölder que T est continue et plus précisément :
kT uk(Lp )0 ≤ kukLp0 , ∀u ∈ Lp .
100
0
0
Soit u ∈ Lp , u 6= 0, alors f := |u|p −2 u appartient à Lp et donc
R
fu
= kukLp .
kT uk(Lp )0 ≥
kf kLp
0
On en déduit donc que T est une isométrie de Lp dans (Lp )0 . En particulier,
T est injective, ce qui montre l’unicité. Pour l’existence il s’agit de montrer
0
que T est surjective, T (Lp ) étant fermé, il suffit de montrer que T (Lp ) est
0
dense dans (Lp )0 . Soit h ∈ (Lp )00 tel que h ≡ 0 sur T (Lp ) comme Lp est
réflexif, on peut identifier h à un élément (encore noté h) de Lp , en prenant
0
u := |h|p−2 h ∈ Lp , on a alors
Z
hT u, hi = 0 = |h|p = 0
0
et donc h = 0 ce qui montre que T (Lp ) est dense dans (Lp )0 .
2
S’agissant du dual de L1 on a le théorème de représentation suivant :
Théorème 5.13 Soit ϕ ∈ (L1 (Ω))0 alors il existe un unique u ∈ L∞ tel que
Z
hϕ, f i =
uf, ∀f ∈ L1 (Ω)
Ω
de plus on a
kϕk(L1 )0 = kukL∞ .
Preuve:
Montrons l’existence d’un u dans L∞ représentant ϕ. Soit K un compact
inclus dans Ω, pour f ∈ L2 on a
| hϕ, χK f i | ≤ kϕk(L1 )0 |K|1/2 kf kL2
de sorte que f ∈ L2 7→ hϕ, χK f i est dans (L2 )0 = L2 . Par le théorème de
Riesz pour les Hilbert ou le théorème 5.12, il existe donc uK ∈ L2 telle que
Z
hϕ, χK f i =
f uK , ∀f ∈ L2
Ω
on vérifie aisément que uK est nécessairement de la forme uK = χK u avec
u ∈ L2loc . En particulier on a
Z
hϕ, f i =
uf, ∀f ∈ Cc (Ω).
(5.7)
Ω
101
Montrons que u ∈ L∞ et plus précisément que |u| ≤ kϕk(L1 )0 p.p. ; si tel
n’était pas le cas, il existerait δ > 0 tel que
Aδ := |u| ≥ kϕk(L1 )0 + δ
soit de mesure strictement positive, ceci entrainant qu’il existe K compact
inclus dans Ω tel que Kδ := K ∩ Aδ soit aussi de mesure strictement positive.
Soit alors f := χKδ sg(u) on a alors
kϕk(L1 )0 kf kL1 = kϕk(L1 )0 |Kδ |
Z
Z
uf =
|u|
≥ hϕ, f i =
Ω
Kδ
≥ |Kδ | kϕk(L1 )0 + δ
ce qui constitue la contradiction recherchée. On a donc u ∈ L∞ et kukL∞ ≤
kϕk(L1 )0 . Par densité de Cc (Ω) dans L1 avec (5.7), on a donc
Z
hϕ, f i = uf, ∀f ∈ L1 (Ω)
ce qui implique aussi kϕk(L1 )0 ≤ kukL∞ . Enfin l’unicité de u ∈ L∞ représentant
ϕ découle immédiatement du lemme 2.7.
2
Le résultat précédent précédent prouve en particulier que L∞ est un
dual topologique, on pourra donc en particulier lui appliquer le théorème
de Banach-Alaoglu-Bourbaki.
Théorème 5.14 Soit p ∈ [1, +∞[, D(Ω) est dense dans Lp (Ω).
Preuve:
Soit T ∈ (Lp )0 tel que T (ϕ) = 0, pour tout ϕ ∈ D. Il résulte des théorèmes
0
5.12 et 5.13 qu’il existe u ∈ Lp (en particulier u ∈ L1loc ) représentant T , on a
alors {u} = 0 dans D0 et donc u = 0 p.p. en vertu du Lemme 2.7. On a donc
T = 0, on en conclut que D(Ω) est dense dans Lp (Ω) grâce au corollaire 1.6
2
Théorème 5.15 Lp (Ω) est séparable pour tout p ∈ [1, ∞[.
Preuve:
Soit E l’ensemble des combinaisons linéaires à coefficients dans Q d’indicatrices de pavés de la forme Πdi=1 ]xi , yi [ inclus dans Ω et avec les xi , yi à
coordonnées rationnelles. Par construction E est dénombrable, il nous suffit
102
donc de montrer que E est dense dans Lp (Ω). Soit f ∈ Lp (Ω) et ε > 0, on
commence par choisir g ∈ Cc (Ω) tel que kf − gkLp (Ω) ≤ ε/2. Soit ω un ouvert
borné contenant supp(g), en utilisant l’uniforme continuité de g, on construit
facilement h ∈ E tel que supp(h) ⊂ ω et kg − hkL∞ (ω) ≤ ε/(2|ω|1/p ), de sorte
que l’on a kg − hkLp (Ω) ≤ ε/2 et donc aussi kf − hkLp (Ω) ≤ ε.
2
Notons que L2 est un Hilbert séparable. En particulier, L2 admet des bases
Hilbertiennes, mieux encore : on peut appliquer le théorème de décomposition
spectrale dans L2 , nous reviendrons sur ce point plus en détail par la suite.
Comme L1 est séparable et L∞ = (L1 )0 , on déduit du corollaire 3.6 du
théorème de Banach-Alaoglu-Bourbaki :
Théorème 5.16 Toute suite bornée de L∞ (Ω) possède une sous-suite convergente pour la topologie faible-∗ σ(L∞ , L1 ).
Nous avons laissé en suspens la question de la réflexivité de L1 et L∞ , à
cette question, la réponse est négative :
Théorème 5.17 L1 (Ω) et L∞ (Ω) ne sont pas réflexifs.
Preuve:
Comme (L1 )0 = L∞ , en vertu du corollaire 3.2, il nous suffit de montrer que
L1 n’est pas réflexif c’est à dire que L1 6= (L∞ )0 . Soit x0 ∈ Ω et ϕ la forme
linéaire sur Cc (Ω) définie par
hϕ, f i := f (x0 ), ∀f ∈ Cc (Ω)
comme hϕ, f i ≤ kf kL∞ , ∀f ∈ Cc (Ω), grâce au théorème de Hahn-Banach, on
peut prolonger ϕ en un élément de (L∞ )0 (qu’on notera encore ϕ). S’il existait
u ∈ L1 représentant ϕ, on aurait en particulier {u} = 0 dans D0 (Ω \ {x0 })
ce qui avec le lemme 2.7 entrainerait f = 0 p.p. sur Ω \ {x0 } et donc aussi
f = 0 p.p. sur Ω, on aurait alors ϕ = 0 ce qui est absurde.
2
Le résultat qui suit va nous permettre de répondre négativement à la
question de la séparabilité de L∞ :
Lemme 5.7 Soit E un evn, s’il existe, (Oi )i∈I une famille d’ouverts non
vides de E vérifiant I non dénombrable et Oi ∩ Oj = ∅ si (i, j) ∈ I 2 et i 6= j
alors E n’est pas séparable.
Preuve:
Supposons par l’absurde que (un ) soit dense dans E alors pour chaque i ∈ I,
il existe n = n(i) tel que un(i) ∈ Oi . Comme i ∈ I 7→ n(i) est injective on en
déduit que I est au plus dénombrable, d’où la contradiction recherchée.
2
103
Proposition 5.2 L∞ n’est pas séparable.
Preuve:
Soit x ∈ Ω et rx < d(x, Rd \ Ω), posons ux := χB(x,rx ) et
1
∞
Ox := u ∈ L : ku − ux kL∞ <
.
2
On vérifie facilement que la famille (Ox )x∈Ω vérifie les hypothèses du lemme
5.7 dans L∞ et donc que L∞ n’est pas séparable.
2
Exercice 5.7 Soit (ρn ) une suite régularisante et f ∈ Lp (Rd ) montrer que
ρn ? f converge vers f dans Lp (Rd ).
Exercice 5.8 Soit Ω un ouvert borné de Rd et p : 1 < p < ∞. Soit (un )
0
une suite de Lp (Ω) et u ∈ Lp (Ω) tels que un * u pour σ(Lp , Lp ) et il existe
λ ≥ 0 tel que |{|un | ≥ λ}| → 0 quand n → +∞. Montrer que u ∈ L∞ avec
kukL∞ ≤ λ.
Exercice 5.9 (Théorème de Lusin) Soit Ω un ouvert borné de Rd et f mesurable Ω → R. Montrer que pour tout ε > 0, il existe g ∈ Cc (Ω) tel que
|{f 6= g}| ≤ ε. Dans le cas où f ∈ L∞ montrer que g peut être choisie
satisfaisant en plus kgkL∞ ≤ kf kL∞
Exercice 5.10 (Théorème d’Egorov) Soit Ω un ouvert de Rd de mesure finie, (fn ) et f mesurables telles que (fn ) converge vers f p.p. Montrer que
pour tout ε > 0, il existe Aε ⊂ Ω mesurable tel que |Ω \ Aε | ≤ ε et (fn )
converge uniformément vers f sur Aε .
Exercice 5.11 Soit p ∈ [1, ∞[ et f ∈ Lp (Rd ), montrer que
lim kτh f − f kLp = 0
h→0
(on rappelle que τh f (x) := f (x + h)).
104
5.4
Compacité dans Lp
Nous avons déja vu que Lp est réflexif pour 1 < p < ∞ il résulte donc du
théorème de Kakutani que les parties bornées de Lp sont faiblement relati0
vement compactes et du théorème 3.5 (ou du fait que Lp est séparable) que
les suites bornées de Lp admettent des sous-suites faiblement convergentes :
Théorème 5.18 Soit p ∈]1, ∞[. Toute partie bornée de Lp est faiblement
relativement compacte. Toute suite bornée de Lp possède une sous-suite qui
0
converge faiblement σ(Lp , Lp ).
Pour p = ∞, comme L∞ = (L1 )0 on a comme conséquence immédiate du
théorème de Banach-Alaoglu-Bourbaki d’une part et de la séparabilité de L1
et du corollaire 3.6 d’autre part :
Théorème 5.19 Toute partie bornée de L∞ est faiblement ∗ relativement
compacte. Toute suite bornée de L∞ possède une sous-suite qui converge faiblement -∗ σ(L∞ , L1 ).
Pour la compacité forte, on a le critère suivant :
Théorème 5.20 (Théorème de compacité de Riesz-Fréchet-Kolmogorov) Soit
p ∈ [1, ∞[ et F une partie bornée de Lp (Ω). Si d’une part pour tout ε > 0 et
tout ω ⊂⊂ Ω il existe δ : 0 < δ < d(ω, Rd \ Ω) tel que
sup kτh f − f kLp (ω) ≤ ε, ∀h ∈ Rd : |h| ≤ δ
f ∈F
et d’autre part pour tout ε > 0 il existe ω ⊂⊂ Ω (i.e. ω ouvert, ω compact et
inclus dans Ω) tel que
sup kf kLp (Ω\ω) ≤ ε
f ∈F
alors F est relativement compact dans Lp (Ω).
Preuve:
Comme Lp (Ω) est complet il suffit de montrer que F est précompact dans
Lp (Ω). Soit donc ε > 0, il s’agit de montrer que F peut être recouvert par un
nombre fini de boules de rayon ε de Lp (Ω). On commence par choisir ω ⊂⊂ Ω
tel que
ε
(5.8)
sup kf kLp (Ω\ω) ≤
3
f ∈F
c’est à dire
ε
sup kf − f χω kLp (Ω) ≤ .
3
f ∈F
105
(5.9)
Par hypothèse, il existe n ∈ N∗ tel que n−1 < d(ω, Rd \ Ω) et
ε
sup kτh f − f kLp (ω) ≤ , ∀h ∈ Rd : |h| ≤ n−1 .
3
f ∈F
(5.10)
Soit ρn un noyau régularisant (C ∞ , positif, à support dans B(0, n−1 ) et
d’intégrale 1) et
Fn,ω := {(ρn ? f ) |ω , f ∈ F}.
Pour f ∈ F et x ∈ Ω on a
Z
ρn (h)|τ−h f (x) − f (x)|dh
|(ρn ? f − f )(x)| ≤
B(0,n−1 )
et donc avec l’inégalité de Jensen
Z
p
|(ρn ? f − f )(x)| ≤
ρn (h)|τ−h f (x) − f (x)|p dh
B(0,n−1 )
et donc en utilisant le théorème de Fubini et (5.10) on a
Z
ε p
p
p
kρn ? f − f kLp (ω) ≤
ρn (h)kτ−h f − f kLp (ω) dh ≤
3
B(0,n−1 )
ainsi
ε
sup kρn ? f − f kLp (ω) ≤ .
3
f ∈F
(5.11)
Pour f ∈ F on a
kρn ? f kL∞ (ω) ≤ kρn kLp0 kf kLp
et
k∇(ρn ? f )kL∞ (ω) ≤ k∇ρn kLp0 kf kLp
de sorte que Fn,ω est uniformément bornée et équilipschitzienne et donc, en
vertu du théorème d’Ascoli, relativement compact dans C(ω) et donc aussi
dans Lp (ω). Il existe donc N et g1 , ..., gN dans Lp (ω) (qu’on prolonge par 0
en dehors de ω) tel que
N
[
ε
Fn,ω ⊂
B(gi , ).
3
i=1
Grâce à (5.9) et (5.11) on en déduit que
Fn,ω ⊂
N
[
B(gi , ε)
i=1
ce qui achève la démonstration.
2
106
Exercice 5.12 Montrer que les conditions sur F dans le Théorème de RieszFréchet-Kolmogorov sont en fait aussi nécessaires pour la relative compacité
de F.
Exercice 5.13 Soit g ∈ L1 , F une partie bornée de Lp (Rd ) et ω un ouvert
borné de Rd , montrer que {(g ? f )χω , f ∈ F} est relativement compact dans
Lp (ω). Le résultat précédent est-il vrai quand on remplace ω par Rd ?
Compacité faible dans L1
5.5
Définition 5.1 Soit Ω un ouvert borné de Rd et F une partie bornée de
L1 (Ω), alors F est dite uniformément intégrable si ∀ε > 0, ∃δ > 0 tel que
Z
|f | ≤ ε, pour tout f ∈ F et tout A ⊂ Ω tel que |A| ≤ δ.
(5.12)
A
Le théorème de Dunford-Pettis énonce que l’uniforme intégrabilité est une
condition nécessaire et suffisante de relative compacité faible dans L1 . Nous
nous contenterons ici de démontrer le caractère suffisant pour la compacité
faible séquentielle, la preuve du caractère nécessaire étant a priori moins utile,
nous renvoyons le lecteur intéressé à [6] pour plus de détails.
Théorème 5.21 (Dunford-Pettis) Soit Ω un ouvert borné de Rd et F une
partie bornée de L1 (Ω), alors si F est uniformément intégrable, de toute suite
de F, on peut extraire une sous suite convergeant pour σ(L1 , L∞ ).
Preuve:
On commence par remarquer que l’on peut supposer les éléments de F positifs
(écrire f = f+ − f− et remarquer que {f± , f ∈ F} sont uniformément
∗
k
intégrables). Soit (fn ) une
R suite de F, pour tout k ∈ N on pose fn :=
fn χ{fn ≤k} . Soit C = supn fn , on a
Z
C ≥ fn ≥ k|{fn > k}|
il résute donc de l’uniforme intégrabilité de F que
Z
lim sup
fn = 0
k→∞
n
{fn >k}
107
et donc que
k
δ := sup kfn −
n
fnk kL1
Z
fn → 0 quand k → ∞.
= sup
n
(5.13)
{fn >k}
On remarque ensuite que comme (fnk )n est bornée dans L∞ , elle admet une
sous-suite qui converge pour σ(L∞ , L1 ) et donc a fortiori pour σ(L1 , L∞ )
(c’est ici qu’intervient le fait que Ω soit borné). On applique alors le procédé
habituel d’extraction diagonal de Cantor. Pour tout k, il existe ϕk strictement
croissante de N dans N et il existe f k ∈ L∞ tels que (fϕkk (n) ) converge vers f k
pour σ(L1 , L∞ ) quand n → ∞ (et on choisit ϕk+1 de la forme ϕk+1 = ϕk ◦ ψk
avec ψk strictement croissante de N dans N de sorte que (fϕl k (n) ) converge
vers f l pour l ≤ k). On a
Z
Z
Z
k
k
f ≤ lim inf fϕk (n) ≤ lim inf fϕk (n) ≤ C
n
n
R
et de plus (f k ) est croissante par rapport à k (passer à la limite dans g(fnk+1 −
fnk ) ≥ 0 pour g ≥ 0, g ∈ L∞ ). Il résulte donc du théorème de convergence
monotone de Beppo-Levi que (f k ) converge fortement dans L1 vers f . Il nous
reste maintenant à montrer que (fϕ(n) ) (avec ϕ(n) := ϕn (n)) converge vers f
pour σ(L1 , L∞ ). Soit g ∈ L∞ , ε > 0 et k0 tel que
kgk∞ (δk0 + kf k0 − f kL1 ) ≤
on a alors
Z
ε
2
Z
k0
k0
g(fϕ(n) − fϕ(n)
+ fϕ(n)
− f k0 + f k 0 − f )
Z
ε
k0
≤ +
g(fϕ(n)
− f k0 )
2
g(fϕ(n) − f ) =
k0
et comme (fϕ(n)
)n converge faiblement dans L1 vers f k0 , on a pour n assez
grand
Z
g(fϕ(n) − f ) ≤ ε
ce qui achève la preuve.
2
Exercice 5.14 Montrer que l’uniforme intégrabilité est aussi une condition
nécessaire à la relative compacité faible séquentielle.
108
Exercice 5.15 Soit F une partie bornée de L1 (Ω). Montrer que F est uniformément intégrable si et seulement si
Z
sup
|f | → 0, quand M → +∞.
f ∈F
{|f |≥M }
Exercice 5.16 (Critère de de La Vallée-Poussin) Soit F une partie bornée
de L1 (Ω). Montrer que F est uniformément intégrable si et seulement s’il
existe une fonction g : R+ → R+ croissante (et que l’on peut en outre choisir
convexe) et telle que g(t)/t → +∞ quand t → ∞ et
Z
sup g(|f (x)|)dx < +∞.
f ∈F
Ω
Pour les suites bornées de L1 (mais non nécessairement uniformément
intégrables) on a le résultat suivant que nous donnons ici sans démonstration :
Lemme 5.8 (Biting Lemma) Soit Ω un ouvert borné de Rd et (fn ) une suite
bornée de L1 (Ω). Il existe une suite décroissante d’ensemble mesurables (Ek )
telle que |Ek | → 0 et une sous suite de (fn ), (fnk ) tels que (χΩ\Ek fnk ) soit
uniformément intégrable.
Nous évoquerons au prochain chapitre le principe de concentration-compacité
de Pierre-Louis Lions qui donne précisément les différents comportements
possibles des suites de mesures de probabilité sur Rd .
109
Chapitre 6
Espaces de mesures
6.1
Rappels sur les espaces de fonctions continues
Rappelons à toutes fins utiles le théorème d’Ascoli-Arzelà que nous avons
d’ailleurs déjà utilisé à plusieurs reprises
Théorème 6.1 (Théorème d’Ascoli-Arzelà) Soit (K, d) un espace métrique
compact et F une partie bornée de C(K) uniformément équicontinue c’est à
dire vérifiant : pour tout ε > 0, il existe δ > 0 tel que pour tout (x1 , x2 ) ∈ K 2
si d(x1 , x2 ) ≤ δ alors
|f (x1 ) − f (x2 )| ≤ ε, ∀f ∈ F.
Alors F est relativement compacte dans C(K).
En pratique, pour montrer l’uniforme équicontinuité d’une famille F on
montre souvent (et c’est équivalent !) qu’elle possède un module de continuité
uniforme c’est à dire une fonction croissante ω tendant vers 0 en 0 et telle
que
|f (x1 ) − f (x2 )| ≤ ω(d(x1 , x2 )), ∀(x1 , x2 , f ) ∈ K 2 × F.
Pour ω(t) = Ct, on a une famille équilipschitzienne, pour ω(t) = Ctα avec
α ≤ 1, une famille équi-Hölderienne d’exposant α....
Proposition 6.1 (Lemme d’Urysohn) Soit (X, d) un espace localement compact (c’est à dire dont tout point possède un voisinage compact) soit K une
partie non vide compacte de X et V un ouvert contenant K alors il existe
f ∈ Cc (X) tel que χK ≤ f ≤ χV .
110
Preuve:
Il est facile de voir qu’il existe O, voisinage ouvert et relativement compact
de K contenu dans V . En posant :
f (x) :=
d(x, X \ O)
, ∀x ∈ X
d(x, K) + d(x, X \ O)
il est clair que f a les propriétés requises.
2
Proposition 6.2 (Partition de l’unité) Soit (X, d) un espace localement compact, K une partie compacte de X et V1 , ..., Vn un recouvrement ouvert de K.
Il existe g1 , .., gn ∈ Cc (X)n vérifiant 0 ≤ gi ≤ 1, supp(gi ) ⊂ Vi et
n
X
gi (x) = 1, ∀x ∈ K.
i=1
La famille g1 , .., gn s’appelle partition de l’unité subordonnée au recouvrement
V1 , ..., Vn de K.
Preuve:
Pour tout x ∈ K, il existe Wx un voisinage ouvert de x tel que W x soit
compact et inclus dans l’un des Vi . Par compacité de K, on peut le recouvrir
par les ouverts Wxj , j = 1, ..., p. On définit alors pour i = 1, ..., n
[
W xj .
Ki :=
j : W xj ⊂Vi
On déduit du Lemme d’Urysohn qu’il existe fi ∈ Cc (X), tel que χKi ≤ fi ≤
χVi . Définissons
g1 := f1 , g2 := f2 (1 − f1 ), ...., gn := fn (1 − fn−1 )....(1 − f1 )
on a alors
n
X
gi (x) = 1 − (1 − f1 (x))...(1 − fn (x))
i=1
or si x ∈ K, x ∈ Ki pour un certain i et donc
2
Pn
i=1
gi (x) = 1.
Théorème 6.2 (Prolongement de Tietze) Soit (K, d) un espace métrique
compact, F un fermé de K et f ∈ C(F ), alors f admet un prolongement
continu à K.
111
Preuve:
Soit ω un module de continuité de f sur F (correctement défini car F est
compact et donc f est uniformément continue sur F ) qu’on suppose sans
perte de généralité sous-additif (ω(s + t) ≤ ω(s) + ω(t)). Pour tout x ∈ K
posons
g(x) := inf {f (y) + ω(d(x, y))}
y∈F
on vérifie sans peine que g prolonge f et admet ω comme module de continuité. 2
Théorème 6.3 Si (K, d) est un espace métrique compact alors C(K) est
séparable.
Preuve:
K étant compact, il est séparable ; soit donc {xi }i∈N dense dans K. Pour
tout i ∈ N et n ∈ N, on déduit du lemme d’Urysohn qu’il existe fi,n ∈ C(K)
vérifiant
χB(xi ,2−n−1 ) ≤ fi,n ≤ χB(xi ,2−n ) .
Pour tout n, il existe In ⊂ N fini tel que
[
B(xi , 2−n−1 )
K=
i∈In
on pose alors pour tout n ∈ N et tout i ∈ In :
fi,n (x)
, ∀x ∈ K.
j∈In fj,n (x)
gi,n (x) := P
On vérifie sans peine que l’espace vectoriel sur Q engendré par la famille
{gi,n , n ∈ N, i ∈ In } est dense dans C(K).
2
On déduit des résultats précédents que si l’espace métrique (X, d) est σcompact (i.e. réunion d’une suite croissante de compacts Kn ) alors Cc (X)
(limite inductive des espaces CKn (X)) est séquentiellement séparable.
6.2
Théorème de Riesz et mesures de Radon
dans le cas compact
On rappelle que si (X, d) est un espace métrique (ici on ne considèrera
par simplicité que ce cas même si la plupart des résultats de ce chapitre
s’étendent au cas séparé), sa tribu Borélienne, BX , est par définition la tribu
112
engendrée par ses ouverts. Une mesure borélienne sur X est une mesure
définie sur la tribu borélienne de X (c’est à dire une application σ-additive
de BX à valeurs dans [0, ∞]). Nous omettrons parfois par la suite le terme
borélienne, étant entendu implicitement que nous ne considèrerons que des
mesures boréliennes. On dit en outre que µ est finie si µ(X) < +∞ etS
que µ
est σ-finie s’il existe une suite croissante de Boréliens Bn telle que X = n Bn
et µ(Bn ) < +∞ pour tout n. Les mesures boréliennes régulières sont définies
comme suit :
Définition 6.1 Soit (X, d) un espace métrique et µ une mesure borélienne
sur X alors µ est dite régulière si pour tout A ∈ BX on a
µ(A) = inf{µ(O) : O ouvert, A ⊂ O}
et
µ(A) = sup{µ(K) : K compact, K ⊂ A}.
Si (X, d) est compact et µ est une mesure borélienne finie alors la forme
linéaire Tµ définie par
Z
f dµ, ∀f ∈ C(X)
Tµ (f ) :=
X
est continue (|Tµ (f )| ≤ kf kµ(X)) et positive au sens où Tµ (f ) ≥ 0 pour tout
f ≥ 0. Comme on a Tµ (1) = µ(X) on a :
kTµ kC(X)0 = µ(X).
Le théorème de représentation de Riesz énonce (entre autres) que réciproquement
toute forme linéaire continue et positive sur C(X) se représente par une mesure borélienne finie.
Théorème 6.4 (Théorème de représentation de Riesz, cas compact et positif) Soit (X, d) un espace métrique compact et T une forme linéaire continue et positive sur C(X). Il existe une unique mesure borélienne finie et
régulière µ sur X telle que T = Tµ .
Preuve:
Nous allons diviser la preuve (qui n’est pas compliquée mais relativement
longue si l’on veut en donner tous les détails) en plusieurs étapes.
Etape 1 : unicité
113
R
Si
deux
mesures
(positives)
boréliennes
µ
et
ν
représentent
T
on
a
f dµ =
X
R
f
dν
pour
tout
f
∈
C(X).
Soit
K
un
fermé
(donc
un
compact)
de
X
X
et Vn := {x ∈ X : d(x, K) < 1/n}, par le lemme d’Urysohn, il existe
fn ∈ C(X) tel que χK ≤ fn ≤ χVn , on a donc
Z
Z
µ(K) ≤
fn dµ =
fn dν ≤ ν(Vn )
X
X
et donc
µ(K) ≤ lim ν(Vn ) = ν
\
n
Vn = ν(K).
n
On en déduit que µ et ν coı̈ncident sur les fermés, un argument classique de
classe monotone permet d’en déduire que µ = ν.
Etape 2 : définition et propriétés de µ sur les ouverts et sur les
compacts
Pour tout ouvert V de X on pose
µ(V ) := sup{T (f ), f ∈ C(X), 0 ≤ f ≤ χV }.
(6.1)
Par construction µ est positive et monotone au sens où si V1 et V2 sont
des ouverts et si V1 ⊂ V2 , alors µ(V1 ) ≤ µ(V2 ). Soit (Vn )n des ouverts de
X et f ∈ C(X) tel que 0 ≤ f ≤ χ∪n Vn comme supp(f ) est compact, il
existe N tel que supp(f ) ⊂ ∪N
n=1 Vn . Soit g1 , ..., gN une partition de l’unité
subordonnée au recouvrement V1 , ..., VN . Utilisant la linéarité de T et le fait
que 0 ≤ f gn ≤ χVn , on a alors
T (f ) =
N
X
T (f gn ) ≤
n=1
N
X
µ(Vn ) ≤
n=1
∞
X
µ(Vn )
n=1
passant au supremum sur tous les f ∈ C(X) tels que 0 ≤ f ≤ χ∪n Vn on en
déduit
∞
∞
[
X
µ
Vn ≤
µ(Vn ).
(6.2)
n=1
n=1
Soit maintenant V1 et V2 ouverts disjoints et ε > 0 et pour i = 1, 2, fi ∈ C(X)
tel que 0 ≤ fi ≤ χVi et
ε
T (fi ) ≥ µ(Vi ) −
2
on a alors 0 ≤ f1 + f2 ≤ χV1 + χV2 = χV1 ∪V2 de sorte que
µ(V1 ∪ V2 ) ≥ T (f1 + f2 ) ≥ µ(V1 ) + µ(V2 ) − ε.
114
On a donc µ(V1 ∪ V2 ) = µ(V1 ) + µ(V2 ) pour tout couple V1 , V2 d’ouverts
disjoints. On en déduit qu’on a la propriété d’additivité sur les ouverts :
pour toute famille finie d’ouverts disjoints V1 , ..., VN on a :
µ
N
[
Vn =
n=1
N
X
µ(Vn ).
(6.3)
n=1
Pour tout compact (i.e. fermé) K de X, on pose
µ(K) := inf{µ(V ) : V ouvert, K ⊂ V }.
Evidemment, µ ainsi définie sur les compacts est monotone pour l’inclusion
(et par monotonie, on vérifie sans peine que si K est à la fois ouvert et fermé
alors les deux définitions de µ(K) coı̈ncident). Soit K1 et K2 deux compacts,
ε > 0 et V1 , V2 deux ouverts tels que K1 ⊂ V1 , K2 ⊂ V2 et
ε
ε
µ(V1 ) ≤ µ(K1 ) + , µ(V2 ) ≤ µ(K2 ) +
2
2
on a alors avec (6.2)
µ(K1 ∪ K2 ) ≤ µ(V1 ∪ V2 ) ≤ µ(V1 ) + µ(V2 ) ≤ µ(K1 ) + µ(K2 ) + ε.
Supposons maintenant que les compacts K1 et K2 sont disjoints. Soit
ε > 0 et V ouvert contenant K1 ∪ K2 tel que µ(V ) ≤ µ(K1 ∪ K2 ) + ε, il existe
alors V1 et V2 ouverts disjoints contenant respectivement K1 et K2 tels que
V1 ∪ V2 ⊂ V et donc
µ(K1 ∪ K2 ) ≥ µ(V ) − ε ≥ µ(V1 ∪ V2 ) − ε
= µ(V1 ) + µ(V2 ) − ε ≥ µ(K1 ) + µ(K2 ) − ε
on a donc µ(K1 ∪K2 ) = µ(K1 )+µ(K2 ) pour tout couple K1 , K2 de compacts
disjoints et par suite, pour toute famille finie de compacts disjoints K1 , ..., KN
on a :
N
N
[
X
µ
Kn =
µ(Kn ).
(6.4)
n=1
n=1
Etape 3 : mesure intérieure, mesure extérieure
Pour tout A ⊂ X, on définit
µ∗ (A) := sup{µ(K) : K compact, K ⊂ A}
et
µ∗ (A) := inf{µ(V ) : V ouvert, A ⊂ V }.
115
Il est facile de voir que µ∗ ≤ µ∗ et que µ∗ et µ∗ sont monotones pour l’inclusion. On pose ensuite
B := {A ⊂ X : µ∗ (A) = µ∗ (A)}
et l’on définit µ = µ∗ = µ∗ sur B. Notons que par construction, les compacts appartiennent à B. Montrons que B contient aussi les ouverts. Par
construction, pour tout ouvert V on a µ(V ) = µ∗ (V ) ≥ µ∗ (V ). Il s’agit de
montrer l’inégalité inverse, soit donc f ∈ C(X) tel que 0 ≤ f ≤ χV , posons
K := supp(f ) et soit W un ouvert contenant K, d’adhérence incluse dans
V . D’après le lemme d’Urysohn, il existe g ∈ C(X) tel que χK ≤ g ≤ χW .
Comme W est compact et inclus dans V et par monotonie de T on a donc
T f ≤ T g ≤ µ(W ) ≤ µ(W ) ≤ µ∗ (V )
passant au supremum sur f on a obtient µ(V ) ≤ µ∗ (V ). Ainsi B contient les
ouverts de X.
Etape 4 : premières propriétés de σ-additivité
Soit (An )n ∈ B N disjoints on se propose de montrer que
∞
[
An ∈ B et µ
∞
[
n=1
∞
X
An =
µ(An ).
n=1
(6.5)
n=1
Soit ε > 0 et pour tout n soit Kn un compact inclus dans An tel que
µ(Kn ) ≥ µ(An ) −
ε
2n
on a alors (en utilisant la monotonie de µ∗ , le fait que les Kn soient disjoints
et (6.4))
µ∗
∞
[
N
N
[
[
An ≥ µ ∗
An ≥ µ
Kn
n=1
n=1
=
N
X
n=1
µ(Kn ) ≥
N
X
n=1
et donc
µ∗
∞
[
µ(An ) − ε.
n=1
∞
X
An ≥
µ(An ).
n=1
n=1
Soit Vn un ouvert contenant An et tel que
µ(Vn ) ≤ µ(An ) +
116
ε
2n
(6.6)
on a alors en utilisant (6.2)
µ
∗
∞
[
An ≤ µ
∞
[
n=1
Vn ≤
n=1
∞
X
µ(Vn )
n=1
≤
∞
X
µ(An ) + ε
n=1
Avec (6.6), et le fait que µ∗ ≤ µ∗ , on en déduit bien (6.5).
Etape 5 : B est une σ-algèbre contenant les boréliens.
Avec ce qui précède, il est facile d’établir que
B = {A ⊂ X : ∀ε > 0, ∃K (compact) ⊂ A ⊂ V (ouvert) et µ(V \ K) ≤ ε}
on en déduit immédiatement que B est stable par complémentaire et donc,
avec l’étape 4 que B est une σ-algèbre. Comme B contient les ouverts (étape
3), B contient les boréliens. En outre, il résulte de l’étape 4 que µ est σadditive sur B et par construction µ est régulière (ou plus précisément sa
restriction à BX est régulière).
Etape 6 : µ représente T .
R
Soit f ∈ C(X), montrons
que
T
(f
)
=
f dµ, par linéarité notons qu’il
X
R
suffit de montrer T (f ) ≤ X f dµ. Comme T (1) = µ(X), on peut sans perte
de généralité (ajout d’une constante à f et homogénéité) supposer que 0 ≤
f ≤ 1. Soit ε > 0 et N = Nε = [ε−1 ] + 1, pour tout k ∈ {0, ..., N } posons
Ak := {x ∈ X : (k − 1)ε < f (x) ≤ kε}.
Pour tout k soit Vk un ouvert contenant Ak et tel que µ(Vk \Ak ) ≤ ε/(N +1),
sans perte de généralité on peut supposer que f ≤ (k + 1)ε sur Vk . On a alors
Z
f dµ ≥
X
N
X
(k − 1)εµ(Ak ) ≥
k=1
N
X
(k − 1)εµ(Vk ) − ε.
k=1
Soit g0 , ..., gN une partition de l’unité subordonnée au recouvrement de X
par les Vk on a alors
T (f ) =
N
X
k=0
T (f gk ) ≤
N
X
(k + 1)εT (gk ) ≤
k=0
et donc on obtient bien que T (f ) ≤
2
N
X
(k + 1)εµ(Vk )
k=0
R
X
f dµ en faisant tendre ε vers 0.
117
Corollaire 6.1 Toute mesure borélienne finie sur un métrique compact est
régulière.
Définition 6.2 Soit (X, d) un espace métrique compact, on appelle mesure
de Radon sur X toute forme linéaire continue sur C(X). On note M(X) :=
C(X)0 l’espace des mesures de Radon sur X et pour tout T ∈ M(X) :
kT kM(X) := kT kC(X)0 = sup{T (f ), f ∈ C(X), kf k ≤ 1}.
Evidemment pour une mesure de Radon positive T = Tµ on a
kT kM(X) = T (1) = µ(X).
Le théorème de Riesz nous a permis d’identifier les mesures de Radon positives sur X aux mesures boréliennes finies. Le résultat suivant permet de
décomposer toute mesure de Radon en partie positive et négative et ce de
manière canonique (minimale en un certain sens) :
Proposition 6.3 Soit (X, d) un espace métrique compact et T une mesure
de Radon sur X. Définissons pour tout f ∈ C(X), f ≥ 0 :
T + (f ) := sup{T (g) : g ∈ C(X) 0 ≤ g ≤ f },
T − (f ) := − inf{T (g) : g ∈ C(X) 0 ≤ g ≤ f }
et, pour tout f ∈ C(X) (en posant f+ = max(f, 0) et f− = max(−f, 0)) :
T + (f ) := T + (f+ ) − T + (f− ), T − (f ) := T − (f+ ) − T − (f− )
alors T + et T − sont deux mesures de Radon positives (appelées respectivement partie positive et négative de T ). On a T = T + − T − et
kT kM(X) = kT + kM(X) + kT − kM(X) = T + (1) + T − (1).
(6.7)
De plus la décomposition de T = T + − T − est minimale en ce sens que si
T = T1 − T2 avec T1 et T2 , mesures de Radon positives alors T1 ≥ T + et
T2 ≥ T − .
Preuve:
Montrons d’abord la linéarité de T + . Soit f1 et f2 dans C(X), positives, on
a
T + (f1 ) + T + (f2 ) = sup{T (g1 + g2 ), gi ∈ C(X), 0 ≤ gi ≤ fi } ≤ T + (f1 + f2 ).
118
Soit ε > 0 et g ∈ C(X), 0 ≤ g ≤ f1 + f2 tel que T + (f1 + f2 ) ≤ T (g) + ε. On a
alors g = min(g, f1 )+(g −f1 )+ et comme 0 ≤ (g −f1 )+ ≤ f2 , min(g, f1 ) ≤ f1 ,
on a
T + (f1 + f2 ) ≤ T (min(g, f1 )) + T ((g − f1 )+ ) + ε ≤ T + (f1 ) + T + (f2 ) + ε
de sorte que
T + (f1 + f2 ) = T + (f1 ) + T + (f2 ), ∀f1 , f2 continues et positives.
Soit f1 et f2 dans C(X), positives, et f := f1 − f2 = f+ − f− , il découle de
ce qui précède et de f1 + f− = f2 + f+ qu’on a
T + (f1 ) + T + (f− ) = T + (f2 ) + T + (f+ )
et donc
T + (f ) = T + (f1 − f2 ) = T + (f+ ) − T + (f− ) = T + (f1 ) − T + (f2 )
en particulier comme T + (0) = 0 on a T + (−f ) = −T + (f ) et comme T + (λf ) =
λT + (f ) pour tout λ > 0 la linéarité de T + est établie. La continuité de T +
découle immédiatement de sa positivité (T + (f − kf k) ≤ 0 et donc T + (f ) ≤
kf kT + (1) ≤ kf kkT kM(X) ). Ensuite, on remarque que si f ∈ C(X) et f ≥ 0
alors
(T + − T )(f ) = sup{T (g − f ) : 0 ≤ g ≤ f }
= sup{−T (h) : 0 ≤ h ≤ f } = T − (f )
on a donc T − (f ) = T + (f ) − T (f ) pour tout f ≥ 0 et ceci est également vrai
pour tout f ∈ C(X) (écrire f = f+ − f− ). La linéarité et la continuité de T −
en découlent (sa positivité est évidente) ainsi que l’identité T = T + − T − .
D’une part, si f ∈ C(X) et kf k ≤ 1 on a T (f ) = T + (f ) − T − (f + ) +
T − (f − ) ≤ T + (1) + T − (1) et donc kT kM(X) ≤ T + (1) + T − (1). D’autre part,
on a
T + (1) + T − (1) = sup{T (f − g) : 0 ≤ f, g ≤ 1}
≤ sup{T (h) : h ∈ C(X), khk ≤ 1} = kT kM(X)
on a donc bien (6.7).
Enfin, montrons que la décomposition T = T + − T − est minimale. Si
T = T1 − T2 on a T ≤ T1 et donc pour tout f ≥ 0 on a
T + (f ) ≤ sup{T1 (g) : g ∈ C(X), 0 ≤ g ≤ f } = T1 (f )
119
et donc T+ ≤ T1 .
2
En particulier T+ − T− est l’unique décompostion de T comme différence
de mesures de Radon vérifiant la propriété (6.7). On déduit immédiatement
de la proposition précédente et du théorème de Riesz 6.4 le théorème de
représentation suivant :
Théorème 6.5 (Théorème de représentation de Riesz, cas compact) Soit
(X, d) un espace métrique compact et T une mesure de Radon sur X, alors il
existe deux mesures boréliennes (positives) finies µ1 et µ2 telles que T = Tµ1 −
Tµ2 . En outre, il existe une unique représentation sous la forme précédente
vérifiant
kT kM(X) = µ1 (X) + µ2 (X).
Autrement dit, le théorème de Riesz 6.5 permet d’identifier les mesures
de Radon sur X aux mesures signées c’est à dire différences de deux mesures
boréliennes (positives) finies. Si µ est une mesure signée s’écrivant µ = µ1 −µ2
avec µ1 et µ2 positives, la proposition 6.3 fournit une manière minimale
de décomposer µ en partie positive et négative : on décompose T = Tµ =
Tµ1 − Tµ2 en sa partie positive et négative T = T + − T − = Tµ+ − Tµ− avec
µ+ et µ− représentant respectivement T + et T − . On vérifie immédiatement
que µ = µ+ − µ− , µ+ et µ− s’appellent respectivement partie positive et
négative de µ. La décomposition µ = µ+ − µ− est minimale au sens où si
µ = µ1 − µ2 avec µi positive alors µ1 ≥ µ+ et µ2 ≥ µ− . Intuitivement quand
on décompose µ = µ1 − µ2 en µ+ − µ− on a retiré la masse commune à µ1 et
µ2 ; on s’attend donc à ce que µ+ et µ− n’aient pas de partie en commun en
un certain sens. On peut donner un sens précis à cette intuition au travers
de la notion de mesures étrangères :
Lemme 6.1 Soit µ une mesure signée sur le compact (X, d) de partie positive µ+ et de partie négative µ− . Alors µ+ et µ− sont étrangères : il existe
un borélien A de X tel que µ+ (A) = µ+ (X) et µ− (A) = 0 (autrement dit µ+
est portée par A et µ− par X \ A).
Preuve:
Nous savons que
Z
Z
sup{ f dµ+ −
f dµ− : f ∈ C(X), kf k ≤ 1} = µ+ (X) + µ− (X)
X
X
et donc pour tout k ≥ 1, n ≥ 1, il existe fk,n ∈ C(X), tel que kfk,n k ≤ 1 et
Z
Z
1
µ+ (X) + µ− (X) ≤
fk,n dµ+ −
fk,n dµ− + n
k2
X
X
120
en posant Vk,n := {fk,n > 0} on a donc
Z
Z
1
(fk,n )+ dµ+ (fk,n )− dµ− + n
µ+ (X) + µ− (X) ≤
k2
X
X
1
≤ µ+ (Vk,n ) + µ− (X \ Vk,n ) + n
k2
et donc
µ+ (X \ Vk,n ) + µ− (Vk,n ) ≤
Posons
A :=
\[
Vk,n
1
.
k2n
(6.8)
n
k
il découle de (6.8) que µ− (A) = 0 et µ+ (X \ A) = 0. 2
Soit µ = µ+ − µ− une mesure signée sur X et A, borélien tel que µ− (A) =
µ+ (X \ A) = 0. La mesure positive |µ| := µ+ + µ− est appelée mesure de
variation totale de la mesure µ. Pour tout B ∈ BX on a
µ+ (B) = µ+ (B ∩ A) = µ(B ∩ A) = |µ|(B ∩ A),
µ− (B) = µ− (B \ A) = −µ(B \ A) = |µ|(B \ A).
On appelle variation totale de µ et l’on note kµkTV la norme kTµ kM(X) :
Z
kµkTV = sup
f dµ = µ+ (X) + µ− (X) = |µ|(X).
kf k≤1
X
Enfin, on aurait tout aussi bien pu définir les parties positive et négatives
de la mesure signée µ comme étant l’unique couple de mesures positives
étrangères dont la différence est µ.
Exercice 6.1 Montrer que kµkTV est le sup sur les familles finies de Boréliens
disjoints (Ai ) de X de la quantité
X
|µ(Ai )|.
i
6.3
Mesures de Radon dans le cas localement
compact
Dans tout ce paragraphe, nous supposerons que (X, d) est un espace
métrique localement compact et σ-compact au sens où il existe une suite
121
strictement croissante de compacts (X
S m )m d’intérieur non vide tels que Xm ⊂
int(Xm+1 ) pour tout m et et X = m Xm (autrement dit Xm est une suite
exhaustive de compacts de X). Notons que ces hypothèses impliquent que X
est non compact (sans quoi on pourrait extraire un recouvrement fini du recouvrement de X par les ouverts int(Xm ) ce qui contredirait le fait que Xm
est strictement croissante). Notons également que tout compact de X est
contenu dans Xm pour m assez grand. Le cadre localement compact couvre
naturellement le cas où X = Rd ou plus généralement X, ouvert de Rd . Toutefois, l’hypothèse de compacité locale peut s’avérer restrictive et élimine de
fait certaines applications intéressantes en dimension infinie, ce qui explique
qu’on préfère parfois travailler dans le cadre plus général des espaces Polonais
(métriques séparables et complets), nous renvoyons le lecteur intéressé aux
notes de cours de Cédric Villani [21].
Exercice 6.2 Soit (X, d) vérifiant les hypothèses de ce paragraphe, montrer
que X est séparable et complet.
Comme X n’est pas compact, on est naturellement amenés à distinguer
différents espaces de fonctions continues sur X (et à nous intéresser tout
particulièrement à leur dual topologique respectif) :
– Cc (X), l’espace des fonctions continues à support compact : c’est la
réunion des espaces CXm (X) des fonctions continues à support dans
Xm , Cc (X) est muni de sa topologie limite inductive des espaces CXm (X),
ainsi une forme linéaire T est continue sur Cc (X) si et seulement si pour
tout m, il existe une constante C = Cm telle que
|T (f )| ≤ C sup |f (x)|, ∀f ∈ Cc (X) : supp(f ) ⊂ Xm
x∈Xm
ce qui revient aussi à dire que pour tout compact K de X, il existe une
constante C = CK telle que
|T (f )| ≤ C sup |f (x)|, ∀f ∈ Cc (X) : supp(f ) ⊂ K
x∈K
On appelle espace des mesures de Radon (localement finies) sur X et
l’on note Mloc (X) le dual topologique de Cc (X),
– Cb (X) est l’espace des fonctions continues bornées sur X, muni de la
norme uniforme, c’est un espace de Banach (non séparable),
– C0 (X) est l’espace des fonctions continues sur X, tendant vers 0 à
l’infini, c’est à dire des fonctions f ∈ C(X) telles que pour tout ε > 0 il
existe m tel que |f (x)| ≤ ε pour tout x ∈ X\Xm (ce qui est évidemment
équivalent à : pour tout ε > 0 il existe un compact K de X tel que
supx∈X\K |f (x)| ≤ ε) ; C0 (X) est un sev fermé de Cb (X) et donc est de
Banach pour la norme uniforme.
122
Exercice 6.3 Montrer que C0 (X) est séparable mais que Cb (X) ne l’est pas,
que C0 (X) est fermé dans Cb (X) et que Cc (X) est dense dans C0 (X) (pour
la norme uniforme).
Nous allons commencer par traiter le cas de Cc (X) et de son dual. Rappelons que Cc (X) muni de la topologie limite inductive des espaces CXm (X) est
complet et séquentiellement séparable. Comme dans le paragraphe précédent
on dit que la forme linéaire T sur Cc (X) est positive si T (f ) ≥ 0 pour tout
f ∈ Cc (X), f ≥ 0. On vérifie facilement que toute forme linéaire positive
sur Cc (X) est une mesure de Radon. On adapte facilement les arguments
du paragraphe précédent pour montrer que toute mesure de Radon sur X se
décompose en la différence de deux mesures de Radon positives. En adaptant
les arguments du cas compact, on obtient alors le résultat de représentation
suivant :
Théorème 6.6 (Théorème de représentation de Riesz, cas non compact)
Soit T une mesure de Radon sur X alors il existe couple de mesures boréliennes
(positives) µ+ et µ− , finies sur les compacts de X telles que
Z
Z
T (f ) =
f dµ+ −
f dµ− , ∀f ∈ Cc (X).
X
X
Autrement dit, les mesures de Radon sur X se représentent par des mesures
signées sur X de la forme µ+ − µ− avec µ+ et µ− positives et finies sur les
compacts (par la suite nous appellerons simplement de telles mesures mesures
signées). On a l’unicité dans la représentation précédente si on impose en plus
que les restrictions de µ± à tout compact sont étrangères. Si Ω est un ouvert
de Rd , les distributions d’ordre 0 sur Ω sont donc les mesures boréliennes
signées, finies sur les compacts.
On déduit des résultats généraux du chapitre 1, un premier résultat utile
de compacité séquentielle :
Proposition 6.4 Soit (Tn ) une suite de mesures de Radon sur X telle que
(Tn (f ))n est bornée pour tout f ∈ Cc (X) alors il existe une mesure de Radon
T et une sous-suite de (Tnk ) de (Tn ) telles que
Tnk (f ) → T (f ), ∀f ∈ Cc (X).
Preuve:
Il résulte du théorème de Banach-Steinhaus (sous la forme de la proposition
1.7) que
f ∈ Cc (X) 7→ p(f ) := sup |Tn (f )|
n
123
est une semi-norme continue sur Cc (X). Comme Cc (X) est séquentiellement
séparable, le résultat cherché découle du théorème de Banach-Alaoglu-Bourbaki
(sous la forme du théorème 1.6).
2
On peut évidemment traduire cette propriété de compacité en termes de
mesures signées. Tout d’abord, on définit la convergence vague comme suit
Définition 6.3 Si (µn )n et µ sont des mesures signées sur X, on dit que
(µn ) converge vaguement vers X si
Z
Z
f dµn →
f dµ, ∀f ∈ Cc (X).
X
X
R
Ensuite la proposition 6.4 traduit le fait que si ( X f dµn ) est bornée pour
tout f ∈ Cc (X) alors (µn ) possède une sous-suite qui converge vaguement.
Par exemple, toute suite de mesure de probabilité possède une sous-suite
qui converge vaguement (mais sa limite n’est pas forcément une mesure de
probabilité, il peut y avoir perte de masse comme le montre l’exemple µn = δn
sur R qui converge vaguement vers 0).
On va maintenant s’intéresser au dual topologique de l’espace de Banach
C0 (X) et montrer qu’il peut s’identifier à l’espace des mesures signées finies
(i.e. de le forme µ+ − µ− avec µ± ≥ 0 et µ± (X) < +∞).
Lemme 6.2 Soit T une forme linéaire positive sur C0 (X) alors T est continue.
Preuve:
Si T n’était pas continue on pourrait pour chaque n trouver fn ∈ C0 (X) telle
que T (fn ) ≥ n et kfn k ≤ 1, quitte à remplacer
n par sa partie positive on
P f−2
peut en outre choisir les fn positifs. La série
n fn converge normalement
dans C0 (X) et donc converge car C0 (X) est de Banach, notons f sa somme
on a alors pour tout
N
N
X
X
1
1
T (fn ) ≥
→ ∞ quand N → ∞
T (f ) ≥
2
n
n
n=1
n=1
ce qui est absurde.
2
En procédant comme pour la proposition 6.3 on a
124
Lemme 6.3 Soit T ∈ C0 (X)0 , il existe un unique couple (T + , T − ) de formes
linéaires positives sur C0 (X) telles que T = T + − T − et
kT kC0 (X)0 = kT + kC0 (X)0 + kT − kC0 (X)0 .
Il est clair que si µR = µ+ − µR− est une mesure signée finie alors Tµ :
f ∈ C0 (X) 7→ Tµ (f ) = X f dµ+ − X f dµ− est une forme linéaire continue et
que kTµ kC0 (X)0 ≤ |µ|(X) = µ+ (X) + µ− (X). Si en outre, on impose que µ+
et µ− sont étrangères alors
kTµ kC0 (X)0 ≤ |µ|(X) = µ+ (X) + µ− (X).
Le théorème suivant énonce que réciproquement tout élément de C0 (X)0 se
représente par une mesure signée finie :
Théorème 6.7 (Théorème de représentation de Riesz, cas non compact,
dual de C0 (X)) Soit T ∈ C0 (X)0 , alors il existe couple de mesures boréliennes
(positives) finies µ+ et µ− , telles que
Z
Z
f dµ− , ∀f ∈ C0 (X).
f dµ+ −
T (f ) =
X
X
Preuve:
Comme T ∈ Cc (X)0 , il découle du théorème 6.6 qu’il existe des mesures
boréliennes µ± , finies sur les compacts telles que
Z
Z
+
−
f dµ− , ∀f ∈ Cc (X).
(6.9)
f dµ+ −
T (f ) = T (f ) − T (f ) =
X
X
Montrons
que µ+ etP
µ− sont finies. Supposons par l’absurde que µ+ (X) =
P
m µ+ (Xm \Xm ) =
m (µ+ (∂Xm )+µ+ (int(Xm )\Xm−1 ) = +∞ de sorte que
l’une des séries de terme général
ηm = µ+ (∂Xm ) ou ηm = µ+ (int(Xm )\Xm−1 )
P
diverge. Supposons que m ηm = +∞ avec ηm = µ+ (∂Xm ). Soit alors Vm
des voisinages ouverts de ∂Xm deux
P à deux disjoints et gm ∈ Cc (X) tel
que χ∂Xm ≤ gm P
≤ χVm . Comme
ηm = +∞, il existe une suite cm ≥ 0,
cP
m → 0 telle que
m cm ηm = +∞ (choisir mk strictement croissante telle que
mk+1 −1
−1
pour m ∈ {mk , ..., mk+1 − 1}). On pose alors
mk P ηm ≥ 1 et cm = k
g := m cm gm comme les gm ont des supports disjoints et comme cm → 0
on a g ∈ C0 (X) et donc
+
T (g) ≥
M
X
+
cm T (gm ) ≥
m=1
M
X
m=1
125
cm µ+ (∂Xm )
P
ce qui constitue la contradiction recherchée. Si m ηm = +∞ avec ηm =
µ+ (int(Xm ) \ Xm−1 ), on choisit pour chaque m un compact Km ⊂ int(Xm ) \
Xm−1 tel que µ+ (Km ) ≥ ηm − 2−m−1 , puis gm ∈ Cc (X) tel que χKm ≤ gm ≤
χint(Xm )\Xm−1 et l’on procède exactement comme dans le cas précédent.
Comme µ± sont finies, le fait que µ+ − µ− représente effectivement T
découle de (6.9) et de la densité de Cc (X) dans C0 (X).
2
Comme dans le cas compact, on a unicité de µ+ et µ− si l’on impose en
outre
kTµ kC0 (X)0 ≤ |µ|(X) = µ+ (X) + µ− (X).
Attention : dans le cas où X n’est pas compact, et en notant Cb (X)
l’espace des fonctions continues bornées sur X (muni de la norme uniforme
qui en fait un espace de Banach), on ne peut identifier les formes linéaires
continues sur Cb (X) à des mesures. En effet soit F le sev de Cb (R) formé
par les fonctions ayant une limite en +∞ et soit T (f ) := lim+∞ f pour tout
f ∈ F . Comme T (f ) ≤ kf k pour tout f ∈ F , on peut, grâce au théorème
de Hahn-Banach prolonger T en un élément (encore noté T ) de Cb (R)0 . Si T
était représenté par une mesure µ, comme T (f ) = 0 pour tout f ∈ Cc (R) on
aurait µ = 0 et donc aussi T = 0, ce qui est absurde.
Définition 6.4 On dit qu’une suite de mesures (finies) (µn ) sur X converge
étroitement vers une mesure (finie) µ sur X si
Z
Z
f dµ, ∀f ∈ Cb (X).
f dµn →
X
X
L’important théorème suivant (qui présente certaines analogies avec le
théorème de Dunford-Pettis) donne un critère (la tension, propriété qui assure
que la masse ”ne part pas à l’infini” et qui exclut en particulier les cas du
type µn = δn dans R) de compacité séquentielle pour la convergence étroite
dans les mesures positives
Théorème 6.8 (Théorème de Prokhorov) Soit (µn ) une suite de mesures
positives sur X, si µn (X) est bornée et si (µn ) est tendue au sens où pour
tout ε > 0, il existe un compact K tel que
sup µn (X \ K) ≤ ε
n
alors (µn ) possède une sous-suite qui converge étroitement vers une mesure
finie.
126
Preuve:
Grâce à la proposition 6.4, on peut supposer (à une extraction encore notée
(µn ) près) que (µn ) converge vaguement vers µ ∈ Mloc (X). Pour tout m, on
a alors µ(Xm ) ≤ lim inf n µn (Xm ) ≤ C et donc µ(X) = supm µ(Xm ) ≤ C de
sorte que µ est finie. Soit ε > 0, comme µ(Xm ) tend vers µ(X), il existe m
tel que µ(X) ≤ µ(Xm ) + ε, ce qui montre que µ est tendue. Soit maintenant
f ∈ Cb (X), ε > 0 et K un compact de X vérifiant supn µn (X \ K) ≤ ε et
µ(X \ K) ≤ ε. Soit g ∈ Cc (X) tel que χK ≤ g ≤ 1, on a alors
Z
Z
Z
f d(µn − µ) ≤
f gd(µn − µ) +
f (1 − g)d(µn − µ)
X
X
X
Z
Z
f gd(µn − µ) +
f (1 − g)d(µn − µ)
=
X
X\K
Z
≤
f gd(µn − µ) + 2εkf k
X
R
et
on
conclut
en
remarquant
que
puisque
f
g
∈
C
(X),
on
a
f gdµn →
c
X
R
f gdµ quand n → ∞.
X
2
Pour comprendre l’intérêt de la tension et du théorème de Prokhorov
prenons l’exemple d’une suite de mesures de probabilité. Nous savons déjà
qu’une telle suite possède (en sous-suite) une limite vague (positive) mais
que cette limite vague n’est pas forcément de masse 1. Si la suite est en outre
tendue, cette limite vague est une mesure de probabilité (prendre 1 comme
fonction-test dans la convergence étroite).
Mentionnons pour clore ce paragraphe l’important principe de concentrationcompacité dû à Pierre-Louis Lions. Nous renvoyons le lecteur aux articles
célèbres ([14]) pour la preuve et les applications de ce principe en calcul des
variations. Soit (µn ) une suite de mesures de probabilité sur Rd (pour faire
simple) alors il y a trois comportements possibles :
– l’évanescence :
∀R > 0, lim sup µn (B(x, R)) = 0,
n x∈Rd
– la concentration : il existe (xn ) tel que pour tout ε > 0, il existe R > 0
tel que pour tout n, on ait µn (B(xn , R)) ≥ 1 − ε,
– la dichotomie : il existe α ∈]0, 1[ tel que pour tout ε > 0 il existe R > 0,
Rn → ∞ et (xn ) tels que pour tout n
|µn (B(xn , R) − α| ≤ ε et µn (B(xn , Rn ) \ B(xn , R)) ≤ ε.
127
6.4
Théorème de Radon-Nikodym, désintégration
des mesures
Soit (X, B) un espace mesurable, ν une mesure (positive) sur (X, B) et f
une fonction mesurable et positive, l’application
Z
f dν
B ∈ B 7→
B
est σ-additive en vertu du théorème de convergence monotone, c’est donc
une mesure µ notée sous la forme dµ = f dν. On dit que deux mesures µ
et ν sont étrangères, ce que l’on note µ ⊥ ν si elles sont portées par deux
ensembles mesurables disjoints i.e. s’il existe A et B dans B et disjoints tels
que µ(X \ A) = 0 et ν(X \ B) = 0. On appelle mesure signée finie toute
fonction de B dans R de la forme µ = µ+ − µ− avec µ+ et µ− mesures
(positives) finies sur (X, B) et étrangères. Notons que si µ+ et µ− ne sont
pas finies alors on ne peut définir µ+ − µ− pour les B ∈ B tels que µ+ (B) =
µ− (B) = +∞ la définition µ = µ+ − µ− est alors purement formelle. Le
théorème de Hahn permet d’identifier les fonctions σ-additives sur B à valeurs
dans R aux mesures signées finies, nous nous limiterons donc ici aux mesures
signées finies. On dira qu’une mesure signée finie µ = µ+ −µ− est absolument
continue par rapport à une mesure ν (ce que l’on notera µ ν) si µ(B) = 0
pour tout B ∈ B tel que ν(B) = 0. Evidemment toute mesure de la forme
dµ = f dν = f+ dν −f− dν avec f ∈ L1 (ν) est absolument continue par rapport
à ν, le théorème de Radon-Nikodym énonce précisément la réciproque. On dit
que la mesure signée finie µ = µ+ − µ− est portée par A ∈ B si et seulement
si pour tout B ∈ B on a µ(B) = µ(B ∩ A) et que deux mesures signées
finies µ1 et µ2 sont étrangères (notation µ1 ⊥ µ2 ) si µ1 et µ2 sont portées
par deux ensembles mesurables disjoints. Notons que si la mesure signée finie
µ = µ+ − µ− est portée par A alors µ+ , µ− et |µ| aussi. Enfin notons que si
µ est une mesure signée finie et ν une mesure alors
µ ν ⇒ µ+ ν, µ− ν
et
µ ⊥ ν et µ ν ⇒ µ = 0.
Exercice 6.4 Soit µ et ν deux mesures positives finies montrer que µ ν
si et seulement si pour tout ε > 0 il existe δ > 0 tel que pour tout B ∈ B si
ν(B) ≤ δ alors µ(B) ≤ ε.
128
Théorème 6.9 (Théorème de décomposition de Lebesgue) Soit (X, B) un
espace mesurable, ν une mesure positive σ-finie et µ une mesure signée finie
sur (X, B). Il existe un unique couple (f, µs ) tel que f ∈ L1 (ν), µs est une
mesure signée finie et
dµ = f dν + dµs , avec µs ⊥ ν.
Preuve:
Montrons d’abord l’unicité, supposons que
dµ = f1 dν + dµs1 = f2 dν + dµs2 ,
avec fi ∈ L1 (ν) et µsi ⊥ ν pour i = 1, 2, on a alors (f1 − f2 )dν = dµs2 − dµs1 et
cette mesure est à la fois étrangère à ν et absolument continue par rapport
à ν et par suite µs1 = µs2 et f1 = f2 dans L1 (ν).
Pour l’existence, on peut sans perte de généralité supposer µ positive et
ν finie et l’on procède comme suit (l’argument est dû à Von Neumann). On
définit la forme linéaire T sur l’espace de Hilbert L2 (µ + ν) :
Z
ϕdµ, ∀ϕ ∈ L2 (µ + ν)
T (ϕ) :=
X
en utilisant l’inégalité de Cauchy-Schwarz, on a pour tout ϕ ∈ L2 (µ + ν)
|T (ϕ)| ≤ kϕkL2 (µ+ν) µ(X)1/2
de sorte que T est continue. Le théorème de représentation de Riesz (dual
d’un Hilbert) permet d’en déduire l’existence de g ∈ L2 (µ + ν) tel que
Z
Z
ϕdµ =
ϕgd(µ + ν), ∀ϕ ∈ L2 (µ + ν)
(6.10)
X
X
en particulier en prenant ϕ = χB pour B ∈ B on en déduit
dµ = gd(µ + ν).
Il est facile d’en déduire que 0 ≤ g ≤ 1 (µ + ν)-p.p. ; posons ensuite
S := {g = 1}, T := {g < 1},
et
µa (B) := µ(B ∩ T ), µs (B) := µ(B ∩ S), ∀B ∈ B
129
on a bien sûr µ = µa + µs et µs portée par S. Comme µ(S) = µ(S) + ν(S) on
a ν(S) = 0 et donc µs ⊥ ν. Il ne nous reste plus qu’à montrer que dµa = f dν
avec f ∈ L1 (ν). Réécrivons (6.10) sous la forme
Z
Z
ϕ(1 − g)dµ =
ϕgdν, , ∀ϕ ∈ L2 (µ + ν).
X
X
Soit B ∈ B, n ∈ N en prenant ϕn := χB∩T (1 + .... + g n ) dans l’identité
précédente il vient
Z
Z
n+1
χT (1 − g )dµ =
χT g(1 + ... + g n )dν
B
B
par le théorème de convergence dominée le membre de gauche converge vers
µ(B ∩ T ) = µa (B) et par convergence monotone celui de droite converge vers
Z
g
dν
χT
1−g
B
on en déduit que dµa = f dν avec
f = χT
g
∈ L1 (ν).
1−g
2
On en déduit comme corollaire immédiat :
Théorème 6.10 (Théorème de Radon-Nikodym) Soit (X, B) un espace mesurable, ν une mesure positive σ-finie et µ une mesure signée finie. Si µ ν
alors il existe un unique f ∈ L1 (ν) tel que dµ = f dν.
La fonction f ∈ L1 (ν) dans le théorème de Radon-Nikodym s’appelle
densité de Radon-Nikodym de µ par rapport à ν et se note souvent sous la
forme
dµ
f=
.
dν
Une conséquence utile du théorème de Radon-Nikodym est le théorème
de désintégration des mesures sur un espace produit. Nous nous limiterons ici
aux mesures de probabilité car c’est ce cas qui nous sera utile pour le transport optimal (il existe des théorèmes de désintégration bien plus généraux
nous ne traitons ici qu’un cas simple mais illustratif). Soit donc (X1 , B1 ) et
(X2 , B2 ) deux espaces mesurables et munissons X1 × X2 de la tribu produit
σ(B1 × B2 ). Si γ est une mesure de probabilité sur (X1 × X2 , σ(B1 × B2 )), on
définit les marginales (ou marges) de γ, π1 γ et π2 γ par
π1 γ(A1 ) := γ(A1 × X2 ), π2 γ(A2 ) := γ(X1 × A2 )
pour tout A1 ∈ B1 et tout A2 ∈ B2 . On vérifie immédiatement que πi γ est
une mesures de probabilité sur (Xi , Bi ).
130
Théorème 6.11 (Désintégration d’une probabilité par rapport à l’une de
ses marges) Soit X1 et X2 des espaces métriques compacts munis de leur
tribu borélienne. Soit γ une mesure borélienne de probabilité sur X1 × X2
et µ := π1 γ alors il existe une famille de mesures de probabilité (γ x1 )x1 ∈X1
mesurable au sens où x1 7→ γ x1 (A2 ) est µ-mesurable pour tout A2 ∈ B2 et
telle que γ = γ x1 ⊗ µ c’est à dire
Z
γ x1 (A2 )dµ(x1 )
γ(A1 × A2 ) =
A1
pour tout A1 ∈ B1 et tout A2 ∈ B2 .
Preuve:
Nous n’allons donner que l’idée de départ, la preuve complète s’avérant assez
longue (cf. Villani [21]). Fixons B ∈ BX2 et définissons
µB (A) := γ(A × B), ∀A ∈ BX1
alors µB est une mesure borélienne positive sur X1 et µB µ de sorte que
l’on peut définir
dµB
fB :=
dµ
et l’on a bien
Z
fB (x)dµ(x) ∀A ∈ B1 .
γ(A × B) =
A
La difficulté est que fB n’est définie qu’ à un ensemble µ-négligeable près qui
dépend de B on ne peut donc pas définir directement γ x (B) := fB (x) car BX2
n’est généralement pas dénombrable (c’est là qu’interviennent les hypothèses
de métrisabilité et de compacité sur X1 et X2 qui permettent de se ramener
à une famille dénombrable de mesurables, on renvoie au chapitre 10 du cours
de Villani [21] pour une démonstration complète).
2
En termes probabilistes, en interprétant γ comme la loi d’un couple de
variables aléatoires (X1 , X2 ), γ x1 n’est autre que la probabilité conditionnelle de X2 sachant X1 = x1 . Terminons ce paragraphe par une application
immédiate du théorème de désintégration.
Lemme 6.4 (Dudley’s gluing Lemma) Soit Xi , i = 1, 2, 3 des espaces métriques
compacts munis de leur tribu borélienne, et µi une mesure borélienne de probabilité sur Xi . Soit γ12 (resp. γ23 ) une mesure borélienne de probabilité sur
X1 × X2 (resp. X2 × X3 ) de marges µ1 , µ2 (resp. µ2 , µ3 ), alors il existe une
mesure borélienne de probabilité γ sur X1 × X2 × X3 telle que π12 γ = γ12 et
π23 γ = γ23 .
131
Preuve:
On désintégre γ12 et γ13 par rapport à leur marge commune µ2 :
γ12 = η x2 ⊗ µ2 , γ23 = θx2 ⊗ µ2
puis l’on définit γ par
Z
η x2 (A1 )θx2 (A3 )dµ2 (x2 )
γ(A1 × A2 × A3 ) :=
A2
pour tous boréliens A1 , A2 , A3 . On vérifie sans peine que γ vérifie les propriétés requises.
2
6.5
Dualité convexe et transport optimal
L’objectif de ce paragraphe est triple :
– donner un bref aperçu du transport optimal, sujet qui a connu un essor
considérable ces dernières années tant sur le plan théorique que du
point de vue applicatif (voir à ce sujet les excellents ouvrages de Cédric
Villani),
– en déduire des métriques explicites métrisant la topologie faible ∗ sur les
mesures de probabilité : les distances de Wasserstein (il est à noter qu’il
en existe beaucoup d’autres telles que la métrique de Lévy-Prokhorov)
– fournir une introduction à la dualité convexe qui est un outil utile dans
divers contextes notamment en calcul des variations.
Encore une fois, par souci de simplicité nous nous restreindrons au cas
compact et laisserons au lecteur le soin de généraliser ce qui suit à des cas
plus généraux. Les données du problème du transport optimal de MongeKantorovich sont deux espaces métriques compacts X et Y , une fonction de
coût de transport c ∈ C(X ×Y ) et deux mesures de probabilités (Boréliennes)
µ et ν sur X et Y respectivement. On note Π(µ, ν) l’ensemble des plans de
transport (entre µ et ν) c’est à dire l’ensemble des probabilités Boréliennes
sur X × Y ayant µ et ν comme marginales. Autrement dit, γ, probabilité
Borélienne sur X × Y est un plan de transport si :
Z
Z
ϕ(x)dγ(x, y) =
ϕ(x)dµ(x), ∀ϕ ∈ C(X)
X×Y
et
X
Z
Z
ψ(y)dµ(y), ∀ψ ∈ C(Y ).
ψ(y)dγ(x, y) =
X×Y
X
132
Notons que Π(µ, ν) est non vide car µ ⊗ ν ∈ Π(µ, ν) et compact pour la
topologie faible ∗ des mesures. Le problème de Monge-Kantorovich s’écrit
alors
Z
inf
c(x, y)dγ(x, y)
(6.11)
γ∈Π(µ,ν)
X×Y
L’existence d’une solution découle immédiatement de la compacité de Π(µ, ν)
et du fait que l’objectif est donné par une forme linéaire continue (il s’agit
d’un problème de programmation linéaire en dimension infinie).
Un ingrédient important dans la théorie du transport optimal est sa formulation duale. Nous allons présenter ici un théorème général de dualité
convexe qui a son intérêt en soi et a d’autres applications en calcul des variations, c’est également l’occasion d’insister une fois de plus sur l’importance de
la convexité. Le problème de Monge-Kantorovich étant un bon exemple d’application de la dualité convexe, ceci justifie de nous éloigner provisoirement
du transport optimal pour y revenir plus en détail plus tard.
Soit E et F deux evn, Λ ∈ L(E, F ) et f et g deux fonctions convexes sci,
F : E → R ∪ {+∞} et G : F → R ∪ {+∞} qu’on supposera propres c’està-dire non identiquement égales à +∞. On appelle transformée de Legendre
de f et l’on note f ∗ la fonction définie par
f ∗ (q) := sup{hq, xi − f (x)}, ∀q ∈ E 0
x∈E
on définit de même la transformée de Legendre de G par
g ∗ (p) := sup{hp, yi − g(y)}, ∀p ∈ F 0 .
y∈F
On s’intéresse alors au problème d’optimisation :
inf {f (x) + g(Λx)}
x∈E
(6.12)
ainsi qu’à son problème dual :
sup {−f ∗ (−Λ∗ p) − g ∗ (p)}.
(6.13)
p∈F 0
Avant d’énoncer et de démontrer le théorème de dualité convexe de FenchelRockafellar, nous aurons besoin de quelques préliminaires d’analyse convexe.
Étant donné f : E → R ∪ {+∞}, convexe sci propre et en notant f ∗ sa
transformée de Legendre (dans la littérature on rencontre aussi le terme de
transformée de Fenchel, de polaire ou de fonction convexe conjuguée), on a
par définition même l’inégalité de Young :
f (x) + f ∗ (q) ≥ hq, xi , ∀(q, x) ∈ E 0 × E,
133
(6.14)
et donc pour tout x ∈ E :
f (x) ≥ f ∗∗ (x) := sup {hq, xi − f ∗ (q)}.
(6.15)
q∈E 0
Lemme 6.5 Soit f : E → R ∪ {+∞}, convexe sci propre, alors f ∗ est
convexe sci propre sur E ∗ .
Preuve:
Le fait que f ∗ soit convexe sci provient du fait que par définition c’est un
supremum de fonctions affines continues et qu’une fonction est convexe (sci)
si et seulement si son épigraphe est convexe (fermé). Il s’agit donc simplement
de montrer que f ∗ n’est pas identiquement égale à +∞. Soit donc x0 ∈ E tel
que f (x0 ) < +∞ et λ0 < f (x0 ) de sorte que (λ0 , x0 ) ∈
/ Epi(f ) := {(λ, x) ∈
R × E : λ ≥ f (x)}. Comme f est convexe sci, Epi(f ) est convexe fermé, on
peut donc séparer strictement (λ0 , x0 ) de Epi(f ) : il existe (k, p) ∈ R × E 0 et
ε > 0 tels que
kλ0 − hp, x0 i ≤ kλ − hp, xi − ε, ∀(λ, x) ∈ Epi(f )
(6.16)
ceci implique que k > 0 et par homogénéité on peut donc supposer que k = 1
on a donc en particulier
f ∗ (p) = sup{hp, xi − f (x)} ≤ hp, x0 i − λ0 − ε < +∞.
x∈E
2
Notons que le le lemme précédent implique que f admet une minorante
affine continue (x 7→ hp, xi − f ∗ (p) avec f ∗ (p) < +∞)
Exercice 6.5 Soit f : E → R ∪ {+∞}, f 6= ∞ montrer que f ∗∗ est la plus
grande fonction convexe s.c.i minorant f (f ∗∗ s’appelle l’enveloppe convexe
sci de f ). En déduire que f est convexe sci si et seulement si f = f ∗∗ .
Théorème 6.12 (Théorème de dualité de Fenchel-Rockafellar) Supposons
qu’il existe x0 ∈ E tel que f (x0 ) < +∞ et g est continue en Λ(x0 ) et que
l’infimum du problème (6.12) soit fini, alors on a :
inf {f (x) + g(Λx)} = max0 {−f ∗ (−Λ∗ p) − g ∗ (p)}.
x∈E
p∈F
(En particulier le sup du problème dual (6.13) est atteint).
134
Preuve:
Désignons par α et β respectivement l’infimum dans (6.12) et le supremum
dans (6.13). Par l’inégalité de Young pour tout (x, p) ∈ E × F 0 on a :
f (x) ≥ h−Λ∗ p, xi − f ∗ (−Λ∗ p), g(Λx) ≥ hp, Λxi − g ∗ (p)
en sommant ces inégalités, on obtient donc α ≥ β.
Posons
C := {(λ, x, y) ∈ R × E × Y : λ ≥ g(Λx − y)}
et notons A l’intérieur de C (lequel est non vide car g est continue en Λx0 ),
on vérifie sans peine que C est convexe et dense dans A. Soit maintenant :
B := {(µ, z, 0) : µ ∈ R, z ∈ E, α − µ ≥ f (z)},
B est convexe non vide et, par définition de α, A ∩ B = ∅. On peut ainsi
séparer au sens large B de A (et donc de C par densité) : il existe (k, q, p) ∈
R × E 0 × F 0 \ {(0, 0, 0)} et a ∈ R tels que
kλ + hq, xi + hp, yi ≥ a ≥ kµ + hq, zi , ∀(λ, x, y) ∈ C, ∀(µ, z, 0) ∈ B. (6.17)
On en déduit que k ≥ 0 (faute de quoi le membre de gauche de (6.17) ne
serait pas minoré). Si k = 0 alors toujours par continuité de g en Λx0 on
aurait pour tout u ∈ E et v ∈ F suffisamment petits
hq, ui + hp, vi ≥ 0
ce qui entrainerait p = 0 et q = 0, ce qui est absurde. On a donc k > 0 et
sans perte de généralité on peut supposer k = 1. Ainsi, (6.17) se réecrit :
inf
{g(Λx−y)+hq, xi+hp, yi} ≥ a ≥ α+sup{hq, zi−f (z)} = α+f ∗ (q).
(x,y)∈E×F
z∈E
(6.18)
En particulier, pour tout u ∈ E on a
hq, ui + hp, Λui ≥ a − g(Λx0 )
et donc q = −Λ∗ p, le membre de gauche de (6.18) se réecrit alors
{g(Λx − y) − hp, Λx − yi} = −g ∗ (p)
inf
(x,y)∈E×F
avec (6.18) on a donc
−g ∗ (p) − f ∗ (−Λ∗ p) ≥ α ≥ β
135
ainsi α = β et p est solution de (6.13).
2
Il est à noter que le problème précédent fournit un théorème d’existence
de solutions pour le problème dual à partir d’hypothèses sur le problème
primal, notons aussi que la preuve repose sur le théorème de séparation (et
pas sur un argument de compacité). Le lecteur intéressé par la dualité convexe
consultera avec profit l’ouvrage classique d’Ekeland et Temam [7] sur le sujet.
Revenons maintenant au problème de transport optimal (6.11) et montrons qu’il s’écrit naturellement comme le dual d’un problème d’optimisation
convexe sur C(X) × C(Y ). Soit Λ : C(X) × C(Y ) défini par Λ(ϕ, ψ) := ϕ ⊕ ψ
pour tout (ϕ, ψ) ∈ C(X) × C(Y ) avec
(ϕ ⊕ ψ)(x, y) := ϕ(x) + ψ(y), ∀(x, y) ∈ X × Y.
L’adjoint de Λ, Λ∗ est donc l’opérateur linéaire continu M(X × Y ) →
M(X) × M(Y ) donné par : pour tout γ ∈ M(X × Y ), Λ∗ γ = (πX γ, πY γ)
avec pour tout (ϕ, ψ) ∈ C(X) × C(Y ) :
Z
Z
ϕ(x)d(πX γ)(x),
ϕ(x)dγ(x, y) =
X
X×Y
Z
Z
.
ψ(y)d(πY γ)(y)
ψ(y)dγ(x, y) =
X
X×Y
Autrement dit, πX γ, et πY γ sont les marges de γ.
On considère maintenant le problème :
inf
f (Λ(ϕ, ψ)) + g(ϕ, ψ)
(ϕ,ψ)∈C(X)×C(Y )
avec, pour tout θ ∈ C(X × Y )
g(θ) :=
et
0
+∞
si θ ≤ c
sinon
Z
Z
f (ϕ, ψ) := −
ϕdµ −
X
Un calcul immédiat donne que
0
∗
∗
f (−Λ γ) =
+∞
ψdν.
Y
si (πX γ, πY γ) = (µ, ν)
sinon
136
(6.19)
et
∗
R
g (γ) =
X×Y
cdγ
+∞
si γ ≥ 0
sinon
de sorte que le dual de (6.19) est
Z
sup −
cdγ = −
inf
γ∈Π(µ,ν)
γ∈Π(µ,ν)
X×Y
Z
cdγ
X×Y
en appliquant le théorème de Fenchel-Rockafellar on obtient donc que (6.11)
possède des solutions (ce que nous savions déjà) et qu’on a la relation :
Théorème 6.13 (Dualité de Kantorovich pour le problème de transport
optimal)
Z
Z
Z
min
c(x, y)dγ(x, y) =
sup
ϕdµ +
ψdν.
γ∈Π(µ,ν)
X×Y
(ϕ,ψ)∈C(X)×C(Y ) : ϕ⊕ψ≤c
X
Y
Exercice 6.6 Montrer sous les hypothèses de ce paragraphe (X et Y compacts et c continue) que (6.19) possède des solutions (se ramener à une suite
maximisante bornée et uniformément équicontinue en utilisant l’uniforme
continuité de c et conclure par le théorème d’Ascoli-Arzelà).
Exercice 6.7 Dans le cas X = Y ⊂ Rd montrer que
Z
u d(µ − ν) : u 1-Lipschitz .
inf |x − y|dγ(x, y) = sup
γ∈Π(µ,ν)
X
Généraliser au cas d’une distance quelconque.
Intéressons nous maintenant au cas particulier où X = Y (métrique compact pour simplifier) et où c est une puissance convexe de la distance d. Pour
µ et ν des mesures de probabilité boréliennes sur X et p ≥ 1, on définit la
p-distance de Wasserstein entre µ et ν par
Z
1/p
p
Wp (µ, ν) :=
inf
d(x, y) dγ(x, y)
(6.20)
γ∈Π(µ,ν)
X×X
Le fait que Wp soit effectivement une distance sur l’ensemble des probabilités sur X et une propriété qui en justifie (entre autres) l’intérêt nous sont
fournis par le
137
Théorème 6.14 Soit (X, d) un métrique compact. Pour tout p ≥ 1, Wp est
une distance sur M+
1 (X), ensemble des mesures de probabilité sur X. De
plus si (µn )n et µ appartiennent à M+
1 (X) alors (µn ) converge faible ∗ vers
µ si et seulement si Wp (µn , µ) → 0 quand n → ∞.
Preuve:
Pour établir que Wp est une distance, seule l’inégalité triangulaire requiert
vraiment une preuve. Soit donc µ1 , µ2 et µ3 dans M+
1 (X) soit γ12 ∈ Π(µ1 , µ2 )
et γ23 ∈ Π(µ2 , µ3 ) tels que
Z
p
d(x1 , x2 )p dγ12 (x1 , x2 ),
Wp (µ1 , µ2 ) =
2
ZX
Wp (µ2 , µ3 )p =
d(x2 , x3 )p dγ23 (x2 , x3 ).
X2
3
On déduit du lemme 6.4 qu’il existe γ ∈ M+
1 (X ) tel que π12 γ = γ12 et
π23 γ = γ13 de sorte que γ13 := π13 γ ∈ Π(µ1 , µ3 ) on a donc en utilisant
l’inégalité triangulaire et l’inégalité de Minkowski :
1/p
Z
p
d(x1 , x3 ) dγ13 (x1 , x3 )
Wp (µ1 , µ3 ) ≤
X×X
Z
1/p
p
=
d(x1 , x3 ) dγ(x1 , x2 , x3 )
X3
Z
1/p
(d(x1 , x2 ) + d(x2 , x3 ))p dγ(x1 , x2 , x3 )
≤
X3
Z
1/p
≤
d(x1 , x2 )p dγ(x1 , x2 , x3 )
X3
Z
1/p
+
d(x2 , x3 ))p dγ(x1 , x2 , x3 )
X3
Z
1/p
=
d(x1 , x2 )p dγ12 (x1 , x2 )
X2
Z
1/p
p
+
d(x2 , x3 )) dγ23 (x2 , x3 )
X2
=Wp (µ1 , µ2 ) + Wp (µ2 , µ3 ).
Supposons que Wp (µn , µ) tende vers 0. Soit γn ∈ Π(µn , µ) tel que
Z
p
Wp (µn , µ) =
d(x, y)p dγn .
X×X
138
Soit maintenant ϕ ∈ C(X) et soit ω un module de continuité de ϕ on a alors
Z
Z
ϕd(µn − µ) =
(ϕ(x) − ϕ(y))dγn (x, y)
X
X
Z
≤
ω(d(x, y))dγn (x, y)
X×X
et donc
Z
Z
ϕd(µn − µ) ≤ lim sup
lim sup
ω(d(x, y))dγn (x, y)
X
X×X
on extrait enfin de (γn ) une sous-suite (encore notée γn ) qui converge faible ∗
vers une limite γ et telle que la limsup dans le membre de droite de l’inégalité
précédente est en fait une limite. On a alors
Z
d(x, y)p dγ(x, y) = 0
X×X
et donc
Z
lim sup
Z
ω(d(x, y))dγn (x, y) =
ω(d(x, y))dγ(x, y) = 0
X×X
X×X
ce qui montre bien que (µn ) converge faible-∗ vers µ. Réciproquement, supposons maintenant que (µn ) converge faible-∗ vers µ et montrons que Wp (µn , µ) →
0. Tout d’abord quitte à diviser d par diam(X) on peut supposer que d ≤ 1
et donc que Wpp ≤ W1 . Il suffit donc de montrer que W1 (µn , µ) → 0. Or (en
utilisant l’exercice 6.7) on a l’expression duale suivante pour W1 :
Z
W1 (µn , ν) = sup{ ϕ d(µn − µ) : ϕ-1-Lipschitz}
X
on déduit aisément du théorème d’Ascoli-Arzelà qu’il existe ϕn 1-Lipschitz
tel que
Z
W1 (µn , ν) =
ϕn d(µn − µ)
X
on peut en outre supposer que ϕn (x0 ) = 0 avec x0 un point fixé de X de
sorte que (ϕn ) est uniformément bornée et uniformément équicontinue. En
appliquant à nouveau le théorème d’Ascoli-Arzelà, on peut supposer (à une
extraction près) que (ϕn ) converge uniformément vers un certain ϕ et que
W1 (µn , µ) converge vers lim sup W1 (µn , µ) on a alors, grâce à la convergence
faible-∗ de (µn ) vers (µ)
Z
lim sup W1 (µn , µ) = lim
ϕn d(µn − µ) = 0
X
ce qui achève la preuve.
2
139
Exercice 6.8 Soit Ω un ouvert convexe borné de Rd et f+ et f− deux densités
de probabilités L1 sur Ω, montrer que
Z
sup{ u(f+ −f− ) : u 1-Lip. sur Ω} = inf{kσkL1 : σ ∈ L1 (Ω)d , div(σ) = f+ −f− }.
Ω
140
Chapitre 7
Espaces de Sobolev et EDP’s
elliptiques linéaires
7.1
Cas de la dimension 1
Soit p ∈ [1, ∞], I un intervalle ouvert de R, on définit
Z
Z
0
1,p
p
p
u ϕ = − gϕ, ∀ϕ ∈ Cc1 (I)}.
W (I) := {u ∈ L : ∃g ∈ L ,
I
I
Par densité on peut dans la définition ci-dessus remplacer ”∀ϕ ∈ Cc1 (I)” par
”∀ϕ ∈ D(I)”. Autrement dit u ∈ W 1,p (I) si u ∈ Lp et u0 ∈ Lp , la fonction
g intervenant dans la définition ci-dessus est évidemment unique ; on la note
alors simplement g = u0 . W 1,p = W 1,p (I) est un espace vectoriel que l’on
munit de la norme
kukW 1,p := kukLp + ku0 kLp , ∀u ∈ W 1,p .
Pour p = 2 on note H 1 := W 1,2 et l’on munit H 1 du produit scalaire
Z
hu, vi := (uv + u0 v 0 ), ∀(u, v) ∈ H 1 × H 1 .
I
On vérifie sans difficulté les propriétés suivantes :
Théorème 7.1 W 1,p est un espace de Banach. W 1,p est réflexif pour 1 <
p < ∞ et séparable pour 1 ≤ p < ∞. H 1 est un espace de Hilbert séparable.
Exercice 7.1 Soit (un ) une suite de W 1,p . On suppose que (un ) converge
vers u dans Lp et que (u0n ) converge dans Lp , montrer que u ∈ W 1,p et que
(un ) converge vers u dans W 1,p .
141
Exercice 7.2 Soit u ∈ W 1,p (I) et ϕ ∈ Cc1 (I) montrer que uϕ ∈ W 1,p et
(uϕ)0 = u0 ϕ + uϕ0 .
Le résultat suivant permet d’identifier en un certain sens les fonctions
W aux primitives de fonctions Lp :
1,p
Théorème 7.2 Soit u ∈ W 1,p alors u admet un représentant que nous noterons encore u ∈ C(I) tel que
Z y
u(y) − u(x) =
u0 (t)dt, ∀x, y dans I 2 .
(7.1)
x
Preuve:
Soit x0 ∈ I et
Z
x
v(x) :=
u0 (t)dt, ∀x ∈ I.
x0
Cc1 (I)
Soit ϕ ∈
et [a, b] un segment inclus dans I et contenant supp(ϕ) on a
alors
Z
Z b
Z x0 Z x0
Z bZ x
0
0
0
0
0
vϕ =
vϕ = −
u (t)dt ϕ (x)dx +
u (t)dt ϕ0 (x)dx
I
a
a
x
x0
x0
avec le théorème de Fubini, il vient donc :
Z
Z x0 Z t
Z bZ b
0
0
0
vϕ = −
ϕ (x)dx u (t)dt +
ϕ0 (x)dx u0 (t)dt
I
a
x0
t
Za
Z
= − u0 ϕ = uϕ0 .
I
I
on a donc {v − u}0 = 0 et donc il existe une constante C telle que v − u = C
p.p., ce qui prouve (7.1).
Pour p > 1 et u ∈ W 1,p , on a donc
Z y
0
|u(x) − u(y)| ≤
|u0 | ≤ ku0 kLp |x − y|1/p = ku0 kLp |x − y|1−1/p
(7.2)
x
ainsi les fonctions de W 1,p sont C 0,α avec α = 1−1/p. Par le même argument,
pour p = ∞, on obtient que les fonctions W 1,∞ sont Lipschitziennes. Pour
p = 1 et x, y ∈ I 2 on a
Z
|u(x) − u(y)| ≤ ω(|x − y|) avec ω(t) := sup
|u0 |
A : |A|≤t
142
A
(noter que pour p = 1, on n’a pas de module de continuité universel de la
forme ku0 kL1 ω). Dans tous les cas, on a bien que u est uniformément continue
sur I et donc s’étend par continuité de manière unique à I.
2
Les fonctions u ∈ W 1,p (I) admettant un représentant continu (et ce,
jusqu au bord de I de sorte que si ∂I 6= ∅, on peut définir sans ambiguité les
valeurs de u sur ∂I), dans la suite de ce paragraphe, nous identifierons u à
ce représentant continu.
Proposition 7.1 Soit u ∈ Lp avec 1 < p ≤ ∞ on a alors les équivalences
entre :
1. u ∈ W 1,p ,
2. il existe une constante C telle que
Z
u ϕ0 ≤ CkϕkLp0 , ∀ϕ ∈ Cc1 (I),
I
3. il existe une constante C telle que pour tout ouvert ω ⊂⊂ I et tout
h ∈ R tel que |h| < d(ω, R \ I) on ait
kτh u − ukLp (ω) ≤ C|h|.
De plus, on peut choisir C = ku0 kLp dans les assertions 2 et 3.
Nous omettons la démonstration de ce résultat car nous démontrerons au
paragraphe suivant sa généralisation à la dimension quelconque.
Exercice 7.3 Montrer que pour p = 1, les assertions 2. et 3. de la proposition 7.1 sont équivalentes, sont vraies pour u ∈ W 1,1 mais n’entrainent pas
que u ∈ W 1,1 . Supposons en outre I bornée, les fonctions L1 vérifiant les
assertions 2. ou 3. de la proposition 7.1 sont appelées fonction à variation
bornée. Montrer que u est à variation bornée si et seulement s’il existe une
constante C telle que
n−1
X
|u(tk+1 ) − u(tk )| ≤ C
k=0
pour toute suite t0 < t1 ... < tn de I. Montrer que u est à variation bornée
si et seulement si u est différence de deux fonctions croissantes bornées sur
I et que c’est encore équivalent à dire que la dérivée distribution de u est
une mesure signée finie. Toujours dans le cas où I est borné, montrer que
143
u ∈ W 1,1 si et seulement si pour tout ε > 0, il existe S
δ tel que pour toute
suite d’intervalles disjoints (Ik )k=1,...,n , Ik =]ak , bk [, si | k Ik | ≤ δ alors
X
|u(bk ) − u(ak )| ≤ ε.
k
Exercice 7.4 Montrer que toute suite bornée de W 1,1 possède une sous-suite
qui converge ponctuellement.
Il peut s’avérer utile (pour la convolution ou la transformée de Fourier,
par exemple) d’étendre les fonctions de W 1,p (I) à R entier, on a alors :
Théorème 7.3 (Théorème de prolongement) Il existe un opérateur linéaire
continu P : W 1,p (I) → W 1,p (R) tel que P u|I = u, pour tout u ∈ W 1,p (I).
Preuve:
Si I est non borné, on peut supposer I =]0, +∞[, on définit alors P en
prolongeant u ∈ W 1,p (]0, +∞[) par parité (ou par réflexion : c’est à dire
P u(x) = u(x) si x ≥ 0 et P u(x) = u(−x) si x < 0) à R entier, on vérifie
immédiatement que kP ukW 1,p (R) ≤ 2kukW 1,p (I) .
Dans le cas où I est borné, on peut supposer I =]0, 1[, pour u ∈ W 1,p (]0, 1[),
on prolonge u par parité à ] − 1, 0[ puis par réflexion par rapport à 1 à l’intervalle ]1, 2[, on note ũ le prolongement de u à l’intervalle ] − 1, 2[ ainsi obtenu.
Soit alors g ∈ Cc1 (R) une fonction cut-off vérifiant : χ[0,1] ≤ g ≤ χ[−1/2,3/2] et
P u := gũ (prolongée par 0 en dehors de ] − 1, 2[). On vérifie sans difficulté
que P a les propriétés voulues.
2
Exercice 7.5 Soit ρ ∈ L1 (R) et u ∈ W 1,p (R) montrer que ρ ? u ∈ W 1,p (R)
et que
(ρ ? u)0 = ρ ? u0 .
Théorème 7.4 (Théorème de densité) Soit p ∈ [1, ∞[ et u ∈ W 1,p (I), il
existe (un )n ∈ D(R)N tel que un |I converge vers u dans W 1,p (I).
Preuve:
Par prolongement si nécessaire, on peut se ramener au cas où I = R. On
procède alors par troncature et régularisation par noyau convolutif. Soit η ∈
D(R) tel que χ[−1,1] ≤ η ≤ χ[−2,2] et ηn (t) := η(n−1 t) pour tout t ∈ R, soit
144
par ailleurs ρn un noyau régularisant. Soit maintenant u ∈ W 1,p (R) on pose
un := ηn (ρn ? u). Par construction, un ∈ D et
u0n = ηn0 (ρn ? u) + ηn (ρn ? u0 ).
On a un − u = ηn (ρn ? u − u) + (ηn − 1)u ; chacun des deux termes dans
l’expression précédente tend vers 0 dans Lp : le premier car ηn est borné dans
L∞ et ρn ? u → u dans Lp et le second par convergence dominée. Pour les
dérivées, on a :
|u0n − u| ≤
1 0
kη kL∞ |ρn ? u| + |ηn (ρn ? u0 ) − u0 |
n
de la même manière que précédemment on en déduit que u0n → u0 dans Lp
et donc que un → u dans W 1,p .
2
Théorème 7.5 (Injections de Sobolev en dimension 1) Soit I un intervalle
ouvert de R, il existe une constante C = C(I) (indépendante de p) telle que
pour tout p ∈ [1, ∞], et tout u ∈ W 1,p (I) on ait
kukL∞ ≤ CkukW 1,p
(7.3)
autrement dit W 1,p (I) ⊂ L∞ avec injection continue. Si de plus I est borné,
alors
1. pour tout p > 1, l’injection W 1,p ⊂ C(I) est compacte
2. l’injection W 1,1 (I) ⊂ Lq (I) est compacte pour tout q ∈ [1, ∞[.
Preuve:
Par prolongement, il nous suffit d’établir (7.3) pour I = R. Soit u ∈ Cc1 (R),
pour p = 1 on a, pour tout x ∈ R :
Z x
|u(x)| ≤
|u0 | ≤ ku0 kL1 .
−∞
Pour p ∈]1, ∞[ et x ∈ R, comme |u|p−1 u ∈ Cc1 (R) avec (|u|p−1 u)0 = p|u|p−1 u0 ,
on a :
Z x
p−1
|u(x)| u(x) =
p|u(s)|p−1 u0 (s)ds
−∞
avec l’inégalité de Hölder, il vient
p
0
|u(x)|p ≤ pkukp−1
Lp ku kLp ≤ pkukW 1,p .
145
Utilisant le fait que p1/p ≤ e1/e pour tout p ≥ 1, on en déduit que
kukL∞ ≤ e1/e kukW 1,p .
Ainsi (7.3) est satisfaite pour tout u ∈ Cc1 (R). Soit maintenant u ∈ W 1,p et
(un ) dans Cc1 (R) telle que un → u dans W 1,p , on déduit de ce qui précède
que (un ) est de Cauchy dans L∞ et ainsi que u ∈ L∞ , un → u dans L∞ et u
satisfait (7.3).
Supposons maintenant que I soit borné, l’assertion 1. découle de (7.2)
et du théorème d’Arzelà-Ascoli. Pour prouver l’assertion 2., on va montrer
que B, la boule unité de W 1,1 , satisfait les conditions du théorème de RieszFréchet-Kolmogorov dans Lq pour tout q ∈ [1, ∞[. Soit ω ⊂⊂ I et h ∈ R tel
que |h| < d(ω, Rd \ I), nous savons déjà (voir exercice 7.3) que
kτh u − ukL1 (ω) ≤ |h|ku0 kL1 ≤ |h|, ∀u ∈ B.
Avec (7.3) on en tire donc que pour tout u ∈ B on a
kτh u − ukqLq (ω) ≤ (2kukL∞ )q−1 |h| ≤ (2C)q−1 |h|
de sorte que B vérifie la première condition du théorème de Riesz-FréchetKolmogorov. Pour la seconde condition du théorème de Riesz-Fréchet-Kolmogorov,
on remarque simplement que pour tout u ∈ B
kukLq (I\ω) ≤ kukL∞ |I \ ω|1/q ≤ C|I \ ω|1/q .
2
Exercice 7.6 Montrer que W 1,1 ⊂ C(I) avec injection continue mais que
cette injection n’est pas compacte (même dans le cas où I est borné).
Corollaire 7.1 Si I est non borné, 1 ≤ p < ∞ et u ∈ W 1,p (I) on a
u(x) → 0, pour |x| → ∞, x ∈ I.
Preuve:
On sait qu ’il existe (un ) ∈ D(R)N telle que un |I → u dans W 1,p et donc avec
(7.3), un |I → u dans L∞ . Pour tout x ∈ I on a |u(x)| ≤ kun − ukL∞ + |un (x)|,
soit ε > 0, pour n assez grand, le premier terme est inférieur à ε et pour |x|
assez grand, le second est nul, ce qui montre le résultat voulu.
2
On vérifie par ailleurs facilement :
146
Corollaire 7.2 Soit 1 ≤ p ≤ ∞, u et v dans W 1,p (I) alors uv ∈ W 1,p (I)
avec (uv)0 = u0 v + uv 0 et on a la formule d’intégration par parties
Z y
Z y
2
0
uv = −
u0 v + u(y)v(y) − u(x)v(x), ∀(x, y) ∈ I .
x
x
Exercice 7.7 Soit G ∈ C 1 (R) telle que G(0) = 0 et u ∈ W 1,p (I) montrer
que G ◦ u ∈ W 1,p (I) et que G ◦ u0 = (G0 ◦ u)u0 (noter aussi que l’hypothèse
G(0) = 0 est inutile dans le cas où I est borné).
Pour 1 ≤ p < ∞ on note W01,p = W01,p (I) l’adhérence de Cc1 (I) dans
(W 1,p , k.kW 1,p ). On munit W01,p de la norme de W 1,p , comme, par définition,
W01,p est fermé dans W 1,p , c’est un espace de Banach pour la norme W 1,p .
On note aussi H01 := W01,2 . On sait déja que si I = R, Cc1 (R) est dense dans
W 1,p (R) de sorte que W01,p (R) = W 1,p (R). Pour I 6= R, I a un bord non vide
et les fonctions de W01,p (I) sont les fonctions W 1,p (I) nulles sur le bord de I :
Théorème 7.6 Soit u ∈ W 1,p (I) alors u ∈ W01,p (I) si et seulement si u = 0
sur ∂I.
Preuve:
Si u ∈ W01,p (I), u est limite dans W 1,p (I) d’une suite (un ) ∈ D(I)N , il résulte
du théorème 7.5 que (un ) converge uniformément vers u sur I et donc u = 0
sur ∂I. Réciproquement, si u = 0 sur ∂I, alors pour tout n ∈ N∗ , {x ∈
I : |u| ≥ 1/n} est compact, soit alors G ∈ C 1 (R), impaire, nulle sur [−1, 1]
et telle que G(t) = t pour tout t ∈ R \ [−2, 2]. On pose alors un = n−1 G(nu)
on a un ∈ W01,p car, par construction, supp(un ) ⊂ {x ∈ I : |u| ≥ 1/n}. On
vérifie sans peine avec l’exercice 7.7 et le théorème de convergence dominée
que (un ) converge vers u dans Lp (I) et que (u0n ) converge dans Lp , ceci
implique que (un ) converge vers u dans W 1,p (I) et prouve que u ∈ W01,p (I).
2
Exercice 7.8 Soit u ∈ W 1,p et c ∈ R montrer que u0 = 0 p.p. sur {u = c}
(indication : s’inspirer de la preuve du théorème précèdent).
Proposition 7.2 (Inégalité de Poincaré) Supposons I borné. Alors il existe
une constante C telle que
kukW 1,p ≤ Cku0 kLp , ∀u ∈ W01,p (I).
147
Preuve:
En notant I =]a, b[ pour u ∈ W01,p et x ∈ I on a
Z x
|u0 | ≤ ku0 kL1
|u(x)| = |u(x) − u(a)| ≤
a
et donc kukL∞ ≤ ku0 kL1 ; on conclut par l’inégalité de Hölder.
2
Si I est borné on déduit de l’inégalité de Poincaré que uR 7→ ku0 kL2 est
une norme équivalente (associée au produit scalaire (u, v) 7→ I u0 v 0 ) sur H01
à la norme H 1 usuelle.
Exercice 7.9 (Inégalité de Poincaré-Wirtinger) Soit I un intervalle ouvert
(borné ou non) et u ∈ W 1,1 (I), montrer que
Z
1
0
ku − ukL∞ ≤ ku kL1 où u :=
u.
|I| I
7.2
Définitions et propriétés premières en dimension quelconque
Soit maintenant Ω un ouvert de Rd , pour tout p ∈ [1, +∞], on définit
W 1,p (Ω) := {u ∈ Lp (Ω) : ∂i {u} ∈ Lp (Ω), i = 1, ..., d}
Autrement dit, u ∈ Lp (Ω) appartient à W 1,p (Ω) si et seulement s’il existe
g1 , ..., gd dans Lp (Ω) tels que
Z
Z
u ∂i ϕ = − gi ϕ, ∀ϕ ∈ Cc1 (Ω), ∀i = 1, ..., d
Ω
Ω
(le fait qu’on puisse indifféremment des fonctions-test ϕ dans Cc1 (Ω) ou dans
D(Ω) dans la définition précédente découle d’un argument désormais habituel de densité) on note alors simplement ∂i {u} = ∂i u = gi et ∇u =
(∂1 u, ..., ∂d u)T . On munit W 1,p = W 1,p (Ω) de la norme suivante (ou de n’importe quelle autre équivalente)
kukW 1,p := kukLp + k∇ukLp , ∀u ∈ W 1,p .
Pour p = 2, on pose H 1 := W 1,2 et l’on munit H 1 du produit scalaire
Z
hu, vi := (uv + ∇u · ∇v), ∀(u, v) ∈ H 1 × H 1 .
Ω
On a de manière évidente :
148
Théorème 7.7 W 1,p est un espace de Banach. W 1,p est réflexif pour 1 <
p < ∞ et séparable pour 1 ≤ p < ∞. H 1 est un espace de Hilbert séparable.
Pour m ∈ N∗ et p ∈ [1, +∞] on définit de manière analogue :
W m,p (Ω) := {u ∈ Lp (Ω) : ∂ α {u} ∈ Lp (Ω), ∀α ∈ Nd , |α| ≤ m}
que l’on munit de la norme suivante (ou une autre équivalente) :
X
kukW m,p := kukLp +
k∂ α ukLp , ∀u ∈ W m,p .
α : 1≤|α|≤m
On note W m,2 := H m et on le munit du produit scalaire :
Z
X Z
uv +
∂ α u ∂ α v, ∀(u, v) ∈ H m .
hu, vi :=
Ω
1≤|α|≤m
Ω
On laisse le lecteur formuler et démontrer l’analogue du théorème 7.7 pour
les espaces W m,p .
Théorème 7.8 (Théorème de densité de Friedrichs) Soit p ∈ [1, ∞[ et u ∈
W 1,p (Ω). Il existe (un )n ∈ D(Rd )N tel que un |Ω converge vers u dans Lp (Ω)
et ∇un |ω converge vers ∇u|ω dans Lp (ω) pour tout ω ⊂⊂ Ω.
Preuve:
Soit η ∈ D(Rd ) telle que χB(0,1) ≤ η ≤ χB(0,2) et ηn (x) := η(n−1 x) pour tout
n ∈ N∗ et x ∈ Rd et soit (ρn ) une suite régularisante. Pour u ∈ W 1,p (Ω) on
pose
u(x) si x ∈ Ω
u(x) :=
0
sinon
et l’on définit un := ηn (ρn ? u). On a alors un ∈ D(Rd ) et
kun − ukLp (Rd ) ≤ kηn (ρn ? u − u)kLp (Rd ) + k(ηn − 1)ukLp (Rd )
d’où l’on déduit facilement que un → u dans Lp (Rd ) et donc que un |Ω → u
dans Lp (Ω).
Soit maintenant ω ⊂⊂ Ω, on commence par remarquer que pour n assez
grand, on a
∇(ρn ? u) = ρn ? ∇u sur ω
puis que
∇un = ηn (ρn ? ∇u) +
1
.
∇η
(ρn ? u) sur ω
n
n
149
et donc
k∇un − ∇ukLp (ω) ≤ kηn (ρn ? ∇u) − ∇ukLp (ω) +
k∇ηkL∞
kukLp (Ω)
n
ce qui permet d’en déduire que ∇un |ω converge vers ∇u|ω dans Lp (ω).
2
Notons au passage que D(Rd ) est dense dans W 1,p (Rd ) pour p ∈]1, ∞[
(considérer un = ηn (ρn ? u)). Nous verrons ultérieurement que pour Ω suffisamment régulier on peut améliorer le résultat précédent.
Proposition 7.3 Soit u ∈ Lp avec 1 < p ≤ ∞ on a alors les équivalences
entre :
1. u ∈ W 1,p ,
2. il existe une constante C telle que
Z
u ∂i ϕ ≤ CkϕkLp0 , ∀ϕ ∈ Cc1 (Ω), ∀i = 1, ..., d,
Ω
3. il existe une constante C telle que pour tout ouvert ω ⊂⊂ Ω et tout
h ∈ Rd tel que |h| < d(ω, Rd \ Ω) on ait
kτh u − ukLp (ω) ≤ C|h|.
Preuve:
L’équivalence entre les assertions 1 et 2 découle immédiatement des théorèmes
5.12 et 5.13 (pour p = ∞). Montrons maintenant que 1 implique 3, on commence par supposer que u ∈ Cc1 (Rd ) et p ∈]1, ∞[, on a alors pour tout x et
h dans Rd
Z 1
|τh u(x) − u(x)| ≤ |h|
|∇u(x + th)|dt
0
en utilisant l’inégalité de Jensen on en déduit que
Z 1
p
p
|τh u(x) − u(x)| ≤ |h|
|∇u(x + th)|p dt
0
soit maintenant ω ⊂⊂ Ω et |h| < d(ω, Rd \ Ω) et soit ω 0 ⊂⊂ Ω tel que
ω + th ⊂ ω 0 pour tout t ∈ [0, 1] (par exemple ω 0 = ω + B(0, |h|)), on a alors
avec le théorème de Fubini :
Z
Z 1Z
p
p
|τh u − u| ≤ |h|
|∇u(x + th)|p dx dt ≤ |h|p k∇ukpLp (ω0 )
ω
0
ω
150
il vient donc
kτh u − ukLp (ω) ≤ |h|k∇ukLp (ω0 ) .
(7.4)
On déduit ensuite du théorème de densité de Friedrichs que (7.4) est satisfaite
par tout u ∈ W 1,p (Ω). Le cas p = ∞ se déduit de ce qui précède en faisant
tendre p vers +∞ dans (7.4).
Montrons enfin que 3 entraine 2. Soit donc u ∈ Lp (Ω) satisfaisant 3,
ϕ ∈ Cc1 (Ω), ω ⊂⊂ Ω tel que supp(ϕ) ⊂ ω et h ∈ Rd avec |h| < d(ω, Rd \ Ω),
il découle de 3 et de l’inégalité de Hölder que
Z
(τh u − u)ϕ ≤ C|h|kϕkLp0
Ω
on remarque ensuite que
Z
Z
(τh u − u)ϕ =
u(x)(ϕ(x − h) − ϕ(x))dx.
Ω
Il vient donc
Ω
Z
u(x)
Ω
ϕ(x − h) − ϕ(x)
≤ CkϕkLp0
|h|
en prenant h = tei (avec e1 , ..., ed la base canonique de Rd ) et en faisant
tendre t vers 0 on en déduit exactement l’assertion 2.
2
Exercice 7.10 Soit u et v dans L∞ (Ω)∩W 1,p (Ω) montrer que uv ∈ W 1,p (Ω)
avec
∇(uv) = u∇v + v∇u.
Exercice 7.11 Soit u ∈ W 1,p (Ω) et G ∈ C 1 (R) ∩ W 1,∞ (R) telle que G(0) =
0, montrer que G ◦ u ∈ W 1,p (Ω) avec
∇(G ◦ u) = (G0 ◦ u)∇u.
Exercice 7.12 Soit u ∈ W 1,p (Ω) et c ∈ R montrer que ∇u = 0 p.p. sur
{u = c}. Montrer que u+ , u− et |u| appartiennent à W 1,p (Ω) et calculer leur
dérivée Lp .
151
Exercice 7.13 Soit Ω et U deux ouverts de Rd et X un C 1 -difféormorphisme
bi-Lipschitzien de Ω sur U (c’est-à-dire que X et X −1 sont C 1 et Lipschitziennes). Soit u ∈ W 1,p (U ) montrer que (u ◦ X) ∈ W 1,p (Ω) et que
∂i (u ◦ X) =
d
X
((∂j u) ◦ X) ∂i Xj
j=1
c’est à dire, en notant JX la jacobienne de X et JX T sa transposée :
∇(u ◦ X)(x) = JX(x)T ∇u(X(x)) p.p. x ∈ Ω.
Exercice 7.14 Soit Ω0 un ouvert de Rd−1 , Ω− := Ω0 ×] − 1, 0[ et Ω := Ω0 ×] −
1, 1[. Pour tout u ∈ W 1,p (Ω− ) on définit pour tout x = (x0 , xd ) ∈ Ω :
u(x)
si x ∈ Ω−
∗ 0
u (x , xd ) :=
u(x0 , −xd ) sinon
Montrer que u∗ ∈ W 1,p (Ω) et
ku∗ kLp (Ω) ≤ 2kukLp (Ω− ) , ku∗ kW 1,p(Ω) ≤ 2kukW 1,p (Ω− ) .
Comme en dimension 1, il est souvent utile de se ramener au cas de l’espace entier et donc de chercher à prolonger les fonctions de W 1,p (Ω) (l’exercice précédent fournit un exemple de tel prolongement par réflexion). Ce
n’est cependant pas toujours possible et dépend de la régularité de l’ouvert
Ω. Nous allons cependant voir qu’un tel prolongement est possible pour Ω suffisamment régulier (par simplicité nous ne chercherons pas ici les hypothèses
minimales de régularité). Dans ce qui suit, nous dirons que Ω est régulier s’il
existe Φ ∈ C 1 (Rd ) telle que :
Ω = {Φ < 0}, ∂Ω = {Φ = 0}, |∇Φ| =
6 0, sur ∂Ω.
Théorème 7.9 (Théorème de prolongement) Soit Ω un ouvert régulier de
Rd au sens précédent et tel que ∂Ω soit borné. Alors il existe un opérateur
linéaire P : W 1,p (Ω) → W 1,p (Rd ) et une constante C ≥ 0 tels que, pour tout
u ∈ W 1,p (Ω) on ait :
1. P u|Ω = u,
2. kP ukLp (Rd ) ≤ CkukLp (Ω) ,
152
3. kP ukW 1,p (Rd ) ≤ CkukW 1,p (Ω) .
Preuve:
Comme dans la démonstration de la formule de Stokes, on remarque grâce
au théorème de l’inversion locale, qu’en chaque point x de ∂Ω il existe U un
voisinage ouvert de x, et un C 1 -difféomorphisme Ψ bilipschitzien : Q → U
avec Q = Bd−1 ×] − 1, 1[ (en notant Bd−1 la boule unité ouverte de Rd−1 ) tels
que
∂Ω ∩ U = Ψ(Bd−1 × {0}), Ω ∩ U = Ψ(Q− ) avec Q− = Bd−1 ×] − 1, 0[.
Pour tout v ∈ W 1,p (Q− ) on définit par ailleurs v ∗ ∈ W 1,p (Q) par prolongement par réflexion comme dans l’exercice 7.14. Comme ∂Ω est compact, on
le recouvre par un nombre fini d’ouverts Ui tel que pour chaque i, il existe
un C 1 -difféomorphisme bilipschitzien Ψi de Q dans Ui tel que
∂Ω ∩ Ui = Ψi (Bd−1 × {0}), Ω ∩ Ui = Ψi (Q− ).
Soit maintenant u ∈ W 1,p (Ω), d’après l’exercice 7.13 pour chaque i, vi :=
u ◦ Ψi ∈ W 1,p (Q− ) et donc on a aussi vi∗ ∈ W 1,p (Q), on pose alors ui (x) :=
vi∗ (Ψ−1
i (x)) pour tout x ∈ Ui , on a alors (cf. exercice 7.13 et 7.14) ui ∈
1,p
W (Ui ) et
kui kLp (Ui ) ≤ Ci kukLp (Ui ∩Ω) , kui kW 1,p (Ui ) ≤ Ci kukW 1,p (Ui ∩Ω)
pour une certaine constante Ci indépendante de u. Soit maintenant (θi )i une
partition de l’unité subordonnée au recouvrement (Ui ). Définissons pour tout
i et tout x ∈ Rd :
θi ui (x) si x ∈ Ui
wi (x) :=
0
sinon
et notons par u le prolongement de u par 0 en dehors de Ω. Définissons enfin
X X
Pu = 1 −
wi
θi u +
i
i
on vérifie sans difficulté que P a les propriétés cherchées.
2
Le théorème de prolongement permet d’améliorer le résultat de densité
fourni par le théorème 7.8 :
Proposition 7.4 Soit Ω un ouvert régulier de Rd , p ∈ [1, +∞[ et u ∈
W 1,p (Ω). Il existe (un )n ∈ D(Rd )N tel que un |Ω converge vers u dans W 1,p (Ω)
153
Preuve:
On note comme précédemment (ρn )n et (ηn )n respectivement une suite régularisante et une suite de troncatures. Dans le cas où ∂Ω est borné, on note
P un opérateur de prolongement et on vérifie facilement que la suite un =
ηn (ρn ? P u) convient. Dans le cas où ∂Ω est non borné, pour ε > 0, on choisit
d’abord n0 tel que kηn0 u − ukW 1,p (Ω) ≤ ε/2, puis on prolonge ηn0 u en une
fonction v ∈ W 1,p (Rd ), on prend alors un := ηn (ρn ? v) comme un → v dans
W 1,p (Rd ) on a bien kun − ukW 1,p (Ω) ≤ ε pour n assez grand.
2
7.3
Injections de Sobolev
Nous avons vu qu’en dimension 1, W 1,p s’injecte continûment dans L∞ ,
nous avions même vu que les fonctions W 1,p étaient continues (et même
Höldériennes pour p > 1). Tout ceci n’est plus vrai en dimension supérieure.
On peut s’en convaincre en prenant par exemple sur la boule unité en dimension deux, des puissances négatives de la norme : x 7→ |x|−α est dans W 1,p
pour p < 2 et α < (2 − p)/p et pourtant cette fonction n’est ni continue, ni
bornée.
Nous allons d’abord considérer le cas de l’espace Rd entier (d ≥ 2) le cas
d’un ouvert régulier dont le bord est borné s’en déduira aisément grâce au
théorème de prolongement. Considérons d’abord le cas où 1 ≤ p ≤ d (et
d ≥ 2 évidemment).
Lemme 7.1 Soit f1 , ..., fd ∈ Ld−1 (Rd−1 ), pour tout x ∈ Rd et i = 1, ...., d on
pose
x−i = (x1 , ...., xi−1 , xi+1 , ..., xd ) ∈ Rd−1 .
Soit
f (x) :=
d
Y
fi (x−i ), ∀x ∈ Rd
i=1
1
d
on a alors f ∈ L (R ) et
kf kL1 (Rd ) ≤
d
Y
kfi kLd−1 (Rd−1 ) .
i=1
Preuve:
Démontrons le résultat par récurrence sur d, pour d = 2 c’est évident. Supposons le résultat vrai en dimension d et démontrons le en dimension d + 1.
154
On commence par fixer xd+1 , puis on remarque que pour d0 = d/(d − 1)
0
on a |fi (., xd+1 )|d ∈ Ld−1
(Rd−1 ), en appliquant l’hypothèse de récurrence on
Q
0
d
obtient que x ∈ Rd 7→ i=1 |fi (x−i , xd+1 )|d ∈ L1 (Rd ) avec
Z
d
Y
0
|fi (x−i , xd+1 )|d dx1 .....dxd ≤
d
Y
Rd i=1
0
kfi (., xd+1 )kdLd (Rd−1 ) .
i=1
Avec l’inégalité de Hölder, il vient donc :
Z
|f (x1 , ..., xd , xd+1 )|dx1 ...dxd ≤ kfd+1 kLd (Rd )
Rd
d
Y
kfi (., xd+1 )kLd
i=1
d
on remarque ensuite que xd+1 7→ kfi (.,
d+1 )kLd est dans L et il résulte donc
Qx
d
de l’inégalité de Hölder que xd+1 7→ i=1 kfi (., xd+1 )kLd est L1 et que :
Z
|f |dx1 ...dxd+1 ≤ kfd+1 kLd (Rd )
Rd+1
d
Y
kfi kLd (Rd ) .
i=1
2
On peut alors en déduire un premier résultat d’injection continue :
Théorème 7.10 (Sobolev, Gagliardo, Nirenberg) Soit 1 ≤ p < d on a alors
∗
W 1,p (Rd ) ⊂ Lp pour p∗ défini par
1 1
1
= − .
∗
p
p d
De plus l’injection précédente est continue et plus précisément, il existe une
constante C telle que
kukLp∗ ≤ Ck∇ukLp , ∀u ∈ W 1,p (Rd ).
Preuve:
Soit u ∈ Cc1 (Rd ), on a pour tout x ∈ Rd :
Z
|u(x)| ≤ fi (x−i ) :=
|∂i u(x−i , t)|dt
R
et donc
|u(x)|
d
d−1
≤
d
Y
i=1
155
1
fi (x−i ) d−1
(7.5)
avec le lemme 7.1, il vient donc
kuk
d
d−1
d
L d−1
≤
d Z
Y
i=1
fi (x−i )dx−i
1
d−1
Rd−1
≤
d
Y
1
k∂i ukLd−1
1
i=1
de sorte que
kuk
d
L d−1
≤
d
Y
k∂i ukL1
d1
≤ k∇ukL1 .
(7.6)
i=1
Par un argument de densité, on en déduit que W 1,1 ⊂ Ld/(d−1) et que (7.6)
est satisfaite pour tout u ∈ W 1,1 , on a ainsi établi (7.5) dans le cas p = 1.
Supposons maintenant que p > 1 et que u ∈ Cc1 (Rd ) en appliquant (7.6)
à v = |u|α−1 u (α > 1 sera fixé ultérieurement), il vient avec l’inégalité de
Hölder :
Z
Z
p−1
(α−1)p
p
α−1
α
p−1
|u| |∇u| ≤ αk∇ukLp
|u|
kuk αd ≤ α
L d−1
Rd
= αk∇ukLp kuk
Rd
α−1
L
(α−1)p
p−1
on choisit maintenant α tel que
(α − 1)p
αd
αd
=
⇒
= p∗ .
d−1
p−1
d−1
On en déduit que (7.5) a lieu pour tout u ∈ Cc1 (Rd ) et, comme d’habitude,
on conclut par densité.
2
Corollaire 7.3 Soit 1 ≤ p < d on a alors W 1,p (Rd ) ⊂ Lq (Rd ) avec injection
continue pour tout q ∈ [p, p∗ ].
Preuve:
On sait déjà que le résultat est vrai pour q = p et q = p∗ pour q ∈]p, p∗ [, soit
α ∈]0, 1[ tel que
α 1−α
1
= +
.
q
p
p∗
Il découle de l’inégalité d’interpolation et de (7.5) que pour tout u ∈ W 1,p
on a u ∈ Lq et
1−α
kukLq ≤ kukαLp kukL1−α
kukW 1,p .
p∗ ≤ C
2
156
Proposition 7.5 (Le cas limite p = d) W 1,d (Rd ) ⊂ Lq (Rd ) avec injection
continue pour tout q ∈ [d, +∞[.
Preuve:
Soit u ∈ Cc1 (Rd ), nous avons vu qu’en appliquant l’inégalité de Sobolev pour
à v = |u|α−1 u (α > 1) on obtient :
Z
α
k∇uk|u|α−1 ≤ Ck∇ukLd kukα−1
kuk αd ≤ C
(α−1)d
L d−1
Rd
L
d−1
avec l’inégalité de Young il vient donc
kuk
1/α
αd
L d−1
(α−1)/α
≤ C 1/α k∇ukLd kuk
L
(α−1)d
d−1
≤ Cα (k∇ukLd + kuk
L
(α−1)d
d−1
).
(7.7)
en prenant α = d on obtient
kuk
d2
L d−1
≤ C(k∇ukLd + kukLd )
2
et on en déduit que Ld /(d−1) ⊂ W 1,d avec injection continue et par interpolation que Lq ⊂ W 1,d avec injection continue pour tout q ∈ [d, d2 /(d − 1)]. On
applique ensuite à nouveau (7.7) à α = d + 1, d + 2, d + 3... et on en déduit
le résultat recherché.
2
Passons maintenant au cas p > d :
Théorème 7.11 (Morrey) Soit ∞ ≥ p > d on a alors W 1,p (Rd ) ⊂ L∞ (Rd )
avec injection continue. De plus, si u ∈ W 1,p (Rd ), u admet un représentant
continu (encore noté u) et plus précisément, il existe une constante C telle
que
|u(x) − u(y)| ≤ Ck∇ukLp |x − y|α , ∀x, y ∈ Rd × Rd
pour α = 1 − d/p.
Preuve:
Soit u ∈ Cc1 (Rd ), x et y dans Rd , soit Q un cube ouvert contenant x et y
et dont les côtés sont de longueur r = 2|x − y| et parallèles aux axes de
coordonnées. Dans tout ce qui suit C désignera une constante (ne dépendant
ni de u ni de x ni de y) mais qui pourra varier d’une ligne à l’autre. Pour
z ∈ Q on a :
Z 1
Z 1
|u(x) − u(z)| ≤
|∇u(x + t(z − x))||z − x|dt ≤ Cr
|∇u(x + t(z − x))|dt
0
0
157
en définissant u := |Q|−1
R
Q
|u(x) − u| ≤ Cr
u et en intégrant l’inégalité précédente il vient
1−d
= Cr1−d
1
Z Z
Z
Q
1
|∇u(x + t(z − x))|dt dz
0
Z
0
Qt
1
|∇u(y)|dy
dt
td
où l’on a posé Qt := (1 − t)x + tQ ⊂ Q. En utilisant l’inégalité de Hölder, on
a
Z
0
0
0
|∇u(y)|dy ≤ k∇ukLp (Q) |Qt |1/p ≤ k∇ukLp td/p rd/p
Qt
et donc
|u(x) − u| ≤ Ck∇ukLp r
1−d+d/p0
Z
1
0
1
td(1−1/p0 )
dt ≤ Ck∇ukLp r1−d/p
de sorte que
|u(x) − u(y)| ≤ Ck∇ukLp |x − y|1−d/p .
Pour montrer l’estimation L∞ , on fixe un cube ouvert contenant x dont les
côtés sont parallèles aux axes de coordonnées et de longueur 1, en utilisant
ce qui précède et l’inégalité de Hölder, on obtient
|u(x)| ≤ |u| + |u(x) − u| ≤ kukLp + Ck∇ukLp ≤ CkukW 1,p
Enfin, on conclut facilement la preuve à nouveau par densité.
2
Exercice 7.15 Soit u ∈ W 1,p (Rd ) avec p > d montrer que
u(x) → 0 quand |x| → 0.
Dans le cas d’un ouvert Ω de Rd régulier tel que ∂Ω soit borné, on
peut étendre les résultats précédents grâce au théorème de prolongement.
En résumé, cela donne :
Théorème 7.12 Soit d ≥ 2, Ω un ouvert de Rd régulier tel que ∂Ω soit
borné et p ∈ [1, ∞]. On a :
1. si p < d, W 1,p (Ω) ⊂ Lq (Ω) avec injection continue pour tout q ∈ [p, p∗ ]
avec p∗ défini par
1 1
1
= −
∗
p
p d
158
2. si p = d, W 1,p (Ω) ⊂ Lq (Ω) avec injection continue pour tout q ∈ [d, ∞[,
3. si p > d, W 1,p (Ω) ⊂ L∞ (Ω) avec injection continue.
Dans le cas d’un domaine régulier borné, on a en outre des résultats
d’injections compactes :
Théorème 7.13 (Rellich-Kondrachov) Soit Ω un ouvert régulier et borné
de Rd et p ∈ [1, ∞]. On a :
1. si p < d, W 1,p (Ω) ⊂ Lq (Ω) avec injection compacte pour tout q ∈ [1, p∗ [
avec p∗ défini par
1
1 1
= −
∗
p
p d
2. si p = d, W 1,p (Ω) ⊂ Lq (Ω) avec injection compacte pour tout q ∈ [1, ∞[,
3. si p > d, W 1,p (Ω) ⊂ C(Ω) avec injection compacte.
Preuve:
Supposons p < d, et q ∈ [1, p∗ [. Il s’agit de montrer que la boule unité
de W 1,p (Ω) vérifie les hypothèses du théorème de Riesz-Fréchet-Kolmogorov
dans Lq (Ω). Soit α ∈]0, 1] tel que
1−α
1
=α+
.
q
p∗
Soit u ∈ W 1,p (Ω), ω ⊂⊂ Ω et h ∈ Rd tel que |h| ≤ d(ω, Rd \Ω) , par l’inégalité
d’interpolation, et le fait que Ω soit borné, on a :
kτh u − ukLq (ω) ≤ kτh u − ukαL1 (ω) kτh u − uk1−α
Lp∗ (ω)
≤ |h|α k∇ukαL1 (Ω) (2kukLp∗ (Ω) )1−α
≤ C|h|α kukW 1,p (Ω)
ce qui montre que la boule unité de W 1,p (Ω) vérifie la première hypothèse
du théorème de Riesz-Fréchet-Kolmogorov. L’inégalité de Hölder donne par
ailleurs
∗
kukLq (Ω\ω) ≤ kukLp∗ (Ω\ω) |Ω \ ω|1/q−1/p
ce qui assure que la boule unité de W 1,p (Ω) vérifie aussi la seconde hypothèse
du théorème de Riesz-Fréchet-Kolmogorov. Le cas p = d se traite de manière
similaire. Enfin la compacité dans le cas p > d découle immédiatement des
théorèmes de Morrey et d’Arzelà-Ascoli.
2
159
Notons en particulier que si Ω est régulier et borné, l’injection W 1,p (Ω) ⊂
L (Ω) est compacte ce qui implique que si (un ) converge faiblement vers u
dans W 1,p (Ω) alors (un ) converge fortement vers u dans Lp (Ω). Notons aussi
que si Ω n’est pas borné, l’injection W 1,p (Ω) ⊂ Lp (Ω) n’est généralement pas
∗
compacte. On peut aussi montrer que pour p < d, l’injection W 1,p (Ω) ⊂ Lp
n’est jamais compacte (même si Ω est borné et régulier).
p
7.4
Espace W01,p et traces de fonctions W 1,p
Nous allons voir que les fonctions W 1,p ont une trace sur les hypersurfaces
régulières c’est à dire que l’on peut donner un sens (Lp ) aux valeurs prises
par une fonction W 1,p sur une telle hypersurface. Ceci est évident pour p > d,
beaucoup moins pour p ≤ d.
Lemme 7.2 Soit p ∈ [1, ∞[ et Ω := Rd−1 × R∗+ . Il existe une constante C
telle que pour tout u ∈ Cc1 (Rd ), on ait
Z
1/p
|u(x0 , 0)|p dx0
≤ CkukW 1,p .
Rd−1
Preuve:
Soit x0 ∈ Rd−1 on a alors
0
Z
p
∞
|u(x , 0)| ≤
Z0 ∞
=
|∂d (|u(x0 , xd )|p−1 u(x0 , xd ))|dxd
p|u(x0 , xd )|p−1 |∂d u(x0 , xd )|dxd
0
pour p = 1 on en déduit immédiatement le résultat cherché en intégrant
l’inégalité précédent par rapport à x0 . Pour p > 1, l’inégalité de Young et
l’inégalité précédente donnent
Z ∞
Z ∞
0
p
0
p
0
p
|u(x , 0)| ≤ C
|u(x , xd )| dxd +
|∂d u(x , xd )| dxd
0
0
et on bien obtient l’inégalité cherchée en intégrant par rapport à x0 .
2
Le lemme précédent montre que lorsque Ω := Rd−1 × R∗+ , on peut prolonger l’opérateur u ∈ Cc1 (Ω) 7→ u|∂Ω en un opérateur linéaire continue de
W 1,p (Ω) → Lp (∂Ω) = Lp (∂Ω, σ) avec σ la mesure superficielle sur ∂Ω (qui
dans le cas du lemme précédent est simplement la mesure de Lebesgue d − 1dimensionnelle sur l’hyperplan ∂Ω). Ceci peut se généraliser comme suit aux
160
ouverts Ω réguliers (en définissant leur mesure superficielle σ sur ∂Ω comme
au chapitre 2). En effet, en rectifiant ∂Ω par cartes locales on obtient le
résultat suivant dont on laisse la preuve au lecteur :
Lemme 7.3 Soit p ∈ [1, ∞[ et Ω un ouvert régulier de Rd tel que ∂Ω soit
borné (pour simplifier). Il existe une constante C telle que pour tout u ∈
Cc1 (Rd ), on ait
Z
1/p
kukLp (∂Ω) :=
|u(x)|p dσ(x)
≤ CkukW 1,p (Ω) .
∂Ω
On en déduit par densité l’existence d’opérateurs de trace :
Théorème 7.14 (Théorème de trace) Soit p ∈ [1, ∞[ et Ω un ouvert régulier
de Rd , alors il existe un opérateur (dit de trace) γ linéaire continu de W 1,p (Ω)
dans Lp (∂Ω) tel que γu = u|∂Ω pour tout u ∈ Cc1 (Rd ).
Par la suite nous noterons simplement γu = u|∂Ω pour u ∈ W 1,p (Ω). En
raisonnant par densité, on peut en déduire diverses formules d’intégration
par parties pour des fonctions W 1,p (Ω). Par exemple, si u = (u1 , ..., ud ) avec
chaque ui ∈ W 1,1 (Ω), on a la formule de Stokes :
Z
Z
u · ndσ.
div(u) =
∂Ω
Ω
Ou encore, si u et v dont dans H 1 (Ω), on a la formule d’intégration par
parties
Z
Z
Z
∂i u v = − u ∂i v +
(uv)ni dσ.
Ω
Ω
∂Ω
Pour 1 ≤ p < ∞ on note W01,p (Ω) l’adhérence de Cc1 (Ω) (ou de D(Ω))
dans (W 1,p (Ω), k.kW 1,p (Ω) ). On munit W01,p de la norme de W 1,p , comme, par
définition, W01,p est fermé dans W 1,p (et donc aussi faiblement fermé par
convexité), c’est un espace de Banach pour la norme W 1,p . On note aussi
H01 := W01,2 . On sait déja que si Ω = Rd , Cc1 (Rd ) est dense dans W 1,p (Rd ) de
sorte que W01,p (Rd ) = W 1,p (Rd ).
Proposition 7.6 (Inégalité de Poincaré) Soit p ∈ [1, ∞[ et Ω un ouvert
borné dans une direction. Alors il existe une constante C telle que
kukLp (Ω) ≤ Ck∇ukLp (Ω) , ∀u ∈ W01,p (Ω)
161
Preuve:
Sans perte de généralité supposons que Ω ⊂ {x ∈ Rd : |x1 | ≤ M }. Soit
u ∈ Cc1 (Ω) (prolongé par 0 en dehors de Ω), pour x ∈ Ω on a
Z 1
∂1 u(x − 2tM e1 )dt
u(x) = u(x) − u(x − 2M e1 ) = 2M
0
et donc
Z
Z Z
p
p
|u| ≤ (2M )
Ω
Ω
1
Z
p
|∂1 u(x − 2tM e1 )| dt dx ≤ (2M )
|∇u|p .
p
0
Ω
On conclut par densité de Cc1 (Ω) dans W01,p (Ω).
2
On peut montrer que l’inégalité de Poincaré est encore vraie dans le cas où
|Ω| est fini. L’inégalité de Poincaré implique en particulier que sur W01,p (Ω),
1,p
1
u
v) 7→
R 7→ k∇ukLp (Ω) est équivalente à la norme W (Ω) et que sur H0 (Ω), (u,
1
(Ω)
est
∇u
·
∇v
est
un
produit
scalaire
et
que
la
norme
qu’il
définit
sur
H
0
Ω
1
équivalente à la norme H (Ω).
L’exercice suivant permet de relier les espaces W01,p (Ω) aux opérateurs de
trace : W01,p (Ω) est simplement le noyau de l’opérateur de trace γ : W 1,p (Ω) →
Lp (∂Ω).
Exercice 7.16 Soit Ω un ouvert régulier de Rd , p ∈ [1, ∞[ et u ∈ W 1,p (Ω).
Montrer que u ∈ W01,p (Ω) si et seulement si u|∂Ω = 0.
Exercice 7.17 Soit Ω un ouvert régulier de Rd , p ∈ [1, ∞[ et u ∈ W 1,p (Ω).
Montrer que u ∈ W01,p (Ω) si et seulement si la fonction qui prolonge u par 0
en dehors de Ω appartient à W 1,p (Rd ).
Exercice 7.18 Soit Ω un ouvert régulier de Rd , p ∈]1, ∞[ et u ∈ Lp (Ω).
Montrer les équivalences entre :
1. u ∈ W01,p (Ω),
2. il existe C tel que
Z
u ∂i ϕ ≤ CkϕkLp0 , ∀ϕ ∈ Cc (Rd ), ∀i = 1, ..., d.
Ω
Exercice 7.19 Soit Ω un ouvert régulier de Rd tel que ∂Ω soit borné, p ∈
[1, ∞[ et u ∈ W 1,p (Ω). Montrer que γ(u± ) = (γu)± et en déduire que si
γu = u|∂Ω ≥ 0 alors u− ∈ W01,p (Ω).
162
7.5
Formulation variationnelle de quelques problèmes aux limites
Soit Ω un ouvert régulier de Rd , on cherche à résoudre le problème elliptique linéaire avec condition de Dirichlet homogène :
−∆u + u = f dans Ω,
u = 0 sur ∂Ω,
Une solution classique est une fonction u ∈ C 2 (Ω) vérifiant ponctuellement
l’EDP précédente et la condition de Dirichlet sur ∂Ω. Evidemment, l’existence d’une solution classique nécessite que f soit continue. Or, nous allons
autoriser le cas f ∈ L2 (Ω) (et même f ∈ H −1 (Ω) où H −1 (Ω) désigne le dual
topologique de H01 (Ω)). Pour f ∈ H −1 (Ω), une solution faible du problème
précédent est par définition une fonction u ∈ H01 (Ω) vérifiant
Z
Z
∇u · ∇ϕ + uϕ = f (ϕ), ∀ϕ ∈ H01 (Ω).
(7.8)
Ω
Ω
Il est facile de voir qu’une solution faible est une fonction H01 solution de
l’EDP au sens des distributions. On vérifie immédiatement, en utilisant la
formule de Green que toute solution classique est solution faible (en supposant en plus Ω borné de sorte que cette solution classique est bien H01 ) et
que si une solution faible est régulière (disons C 2 (Ω)) alors c’est une solution
classique. L’existence et l’unicité d’une solution faible est ici simplement assurée par le théorème de Riesz. En effet, dire que u ∈ H01 est solution faible
signifie exactement que u représente f , étant entendu que H01 est muni du
produit scalaire usuel de H 1 :
Z
Z
hu, ϕi :=
∇u · ∇ϕ + uϕ.
Ω
Ω
De plus, on vérifie immédiatement que u est solution faible si et seulement si
J(v) ≥ J(u), ∀v ∈ H01 , avec J(v) :=
1
hv, vi − f (v).
2
(7.9)
On a donc :
Théorème 7.15 Soit f ∈ H −1 (Ω), l’équation
−∆u + u = f dans Ω, u = 0 sur ∂Ω,
(7.10)
possède une unique solution faible u ∈ H01 . De plus u est l’unique minimiseur
de la fonctionnelle J définie par (7.9) sur H01 .
163
Si l’on note T l’opérateur de H −1 (Ω) → L2 (Ω) qui à f ∈ H −1 (Ω) associe
u ∈ H01 (Ω) ⊂ L2 (Ω) la solution de (7.10), on a
kT f kH 1 = kf kH −1 .
Si en plus Ω est borné comme l’injection de H 1 dans L2 est compacte, on en
déduit que T est un opérateur compact de H −1 (Ω) dans L2 (Ω).
Exercice 7.20 Soit Ω un ouvert borné et régulier de Rd et f ∈ H −1 . Montrer
que l’équation
−∆u = f dans Ω
avec condition de Dirichlet homogène possède une unique solution faible dans
H01 . Montrer que pour λ > 0 assez petit (quantifier), il en est de même pour :
−∆u − λu = f dans Ω, u = 0 sur ∂Ω.
L’exemple précédent illustre de manière simple comment la formulation
faible (ou variationnelle) permet de montrer l’existence et l’unicité (et caractérisation variationnelle c’est à dire en terme de minimisation d’une fonctionnelle d’énergie) d’une solution faible ; on a trivialisé la question en utilisant le théorème de Riesz, pour des cas un peu plus généraux, c’est le
théorème de Lax-Milgram, que nous rappelons ci-dessous, qui permet de
prouver l’existence et l’unicité d’une solution faible.
Théorème 7.16 (Théorème de Lax-Milgram) Soit H un espace de Hilbert,
a une forme bilinéaire continue et coercive (c’est à dire telle qu’il existe C > 0
tel que a(v, v) ≥ Ckvk2 = C hv, vi pour tout v ∈ H) et f ∈ H 0 . Il existe un
unique u ∈ H vérifiant
a(u, ϕ) = f (ϕ), ∀ϕ ∈ H.
Si de plus a est symétrique alors u est l’unique minimiseur sur H de la
fonctionnelle J définie par :
1
J(v) := a(v, v) − f (v), ∀v ∈ H.
2
A titre d’application immédiate, considérons Ω ouvert borné et régulier
de Rd , f ∈ H −1 et le problème de Dirichlet :

X
 −
∂j (aij ∂i u) + a0 u = f dans Ω,
1≤i,j≤d

u = 0 sur ∂Ω,
164
avec a0 ∈ L∞ , a0 ≥ 0, les fonctions aij ∈ L∞ satisfaisant la condition d’ellipticité : il existe C > 0 tel que pour presque tout x, pour tout p ∈ Rd on
a
X
aij (x)pi pj ≥ C|p|2 .
(7.11)
i,j
Une solution faible est par définition une fonction u ∈ H01 (Ω) telle que
Z
Z X
aij ∂i u ∂j ϕ + a0 uϕ = f (ϕ), ∀ϕ ∈ H01 .
(7.12)
Ω i,j
Ω
Au vu de la formulation variationnelle précédente, il est naturel de définir la
forme bilinéaire
Z X
Z
a(u, ϕ) :=
aij ∂i u ∂j ϕ + a0 uϕ, ∀u, ϕ ∈ H01
Ω i,j
Ω
les coefficients a0 , aij étant bornés, a est continue sur H01 et la condition
d’ellipticité (avec l’inégalité de Poincaré) assure que a est coercive sur H01
(noter aussi que si a0 ≥ α > 0 l’hypothèse que Ω est borné est inutile). Le
théorème de Lax-Milgram permet immédiatement d’en déduire l’existence et
l’unicité d’une solution faible.
On peut également considérer le problème de Dirichlet non homogène :
−∆u + u = f dans Ω,
u = g sur ∂Ω,
ou plus généralement (pour des fonctions a0 et aij vérifiant les mêmes hypothèses que précédemment)

X
 −
∂j (aij ∂i u) + a0 u = f dans Ω,
1≤i,j≤d

u = g sur ∂Ω,
où g ∈ H 1 (Ω) et la condition de Dirichlet u = g sur ∂Ω est à interpréter au
sens des traces c’est à dire au sens γ(u − g) = 0 (ou ce qui revient au même
u − g ∈ H01 (Ω)). Une solution faible des équations précédentes est alors par
définition un élément u de K := g + H01 (Ω) = {v ∈ H 1 (Ω) : γ(u − g) = 0}
vérifiant (7.8) dans le cas de la première équation et (7.8) dans le cas de la
seconde. L’existence et l’unicité d’une solution faible découle alors du fait
que K est un sous-espace affine fermé de H 1 et du théorème de Stampacchia
que nous rappelons ici :
165
Théorème 7.17 (Théorème de Stampacchia) Soit H un espace de Hilbert,
a une forme bilinéaire continue et coercive, K un convexe fermé non vide de
H et f ∈ H 0 . Il existe un unique u ∈ K vérifiant
a(u, ϕ − u) ≥ f (ϕ − u), ∀ϕ ∈ K.
(7.13)
Si de plus a est symétrique alors u est l’unique minimiseur sur K de la
fonctionnelle J définie par :
1
J(v) := a(v, v) − f (v), ∀v ∈ H.
2
En effet, dans le cas K = g + H01 (Ω), (7.13) se réécrit simplement
a(u, ϕ) = f (ϕ), ∀ϕ ∈ H01 (Ω)
qui est la forme variationnelle (ou faible) des EDP’s considérées plus haut.
Exercice 7.21 (Conditions de Neumann) Soit Ω ouvert borné et régulier de
Rd et f ∈ H −1 , on appelle solution faible du problème de Neumann
−∆u + u = f dans Ω,
∂u
= 0 sur ∂Ω,
∂n
toute fonction u ∈ H 1 vérifiant :
Z
Z
∇u · ∇ϕ + uϕ = f (ϕ), ∀ϕ ∈ H 1 .
Ω
Ω
Montrer qu’il existe une unique solution faible du problème de Neumann
précédent et que toute solution classique est une solution faible. Donner une
caractérisation de la solution du problème précédent en termes de minimisation. Donner une condition nécessaire et suffisante pour que l’équation
−∆u = f dans Ω,
∂u
= 0 sur ∂Ω,
∂n
admette une solution faible.
Exercice 7.22 Soit Ω ouvert borné et régulier de Rd , a ∈ L∞ (Ω) (pas
de condition de signe) b ∈ L∞ (Ω, Rd ) et f ∈ L2 (Ω), on s’intéresse ici à
l’équation :
−∆u + b · ∇u + au = f dans Ω, u = 0 sur ∂Ω,
166
(7.14)
1. Montrer que pour λ > 0 assez grand l’équation
−∆u + b · ∇u + au + λu = f dans Ω, u = 0 sur ∂Ω,
(7.15)
possède une unique solution faible que l’on notera T f .
2. Montrer que T est un endomorphisme compact de L2 .
3. Montrer que pour f = 0 l’ensemble des solutions de (7.15) est un sous
espace-vectoriel de dimension finie d de H01 (Ω). Montrer que (7.15)
possède des solutions si et seulement si f ∈ F ⊥ avec F un sev de
dimension d de L2 (Ω).
4. Que peut-on dire de plus dans le cas où a ≥ 0, b ∈ Cc1 (Ω) et div(b) ≤ 0 ?
5. En utilisant le principe du maximum, que peut-on dire de plus dans le
cas où a ≥ 0 ?
7.6
Principe du maximum et régularité elliptique
Théorème 7.18 (Principe du maximum, cas sans dérive) Soit Ω un ouvert
régulier de Rd , a0 ≥ 0, a0 ∈ L∞ , aij ∈ L∞ vérifiant la condition d’ellipticité
(7.11), f ∈ H −1 (Ω) et u ∈ H 1 (Ω) solution faible de l’équation
X
−
∂j (aij ∂i u) + a0 u = f dans Ω.
(7.16)
1≤i,j≤d
Si f ≥ 0 (au sens ϕ ≥ 0 ⇒ f (ϕ) ≥ 0) et si u|∂Ω ≥ 0 alors u ≥ 0 dans Ω.
Preuve:
Comme u|∂Ω ≥ 0, on sait que u− ∈ H01 (Ω) (voir exercice 7.19) on peut
donc prendre u− comme fonction test dans (7.16) (on dit aussi ”multiplier
l’équation” par u− ), il vient alors
Z X
aij ∂i u ∂j u− + a0 uu− = f (u− ) ≥ 0
Ω
1≤i,j≤d
en utilisant les identités ∂i u ∂j u− = −∂i u− ∂j u− , uu− = −u2− et la condition
d’ellipticité (7.11), il vient donc
Z
Z
2
−C
|∇u− | − a0 u2− ≥ 0
Ω
Ω
167
de sorte que ∇u− = 0 et donc u− = 0, ce qui prouve le résultat voulu.
2
Le principe du maximum joue un rôle fondamental dans les EDP’s elliptiques notamment pour obtenir des résultats d’unicité et ce, même (surtout
en fait !) dans le cadre non-linéaire. Considérons par exemple le cas où Ω
est un ouvert borné de Rd et considérons l’équation non-linéaire (de type
Hamilton-Jacobi) suivante :
F (x, D2 u) + H(x, ∇u) + u = 0.
(7.17)
Où F et H sont des fonctions continues et F est elliptique au sens où si
M1 ≥ M2 (au sens des matrices symétriques) alors F (x, M1 ) ≤ F (x, M2 ).
Supposons maintenant que u et v soient des fonctions C 2 (Ω), que u soit une
sous-solution de l’équation préceédente :
F (x, D2 u) + H(x, ∇u) + u ≤ 0 sur Ω
et que v en soit une sur-solution :
F (x, D2 v) + H(x, ∇v) + v ≥ 0 sur Ω.
On a alors le principe du maximum (ou principe de comparaison) suivant :
u ≤ v sur ∂Ω ⇒ u ≤ v sur Ω.
Pour démontrer ce principe de comparaison, il s’agit de montrer que maxΩ (u−
v) ≤ 0, si le maximum est atteint sur ∂Ω il n’y a rien à démontrer. Supposons
donc qu’il est atteint en un point x0 ∈ ∂Ω et supposons par l’absurde que
u(x0 ) > v(x0 ). On a alors
∇u(x0 ) = ∇v(x0 ), D2 u(x0 ) ≤ D2 v(x0 )
et donc en utilisant l’ellipticité de F :
u(x0 ) ≤ −F (x0 , D2 u(x0 )) − H(x0 , ∇u(x0 ))
≤ −F (x0 , D2 v(x0 )) − H(x0 , ∇v(x0 )) = v(x0 )
ce qui constitue la contradiction recherchée. Notons que le principe de comparaison implique en particulier que le problème de Dirichlet :
F (x, D2 u) + H(x, ∇u) + u = 0 dans Ω, u = g sur ∂Ω
(7.18)
admet au plus une solution classique. Cependant, le problème (7.18) n’ayant
généralement pas de solution classique, il faut recourir à la notion de solution
de viscosité développé par Michael Crandall et Pierre-Louis Lions (voir [3]).
L’argument précédent valable pour les solutions classiques donne l’intuition que le principe du maximum devrait rester valable pour des équations
linéaires ”avec un terme en ∇u” (ou terme de dérive). On a en effet :
168
Théorème 7.19 (Principe du maximum pour des équations elliptiques avec
terme de dérive) Soit Ω un ouvert borné (pour simplifier) et régulier de Rd ,
a0 ≥ 0, a0 ∈ L∞ , ai ∈ L∞ , aij ∈ L∞ vérifiant la condition d’ellipticité (7.11),
f ∈ H −1 (Ω) et u ∈ H 1 (Ω) solution faible de l’équation
X
−
∂j (aij ∂i u) +
d
X
ai ∂i u + a0 u = f dans Ω.
(7.19)
i=1
1≤i,j≤d
Si f ≥ 0 (au sens ϕ ≥ 0 ⇒ f (ϕ) ≥ 0) et si u|∂Ω ≥ 0 alors u ≥ 0 dans Ω.
Preuve:
Soit m := essinf u et supposons par l’absurde que m < 0 soit alors m < k < 0
et
vk := (u − k)−
on a alors vk ∈ H01 (Ω) et en multipliant (7.19) par vk et en utilisant la
condition d’ellipticité, on obtient
Z
Z
Z
2
|∇vk ||vk | ≤ Ck∇vk kL2 kχAk vk kL2
|∇vk ||vk | = C
|∇vk | ≤ C
Ak
Ω
Ω
avec
Ak := {∇u 6= 0, u < k}.
Comme vk ∈
H01
et vk 6= 0 il vient donc
k∇vk kL2 ≤ CkχAk vk kL2
soit maintenant q = 2∗ si d ≥ 3 et +∞ > q > 2 quelconque si d = 2, il résulte
de l’inégalité de Poincaré, du fait que H 1 ⊂ Lq avec injection continue et de
l’inégalité de Hölder que l’on a alors
kvk kLq ≤ CkχAk vk kL2 ≤ Ckvk kLq |Ak |1/2−1/q .
Ce qui implique que pour tout k > m on a |Ak | ≥ α > 0 et ceci est absurde
car |Ak | → 0 quand k → m+ (c’est clair pour m = −∞ car u ∈ L2 et pour
m > −∞, on a |Ak | → |{∇u 6= 0, u = m}| = 0 d’après l’exercice 7.12).
2
On en déduit immédiatement :
Corollaire 7.4 Sous les hypothèses du théorème 7.19, le problème de Dirichlet :
−
X
1≤i,j≤d
∂j (aij ∂i u) +
d
X
ai ∂i u + a0 u = f dans Ω, u = 0 sur ∂Ω
i=1
possède une unique solution pour tout f ∈ L2 (Ω).
169
(7.20)
Preuve:
On déduit de l’hypothèse d’ellipticité qu’il existe λ > 0 tel que la forme
bilinéaire continue
Z X
X
a(u, ϕ) :=
aij ∂i u∂j ϕ +
ai ∂i u ϕ + (a0 + λ)uϕ , ∀u, v ∈ H 1
Ω
ij
i
soit coercive sur H 1 . Il résulte alors du théorème de Lax-Milgram que pour
tout f ∈ L2 (Ω), l’équation
−
X
1≤i,j≤d
∂j (aij ∂i u) +
d
X
ai ∂i u + (a0 + λ)u = f dans Ω, u = 0 sur ∂Ω (7.21)
i=1
possède une unique solution que nous noterons T f . On vérifie sans peine que
T est un endomorphisme compact de L2 . De plus, par construction u est
solution faible de (7.20) si et seulement si u = T (f + λu) ce qui se réecrit
encore (I − λT )v = f avec v = f + λu. Il découle alors du principe du
maximum que (I − λT ) est injective. On déduit donc de l’alternative de
Fredholm que (I − λT ) est surjective et ainsi le résultat cherché.
2
Nous allons maintenant nous intéresser à la régularité des solutions faibles.
Dans le cas Ω = Rd , il est facile de voir, par transformée de Fourier comme
au chapitre 2, que si f ∈ L2 , la solution faible de
−∆u + u = f
est en fait H 2 . On a même mieux : kukH 2 ≤ Ckf kL2 pour une certaine
constante C. On peut également itérer l’argument : f ∈ H 2 ⇒ u ∈ H 4 ,....,
f ∈ H m ⇒ u ∈ H m+2 . En particulier, si f ∈ H m pour tout m alors u ∈
H m pour tout m ce qui entraine en particulier que u ∈ C ∞ . Nous allons
maintenant généraliser ces résultats de régularité elliptique à des équations
(linéaires) plus générales (avec des coefficients variables, ce qui rend inadaptée
la résolution en Fourier) et pour des domaines plus généraux. Afin d’éviter
les difficultés liées à la géométrie du domaine, nous allons nous limiter au cas
de l’espace entier ou du demi-espace :
Théorème 7.20 Supposons que Ω = Rd ou Ω = Rd−1 × R∗+ , soit aij ∈
W 1,∞ (Ω) vérifiant la condition d’ellipticité (7.11), f ∈ L2 (Ω) et u ∈ H01 (Ω)
solution faible de l’équation
X
−
∂j (aij ∂i u) + u = f dans Ω.
(7.22)
1≤i,j≤d
170
alors u ∈ H 2 (Ω) et il existe une constante C (indépendante de f !) telle que :
kukH 2 (Ω) ≤ Ckf kL2 .
Preuve:
Commençons par traiter le cas Ω = Rd . Pour h ∈ Rd \ {0} et v ∈ H 1 , on
note :
τh v − v
Dh v :=
∈ H 1.
|h|
Multiplions l’équation par D−h (Dh u) il vient alors en utilisant les propriétés
élémentaires de Dh et le fait que les aij sont Lipschitziennes :
Z
Z X
f D−h (Dh u) =
aij ∂i uD−h (Dh ∂j u) + uD−h (Dh u)
Ω
Ω 1≤i,j≤d
Z
X
=
Dh (aij ∂i u)(Dh ∂j u) + (Dh u)2
Ω 1≤i,j≤d
Z
X
≥
(τh aij )(∂i Dh u)(∂j Dh u) + Dh (aij )∂i uDh ∂j u
Ω 1≤i,j≤d
Z
≥C
|Dh ∇u|2 − C 0 k∇ukL2 kDh ∇ukL2
Ω
en remarquant ensuite que kDh ϕkL2 ≤ k∇ϕkL2 pour tout ϕ ∈ H 1 , on en
déduit que
kDh ∇ukL2 ≤ C(kf kL2 + k∇ukL2 ) ≤ Ckf kL2
on déduit alors de la proposition 7.3 que ∇u ∈ H 1 i.e. u ∈ H 2 et en prenant
h = tei et en faisant tendre t vers 0 on obtient bien
kukH 2 ≤ Ckf kL2 .
Dans le cas où Ω est le demi-espace, il faut prendre garde à n’utiliser que des
translations laissant invariantes Ω et la condition de Dirichlet, c’est à dire des
h ∈ Rd−1 × {0} (des translations tangentielles). Pour de tels h, en procédant
comme précédemment on obtient
k∂ij ukL2 ≤ Ckf kL2 , i = 1, ..., d, j = 1, ...., d − 1.
On estime enfin la dérivée seconde manquante ∂dd u en utilisant l’équation :
avec ce qui précède on a add ∂dd u ∈ L2 et on conclut en utilisant le fait qu’avec
(7.11) on a add ≥ C > 0.
2
171
Indiquons que par rectification par cartes locales, on peut aussi montrer
(mais la preuve est un peu plus fastidieuse, consulter par exemple [2] ou [10])
que le résultat précédent est encore valable pour Ω ouvert borné de classe C 2
de Rd . Il est aussi facile d’adapter la preuve du cas Ω = Rd pour montrer des
2
et en itérant l’argument d’obtenir des résultats
résultats de régularité Hloc
de régularité d’ordre plus élevé, un exercice (bien noter la différence dans
les hypothèses et aussi dans l’estimation par rapport au théorème précédent)
pour s’en persuader :
Exercice 7.23 Soit Ω un ouvert de Rd , aij ∈ W 1,∞ satisfaisant (7.11), ai ∈
L∞ , a0 ∈ L∞ , f ∈ L2 (Ω) et u ∈ H 1 (Ω) solution faible de :
−
X
∂j (aij ∂i u) +
d
X
ai ∂i u + a0 u = f.
i=1
1≤i,j≤d
2
Montrer que u ∈ Hloc
(Ω) (i.e. u ∈ H 2 (ω) pour tout ω ⊂⊂ Ω) et que pour
tout ω ⊂⊂ Ω il existe C = C(ω) telle qu’on ait l’estimation :
kukH 2 (ω) ≤ C(kf kL2 (Ω) + kukL2 (Ω) ).
Si on suppose en outre que aij , ai , a0 et f sont C ∞ montrer que u ∈ C ∞ (Ω).
Terminons ce chapitre par une application importante du théorème de
décomposition spectrale des opérateurs autoadjoints compacts :
Théorème 7.21 Soit Ω un ouvert borné de Rd alors il existe une base Hilbertienne (un )n≥1 de L2 (Ω) et une suite (λn )n≥1 de réels vérifiant λn > 0 et
λn → +∞ tels que un ∈ H01 (Ω) ∩ C ∞ (Ω) et
−∆un = λn un .
On appelle les λn les valeurs propres de −∆ sur Ω avec condition de Dirichlet
et les fonctions un fonctions propres associées.
Preuve:
Soit T l’endomorphisme de L2 (Ω) qui à f ∈ L2 (Ω) associe u solution faible
de
−∆u = f, u ∈ H01 (Ω).
Nous savons déjà que T est un endomorphisme compact de L2 . Soit f et g
dans L2 (Ω) et u := T f , v := T g on a alors
Z
Z
Z
hT f, gi =
ug =
∇u∇v =
vf = hT g, f i
Ω
Ω
Ω
172
ce qui montre que T est autoadjoint. On a également
Z
hT f, f i =
|∇u|2 ≥ 0, ∀f ∈ L2 (Ω)
Ω
et ker(T ) = {0}. Il résulte alors du théorème 4.8 que L2 (Ω) possède une base
hilbertienne (un )n≥1 de vecteurs propres de T associés à une suite (µn )n≥1
de valeurs propres vérifiant µn > 0 et µn → 0 quand n → ∞. On vérifie
immédiatement que
−∆un = λn un avec λn =
1
.
µn
Enfin comme −∆un ∈ L2 (Ω), il résulte des résultats de régularité elliptique
vus précédemment que un ∈ H 2 (ω) pour tout ω ⊂⊂ Ω, en itérant l’agument
on a un ∈ H 2m (ω) pour tout m ∈ N∗ et donc un ∈ C ∞ (Ω).
2
Notons que si l’on dispose des fonctions propres de −∆ sur Ω (dans certains domaines simples, ces fonctions propres sont effectivement connues explicitement), alors la solution de
−∆u = f, u ∈ H01 (Ω)
est explicite et donnée par :
u=
∞
X
hf, un i
n=1
λn
un .
La connaissance des fonctions propres de −∆ sur Ω permet également de
résoudre simplement l’équation de la chaleur :
∂t u − ∆u = 0, u|t=0 = u0 , u|∂Ω = 0
par
u(t, x) =
∞
X
e−λn t hu0 , un i un (x).
n=1
173
Chapitre 8
Calcul des variations et EDP’s
elliptiques non-linéaires
Nous avons vu au chapitre précédent que sur une domaine régulier borné
Ω, résoudre :
−∆u + u = f dans Ω,
u = 0 sur ∂Ω,
revenait à minimiser sur H01 la fonctionnelle
Z
1
2
2
|∇v| + v − f (v).
J(v) :=
2
Ω
Une autre manière de formuler cette équivalence est de dire que les solutions
faibles de l’EDP ci-dessus sont des points critiques de la fonctionnelles J. Notons aussi que J étant convexe, il y a équivalence entre être point critique de
J et minimiser J et comme J est strictement convexe il y a aussi unicité du
point critique. L’EDP ci-dessus apparait ainsi comme l’équation J 0 (u) = 0 :
l’équation d’Euler-Lagrange correspondant à la condition du premier ordre
de minimisation de J. De nombreuses EDP’s intéressantes sont des équations
de points critiques de certaines fonctionnelles d’énergie. Nous allons exploiter ce lien dans ce chapitre en nous limitant aux méthodes de minimisation
pour des EDP’s qui apparaissent naturellement comme équation de point critique (Euler-Lagrange) de fonctionnelles d’énergie. Mentionnons qu’il existe
d’autres méthodes (mountain-pass, linking..) pour montrer l’existence de
point critiques et donc de solutions aux EDP’s de type Euler-Lagrange. Nous
aborderons aussi dans ce chapitre les méthodes de point-fixe pour l’existence
de solutions à certaines EDP’s non-linéaires. Là aussi, il ne s’agit que d’une
introduction au sujet et de nombreuses autres méthodes non variationnelles
existent : méthodes de monotonie, de sous et sur-solutions (voir par exemple
[8] pour un aperçu), méthodes d’inversion locale, de bifurcation....
174
8.1
Méthode directe du calcul des variations
Soit Ω un ouvert borné régulier de Rd , p ∈]1, +∞[ et considérons le
problème de minimisation suivant
Z F
(∇u(x))
+
G(u(x))
dx
(8.1)
J(u),
avec
J(u)
:=
inf
1,p
u∈W0 (Ω)
Ω
Théorème 8.1 Supposons que F et G soient continues, que G soit minorée,
qu’il existe A > 0 et B ∈ R tels que F vérifie (la condition de coercivité) :
F (z) ≥ A|z|p + B, ∀z ∈ Rd
et que F soit convexe sur Rd . Alors (8.1) possède au moins une solution.
Preuve:
Soit (un )n une suite minimisante de (8.1), c’est à dire une suite de W01,p (Ω)
telle que J(un ) → inf(8.1). Il résulte de l’hypothèse de coercivité et du fait
que G soit minorée que k∇un kLp est bornée et donc, avec l’inégalité de Poincaré on en déduit que (un )n est bornée dans W 1,p (Ω). Comme W 1,p (Ω) est
réflexif, on peut supposer quitte à extraire une sous-suite, que (un ) converge
faiblement vers u ∈ W 1,p (Ω). Comme W01,p (Ω) est faiblement fermé dans
W 1,p (Ω), on a u ∈ W01,p (Ω). L’injection de W 1,p (Ω) dans Lp (Ω) étant compacte, on peut supposer que un → u dans Lp (Ω) et p.p., et l’on a ∇un * ∇u
dans Lp . Le lemme de Fatou et le fait que G soit minorée permettent d’en
déduire que
Z
Z
lim inf
G(un ) ≥
G(u).
Ω
Ω
R
Le même argument montre que v ∈ W 1,p (Ω) 7→ Ω F (∇v) est sci pour la
topologie forte de W 1,p (Ω), comme F est convexe, cette fonctionnelle est
convexe et donc aussi sci pour la topologie faible de W 1,p (Ω). On a donc
Z
Z
lim inf
F (∇un ) ≥
F (∇u).
Ω
Ω
Ceci permet d’en conclure que u est solution de (8.1).
2
Notons que l’hypothèse de convexité de F est essentielle dans la preuve
précédente et ne peut être affaiblie, comme le montre le contre-exemple suivant dû à Bolza. Considérons
Z 1
inf J(u) :=
(1 − u̇2 )2 + u2 , u ∈ W01,4 (]0, 1[).
0
175
Il est facile de construire une suite (un ) telle que J(un ) → 0 et donc d’en
déduire que l’infimum du problème est 0 mais ce dernier n’est clairement
pas atteint. Notons également que si en plus, J est strictement convexe (ce
qui est le cas si par exemple F et G sont strictement convexes) alors (8.1)
possède un unique minimiseur (l’argument est classique : si u1 et u2 sont
deux minimiseurs distincts, (u1 + u2 )/2 a une valeur strictement plus petite
de J, ce qui est absurde).
Supposons maintenant que F et G soient de classe C 1 et qu’il existe une
constante C telle que ∇F et G0 vérifient les conditions de croissance
|∇F (z)| ≤ C(|z|p−1 + 1), ∀z ∈ Rd
et, si p ≤ d :
|G0 (u)| ≤ C(|u|q−1 + 1), ∀u ∈ R
avec q > 1 tel que W 1,p (Ω) ⊂ Lq (Ω).
Théorème 8.2 Sous les hypothèses précédentes, toute solution de (8.1) est
solution faible de l’équation d’Euler-Lagrange :
− div(∇F (∇u)) + G0 (u) = 0 dans Ω, u|∂Ω = 0
c’est à dire que
Z
Z
∇F (∇u) · ∇ϕ +
Ω
G0 (u)ϕ = 0, ∀ϕ ∈ W01,p (Ω).
(8.2)
(8.3)
Ω
Preuve:
Soit ϕ ∈ W01,p (Ω) et 1 > ε > 0, on a
1
J(u + εϕ) − J(u) ≥ 0
ε
(8.4)
On a d’abord ηε := ε−1 (F (∇u + ε∇ϕ) − F (∇u)) → ∇F (∇u) · ∇ϕ p.p. quand
ε → 0+ . Par ailleurs, l’inégalité des accroissement finis et l’hypothèse de
croissance sur ∇F donnent :
|ηε | ≤ |∇ϕ|
|∇F | ≤ C|∇ϕ|(|∇u| + |∇ϕ|)p−1 ∈ L1 .
sup
[∇u,∇u+ε∇ϕ]
Avec le théorème de convergence dominée, on en déduit que
Z
Z
lim+ ηε =
∇F (∇u) · ∇ϕ.
ε→0
Ω
Ω
176
Exactement de la même manière, on obtient
Z
Z
1
lim
(G(u + εϕ) − G(u)) =
G0 (u)ϕ
ε→0+ ε Ω
Ω
et donc en passant à la limite dans (8.4), on en déduit
Z
Z
∇F (∇u) · ∇ϕ + G0 (u)ϕ ≥ 0
Ω
Ω
changeant ϕ en −ϕ, on obtient que l’inégalité précédente est en fait une
égalité, ce qui permet de conclure.
2
Les hypothèses de croissance sur les dérivées sont un peu lourdes mais
elles sont néanmoins importantes. Sans elles, il se pourrait qu’il existe des
minimiseurs qui ne soient pas solution de l’équation d’Euler-Lagrange. Ce
phénomène (un peu curieux) est appelé phénomène de Lavrentiev (voir par
exemple [4]).
Exercice 8.1 Soit d ≥ 3, Ω la boule unité de Rd , 1 < q < 2∗ , f ∈ L2 (Ω) à
symétrie radiale (i.e. |x| = |y| ⇒ f (x) = f (y)), montrer que
−∆u + |u|q−2 u = f, dans Ω, u ∈ H01 (Ω)
admet une unique solution et que celle-ci est à symétrie radiale.
Exercice 8.2 Soit Ω un ouvert borné régulier de Rd , p ∈]1, +∞[ et f ∈
0
Lp (Ω) montrer que
− div(|∇u|p−2 ∇u) + |u|p−2 u = f
possède une unique solution dans u0 +W 1,p (Ω) pour tout u0 ∈ W 1,p (Ω). Même
question pour l’équation
− div(|∇u|p−2 ∇u) − ε|u|p−2 u = f
avec ε > 0 assez petit.
Exercice 8.3 Soit Ω un ouvert borné régulier de Rd , u0 ∈ H01 (Ω), f ∈
C(R, R) décroissante et vérifiant |f (u)| ≤ C(|u|+1) pour tout u ∈ R. Montrer
que
−∆u = f (u), u ∈ u0 + H01 (Ω)
possède une unique solution.
177
Exercice 8.4 Soit F convexe : Rd → Rd vérifiant pour des constantes strictement positives M et m :
M (|p|2 + 1) ≥ F (p) ≥ m(|p|2 − 1), ∀p ∈ Rd .
Soit Ω un ouvert borné régulier de Rd et f ∈ L2 (Ω), montrer que
Z
Z
(F (∇u) − f u) =
max
− F ∗ (σ(x))dx.
min
1
u∈H0 (Ω)
Ω
σ∈L2 (Ω,Rd ) div(σ)=−f
Ω
Exercice 8.5 Soit Ω un ouvert borné régulier de Rd , montrer que le problème
inf k∇ukL2 (Ω) , u ∈ H01 (Ω), kukL2 (Ω) = 1
admet des solutions. Donner une EDP vérifiée par ces solutions. Quel est le
lien entre la valeur de ce problème (i.e. la valeur de l’infimum), la première
valeur propre du laplacien-Dirichlet sur Ω et la meilleure constante dans
l’inégalité de Poincaré ?
Exercice 8.6 Soit Ω un ouvert borné régulier de Rd , montrer que l’équation :
−∆u + u = cos(u), u|∂Ω = 0
possède une unique solution H01 (Ω) et que celle-ci est de classe C ∞ .
8.2
Théorèmes de point-fixe et applications
d
d
Notons B la boule euclidienne unité fermée de Rd et S d−1 = ∂B . On
commence cette section par le théorème de non-rétraction (C 1 ) de la boule
sur la sphère :
d
Théorème 8.3 Il n’existe pas d’application C 1 f : B → S d−1 telle que
f (x) = x pour tout x ∈ S d−1 .
Preuve:
d
Supposons au contraire que f : B → S d−1 soit C 1 et telle que f (x) = x pour
tout x ∈ S d−1 . Pour t ∈ (0, 1) et x ∈ B, posons
ft (x) := (1 − t)x + tf (x).
178
d
d
Par convexité, ft (B ) ⊂ B . De plus, f est M -Lipschitz avec
M = sup kf 0 (x)k
x∈B
d
et ft0 − id = t(f 0 − id). Pour t ∈ (0, t0 ) avec t0 = (1 + M )−1 , ft0 (x) est donc
inversible pour tout x ∈ B d . En particulier, avec le théorème de l’inversion
locale, pour tout x ∈ B d , ft est un C 1 -difféomorphisme d’un voisinage de x
sur un voisinage de ft (x), en particulier ft (B d ) est ouvert . Soit x et y dans
d
B , on a
kft (x) − ft (y)k = k(1 − t)(x − y) + t(f (x) − f (y))k ≥ ((1 − t) − tM )kx − yk
et comme 1 > t(1 + M ), on en déduit que ft is injective. Ainsi ft est un C 1
difféomorphisme de B d sur ft (B d ) ⊂ B d . Prouvons maintenant que ft (B d ) =
B d , supposons par l’absurde qu’il existe y ∈ B d \ ft (B d ) et soit z ∈ ft (B d ),
comme ft (B d ) est ouvert, yλ := z + λ(y − z) ∈ ft (B d ) pour λ > 0 assez petit.
Soit maintenant
λ∗ := sup{λ ∈ [0, 1] : yλ ∈ ft (B d )}, y ∗ := yλ∗ .
d
Il est clair que y ∗ ∈ ft (B ) prouvons que y ∗ ∈ ft (B d ). Si ce n’était pas le
cas, on aurait y ∗ = ft (x) avec x ∈ S d−1 et comme ft (x) = x pour x ∈ S d−1
on aurait y ∗ = x ∈ S d−1 contredisant le fait que (z, y] est inclus dans B d . Si
λ∗ < 1, comme ft (B d ) est voisinage de y ∗ , yλ ∈ ft (B d ) pour λ > λ∗ proche
de λ∗ contredisant ainsi la maximalité de λ∗ . Ainsi y ∗ = y ∈ ft (B d ). On a
ainsi prouvé que pour t ∈ (0, t0 ), ft est un C 1 diffeomorphisme de B d dans
elle-même. Posons maintenant pour tout t ∈ [0, 1] :
Z
P (t) =
det(Dft (x))dx
Bd
Puisque ft est linéaire en t, P (t) est polynomial en t. Pour t ∈ (0, t0 ), par
la formule du changement de variables, P (t) est la mesure de Lebesgue de
ft (B d ) = B d , P (t) est donc constant sur (0, t0 ) et donc
Z
det(Df (x))dx = P (0) > 0.
P (1) =
Bd
Mais det Df (x) = 0 partout (sinon par le théorème de l’inversion locale
f (B d ) = S d−1 serait d’intérieur non vide), ce qui constitue la contradiction
recherchée. 2
On en déduit alors le théorème du point fixe de Brouwer :
179
Théorème 8.4 (Brouwer) Soit C une partie convexe compacte de Rd et soit
f : C → C continue, alors il existe x ∈ C tel que f (x) = x.
Preuve:
d
On va prouver le résultat dans le cas C = B et on déduit le cas général en
remarquant que tout convexe compact est homéomorphe à une boule euclidienne de dimension finie. Supposons par l’absurde que f soit une application
d
continue de B dans elle-même sans point fixe
d
inf{kx − f (x)k, x ∈ B } > 0.
(8.5)
L’inégalité (8.5) restant satisfaite pour les fonctions suffisamment uniformément
proches de f , on peut en outre supposer que f est de classe C 1 (en régularisant
d
par convolution). Pour x ∈ B soit g(x) l’intersection de S d−1 avec la demidroite {x + λ(f (x) − x), λ ≥ 0}. Avec (8.5), g est bien définie et de classe
d
C 1 . Par construction, g envoie B sur S d−1 et g(x) = x pour tout x ∈ S d−1 ,
ce qui contredit la conclusion du Théorème 8.5.
2
Il va sans dire que la généralité du Théorème de Brouwer en fait un outil
extrêmement puissant pour démontrer des résultats d’existence (en dimension finie toutefois). A titre d’exercice applicatif, on démontrera, le résultat
suivant :
Théorème 8.5 (Perron-Frobenius) Soit A ∈ Mn (R) une matrice à coefficients strictement positifs, alors A possède un vecteur propre à coordonnées
strictement postives.
d
Exercice 8.7 Soit F ∈ C 0 (B , Rd ) tel que F (x) · x ≥ 0 pour tout x ∈ S d−1 .
Montrer qu’il existe x ∈ B tel que F (x) = 0.
En dimension infinie, le Théorème du point fixe de Schauder est très utile
pour les EDP’s non linéaires et s’énonce comme suit
Théorème 8.6 (Schauder) Soit C une partie convexe fermée bornée d’un
espace de Banach E et f : C → C continue et telle que f (C) soit relativement
compacte, alors il existe x ∈ C tel que f (x) = x.
Preuve:
Comme f (C) est relativement compacte, pour tout ε > 0, il existe Nε et
ε
ε
des points xε1 , ..., xεN de C tels que : f (C) ⊂ ∪N
i=1 B(f (xi ), ε) . Soit Eε le
180
sous espace vectoriel engendré par {f (xε1 ), ..., f (xεNε )}. Notons B c (f (xεi ), ε) le
complémentaire de B(f (xεi ), ε) et posons pour tout x ∈ C et i :
d(f (x), B c (f (xεi ), ε))
αiε (x) := PNε
ε
c
j=1 d(f (x), B (f (xj ), ε))
de sorte que αiε (x) > 0 ssi kf (x) − f (xεi )k < ε. Soit Cε := C ∩ Eε et pour
x ∈ Cε , posons
Nε
X
fε (x) :=
αiε (x)f (xεi )
i=1
par convexité de C, fε (Cε ) ⊂ Cε et fε . Comme Eε est de dimension finie
et Cε est convexe compact dans Eε , on déduit du Théorème de Brouwer
qu’il existe xε ∈ Cε tel que xε = fε (xε ). Par construction, pour chaque ε, xε
appartient à l’enveloppe convexe fermée de f (C), co(f (C)). Grâce au Lemme
8.1 ci-dessous, co(f (C)) est compact, en prenant ε = 1/n, xn := xεn , on peut
donc, quitte à passer à une suite extraite, supposer que xn converge vers
x ∈ co(f (C)) ⊂ C. Montrons que x est un point fixe de f . Pour tout n, on a
f (x) − fεn (xn ) =
Nεn
X
αiεn (xn )(f (x) − f (xn ) + f (xn ) − f (xεi n ))
(8.6)
i=1
Dans la somme précédente il n’y a que des termes tels que kf (xn )−f (xεi n )k <
εn et donc
kf (x) − fεn (xn )k ≤ kf (x) − f (xn )k + εn .
Ceci implique que fεn (xn ) converge vers f (x). On en déduit donc que f (x) =
x en passant à la limite dans fεn (xn ) = xn .
2
Dans la preuve précédente, on a utilisé le résultat suivant :
Lemme 8.1 Soit E un espace de Banach et K une partie relativement compacte de E, alors co(K) est compact.
Preuve:
Par complétude, il suffit de montrer que co(K) est précompact. Soit ε > 0,
prouvons que co(K) peut être recouvert par un nombre fini de boules ouvertes
de rayon ε. Comme K est relativement compacte, il existe p et x1 , ..., xp dans
K tels que K ⊂ ∪pi=1 B(xi , ε/3). Soit C := co{x1 , ..., xp }, par compacité de
C, il existe l et y1 , ...., yl dans C tels que C ⊂ ∪lj=1 B(yj , ε/3). Soit z ∈ co(K)
z=
m
X
k=1
181
λ k ak
pour des ak dans K et des λk positifs de somme 1. On écrit ak sous la forme
ε
ak = xik + vk , pour un ik ∈ {1, ...., p}, et vk ∈ B(0, 1).
3
On a alors
z=
m
X
m
X
ε
λk xik + v, v :=
λk vk ∈ B(0, 1).
3
k=1
k=1
On remarque que
x=
m
X
λk xik ∈ C
k=1
de sorte qu’il existe j tel que x ∈ B(yj , ε/3) et donc z ∈ B(yj , 2ε/3). Ceci
montre que co(K) ⊂ ∪lj=1 B(yj , 2ε/3) et donc co(K) ⊂ ∪lj=1 B(yj , ε).
2
Le théorème du point fixe de Schauder est un outil puissant pour montrer
l’existence de solutions à certaines EDP’s non linéaires. Illustrons celà sur
l’exemple de l’équation quasi-linéaire suivante :
− div(A(x, u)∇u) = f (x), dans Ω, u = 0 sur ∂Ω
(8.7)
on suppose ici que Ω est borné et régulier, que f ∈ H −1 , que A ∈ C(Ω × R),
que A est bornée et vérifie la condition d’uniforme ellipticité qu’il existe
C > 0 telle que
hA(x, u)q, qi ≥ C|q|2 , ∀(x, u, q) ∈ Ω × R × Rd × Rd .
Pour tout v ∈ L2 l’équation
− div(A(x, v)∇u) = f, u = 0 sur ∂Ω
(8.8)
possède une unique solution faible u ∈ H01 (Ω) ⊂ L2 (Ω) on note u = T v cette
solution et on cherche donc un point fixe de T (T : L2 → L2 ). Soit v ∈ L2 ,
u := T v est caractérisé par
Z
hA(x, v)∇u, ∇ϕi = hf, ϕi , ∀ϕ ∈ H01
Ω
avec l’hypothèse d’ellipticité sur A on a donc, en prenant ϕ = u comme
fonction-test ci-dessus :
kukH01 := k∇ukL2 ≤
1
kf kH −1
C
et donc T (L2 ) est inclus dans la boule B fermée de centre 0 et de rayon
C −1 kf kH −1 dans H01 , comme l’injection de H01 dans L2 est compacte, B est
182
relativement compacte dans L2 . On remarque ensuite que T : L2 → L2 est
continue, en effet si vn → v dans L2 et un = T vn , en posant An := A(x, vn ),
on a :
Z
hAn ∇un , ∇ϕi = hf, ϕi , ∀ϕ ∈ H01
Ω
comme (un ) est bornée dans H01 on peut à une extraction près supposer que
(un ) converge faiblement dans H01 et fortement dans L2 vers u ∈ H01 , on peut
aussi supposer à une extraction près que vn converge p.p. vers v et donc que
An converge p.p. et dans L2 vers A := A(x, v), on a alors
Z
hA∇u, ∇ϕi = hf, ϕi , ∀ϕ ∈ H01
Ω
ce qui montre que u = T v et, par compacité, que toute la suite (un ) converge
vers T v de sorte que T est continue. Avec l’inégalité de Poincaré, B est inclus
dans une boule fermée B 0 de L2 , T (B 0 ) ⊂ B ⊂ B 0 et T (B 0 ) est relativement
compacte dans L2 . On déduit donc du théorème de Schauder que T admet
un point fixe dans B 0 et donc que l’EDP (8.7) possède au moins une solution.
Exercice 8.8 Soit Ω un ouvert borné régulier de Rd et b une fonction 1Lipschitzienne de Rd dans R, montrer que
−∆u + u = b(∇u), u|∂Ω = 0
possède une et une seule solution dans H01 (Ω). Montrer que si en plus, b est
C ∞ alors cette solution est C ∞ .
183
Bibliographie
[1] R. Adams, Sobolev Spaces, Academic Press, New York, 1975.
[2] H. Brezis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983.
[3] M. Crandall, P.-L. Lions, H. Ishii. User’s guide to viscosity solutions
of second order partial differential equations. Bull. Amer. Math. Soc.
(N.S.) 27 (1992), no. 1, 1-67.
[4] B. Dacorogna, Direct Methods in the Calculus of Variations, SpringerVerlag, 1989.
[5] K. Deimling, Nonlinear functional analysis. Springer-Verlag, Berlin,
1985.
[6] N. Dunford, J. Schwartz, Linear operators, Wiley, 1971.
[7] I. Ekeland, R. Temam, Convex Analysis and Variational Problems,
North-Holland, 1976.
[8] L.C. Evans, Partial differential equations. Graduate Studies in Mathematics, 19. American Mathematical Society, Providence, RI, 1998.
[9] L.C. Evans, R.F Gariepy, Measure theory and fine properties of functions. Studies in Advanced Mathematics. CRC Press, Boca Raton, FL,
1992.
[10] D. Gilbarg, N. trudinger, Elliptic Partial Differential Equations of Second Order, Springer-Verlag, Heidelberg, classics in Mathematics, reprint of the 1998 edition.
[11] S. Lang, Analyse réelle, Dunod, Paris, 1977.
[12] E. Lieb, M. Loss, Analysis. Second edition. Graduate Studies in Mathematics, 14. American Mathematical Society, Providence, RI, 2001.
[13] J.-L. Lions, Problèmes aux limites dans les équations aux dérivées partielles, Presses de l’Université de Montréal, 1965.
[14] P.-L. Lions, The concentration-compactness principle in the Calculus of
Variations (Ann. Inst. H. Poincaré Anal. Non Linéaire 1 (1984), no.2,
184
109-145, no.4, 223-283, et Rev. Mat. Iberoamericana 1 (1985), no.1,
145-201 et no.2, 45-121).
[15] F. Paulin, Topologie et Calcul différentiel, cours de la FIMFA.
[16] W. Rudin, Functional analysis. Second edition, New York, 1991.
[17] W. Rudin, Analyse réelle et complexe, 3ème édition, Dunod, Paris,
1998.
[18] L. Schwartz, Topologie générale et analyse fonctionnelle, Hermann,
1970.
[19] C. Villani, Topics in optimal transportation, AMS, 2004.
[20] C. Villani, Optimal Transport, Old and New, Springer-Verlag, 2009.
[21] C. Villani, Cours d’intégration et d’analyse de Fourier, ENS Lyon, 2008,
http ://www.umpa.ens-lyon.fr/∼cvillani/Cours/iaf-2007.html
[22] K. Yosida, Functional Analysis, Springer Classics in Mathematics.
[23] C. Zuily, Distributions et équations aux dérivées partielles, Hermann,
Paris, 1986.
185
Téléchargement