Analyse de Fourier, analyse spectrale et équations aux dérivées

publicité
Promotion 2012
Année 2
Enseignement diversifié 1
MAT432
Analyse de Fourier, analyse spectrale
et équations aux dérivées partielles
Jean-Michel Bony, Yvan Martel
Édition 2013
Introduction
Ce cours a pour objectif de proposer une introduction à l’étude mathématique
de certaines équations aux dérivées partielles en mettant en application les
connaissances des élèves sur deux thèmes classiques de l’analyse : l’analyse hilbertienne (notamment, la théorie spectrale des opérateurs bornés) et l’analyse
de Fourier.
Les concepts et techniques mathématiques utilisés dans ce cours interviennent de façon très importante dans d’autres disciplines, notamment en
sciences physiques, mais ne représentent évidemment qu’une infime partie des
mathématiques utilisées par les autres sciences.
Ce polycopié reprend l’essentiel du texte de la version précédente du cours
MAT432 de Jean-Michel Bony et Isabelle Gallagher, Analyse de Fourier et
théorie spectrale. Toutefois, dans cette nouvelle version, certains chapitres ont
été rajoutés et le plan a été modifié pour placer un accent plus important sur
l’étude des équations aux dérivées partielles.
Deux points majeurs de ce cours sont donc l’analyse de Fourier et l’étude
des équations aux dérivées partielles.
L’analyse de Fourier. — Le lecteur connaît déjà bien les séries de Fourier mais
nous leur consacrons le Chapitre 3, notamment pour replacer leur étude dans
le cadre naturel des fonctions périodiques de carré sommable sur une période
et pour en donner des applications à quelques équations aux dérivées partielles
linéaires.
La transformation de Fourier, indissociable de la convolution, est étudiée
au Chapitre 4, notamment dans le cadre des fonctions de carré sommable sur
Rd . Une fonction f à valeurs complexes, définie sur Rd peut sous des hypothèses
assez générales, et en tout cas sans supposer aucune périodicité, se représenter
sous la forme suivante
f (x) = (2π)
−d
Z
Rd
eix·ξ fb(ξ) dξ,
4
appelée formule d’inversion de Fourier, où la fonction fb, définie dans Rd , s’appelle la transformée de Fourier de f et s’en déduit de manière analogue :
fb(ξ) =
Z
Rd
e−ix·ξ f (x) dx.
La première de ces formules exprime f comme une superposition, indexée par ξ,
de fonctions particulièrement simples : les exponentielles imaginaires x → eix·ξ
qui
oscillent
à la fréquence |ξ|, chacune d’elles étant affectée d’une amplitude
b f (ξ), et d’une phase arg fb(ξ).
Cette représentation a créé une véritable révolution, que ce soit en mathématiques ou en physique, dans la manière de penser une fonction. La donnée
de fb est exactement équivalente à celle de f — on dispose des formules cidessus pour déduire l’une de l’autre — mais l’information contenue dans f est
analysée et recombinée de manière très différente pour former fb. Une grande
(ou faible) valeur de f (x0 ) signifie que le phénomène physique décrit par f est
important (ou négligeable) en ce point. Une grande (ou faible) valeur de fb(ξ0 )
signifie que la “fréquence” ξ0 contribue beaucoup (ou peu) pour reconstruire f .
Cette dualité entre analyse en amplitude et analyse en fréquence est d’une
grande importance en physique comme en mathématiques. En mécanique
quantique, les rôles joués par f et fb sont parfaitement symétriques. Dans l’expression de lois physiques, ou dans les dispositifs expérimentaux, c’est tantôt
f tantôt fb qui apparaît simplement. Pour une équation aux dérivées partielles
linéaire à coefficients constants, la recherche de solutions du type x → eix·ξ est
un calcul purement algébrique ; rechercher d’autres solutions comme superposition de celles-ci, c’est précisément rechercher fb, etc.
Les équations aux dérivées partielles. — L’étude de ces équations constitue la
partie la plus nouvelle de ce cours pour le lecteur. Nous avons choisi de traiter
des équations aux dérivées partielles simples (en particulier, linéaires) mais qui
sont considérées comme universelles, c’est-à-dire qu’elles apparaissent dans de
nombreux contextes différents en sciences physiques.
On appelle équation aux dérivées partielles (EDP) une équation concernant
une fonction inconnue u de plusieurs variables et impliquant plusieurs de ces
dérivées partielles. Selon les cas, les variables indépendantes de la fonction
inconnue u pourront être notées :
– soit x = (x1 , . . . , xd ) ∈ Rd (ou un domaine de Rd ), où d ≥ 1 est la
dimension de l’espace ;
– soit (t, x), où t ∈ R représente le temps (ou parfois une variable d’espace
qui doit être privilégiée) et x ∈ Rd (ou un domaine de Rd ) est la variable
d’espace.
5
Dans le premier cas, on a affaire à une équation stationnaire et dans le deuxième
cas à une équation d’évolution.
Il est très rare que l’on cherche à obtenir toutes les solutions d’une équation
— il y en a en général beaucoup trop — on cherche le plus souvent à obtenir
une solution (si possible unique) satisfaisant à des conditions additionnelles.
Les états stationnaires des systèmes physiques, ou leur évolution, sont fréquemment régis par des équations aux dérivées partielles, mais la modélisation n’est
complète que si on adjoint les autres conditions (initiales, à la frontière . . .)
auxquelles il sont soumis. Par exemple :
(i) Pour des problèmes d’évolution, on cherche fréquemment à déterminer
l’évolution du système connaissant son état à l’instant 0. La formulation mathématique correspondante est le problème de Cauchy : déterminer une solution u(t, x) de l’équation aux dérivées partielles dont les valeurs u(0, x) sont
imposées.
(ii) Pour un problème stationnaire dans l’espace entier, on impose souvent
soit des conditions à l’infini (on demandera ainsi que le potentiel électrostatique vérifie l’équation de Poisson et tende vers 0 à l’infini), soit la finitude de
certaines normes (traduisant par exemple la finitude de l’énergie).
(iii) Pour des problèmes stationnaires dans un domaine borné, on doit décrire
le comportement physique du système à l’interface. Mathématiquement, cela
conduira par exemple à imposer la valeur de la solution à la frontière, ou bien
celle de sa dérivée normale (condition portant sur le flux).
(iv) Pour un problème d’évolution dans un domaine borné, il faudra en général imposer à la fois des conditions à l’instant initial, et des conditions à la
frontière.
Détaillons maintenant le plan des Chapitres 1 à 7.
Dans le Chapitre 1, nous abordons par des outils élémentaires l’équation de
transport linéaire (la plus simple des EDP) ainsi que l’équation de Burgers, qui
est la seule équation non linéaire étudiée dans ce cours. Le but de ce chapitre
est surtout d’introduire quelques notions fondamentales liées aux EDP dans
des cas simples où des calculs explicites sont possibles.
Le Chapitre 2 est consacré aux équations de Laplace et Poisson, qui sont
les EDP du second ordre les plus simples à écrire :
∆u = 0 ,
−∆u = f .
Un concept clé de ce chapitre est la notion de solution fondamentale.
Le Chapitre 3, dédié aux séries de Fourier, contient aussi une application
à l’équation de la chaleur linéaire périodique.
6
Le Chapitre 4 est consacré à la transformation de Fourier et à une introduction aux espaces de Sobolev H s qui sont bien adaptés à l’étude des solutions
de certaines EDP.
Au Chapitre 5, nous nous intéressons à des EDP du second ordre stationnaires, par le biais de deux exemples types :
à coefficients constants
à coefficients variables
−∆u + u = f ,
−∆u + u − c(x)u = f .
La transformation de Fourier est bien adaptée à l’étude de phénomènes qui se
produisent dans l’espace entier et qui sont invariants par translation : typiquement, elle permet de résoudre la première équation.
En revanche, pour une équation à coefficients variables, l’analyse de Fourier n’est plus directement utilisable. Dans une large mesure, c’est la théorie
spectrale qui va prendre le relais. Pour les endomorphismes des espaces de
dimension finie, la théorie spectrale est bien connue du lecteur : c’est essentiellement la recherche des valeurs propres et vecteurs propres. Comme cela
a été vu pendant le cours de Tronc commun, en dimension infinie, certains
aspects se généralisent tels quels, mais d’autres sont sensiblement modifiés.
Un opérateur différentiel comme le Laplacien doit être pensé comme une application linéaire, qui à une fonction u fait correspondre ∆u. Il opère dans
des espaces de fonctions qui sont de dimension infinie. La théorie spectrale de
tels opérateurs différentiels est fondamentale dans l’étude des EDP linéaires
ou non linéaires. Cependant, le Laplacien est un opérateur non borné et dans
ce cours nous nous limitons essentiellement au cas des opérateurs bornés. Nous
verrons dans la deuxième partie du Chapitre 5 comment réduire la résolution
de l’équation −∆u+u−c(x)u = f à l’étude d’un problème spectral compact et
à l’application de l’alternative de Fredholm présentée de façon abstraite dans
l’Annexe A.
Le Chapitre 6 illustre l’efficacité de la transformation de Fourier dans
l’étude des équations d’évolution à coefficients constants sur Rd , notamment
l’équation de la chaleur
∂t u − ∆u = 0 ;
l’équation de Schrödinger
i ∂t u + ∆u = 0 ;
l’équation des ondes
∂t2 u − ∆u = 0 .
Finalement, le Chapitre 7 est destiné à ouvrir d’autres perspectives, concernant des équations aux dérivées partielles posées sur des domaines bornés généraux ou des équations d’évolution avec potentiel dont l’étude nécessite des
7
informations spectrales sur des opérateurs non bornés dont la théorie est seulement esquissée à la fin de l’Appendice A.6.
Il faut savoir que l’étude des équations aux dérivées partielles et de leurs
applications est un sujet très vaste et complexe qui occupe un grand nombre
de mathématiciens professionnels dans le monde. Dans le cadre de ce cours, on
peut regretter les limitations suivantes. D’une part, il n’est pas possible faute
de temps d’enseigner aux élèves la théorie des distributions qui est pourtant
d’une grande utilité dans l’étude des EDP. Le lecteur intéressé pourra consulter
la partie du cours MAT431 de François Golse [GO] consacrée à cette théorie (ou
[SC1], [SC2], [H-L]). À l’exception de l’équation de Burgers, ce cours n’aborde
pas les EDP non linéaires, dont l’étude est remarquablement riche et complexe.
Finalement, nous ne présentons pas de façon systématique la dérivation de ces
EDP à partir des lois de la physique (voir par exemple les chapitres consacrés
aux EDP dans le polycopié [GO] ou [SC2]).
Une partie du cours de deuxième année MAP431, Analyse Numérique
et Optimisation, organisé par le département de mathématiques appliquées,
a pour but d’enseigner quelques autres facettes de l’analyse mathématique
d’EDP ainsi que des techniques de résolution numérique.
Pour aller plus loin, le lecteur devrait consulter le contenu des cours de Master 1 de mathématiques de l’École Polytechnique relatifs à l’étude de plusieurs
aspects de la théorie des équations aux dérivées partielles :
MAT554 : Analyse non linéaire,
MAT561 : Équation de Schrödinger non linéaire : des condensats de Bose Einstein aux supersolides,
MAT567 : Transport et diffusion.
Il nous reste à décrire brièvement le contenu des trois Appendices.
Dans l’Appendice A, nous rappelons les bases de l’analyse hilbertienne, de
l’analyse des opérateurs bornés et des opérateurs compacts sur les espaces de
Hilbert.
L’Appendice B consacré aux compléments d’intégration, est un rappel des
principaux résultats relatifs à l’intégrale de Lebesgue vus en Tronc Commun
de première année.
Les Appendices A et B contiennent donc des prérequis d’analyse indispensables et leur connaissance est exigée à l’issue du cours.
La théorie des fonctions d’une variable complexe est une très belle théorie
mathématique, dont les interventions en physique sont nombreuses et variées.
8
Cette théorie a été exposée en cours de Tronc Commun de première année, aussi
avons-nous choisi d’en rappeller uniquement quelques aspects dans l’Appendice C, notamment le théorème des résidus qui est un outil de calcul important
en analyse de Fourier.
Notations
Notations pour les variables
?
= {x ∈ R | x > 0} ;
(i) R+
(ii) ej désigne le j–ème vecteur de la base canonique de Rd ;
(iii) Un élement x de Rd est noté x = (x1 , . . . , xd ) ;
(iv) Pour a, b ∈ Rd , le produit scalaire de a et b est noté
a·b=
d
X
aj b j ,
j=1
et |a| =
1
P
√
d
2 2
a
a·a=
désigne la norme de a ;
j=1 j
(v) Si Ω désigne un ouvert de Rd , sa frontière est notée ∂Ω ;
(vi) La boule ouverte de Rd de centre x et de rayon r > 0 est notée BRd (x, r) =
{y ∈ Rd | |y − x| < r} ou plus simplement B(x, r) ;
(vii) ρ(d) est le volume de la boule unité de Rd ;
d ρ(d) est la surface de la sphère unité ∂BRd (0, 1) de Rd .
Notations pour les fonctions
(i) Pour une fonction u : Rd → R ou C, on note u(x) = u(x1 , . . . , xd ).
(ii) Lorsqu’une variable supplémentaire joue un rôle particulier (dans ce
cours, généralement, la variable temps t), on considère des fonctions
u : R × Rd → R ou C, et on note u(t, x) = u(t, x1 , . . . , xd ).
(iii) Le produit de convolution de deux fonctions u, v : Rd → R ou C est
noté
Z
(u?v)(y) =
u(x − y)v(y)dy .
Rd
(iv) La transformée de Fourier de f est notée fb ou F(f ) et désigne
fb(ξ)
=
Z
Rd
e−i x·ξ f (x)dx .
10
Avec cette normalisation,
F(f ?g) = fb gb ,
F(f g) = (2π)−d fb? gb .
Voir aussi le formulaire Section 4.4.
(v) Une sous-suite (ou suite extraite) d’une suite (un ) pourra être notée (unk )
ou (uϕ(n) ), où ϕ : N → N est strictement croissante.
Notations pour les dérivées
(i) Pour une fonction u : Rd → R ou C, la dérivée partielle de u par rapport
à la variable xj au point x est (pourvu que cette limite existe)
∂u
u(x + hej ) − u(x)
(x) = lim
;
h→0
∂xj
h
Les notations équivalentes suivantes pourront être utilisées
∂u
= ∂xj u = uxj ;
∂xj
(ii) De même,
∂ 2u
= ∂xj ∂xk u = uxj ,xk .
∂xj ∂xk
(iii) Le gradient d’une fonction à valeurs scalaires u : Rd → R ou C est noté
∇u = (∂x1 u, . . . , ∂xd u) ;
(iv) Le Laplacien de u : Rd → R ou C est noté
∆u =
d
X
∂x2j u ;
j=1
(v) Notation multi-indice : un vecteur α = (α1 , . . . , αd ) de Nd est appelé un
P
multi-indice, d’ordre |α| = dj=1 αj .
On note alors
∂ αu =
∂ |α| u
= ∂xα11 . . . ∂xαdd u .
∂xα1 1 . . . ∂xαd d
11
(vi) Dans le cas où une variable supplémentaire t joue un rôle particulier et
que u : R × Rd → R ou C, on note
∂u
= ∂t u = ut
∂t
la dérivée partielle par rapport à t. Dans ce cas, on pourra préciser que
le gradient ou le Laplacian ne concernent que les variables d’espace en
utilisant un indice x :
∇x u = (∂x1 u, . . . , ∂xd u) ,
∆x u =
d
X
∂x2j u .
j=1
Notations pour les espaces de fonctions
(i) C(Rd ) = {u : Rd → R ou C | u est continue sur Rd } ;
C p (Rd ) = {u : Rd → R ou C | pour tout multi-indice α ∈ Nd , |α| ≤ p,
∂ α u existe et est continue sur Rd } ;
(ii) L1 (Rd ) = {u : Rd → R ou C (mesurable) | kukL1 = Rd |u| < ∞} ;
R
1/2
L2 (Rd ) = {u : Rd → R ou C (mesurable) | kukL2 = ( Rd |u|2 ) < ∞} ;
Ces espaces sont en fait des espaces de classes de fonctions, voir l’Appendice B pour une définition rigoureuse.
R
(iii) Les espaces de Sobolev H s (Rd ) sont introduits au Chapitre 4.
(iv) On note L(E, F ) l’espace vectoriel des applications linéaires continues
de E dans F (et L(E, E) = L(E)). Voir Appendice A.1.
Chapitre 1
EDP d’ordre un et méthode des
caractéristiques
Une première étude des EDP les plus simples ne nécessite que des outils mathématiques élémentaires, mais donne l’occasion d’introduire du vocabulaire
et quelques notions fondamentales dans la suite de la théorie.
1.1
Équations de transport
Il est naturel de commencer par l’équation de transport à coefficients
constants qui est la plus simple des équations aux dérivées partielles :
∂t u + b · ∇x u = 0 dans [0, +∞[×Rd ,
(1.1)
où b = (b1 , . . . , bd ) ∈ Rd est un vecteur fixe et u = u(t, x) est la fonction
P
inconnue. On note b · ∇x u = dj=1 bj ∂xj u.
Il est très facile de résoudre cette équation en observant qu’elle signifie
qu’une certaine dérivée directionnelle de u s’annule ; on pose, pour tout λ ∈ Rd ,
t ≥ 0, z(t) = zλ (t) = u(t, λ + bt). Alors, par un calcul élémentaire de dérivée
composée, l’équation (1.1) implique que pour tout t,
z 0 (t) =
dz
(t) = ∂t u(t, λ + bt) + b · ∇x u(t, λ + bt) = 0,
dt
ce qui implique que u est constant le long de toute droite passant par (0, λ) et
de direction (1, b). La connaissance de u pour t = 0 en tout λ ∈ Rd suffit donc
à déterminer la valeur de u sur tout le domaine [0, +∞[×Rd .
14
a
Chapitre 1. EDP d’ordre un
Problème de Cauchy homogène
On considère l’équation précédente complétée d’une donnée initiale g :
(
∂t u + b · ∇ x u = 0
u(t = 0) = g
dans [0, +∞[×Rd ,
sur Rd ,
(1.2)
où b = (b1 , . . . , bd ) ∈ Rd et g : Rd → R sont donnés.
Théorème 1.1.1 Si g est de classe C 1 , alors il existe une unique solution de
classe C 1 du problème (1.2) donnée par u(t, x) = g(x − bt).
D’après ce qui précède, si u est solution alors, pour tout λ ∈ Rd , t ≥ 0,
u(t, λ + bt) = u(0, λ) = g(λ). D’où, pour tout x ∈ Rd , t ≥ 0, en posant
λ = x − bt,
u(t, x) = g(x − bt).
(1.3)
Réciproquement, si g est de classe C 1 , on voit que u défini par (1.3) résout
bien l’équation (1.2).
On a donc résolu le problème de Cauchy associé à (1.1) en montrant l’existence et l’unicité d’une solution classique (voir plus bas) de (1.2) pour tout g
de classe C 1 .
1.1.2 Courbes caractéristiques La droite Γλ d’équation x = γλ (t), où
t 7→ γλ (t) = λ + bt ∈ Rd , est appelée la courbe caractéristique issue de λ.
Clairement, γλ vérifie
(
d
γ (t) = b,
dt λ
(1.4)
γλ (0) = λ.
Toute solution de (1.1) est constante le long de toute courbe caractéristique.
1.1.3 Notions de solution Dans ce cours, nous nous limiterons le plus
souvent aux solutions classiques d’EDP, c’est-à-dire aux fonctions que l’on
peut dériver autant de fois qu’il le faut pour que chaque terme de l’équation
soit bien défini de façon habituelle comme la dérivée d’une fonction dérivable.
Dans le cadre précédent, si la fonction g n’est pas de classe C 1 alors il
n’existe pas de solution de (1.2) qui soit C 1 pour tout t. Cependant, la fonction u(t, x) définie par la formule (1.3) garde un sens et donne un candidat
naturel pour être une solution faible. Pour cela, il faudrait disposer d’un cadre
permettant de définir la dérivée au sens faible de fonctions non dérivables ; le
plus général est celui de la théorie des distributions qui ne sera pas abordée
dans ce cours. Voir par exemple le polycopié [GO] du cours de F. Golse.
15
1.1. Équations de transport
1.1.4 Réversibilité L’équation (1.1) est réversible, dans le sens suivant :
si u(t, x) est solution alors v(t, x) = u(−t, −x) est aussi solution.
(1.5)
En particulier, on peut résoudre (1.1) pour t < 0.
Remarque 1.1.5 On peut considérer plus généralement l’équation
∂t u + b(t, x) · ∇x u = 0,
où b : [0, +∞[×Rd → Rd est un champ de vecteurs C 1 (chaque bk et toutes
ses dérivées partielles ∂xj bk , ∂t bk sont continues). Consulter par exemple [GO],
Chapitre 2.
b
Équation non homogène
On considère maintenant le problème non homogène (avec second membre)
(
dans [0, +∞[×Rd ,
sur Rd ,
∂t u + b · ∇x u = f
u(t = 0) = g
(1.6)
où b ∈ Rd ainsi que f (t, x) et g(x) sont donnés (f est appelé terme source).
Comme précédemment, on est conduit à poser z(t, x) = u(t, λ + bt). Alors,
z 0 (t) = f (t, λ + bt), et par intégration, on obtient
z(t) = z(0) +
Z t
f (s, λ + bs)ds = g(λ) +
Z t
f (s, λ + bs)ds.
0
0
Finalement, pour tout x ∈ Rd , t ≥ 0,
u(t, x) = g(x − bt) +
Z t
f (s, x − b(t − s))ds.
(1.7)
0
Remarque 1.1.6 On voit que la méthode des caractéristiques (qui consiste ici
à étudier les variations de u le long des courbes Γλ définies par (1.4) a permis
de transformer une EDP en une équation différentielle ordinaire, directement
intégrable.
1.1.7 Principe de Duhamel Le principe de Duhamel affirme de façon générale que si l’on sait résoudre le problème de Cauchy homogène, alors on peut
résoudre le problème non homogène. Ce principe est facile à illustrer dans le
cas présent. On note, pour s ≥ 0,
(
ws (t, x) la solution de
∂t ws + b · ∇x ws = 0
ws (t = s, x) = f (s, x)
t ∈ R, x ∈ Rd ,
x ∈ Rd ,
16
Chapitre 1. EDP d’ordre un
et donc ws (t, x) = f (s, x − b(t − s)). Alors, on voit que
u(t, x) =
Z t
0
ws (t, x)ds
est solution de l’équation non homogène (1.6) avec g = 0.
1.2
Équation des ondes en dimension un
On considère maintenant l’équation des ondes (homogène) en dimension
un d’espace
(
∂t2 u − ∂x2 u = 0
u(t = 0) = g; ∂t u(t = 0) = h
dans [0, +∞[×R,
sur R,
(1.8)
où g(x) et h(x) sont des fonctions données. L’équation est d’ordre 2 en temps
ce qui conduit à prescrire une donnée initiale à la fois sur u et ∂t u en t = 0.
La raison de faire apparaître cette équation d’ordre deux à ce niveau du
cours est qu’elle peut être “factorisée” de la façon suivante
(∂t + ∂x )(∂t − ∂x )u = (∂t2 − ∂x2 )u.
(1.9)
On est donc conduit à poser
v(t, x) = (∂t − ∂x )u(t, x)
(1.10)
qui vérifie
∂t v + ∂x v = 0.
D’après la section précédente, et plus précisément la formule (1.3), on trouve
v(t, x) = a(x − t) où a(λ) = v(t = 0, λ). La définition (1.10) de v donne alors
∂t u − ∂x u = a(x − t),
que l’on sait également résoudre, voir formule (1.7). Comme u(t = 0, x) = g(x),
on trouve
u(t, x) = g(x + t) +
Z t
a(x + (t − s) − s)ds
0
= g(x + t) +
1 Z x+t
a(y)dy
2 x−t
en utilisant le changement de variable y = x + t − 2s. On veut maintenant
une expression de u(t) en fonction de g et h. On voit que a(y) = v(0, y) =
17
1.2. Équation des ondes en dimension un
∂t u(0, y) − ∂x u(0, y) = h(y) − g 0 (y). En reportant dans la formule précédente
et après intégration, on trouve pour tout t ≥ 0, x ∈ R,
u(t, x) =
1 Z x+t
1
[g(x + t) + g(x − t)] +
h(y)dy.
2
2 x−t
(1.11)
C’est la formule de d’Alembert.
Nous venons de déterminer la formule (1.11) en supposant que u(t, x) était
une solution suffisamment régulière (au moins de classe C 2 ). Inversement, il
est élémentaire de vérifier par un calcul direct que u(t, x) défini par (1.11) pour
g de classe C 2 et h de classe C 1 résout bien l’équation (1.8). On obtient donc
le théorème suivant.
Théorème 1.2.1 Si g est de classe C 2 et h de classe C 1 , alors u(t, x) donné
par (1.11) est l’unique solution de classe C 2 de (1.8).
Remarque 1.2.2 D’après (1.11), on voit que u(t) est de la forme
u(t, x) = G(x − t) + H(x + t),
(1.12)
pour deux fonctions G et H d’une variable bien choisies. Réciproquement, on
remarque que toute fonction de la forme (1.12) est solution de ∂t2 u − ∂x2 u = 0.
Remarque 1.2.3 L’équation des ondes ∂t2 u − ∂x2 u = 0 est réversible en temps
dans le sens (1.5).
1.2.4 Régularité Si g est de classe C p et h est classe C p−1 , pour p ≥ 1, on
voit que u(t) est de classe C p pour tout t (et ∂t u est de classe C p−1 ). Autrement
dit, la régularité persiste dans le temps.
1.2.5 Notion de domaine de dépendance
considère le triangle
Pour t0 > 0, x0 ∈ Rd , on
T0 (t0 , x0 ) = {(t, x); 0 ≤ t ≤ t0 , |x − x0 | ≤ t0 − t}.
D’après la formule (1.11), la valeur de la solution u(t0 , x0 ) de (1.8) au point
(t0 , x0 ) ne dépend que de g|[x0 −t0 ,x0 +t0 ] et h|[x0 −t0 ,x0 +t0 ] , les restrictions de g et
h à l’intervalle [x0 − t0 , x0 + t0 ].
Comme conséquence, on voit que si g et h sont nulles sur [x0 − t0 , x0 +
t0 ], alors u(t0 , x0 ) = 0, et même u est nulle dans le triangle T0 (t0 , x0 ). Ce
phénomène est une illustration de la vitesse finie de propagation. Ici, la vitesse
est égale à 1 car l’équation est sous forme adimensionnée. Pour l’équation des
ondes plus générale ∂t2 u − c2 ∂x2 u = 0, où c > 0, la vitesse de propagation est c.
18
Chapitre 1. EDP d’ordre un
Exercice 1.2.6 Résoudre l’équation des ondes non homogène en dimension un :
(
∂t2 u − ∂x2 u = f
u(t = 0) = g ; ∂t u(t = 0) = h
dans [0, +∞[×R,
sur R.
Exercice 1.2.7 Un autre exercice classique est de résoudre l’équation des ondes
sur la demi-droite
∂t2 u − ∂x2 u = 0
u(t = 0) = g; ∂t u(t = 0) = h


u = 0,



?
dans [0, +∞[×R+
,
?
sur R+ ,
sur ]0, +∞[×{x = 0},
à partir de la formule de d’Alembert. La dernière ligne est une condition au
bord du domaine, appelée condition de Dirichlet. On pourra utiliser un argument de réflexion, en introduisant g̃, h̃ et ũ(t, x) telles que
g̃(x) = g(x) (x > 0) ; g̃(x) = −g(−x) (x < 0) ,
h̃(x) = h(x) (x > 0) ; h̃(x) = −h(−x) (x < 0) ,
ũ(t, x) = u(t, x) (x > 0, t ≥ 0) ; ũ(t, x) = −u(t, −x) (x < 0, t ≥ 0) .
1.2.8 Pour aller plus loin L’équation (1.8) se généralise en dimension supérieure d’espace de la façon suivante :
∂t2 u − ∆x u = 0
dans [0, +∞[×Rd .
En toute dimension d ≥ 2, cette équation peut être résolue explicitement,
mais cela demande bien plus d’efforts qu’en dimension un et le résultat dépend
fortement de la dimension d’espace d et en particulier de la parité de d. Ce
travail dépasse le cadre de ce chapitre introductif et il est reporté au Chapitre 6
de ce cours. Le lecteur intéressé pourra aussi consulter [EV, Chapitre 2.4] ou
[GO, Chapitre 10].
1.3
EDP non linéaire d’ordre un
Nous considérons seulement le cas typique de l’équation de Burgers (sans
diffusion) :
(
dans [0, +∞[×R,
∂t u + ∂x 12 u2 = 0
(1.13)
u(t = 0) = g
sur R,
mais la démarche que nous allons adopter est générale et s’étend sans difficulté
aux équations ∂t u + a(u)∂x u sous des hypothèses naturelles pour a(u). Il s’agit
1.3. EDP non linéaire d’ordre un
19
de la seule équation non linéaire étudiée dans ce cours. La donnée initiale g est
supposée de classe C 1 et, supposant comme dans les sections précédentes qu’il
existe une solution, on en cherche une expression nécessaire. Comme l’équation considérée s’écrit sous la forme ∂t u + u∂x u, on s’inspire de la section sur
l’équation de transport en considérant la famille de courbes caractéristiques
Γλ , d’équation x = γλ (t), pour tout λ ∈ R, où
(
d
γ (t)
dt λ
= u(t, γλ (t)),
γλ (t = 0) = λ.
(1.14)
Contrairement à l’équation de transport (1.1), les courbes caractéristiques dépendent de la solution u(t). On va voir qu’en fait ces courbes sont beaucoup
plus simples qu’il n’y paraît.
Pour cela, posons comme précédemment z(t) = u(t, γλ (t)). Alors, en utilisant les équations de u et γλ , on trouve
z 0 (t) = ∂t u(t, γλ (t)) +
dγλ
(t) · ∂x u(t, γλ (t)) = 0,
dt
ce qui signifie
u(t, γλ (t)) = const = u(0, γλ (0)) = g(λ),
(1.15)
et donc u est constant le long de toute courbe caractéristique. En retour, cela
prescrit la forme des courbes caractéristiques. En effet, on a
d
γλ (t) = g(λ),
dt
d’où γλ (t) = t g(λ) + λ,
(1.16)
et les courbes caractéristiques Γλ sont des droites de pente g(λ).
En combinant (1.15) et (1.16), on obtient pour tout λ ∈ R,
u(t, t g(λ) + λ) = g(λ).
(1.17)
Une conséquence immédiate est que pour tout t, x 7→ u(t, x) a la même image
que λ 7→ g(λ) (c’est-à-dire prend les mêmes valeurs).
Notre analyse jusqu’à présent a permis d’obtenir une formule implicite pour
u. La détermination explicite de u(t, x) en fonction de t et x dépend maintenant
de la résolution de l’équation
t g(λ) + λ = x,
(1.18)
que nous allons considérer maintenant, juste après une dernière remarque formelle très importante.
20
Chapitre 1. EDP d’ordre un
Définissons, pour tout λ ∈ R, w(t) = wλ (t) = ∂x u(t, γλ (t)). Il se trouve que
w(t) vérifie une équation différentielle simple, car en utilisant (1.13) et (1.14),
w0 (t) =
∂t ∂x u + γλ0 (t) ∂x2 u (t, γλ (t))
= −(∂x u)2 (t, γλ (t)) = −w2 (t).
(1.19)
(1.20)
Complétée par la donnée initiale w(0) = g 0 (λ), on calcule la solution par intégration directe de l’équation différentielle
w(t) = ∂x u(t, γλ (t)) =
g 0 (λ)
.
1 + g 0 (λ)t
Le fait que w(t) soit ou non bien défini pour tout t ≥ 0 dépend manifestement
du signe de g 0 (λ). Pour λ tel que g 0 (λ) ≥ 0, on pose T (λ) = +∞, sinon,
T (λ) = −1/g 0 (λ). Ensuite, on définit
T ∗ = inf T (λ)
λ∈R
(T ∗ = +∞ si ∀λ, T (λ) = +∞).
(1.21)
Il apparaît d’après ce calcul qu’une solution classique u(t, x) du problème ne
peut exister que sur un intervalle de la forme [0, τ ], où 0 ≤ τ < T ∗ , puisque
sinon ∂x u(t) serait mal définie à T ∗ . Autrement dit, T ∗ majore le temps d’existence maximal.
Nous allons voir qu’inversement, l’équation (1.18) peut être résolue exactement sur [0, T ∗ [ et conduit à une solution u(t, x) classique de (1.13) sur tout
l’intervalle [0, T ∗ [. On nomme T ∗ le temps de vie de la solution. En effet, pour
0 < t < τ < T ∗ , on a
d
τ
(t g(λ) + λ) = tg 0 (λ) + 1 ≥ 1 − ∗ > 0.
dλ
T
Ainsi, l’image de λ 7→ t g(λ)+λ est R tout entier et pour tout x ∈ R, 0 < t < τ ,
l’équation (1.18) a une unique solution, notée λt (x).
Finalement, pour tout 0 < t < T ∗ , x ∈ R, on pose u(t, x) = g(λt (x)) et
on vérifie que u est solution de (1.13). En effet, pour tout x, par définition
de λt (x), u(t, t g(λt (x)) + λt (x)) = g(λt (x)). Comme λt (x) décrit R lorsque x
décrit R, on voit que pour tout λ et tout t, u vérifie (1.17). En dérivant (1.17)
par rapport à t, on trouve
(∂t u + g(λ)∂x u)(t, t g(λ) + λ) = 0,
d’où
(∂t u + u∂x u)(t, t g(λ) + λ) = 0.
21
1.3. EDP non linéaire d’ordre un
Enfin, λt=0 (x) = x et donc u(t = 0, x) = g(x).
Si T ∗ = +∞, on dit que la solution existe globalement. Cependant, cela
impose que g 0 (λ) ≥ 0, pour tout λ, c’est-à-dire une donnée initiale croissante.
Si T ∗ = 0, ce qui signifie lim g 0 = −∞ quand x → −∞ ou +∞, il n’existe
de solution sur aucun intervalle [0, τ ], pour τ > 0.
Dans les autres cas, on a 0 < T ∗ < +∞ et
lim
sup |∂x u(t, x)| = ∞,
t→T ∗ ,t<T ∗ x∈R
et on parle de phénomène d’explosion, bien que supx∈R,t∈[0,T ∗ [ |u(t, x)| =
supλ∈R |g(λ)|.
En fait, le phénomène d’explosion (ou de fin d’existence d’une solution classique) est lié à l’intersection de courbes caractéristiques qui n’ont pas toutes
la même pente. Le temps T ∗ correspond au premier temps où une telle intersection a lieu.
On peut maintenant énoncer le résultat principal.
Théorème 1.3.1 Si g est de classe C 1 , il existe une unique solution u(t, x)
de classe C 1 de (1.13) sur l’intervalle de temps maximal [0, T ∗ [ où T ∗ (fini ou
infini) est défini par (1.21).
Remarque 1.3.2 Pour une justification rigoureuse des arguments présentés
plus haut (en particulier la question importante de la régularité de λt (x)),
nous renvoyons à [GO, Chapitre 2.3].
Exercice 1.3.3 Supposons que g soit à support compact, c’est-à-dire vérifie
g(x) = 0 quand |x| > A, pour un certain A > 0. Montrer que u(t, x) vérifie
u(t, x) = 0 pour |x| > A pour tout t dans l’intervalle d’existence (utiliser les
courbes caractéristiques partant de A et −A).
Exercice 1.3.4 Résoudre
(
∂t u + u∂x u + u = 0
u(t = 0) = g
dans [0, +∞[×R,
sur R.
Exercice 1.3.5 Sous l’hypothèse standard a0 (0) 6= 0, résoudre
(
∂t u + a(u)∂x u = 0
u(t = 0) = g
dans [0, +∞[×R,
sur R.
22
Chapitre 1. EDP d’ordre un
1.3.6 Pour aller plus loin L’équation suivante (exemple tyique d’une équation
quasi-linéaire d’ordre deux)
∂t2 u − a2 (∂x u)∂x2 u = 0,
où a est une fonction, combine toutes les difficultés déjà rencontrées. Cependant, en s’inspirant des méthodes de ce chapitre, on peut donner une certaine
description du comportement de la solution. Voir le livre de John [JO].
Chapitre 2
Équations de Laplace et de
Poisson
Nous nous intéressons dans ce chapitre aux deux équations suivantes
équation de Laplace
∆u = 0
équation de Poisson
−∆u = f
dans Rd ,
(2.1)
dans Rd ,
(2.2)
pour d ≥ 2. (Le signe − devant le laplacien pour l’équation de Poisson se
justifie par une préférence naturelle pour les opérateurs positifs.)
Une bonne connaissance des résultats de la théorie de l’intégration (Appendice B) et notamment du produit de convolution est préférable pour aborder
ce chapitre.
2.1
Solution fondamentale du laplacien
Pour commencer l’étude d’une EDP, il est naturel de rechercher des solutions explicites. Pour cela, lorsque la situation semble complexe, on peut
se concentrer sur des classes particulières de fonctions, par exemple avec des
propriétés de symétrie, liées aux symétries de l’équation elle-même.
Exercice 2.1.1 Montrer que l’équation de Laplace est invariante par rotation,
dans le sens suivant : pour toute matrice orthogonale Θ de taille d × d,
si u(x) est solution de (2.1), alors u(Θx) est aussi solution de (2.1).
Il est donc naturel de chercher une solution de (2.1) sous la forme
u(x) = v(|x|) = v(r)
1/2
où r = |x| = (x21 + . . . + x2d )
.
24
Chapitre 2. Équations de Laplace et de Poisson
Exercice 2.1.2 Vérifier par un calcul direct que
∆u(x) = v 00 (r) +
d−1 0
v (r).
r
(2.3)
Ainsi u vérifie (2.1) si et seulement si
v 00 +
d−1 0
v = 0.
r
(2.4)
Si v 0 6= 0, on écrit
v 00
1−d
0 0
,
=
(ln
|v
|)
=
v0
r
a
et par intégration, on obtient v 0 (r) = d−1 pour une constante a. Par une
r
deuxième intégration, on obtient :


b ln r + c
v(r) =
b

+c
d−2
r
(d = 2),
(d ≥ 3).
On définit maintenant la solution fondamentale du Laplacien
1
ln |x|
2π
Φ(x) =
1
1



d(d − 2)ρ(d) |x|d−2




−
(d = 2),
(d ≥ 3),
(2.5)
où ρ(d) est le volume de la boule unité BRd (0, 1) de Rd . Le choix d’une telle
normalisation pour Φ sera justifiée par les résultats de la section suivante.
Par les calculs précédents, la fonction Φ vérifie ∆Φ = 0, pour tout x 6= 0.
Cependant, Φ présente une singularité à l’origine qu’il convient d’étudier. Pour
cela, nous aurons besoin du rappel suivant.
2.1.3 Rappel d’intégration On rappelle que pour toute fonction ϕ positive (et
mesurable), ou pour toute fonction L1 (R+ ), on a
d ρ(d)
Z +∞
0
ϕ(r)dr =
Z
Rd
|x|1−d ϕ(|x|)dx.
(2.6)
En particulier, par le critère de Riemann de convergence des intégrales généralisées de fonctions puissances, la fonction x ∈ Rd 7→ |x|s appartient à
L1 (BRd (0, 1)) si et seulement si s > −d. Dans ce cas, on peut dire de façon
équivalente que x ∈ Rd 7→ |x|s appartient à L1loc (Rd ).
2.2. Résolution de l’équation de Poisson
25
La formule (2.6) est une généralisation de formules bien connues en dimension d’espace 2 et 3 (Voir remarque B.4.8) :
2π
Z +∞
ψ(r)rdr =
0
4π
Z +∞
ψ(r)r2 dr =
0
Z
R2
Z
R3
ψ(|x|)dx.
(2.7)
ψ(|x|)dx.
(2.8)
2.1.4 Estimations sur la solution fondamentale du Laplacien D’après
le rappel précédent, on voit que pour tout d ≥ 2, Φ ∈ L1loc (Rd ). D’autre part,
par un calcul explicite, pour tout k = 1, . . . , d, x ∈ R,
|∂xk Φ(x)| ≤
C
|x|d−1
d’où ∂xk Φ ∈ L1loc (Rd ).
Enfin, pour tout j, k = 1, . . . , d, x ∈ R,
|∂xj ∂xk Φ(x)| ≤
C
|x|d
mais ∂xj ∂xk Φ 6∈ L1loc (Rd ).
En effet, dans la gamme des puissances négatives de |x|, ∂xj ∂xk Φ est juste assez
singulier pour ne pas être intégrable dans un voisinage de 0.
En résumé :
(
∀x ∈ Rd \ {0}, ∆Φ = 0,
Φ ∈ L1loc (Rd ), ∂xk Φ ∈ L1loc (Rd ), ∂xj ∂xk Φ 6∈ L1loc (Rd ).
(2.9)
On voit donc que Φ ne résout pas de façon satisfaisante l’équation de Laplace
sur Rd tout entier, car Φ n’est pas définie en 0 et même si ∆Φ = 0 sur Rd \ {0},
prises individuellement, les dérivées partielles secondes de Φ sont singulières
en 0 au point de ne pas être intégrables.
Néanmoins, la fonction Φ est la clé de la résolution générale de l’équation
de Poisson comme nous allons le voir maintenant.
2.2
Résolution de l’équation de Poisson
Dans cette section nous énonçons le résultat suivant et le démontrons dans
le cas particulier d = 3.
26
Chapitre 2. Équations de Laplace et de Poisson
Théorème 2.2.1 Soit f de classe C 2 sur Rd , à support compact. On définit,
pour tout x ∈ Rd ,
u(x) =
Z
Rd
Φ(x − y)f (y)dy = (Φ?f )(x).
(2.10)
Alors,
(a) La fonction u est de classe C 2 sur Rd .
(b) −∆u = f dans Rd .
Le résultat peut se démontrer de plusieurs façons. Par exemple, dans [EV,
pp 23-25], la preuve repose de façon classique sur la formule de Green en dimension 3 (généralisation de la formule d’intégration par parties qui fait appel aux
intégrales de surfaces – voir Chapitre 7). Au Chapitre 5, nous proposerons une
autre démonstration basée sur la transformée de Fourier et une régularisation
du problème.
Nous allons donner une preuve ad hoc qui consiste à régulariser la fonction
Φ à l’origine et à passer à la limite après convolution. Cette démonstration
s’adapte à toutes les dimensions d ≥ 2 en utilisant (2.6), mais nous nous
1 1
.
limitons au cas d = 3 par souci de simplicité. Dans ce cas, Φ(x) = 4π
|x|
On considère, pour tout 0 < ε < 1, Φε une approximation de Φ vérifiant :

















Φε est de classe C 2 sur R3 , Φε (x) = Φε (|x|) ;
Φε (x) = Φ(x) pour tout |x| ≥ ε ;
lim kΦε − ΦkL1 (BR3 (0,1)) = 0 ;
ε→0
−2
pour tout k = 1, 2, 3 et |x| ≤ ε ;
|∂xk Φε (x)| ≤ Cε
∂xj ∂xk Φε (x) ≤ Cε−3 pour tout j, k = 1, 2, 3 et |x| ≤ ε.
(2.11)
On vient de tronquer la fonction Φ sur la région |x| ≤ ε. Bien sûr, on ne
peut pas éviter de fortes valeurs des dérivées et dérivées secondes près de zéro,
lorsque ε est petit, puisque l’on approche une fonction qui est singulière en
zéro.
Notons qu’il est facile de construire explicitement de telles approximations.
Par exemple, on peut poser
Φε (x) = αε |x|4 + βε |x|2 + γε , pour tout |x| ≤ ε,
et ajuster les paramètres αε , βε et γε pour que Φε soit de classe C 2 . On vérifie
alors bien toutes les propriétés (2.11). Le calcul explicite des paramètres αε ,
βε , γε n’est pas utile dans la suite.
On revient à la définition de u = Φ?f pour observer que u est de classe C 2
sur R par le Théorème B.7.9. Comme f est à support compact, il existe K > 0
27
2.2. Résolution de l’équation de Poisson
tel que f ≡ 0 pour |x| > K. On va calculer ∆u comme limite de ∆(Φε ?f ).
Pour cela, posons uε = Φε ?f . Alors, on a
∆(u − uε ) = (Φ − Φε )?(∆f )
et donc
k∆(u − uε )kL∞ ≤ kΦ − Φε kL1 (BR3 (0,1)) k∆f kL∞ .
Comme limε→0 kΦ − Φε kL1 (BR3 (0,1)) = 0, pour montrer le théorème, il suffit
d’obtenir limε→0 −∆uε (x) = f pour tout x ∈ Rd .
Soit x ∈ Rd , on a par le théorème B.7.9 et la formule (2.9)
∆uε (x) = (∆Φε ?f )(x) =
Z
|y|<ε
f (x − y)∆Φε (y)dy = Iε + Jε ,
où
Iε =
Z
|y|<ε
(f (x − y) − f (x)) ∆Φε (y)dy,
Jε = f (x)
Z
|y|<ε
∆Φε (y)dy.
Par le théorème des accroissements finis |f (x − Ry) − f (x)| ≤ C|y| ≤ Cε et
comme |∆Φε (y)| ≤ Cε−3 , on obtient |Iε | ≤ Cε−2 |y|≤ε dy ≤ Cε (la dimension
de l’espace est 3).
Ensuite, pour Jε , on utilise (2.8) et (2.3) :
2
Φ00ε + Φ0ε (r)r2 dr
r
0
h
iε
2 0
= 4πf (x) r Φε (r) = 4πf (x)ε2 Φ0ε (ε) = −f (x)
Jε = 4πf (x)
Z ε
0
1
car Φ0ε (ε) = Φ0 (ε) = − 4πε
2 (par abus de langage, on a noté indifféremment
Φε (x) = Φε (|x|)).
En conclusion, on obtient ∆uε = −f (x) + O(ε), ce qui était le résultat
recherché.
2.2.2 Vocabulaire des distributions Il est inexact de faire le raisonnement suivant :
∆(f ?Φ) = f ?(∆Φ) = 0 car ∆Φ = 0 presque partout,
car ∆Φ n’est pas une fonction intégrable dans un voisinage de l’origine.
Donner un sens à ∆Φ globalement sur Rd requiert le vocabulaire des distributions. En effet, au sens des distributions, le théorème 2.2.1 signifie exactement −∆Φ = δ0 , où δ0 est la masse de Dirac (voir le Chapitre sur les mesures de
Radon du cours de Tronc Commun). C’est une distribution positive, donc une
28
Chapitre 2. Équations de Laplace et de Poisson
mesure positive, que l’on peut se représenter comme la limite des fonctions hε ,
approximations de l’identité, définie dans le théorème B.7.11. En particulier, δ0
est une mesure de masse totale un, qui ne charge que l’origine, ce que l’on peut
résumer par δ0 (Rd ) = δ0 ({0}) = 1. Dans cette situation, le calcul correct est
−∆(f ?Φ) = f ?(−∆Φ) = f ?δ0 = f , la masse de Dirac étant l’élément unité
du produit de convolution. La démonstration du théorème précédent signifie
exactement que la famille (−∆Φε ) est une approximation de l’identité.
Remarque 2.2.3 On obtient plus de régularité sur u si l’on suppose plus de
régularité sur f . Par exemple si f est de classe C k , à support compact, on
obtient que u est aussi de classe C k , k ≥ 2. On peut largement affaiblir les
hypothèses sur f et vérifier que u défini par la formule (2.10) est encore solution
de (2.2) en un certain sens.
Exercice 2.2.4 Cet exercice concerne la question de l’unicité d’une solution au
sens du théorème 2.2.1.
Soit v une fonction de classe C 2 sur Rd tendant vers 0 à l’infini et telle que
∆v = 0. On veut montrer que v est identiquement nulle.
(a) Soit ε > 0. Montrer que la fonction vε (x) := v(x) + ε|x|2 n’a pas de
maximum local.
(b) En déduire que pour tout R > 0, on a sup|x|≤R vε (x) = sup|x|=R vε (x).
(c) En déduire que sup|x|≤R v(x) = sup|x|=R v(x) et conclure. (En fait, même
dans l’espace très grand des distributions tempérées, ∆v = 0 sur Rd implique
que u est un polynôme. Voir par exemple [GO].)
(d) Compléter le théorème 2.2.1 d’un résultat d’unicité.
Exercice 2.2.5 Équation de Laplace sur le demi-espace. On note Rd+ =
{(x1 , . . . , xd ) | xd ≥ 0}. Soit g : Rd−1 → R une fonction de classe C 2 à support compact. On veut résoudre l’équation de Poisson sur le demi-espace avec
condition de Dirichlet g sur le bord ∂Rd+ = Rd−1 , c’est-à-dire le problème
suivant :
1. u ∈ C 2 (Rd+ ),
2. ∆u = 0 dans Rd+ ,
3.
lim
x→(y,0), xd >0
u(x) = g(y) pour tout y ∈ Rd−1 .
Pour tout x ∈ Rd , on note x̃ = (x1 , . . . , xd−1 , −xd ).
29
2.2. Résolution de l’équation de Poisson
(a) On pose G(x, y) = Φ(y − x) − Φ(y − x̃), où Φ est comme précédemment la
solution fondamentale de l’équation de Laplace sur Rd . Montrer que
∂G
2 xd
(x, y) =
.
∂yd
d ρ(d)|x − y|d
On pose K(x, y) =
∂G
(x, y).
∂yd
(b) Montrer que pour tout y ∈ Rd−1 , l’application x 7→ K(x, y) est harmonique
sur Rd , c’est-à-dire ∆x K = 0.
R
(c) On pose u(x) = Rd−1 K(x, y)g(y)dy. Montrer que
que ∆u = 0 sur Rd+ .
R
Rd−1
K(x, y)dy = 1, puis
(d) Montrer que u résout le problème.
Exercice 2.2.6 Équation de Poisson dans la boule unité B = BRd (0, 1). Soit g
une fonction de classe C 2 définie sur la sphère S = ∂B. On cherche à résoudre
l’équation de Laplace sur la boule unité avec condition de Dirichlet g sur le
bord :
1. u ∈ C 2 (B),
2. ∆u = 0 dans B,
3.
lim
x→y, x∈B
u(x) = g(y) pour tout y ∈ S.
Pour tout x ∈ Rd , on note x̃ = x/|x|2 , l’inversion de x par rapport à S.
(a) On pose G(x, y) = Φ(y − x) − Φ(|x|(y − x̃)). Montrer que pour tout y ∈ S,
d
X
1 − |x|2
∂G
∂G
(x, y) :=
yj
(x, y) =
.
−
∂ν
∂yj
dρ(d)|x − y|d
j=1
On pose K(x, y) = − ∂G
(x, y).
∂ν
R
(b) On pose u(x) = S K(x, y)g(y)dy. En s’inspirant de l’exercice précédent,
montrer que u résout le problème.
Chapitre 3
Séries de Fourier et applications
Le lecteur connaît déjà en partie la théorie des séries de Fourier, notamment
dans ses aspects calculatoires. Nous insisterons sur la convergence en moyenne
quadratique de ces séries, dont la théorie est simple et correspond bien aux
besoins de la physique. Pour les autres notions de convergence, les résultats
sont moins complets : par exemple, il n’existe pas de bonne caractérisation des
fonctions dont la série de Fourier converge uniformément ou en moyenne. Nous
nous bornerons à énoncer quelques conditions suffisantes de convergence.
Le cas des fonctions périodiques de plusieurs variables sur des réseaux quelconques, important notamment en physique du solide, est étudié dans la section 3.4.
Nous commençons par rappeler la méthode de séparation des variables appliquées à la résolution de l’équation de la chaleur pour motiver l’introduction
des séries de Fourier.
3.1
Méthode de séparation des variables
La méthode de séparation des variables consiste en chercher des solutions
d’équations aux dérivées partielles sous la forme de combinaisons particulières
de fonctions d’un nombre plus réduit de variables. On s’intéresse à l’équation
de la chaleur sur l’intervalle [0, 2π]
(
∂t u − ∂x2 u = 0
u(t = 0) = g
dans [0, ∞[×]0, 2π[,
sur [0, 2π],
(3.1)
la fonction inconnue u(t, x) étant une fonction à valeur réelle de deux variables :
t, appelée variable de temps et x, appelée variable d’espace.
32
Chapitre 3. Séries de Fourier et applications
L’équation étant posée sur un intervalle, il convient de la compléter par des
conditions aux limites, c’est-à-dire des conditions aux bords de l’intervalle. Ces
conditions aux limites doivent être soigneusement dosées (ni trop de conditions,
ni trop peu) pour obtenir une solution et une seule. Par exemple, les conditions
aux limites suivantes assurent que l’équation est bien posée :
Conditions de Dirichlet : u(t, 0) = u(t, 2π) = 0.
Conditions de Neumann : ∂x u(t, 0) = ∂x u(t, 2π) = 0.
Conditions périodiques : u(t, 0) = u(t, 2π), ∂x u(t, 0) = ∂x u(t, 2π).
Conditions mixtes : par exemple, ∂x u(t, 0) = 0 et u(t, 2π) = 0.
Pour l’instant, on choisit de compléter l’équation par des conditions périodiques, et on laisse libre la donnée initiale :
∂t u − ∂x2 u = 0,
u(t, 0) = u(t, 2π),


∂x u(t, 0) = ∂x u(t, 2π) = 0,



dans [0, ∞[×]0, 2π[,
sur [0, ∞[,
sur [0, ∞[.
(3.2)
On cherche une solution de (3.2) ayant la forme suivante :
u(t, x) = v(t)w(x),
d’où ∂t u(t, x) = v 0 (t)w(x), ∂x2 u(t, x) = v(t)w00 (x), et l’équation est équivalente
à v 0 (t)w(x) = v(t)w00 (x). Lorsque w(x) et v(t) ne s’annulent pas, on a
w00 (x)
v 0 (t)
=
.
v(t)
w(x)
Les deux variables x et t étant indépendantes, on en déduit qu’il existe µ ∈ R
telle que
v 0 = µv,
w00 = µw;
on vient donc de ramener l’EDP à deux équations différentielles ordinaires.
Par l’équation de v, on obtient bien sûr v(t) = aeµt , pour une constante a.
On peut choisir a = 1 en reportant le choix d’une constante multiplicative sur
la fonction w(x). On fixe donc
v(t) = eµt .
On s’intéresse maintenant à l’équation de w. En tenant en compte les conditions aux limites en x, on obtient pour w(x) :
w00 = µw,
w(0) = w(2π),

 0
w (0) = w0 (2π).



Distinguons les différentes possibilités selon le signe de µ :
(3.3)
33
3.2. Séries de Fourier en dimension un d’espace
√
√
µ > 0 : w(x) = a1 e µx + a2 e− µx , mais ce type de solution ne convient pas
aux conditions aux limites.
µ = 0 : w(x) = a1 x + a2 , mais un tel choix ne convient que si w(x) = a2 .
√
√
µ < 0 : w(x) = a1 ei −µx + a2 e−i −µx . Une telle fonction vérifie les conditions
√
aux limites si −µ = k ∈ N, et donc
2
w(x) = a1 eikx + a2 e−ikx ,
v(t) = e−k t .
On vient de trouver une famille de solutions
2
2
u(t, x) = v(t)w(x) = a1 eikx−k t + a2 e−ikx−k t ,
correspondant aux données initiales du type :
u(0, x) = a1 eikx + a2 e−ikx .
L’équation étant linéaire, on peut ajouter des solutions pour former d’autres
solutions. On sait donc trouver une solution de l’équation de la chaleur pour
toute donnée initiale polynôme trigonométrique.
De là vient une question naturelle. Est-ce que toute donnée initiale g :
[0, 2π] → R (ou C) peut être décomposée sous la forme d’une somme infinie
(une série) de telles fonctions trigonométriques
g(x) =
X
ck eikx ,
ck ∈ C ?
k∈Z
Dans cette situation, on pourrait résoudre formellement l’équation de la chaleur
en posant
X
2
u(t, x) =
ck eikx−k t .
k∈Z
3.2
a
Séries de Fourier en dimension un d’espace
Convergence en moyenne quadratique
Il y a en fait deux points de vue qui se ramènent facilement l’un à l’autre.
On peut considérer des fonctions périodiques sur R et chercher à les écrire
sur toute la droite réelle comme somme d’une série de Fourier. On peut aussi
considérer des fonctions f définies uniquement sur un intervalle, et chercher
une série de Fourier dont la somme soit égale à f sur cet intervalle.
34
Chapitre 3. Séries de Fourier et applications
On se donne T > 0 et on pose ω = 2π/T . Il sera commode de normaliser
le produit scalaire de l’espace L2 ([a, a + T ]) en posant
(f | g) =
Z a+T
f (x)g(x) dx/T ,
(3.4)
a
de telle sorte que la fonction constante 1 ait une norme égale à 1.
L’espace L2T désigne l’espace des fonctions T -périodiques (c’est-à-dire vérifiant f (x + T ) = f (x)), dont la restriction à [0, T ] est de carré sommable.
On munit L2T du produit scalaire (3.4), le résultat ne dépendant pas de a, en
convenant toujours que deux fonctions égales presque partout sont égales. La
convergence pour cette norme est donc la convergence en moyenne quadratique
sur tout intervalle.
L’espace L2T est ainsi un espace de Hilbert, isométrique à L2 ([0, T ]) et tout
résultat sur l’un de ces espaces se transforme immédiatement en un résultat
sur l’autre.
Théorème 3.2.1 Les fonctions ek (x) = eikωx , k ∈ Z forment une base hilbertienne de L2 ([0, T ]).
Il est très facile de prouver le caractère orthonormal de cet ensemble : on a
(ej | ek ) =
Z T
e
i(k−j)ωx
dx/T =
Z 2π
0
0
ei(k−j)s ds/(ωT ) = δjk .
Le fait que les ej forment un système total résulte du fait que les fonctions
continues sur [0, T ] sont denses dans L2 ([0, T ]) (théorème B.6.13) et du théorème de Stone-Weierstrass. Etant donné f ∈ L2 ([0, T ]), nous allons construire
une suite fj de polynômes trigonométriques (c’est-à-dire de combinaisons linéaires des ej ) qui converge vers f en moyenne quadratique.
L’espace L2 ([0, T ]) coïncide avec l’espace des fonctions de carré sommable
sur l’ouvert ]0, T [ (les deux points sont de mesure nulle) et, d’après le théorème B.6.13 (ii), on peut trouver une fonction gj continue et à support compact
dans ]0, T [ telle que kf − gj k2 ≤ 1/j. On a en particulier gj (0) = gj (T ) = 0.
En appliquant le résultat de l’exemple A.2.18 (après changement de variable x → ωx), on peut trouver un polynôme trigonométrique fj tel que
kgj − fj k∞ ≤ 1/j. On a
kgj − fj k22 =
Z T
0
|gj − fj |2 dx/T ≤ 1/j 2 ,
et donc kf − fj k2 ≤ 1/j + 1/j = 2/j. La suite de polynômes trigonométriques
fj converge vers f en moyenne quadratique sur [0, T ], ce qui achève la démonstration.
35
3.2. Séries de Fourier en dimension un d’espace
Il suffit maintenant d’expliciter dans ce cas particulier le théorème A.3.20
relatif aux bases hilbertiennes pour obtenir le résultat suivant.
Théorème 3.2.2
(a) Tout élément f ∈ L2 ([0, T ]) peut se décomposer de façon unique sous la
forme
X
f=
ck (f )eikωx ,
k∈Z
la série convergeant en moyenne quadratique sur [0, T ]. Les composantes ck (f )
sont données par
ck (f ) = (ek | f ) =
Z T
e−ikωx f (x) dx/T ,
(3.5)
0
et vérifient
Z T
0
|f (x)|2 dx/T =
X
|ck (f )|2
(Bessel-Parseval) .
k∈Z
(b) Réciproquement, étant donnés des scalaires γk vérifiant k∈Z |γk |2 < ∞,
P
la série γk eikωx converge en moyenne quadratique sur tout intervalle borné
vers une fonction f ∈ L2T telle que l’on ait ck (f ) = γk .
P
Ce théorème caractérise complètement les fonctions de carré sommable en
termes de leur séries de Fourier. Il ne fournit toutefois que la convergence
en moyenne quadratique, et ne dit rien sur la convergence ponctuelle. Un
théorème considérablement plus difficile (L. Carleson, 1965) assure que les
P
ikωx
sommes partielles symétriques K
de la série de Fourier d’une fonc−K ck e
2
tion f ∈ L ([0, T ]) convergent presque partout vers f .
b
Propriétés élémentaires des coefficients de Fourier
L’intégrale d’une fonction T -périodique sur
un intervalle [a, a+T ] ne dépend
R a+T
2
pas de a. Pour f ∈ LT , on a donc ck (f ) = a f (t)e−ikωt dt/T quel que soit
a ∈ R. Lorsque f possède des propriétés de symétrie, il est plus efficace de
choisir [−T /2, T /2] comme domaine d’intégration. Le lecteur n’aura aucun
mal à vérifier les propriétés suivantes.
(i) Si f est à valeurs réelle, les ck possèdent la symétrie hermitienne : c−k =ck .
(ii) Si f possède la symétrie hermitienne (f (−x) = f (x)), les ck sont réels.
(iii) Si f est paire (resp. impaire), les ck sont pairs, c’est-à-dire ck = c−k (resp.
impairs).
36
Chapitre 3. Séries de Fourier et applications
(iv) Si f est réelle et paire, les ck sont réels et pairs.
On utilise aussi la forme trigonométrique suivante pour la série de Fourier
de f ∈ L2T :
f (x) = a0 /2 +
∞
X
ak cos kωx + bk sin kωx ,
(3.6)
k=1
avec
ak =ck +c−k =2
Z T
0
f (x) cos kωx dx/T, bk =i(ck −c−k )=2
Z T
f (x) sin kωx dx/T,
0
qui est surtout intéressante lorsque f est réelle (les ak et bk sont réels) ou possède des propriétés de parité (séries de sinus ou de cosinus). On peut
√d’ailleurs
obtenir
√ directement ces formules en remarquant que les fonctions 1, 2 cos kωx
et 2 sin kωx, p ≥ 1, forment une base hilbertienne de L2 ([0, T ]) et en appliquant à cette base le théorème A.3.20.
3.2.3 Développements en demi-période On se donne f ∈ L2 ([0, T ]), et
on pose cette fois ω = π/T . Les séries de Fourier en eikωx permettent alors
de développer toutes les fonctions de carré sommable sur l’intervalle [−T, T ].
Parmi celles-ci, figurent la fonction f1 qui est paire et coïncide avec f sur [0, T ]
(sauf peut-être en 0, qui est de mesure nulle), et la fonction f2 qui est impaire
et coïncide avec f sur [0, T ].
La fonction paire f1 a une série de Fourier qui, mise sous forme trigonométrique, ne contient que des cosinus et qui converge vers f1 en moyenne
quadratique sur [−T, T ]. Elle converge donc vers f en moyenne quadratique
sur [0, T ] et on a
f = a0 /2 +
∞
X
ak cos kωx dans L2 ([0, T ]) ,
ω = π/T ,
k=1
où les coefficients forment une suite de carré sommable.
Le raisonnement est le même pour f2 et on obtient donc un autre développement de la même fonction f :
f=
∞
X
bk sin kωx dans L2 ([0, T ]) ,
ω = π/T .
k=1
3.2.4 Pour ne pas se tromper.
On peut hésiter sur la normalisation (dx/T ou dx/2T ?) des espaces L2 , sur
la présence du coefficient 2, . . . si on suit l’argument précédent ; le mieux est
de revenir au théorème fondamental sur les bases hilbertiennes. On considère
3.2. Séries de Fourier en dimension un d’espace
37
l’espace L2 ([0, T ]) en choisissant n’importe quelle normalisation (par exemple
en ne normalisant pas et en intégrant simplement en dx), cela ne changera
pas le résultat. Les fonctions 1 et cos kωx forment un système orthogonal, cela
résulte de ce qui précède mais est facile à vérifier. Ce système est total : nous
venons de voir en développant f1 que c’est une conséquence de la théorie des
séries de Fourier 2T -périodiques.
Il reste donc uniquement à calculer la norme αk de ces fonctions pour la
norme choisie (attention, α0 a une fâcheuse tendance à être plus grand que les
autres), à prendre αk−1 cos kωt comme base hilbertienne, et à écrireRle théorème
fondamental. Par exemple,
avec le produit scalaire non normalisé 0T f g dx, on
q
√
a α0 = T , αk = T /2 pour k 6= 0 et
f (x) =
∞
X
0
!
1
1 ZT
f (x) cos kωx dx
cos kωx dans L2 [0, T ] , ω = π/T ,
αk 0
αk
On faitqde même pour le développement en sinus, où la norme des sin pωx
vaut β = T /2 pour le même produit scalaire. On a
f (x) =
∞
X
1
!
1
1ZT
f (x) sin kωx dx
sin kωx dans L2 [0, T ] , ω = π/T ,
β 0
β
3.2.5 Développements en quart de période ROn considère toujours
L2 ([0, T ]), avec son produit scalaire non normalisé 0T f g dx mais on pose
ω = π/(2T ). Le lecteur pourra compléter, à titre d’exercice, les indications
qui vont suivre.
3.2.6 Développements en cosinus pairs Montrer que les fonctions ϕk (t) =
cos 2kωx forment un système orthogonal, et calculer leur norme (attention
pour k = 0).
Montrer que le système formé par ces fonctions est total. Pour f ∈
L2 ([0, T ]), on construira une fonction g ∈ L2 ([−2T, 2T ]) de la manière suivante


pour 0 < x < T
 f (x)
g(x) = f (2T − x) pour T < x < 2T


g(−x)
pour −2T < x < 0 .
On montrera que le développement en série de Fourier de g ne contient que
des cosinus pairs, et on en déduira que les combinaisons linéaires des ϕk sont
denses dans L2 ([0, T ]).
Montrer que tout f ∈ L2 ([0, T ]) s’écrit comme γk ϕk , la série convergeant en moyenne quadratique, et donner la formule permettant de calculer
les coefficients.
P
38
Chapitre 3. Séries de Fourier et applications
3.2.7 Développements en cosinus impairs Même question en posant ϕk (x)=
cos((2k+1)ωx). On utilisera la fonction
g(x) =


 f (x)
pour 0 < x < T
−f (2T − x) pour T < x < 2T


g(−x)
pour −2T < x < 0 .
3.2.8 Développements en sinus pairs
sin(2kωx). On utilisera la fonction
Même question en posant ϕk (x) =


 f (x)
pour 0 < x < T
g(x) =  f (2T − x) pour T < x < 2T

−g(−x)
pour −2T < x < 0 .
3.2.9 Développements en sinus impairs
sin((2k+1)ωx). On utilisera la fonction
g(x) =
c
Même question en posant ϕk (x) =


 f (x)
pour 0 < x < T
−f (2T − x) pour T < x < 2T


−g(−x)
pour −2T < x < 0 .
Autres résultats de convergence
Les formules (3.5) définissant les coefficients de Fourier ck (f ) ont un sens
dès que la fonction f appartient à l’espace L1T des fonctions T -périodiques
sommables sur [0, T ]. On a L2T ⊂ L1T . Deux types de question se posent.
D’une part, pour une fonction f qui appartiennent à L2T et qui possède des
propriétés de régularité supplémentaire, peut-on dire que sa série de Fourier
converge vers f pour d’autres notions de convergence que la convergence en
moyenne quadratique ? D’autre part, si f appartient à L1T mais pas à L2T ,
existe-t-il une notion de convergence pour laquelle la série de Fourier converge
vers f ?
Le résultat suivant, qui a son intérêt propre, fournira une condition suffisante, mais très loin d’être nécessaire, pour que la série de Fourier de f converge
uniformément vers f .
Théorème 3.2.10 (i) Soit f une fonction T -périodique de classe C p . On a
alors
p ck ddtpf = (ikω)p ck (f ) .
Il existe une constante C telle que l’on ait |ck (f )| ≤ C/ |k|p pour k 6= 0.
(ii) Si f est de classe C 2 , sa série de Fourier converge vers f uniformément.
3.2. Séries de Fourier en dimension un d’espace
39
Si f est T -périodique et de classe C 1 , on a ck (f 0 ) = T1 0T f 0 (x)e−ikωx dx. En
intégrant par parties, leR terme tout intégré étant nul du fait de la périodicité, on
obtient ck (f 0 ) = T1 ikω 0T f (x)e−ikωx dx = ikωck (f ). On conclut par récurrence.
Si la fonction f (p) est continue, elle est de carré sommable sur [0, T ], et la
(p)
suite des ck (f
) est de carré sommable et donc bornée. Il existe M > 0 tel
(p)
que ck (f ) ≤ M pour tout k. Pour k 6= 0, on a donc |ck (f )| ≤ M ω −p / |k|p .
R
Si maintenant f est de classe C 2 , on a ck eikωx = |ck | ≤ C/ |k|2 . La
∞
série de Fourier est normalement convergente pour la norme uniforme. Ses
P 2
ikωx
convergent donc uniformément, pour
sommes partielles SK1 ,K2 = K
−K1 ck e
K1 , K2 → ∞ vers une certaine fonction continue g. Il reste à montrer que
f = g.
Sur l’intervalle [0, T ], la convergence uniforme entraîne la convergence en
moyenne quadratique. On a donc SK1 ,K2 → g en moyenne quadratique, tandis
que le fait que f ∈ L2 ([0, T ]) nous assure que SK1 ,K2 → f pour cette même
norme. L’unicité de la limite nous assure que f (x) = g(x) p.p. Il reste à observer que deux fonctions continues égales presque partout sont égales en tout
point, ce qui achève la démonstration.
Nous admettrons le théorème suivant. On rappelle qu’une fonction f définie
sur un intervalle [a, b] est de classe C 1 par morceaux s’il existe un nombre fini
de points de subdivision a = x0 < x1 < . . . < xN = b tels que la fonction f
soit de classe C 1 dans chaque intervalle ouvert ]xj , xj+1 [ et que de plus f (x)
et f 0 (x) possèdent des limites à droite et à gauche lorsque x tend vers l’un des
points de subdivision. Ces limites seront notées f (xj ± 0) et f 0 (xj ± 0).
On dit qu’une fonction T -périodique est de classe C 1 par morceaux si elle
l’est sur l’intervalle [0, T ] ; elle l’est alors sur tout intervalle borné [a, b]. Une
telle fonction est bornée et donc dans L2T .
Théorème 3.2.11 Soit f une fonction T -périodique de classe C 1 par morceaux, et soient ck ses coefficients de Fourier.
(i) En tout point x où f est continue, les sommes partielles symétriques
P
ikωx
SK (x) = K
convergent vers f (x).
−K ck e
(ii) En un point x où la fonction f est discontinue, les SK (x) convergent vers
(f (x+0)+f (x−0))/2.
(iii) Soit [a, b] un intervalle tel que f soit continue en tout point de [a, b]. Alors
SK converge vers f uniformément sur [a, b].
On fera attention à l’hypothèse de (iii) : on demande non seulement que la
restriction de f à [a, b] soit continue, mais encore que f soit continue à gauche
en a et à droite en b.
40
Chapitre 3. Séries de Fourier et applications
Le théorème n’est valable que pour les sommes partielles symétriques. Ce
type de sommation, harmonique par harmonique, est par ailleurs physiquement
très raisonnable. C’est lui que l’on adopte naturellement lorsque la série de
Fourier est mise sous forme trigonométrique (3.6).
Les conclusions du théorème précédent sont valables en remplaçant l’hypothèse “f de
classe C 1 par morceaux” par l’hypothèse plus faible “f à variation bornée”, ce qui signifie
que f est différence de deux fonctions croissantes. Cette hypothèse assure que les limites à
droite et à gauche f (x ± 0) existent en tout point, ce qui donne un sens au reste de l’énoncé.
Si l’on sait seulement que f est continue, on n’a en général ni convergence
uniforme, ni même convergence simple : il existe une fonction continue telle que
sa série de Fourier diverge en tout point d’un ensemble infini non dénombrable.
Venons-en au cas des fonctions appartenant à L1 ([0, T ]). On a le résultat
suivant sur les coefficients de Fourier.
Théorème 3.2.12 (Riemann-Lebesgue)
Soit f ∈ L1T . Les coefficients
R T −ikx
f (x) dx/T vérifient |ck (f )| ≤
de Fourier de f , définis par ck (f )= 0 e
RT
|f
(x)|
dx/T
.
De
plus
c
(f
)
tend
vers
0
pour
|k| → ∞.
k
0
La majoration en module de l’intégrale est immédiate, mais le fait que la suite
ck (f ) tende vers 0 est un peu plus délicat. Nous renvoyons à la démonstration
(quasiment identique) du théorème correspondant relatif à la transformation
de Fourier (théorème 4.1.1).
Des optimistes pourraient espérer dans ce cas une convergence en moyenne
ou presque partout de la série de Fourier. Il n’en est rien et la situation peut
sembler catastrophique, puisqu’il existe f ∈ L1T dont la série de Fourier diverge
en tout point. Il faut faire appel à une notion de convergence que nous n’avons
pas encore rencontrée pour obtenir un résultat satisfaisant.
Définition 3.2.13 Soient (fj ) et f des fonctions localement sommables sur
R. On dit que fj tend vers f au sens des distributions si, pour toute fonction
ϕ de classe C ∞ et à support compact, on a
Z
R
fj (t)ϕ(t) dt −→
Z
j→∞ R
f (t)ϕ(t) dt .
Si on compare cette notion à la convergence simple, au lieu de demander la
convergence des valeurs ponctuelles, on demande la convergence des “moyennes
pondérées par ϕ”.
On a encore unicité de la limite : si fj → f et fj → g au sens des distributions, alors f (t) = g(t) p.p. Nous admettrons le résultat suivant.
41
3.2. Séries de Fourier en dimension un d’espace
Théorème 3.2.14 Soient f appartenant à L1T et ck ses coefficients de Fourier.
P 2
ikωx
convergent vers f au sens
Alors les sommes partielles SK1 ,K2 = K
−K1 ck e
des distributions lorsque K1 et K2 tendent vers l’infini.
d
Espaces de Sobolev HTs
Comme précédemment, pour f ∈ L2T , on note (ck (f ))k∈Z les coefficients
de Fourier de f . Il est facile de vérifier que l’espace suivant (appelé espace de
Sobolev)


HT1 = f ∈ L2T ; kf k2H 1 =
T
muni du produit scalaire (f |g)H 1 =
Hilbert. En effet, l’espace


X
k∈Z


(1 + k 2 )|ck (f )|2 < +∞ ,
P
k∈Z (1
h1 (C) = γ = (γk )k∈Z ;
X
+ k 2 )ck (f )ck (g) est un espace de


(1 + k 2 )|γk |2 < +∞
k∈Z
muni du produit scalaire (γ|θ) = k∈Z (1 + k 2 )γk θk est un espace de Hilbert.
D’autre part, la restriction de l’isomorphisme f ∈ L2T 7→ (ck (f ))k∈Z ∈ `2 (C) à
HT1 est un isomorphisme isométrique de HT1 dans h1 (C).
P
Nous allons maintenant montrer une version d’un résultat classique appelé
théorème de Rellich.
Théorème 3.2.15 Soit (fn )n∈N une suite bornée de HT1 . Il existe une soussuite (fϕ(n) ) de (fn )n∈N et f ∈ HT1 tels que
lim kfϕ(n) − f kL2T = 0
n→+∞
Nous utilisons dans cette démonstration la notion de convergence faible dans les
espaces de Hilbert introduite de façon générale dans l’appendice A.3.d. D’après
le résultat de l’exercice A.3.28, il existe une sous-suite (fϕ(n) ) de (fn )n∈N et f ∈
HT1 tels que (fϕ(n) ) converge faiblement vers f dans HT1 . On pose gn = fϕ(n) −f
de sorte que la suite (gn ) est bornée et converge faiblement vers 0 dans HT1 .
En particulier, pour tout k, (ek , gn ) = ck (gn ) → 0. Pour K ≥ 1, on écrit
kgn k2L2 =
T
X
k∈Z
|ck (gn )|2 =
X
|k|≤K
|ck (gn )|2 +
X
|k|>K
|ck (gn )|2 .
42
Chapitre 3. Séries de Fourier et applications
Soit ε > 0. Pour K > 0 assez grand, on a
X
|ck (gn )|2 ≤
|k|>K
X
1
C
(1 + k 2 )|ck (gn )|2 ≤
≤ ε.
2
1 + K |k|>K
1 + K2
Un tel K étant fixé, pour n assez grand, on a
limn→+∞ kgn k2L2 = 0.
P
|k|≤K
|ck (gn )|2 ≤ ε. Donc
T
3.2.16 Espaces HTs Plus généralement, on définit pour s ≥ 1,
HTs =



f ∈ L2T ; kf k2HTs =
muni du produit scalaire (f |g)H s =
X


(1 + k 2 )s |ck (f )|2 < +∞

k∈Z
P
k∈Z (1
+ k 2 )s ck (f )ck (g).
Exercice 3.2.17 Montrer que pour s ≥ p + 1, où p ≥ 0, une fonction de HTs
est de classe C p . On pourra utiliser l’estimation suivante
!1
!1
2
X
|k|p |ck (f )| ≤
k
3.3
X
|k|2s |ck (f )|2
k
2
X
|k|2(p−s)
k
Application à l’équation de la chaleur
Nous terminons maintenant la résolution de l’équation de la chaleur commencée à la section 3.1. On considère le problème
∂t u − ∂x2 u = 0,
u(t, 0) = u(t, 2π),

∂x u(t, 0) = ∂x u(t, 2π),



u(t = 0) = g,





dans [0, ∞[×]0, 2π[,
pour t > 0,
pour t > 0,
sur ]0, 2π[.
(3.7)
On suppose “seulement” que g ∈ L2 ([0, 2π]). D’après le théorème 3.2.2, on a
g(x) =
X
ck eikx ,
au sens de L2 .
k∈Z
et les calculs formels effectués à la section 3.1 nous conduisent à poser pour
t > 0,
X
2
u(t, x) =
ck eikx−k t .
(3.8)
k∈Z
Alors u(t, x) est bien solution du problème (3.7) au sens du théorème suivant.
43
3.3. Application à l’équation de la chaleur
Théorème 3.3.1 (a) Régularité et équation de u : la série (3.8) définit
une fonction u(t, x) de classe C ∞ (]0, +∞[×R) vérifiant ∂t u − ∂x2 u = 0 sur
]0, +∞[×R.
(b) Condition de périodicité : pour tout t > 0, x ∈ R, u(t, x) = u(t, x + 2π) et
∂x u(t, x) = ∂x u(t, x + 2π).
(c) Donnée initiale :
lim ku(t, .) − gkL2 (]0,1[) = 0.
(3.9)
t→0,t>0
2
D’abord, on observe que pour t > 0, |ck ei kx−k t | ≤ |ck | et donc la série (3.8)
est bien définie dans L2 .
2
2
Soit τ > 0. Pour (t, x) ∈ [τ, +∞[×R, on a |ck ei k·x−k t | ≤ |ck |e−k τ et
donc la série converge normalement sur [τ, +∞[×R. Finalement, pour tout p, q
2
2
entiers, on a |∂tp ∂xq (ck ei k·x−k t )| ≤ |ck ||k|q+2p e−k τ et donc la série des dérivées
∂tp ∂xq pour tout p, q converge normalement sur [τ, +∞[×R. Ceci implique que
u ∈ C ∞ (]0, +∞[×R).
En dérivant terme à terme, on voit que u(t, x) vérifie bien l’équation de
la chaleur. La fonction obtenue en sommant la série est bien périodique. Finalement, vérifions le sens à donner à la condition initiale. Bien sûr, on peut
observer en prenant t = 0 dans la définition de u(t, x) que l’on obtient la série
correspondant à g. Mais nous ne savons pas encore par les arguments précédents si t 7→ u(t) est continue en t = 0+ à valeurs dans L2 . Il faut le vérifier
par un calcul de limite explicite. On écrit
g(x) − u(t, x) =
X
ck ei kx 1 − e−k
2t
|k|>K
+
X
ck ei kx 1 − e−k
2t
=I +J
|k|≤K
Soit ε > 0. Comme k |ck |2 < ∞, il existe K = K(ε) > 0 tel que
P
1
2
k | ≤ 2 ε. Le premier terme se contrôle alors de la façon suivante
|k|>K |cP
kIk2L2 ≤ k|>K |ck |2 ≤ 12 ε.
P
La valeur de K est maintenant fixée. Comme e−k
pour tout k, il existe τ tel que si t ∈ (0, τ ), alors
kJk2L2 ≤
X
|k|≤K
|ck |2 1 − e−k
2t
2
2t
→ 1 lorsque t → 0+
1
≤ ε.
2
En définitive, pour tout ε > 0, il existe τ > 0 tel que si t ∈ (0, τ ) alors
kg − u(t)k2L2 ≤ ε.
44
Chapitre 3. Séries de Fourier et applications
3.3.2 Effet régularisant Pour t > 0, la fonction u(t, x) est de classe C ∞
alors que la donnée initiale est seulement dans L2 . Ceci traduit le fort effet
régularisant de l’équation de la chaleur par rapport à la donnée initiale. Cet
effet régularisant va de pair avec le fait que l’équation de la chaleur est mal
posée de façon rétrograde, c’est-à-dire si l’on inverse le sens du temps.
Exercice 3.3.3 Résoudre l’équation de la chaleur posée sur l’intervalle [0, 2π]
avec d’autres conditions aux limites (Dirichlet, Neumann homogène) en utilisant les développements en demi et quart de période introduits aux n◦ 3.2.3 et
n◦ 3.2.5.
Exercice 3.3.4 On considère le problème suivant (équation des ondes)
∂t2 u − ∂x2 u = 0,
u(t, x) = u(t, 2π + x),


u(0, x) = g, ∂t u(0, x) = h,



pour t > 0, x ∈ R,
pour t > 0, x ∈ R,
pour x ∈ R.
(3.10)
On choisit g ∈ C 4 (R) et h ∈ C 3 (R), 2π–périodiques sur R.
(a) Chercher une solution de classe C 2 en t et x de la forme
u(t, x) =
X
n≥0
an (t) cos nx +
X
bn (t) sin nx.
n≥1
(b) A quelle condition la solution trouvée est-elle bornée (en temps) ?
(c) Pourquoi a-t-on choisit des hypothèses de régularité C 4 sur g et C 3 sur
s
(voir
h ? Donner des hypothèses suffisantes sur g et h en termes d’espaces H2π
2
o
n 3.2.16) pour obtenir une solution u de classe C en t et x.
Exercice 3.3.5 (Contrôle de l’équation des ondes) On considère une équation
des ondes qui modélise le comportement d’une corde vibrante fixe à une extrémité et commandée à l’autre extrémité. Le but est d’arrêter les oscillations.
Le problème s’écrit
∂t2 w − ∂x2 w = 0,
sur ]0, +∞[×]0, 1[,
w(t, 0) = 0, w(t, 1) = p(t),
pour tout t ∈ [0, +∞[,


w(0, x) = g(x), ∂t w(0, x) = h(x), pour tout x ∈]0, 1[



où les fonctions g et h, de classe C 4 , sont données et où l’on cherche le contrôle
t 7→ p(t) pour avoir
pour tout x ∈]0, 1[, w(4, x) = ∂t w(4, x) = 0.
(3.11)
3.3. Application à l’équation de la chaleur
45
Pour simplifier, on suppose
p(0) = p0 (0) = 0 ainsi que p(4) = p0 (4) = 0.
(3.12)
1. Préliminaires :
1.a. Soit q une fonction continue sur R et α > 0. Montrer que la solution de
l’équation différentielle
b00 + α2 b = q,
b(0) = b0 ,
b0 (0) = b̃0 .
s’écrit
b̃0
1Zt
sin(α(t − s))q(s)ds.
b(t) = b0 cos αt + sin αt +
α
α 0
1.b. Décomposer la fonction x 7→ x en série de sinus sur l’intervalle [0, 1],
c’est-à-dire trouver les coefficients (βk )k≥1 tels que pour x ∈ [0, 1[,
x=
∞
X
βk sin(kπx).
k=1
2. Poser u(t, x) = w(t, x) − xp(t) et déterminer l’équation vérifiée par u(t, x)
en supposant p de classe C 2 sur [0, 1].
3. Chercher une solution de l’équation de u sous la forme u(t, x) =
P∞
k=1 bk (t) sin(kπx) et donner l’équation de bk . En déduire l’expression de bk (t)
et b0k (t) en fonction de p et des coefficients de Fourier en séries de sinus des
fonctions g et h.
4. Montrer que (3.11) impose que les quantités suivantes
Z 4
00
p (t) cos(kπt)dt,
Z 4
p00 (t) sin(kπt)dt
0
0
prennent des valeurs à préciser en fonction des coefficients de Fourier de g et
de h.
5. On choisit g(x) = sin(πx) et h(x) = 0. Trouver une fonction p solution du
problème sous la forme
π
p(t) = δ sin(πt) + γ sin
t
2
où δ et γ sont à déterminer.
46
3.4
Chapitre 3. Séries de Fourier et applications
Autres bases hilbertiennes classiques de L2
3.4.1 Polynômes de Legendre. On se donne un intervalle borné [a, b] et
on considère l’espace de Hilbert L2 ([a, b]). Montrons d’abord que l’espace des
polynômes est partout dense. D’après le théorème B.6.13, l’espace des fonctions
continues est partout dense. Un élément f ∈ L2 étant donné, on peut trouver
une suite (fj ) de fonctions continues dans [a, b] telles que kf − fj k2 → 0.
D’après le théorème de Stone-Weierstrass (voir l’exemple A.2.14), on peut
pour chaque f√
j trouver un polynôme Pj tel que kfj − Pj k∞ ≤ 1/j. On a donc
kfj − Pj k2 ≤ b−a/j. On a enfin
kf − Pj k2 ≤ kf − fj k2 +
√
b−a/j −→ 0 ,
j→∞
ce qui achève de montrer la densité des polynômes.
La suite des polynômes 1, x, x2 , x3 , . . . constitue donc un système total,
et le procédé d’orthonormalisation de Schmidt permettrait de construire une
base orthonormale (Pk ), k = 0, 1 . . . de L2 ([a, b]) telle que chaque Pk soit un
polynôme de degré exactement k. Il est plus rapide de procéder comme suit.
k
n
o
d
(x−a)k (x−b)k ,
Exercice 3.4.2 On considère les polynômes Pk (x) = ck dx
k
où les constantes ck > 0 seront choisies ultérieurement.
(a) Montrer que Pk est de degré exactement k et en déduire que l’ensemble
des Pk est total dans L2 ([a, b]).
(b) Montrer que les Pk sont mutuellement orthogonaux (pour k < l, on intégrera k fois par parties dans l’expression intégrale de (Pk | Pl )).
(c) Déterminer les ck pour que la famille des Pk soit une base hilbertienne.
3.4.3 Fonctions d’Hermite. Il s’agit d’une base de L2 (R) qui joue un
rôle important, notamment pour l’étude de la transformation de Fourier ou de
l’oscillateur harmonique.
Nous aurons besoin d’anticiper sur la suite du cours (voir le corollaire 4.1.8)
en admettant le résultat suivant :
Si
f est une fonction sommable dont la transformée de Fourier fb(ξ) =
R −ixξ
e
f (x) dx est identiquement nulle, alors f (x) = 0 p.p.
2
Nous allons d’abord démontrer que les fonctions du type e−x /2 xk , avec
k ∈ N, forment un système total dans L2 (R). D’après
le critère de totalité, il
R
2
suffit de prouver qu’une fonction g ∈ L2 vérifiant e−x /2 xk g(x) dx = 0 pour
3.4. Autres bases hilbertiennes classiques de L2
47
tout k est nécessairement nulle. Considérons la fonction de la variable complexe
ζ définie par
Z
G(ζ) =
e−ixζ e−x
2 /2
g(x) dx .
En appliquant le théorème B.2.16 dans chaque bande définie par |Im ζ| ≤
R, le lecteur montrera facilement que G est holomorphe
dans tout le plan
R
k
k
k −ixζ −x2 /2
complexe. Il démontrera de plus que dR G/dζ (ζ) = (−ix) e
e
g(x) dx.
2
En particulier, dk G/dζ k (0) = (−i)k xk e−x /2 g(x) dx, quantité qui est nulle
sous notre hypothèse.
D’après le théorème C.4.10, la fonction G est identiquement nulle dans tout
le plan complexe, et en particulier pour ζ réel. C’est donc dire que la trans2
formée de Fourier de la fonction sommable x 7→ e−x /2 g(x) est identiquement
nulle. D’après le résultat admis ci-dessus, cette fonction, et donc g elle-même,
sont nulles presque partout.
2
Cela achève la démonstration du fait que le système des xk e−x /2 est total.
Le procédé d’orthonormalisation de Schmidt permettrait d’en déduire une base
hilbertienne. La définition de l’exercice ci-dessous est plus directe. Les Hk
portent le nom de polynômes d’Hermite, et les Ψk celui de fonctions d’Hermite.
2
2
Exercice 3.4.4 (a) Démontrer que l’on a (d/dx)n e−x = (−1)n e−x Hn (x), où
Hn est un polynôme de degré exactement n dont on calculera le terme de plus
haut degré.
(b) On pose
2 /2
Ψn (x) = cn e−x
Hn (x) ,
où cn est une constante qui sera choisie ultérieurement. Montrer que les Ψn
appartiennent à L2 (R) et calculer les produits scalaires (Ψp | Ψq )L2 . On rappelle
R
2
que e−x dx = π 1/2 . On pourra intégrer p fois (ou q fois) par parties.
(c) En déduire que, en posant cn = π −1/4 2−n/2 (n!)−1/2 , les fonctions Ψn , n ∈ N,
forment une base hilbertienne de L2 .
3.4.5 Fonctions de Laguerre.
hilbertienne de L2 ([0, +∞[)
Les fonctions suivantes forment une base
Lk (x) = e−x/2 Lk (x) où Lk (x) =
ex dk −x k e x .
k! dxk
Les démonstrations sont très proches de celles que nous avons vues pour les
fonctions d’Hermite.
48
Chapitre 3. Séries de Fourier et applications
Exercice 3.4.6 (a) Soit g ∈ L2 ([0, ∞[). Montrer que la fonction
G(ζ) =
Z ∞
e−ixζ e−x/2 g(x) dx
0
est holomorphe dans le demi-plan défini par Im ζ < 1/2 et exprimer sous forme
intégrale ses dérivées successives à l’origine.
(b) On suppose que 0∞ e−x/2 xk g(x) dx = 0 pour tout k. Montrer que la
transformée de Fourier de la fonction égale à 0 pour x < 0 et à g(x)e−x/2 pour
x > 0 est identiquement nulle, et en déduire que g(x) = 0 p.p.
R
(c) Démontrer que les Lk sont des polynômes de degré exactement k et déduire
de ce qui précède que les fonctions de Laguerre forment un système total dans
L2 ([0, ∞[).
(d) Calculer les produits scalaires (Lk | Lk0 ) et en déduire que les fonctions de
Laguerre forment une base hilbertienne.
3.5
Séries de Fourier multidimensionnelles
Nous nous plaçons dans le cadre qui pourra être utile au lecteur, notamment
pour l’étude des structures cristallines : les fonctions étudiées sont définies
dans l’espace R3 muni de sa structure euclidienne, mais elles sont périodiques
relativement à un réseau qui peut n’avoir aucune relation spéciale avec la
structure euclidienne. On notera x · y le produit scalaire dans R3 des vecteurs
x et y. Le lecteur n’aura aucun mal à remplacer la dimension 3 par n dans
tout ce qui suit.
Définition 3.5.1 Un sous-ensemble Γ de R3 est appelé un réseau s’il existe
une base (e1 , e2 , e3 ) de R3 telle que les éléments de Γ soient exactement les
vecteurs dont les composantes dans cette base sont entières :
γ = x1 e1 + x2 e2 + x3 e3 ,
x1 , x2 , x3 ∈ Z .
On dit alors que (e1 , e2 , e3 ) est une base du réseau Γ.
On dit qu’une fonction f définie dans R3 est Γ-périodique si on a f (x+γ) =
f (x) pour tout γ ∈ Γ.
Il ne faudrait pas croire que le réseau détermine la base, il y a au contraire un
large choix.
49
3.5. Séries de Fourier multidimensionnelles
Théorème 3.5.2 Soit Γ un réseau et (e1 , e2 , e3 ) une base de celui-ci. Pour
que (f1 , f2 , f3 ) soit aussi une base de Γ, il faut et il suffit que la matrice de
passage P = (pij ) donnée par
fi =
3
X
pij ej
1
ait ses composantes entières et son déterminant égal à ±1.
Si les fi forment une base de Γ, ils appartiennent à Γ et leurs composantes pij
doivent être entières. Pour la même raison, la matrice inverse P −1 qui exprime
les ei en fonction des fj doit avoir ses composantes entières. Les déterminants
de ces deux matrices sont des entiers inverses l’un de l’autre, ce qui impose
une valeur ±1.
Réciproquement, si P a ses composantes entières, tout élément du réseau de
base fj appartient à Γ. Si de plus det P = ±1, la matrice P −1 est au signe près
la transposée de la matrice des cofacteurs et a donc ses composantes entières.
Tout élément de Γ s’écrit comme combinaison linéaire à coefficients entiers des
fj ce qui achève la démonstration.
Etant donné une base (e1 , e2 , e3 ), il existe une unique base (e∗1 , e∗2 , e∗3 ), que
nous appellerons base réciproque 1 , vérifiant ei · e∗j = 2πδij . La construction est
facile : on choisit v 6= 0 orthogonal à e2 et e3 , le produit scalaire λ = e1 · v
est alors non nul et on pose e∗1 = 2πλ−1 v. On procède de même pour les deux
autres vecteurs. On a
x=
3
X
1
xj ej , k =
3
X
kj e∗j =⇒ k · x = 2π
1
3
X
kj xj
(3.13)
1
Théorème et Définition 3.5.3 (réseau réciproque) Soient Γ un réseau
et k ∈ R3 . Les trois propriétés suivantes sont équivalentes.
(a) La fonction x 7→ eik·x est Γ-périodique.
(b) Pour tout γ ∈ Γ, on a k · γ ∈ 2πZ.
(c) Si (ej ) est une base de Γ, les composantes de k dans la base réciproque
(e∗j ) sont des entiers.
On note Γ∗ , et on appelle réseau réciproque de Γ, l’ensemble des k possédant
ces propriétés.
1. Selon les ouvrages, le facteur 2π apparaît ou non dans
On appelle classi
la définition.
quement base duale la base e0j de l’espace dual vérifiant e0j , ek = δjk . Au facteur 2π près,
il s’agit du même concept si on identifie R3 et son dual grâce au produit scalaire.
50
Chapitre 3. Séries de Fourier et applications
On a eik·(x+γ) = eik·γ eik·x . La propriété (a) équivaut donc à dire que eik·γ = 1
pour tout γ ∈ Γ, ce qui est équivalent à la propriété (b).
Supposons (b) vérifiée, soit (ej ) une base de Γ et notons (kj ) les composantes de k dans la base réciproque. Le produit scalaire k · e1 = 2πk1 doit
appartenir à 2πZ ce qui impose k1 ∈ Z. Il en est de même pour les autres
composantes ce qui montre que (b) ⇒ (c).
Réciproquement, si les composantes de k dans la base réciproque sont des
entiers, la formule (3.13) montre que k · γ est le produit de 2π par un entier
pour γ ∈ Γ. Cela achève la démonstration.
Définition 3.5.4 (mailles d’un réseau) Soit Γ un réseau et (ej ) une base
de celui-ci. On appelle maille de Γ pour la base (ej ) un parallélépipède
M=
X
3
1
xj ej aj ≤ xj < aj + 1
(3.14)
,
où les aj appartiennent à R.
Lorsque γ parcourt Γ, les ensembles translatés M + γ sont deux à deux
disjoints et recouvrent R3 .
Théorème 3.5.5 Soient M et M 0 deux mailles d’un réseau Γ, relatives à
deux bases (ej ) et (e0j ). Alors, pour toute fonction f localement sommable et
Γ-périodique, les intégrales de f sur M et sur M 0 sont égales.
En particulier, M et M 0 ont le même volume.
Le second énoncé résulte du premier en prenant f = 1.
M0
e02
e01
Aγ
M
e2
Bγ
e1
51
3.5. Séries de Fourier multidimensionnelles
Considérons les ensembles Aγ = M 0 ∩ (M + γ). L’ensemble M 0 étant borné,
l’ensemble Γ0 ⊂ Γ constitué des γ tel que Aγ 6= ∅ est fini. Les Aγ sont disjoints
et recouvrent M 0 .
Notons Bγ le translaté Aγ − γ. Les Bγ sont contenus dans M . Montrons
qu’ils sont disjoints : si on avait x ∈ Bγ ∩ Bγ 0 , on aurait dans une même maille
M 0 deux points x + γ et x + γ 0 dont la différence est un vecteur du réseau ; cela
est interdit par (3.14). Montrons que la réunion des Bγ est M : si x appartient à
M , il appartient aussi, comme tout point de R3 , à un certain translaté M 0 − γ0
de la maille M 0 par un élément du réseau ; cela signifie que x + γ0 ∈ Aγ0 et
donc que x ∈ Bγ0 .
En conclusion, nous avons écrit M 0 comme réunion disjointe d’un nombre
fini d’ensembles Aγ , γ ∈ Γ0 , et M comme réunion disjointe des translatés
Bγ = Aγ − γ. On a donc, pour f localement sommable et Γ-périodique,
Z
M0
f (x) dx =
X Z
γ∈Γ0
Aγ
f (x) dx =
X Z
γ∈Γ0
f (y+γ) dy
Bγ
=
X Z
γ∈Γ0
Bγ
f (y) dy =
Z
f (y) dy .
M
Exercice 3.5.6 On appelle plus généralement domaine fondamental de Γ un
sous-ensemble D de R3 tel que les translatés D + γ, γ ∈ Γ soient deux à
deux disjoints et recouvrent R3 . Montrer que l’intégrale sur D d’une fonction
f localement sommable et Γ-périodique ne dépend pas de D.
Théorème 3.5.7 Notons L2Γ l’espace des fonctions localement de carré sommable et Γ-périodiques (en convenant que deux fonctions égales presque partout
sont égales) muni du produit scalaire
(f | g) =
Z
f (x)g(x) dx/V
M
où M est une maille (quelconque) du réseau et V le volume d’une maille.
Alors L2Γ est un espace de Hilbert, et les fonctions x → eik·x , k ∈ Γ∗ , en
constituent une base hilbertienne.
L’espace L2Γ est isométrique à l’espace L2 (M ) et est donc un espace de
Hilbert. Il est facile de montrer que les eik·x forment un système orthonormal.
Pour montrer que ce système est total, on peut procéder comme en dimension 1 : approcher tout élément de L2Γ par une fonction continue Γ-périodique,
puis utiliser le théorème de Stone-Weierstrass pour approcher cette dernière,
P
en norme uniforme, par des combinaisons linéaires finies ck e−ik·x .
52
Chapitre 3. Séries de Fourier et applications
On peut aussi se ramener à une situation produit de la façon suivante :
on choisit une base (ej ) du réseau, on définit la maille M par (3.14) avec les
aj = 0 et, à toute fonction f ∈ L2 (M ), on associe la fonction F (x1 , x2 , x3 ) =
P
f ( xj ej ) qui est définie dans le cube Q = [0, 1]3 .
Le problème initial est donc ramené à décomposer une fonction F ∈ L2 (Q)
sous la forme
F (x1 , x2 , x3 ) =
X
ck1 k2 k3 e2iπk1 x1 e2iπk2 x2 e2iπk3 x3 ,
dans L2 (Q) .
On sait que les e2iπk1 x1 forment une base hilbertienne de L2 ([0, 1]) et l’argument
général sur les bases hilbertiennes de L2 (A × B) (voir n◦ B.6.16) fournit le
résultat.
Il ne reste plus qu’à réécrire dans ce cadre les propriétés générales des bases
hilbertiennes (théorème A.3.20).
Corollaire 3.5.8 Toute fonction f ∈ L2Γ peut se décomposer de façon unique
sous la forme
X
f=
ck (f )eik·x ,
k∈Γ∗
la série convergeant en moyenne quadratique sur tout compact de R3 . Les composantes ck (f ) sont données par
ck (f ) =
Z
e−ik·x f (x) dx/V ,
M
et vérifient
Z
|f (x)|2 dx/V =
M
X
|ck (f )|2
(Bessel-Parseval) .
k∈Γ∗
Réciproquement, étant donné des scalaires γk vérifiant k∈Γ∗ |γk |2 < ∞,
P
la série γk eik·x converge en moyenne quadratique sur tout compact vers une
fonction f ∈ L2Γ telle que l’on ait ck (f ) = γk .
P
Exercice 3.5.9 Pour une donnée initiale g ∈ L2 ([0, 2π]d ), trouver une solution
u(t, x) (2πZ)d –périodique en x de l’équation de la chaleur
∂t u − ∆u = 0 ;
lim ku(t, .) − gkL2 ([0,2π]d ) = 0.
t→0, t>0
Chapitre 4
Transformée de Fourier dans L2
Comme nous l’avons dit dans l’introduction, la transformation de Fourier
associe à une fonction f une autre fonction fb, la connaissance de l’une de
celles-ci permettant, sous de bonnes hypothèses, de retrouver l’autre par des
formules que l’on trouvera dans la section 4.1. Selon les problèmes que l’on
étudie, c’est parfois f parfois fb qui intervient de manière simple.
Il est donc très important de savoir passer de l’une de ces fonctions à l’autre,
pas uniquement sur le plan numérique ou sur celui des formules explicites,
mais aussi sur le plan qualitatif : si on possède telle information (régularité,
décroissance, . . .) sur f , que sait-on sur fb ; si on fait subir telle transformation
à f , qu’advient-il de fb ; si l’on combine deux fonctions f et g peut-on lire cette
opération au niveau des transformées de Fourier . . . ?
C’est essentiellement à ces questions que répond ce chapitre, et l’utilité de
ces connaissances apparaîtra vite pour les applications traitées aux chapitres
suivants.
Enfin, le lecteur pourra trouver dans la section 4.3 une autre justification de
l’intervention générale de l’analyse de Fourier. Chaque fois que des “causes”
(représentées par une fonction du temps, ou d’un point de l’espace, ou des
deux) produisent des “effets” (représentés par une fonction du même type),
si les effets dépendent linéairement des causes (principe de superposition) et
si une translation des causes induit la même translation sur les effets, alors le
phénomène se décrit en termes de convolution et de transformation de Fourier.
54
Chapitre 4. Transformée de Fourier
4.1
a
Rappels sur la transformée de Fourier
Transformée de Fourier des fonctions sommables
Théorème et Définition 4.1.1 Soit f ∈ L1 (Rd ). On appelle transformée de
Fourier de f la fonction, notée fb ou F(f ), définie pour ξ ∈ Rd par
fb(ξ)
=
Z
e−ix·ξ f (x) dx ,
(4.1)
en notant x · ξ le produit scalaire de Rd . La fonction fb est continue, tend vers
0 à l’infini, et vérifie
b
(4.2)
f ≤ kf k1 .
∞
Il est clair que la valeur de fb en chaque point est majorée en module par
|f (x)| dx, d’où l’inégalité (4.2). D’autre part, si une suite ξj converge vers
ξ0 , les fonctions e−ix·ξj f (x) convergent en chaque point vers e−ix·ξ0 f (x), et sont
majorées en module par la fonction sommable fixe |f (x)|. La continuité de fb
résulte du théorème de Lebesgue.
R
Nous allons maintenant démontrer, en dimension 1 pour simplifier, que fb
tend vers 0 à l’infini. Montrons-le d’abord dans le cas particulier où f est
continue et à support compact. Pour ξ 6= 0, on a
fb(ξ) =
Z
e−ixξ f (x) dx = −
et donc
fb(ξ)
Z
e−i(x−π/ξ)ξ f (x) dx = −
Z
e−ixξ f (x + π/ξ) dx
1 Z −ixξ =
e
f (x) − f (x + π/ξ) dx .
2
Si le support de f est contenu dans [−R, R], on a donc
b f (ξ)
≤R
sup
|f (y) − f (x)| .
|y−x|≤π/|ξ|
La fonction f étant uniformément continue, le membre de droite tend vers 0
pour |ξ| → ∞ ce qui achève la démonstration de ce cas particulier.
Pour chaque f ∈ L1 , on peut trouver une suite ϕj de fonctions continues
à support
compact telle que kf − ϕj k1 tende vers 0. Il résulte de (4.2) que
b
cj tend vers 0, et la fonction fb, qui est limite uniforme de fonctions
f − ϕ
∞
tendant vers 0 à l’infini, possède la même propriété.
55
4.1. Rappels
Exemple 4.1.2 Fonction caractéristique d’un intervalle
Si 1[a,b] désigne la fonction égale à 1 dans l’intervalle [a, b] et à 0 ailleurs, un
calcul simple montre que
−i a+b
ξ
2
F 1[a,b] = e
ξ)
2 sin( b−a
2
ξ
(4.3)
en convenant que sin t/t = 1 pour t = 0.
Exemple 4.1.3 Exponentielles décroissantes
Pour α > 0, considérons les fonctions H(x)e−αx et e−α|x| , en notant H la
fonction de Heaviside, c’est-à-dire la fonction caractéristique de l’intervalle
[0, ∞[. On a
F H(x)e−αx =
1
α + iξ
F e−α|x| =
,
2α
.
α2 + ξ 2
(4.4)
On voit déjà apparaître sur cet exemple un phénomène important : plus une
fonction est régulière, plus sa transformée de Fourier est décroissante à l’infini.
Ici, la première fonction présente une discontinuité tandis que la seconde est
continue mais a une dérivée discontinue. On voit que la transformée de Fourier
de la première décroît en 1/ξ alors que celle de la seconde décroît en 1/ξ 2 .
Exemple 4.1.4 Gaussiennes
Pour a > 0, on a
−ax2
F e
On a en effet
Z
2
r
=
e−ixξ e−ax dx = e−ξ
π −ξ2 /4a
e
.
a
2 /4a
Z
(4.5)
iξ
2
e−a(x+ 2a ) dx .
(4.6)
2
En écrivant l’intégrale de e−az dz
sur le bord orienté du rectangle cicontre et en montrant que les intégrales sur AB et CD tendent
vers 0 pour R→∞, on prouvera
que l’intégrale figurant au membre
de droite q
de (4.6) est égale à
R −ax2
e
dx= π/a.
C
iξ/2a
B
D
A
0
R
Exemple 4.1.5 Fractions rationnelles
Nous avons vu au n◦ C.6.3 que le théorème des résidus permet de calculer les
56
Chapitre 4. Transformée de Fourier
transformées de Fourier de toutes les fractions rationnelles qui appartiennent
à L1 . On pourra montrer par exemple (attention : le demi-plan supérieur ne
convient que pour ξ < 0) que
2α
F
2
α + x2
= (2π)−1 e−α|ξ| .
Exemple 4.1.6 Transformée d’un produit tensoriel
Si f et g sont sommables dans Rp et Rq respectivement, et si on forme la
fonction F (x, y) = f (x)g(y) qui appartient à L1 (Rp+q ), on a
Fb (ξ, η)
=
ZZ
e−i(x·ξ+y·η) f (x)g(y) dx dy = fb(ξ)gb(η)
et l’extension à un produit de plusieurs facteurs est immédiate. Par exemple,
2
Q
2
dans Rd , on a e−a|x| = e−axj et la formule suivante résulte immédiatement
de (4.5)
d/2
2
π
−a|x|2
e−|ξ| /4a .
(4.7)
F e
=
a
Théorème 4.1.7 (Inversion de Fourier) Soit f ∈ L1 (Rd ) telle que fb ∈
L1 (Rd ). On a alors
(4.8)
f = (2π)−d F(fb) p.p.
où on a noté F l’analogue de la transformation de Fourier obtenu en remplaçant i par −i dans (4.1).
R R i(x−y)·ξ
La valeur en x du membre de droite de (4.8) s’écrit (2π)−d
e
f (y) dy dξ,
mais il est impossible d’appliquer le théorème de Fubini, la fonction à intégrer n’étant pas
2
2
sommable dans R2d . Nous allons la multiplier par la fonction e−ε |ξ| /4 qui tend vers 1 pour
ε → 0, et évaluer de deux manières différentes l’intégrale.
Posons donc
Iε (x) = (2π)−d
ZZ
ei(x−y)·ξ e−ε
2
|ξ|2 /4
f (y) dy dξ .
(4.9)
R2d
Cette fois-ci, le théorème de Fubini est applicable, et on obtient en intégrant d’abord par
rapport à y
Z
2
2
Iε (x) = (2π)−d eix·ξ e−ε |ξ| /4 fb(ξ) dξ .
Lorsque
ε → 0, la fonction à intégrer reste majorée en module par la fonction sommable fixe
b f (ξ). Le théorème de Lebesgue entraîne que l’on a, pour chaque x
lim Iε (x) = (2π)−d
ε→0
Z
eix·ξ fb(ξ) dξ .
57
4.1. Rappels
Si nous calculons maintenant (4.9) en intégrant d’abord par rapport à ξ, on obtient
Z
Iε (x) = Gε (x − y)f (y) dy ,
c’est-à-dire Iε = Gε ?f , où on a posé
Gε (z) = (2π)−d
Z
eiz·ξ e−ε
2
|ξ|2 /4
dξ .
En utilisant (4.7) avec a = ε2 /4, et en remarquant que le résultat est invariant en remplaçant
z par −z, on obtient
Gε (z) = ε−d G1 (z/ε)
avec
2
G1 (z) = π −d/2 e−|z| .
En notant que la fonction G1 est d’intégrale 1, on voit que la famille des Gε est une approximation de l’identité, et le théorème B.7.11 assure que les Gε ?f convergent en moyenne
vers f .
En résumé, les fonctions Iε convergent vers (2π)−d F(fb) en chaque point x. D’autre part,
les Iε convergent vers f en moyenne et on peut donc (théorème B.2.8) trouver une suite εj
tendant vers 0 telle que Iεj → f p.p. Les fonctions f et (2π)−d F(fb) sont donc égales presque
partout.
Corollaire 4.1.8 Si f est une fonction sommable dont la transformée de Fourier est nulle, on a f = 0 p.p. Si deux fonctions sommables g et h ont même
transformée de Fourier, elles coïncident presque partout.
La seconde propriété résulte de la première en posant f = g − h, et elle n’exige
b Elle autorise à lire “à l’envers” les tables de
pas la sommabilité de gb ou h.
transformées de Fourier dans des cas où g est une fonction inconnue mais où
gb est connue : si gb est la transformée de Fourier d’une fonction h de la table,
on peut en déduire que g = h p.p.
Remarque 4.1.9 D’après le théorème 4.1.1, si fb est sommable, la fonction F(fb)
est continue et tend vers 0 à l’infini. En particulier, si f est le représentant
continu, l’égalité (4.8) a lieu partout.
A posteriori, on voit donc que les hypothèses du théorème d’inversion ne
peuvent être remplies que si f est (égale presque partout à) une fonction continue tendant vers 0 à l’infini. Cela écarte des fonctions d’un usage tout à fait
courant en mathématiques comme en physique, par exemple les fonctions caractéristiques d’un intervalle (4.3) ou les exponentielles unilatérales (4.4).
L’extension de la transformation de Fourier aux fonctions de carré sommable remédiera en grande partie aux insuffisances du théorème 4.1.7.
58
Chapitre 4. Transformée de Fourier
Remarque 4.1.10 La transformation F possède bien entendu les mêmes propriétés que F, à condition de “changer i en −i” dans les formules explicites.
Nous n’énoncerons donc pas ces propriétés, mais nous les utiliserons à l’occasion.
Remarque 4.1.11 Questions de normalisation.
Il existe des variantes dans la définition de la transformation de Fourier dans
Rd . Outre la forme ci-dessus, les plus courantes sont les suivantes
Z
fb(ξ) = (2π)−d/2
ou
fb(ξ)
=
Z
e−ix·ξ f (x) dx ,
(4.10)
e−2iπx·ξ f (x) dx .
(4.11)
L’avantage de ces définitions est que l’on a alors F −1 = F et que, comme
nous le verrons, F est une isométrie de L2 . L’inconvénient est que des facteurs 2π réapparaissent lorsqu’on écrit la transformée de Fourier d’un produit
de convolution pour la convention (4.10) ou la transformée de Fourier d’une
dérivée pour la convention (4.11).
Si on veut couvrir tous les cas, on peut introduire C et α réels, la définition
et la formule d’inversion s’écrivant
fb(ξ) = C d
Z
Rd
e−iαx·ξ f (x) dx ,
f (x) = (|α| /2πC)d
Z
Rd
eiαx·ξ fb(ξ) dξ
Il est important, en lisant un ouvrage ou une table de transformées de Fourier,
de s’assurer de la normalisation utilisée.
b
Propriétés fondamentales
Symétries, translations et dilatations
Les propriétés qui vont suivre s’obtiennent par des changements de variable
simples dans la formule (4.1) définissant la transformation de Fourier.
(i) Si f est réelle, alors fb possède la symétrie hermitienne (fb(−ξ) = fb(ξ)). Si
f possède la symétrie hermitienne, alors fb est réelle. Plus généralement, on a
h
i
F f (x) = fb(−ξ) .
(ii) Si f est paire (resp. impaire), alors fb est paire (resp. impaire). Si f est
réelle et paire, il en est de même de fb. Plus généralement, on a
h
i
F f (−x) = fb(−ξ) .
59
4.1. Rappels
(iii) Translation et modulation
h
i
F f (x − x0 ) = e−ix0 ·ξ fb(ξ)
i
h
F eix·ξ0 f (x) = fb(ξ − ξ0 ) .
,
(iv) Dilatations Pour λ réel non nul, on a
h
i
F f (x/λ) = |λ|d fb(λξ) .
Remarque 4.1.12 Il est important de noter que les dilatations portant sur f
et fb sont inverses l’une de l’autre. Pour λ petit, f est très concentrée autour
de l’origine alors que fb est très étalée, et la situation est inverse pour λ grand.
Le fait que f et fb ne puissent être simultanément concentrées n’est pas
spécifique aux dilatées d’une fonction fixe. C’est un phénomène général (le
principe d’incertitude) sur lequel nous reviendrons au n◦ 4.2. Ses interprétations
physiques sont nombreuses et importantes. Par exemple, pour représenter un
signal très bref comme superposition de signaux périodiques, un large spectre
de fréquences sera nécessaire, alors que pour un signal plus long et à variation
plus douce, une gamme de fréquences moins étalée pourra suffire.
Dérivation
Théorème 4.1.13 Soit f une fonction sommable de classe C 1 , dont les dérivées partielles sont également sommables. On a alors
i
h
F ∂f /∂xj = iξj fb(ξ) .
Nous allons d’abord démontrer le résultat en dimension 1. Il n’est pas vrai en
général qu’une fonction sommable tende vers 0 à l’infini, mais cette propriété
va résulter ici du fait que f et f 0 sont sommables. En effet, on a
f (x) = f (0) +
Z x
0
0
f (t) dt −→ f (0) +
x→±∞
Z ±∞
f 0 (t) dt
0
ce qui montre d’abord que f possède des
limites lorsque x → ±∞. Si l’une de
R∞
ces limites était non nulle, on aurait −∞ |f (x)| dx = +∞ et f ne serait pas
sommable.
En intégrant par parties, on obtient
Z R
−R
h
iR
e−ixξ f 0 (x) dx = e−ixξ f (x)
−R
−
Z R
−R
(−iξ)e−ixξ f (x) dx .
60
Chapitre 4. Transformée de Fourier
D’après ce qui précède, le terme tout intégré tend vers 0 pour R → ∞ et, les
fonctions f et f 0 étant sommables sur R, on a
Z ∞
e−ixξ f 0 (x) dx = iξ
−∞
Z ∞
e−ixξ f (x) dx
−∞
ce qui achève la démonstration en dimension 1.
Supposons maintenant d = 2, en notant x, y les coordonnées. Il nous faut
donc démontrer, pour ξ et η fixés, l’égalité des deux expressions suivantes
h
i
F ∂f /∂x (ξ, η) =
iξ fb(ξ, η)
=
Z
Z
e−iyη h1 (y) dy avec h1 (y) =
e
−iyη
h2 (y) dy avec h2 (y) =
∂f
(x, y) dx
∂x
Z
e−ixξ
Z
e−ixξ iξf (x, y) dx .
Nous avons utilisé le théorème de Fubini, ce qui est justifié par le fait que
∂f /∂x et f sont sommables dans R2 , mais il importe ici de bien en expliciter
les conclusions. Ce théorème affirme qu’il existe un ensemble N1 de mesure
nulle tel que, pour y ∈
/ N1 , la fonction x 7→ ∂f /∂x(x, y) est sommable. De
même, il existe un ensemble N2 de mesure nulle tel que, pour y ∈
/ N2 , la
fonction x 7→ f (x, y) est sommable. Si maintenant y ∈
/ (N1 ∪ N2 ), la fonction
x 7→ f (x, y) vérifie exactement les hypothèses du théorème en dimension 1, et
la conclusion en est que h1 (y) = h2 (y). L’ensemble
h N1 ∪i N2 étant de mesure
nulle, les intégrales donnant les expressions de F ∂f /∂x et de iξ fb(ξ, η) sont
donc égales.
En dimension d, la démonstration relative à F(∂f /∂xj ) est identique, la
variable xj jouant le rôle de la variable x ci-dessus, et les d − 1 autres jouant
celui de la variable y.
Corollaire 4.1.14 Soit f une fonction sommable et de classe C p dont toutes
les dérivées partielles jusqu’à l’ordre p sont sommables. On a alors
fb(ξ) = o(|ξ|−p )
pour
ξ→∞.
En effet, en appliquant p fois de suite le théorème 4.1.13, on obtient que
ip ξj1 . . . ξjp fb(ξ) est la transformée de Fourier de ∂ p f /∂xj1 . . . ∂xjp et que le produit de fb(ξ) par n’importe quel monôme de degré ≤ p est la transformée de
Fourier d’une fonction sommable,
et tend donc vers 0 à l’infini (théorème 4.1.1).
pb
Cela entraîne que |ξ| f (ξ) → 0 et le résultat.
Théorème 4.1.15 Soit f une fonction sommable telle que les fonctions x 7→
xj f (x) soient aussi sommables. Alors fb est de classe C 1 et on a
h
i
F xj f (x) = i
∂ b
f (ξ) .
∂ξj
61
4.1. Rappels
Il suffit d’appliquer le théorème de dérivation sous le signe somme, les variables
ξk pour k 6= j étant fixées,
Z
∂ Z −ix·ξ
e
f (x) dx = e−ix·ξ (−ixj )f (x) dx ,
∂ξj
la fonction figurant à droite sous le signe somme étant majorée en module par la
fonction sommable |xj f (x)|. Les dérivées partielles de fb sont des transformées
de Fourier de fonctions sommables et sont donc continues (théorème 4.1.1), ce
qui montre que fb est de classe C 1 .
Corollaire 4.1.16 Soit f une fonction telle que x → (1 + |x|p )f (x) soit sommable. Alors fb est de classe C p .
Tout monôme de degré ≤ p étant majoré en module par Cte (1 + |x|p ), l’hypothèse entraîne que le produit de f par tout monôme de degré ≤ p est sommable.
En utilisant p fois de suite le théorème 4.1.15, on en déduit que toutes les dérivées partielles d’ordre ≤ p de fb sont des transformées de Fourier de fonctions
sommables et sont donc continues.
Remarque 4.1.17 On peut exprimer l’idée des deux résultats précédents en
disant que la transformation de Fourier échange la régularité et la décroissance
à l’infini. Une fonction très régulière (ayant beaucoup de dérivées dans L1 ) aura
une transformée de Fourier très petite à l’infini. En revanche, une fonction
très petite à l’infini (telle qu’elle reste sommable après multiplication par des
polynômes de degré élevé) aura une transformée de Fourier très régulière.
L’exercice qui suit montre que, en combinant les résultats ci-dessus avec
la formule d’inversion de Fourier, on obtient des conditions nécessaires et des
conditions suffisantes de régularité. Il subsiste toutefois un écart entre les deux
et on n’obtient pas de condition nécessaire et suffisante.
Exercice 4.1.18 Soit f ∈ L1 (R). On a vu que si f ∈ C 1 (avec f 0 sommable),
alors fb(ξ) = o(|ξ|−1 ) à l’infini. Montrer que si fb(ξ) = o(|ξ|−2−δ ) à l’infini,
avec δ > 0, alors f est de classe C 1 . On remarquera que fb(ξ) et ξ fb(ξ) sont
sommables, et on appliquera le théorème 4.1.15 pour la transformation F.
Les fonctions les plus petites à l’infini sont indubitablement celles qui sont
nulles en dehors d’un ensemble borné. On peut s’attendre à une très grande
régularité de leur transformée de Fourier. C’est effectivement le cas : non seulement elles sont de classe C ∞ , mais elles se prolongent en une fonction holomorphe dans C tout entier.
62
Chapitre 4. Transformée de Fourier
Théorème 4.1.19 Soit f une fonction appartenant à L1 (R) et nulle hors d’un
intervalle borné. Alors la fonction de la variable complexe ζ définie par
fb(ζ)
Z
=
e−ixζ f (x) dx
(4.12)
est holomorphe dans tout le plan complexe. On a
fb(ζ)
=
∞ b(n)
X
f (0)
0
n!
ζ
n
fb(n) (0)
avec
n
= (−i)
Z
xn f (x) dx ,
(4.13)
le rayon de convergence de la série étant infini.
Soit A tel que f soit nulle hors de [−A, A]. En utilisant le théorème B.2.16,
nous allons montrer que fb est holomorphe dans tout disque Dρ ⊂ C de rayon
ρ centré à l’origine. Pour ζ ∈ Dρ , on a en effet
dfb/dζ =
Z
e−ixζ (−ix)f (x) dx ,
la fonction figurant sous le signe somme dans le membre de droite étant majorée
en module par la fonction sommable eAρ A |f (x)|.
La fonction fb qui est holomorphe dans tout disque est donc holomorphe
dans C entier. Elle admet donc (théorème C.4.3) un développement en série entière convergeant dans tout le plan. Enfin le théorème 4.1.15 et une récurrence
montrent que la dérivée peme de fb est la transformée de Fourier de (−ix)p f (x).
Le calcul en 0 de ces transformées de Fourier donne les formules (4.13).
Remarque 4.1.20 N’ayant pas défini les fonctions holomorphes de plusieurs
variables, nous n’avons pas énoncé l’équivalent du théorème précédent dans
Rd . On peut dire toutefois que, si f ∈ L1 (Rd ) est nulle hors d’un ensemble
borné, alors la fonction
fb(ζ
1 , . . . , ζd )
=
Z
Rd
e−i(x1 ζ1 +···+xd ζd ) f (x) dx
est définie pour tout ζ ∈ Cd , et que si on fixe les variables ζk pour k 6= j, c’est
une fonction holomorphe de ζj .
Exercice 4.1.21 On se donne une fonction f définie sur R vérifiant |f (x)| ≤
C(1 + |x|K )e−a|x| où C ≥ 0, K ≥ 0, et a > 0 sont donnés. Montrer que la
formule (4.12) définit une fonction holomorphe dans la bande constituée des
ζ ∈ C vérifiant |Im(ζ)| < a.
63
4.1. Rappels
Convolution
Le théorème suivant, dont nous verrons plusieurs variantes, assure que la
transformation de Fourier échange convolution et multiplication des fonctions.
Théorème 4.1.22 Soient f et g sommables dans Rd . On a alors
h
i
F f ?g (ξ) = fb(ξ)gb(ξ) .
On a en effet
=
fd
?g(ξ)
Z
e
−ix·ξ
Z
f (x − y)g(y) dy dx .
On peut appliquer le théorème de Fubini, la fonction à intégrer étant sommable
dans R2d (son module vaut |f (x − y)| |g(y)|). En faisant le changement de
variable (x, y) 7→ (x − y, y), on obtient
fd
?g(ξ)
=
ZZ
e−i(y+z)·ξ f (z)g(y) dy dz
Z
=
−iz·ξ
e
Z
f (z) dz
−iy·ξ
e
g(y) dy ,
ce qui achève la démonstration.
Remarque 4.1.23 En utilisant la formule d’inversion de Fourier, on peut exprimer la transformée de Fourier d’un produit à partir du produit de convolution
des transformées de Fourier. Supposons que f et h soient sommables et posons
g = Fh. On a alors g ∈ Cb et donc f g ∈ L1 . D’autre part, le produit de
convolution de h ∈ L1 et de fb ∈ Cb est défini par le théorème B.7.3. On a
F(f g)(ξ) =
Z
f (x)e−ix·ξ
Z
eix·η h(η) dη dx .
La fonction à intégrer a pour module |f (x)h(η)| qui est sommable dans R2d et
on peut appliquer le théorème de Fubini. On a
Z
f (x)e−ix·(ξ−η) dx = fb(ξ − η) ,
et donc
F(f g) = fb?h .
64
c
Chapitre 4. Transformée de Fourier
Fonctions de la distance à l’origine
Considérons les fonctions f (x), dites fonctions radiales, ne dépendant que
de r = |x| = (x21 + · · · + x2d )1/2 . Cela signifie qu’il existe une fonction F définie
sur [0, ∞[ avec f (x) = F (r) et il est équivalent de dire que pour toute rotation
Θ centrée à l’origine (c’est-à-dire toute transformation linéaire conservant le
produit scalaire et l’orientation), on a f (Θx) = f (x) pour tout x.
Si f est sommable et radiale, nous allons montrer que fb est également
radiale. Soit donc Θ une rotation, on a
fb(Θξ) =
Z
e−ix·Θξ f (x) dx =
Z
e−i(Θ
−1 x)·ξ
f (x) dx ,
en introduisant la rotation inverse Θ−1 qui conserve le produit scalaire. En
faisant le changement de variable x = Θy, dont le jacobien est égal à 1, on a
fb(Θξ) =
Z
e−iy·ξ f (Θy) dy =
Z
e−iy·ξ f (y) dy = fb(ξ) .
Si on pose ρ = (ξ12 + · · · + ξd2 )1/2 , il existe donc une fonction Φ(ρ) telle que
fb(ξ) = Φ(ρ). Nous allons établir la formule permettant de calculer Φ à partir
de F . Le résultat dépendra de la dimension.
4.1.24 Cas de la dimension 1. Il s’agit de la transformée de Fourier d’une
fonction paire, dont nous savons qu’elle est paire. Le lecteur vérifiera sans peine
que
Z ∞
cos(ρr)F (r) dr ; d = 1 .
Φ(ρ) = 2
0
4.1.25 Cas de la dimension 2. En notant (e1 , e2 ) la base de R2 , la valeur de
Φ en ρ est la valeur de fb au point ρe1 . On a donc
Φ(ρ) =
Z
R2
e−iρ e1 ·x f (x) dx .
(4.14)
En introduisant les coordonnées polaires (r, θ), on a e1 · x = r cos θ et donc
Φ(ρ) =
Z ∞ Z 2π
0
e−iρr cos θ F (r)r dr dθ .
0
L’une des définitions de la fonction de Bessel J0 étant
1 Z 2π −it cos θ
2 Z π/2
J0 (t) =
e
dθ =
cos(t cos θ) dθ ,
2π 0
π 0
on a donc
Φ(ρ) = 2π
Z ∞
0
rJ0 (ρr)F (r) dr
;
d=2.
65
4.1. Rappels
4.1.26 Cas de la dimension 3.
La formule (4.14) ci-dessus est toujours
valable, le domaine d’intégration étant R3 . En utilisant les coordonnées polaires
x = rθ, où θ parcourt la sphère unité S2 de R3 , on a d’après (B.15)
Φ(ρ) =
Z ∞ ZZ
0
S2
e−iρr cos(e1 ,θ) F (r)r2 dr dσθ .
Sur la sphère unité, à chaque valeur α de l’angle entre e1 et θ, correspond un
cercle de longueur 2π sin α le long duquel la fonction à intégrer est constante.
On a
Z π
ZZ
sin t
,
e−it cos(e1 ,θ) dσθ =
e−it cos α 2π sin α dα = 4π
t
S2
0
et donc
4π Z ∞
Φ(ρ) =
r sin(ρr)F (r) dr ; d = 3 .
(4.15)
ρ 0
Remarque 4.1.27 On obtient de même une formule explicite pour chaque valeur de la dimension d. Pour d pair, apparaissent des fonctions de Bessel d’ordre
entier, et pour d impair des fonctions trigonométriques.
Exemple 4.1.28 Les calculs ci-dessus, qui utilisent à plusieurs reprises les théorèmes de Fubini et de changement de variable, sont justifiés par le fait que f
est sommable. Nous allons montrer sur un exemple comment procéder avec
une fonction non sommable.
En dimension 3, considérons la fonction f (x) = 1/r2 . Elle n’est ni sommable
ni de carré sommable : au voisinage de l’origine elle est sommable mais pas de
carré sommable et la situation s’inverse à l’infini.
Nous noterons fN la fonction égale à 1/r2 pour r ≤ N et à 0 sinon. La
fonction fN appartient à L1 , tandis que f − fN appartient à L2 . On peut
donc définir la transformée de Fourier fb de f comme la somme d’une fonction
bornée (fc
N ) et d’une fonction de carré sommable (F(f −fN )), le résultat ne
dépendant pas du N choisi.
Lorsque N tend vers l’infini, fN −f converge vers 0 en moyenne quadratique.
La suite F(f −fN ) converge donc vers 0 en moyenne quadratique, et on peut
en extraire une sous-suite qui converge vers 0 presque partout. De l’égalité
d
b
fb = fc
N + F(f −fN ), on déduit donc que fNk (ξ) → f (ξ) p.p. pour une certaine
sous-suite.
On peut calculer la fonction radiale fc
N (ξ) = ΦN (ρ) par la formule (4.15) :
ΦN (ρ) =
4π Z ρN
4π Z N
r sin(ρr)r−2 dr =
sin(s) ds/s .
ρ 0
ρ 0
66
Chapitre 4. Transformée de Fourier
D’après l’exercice C.6.6, la dernière intégrale tend vers π/2 (sauf pour ρ = 0)
lorsque N tend vers l’infini. La suite des fc
N converge donc presque partout
2
vers 2π /ρ. Comme on sait a priori qu’une sous-suite doit converger presque
partout vers F(1/r2 ), on a donc
F
4.2
a
1
r2
=
2π 2
·
ρ
Transformation de Fourier dans L2
Définition, propriétés
Nous allons maintenant étendre aux fonctions de carré sommable la définition de la transformation de Fourier. Celle-ci ne sera plus définie par une
intégrale, et il nous faudra utiliser un procédé d’approximation dans l’espace
L2 . Nous utiliserons à plusieurs reprises la propriété suivante (voir le tableau
page 193 et l’exercice B.6.30) : si une suite fj d’éléments de L2 converge vers f
en moyenne quadratique, on peut en extraire une sous-suite qui converge vers
f presque partout.
Lemme 4.2.1 Soient f et g appartenant à L1 (Rd ) et dont les transformées
de Fourier appartiennent également à L1 (Rd ). Les fonctions f , g, fb et gb sont
alors de carré sommable, et on a
fb gb
= (2π)d (f | g)
b
f ;
2
= (2π)d/2 kf k2 .
D’après la formule d’inversion de Fourier, chacune des fonctions f , g, fb et gb
est la transformée de Fourier d’une fonction sommable, et est donc bornée
(théorème 4.1.1). Etant à la fois sommable et bornée, elle est de carré sommable
(remarque B.6.10). On a
Z
f (x)g(x) dx = (2π)
−d
Z
Z
f (x)
e
ix·ξ
gb(ξ) dξ
dx .
La fonction |f (x)gb(ξ)| étant d’intégrale finie dans R2d , on peut appliquer le
théorème de Fubini et on obtient
−d
(f | g) = (2π)
Z Z
e−ix·ξ f (x) dx
gb(ξ) dξ = (2π)−d fb gb .
4.2. Transformation de Fourier dans L2
67
Lemme 4.2.2 Soient f et g appartenant à L1 ∩ L2 . Leurs transformées de
Fourier sont alors dans L2 et on a
fb gb
= (2π)d (f | g)
b
f ;
2
= (2π)d/2 kf k2 .
(4.16)
2
Considérons la fonction h(x) = π −d/2 e−|x| qui est d’intégrale 1 et formons
l’approximation de l’identité hε (x) = ε−d h(x/ε). On sait (théorème B.7.11)
que les fonctions hε ?f appartiennent à L1 ∩ L2 et convergent vers f à la fois
dans L1 et dans L2 . Nous poserons fj = h1/j ?f et gj = h1/j ?g.
D’après le théorème 4.1.22, la fonction fcj est le produit ordinaire de fb,
qui est une fonction bornée, et de hd
1/j qui est une gaussienne. Elle est donc
majorée en module par un multiple d’une gaussienne et est sommable. On a
de même gcj ∈ L1 .
En appliquant le lemme 4.2.1, on obtient
c
c
fj − f
k
2
= (2π)d/2 kfj − fk k2 −−→ 0 .
j,k→∞
La suite des fcj est de Cauchy dans L2 , elle converge donc en moyenne quadratique vers une certaine fonction ϕ ∈ L2 et il existe une sous-suite de la
suite des fcj qui converge vers ϕ presque partout. Mais d’autre part, du fait
que fj → f dans L1 , on sait que fcj converge vers fb uniformément et donc en
chaque point. On a ainsi montré que fb = ϕ p.p.
Nous avons établi que fb appartient à L2 et que fcj converge vers fb en
moyenne quadratique, et le résultat analogue est valable pour g. En appliquant
à nouveau le lemme 4.2.1, on a
fcj gcj = (2π)d (fj | gj ) .
Par continuité du produit scalaire, chacun des membres de l’égalité ci-dessus
converge vers le membre correspondant de (4.16), ce qui achève la démonstration.
Théorème et Définition 4.2.3 Soit f ∈ L2 (Rd ). Pour toute suite fj d’éléments de L1 ∩ L2 qui converge vers f en moyenne quadratique, la suite des fcj
converge en moyenne quadratique. La limite ne dépend pas (à l’égalité presque
partout près) de la suite fj choisie, on la note fb ou Ff .
L’application f 7→ (2π)−d/2 Ff est une application linéaire, bijective, isométrique de L2 sur lui-même. L’application inverse est (2π)−d/2 F.
68
Chapitre 4. Transformée de Fourier
Remarquons d’abord qu’il existe effectivement des suites d’éléments de L1 ∩ L2
qui convergent vers f en moyenne quadratique. On peut prendre par exemple
fj (x) = f (x) pour |x| ≤ j et fj (x) = 0 sinon. On peut même, cela nous servira
plus loin, construire une suite gj vérifiant les mêmes propriétés et gcj ∈ L1 en
posant gj = hεj ?fj avec hε comme dans le lemme ci-dessus.
En appliquant (4.16), on obtient
c
c
fj − f
k
2
= (2π)d/2 kfj − fk k2 −−→ 0 .
j,k→∞
La suite des fcj est donc de Cauchy dans L2 et elle converge en moyenne
quadratique vers un certain élément que l’on notera fb. Si (fj0 ) est une autre
suite d’éléments de L1 ∩ L2 qui converge vers f en moyenne quadratique, le
même argument montre que les fcj0 convergent vers un certain élément ϕ ∈ L2 .
En appliquant encore (4.16), on a
b
f − ϕ
2
d
= lim fcj − fcj0 = (2π) 2 lim fj − fj0 = 0 ,
2
j→∞
j→∞
2
ce qui montre que l’on a fb = ϕ p.p.
En approchant deux éléments quelconques f et g de L2 par des suites
d’éléments de L1 ∩ L2 , on a
fb gb
= lim fcj gcj = (2π)d lim (fj | gj ) = (2π)d (f | g) .
j→∞
j→∞
Cela montre que l’application f 7→ (2π)−d/2 fb respecte le produit scalaire et est
donc une isométrie.
Ce que nous avons démontré pour F est bien entendu valable pour F. Nous
avons vu que l’on peut approcher un élément f ∈ L2 par une suite de fonctions
gj qui sont sommables et dont la transformée de Fourier est sommable. On sait
que l’on a alors (2π)−d FFgj = gj et, les deux applications étant continues, on
obtient (2π)−d FFf = f en passant à la limite. Pour la même raison (2π)−d FF
est l’identité de L2 ce qui prouve que (2π)−d/2 F et (2π)−d/2 F sont bijectives
et inverses l’une de l’autre.
Remarque 4.2.4 Lorsque f est de carré sommable mais n’est pas sommable,
la fonction x 7→ e−ix·ξ f (x), qui a le même module, n’est sommable pour aucune
valeur de ξ. Il est donc hors de question d’utiliser la formule intégrale (4.1)
dans ce cas. La seule méthode générale est de choisir une suite fj de fonctions
dans L1 ∩ L2 qui approche f dans L2 et de calculer la limite en moyenne
quadratique des fcj (qui eux se calculent par la formule (4.1)).
Toutefois, on peut souvent se ramener à un calcul d’intégrales semiconvergentes. C’est l’objet du théorème suivant.
4.2. Transformation de Fourier dans L2
69
ThéorèmeR 4.2.5 Soit f ∈ L2 (Rd ) et supposons que, pour presque tout ξ,
l’intégrale |x|≤R e−ix·ξ f (x) dx converge vers une limite, que nous noterons ϕ(ξ)
lorsque R tend vers +∞. Alors, on a fb(ξ) = ϕ(ξ) p.p.
Considérons les fonctions fR , égales à f pour |x| ≤ R et à 0 sinon. Elles
appartiennent à L1 ∩ L2 et fR → f en moyenne quadratique pour R → ∞.
Les fcR convergent donc vers fb en moyenne quadratique. D’après le résultat
rappelé au début de cette section, on peut trouver une suite Rj tendant vers
l’infini telle que fcR j → fb p.p. Mais par hypothèse on a aussi fcR j → ϕ p.p. ,
d’où le résultat.
Exercice 4.2.6 Montrer que la fonction f (x) = sin(ax)/x appartient à L2 (R)
mais pas à L1 (R), et calculer par deux méthodes sa transformée de Fourier
(a) en utilisant
la méthode ci-dessus et en se ramenant au résultat de l’exerRR
cice C.6.6 : 0 sin x/x dx → π/2 (la seule difficulté est de ne pas faire d’erreur
de signe) ;
(b) en utilisant le résultat de l’exemple 4.1.2 et le fait que F et (2π)−1 F sont
inverses l’un de l’autre.
Par les deux méthodes, on doit trouver fb(ξ) = π1[−a,a] (ξ).
4.2.7 Propriétés de la transformation de Fourier étendue à L2 .
Nous ne ferons que les énoncer. Elles se déduisent, par passage à la limite,
des propriétés correspondantes déjà démontrées pour les éléments de L1 .
Toutes les propriétés de symétrie, de transformation par translation et par
dilatation vues pour les fonctions sommables dans la section b sont valables
telles quelles.
Théorème 4.2.8 Soit f de classe C 1 dans Rd telle que f et ses dérivées
partielles soient de carré sommable. On a alors
h
i
F ∂f /∂xj = iξj fb(ξ) .
Remarque 4.2.9 Nous n’énoncerons pas d’analogue du théorème 4.1.15. Si f
et les xj f sont de carré sommable, il n’est pas toujours vrai que fb soit de
classe C 1 . Ce sont les “dérivées partielles de fb au sens des distributions” qui
sont égales, au facteur i près, aux transformées de Fourier des xj f .
Théorème 4.2.10 Soient f ∈ L1 (Rd ) et g ∈ L2 (Rd ). On a alors
h
i
F f ?g (ξ) = fb(ξ)gb(ξ) .
(4.17)
70
Chapitre 4. Transformée de Fourier
Nous nous bornerons à vérifier que les deux membres définissent des éléments
de L2 . Au membre de gauche, le produit de convolution f ?g appartient à L2
d’après le théorème B.7.4, et sa transformée de Fourier est donc définie et de
carré sommable. Au membre de droite, on a le produit ordinaire de la fonction gb
qui appartient à L2 par la fonction fb qui est bornée, ce qui donne un élément
de L2 .
Théorème 4.2.11 Soient f et g appartenant à L2 (Rd ). On a alors
h
i
F f g = (2π)−d fb? gb
(4.18)
Là encore, nous nous limiterons à vérifier que les deux membres sont bien
définis. Au membre de gauche, le produit f g appartient à L1 et sa transformée
de Fourier est une fonction continue tendant vers 0 à l’infini. Au membre de
droite, on a le produit de convolution de deux éléments de L2 , qui d’après le
théorème B.7.4 est effectivement une fonction continue tendant vers 0 à l’infini.
Remarque 4.2.12 Il y a bien d’autres cas où les formules (4.17) et (4.18) sont
valables (voir la section 4.4). On peut presque dire que chaque fois que l’un des
membres a un sens, il est alors possible de définir l’autre et que l’on a égalité.
La théorie des distributions permet d’étendre considérablement les cas où la
convolution et la transformation de Fourier sont définies.
4.2.13 Spectre de la transformée de Fourier dans L2 Dans l’espace L2 (R), la
transformation de Fourier normalisée G = (2π)−1/2 F est un opérateur unitaire :
on a G −1 = G = G ∗ . Ses valeurs propres sont donc de module 1. On peut
dire beaucoup plus en remarquant que (Gf )(−x) = (Gf )(x). L’opérateur G 2
coïncide donc avec l’opérateur de symétrie qui à x 7→ f (x) fait correspondre
x 7→ f (−x), et on a G 4 = I.
Si f est un vecteur propre de G relatif à λ, on a donc G 4 f = λ4 f = f . Les
seules valeurs propres possibles de G sont donc ±1 et ±i.
A partir de la transformée de Fourier des gaussiennes, et en utilisant les
théorèmes 4.1.13 et 4.1.15, le lecteur pourra effectivement vérifier que, pour
les fonctions d’Hermite Ψn définies au n◦ 3.4.3, on a GΨn = (−i)n Ψn .
Finalement, on remarque que le spectre de G est réduit à ces quatre valeurs
propres : pour toute autre valeur
de λ, l’inverse
de G − λ est l’opérateur qui,
−1
P
P
n
à cn Ψn , fait correspondre
(−i) − λ cn Ψn .
4.2. Transformation de Fourier dans L2
b
71
Le principe d’incertitude
Soit f ∈ L2 (R) vérifiant kf k2 = 1. La fonction |f (x)|2 est positive et
d’intégrale 1 et peut être interprétée comme une loi de probabilité. On définit
alors sa moyenne mf , sa variance Vf et son écart-type σf par les formules
mf =
Z
2
x |f (x)| dx,
Vf =
Z
(x − mf )2 |f (x)|2 dx,
σf =
q
Vf ,
à condition que les intégrales ci-dessus aient un sens. Il suffit pour cela que
x2 |f (x)|2 soit sommable : dans l’intégrale définissant mf , on peut majorer x
en module par (1 + x2 )/2.
L’écart-type σf , qui est égal à k(x − mf )f k2 , est l’une des manières de
mesurer la concentration de la loi de probabilité autour de sa moyenne. Une
petite valeur de σ signifie que, en dehors d’un petit voisinage de mf , l’intégrale
de |f (x)|2 est petite.
Le théorème ci-dessous va donner un contenu quantitatif et général à un
phénomène que nous avons déjà observé (remarque 4.1.12) : il n’est pas possible
que f et fb soient simultanément très concentrées.
Théorème 4.2.14 Soit f ∈ L2 (R) vérifiant kf k2 = 1 et posons g =
(2π)−1/2 fb. On suppose que f est de classe C 1 et que les fonctions f 0 et xf
sont de carré sommable. On a alors
σf σg ≥ 1/2 ,
l’égalité ayant lieu si et seulement si f est une gaussienne.
La fonction g est de carré sommable et de norme 1. En outre, la fonction
iξ fb est la transformée de Fourier de f 0 (théorème 4.2.8) et est donc de carré
sommable, ce qui permet de définir mg et σg .
Si on remplace f par la fonction x 7→ f (mf + x), la moyenne de la loi
associée devient nulle et l’écart type n’est pas modifié ; quant à la fonction g,
elle est multipliée par eimf ξ . La fonction |g|2 étant inchangée, il en est de même
de mg et σg . Cette première modification étant faite, on peut encore multiplier
f (x) par e−img x , ce qui revient à remplacer g(ξ) par g(mg + ξ). Pour la même
raison que précédemment, les écarts-type sont encore inchangés et on s’est
donc ramené à démontrer le théorème dans le cas particulier où mf = mg = 0,
ce que nous supposerons désormais. On a alors
σf = kxf k2
,
σg = kξgk2 = (2π)−1/2 ξ fb = kf 0 k2 .
2
72
Chapitre 4. Transformée de Fourier
La fonction x 7→ x |f (x)|2 est le produit de xf et f qui appartiennent à L2 et est
donc sommable. Sa dérivée |f |2 +2x Re(f f 0 ) l’est aussi, du fait que xf et f 0 sont
dans L2 . Comme nous l’avons vu dans la démonstration du théorème 4.1.13,
cela entraîne que x |f (x)|2 tend vers 0 à l’infini. On a
Z R
h
i
d
2
2 R
−
|f (x)|2 dx −→ −1 .
x |f (x)| dx = x |f (x)|
−R
R→∞
−R
−R dx
Z R
On a donc, en utilisant l’inégalité de Cauchy-Schwarz,
1 = −2 Re (xf | f 0 ) ≤ 2 kxf k2 kf 0 k2 = 2σf σg ,
ce qui est l’inégalité voulue. On a ci-dessus une égalité si et seulement si le
produit scalaire des “vecteurs” f 0 et xf est égal à l’opposé du produit de leurs
normes. Cela se produit si et seulement si ces vecteurs sont colinéaires et de
direction opposée, c’est-à-dire s’il existe λ > 0 tel que f 0 (x) = −λxf (x). Cela
caractérise les gaussiennes.
c
Espaces de Sobolev H s (Rd )
Les espaces de Sobolev introduits dans cette section ont de multiples avantages par rapport aux espaces de fonctions C p pour la résolution de certaines
EDP. Commençons par l’espace H 1 (Rd ) :
H 1 (Rd ) = f ∈ L2 (Rd ); kf k2H 1 (Rd ) =
Z
Rd
2
(1 + |ξ|2 ) fb(ξ) dξ < ∞ .
Il est clair que H 1 (Rd ), muni du produit scalaire
(f |g)
H1
=
Z
Rd
(1 + |ξ|2 )fb(ξ)gb(ξ)dξ
est un espace de Hilbert. En effet, l’espace L2 (Rd ; (1+|ξ|2 )dξ) muni du produit
scalaire
Z
(F |G) =
(1 + |ξ|2 )F (ξ)G(ξ)dξ
Rd
est un espace de Hilbert et la restriction de (2π)−d/2 F (où F est la transformée
de Fourier L2 ) à l’espace H 1 (Rd ) est un isomorphisme isométrique de H 1 (Rd )
dans L2 (Rd ; (1 + |ξ|2 )dξ).
Nous utiliserons dans le chapitre suivant le résultat de compacité suivant,
qui est une version affaiblie d’un résultat classique appelé théorème de Rellich.
4.2. Transformation de Fourier dans L2
73
Théorème 4.2.15 Soit (fn )n∈N une suite bornée de H 1 (Rd ) vérifiant, pour un
certain R > 0,
∀n ∈ N, ∀x ∈ Rd , |x| > R ⇒ fn (x) = 0.
Alors, il existe une sous-suite (fϕ(n) ) de (fn )n∈N et f ∈ H 1 (Rd ) tels que
lim kfϕ(n) − f kL2 (Rd ) = 0
n→+∞
Nous utilisons dans cette démonstration la notion de convergence faible dans
les espaces de Hilbert introduite de façon générale au paragraphe A.3.d. En particulier, d’après le résultat de l’exercice A.3.28, il existe une sous-suite (fϕ(n) )
de (fn )n∈N et f ∈ H 1 (Rd ) telle que (fϕ(n) ) converge faiblement vers f dans
H 1 (Rd ). De plus, f vérifie la même condition de support que les (fn ).
On pose gn = fϕ(n) − f , de sorte que la suite (gn ) est bornée dans H 1 (Rd )
et converge faiblement vers 0 dans H 1 (Rd ). Alors, pour M > 0,
(2π)d kgn k2L2 (Rd ) = kgbn k2L2 (Rd ) ≤ kgbn k2L2 (|ξ|<M ) + kgbn k2L2 (|ξ|>M ) .
Soit ε > 0. Le deuxième terme se majore de la façon suivante :
kgbn k2L2 (|ξ|>M ) ≤
Z
1
C
2
bn (ξ)|2 dξ ≤
(1
+
|ξ|
)|
g
≤ ε,
1 + M2
1 + M2
pour M assez grand. Un tel M étant fixé, on a kgbn k2L2 (|ξ|<M ) → 0 lorsque
n → +∞ par le théorème de convergence dominée.
En effet, à ξ fixé, on a gbn (ξ) → 0 car 1|x|<R e−ix·ξ ∈ L2 (Rd ) et gn converge
faiblement vers 0 dans L2 (Rd ). De plus, |gbn (ξ)| ≤ (2R)d/2 kgn kL2 ≤ C 0 par
l’inégalité de Cauchy-Schwarz et donc |gbn (ξ)|1|ξ|<M ≤ C 0 1|ξ|<M ∈ L1 (Rd ).
On obtient ainsi kgbn k2L2 (|ξ|<M ) ≤ ε pour n assez grand. Finalement, on a
bien montré limn→+∞ kgn kL2 (Rd ) = 0.
Exercice 4.2.16 Pour s > 0, on définit plus généralement les espaces H s (Rd )
par
s
d
2
d
H (R ) = f ∈ L (R );
kf k2H s (Rd )
=
Z
Rd
2 s
(1 + |ξ| )
ˆ 2
f (ξ) dξ
(Par convention H 0 = L2 .)
(a) Justifier que H s (Rd ), muni du produit scalaire
(f |g)
Hs
=
Z
Rd
(1 + |ξ|2 )s fˆ(ξ) ĝ(ξ)dξ
<∞ .
74
Chapitre 4. Transformée de Fourier
est bien un espace de Hilbert.
(b) Montrer que si s > d/2 alors toute fonction de H s (Rd ) est continue et
bornée sur Rd . On pourra utiliser l’estimation suivante
Z
|fˆ(ξ)|dξ ≤
Z
(1 + |ξ|) |fˆ(ξ)|2 dξ
2s
1 Z
2
−2s
(1 + |ξ|)
1
dξ
2
.
(c) Soit f ∈ H s (Rd ) et g une fonction de classe C ∞ et nulle en dehors
d’un compact de Rd . Montrer que la fonction f g appartient à H s (Rd ) et que
kf gkH s ≤ Ckf kH s où la constante C ne dépend que de la fonction g. On
pourra utiliser la formule (4.18), le corollaire 4.1.14 et le théorème B.7.4 (i).
Exercice 4.2.17 (application trace) On définit S(Rd ) (appelé espace de
Schwartz) l’espace des fonctions ϕ de classe C ∞ sur Rd à décroissance rapide
ainsi que toutes leurs dérivées, c’est-à-dire vérifiant
∀α, β ∈ Nd ,
sup |xα ∂ β ϕ(x)| < ∞,
x∈Rd
où l’on a adopté les notations suivantes xα = xα1 1 . . . xαd d et ∂ β ϕ = ∂xβ11 . . . ∂xβdd ϕ.
Comme dans l’exercice précédent, pour f ∈ L2 (Rd ) et s ∈ [0, +∞[, on note
kf k
Z
Hs
=
Rd
2s
hξi
|fb(ξ)|2 dξ
1/2
où
hξi = 1 +
Pd
2
j=1 ξj
1/2
et H s (Rd ) = {f ∈ L2 (Rd ) | kf kH s < ∞} qui est un espace de Hilbert muni du
produit scalaire associé à k.kH s .
(a) Montrer que pour f ∈ S(Rd ), la transformée de Fourier de f est bien définie
et appartient également à S(Rd ).
(b) Montrer que si f ∈ S(Rd ) alors f ∈ H s (Rd ) pour tout s ≥ 0.
(c) On considère l’application trace τ définie (pour l’instant) de S(Rd ) dans
S(Rd−1 ) par
τ u(x0 ) = u(0, x0 ),
x0 = (x2 , . . . , xd ).
Montrer que pour tout u ∈ S(Rd ) et tout ξ 0 ∈ Rd−1 ,
τcu(ξ 0 )
1 Z
ub(ξ1 , ξ 0 )dξ1 .
=
2π R
(d) Montrer que pour tout s > 1/2, il existe C = C(s) > 0 telle que pour tout
u ∈ S(Rd ),
kτ ukH s−1/2 (Rd−1 ) ≤ CkukH s (Rd ) .
75
4.3. Caractère universel de la convolution
Indication : déduire de la question précédente l’estimation suivante :
|τcu(ξ 0 )|2
et exprimer
R hξi
R
−2s
1
≤ 2
4π
Z
R
|ub(ξ)|2 hξi2s dξ1
Z
−2s
hξi
dξ1
R
dξ1 en fonction de hξ 0 i (on note ξ = (ξ1 , ξ 0 )).
(e) Soit s > 1/2. En utilisant le fait que S(Rd ) est dense dans H s (Rd ) pour la
norme k.kH s (fait que l’on admettra), montrer que l’on peut étendre de manière
unique l’application trace à une application linéaire continue de H s (Rd ) dans
H s−1/2 (Rd−1 ).
(f) Soit s > 1/2 et g ∈ H s−1/2 (Rd−1 ). Définissons v par
vb(ξ) = gb(ξ 0 )
hξ 0 i2(s−1/2)
.
hξi2s
Montrer que v ∈ H s (Rd ) et v(0, x0 ) = Cg(x0 ) pour une constante C 6= 0. En
déduire que l’extension de l’application trace définie à la question précédente
est surjective.
4.3
Caractère universel de la convolution
Considérons un système physique, que nous nous représenterons comme une
“boîte noire”, qui lorsqu’on l’excite avec un signal f (t) produit une réponse
r(t). Le signal d’entrée pourra être de nature mécanique, acoustique, optique,
électrique, . . . , le signal de sortie pourra être de même nature que le signal
d’entrée ou de nature différente, c’est-à-dire que tout appareil transmettant,
amplifiant, transformant . . .un signal rentrera dans ce cadre.
On est fréquemment amené à admettre que le système en question possède
les trois propriétés suivantes. Nous les traduirons mathématiquement en termes
de l’opérateur A qui au signal d’entrée f fait correspondre la réponse r = Af .
(α) Principe de superposition : si on superpose deux signaux d’entrée, on
obtient à la sortie la superposition des réponses correspondantes. Cela se
traduit par le fait que l’opérateur A est linéaire.
(β) Homogénéité dans le temps : si le signal f produit une réponse r, alors le
même signal décalé de T secondes produira la même réponse décalée de
T secondes. Mathématiquement, cela signifie que l’opérateur A commute
avec les translations : si on note τT l’opérateur qui à f fait correspondre
la fonction τT f (t) = f (t − T ), on a alors A ◦ τT = τT ◦ A.
76
Chapitre 4. Transformée de Fourier
(γ) Causalité : les causes ne produisent pas d’effet qui leur soit antérieur :
si le signal f est nul pour t ≤ t0 , alors la réponse r = Af est nulle pour
t ≤ t0 .
Il appartient à la physique de dire dans quels cas, dans quelle mesure,
avec quelle approximation on peut admettre la validité de ces hypothèses. La
linéarité tombe souvent en défaut pour de grandes amplitudes (saturation,. . .).
L’homogénéité dans le temps n’est pas valable si les composants du système se
modifient (vieillissement, hysteresis,. . .) pendant les T secondes en question.
Théorème 4.3.1 (i) Soit a ∈ L1 (R) et considérons l’opérateur A de L1 (R)
dans lui-même défini par Af = a?f . Alors l’opérateur A vérifie les propriétés
(α) et (β) ci-dessus. Si a est nulle pour t < 0, il vérifie en outre la propriété (γ).
(ii) Soit maintenant a ∈ L1loc (R) nulle pour t < 0. Alors l’opérateur A, toujours
défini par Af = a?f , transforme toute fonction f localement sommable à
support limité à gauche, c’est-à-dire nulle pour t inférieur à un certain t0 ,
en une fonction localement sommable nulle pour t < t0 . Il vérifie encore les
propriétés (α), (β) et (γ).
La linéarité est évidente et on a
τT Af (t) =
Z
a(t−T −s)f (s) ds =
Z
a(t−σ)f (σ−T ) dσ
= a?(τT f ) (t) = AτT f (t) ,
ce qui montre que la seconde propriété est vérifiée. Si a est nulle pour t < 0 et
f nulle pour t < t0 , dans l’expression
Af (t) =
Z
a(t − s)f (s) ds ,
le domaine d’intégration en s est [t0 , ∞[ ∩ ] − ∞, t] qui est vide pour t < t0 .
En ce qui concerne la dernière partie de l’énoncé, nous avons déjà vu dans
le théorème B.7.8(ii) que, si a et f sont localement sommables et sont nulles
respectivement pour t < 0 et pour t < t0 , alors a?f est localement sommable
et est est nulle pour t < t0 . La linéarité est évidente et on vérifie la propriété
(β) comme ci-dessus.
Remarque 4.3.2 On aurait pu considérer, toujours pour a ∈ L1 , l’opérateur de
L2 dans lui-même (ou bien de Cb dans lui-même) défini par la même formule
(théorèmes B.7.3 et B.7.4). Pour a ∈ L2 , on aurait pu considérer l’opérateur
4.3. Caractère universel de la convolution
77
f 7→ a?f qui applique L2 dans Cb (théorème B.7.4). Tous ces opérateurs
vérifient (α) et (β), ainsi que (γ) lorsque a est nulle pour t < 0.
L’opérateur A du théorème est continu de L1 dans lui-même : on a kAf k1 ≤
C kf k1 , avec C = kak1 . De même, il résulte facilement des théorèmes B.7.3
et B.7.4 que les opérateurs évoqués ci-dessus sont continus.
4.3.3 Réciproquement, un opérateur A vérifiant (α), (β) et (γ) est-il toujours
un opérateur de convolution ?
En supposant de plus une propriété de continuité très faible, la réponse est
“oui” mais à condition de se placer dans le cadre des distributions. Nous ne
pourrons donner ici qu’un énoncé comportant des hypothèses restrictives.
Par exemple l’identité de L1 , c’est-à-dire l’opérateur défini par Af = f (une
boîte noire très facile à construire), vérifie (α), (β) et (γ). Il n’existe cependant
pas de fonction a ∈ L1 telle que l’on ait a?f = f pour tout f . On devrait en
effet avoir abfb = fb pour tout f , cela imposerait ab = 1 qui ne tend pas vers
0 à l’infini. En revanche, la théorie des distributions introduit la distribution
de Dirac δ, dont la transformée de Fourier (généralisée) vaut 1 et qui vérifie
effectivement (pour une généralisation adéquate de la convolution) δ?f = f .
Théorème 4.3.4 (une réciproque partielle) Soit A un opérateur continu
de L2 (R) dans Cb (R) vérifiant (α), (β) [resp. et (γ)]. Il existe alors une fonction a ∈ L2 (R), [resp. nulle pour t < 0] telle que l’on ait Af = a?f . La
fonction a est unique, à l’égalité presque partout près.
La continuité de A signifie qu’il existe une constante C telle que kAf k∞ ≤
C kf k2 . En particulier, on a |Af (0)| ≤ C kf k2 . L’application f 7→ Af (0), qui
est une forme linéaire d’après (α), est donc continue. D’après le théorème de
Riesz (théorème A.3.14), il existe un unique h ∈ L2 tel que l’on ait
Af (0) =
Z
h(s)f (s) ds
pour tout f ∈ L2 .
En utilisant maintenant la propriété (β), on a
Af (0 − T ) =
Z
h(s)f (s − T ) ds =
Z
h(−s)f (−s − T ) ds .
En introduisant la fonction a(s) = h(−s), qui appartient à L2 , et en remplaçant
−T par t dans la formule ci-dessus, on obtient
Af (t) =
Z
a(s)f (t − s) ds = (a?f )(t) .
78
Chapitre 4. Transformée de Fourier
Il reste à utiliser la propriété (γ) qui assure en particulier que Af (0) = 0 si
f est nulle pour t < 0. Choisissons comme fonction particulière la fonction f0
vérifiant f0 (t) = a(−t) pour t > 0 et f0 (t) = 0 sinon. On a
0 = Af0 (0) =
Z
a(s)f0 (0 − s) ds =
Z 0
a(s)a(s) ds
−∞
et la fonction a est nulle (presque partout) pour t < 0.
Remarque 4.3.5 La propriété universelle de la convolution n’est pas limitée
au cas unidimensionnel (à l’exclusion bien sûr des questions de causalité). Le
lecteur vérifiera facilement que la démonstration ci-dessus peut être reproduite
sans changement pour démontrer l’énoncé suivant : Soit A un opérateur linéaire
continu de L2 (Rd ) dans Cb (Rd ) qui commute avec les translations de Rd , il
existe alors a ∈ L2 (Rd ) tel que l’on ait Af = a?f .
Ces opérateurs peuvent être de nature physique très variée : transformation
d’une image bidimensionnelle en une autre image bidimensionnelle ; opérateur
qui associe à une répartition de charges tridimensionnelle le potentiel créé par
ces charges, etc.
Remarque 4.3.6 La fonction a, appelée réponse impulsive, contient toute l’information nécessaire sur le comportement de la “boîte noire”, et il est important de pouvoir la déterminer.
Revenons, pour simplifier, au cas où a est sommable et à support dans
[0, ∞[. Si on prend comme signal d’entrée la fonction (impulsion unité) égale
à 1/ε dans l’intervalle [0, ε] et à 0 ailleurs, il résulte du théorème B.7.11 sur les
approximations de l’identité que la réponse rε tend vers a pour ε → 0, ce qui
justifie la terminologie “réponse impulsive”.
Si on prend comme signal d’entrée la fonction de Heaviside, égale à 1 pour
t > 0 et à 0 sinon, qui est particulièrement simpleR à réaliser expérimentalement,
on obtient comme réponse la fonction r(t) = 0t a(s) ds. Il suffira de dériver
celle-ci pour obtenir a.
Si le système est constitué de deux sous-systèmes (correspondant à des
opérateurs A et B et à des réponses impulsives a et b) mis en série, c’est-à-dire
si le signal f est d’abord transformé en g = Bf puis en r = Ag = (A ◦ B)f ,
on a
r = a?(b?f ) = (a?b)?f
en utilisant l’associativité (exercice B.7.2). La réponse impulsive du système
total est donc le produit de convolution a?b des réponses impulsives des deux
sous-systèmes.
79
4.3. Caractère universel de la convolution
4.3.7 Rôle de la transformation de Fourier
En supposant toujours a sommable et à support dans [0, ∞[, on ne peut
pas en principe prendre la fonction t 7→ eiωt comme signal d’entrée : elle n’est
ni sommable ni à support limité à gauche. Pour un moment, faisons comme si
cela était permis. On aurait
h
iωt
A e
i
=
Z
eiω(t−s) a(s) ds = ab(ω)eiωt .
On obtient donc un signal de même type, de même fréquence, dont l’amplitude
est multipliée par |ab(ω)| et qui est déphasé de Arg(ab(ω)).
On peut rendre raisonnable le calcul précédent en regardant, pour t > 0,
la réponse correspondant à l’excitation H(t + N )eiωt (c’est-à-dire un signal
sinusoïdal qui a commencé au temps −N ). Le support étant limité à gauche,
on peut écrire
h
A H(t + N )e
iωt
i
=
Z t+N
−∞
eiω(t−s) a(s) ds = ab(ω)eiωt + rN (t) ,
où l’erreur rN est majorée en module, pour t > 0, par N∞ |a(s)| ds et tend
donc vers 0 avec N .
d (ω) = a
b (ω)fb(ω)
Quoi qu’il en soit, pour tout signal d’entrée f ∈ L1 , on a Af
d’après le théorème 4.1.22. Si on est dans les conditions du théorème d’inversion
(transformées de Fourier dans L1 ou L2 ), l’effet de l’opérateur A est maintenant complètement
décrit “en fréquence” : le signal d’entrée est une superposiR b
−1
iωt
tion (2π)
f (ω)e dω des fonctions eiωt affectées d’amplitudes (complexes)
fb(ω) ; le signal de sortie est une superposition des mêmes fonctions, dont l’amplitude a été multipliée par ab(ω). La quantité ab(ω) (ou parfois son module)
porte divers noms (facteur de réponse, gain, impédance, . . .) selon la nature
du système étudié.
R
4.3.8 Retour sur les équations différentielles Considérons d’abord une
équation différentielle linéaire à coefficients constants du premier ordre
u0 (t) − λu(t) = f (t) ,
λ∈C.
(4.19)
En supposant la fonction f continue [resp. C k ] et à support limité à gauche,
nous allons rechercher une solution de classe C 1 [resp. C k+1 ] à support limité
à gauche de (4.19). Le lecteur connaît bien la méthode dite de variation de la
constante, il cherchera u sous la forme C(t)eλt , obtiendra l’équation C 0 (t) =
e−λt f (t).R Il en existe une et une seule solution nulle pour t assez petit, à savoir
t
C(t) = −∞
e−λs f (s) ds et on obtient finalement
u(t) =
Z t
−∞
eλ(t−s) f (s) ds = a?f (t)
80
Chapitre 4. Transformée de Fourier
en posant a(t) = H(t)eλt .
Le fait que la solution soit fournie par un opérateur de convolution était
prévisible a priori, à condition de savoir que, pour tout second membre f
continu à support limité à gauche, il existe une unique solution u à support
limité à gauche. Cela permet de définir un opérateur f 7→ u et on se rend
facilement compte, en utilisant l’unicité, qu’il doit vérifier les conditions (α),
(β) et (γ) du début de cette section.
4.3.9 Cas d’une équation du second ordre à coefficients constants
Considérons l’équation
u00 (t) + αu0 (t) + βu(t) = f (t) ,
α, β ∈ C
(4.20)
Nous noterons λ1 et λ2 les racines (distinctes ou non) de l’équation caractéristique λ2 + αλ + β = 0, de sorte que l’équation ci-dessus peut s’écrire
d
− λ1
dt
!
!
d
− λ2 u = f .
dt
Pour f continue et à support limité à gauche, cherchons u de classe C 2 à
support limité à gauche. Si on pose v = dtd − λ2 u, la fonction v est de classe
C 1 , a son support limité à gauche et doit vérifier
d
dt
− λ1 v = f . Nous savons
h
i
qu’il existe une unique solution donnée par v = H(t)eλ1 t ?f . Il ne reste plus
qu’à résoudre
support est
d
dt
− λ2 u = v dont l’unique solution vérifiant la condition de
h
i
h
i
h
i
u = H(t)eλ2 t ?v = H(t)eλ2 t ? H(t)eλ1 t ?f ,
l’associativité permettant de ne pas préciser l’ordre des opérations. On peut
donc encore écrire la solution sous la forme u = a?f , où le calcul explicite des
intégrales donne immédiatement
h
i
h
i
a(t) = H(t)eλ2 t ? H(t)eλ1 t =

λ1 t −eλ2 t

 H(t) e λ −λ
1


H(t)teλ1 t
4.3.10 Cas d’une équation d’ordre quelconque
d’ordre m à coefficients constants
2
pour λ1 6= λ2
pour λ1 = λ2 .
Pour une équation linéaire
dm u
dm−1 u
(t)
+
α
(t) + . . . + α0 u(t) = f (t) ,
m−1
dtm
dtm−1
(4.21)
81
4.4. Récapitulation
on notera λ1 , . . . , λm les racines, distinctes ou non, de l’équation caractéristique
λm + αm−1 λm−1 + . . . + α0 = 0.
En reprenant l’argument vu ci-dessus pour m = 2, le lecteur montrera que,
pour f continue à support limité à gauche, il existe une et une seule solution
u à support limité à gauche, et que celle-ci est donnée par
u = a?f
où la fonction a peut être décrite de deux façons. On a d’abord
h
i
h
i
h
i
a = H(t)eλ1 t ? H(t)eλ2 t ? . . . ? H(t)eλm t ,
ce qui permet un calcul explicite de a. On peut aussi déterminer l’unique solution Φ de l’équation homogène qui vérifie Φ(0) = Φ0 (0) = . . . = Φ(m−2) (0) = 0
et Φ(m−1) (0) = 1, et montrer que l’on a a(t) = H(t)Φ(t).
4.4
Récapitulation
La définition et les propriétés de la transformation de Fourier ont été données précédemment soit dans le cadre L1 soit dans le cadre L2 . Nous rassemblons ici ces résultats, légèrement généralisés par la considération de fonctions
appartenant à L1 +L2 .
Nous noterons L1 +L2 l’espace des fonctions qui peuvent s’écrire comme
somme d’une fonction de L1 et d’une fonction de L2 . L’espace Cb +L2 est
défini de manière analogue.
4.4.1 Définition La transformée de Fourier fb = Ff est définie pour f ∈
L1 +L2 , on a alors fb ∈ Cb +L2 . (voir n◦ 4.1.1 et 4.2.3 ).
4.4.2 Mode de calcul La formule intégrale n’est valide que pour f ∈ L1 .
On a toutefois le résultat suivant :
Soit f ∈ L1 +L2 et soit fR la fonction sommable égale à f pour |x| ≤ R et à 0
R
sinon. Si les fonctions fcR (ξ) = |x|≤R e−ix·ξ f (x) dx convergent presque partout
vers une fonction g(ξ), alors fb = g. (voir n◦ 4.2.5 et 4.1.28).
4.4.3 Formule d’inversion Si f ∈ L1 +L2 et si fb ∈ L1 +L2 , on a f =
(2π)−d F(fb) p.p. (voir n◦ 4.1.7 et 4.2.3).
4.4.4 Conjugaison complexe, symétrie, translations, modulations, dilatations Les formules vues dans la section 4.1 sont valables pour f ∈ L1 +L2 .
82
Chapitre 4. Transformée de Fourier
4.4.5 L’échange de la dérivation et de la multiplication par les coordonnées
h
i
F ∂f /∂xj = iξj fb(ξ) si f ∈ C 1 , f ∈ L1 +L2 , ∂f /∂xj ∈ L1 +L2
h
i
F xj f (x) = i
∂ b
f (ξ) si f ∈ L1 , xj f ∈ L1
∂ξj
(voir n◦ 4.1.13, 4.2.8 et 4.1.15).
4.4.6 L’échange de la convolution et de la multiplication
F(f ?g) = fb gb si f ∈ L1 , g ∈ L1 +L2
F(f g) = (2π)−d fb? gb si f ∈ L2 , g ∈ L2
F(f g) = (2π)−d fb?h si f ∈ L1 , h ∈ L1 , g = (2π)−d Fh
(voir n◦ 4.1.22 et 4.2.10, 4.2.11, 4.1.23).
Pour en savoir plus
Nous avons été parfois gênés, et nous le serons encore plus dans les chapitres
suivants consacrés aux applications, par le fait que la transformation de Fourier
n’était définie que pour une classe relativement restreinte de fonctions. Par
exemple, si f est sommable, il ne nous est pas permis en général de parler
de F fb.
Un des grands succès de la théorie des distributions a été d’étendre la définition de la transformation de Fourier à un cadre considérablement plus général,
de telle sorte que les propriétés fondamentales en soient encore valables. Le
lecteur pourra prendre connaissance de cette théorie en consultant [SC1] ou
[GO].
La transformation de Laplace, dont le lecteur peut trouver la définition
dans l’exercice B.2.18, concerne des fonctions définies sur la demi-droite, mais
pouvant avoir une grande croissance en +∞. Elle possède des propriétés comparables à celles de la transformation de Fourier, à laquelle elle est d’ailleurs
étroitement reliée, pour la transformation d’une dérivée ou d’un produit de
convolution. Elle fournit des méthodes simples de résolution d’équations différentielles, équations intégrales, équations intégro-différentielles, . . . On en
trouvera une étude, étendue au cas des distributions dans l’ouvrage de Laurent
Schwartz cité ci-dessus.
4.4. Récapitulation
83
Les tables de transformées de Fourier et de Laplace permettent, au prix
de simples manipulations algébriques, de déterminer des solutions de nombreuses équations sous forme de fonctions explicites. Les quelque 800 pages de
formules (couvrant également les bases hilbertiennes classiques, les fonctions
spéciales, etc.) de [B-E-M-O-T] devraient satisfaire le lecteur le plus exigeant.
Chapitre 5
EDP linéaires du second ordre
Nous nous intéressons dans ce chapitre aux équations stationnaires linéaires
d’ordre 2 dans tout l’espace. Le lecteur pourra constater que les méthodes que
nous allons appliquer s’étendent à certaines équations d’ordre supérieur.
Dans la première section, nous considérons le cas des équations linéaires
à coefficients constants, pour lesquelles nous allons voir que la transformation
de Fourier et la convolution fournissent rapidement des résultats importants.
Les équations à coefficients variables et surtout les équations non linéaires
requièrent d’autres méthodes, notamment des éléments de théorie spectrale.
Nous traitons un exemple particulier d’EDP à coefficients variables dans la
deuxième section de ce chapitre.
Le cas des équations stationnaires posées dans des domaines bornés est
abordé au chapitre 7.
5.1
EDP linéaires du second ordre à coefficients constants
En dimension d’espace d, la forme générale d’une équation aux dérivées
partielles linéaire du second ordre et à coefficients constants est la suivante
−
d
X
j,k=1
aj,k
d
X
∂u
∂ 2u
(x) +
bj
(x) + cu(x) = f (x),
∂xj ∂xk
∂xj
j=1
(5.1)
où les coefficients aj,k , bj , c sont des constantes, le second membre f est une
fonction donnée et u est la fonction inconnue.
86
Chapitre 5. EDP linéaires du second ordre
L’opérateur L qui à u fait correspondre la fonction figurant au membre de
gauche de (5.1) est appelé opérateur différentiel (du second ordre à coefficients
constants). Si u est une fonction de classe C m , m = 2, 3, . . . , ∞, alors Lu est
de classe C m−2 .
L’équation (5.1) se réécrit donc Lu = f ; on dit qu’elle est homogène lorsque
le second membre f est nul.
Le fait que l’opérateur L soit linéaire a immédiatement les conséquences
suivantes.
(i) L’espace des fonctions v de classe C m , m ≥ 2, qui sont solutions de l’équation homogène Lv = 0 est un espace vectoriel.
(ii) Soit u0 une fonction de classe C m vérifiant Lu0 = f . Une fonction u de
classe C m est solution de Lu = f si et seulement si elle peut s’écrire u = u0 +v,
avec v de classe C m solution de l’équation homogène.
5.1.1 Un exemple typique d’équation elliptique
Dans l’espace R3 , nous allons étudier l’équation suivante
−∆u + λu = f ,
(5.2)
où λ est une constante > 0 donnée.
On suppose que f est continue et sommable. Dans un premier temps, nous
allons supposer qu’il existe une solution u de classe C 2 , sommable ainsi que ses
dérivées jusqu’à l’ordre 2, et nous allons montrer que u est alors déterminée
par une formule explicite. Dans un second temps, nous examinerons si la formule obtenue résout effectivement le problème. Dans une dernière étape, nous
exprimerons la solution sous forme d’un produit de convolution.
En faisant sur u les hypothèses ci-dessus, ub est continue bornée et tend
vers 0 à l’infini, et il en est de même de F(∂ 2 u/∂x2j ) = −ξj2 ub(ξ). On a donc
F(∆u) = − |ξ|2 ub(ξ). En écrivant que les deux membres de notre équation ont
même transformée de Fourier, on obtient l’équation
(|ξ|2 + λ)ub(ξ) = fb(ξ) .
On voit ainsi, et c’est un phénomène général, que la résolution d’une équation
aux dérivées partielles linéaire à coefficients constants se ramène à un problème
de division d’une fonction par une autre. Le cas est ici facile du fait que |ξ|2 +λ
ne s’annule pas. On obtient
ub(ξ) =
fb(ξ)
·
|ξ|2 + λ
87
5.1. EDP à coefficients constants
La fonction figurant au membre de droite est bornée et son comportement en
l’infini est du type o(|ξ|−2 ). Elle n’est pas nécessairement sommable, mais elle
est de carré sommable et on peut utiliser la formule d’inversion de Fourier. On
a donc établi le résultat suivant :
Si l’équation possède une solution u de classe C 2 , sommable ainsi que ses
dérivées jusqu’à l’ordre 2, on a nécessairement
(
−3
u = (2π)
F
fb(ξ)
|ξ|2 + λ
)
.
(5.3)
Inversement, la formule (5.3) définit toujours un élément u de L2 dès que f
est sommable. S’il s’avère que cette fonction est de classe C 2 et que ses dérivées
jusqu’à l’ordre 2 sont sommables, alors le calcul précédent montre que u est
effectivement une solution. On peut montrer qu’il suffit en fait que u soit de
classe C 2 pour que ce soit une solution. Sinon, on dit que u est une solution
généralisée de l’équation.
Exercice 5.1.2 On suppose que f est de classe C 4 et que ses dérivées partielles
jusqu’à l’ordre 4 sont sommables. Montrer que l’on a alors ub(ξ) = o(|ξ|−6 ) et
en déduire que u est effectivement de classe C 2 . (Ce résultat est loin d’être
optimal, f de classe C 1 suffirait).
Les espaces adaptés à l’étude de ces solutions sont les espaces de Sobolev
H s (Rd ) (voir exercice 4.2.16). Si f ∈ H s (R3 ), alors u donné par (5.3) appartient
à H s+2 (R3 ). Que faut-il supposer sur s pour garantir que u est de classe C 2
(utiliser l’exercice 4.2.16) ?
Remarque 5.1.3 Si u est la solution de (−∆+λ)u=f fournie par la méthode
précédente, on en obtient d’autres en lui√ajoutant des solutions de l’équation
homogène (par exemple les fonctions e± λx1 ). On peut montrer que la seule
solution de l’équation homogène qui soit de carré sommable est la fonction 0. La
solution u fournie par (5.3) est donc l’unique solution de (5.2) qui appartienne
à L2 .
5.1.4 Expression de la solution en termes de convolution Nous supposerons
désormais que f ∈ L2 . L’expression (5.3) contient la transformée de Fourier
du produit de deux fonctions : la fonction (λ + |ξ|2 )−1 qui, nous l’avons vu,
appartient à L2 et la fonction fb qui appartient aussi à L2 . D’après (4.18)
appliqué à F celle-ci s’exprime comme produit de convolution des transformées
de Fourier :
!
1
−6
u = (2π) F
?
F
fb ,
λ + |ξ|2
88
Chapitre 5. EDP linéaires du second ordre
ou encore
!
1
u = (2π) K ?f , K = F
.
(5.4)
λ + |ξ|2
Le calcul de K est un très bon exemple de calcul de transformée de Fourier
d’une fonction de L2 ne dépendant que de la distance à l’origine.
−3
D’après le n◦ 4.4.2, si la limite suivante
lim
Z
R→∞ |ξ|≤R
eix·ξ
1
dξ
λ + |ξ|2
existe pour presque tout ξ, elle est égale (presque partout) à K. Pour R fixé,
d’après (4.15) l’intégrale ci-dessus définit une fonction ne dépendant que de
r = |x|, égale à
4π Z R ρ sin(rρ)
2π Z R ρ sin(rρ)
dρ
=
dρ ,
r 0 λ + ρ2
r −R λ + ρ2
en remarquant que la fonction est paire.
Grâce au théorème des résidus, le lecteur sait démontrer l’existence de la
limite de cette intégrale pour R → ∞ et il sait calculer sa valeur (voir le
n◦ C.6.3). Il obtiendra
√
K(r) = 2π 2 r−1 e− λ r .
En reportant dans (5.4), on obtient finalement

√

e− λ r 
u=
?f .
4πr
5.1.5 Notion de symbole et opérateurs du second ordre elliptiques
En prenant la transformée de Fourier de la forme générale de l’équation (5.1),
on trouve P (ξ)ub = fb, où P , appelé symbole de L, est le polynôme
P (ξ) =
d
X
aj,k ξk ξj + i
d
X
bj ξj + c.
j=1
j,k=1
On ne peut pas résoudre à coup sûr l’équation en divisant par P (ξ) à cause
de l’existence possible de racines réelles pour P , voir Remarque 5.1.9 plus bas.
La notion fondamentale d’ellipticité permet de résoudre un problème proche
du problème initial.
On dit que l’opérateur L est elliptique s’il existe θ > 0 telle que
∀ξ ∈ Rd ,
X
j,k=1
aj,k ξk ξj ≥ θ|ξ|2 .
89
5.1. EDP à coefficients constants
Dans ce cas, pour γ assez grand (dépendant des coefficients de L), le polynôme P (ξ) + γ ne s’annule pas sur Rd et on peut résoudre le problème
(L + γ)u = f
pour tout f ∈ L2 avec des résultats analogues à ceux obtenus pour l’équation (5.2). Bien sûr, cette méthode est limitée au cas des opérateurs à coefficients constants. Dans la section suivante, nous allons voir que la théorie
spectrale permet de résoudre certaines équations du même type à coefficients
variables.
5.1.6 Equation de Poisson
Revenons sur l’équation de Poisson posée dans R3 déjà traitée au Chapitre 2
∆u = f
(5.5)
en utilisant la transformation de Fourier. On procède comme dans le cas précédent, en espérant que u ait une transformée de Fourier, et que la formule
F(∂u/∂xj ) = iξj ub puisse être appliquée deux fois. En écrivant que les deux
membres de (5.5) ont même transformée de Fourier, on obtient l’équation
|ξ|2 ub(ξ) = fb(ξ) et donc ub(ξ) = fb(ξ) |ξ|−2 . Le membre de droite est le produit de deux fonctions et on peut donc espérer avoir
F ub = (2π)−3 F fb ? F |ξ|−2 .
Nous avons calculé (voir l’exemple 4.1.28) la dernière de ces transformées de
Fourier. Si on peut de plus appliquer la formule d’inversion de Fourier, on aura
donc
(2π)3 u = (2π)−3 (2π)3 f ? 2π 2 /r
ou encore
1
u=
4π
1
?f .
r
(5.6)
Remarque 5.1.7 Le principe précédent peut fournir une preuve, à condition
de définir la transformation de Fourier pour des objets plus généraux que les
éléments de L1 + L2 . Notre problème est que, sauf hypothèses très spéciales
portant sur f , le produit de convolution v = (r−1 )?f n’est ni sommable ni de
carré sommable à l’infini. Par exemple, si f est positive, on voit facilement que
v(x) ≥ Cte / |x| à l’infini et que les intégrales de v et de v 2 sont donc infinies.
L’argument développé ci-dessus tombe ainsi en défaut dès le début : nous ne
savons même pas parler de ub.
Dans l’exercice suivant, on donne une autre démonstration du Théorème 2.2.1.
90
Chapitre 5. EDP linéaires du second ordre
Exercice 5.1.8 Il s’agit de démontrer le Théorème 2.2.1 par une autre méthode. Le produit de convolution v = f ?h est défini dès que h est localement sommable (et donc pour h(x) = 1/ |x|) et v est de classe C 2 ; ∂v/∂xj =
(∂f /∂xj )?h ; ∂ 2 v/∂xj ∂xk = (∂f
/∂xj ∂xk )?h. On posera u = (1/4π)r−1 ?f et
√
on notera uλ = (1/4π)(r−1 e− λr )?f la solution de (−∆ + λ)uλ = f calculée
au n◦ 5.1.1.
(a) Montrer
que √
la fonction
t 7→ t−1 (1−e−t ) est bornée sur ]0, ∞[ et en déduire
√
−1
que r − r−1 e− λr ≤ C λ.
√
(b) En déduire que k∆u − ∆uλ k∞ ≤ C λ k∆f k1 .
(c) Montrer que, pour tout λ, la fonction uλ est majorée en module par la
fonction r−1 ? |f |. En écrivant r−1 comme somme d’une fonction sommable et
d’une fonction bornée, en déduire que kuλ k∞ ≤ C1 kf k1 + C2 kf k∞ .
(d) En écrivant ∆u = (∆u − ∆uλ ) + (∆ − λ)uλ + λuλ , démontrer que l’on a
−∆u = f .
(e) Montrer que u tend vers 0 à l’infini.
Remarque 5.1.9 Nous voyons que la transformation de Fourier permet de ramener la résolution des équations aux dérivées partielles à coefficients constants
à un problème de division de fonctions. Le premier cas étudié, où il fallait diviser par la fonction |ξ|2 + λ qui ne s’annule pas, était assez simple. Dans le
second cas, on a utilisé l’ellipticité et modifié l’équation pour se ramener à une
situation similaire. Dans le troisième cas, il fallait diviser par |ξ|2 qui s’annule
à l’origine, ce qui introduit des singularités dans ub et correspond au fait que
la solution u cherchée décroît relativement peu à l’infini.
Si on voulait résoudre l’équation ∂ 2 u/∂x2 − ∂ 2 u/∂y 2 dans le plan par cette
méthode, on serait amené à diviser par η 2 − ξ 2 , ce qui conduirait à des ub qui
ne sont même pas localement sommables (η et ξ sont les variables de Fourier
correspondant à x et y).
La théorie des distributions permettrait d’une part de donner des énoncés plus généraux et plus simples pour les deux équations que nous avons
étudiées, d’autre part d’attaquer directement des équations du type évoqué cidessus (voir [GO]). Nous allons toutefois retrouver cette équation (rebaptisée
∂ 2 u/∂t2 −∂ 2 u/∂x2 ) dans la section 6 ci-dessous, en utilisant une transformation
de Fourier relative à la variable d’espace.
5.2. EDP à coefficients variables
5.2
91
EDP linéaire du second ordre à coefficients variables
Nous nous limiterons au cas typique d’un opérateur différentiel de la forme
Lu = −∆u + u − c(x)u où c(x) est une fonction réelle donnée, C ∞ et nulle
à l’extérieur d’un compact de Rd . D’une part, on pourrait considérablement
affaiblir les hypothèses sur le coefficient c(x), d’autre part, on pourrait considérer des équations à coefficients variables plus générales, pourvu qu’elles soient
elliptiques, au sens du n◦ 5.1.5.
Notre objectif, pour une fonction f donnée, par exemple dans L2 (Rd ), est
de résoudre le problème
Lu = −∆u + u − c(x)u = f,
(5.7)
c’est-à-dire de préciser les propriétés d’existence et d’unicité de solutions u de
(5.7) en fonction de f .
La stratégie repose sur la transformation du problème initial en un problème compact et l’utilisation de l’alternative de Fredholm (voir section A.5).
En effet, en posant v = −∆u + u, le problème se transforme en
(I − A)v = f
(5.8)
où I est l’identité de L2 et où on a défini l’opérateur
Av = c(x)(−∆ + I)−1 v.
(5.9)
Si l’on montre que l’opérateur A est compact, on peut utiliser l’alternative de
Fredholm sur le problème (I − A)v = f et revenir finalement au problème
initial en résolvant −∆u + u = v par la transformation de Fourier.
Pour mettre en œuvre cette stratégie, nous allons d’abord montrer le résultat suivant.
Lemme 5.2.1 La formule (5.9) définit bien un opérateur borné A sur L2 (Rd ).
De plus, A est un opérateur compact.
L’opérateur (−∆ + I)−1 défini sur L2 en utilisant la transformée de Fourier
comme dans la section 5.1.1 est clairement un opérateur borné. La multiplication par c(x) est également un opérateur borné de L2 car la fonction x 7→ c(x)
est bornée. Donc, la formule (5.9) définit bien un opérateur borné A de L2 .
Soit vn une suite bornée de L2 (Rd ) et wn = Avn . On montre que la suite wn
est bornée dans l’espace de Sobolev H 2 (Rd ). D’abord, si un = (−∆ + I)−1 vn , il
92
Chapitre 5. EDP linéaires du second ordre
est immédiat que la suite (un ) est bornée dans H 2 (Rd ) en utilisant la formule
b
vn
2
d
explicite ubn = 1+|ξ|
2 et la définition de l’espace H (R ), voir section 4.2. En
utilisant le résultat de l’exercice 4.2.16 (c), on voit alors que la suite (wn ) où
wn = c(x)un est aussi bornée dans H 2 (Rd ). Par ailleurs, wn est à support
compact, limité par le support de c(x). On déduit du théorème 4.2.15 qu’il
existe une sous-suite wϕ(n) qui converge dans L2 (Rd ). L’opérateur A est donc
compact dans L2 (Rd ).
5.2.2 Alternative de Fredholm appliquée à I − A
On définit l’ensemble
N = {w ∈ L2 tel que w − Aw = 0}.
Nous appliquons le théorème A.5.6 et son mode d’emploi :
– Soit N = {0} et alors, pour tout f ∈ L2 , il existe une unique solution
v ∈ L2 de (5.8).
– Soit l’ensemble N est non réduit à {0}, de dimension finie, et le problème
v − Av = f admet une solution si et seulement si f ∈ (N ∗ )⊥ où N ∗ =
{w ∈ L2 tel que w − A∗ w = 0} (N ∗ étant de dimension finie, cela revient
à imposer un nombre fini de relations d’orthogonalité sur f ).
Pour en déduire un résultat sur le problème initial, précisons la notion de
solution faible que nous allons adopter, et qui correspond à la façon dont nous
résolvons le problème.
Définition 5.2.3 Pour f ∈ L2 (Rd ), on dit que u ∈ L2 (Rd ) est solution faible
de −∆u + u − c(x)u = f s’il existe v ∈ L2 (Rd ) tel que
−∆u + u = v
et v − c(x)u = f.
La relation −∆u + u = v ci-dessus signifie (|ξ|2 + 1)û = v̂ qui a bien un sens
p.p. pour des fonctions L2 . Toute solution faible appartient en fait à H 2 (Rd ).
Sans autre hypothèse sur f , u n’est pas de classe C 2 en général. En fait,
cette définition correspond au fait que pour une fonction u ∈ H 2 (Rd ), on peut
définir au sens faible les dérivées secondes de u et en particulier ∆u comme
fonctions de L2 . Alors, l’équation −∆u + u − c(x)u = f est vérifiée au sens des
fonctions L2 .
On obtient alors l’alternative suivante, conséquence de l’alternative de Fredholm.
5.2. EDP à coefficients variables
93
Théorème 5.2.4 Soit x ∈ Rd 7→ c(x) une fonction de classe C ∞ , nulle à
l’extérieur d’un compact de Rd .
(a) On a l’alternative suivante :
– Soit, pour tout f ∈ L2 (Rd ), il existe une unique solution faible u du
problème (5.7).
– Soit, il existe des solutions non nulles w du problème homogène Lw = 0.
Ces solutions appartiennent à H s (Rd ), pour tout s ≥ 1, et en particulier
sont de classe C ∞ .
(b) Dans le deuxième cas, la dimension du sous-espace des solutions du problème homogène est finie et le problème (5.7) a une solution si et seulement
si f est orthogonale au sens du produit scalaire L2 à toutes les solutions du
problème homogène.
L’essentiel de la preuve de ce théorème vient du Lemme 5.2.1 et de l’alternative de Fredholm. Complétons les informations obtenues dans la deuxième
partie de l’alternative. Dans le cas où N ∗ n’est pas réduit à {0}, si w ∈ N ∗
alors w = A∗ w et w ∈ L2 (Rd ), ce qui permet de montrer que w ∈ H s (Rd ) pour
tout s ≥ 1 (par récurrence sur s et les arguments de la preuve du lemme 5.2.1).
En particulier, w est de classe C ∞ (utiliser l’exercice 4.2.16) et en appliquant
−∆+I à l’équation w = A∗ w, on voit que w vérifie au sens classique l’équation
homogène Lw = 0. La réciproque est aussi vraie : si w ∈ L2 est solution faible
de Lw = 0, alors w ∈ N ∗ .
Une condition suffisante d’existence de solution au problème (5.8) est donc
l’orthogonalité de f à toutes les solutions classiques appartenant à L2 du problème homogène Lw = 0.
Il est facile de voir que cette hypothèse est nécessaire. En effet, soit u une solution faible de (5.8) et w ∈ L2 vérifiant Lw = 0. On a (v − c(x)u − f | w) = 0
b = (2π)−d (u
b | (|ξ|2 + 1)w)
b =
où (|ξ|2 + 1)ub = vb. Comme (v | w) = (2π)−d (vb | w)
(u | − ∆w + w), en utilisant Lw = 0, on trouve (w | f ) = 0.
Remarque 5.2.5 Pour obtenir une solution classique (u de classe C 2 ), il faut
supposer plus de régularité sur la fonction f (tout en gardant, si N ∗ 6= {0},
les mêmes propriétés nécessaires d’orthogonalité). Dans ce cadre, même si l’on
veut obtenir un résultat final écrit dans des espaces du type C p , on préfère
utiliser les espaces de Sobolev pour transmettre la régularité de f à u. Par
exemple, f ∈ H s pour s > d2 est suffisant pour assurer que u est de classe C 2
et donc une solution classique (voir exercice 4.2.16).
5.2.6 Quelques applications Les équations d’évolution classiques fournissent de nombreuses motivations à la résolution d’équations stationnaires
de type (5.7).
94
Chapitre 5. EDP linéaires du second ordre
(a) Pour l’équation de Schrödinger linéaire avec potentiel c(x)
iψt + ∆ψ + c(x)ψ = 0 ,
il est habituel de chercher des solutions particulières de la forme : ψ(t, x) =
e−iλt u(x) , de telle sorte que l’on s’intéresse au problème aux valeurs propres
suivant : chercher u (non trivial) et λ tels que
−∆u + λu − c(x)u = 0 .
(5.10)
(b) La même remarque s’applique à l’équation de Klein-Gordon
ψtt − ∆ψ + ψ − c(x)ψ = 0 ,
avec des solutions stationnaires ψ(t, x) = u(x), et à l’équation d’Airy avec
potentiel
ψt + (ψxx + c(x)ψ)x = 0 ,
avec des solutions du type ψ(t, x) = u(x − λt) (ondes progressives).
(c) Une autre motivation vient des équations non linéaires, comme par exemple
l’équation de Schrödinger non linéaire :
iψt + ψxx + |ψ|2 ψ = 0 ,
√
2
en dimension un d’espace. On note pour commencer que la fonction q(x) = ch(x)
est solution de l’équation q 00 − q + q 3 = 0 (le calcul est laissé au lecteur). Ainsi,
Q(t, x) = eit q(x) est une solution particulière de l’équation d’évolution cidessus. On étudie la stabilité de cette solution (par rapport aux perturbations
de la condition initiale) en linéarisant l’équation autour de cette solution. En
pratique, on pose ϕ(t, x) = eit (q(x) + ε(t, x)) où ε est une fonction “petite” (en
un sens à préciser). Un calcul élémentaire montre que la fonction ε(t, x) doit
être solution de l’équation suivante :
iεt + εxx − ε + |q + ε|2 (q + ε) − q 3 = 0 .
On développe le terme non linéaire de la façon suivante :
|q + ε|2 (q + ε) − q 3 = (q + ε)(q + ε)(q + ε) − q 3
= 2q 2 ε + q 2 ε + qε2 + 2q|ε|2 + |ε|2 ε .
Comme on étudie les solutions proches de 0, on néglige les termes quadratiques
et cubiques en ε, de sorte que l’équation devient iεt + εxx − ε + 2q 2 ε + q 2 ε = 0.
95
5.2. EDP à coefficients variables
On décompose ε en partie réelle et partie imaginaire : ε = ε1 + iε2 , qui vérifient
alors le système suivant :
∂t ε1 = L2 ε2 ,
−∂t ε2 = L1 ε1 ,
où on a défini les opérateurs : L1 η = −η 00 + η − 3q 2 η et L2 η = −η 00 + η −
q 2 η. Ces opérateurs avec potentiels ch2C(x) sont classiques en physique et leurs
propriétés “spectrales” (dépendant de C) sont très bien connues. Toutefois,
même connaissant bien les opérateurs L1 et L2 , l’étude du système ci-dessus
est loin d’être évidente. On se contente à titre d’exercice d’étudier le noyau de
L1 et L2 , c’est-à-dire les fonctions η ∈ L2 solutions de L1 η = 0 et L2 η = 0.
Exercice 5.2.7 On considère les opérateurs L1 et L2 définis au no 5.2.6. Vérifier
que L1 (q 0 ) = 0 et L2 q = 0. Montrer que q 0 (respectivement, q) est la seule fonction, à une constante multiplicative près, vérifiant L1 η = 0 (respectivement,
L2 η = 0) et appartenant à L2 (R). On pourra utiliser le Wronskien associé à
deux solutions indépendantes de L1 η = 0.
En déduire un résultat d’existence au sens du théorème 5.2.4 de solutions
du problème L1 η = f (respectivement, L2 η = f ) selon les propriétés de f .
Exercice 5.2.8 (Systèmes de deux équations)
1. On considère dans cette première partie le problème suivant : étant donné
f ∈ L2 (Rd ), résoudre le système
(
−∆u1 + u1 − c(x)u2 = f,
−∆u2 + u2 − u1 = 0,
x ∈ Rd ,
x ∈ Rd ,
où c(x) est une fonction donnée.
1.a. Dans cette question, c(x) ≡ c0 est une fonction constante avec c0 < 1.
Montrer que pour tout f ∈ L2 (Rd ), il existe (u1 , u2 ) ∈ H 2 (Rd ) × H 4 (Rd )
solution du système en un sens à préciser.
1.b. On suppose maintenant que c(x) est une fonction de classe C ∞ nulle
à l’extérieur d’un compact. Montrer que l’opérateur défini sur L2 par Av =
c(x)(−∆ + 1)−2 v est borné et compact. En déduire une méthode de résolution
du système dans ce cas et une alternative sur l’existence de solutions faibles
(notion à définir) de ce système pour f ∈ L2 (Rd ).
2. On s’intéresse dans cette deuxième partie au problème
(
−∆u1 + u1 − c(x)u2 = f,
−∆u2 + u2 − d(x)u1 = g,
x ∈ Rd ,
x ∈ Rd ,
où c(x) et d(x) sont des fonctions données, de classe C ∞ et nulles à l’extérieur
d’un compact. Proposer une méthode de résolution de ce système pour f, g ∈
L2 (Rd ) et donner une alternative sur l’existence de solutions faibles.
Chapitre 6
Équations d’évolution sur Rd
Dans ce chapitre, nous appliquons la transformation de Fourier à la résolution de quelques équations d’évolution linéaires et à coefficients constants.
6.1
Equation de la chaleur
La température u(t, x) au point x et à l’instant t dans un corps conducteur
de la chaleur obéit à l’équation suivante (en prenant égales à 1 les constantes
physiques)
∂u
(t, x) − ∆u(t, x) = f (t, x) ,
(6.1)
∂t
où ∆ désigne le Laplacien en les variables d’espace (en dimension 1, il se
réduit à ∂ 2 /∂x2 ). Nous nous placerons dans Rd , les cas d = 1, 2 et 3 ayant leur
importance (tige, plaque ou volume conducteurs).
La fonction f représente d’éventuelles sources de chaleur (f (t, x) dt dx est la
quantité de chaleur fournie au corps conducteur, entre les instants t et t + dt et
dans un voisinage de x de mesure dx). On a f = 0 si le corps est parfaitement
isolé.
Le problème de Cauchy pour l’équation homogène consiste à trouver une
fonction u(t, x), définie dans [0, ∞[×Rd , vérifiant

∂

 ∂t
− ∆ u(t, x) = 0

 u(0, x)
(6.2)
= g(x) ,
où g est une fonction donnée dans Rd , continue et sommable. Nous allons
dans un premier temps supposer l’existence d’une bonne solution, et montrer
98
Chapitre 6. Équations d’évolution sur Rd
que celle-ci est nécessairement déterminée à partir de g par une formule explicite. Nous vérifierons ensuite que la formule trouvée fournit effectivement une
solution.
Supposons donc que u soit une solution de classe C 2 , dont les dérivées
partielles sont, pour chaque valeur de t, sommables dans Rd . On suppose même
que les fonctions ∂u/∂t(t, x) sont majorées en module par une fonction h(x)
sommable dans Rd . Posons alors
Z
ue(t, ξ) =
Rd
e−ix·ξ u(t, x) dx .
(6.3)
On dit que ue, notée également Fx u est la transformée de Fourier partielle
(en x) de u. En appliquant, à t fixé, les résultats connus sur la transformation
de Fourier, on voit que Fx (∂u/∂xj ) = iξj ue, et que
g = − |ξ|2 u
e.
∆u
(6.4)
D’autre part, on a d’après le théorème de dérivation sous le signe somme
Z
∂u
∂ Z
−ix·ξ
e
u(t, x) dx =
e−ix·ξ (t, x) dx ,
∂t Rd
∂t
Rd
la fonction figurant sous le signe somme au membre de droite étant majorée
en module par la fonction sommable h. On a donc
∂ ue/∂t = Fx (∂u/∂t) .
(6.5)
En écrivant l’égalité des transformées de Fourier partielles de (6.2), on obtient

∂

 ∂t
+ |ξ|2 ue(t, ξ) = 0

u
e(0, ξ)
(6.6)
= gb(ξ) .
On voit ainsi — et c’est un phénomène général — qu’une transformation de
Fourier partielle remplace une équation aux dérivées partielles par une équation
différentielle ordinaire, dépendant du paramètre ξ. L’équation ci-dessus est
particulièrement simple à résoudre, on obtient
2
ue(t, ξ) = gb(ξ)e−t|ξ| .
(6.7)
On peut appliquer, à t fixé, la formule d’inversion de Fourier dans Rd : le
membre de droite est le produit d’une gaussienne par gb, qui est une fonction
bornée, et est donc sommable. On doit donc avoir
−d
u(t, x) = (2π)
Z
Rd
2
eix·ξ e−t|ξ| gb(ξ) dξ ,
(6.8)
99
6.1. Equation de la chaleur
ce qui est l’une des manières d’écrire la solution comme une intégrale.
On peut voir dans (6.8), toujours à t > 0 fixé, la transformée d’un produit de deux fonctions de ξ, qui doit donc être à un facteur près le produit
de convolution des transformées de Fourier. On va se ramener à l’énoncé du
2
théorème 4.1.22 en introduisant la fonction Gt (x) = (4πt)−d/2 e−|x| /4t dont
2
la transformée de Fourier partielle est e−t|ξ| (voir (4.5)). C’est une fonction
sommable ainsi que g et on a donc
2
Fx (Gt ?g) = gb(ξ)e−t|ξ| .
La formule (6.7) nous assure que les fonctions sommables u(t, ·) et Gt ?g ont
même transformée de Fourier. Elles sont donc égales presque partout et la
solution u est donnée par
u(t, x) = (Gt ?g) (x) .
(6.9)
Les gaussiennes sont de si bonnes fonctions que la formule (6.9) fournit
effectivement une solution sous des hypothèses très faibles.
Théorème 6.1.1 Si la fonction g est sommable dans Rd , alors la fonction
u(t, x) donnée par
u(t, x) = (4πt)
−d/2
Z
Rd
e−|x−y|
2
/4t
g(y) dy
est de classe C ∞ dans ]0, ∞[×Rd et vérifie l’équation de la chaleur. En outre,
les fonctions u(t, ·) convergent vers g dans L1 (Rd ) lorsque t tend vers 0.
Exercice 6.1.2 Il s’agit de démontrer l’énoncé précédent.
(a) Démontrer que u(t, x) est de classe C ∞ dans ]0, ∞[×Rd . On appliquera le
théorème de dérivation sous le signe somme dans les domaines ]ε, ∞[×Rd . Il
2
sera bon de remarquer que, dans un tel domaine, le produit de e−|x−y| /4t par
un polynôme des variables 1/t et (xj − yj ) est une fonction bornée.
(b) Exprimer sous forme intégrale ∂u/∂t et ∂ 2 u/∂x2j et vérifier que u est solution de l’équation de la chaleur.
(c) En utilisant le théorème B.7.11, montrer que les fonctions Gt ?g convergent
en moyenne vers g.
Remarque 6.1.3 On peut aussi considérer le cas d’une donnée initiale dans
L2 (Rd ). On obtient un résultat similaire, et de plus la fonction t 7→ ku(t)kL2 (Rd )
est décroissante.
100
Chapitre 6. Équations d’évolution sur Rd
Remarque 6.1.4 La fonction définie pour t > 0 par
Φ(t, x) = Gt (x)
est appelée solution fondamentale de l’équation de la chaleur. Cette fonction
vérifie

∂

 ∂t
− ∆ Φ(t, x) = 0, t > 0, x ∈ Rd ,
(6.10)

 Φ(t = 0) = δ ,
0
où δ0 est la masse de Dirac en 0, introduite dans le chapitre sur les mesures
de Radon du cours de Tronc Commun. En effet, le fait que Φ(t, x) vérifie
l’équation de la chaleur pour t > 0 se vérifie par un calcul direct. En ce qui
concerne la valeur de Φ en t = 0, elle est à interpréter de la manière suivante :
pour toute fonction x 7→ f (x) continue sur Rd et à support compact,
lim hΦ(t)|f i = hδ0 |f i = f (0),
t→0, t>0
où la notation hµ|f i désigne l’image de la fonction f par la forme linéaire
µ. On peut aussi interpréter la masse de Dirac comme la limite (au sens des
mesures) d’une approximation de l’identité, définie dans le théorème B.7.11.
Il se trouve que quand t → 0+ , la famille de fonctions x 7→ Φ(t, x) est bien
une approximation de l’identité. Voir n◦ 2.2.2 pour une remarque similaire sur
l’équation de Laplace.
Remarque 6.1.5 Si on voulait résoudre le problème de Cauchy pour t < 0
(c’est-à-dire, connaissant la répartition de la température à l’instant 0, essayer
de déterminer ce qu’elle a été dans le passé), la formule (6.7) montre que
2
la transformée de Fourier de u(t, ·) devrait être gb(ξ)e|t||ξ| . Cela représente,
sauf pour des données g extrêmement particulières, une croissance gigantesque
lorsque ξ tend vers l’infini et il n’existe aucune fonction, ni même aucune
distribution ayant une telle transformée de Fourier.
L’équation de la chaleur, contrairement aux deux équations qui vont suivre,
a un comportement qui change considérablement lorsque l’on renverse le sens
du temps : le problème de Cauchy rétrograde n’a en général pas de solution et
l’équation n’est pas réversible.
Remarque 6.1.6 On remarque que si g ≥ 0, alors pour tout t > 0, la Rsolution
de l’équation de la chaleur vérifie u(t, x) ≥ 0. De plus, si g ≥ 0 et g 6= 0,
alors pour tout t > 0, tout x ∈ Rd , u(t, x) > 0. C’est une illustration de la
vitesse infinie de propagation (une donnée initiale positive non nulle induit une
chaleur non nulle partout instantanément).
101
6.1. Equation de la chaleur
Cette remarque conduit également au principe de comparaison : si u1 (t, x)
et u2 (t, x) sont solutions, et si u1 (0, x) ≥ u2 (0, x) pour tout x, alors pour tout
t > 0, u1 (t, x) ≥ u2 (t, x) pour tout x, et même u1 (t, x) > u2 (t, x) dès que
u1 (0, x) 6≡ u2 (0, x) et t > 0.
Exercice 6.1.7 Pour une fonction f continue, résoudre (6.1) en utilisant le
principe de Duhamel, vu au n◦ 1.1.7.
Exercice 6.1.8 (Équation de la chaleur sur le demi-espace) On définit Rd+ =
[0, +∞[×Rd−1 , pour un entier d ≥ 2. Soit f ∈ L2 (Rd+ ). Donner l’expression
d’une solution du problème suivant
 ∂u

 ∂t
− ∆u = 0,
u(t, x) = 0,


u(0, x) = f (x),
sur ]0, +∞[×Rd+ ,
pour t ∈ [0, +∞[, x = (0, x0 ), x0 ∈ Rd−1 ,
pour x ∈ Rd+ ,
en fonction de f et préciser sa régularité. On pourra utiliser une méthode de
réflexion impaire, c’est-à-dire définir ũ(t, x) par
ũ(t, x) = u(t, x)
ũ(t, x) = −u(t, x̃)
si x1 > 0
si x1 < 0, où x̃ = (−x1 , x2 , . . . , xd ).
Exercice 6.1.9 (Solutions radiales de l’équation de Navier-Stokes)
(1) On dit qu’une fonction ϕ : R2 → R est radiale s’il existe une fonction
1
e
ϕe : [0, +∞[→ R telle que, pour tout x ∈ R2 , ϕ(x) = ϕ(|x|)
où |x| = (x21 + x22 ) 2 .
Montrer que, ϕ étant une fonction radiale de classe C 2 ,
∆ϕ(x) = ϕe00 (|x|) +
1 0
ϕe (|x|).
|x|
(2) On rappelle la définition de l’espace de Schwartz S(R2 ), ensemble des fonctions ϕ de classe C ∞ sur R2 vérifiant : ∀α, β ∈ N2 , supx∈R2 |xα ∂ β ϕ(x)| < ∞, où
xα = xα1 1 xα2 1 et ∂ β ϕ = ∂xβ11 ∂xβ22 ϕ. Dans cette question, on considère ω ∈ S(R2 ).
(2a) Montrer que la fonction ϕ donnée par
(L)
1 Z
ω(y) log |x − y|dy,
ϕ(x) =
2π R2
est bien définie et de classe C ∞ sur R2 et vérifier que pour tout ω ∈ S(R2 ), la
fonction ϕ ainsi définie satisfait ∆ϕ = ω sur R2 .
Chapitre 6. Équations d’évolution sur Rd
102
(2b) Montrer que si la fonction ω est positive et à support compact, alors
ϕ(x)
1 Z
lim
=
ω(y)dy.
|x|→+∞ log |x|
2π R2
(2c) On suppose dans cette question que ω est radiale. Montrer R que ϕ est
e
e et en déduire ϕ
e0 (r) = 1r 0r ω(s)sds.
également radiale. Montrer que (rϕe0 )0 = rω
En déduire
x⊥ Z |x|
⊥
e
∇ ϕ(x) = 2
ω(s)sds,
|x| 0
où ∇⊥ = (−∂x2 , ∂x1 ) et x⊥ = (−x2 , x1 ).
(3) Dans cette question, on considère à nouveau une fonction ω ∈ S(R2 ) et
ϕ donnée par (L). On cherche une fonction u = (u1 , u2 ) : R2 → R2 , de classe
C ∞ , à divergence nulle :
div u = ∂x1 u1 + ∂x2 u2 = 0 sur R2 ,
(D)
et telle que
∂x1 u2 − ∂x2 u1 = ω.
(O)
(3a) Montrer que si u est une telle fonction, alors ∆u1 = −∂x2 ω, ∆u2 = ∂x1 ω.
(3b) Montrer que u = ∇⊥ ϕ vérifie (D) et (O).
(3c) Montrer que
u(x) =
1 Z (x − y)⊥
ω(y)dy.
2π R2 |x − y|2
(3d) On suppose que dans cette question que ω est radiale. Montrer dans ce
cas que
x⊥ Z |x|
e
ω(s)sds.
u(x) = 2
|x| 0
(R)
(4) Pour une fonction v = (v1 , v2 ) : R2 → R2 , on note v · ∇ = v1 ∂x1 + v2 ∂x2 .
Le système de Navier-Stokes incompressible en dimension 2 d’espace s’écrit :
(
(NS)
∂t u + (u · ∇)u = ν∆u − ∇p,
div u = ∂x1 u1 + ∂x2 u2 = 0,
t > 0, x ∈ R2 ,
où :
– u(t, x) : ]0, ∞[×R2 → R2 est la vitesse du fluide au point x à l’instant t ;
103
6.2. Equation de Schrödinger libre
– p(t, x) : ]0, ∞[×R2 → R est la pression dans le fluide ;
– la constante ν > 0 est la viscosité du fluide ;
– ∆ et ∇ concernent seulement les variables d’espace : ∆u = (∂x21 u1 +
∂x22 u1 , ∂x21 u2 + ∂x22 u2 ), (u · ∇)u = (u1 ∂x1 u1 + u2 ∂x2 u1 , u1 ∂x1 u2 + u2 ∂x2 u2 ),
∇p = (∂x1 p, ∂x2 p) ;
– la condition de divergence nulle est imposée pour tout t > 0, x ∈ R2 .
On s’intéresse à des solutions u(t, x) de classe C ∞ sur ]0, +∞[×R2 .
(4a) Expliciter le système d’équations vérifiées par u1 (t, x), u2 (t, x) et p(t, x).
(4b) Montrer que si u(t, x) vérifie (NS) pour une certaine fonction p(t, x), alors
ω(t, x) définie à partir de u(t, x) par (O) vérifie
∂t ω + u · ∇ω = ν∆ω.
(4c) On suppose que ω est radiale et que u est reliée à ω par la relation (R).
Montrer que u · ∇ω = 0. Ainsi dans ce cas, ω vérifie l’équation de la chaleur
(C)
∂t ω = ν∆ω.
(4d) Justifier que
!
1
x
ω(t, x) = G √
,
νt
νt
G(y) =
1 − |y|2
e 4 ,
4π
est une solution de (C) pour t > 0. Calculer la fonction u(t, x) correspondante
(appelée vortex de Lamb-Oseen). Montrer que pour tout t > 0, x 7→ u(t, x) 6∈
(L2 (R2 ))2 .
6.2
Equation de Schrödinger libre
La fonction d’onde u(t, x) ∈ C d’une particule libre obéit à l’équation
suivante (en prenant égales à 1 les constantes physiques)
i
∂u
(t, x) + ∆u(t, x) = 0 .
∂t
(6.11)
Le problème de Cauchy consiste à déterminer une solution dans R × Rd de
cette équation vérifiant u(0, x) = g(x), la fonction g étant donnée.
La seule condition portant sur g que souhaite imposer la physique est le
fait que cette fonction soit de carré sommable (et de norme 1 dans L2 ). En
Chapitre 6. Équations d’évolution sur Rd
104
supposant de plus (voir l’exercice 6.2.1) que la solution soit assez régulière
pour que (6.4) et (6.5) soient valides, on doit avoir
i
∂ ue
(t, ξ) − |ξ|2 ue(t, ξ) = 0
∂t
avec ue(0, ξ) = gb(ξ). La solution est évidente
2
ue(t, ξ) = gb(ξ)e−it|ξ| .
(6.12)
Pour t fixé, on obtient une fonction ayant même module (et donc même norme
dans L2 ) que ub. On peut donc poser
u(t, x) = (2π)−d F x ue(t, ·) (x) ,
(6.13)
et la transformation de Fourier étant (à un facteur près) une isométrie, on a
ku(t, ·)k2 = kgk2 .
C’est cette fonction que la mécanique quantique, pour une donnée normalisée par kgk2 = 1, appelle la solution de l’équation de Schrödinger. Elle est
définie pour tout temps et la normalisation est conservée au cours de l’évolution. On peut démontrer que u est effectivement une “solution au sens des
distributions” de l’équation. Par contre, si on veut une solution usuelle de
classe C 2 , il est nécessaire de faire des hypothèses supplémentaires sur g.
Exercice 6.2.1 On suppose, en dimension 3, que g est de classe C 4 et qu’elle est
de carré sommable ainsi que ses dérivées partielles jusqu’à l’ordre 4. Montrer
que, pour la solution définie par (6.13), les fonctions ∂u/∂t et ∂ 2 u/∂x2j sont
continues et que l’équation de Schrödinger est vérifiée au sens classique (on
montrera que |ξ|2 ue(t, ξ) et ∂ ue/∂t sont majorées en module par une fonction
de ξ sommable et indépendante de t).
Formuler une hypothèse sur g en terme d’appartenance à un espace de
Sobolev H s (R3 ) pour obtenir les mêmes conclusions.
6.2.2 Formule de représentation Pour aller plus loin à partir de (6.13),
on admet que la formule
F e−|x|
2 /2a
d
1
2
= (2πa) 2 e− 2 a|ξ| ,
s’étend au cas des paramètres complexes
√
1
2
2
F e−|x| /2z = ( 2πz)d e− 2 z|ξ| ,
105
6.3. Equation des ondes
√
désignant la détermination principale de la racine carrée.
Par la formule précédente, ou par analogie avec l’équation de la chaleur, on
avance l’expression suivante pour la solution de l’équation de Schrödinger
−d/2 −idπ/4
u(t, x) = (4πt)
e
Z
ei|x−y|
2 /4t
g(y)dy.
Pour g assez régulière et à support compact, on peut vérifier directement sur
cette formule que u(t, x) vérifie l’équation. On peut aussi montrer (voir [EV]
par exemple), mais nous l’admettrons, que la solution u(t, x) vérifie la condition
initiale u(0, x) = g(x) dans le sens suivant
lim ku(t) − gkL2 (R3 ) = 0.
t→0, t>0
De même que pour l’équation de la chaleur, la fonction
Φ(t, x) = (4πt)−d/2 e−idπ/4 ei|x|
2 /4t
est appelée la solution fondamentale de l’équation de Schrödinger.
Remarque 6.2.3 L’équation de Schrödinger ne présente pas d’effet régularisant
comme celui de l’équation de la chaleur. Ce phénomène est lié à la réversibilité
de l’équation
si u(t, x) est solution alors u(−t, x) est solution.
Un autre type d’effet régularisant est disponible pour l’équation de Schrödinger, mais il est particulièrement subtil. On pourra consulter à ce propos la
composition d’analyse et probabilités du concours externe de l’agrégation de
2000.
Finalement, en développant le carré |x − y|2 , on observe que l’expression
de la solution u(t, x) en fonction de g présente beaucoup d’analogie avec la
transformée de Fourier
u(t, x) = (4πt)
6.3
−d/2 −idπ/4 i|x|2 /4t
e
e
Z
e−i(x·y)/2t ei|y|
2 /4t
Equation des ondes
On recherche une solution u(t, x), définie sur R × Rd de
∂ 2u
(t, x) − ∆u(t, x) = 0 ,
∂t2
g(y)dy.
Chapitre 6. Équations d’évolution sur Rd
106
et, l’équation étant du second ordre en t, le problème de Cauchy consiste
à déterminer la solution de cette équation satisfaisant aux deux conditions
initiales
∂u
u(0, x) = g(x)
;
(0, x) = h(x) ,
∂t
où g et h sont des fonctions données dans Rd dont nous préciserons plus loin
la régularité.
En supposant que la solution u existe et soit assez régulière pour pouvoir
appliquer (6.4) et deux fois de suite (6.5), on obtient les conditions suivantes
portant sur ue :
∂ 2 ue
∂ ue
b
(0, ξ) = h(ξ)
.
(t, ξ) + |ξ|2 ue(t, ξ) = 0 , ue(0, ξ) = gb(ξ) ,
2
∂t
∂t
La solution est explicite, on obtient
b
ue(t, ξ) = gb(ξ) cos(|ξ| t) + h(ξ)
sin(|ξ| t)
,
|ξ|
(6.14)
et on en déduit u = (2π)−d F x ue.
Théorème 6.3.1 Selon la dimension de l’espace, la solution u(t, x) de l’équation des ondes donnée par (6.14) s’écrit de la façon suivante :
– d=1:
u(t, x) =
1
1 Z x+t
h(y)dy + [g(x + t) + g(x − t)] .
2 x−t
2
– d=2:



1 ZZ
h(x + z)
g(x + z)
∂  1 ZZ
u(t, x) =
,
1 dz +
1 dz
2π D(0,t) (t2 − |z|2 ) 2
∂t  2π D(0,t) (t2 − |z|2 ) 2 
où D(0, t) est le disque de rayon t centré à l’origine et dz est l’élément
de surface de ce disque.
– d=3:
1 ZZ
∂
u(t, x) =
h(x + z) dσz +
4πt z∈S(0,t)
∂t
(
1 ZZ
g(x + z) dσz
4πt z∈S(0,t)
)
,
où S(0, t) est la sphère de rayon t centrée à l’origine et dσz est l’élément
de surface de cette sphère.
107
6.3. Equation des ondes
Pour la dimension 1, la formule a déjà été vue au chapitre 1 (formule de
d’Alembert). La méthode pour trouver les formules en dimensions 2 et 3 est
assez particulière : on commence par le cas de la dimension 3 et on en déduit
la formule en dimension 2 par la méthode de descente. On commence par le
cas particulier où g = 0 et ainsi
−d
u(t, x) = (2π)
Z
Rd
sin(|ξ| t) iξ·x
e dξ
|ξ|
b
h(ξ)
(6.15)
se déduit directement de (6.14) et de la formule d’inversion de Fourier (théorème 4.1.7).
En dimension 3, on utilise un calcul préliminaire. D’abord, par intégration
directe, on observe
Z 2π Z π
0
e
i|ξ|t cos ϕ 2
2
t sin ϕ dϕdθ = 2πt
Z π
ei|ξ|t cos ϕ sin ϕ dϕ
0
0
=
2πt h i|ξ|t cos ϕ iπ
sin(|ξ|t)
e
= 4πt
.
0
i|ξ|
|ξ|
Rappelons la formule élémentaire suivante, pour tout vecteur ξ, pour tout
vecteur unitaire v :
ZZ
z∈S(0,t)
eiξ·z dσz =
ZZ
z∈S(0,t)
ei|ξ|(v·z) dσz .
En particulier, en utilisant les coordonnées sphériques
x = r sin ϕ cos θ, y = r sin ϕ sin θ, z = r cos ϕ, ϕ ∈ [0, π[, θ ∈ [0, 2π[,
et en prenant v = e3 dans la formule précédente, on trouve
sin(|ξ|t)
1 ZZ
=
eiξ·z dσz .
|ξ|
4πt z∈S(0,t)
Ainsi, par la formule de Fubini,
ZZ
(2π)−3 Z b
iξ·x
u(t, x) =
h(ξ)e
eiξ·z dσz
4πt
z∈S(0,t)
Z
1 ZZ
−3
iξ(x+z)
b
=
(2π)
h(ξ)e
dξ dσz
4πt z∈S(0,t)
1 ZZ
=
h(x + z)dσz .
4πt z∈S(0,t)
Chapitre 6. Équations d’évolution sur Rd
108
Pour la dimension 2, on utilise l’artifice suivant : pour ξ = (ξ1 , ξ2 ), on pose
e Alors,
ξe = (ξ1 , ξ2 , 0), de telle sorte que |ξ| = |ξ|.
e
sin(|ξ|t)
sin(|ξ|t)
1 ZZ
e
=
=
eiξ·z dσz
e
|ξ|
4πt z∈S(0,t)
|ξ|
Z 2π Z π
1
e−it sin ϕ(ξ1 cos θ+ξ2 sin θ) t2 sin ϕdϕdθ.
=
4πt 0 0
On change de variable, en posant α = t sin ϕ = |(t sin ϕ cos θ, t sin ϕ sin θ)|, de
2 1
telle sorte que (pour ϕ ∈ [0, π2 [, utiliser dα = t cos ϕdϕ = t(1 − αt2 ) 2 dϕ =
1
(t2 − α2 ) 2 dϕ, et un argument de symétrie pour ϕ ∈ [ π2 , π[)
1 Z 2θ Z t iα(ξ1 cos θ+ξ2 sin θ)
α
sin(|ξ|t)
=
e
1 dα
|ξ|
2π 0 0
(t2 − α2 ) 2
=
1 ZZ
eiξ·z
dz,
2π z∈D(0,t) (t2 − |z|2 ) 21
en utilisant les coordonnées polaires (α, θ). Ainsi, en procédant comme précédemment, u(t, x) défini par (6.15) en dimension 2 s’écrit
ZZ
(2π)−2 Z b
eiξ·z
iξx
h(ξ)e dξ
u(t, x) =
1 dz
2π
z∈D(0,t) (t2 − |z|2 ) 2
1 ZZ
h(x + z)
=
dz.
2π z∈D(0,t) (t2 − |z|2 ) 12
∂
Par ailleurs, on remarque par un calcul direct que v(t, x) = ∂t
u(t, x) est
∂2v
alors solution de l’équation des ondes ∂t2 (t, x)−∆v(t, x) = 0 avec les conditions
initiales suivantes :
v(0, x) = ut (0, x) = h(x), vt (0, x) = utt (0, x) = ∆u(0, x) = 0.
Pour tous g et h, on obtient donc par linéarité les formules proposées pour les
dimensions 2 et 3.
Remarque 6.3.2 En dimension 3, la formule fait apparaître le phénomène de
propagation à vitesse constante 1 : pour que u(t0 , x0 ) soit non nul, il est nécessaire qu’il existe au moins un point y0 , situé à la distance t0 du point x0 et
qui appartienne au support de g ou de h. Autrement dit, si les fonctions g et
h sont nulles hors d’un petit voisinage de y0 , la solution sera nulle en dehors
d’un petit voisinage du “cône d’onde” : {(t, x)| |x − y0 | = |t|}.
109
6.3. Equation des ondes
Pour l’équation des ondes en dimension 2, la situation est différente. Pour
des données du même type, la solution sera bien nulle à l’extérieur d’un voisinage du cône d’onde, mais elle sera en général non nulle à l’intérieur du cône
(c’est-à-dire pour |x − y0 | ≤ |t|).
Remarque 6.3.3 Les conditions que la physique souhaite imposer sont que g,
h et les ∂g/∂xj soient de carré sommable. Plus précisément, on introduit
1Z
Ec (t) =
2
∂u 2
∂t Z
−d 1
dx = (2π)
2
2
∂u
e
∂t dξ
et
2
1Z
1Z
1 Z X ∂u Ep (t) =
dx = (2π)−d
|∇u|2 dx =
|ξ|2 |ue|2 dξ
∂xj 2
2
2
qui représentent respectivement l’énergie cinétique et l’énergie potentielle
(demi-intégrale du carré du champ ∇u).
En reportant l’expression (6.14) dans ces formules, on obtient
2(2π)d Ec =
2(2π)d Ep =
2(2π)d (Ec + Ep ) =
2
Z b
− |ξ| g
dξ
b
(ξ)
sin(|ξ|
t)
+
h(ξ)
cos(|ξ|
t)
2
Z
2 b
|ξ| gb(ξ) cos(|ξ| t) + (h(ξ)/ |ξ|) sin(|ξ| t)
Z 2 b
2
2
|ξ| |gb(ξ)| + h(ξ) dξ .
dξ
L’énergie
totale estdonc conservée au cours de l’évolution, si l’énergie initiale
1/2 khk22 + k∇gk22 est finie.
Là encore, sous ces hypothèses minimales, on obtient une solution “généralisée”. Le lecteur pourra montrer, par exemple, que pour des données g et
h de classe C ∞ et à support compact, la fonction u(t, x) déterminée par la
formule (6.14) est de classe C ∞ et est une solution classique.
Chapitre 7
Quelques autres méthodes de
résolution d’EDP linéaires
Dans ce chapitre, nous évoquons quelques autres méthodes de résolution
d’EDP linéaires. Nous considérons le cas d’EDP stationnaires ou d’évolution
posées sur des domaines bornés généraux, et de l’équation de Schrödinger posée
sur R3 avec potentiel. Certains arguments sont présentés de façon formelle,
leur justification nécessiterait l’introduction de notions d’analyse fonctionnelle
dépassant le cadre de ce cours comme la théorie des traces et la théorie des
opérateurs non bornés.
7.1
Résolution d’une équation elliptique dans
un domaine borné
Tout d’abord, précisons la définition d’un ouvert à bord C ∞ . On dit que
Ω est un ouvert de Rd à bord C ∞ (ou régulier) si pour tout x0 ∈ ∂Ω, il existe
un voisinage ouvert V de x0 dans Rd et un difféomorphisme ψ, de classe C ∞
de V sur un voisinage de ψ(x0 ) = 0 tel que ψ(V ∩ Ω) ⊂ {x ∈ Rd , xd > 0} et
ψ(V \ Ω) ⊂ {x ∈ Rd , xn ≤ 0}. Cela signifie que la frontière de Ω est de classe
C ∞ et que l’ouvert Ω est “situé localement d’un seul côté de la frontière”.
Nous nous plaçons dans un ouvert Ω à bord C ∞ de Rd (d = 1, 2 ou 3), que
nous supposons également borné et connexe par arc (en dimension 1, Ω est un
intervalle ouvert borné).
Considérons à titre d’exemple l’équation suivante, posée dans un tel domaine Ω de Rd :
−∆u + u = f, u|∂Ω = 0 .
112
Chapitre 7. Quelques autres EDP
Nous allons montrer l’existence de solutions à cette équation en utilisant la
notion de convergence faible introduite au Chapitre A.3. Ceci nous fournira une
notion affaiblie de la solution, dans la mesure où nous allons démontrer qu’il
existe une fonction u de carré sommable, et dont toutes les dérivées partielles
sont de carré sommable, telle que pour toute fonction h suffisamment régulière
(les hypothèses sur h seront précisées par la suite) et s’annulant sur le bord
de Ω, on a
Z
(∇u · ∇h + uh − f h)(x) dx = 0 ,
Ω
∂u
∂u
, . . . , ∂x
· Une intégration par parties montre
où l’on a noté ∇u le vecteur ∂x
1
d
que u vérifie l’équation cherchée en un sens généralisé.
Nous appellerons H01 (Ω) l’espace des fonctions f nulles au bord de Ω, telles
que
kf k2H01 (Ω) = kf k2L2 (Ω) + k∇f k2L2 (Ω) < ∞ .
Il faudrait discuter du sens donner à ∇f ∈ L2 (Ω) ainsi qu’à la possibilité
de considérer les valeurs sur le bord ∂Ω d’une telle fonction (sa “trace sur le
bord”). Cette notion est abordée dans le cas du demi-espace dans l’exercice
4.2.17, mais le cas général dépasse le cadre de ce cours. Par analogie avec
l’exerice 4.2.17, nous admettrons qu’à une fonction f telle que kf kH01 (Ω) < ∞,
on peut effectivement associer une fonction définie (presque partout) sur ∂Ω.
Ainsi, on peut bien parler de fonctions telles que kf kH01 (Ω) < ∞ et nulles sur
le bord. Il n’est pas difficile de démontrer que l’espace vectoriel des fonctions
de H01 (Ω) muni du produit scalaire associé à cette norme, est un espace de
Hilbert.
Introduisons la fonctionnelle
(
F :
H01 (Ω) → R
u
7→ 21 k∇uk2L2 + 12 kuk2L2 − (f |u)L2
où f est supposée être dans l’espace H01 (Ω). On constate facilement, par l’inégalité de Cauchy-Schwarz, que
1
1
F (u) ≥ k∇uk2L2 + kuk2L2 − kf kL2 kukL2 .
2
2
La fonctionnelle F est donc minorée. Soit m la borne inférieure de F ,
et soit (uj )j∈N une suite minimisante de F , c’est-à-dire une suite telle
que lim F (uj ) = m. Nous allons montrer qu’il existe une sous-suite de (uj )j∈N
j→∞
qui converge fortement dans H01 (Ω). On constate d’abord que la suite (uj )j∈N
est bornée dans H01 (Ω). En effet pour j ∈ N assez grand, on a
1
1
k∇uj k2L2 + kuj k2L2 ≤ m + 1 + (f |uj )L2
2
2
7.1. Équation elliptique dans un domaine borné
113
et l’inégalité de Cauchy-Schwarz donne
1
(f |uj ) ≤ kf kL2 kuj kL2 ≤ kf k2L2 + kuj k2L2
4
ce qui permet de conclure. Par l’exercice A.3.28 on déduit de la borne sur la
suite (uj )j∈N qu’il existe u ∈ H01 (Ω) et une sous-suite (que nous continuerons
de noter (uj )j∈N pour simplifier les notations) telles que (uj )j∈N converge faiblement vers u dans H01 (Ω). Montrons maintenant que cette convergence est
forte. Par construction de u, on sait que
lim (f |uj ) = (f |u) ,
j→∞
et la proposition A.3.23 implique que
kukH01 (Ω) ≤ lim inf kuj kH01 (Ω) .
j→∞
De plus,
lim F (uj ) = m ,
j→∞
d’où
1
lim inf kuj k2H01 (Ω) − (f |u)
2 j→∞
1
kuk2H01 (Ω) − (f |u) = F (u) ,
≥
2
m = lim inf F (uj ) =
j→∞
d’où l’on tire que nécessairement
1
kuk2H01 (Ω) − (f |u) = m .
2
En particulier, lim inf j→∞ kuj kH01 (Ω) = kukH01 (Ω) , et donc par la proposition A.3.23 la suite (uj )j∈N converge fortement vers u dans H01 (Ω).
Pour conclure à l’existence d’une solution à l’équation elliptique, il suffit
enfin de remarquer que u minimise la fonctionnelle F , donc que dF (u) = 0.
Cela signifie que pour tout h ∈ H01 (Ω), on a (dF (u)|h) = 0, ou encore que
Z
(∇u · ∇h + uh − f h)(x) dx = 0 ,
Ω
ce que nous voulions démontrer : l’équation elliptique est ainsi vérifiée en un
sens généralisé.
114
7.2
Chapitre 7. Quelques autres EDP
Le Laplacien dans un domaine borné
Le Laplacien nous fournira ici deux exemples importants, selon la condition
imposée à la frontière, d’opérateur non borné. Nous nous placerons dans un
ouvert borné Ω de Rd , d = 1, 2 ou 3 qui est régulier au sens de la définition
du début de la section 7.1.
On dit qu’une fonction f appartient à C k (Ω) si f est définie et continue
dans Ω, est de classe C k dans Ω, et si les dérivées partielles d’ordre ≤ k se
prolongent continûment à la frontière. Si u ∈ C 2 (Ω), alors ∆u définit une
fonction continue sur Ω.
Le théorème suivant, admis dans le cadre de ce cours, résume les principales
propriétés des fonctions propres du Laplacien associées à la condition, dite “de
Dirichlet”, de nullité à la frontière.
Théorème 7.2.1 (Fonctions propres du Laplacien avec condition de
Dirichlet) Il existe une base hilbertienne (Φj ), j = 1, 2 . . . de L2 (Ω) et une
suite (λj ) de nombres réels vérifiant les propriétés suivantes
Φj ∈ C ∞ (Ω) ;
Φj (x) = 0 pour x ∈ ∂Ω ,
∆Φj = −λj Φj ,
0 < λ1 < λ2 ≤ λ3 ≤ λ4 ≤ . . . ;
λk −−→ +∞ .
k→∞
Les valeurs propres λj sont déterminées de manière unique. La première valeur
propre est simple, les suivantes peuvent être multiples, mais l’espace propre
correspondant est de multiplicité finie. Les sous-espaces propres sont déterminés de manière unique.
Exemple 7.2.2 En dimension 1, si Ω est l’intervalle ]0, L[, nous connaissons
déjà la solution. Nous avons vu en effet, en posant ω = π/L, que les fonctions
Φk (t) = (L/2)−1/2 sin(kωt) forment une base hilbertienne de L2 ([0, L]). Ces
2
fonctions s’annulent à la frontière et vérifient dtd 2 Φk = −k 2 ω 2 Φk . On a donc
λk = k 2 ω 2 .
Exemple 7.2.3 Le théorème 7.2.1 est encore valable pour des ouverts à frontière régulière par morceaux (en définissant bien ce concept), les fonctions
propres n’étant toutefois plus, en général, de classe C ∞ dans les “coins”
de l’ouvert. Si Ω est le rectangle du plan ]0, L[×]0, L0 [, en posant ω =
π/L et ω 0 = π/L0 il résulte du n◦ B.6.16 que les fonctions Φkk0 (x, y) =
115
7.2. Le Laplacien dans un domaine borné
(LL0 /4)−1/2 sin(kωx) sin(k 0 ω 0 y) forment une base hilbertienne de L2 (Ω). On a
∆Φkk0 = −(k 2 ω 2 +k 02 ω 02 )Φkk0 . En rangeant par ordre croissant les k 2 ω 2 +k 02 ω 02 ,
on obtient la suite des λj . Il existe des valeurs propres multiples si et seulement
si L02 /L2 est rationnel.
Théorème et Définition 7.2.4 (opérateur ∆dir ) On dit qu’un élément u
de L2 (Ω) appartient au domaine de ∆dir , ce que l’on notera u ∈ D(∆dir ) si les
composantes cj (u) = (Φj | u) dans la base des Φj vérifient
X
λ2j |cj (u)|2 < ∞ .
(7.1)
On appelle ∆dir l’opérateur appliquant D(∆dir ) dans L2 défini par
∆dir u = −
∞
X
λj cj (u)Φj ,
1
la série convergeant en moyenne quadratique.
Toute fonction u ∈ C 2 (Ω) qui s’annule sur ∂Ω appartient à D(∆dir ) et on
a alors ∆dir u = ∆u.
Nous nous bornerons à vérifier que la série converge bien en moyenne quadratique. Comme c’est une série de termes orthogonaux (voir le théorème A.3.2),
il faut et il suffit que la suite des normes (qui valent ici λj |cj (u)|) soit de carré
sommable, et c’est bien ce qui est garanti par l’appartenance de u à D(∆dir ).
7.2.5 Remarques et compléments Les fonctions appartenant à C 2 (Ω) qui ne
s’annulent pas à la frontière n’appartiennent pas à D(∆dir ). L’opérateur ∆dir
rend compte à la fois de l’opérateur différentiel considéré (le laplacien) et de
la condition aux limites.
En dimension 1, pour Ω =]0, L[, les éléments de D(∆dir ) appartiennent à
C 1 (Ω) et sont nuls aux deux extrémités, mais ils ne sont pas en
général de
Rx
2
0
0
classe C . Si u ∈ D(∆dir ) et si ∆dir u = f , on a u (x) = u (0) + 0 f (t) dt, ce
qui est une manière de dire que “la dérivée seconde de u est égale à f en un
sens faible”.
En dimension 2 et 3, les éléments de D(∆dir ) sont des fonctions continues
nulles à la frontière, mais elles ne sont en général même pas de classe C 1 . On
a toutefois “∆u = f au sens des distributions”.
On peut donner un équivalent de la valeur de λj lorsque j → ∞ : on a

2

 (πj/µ(Ω))
λj ∼  (4πj/µ(Ω))

2/3
(6π 2 j/µ(Ω))
pour d = 1
pour d = 2
pour d = 3 ,
(7.2)
116
Chapitre 7. Quelques autres EDP
où µ(Ω) est la mesure de Lebesgue n-dimensionnelle de Ω.
La condition (7.1) d’appartenance à D(∆dir ) peut donc être remplacée par
2
j (f )| < ∞.
P 4/d
j |c
7.2.6 Equation −∆dir u − λu = f
La fonction f étant donnée dans L2 , on recherche une solution u appartenant à D(∆dir ). Si la solution obtenue est de classe C 2 , ce sera une solution
classique nulle à la frontière de −∆u − λu = f , sinon ce sera une solution
généralisée. Rappellons que nous avons obtenu des solutions “généralisées” à
ce type d’équation dans la section précédente, dans le cas λ < 0.
En égalant les composantes des deux membres selon la base hilbertienne
des Φj , on obtient
(λj − λ)cj (u) = cj (f ) .
(7.3)
Deux cas sont donc à considérer.
Si λ n’est pas une des valeurs propres λj , l’équation possède une solution
P
et une seule. En effet, on pose alors γj = cj (f )/(λj − λ) et u = γj Φj , la série
convergeant en moyenne quadratique. Pour montrer que u ∈ D(∆dir ), il faut
P
vérifier d’après (7.1) que λ2j |γj |2 < ∞ ; on a
X
λ2j
2
|γj | ≤
2
X
λ
j
|cj (f )|2
sup λ
−
λ
j
j
<∞.
j
On a ainsi montré que si λ n’est pas une valeur propre de −∆dir , il n’appartient
pas au spectre.
Si λ est une valeur propre de multiplicité m, l’équation n’est résoluble que
si f vérifie m équations intégrales. L’ensemble des solutions est alors de dimension m. Si on a λ = λl = . . . = λl+m−1 , l’équation (7.3) relative à chacun
des indices l + p, 0 ≤ p < m ne peut être résolue que si cl+p (f ) = 0, c’est à
dire si
Z
Φl+p (x)f (x) dx = 0 , p = 0, . . . , m − 1 ,
Ω
ce qui signifie encore que la projection de f sur l’espace propre relatif à λ est
nulle.
Si ces conditions sont vérifiées, les solutions sont données par
X
u=
j ∈{l,...,l+m−1}
/
où les Cp sont arbitraires.
m−1
X
cj (f )
Φj +
Cp Φl+p ,
λ − λj
p=1
117
7.2. Le Laplacien dans un domaine borné
Nous abordons maintenant une autre condition à la frontière, dite “de Neumann”. On notera ν le vecteur normal en chaque point de ∂Ω et on demandera
que la dérivée normale ∂u/∂ν soit nulle en tout point frontière. Si on introduit le gradient de u, il est équivalent de demander que ∇u soit tangent à ∂Ω
en tout point frontière, ou encore de demander que le flux de ∇u à travers
n’importe quelle portion de la frontière soit nul.
Théorème 7.2.7 (Fonctions propres du Laplacien avec condition de
Neumann) Il existe une base hilbertienne (Ψj ), j = 1, 2, . . . de L2 (Ω) et une
suite (µj ) vérifiant les propriétés suivantes
∂Ψj
(x) = 0 pour x ∈ ∂Ω ,
∂ν
Ψj ∈ C ∞ (Ω) ;
∆Ψj = −µj Ψj ,
0 = µ1 < µ2 ≤ µ3 ≤ µ4 ≤ . . .
µk −−→ +∞ .
k→∞
Remarque 7.2.8 Pour cette condition aux limites, 0 est une valeur propre,
les fonctions propres étant les constantes. Au contraire, pour la condition de
Dirichlet, la première valeur propre de −∆ est strictement positive.
Les λj et les µj ont le même équivalent asymptotique (7.2), mais sont en
général différentes.
Exercice 7.2.9 En dimension 1, si Ω est l’intervalle ]0, L[, ou bien en dimension
2 si Ω est le rectangle ]0, L[×]0, L0 [, déterminer explicitement les valeurs propres
et les fonctions propres. On utilisera les développements en demi-période en
série de cosinus.
Théorème et Définition 7.2.10 (opérateur ∆neu ) On dit qu’un élément u
de L2 (Ω) appartient au domaine de ∆neu , ce que l’on notera u ∈ D(∆neu ) si
les composantes dj (u) = (Ψj | u) dans la base des Ψj vérifient
X
µ2j |dj (u)|2 < ∞
On appelle ∆neu l’opérateur appliquant D(∆neu ) dans L2 défini par
∆neu u =
∞
X
µj dj (u)Ψj ,
1
la série convergeant en moyenne quadratique.
Toute fonction u ∈ C 2 (Ω) dont la dérivée normale s’annule sur ∂Ω appartient à D(∆neu ) et on a alors ∆neu u = ∆u.
118
Chapitre 7. Quelques autres EDP
Remarque 7.2.11 Bien qu’ils correspondent tous deux au Laplacien, les opérateurs ∆dir et ∆neu doivent être considérés comme très différents : ils ne sont
pas définis sur le même domaine, ils n’ont ni les mêmes valeurs propres ni les
mêmes vecteurs propres, etc.
7.2.12 Equation −∆neu u − λu = f
La fonction f étant donnée dans L2 , on recherche une solution u appartenant à D(∆neu ). Si la solution obtenue est de classe C 2 , ce sera une solution
classique de −∆u − λu = f dont la dérivée est nulle sur ∂Ω, sinon c’en sera
une solution généralisée.
La démarche est exactement la même que pour la condition de Dirichlet.
On doit résoudre pour tout j l’équation (µj − λ)dj (u) = dj (f ), et on doit
distinguer deux cas.
Si λ n’est pas une des valeurs propres µj , l’équation possède une solution
et une seule donnée par
X dj (f )
Ψj .
u=
λ − µj
Si λ est une valeur propre de multiplicité m, l’équation n’est résoluble que
si f vérifie m conditions intégrales exprimant l’orthogonalité avec les fonctions
propres. Si elles sont vérifiées, l’ensemble des solutions est alors de dimension m.
En particulier, pour λ = 0, l’équation −∆neu u R= f n’est résoluble que
si f est orthogonale aux constantes, c’est-à-dire si f (x) dx = 0. La valeur
propre 0 étant simple, il n’y a pas d’autre condition à imposer à f . D’autre
part, la somme d’une solution et d’une constante est encore une solution.
7.2.13 Une interprétation physique
L’ouvert Ω représente une tige, plaque ou solide métallique en état d’équilibre thermique, c’est-à-dire que la température u(x) au point x ne dépend pas
du temps. La fonction f représente les sources de chaleur : par unité de temps,
un petit ensemble de mesure dx proche du point x reçoit f (x)dx calories. En
écrivant la conservation de la quantité de chaleur, et le fait que la quantité de
chaleur traversant une surface par unité de temps est proportionnel au flux
du gradient de température, on obtient l’équation de la chaleur stationnaire
−∆u = f (dans le cas non stationnaire, on obtiendrait l’équation de la chaleur
que nous avons déjà rencontrée au n◦ 6.1).
La description ci-dessus est incomplète. On doit encore décrire la nature
des échanges sur ∂Ω. Deux conditions sont particulièrement importantes en
119
7.2. Le Laplacien dans un domaine borné
physique : le cas isotherme, où des échanges thermiques ont lieu à la frontière
pour maintenir celle-ci à une température fixée (plongement dans la glace
fondante par exemple) ; et le cas adiabatique où le système est isolé, le flux de
chaleur (et donc celui de ∇u) à travers toute portion de la frontière étant alors
nul. On aura reconnu nos conditions de Dirichlet et de Neumann.
Dans le cas isotherme, quelles que soient les sources de chaleur f , il existe
un unique équilibre thermique qui leur correspond. Dans la pratique, on commencera à chauffer à un certain instant et on observera d’abord un régime
transitoire (régi par l’équation comportant le terme ∂/∂t), puis le système
deviendra très proche de l’état stationnaire décrit la solution u de −∆dir u=f .
Dans le cas adiabatique, on n’atteindra certainement pas un état de régime
si l’intégrale de f (la quantité de chaleur fournie à l’ensemble par unité de
temps) est non nulle. En cas d’intégrale positive, la quantité de chaleur emmagasinée va croître de façon linéaire, jusqu’à détérioration du matériel. Par
contre, si l’intégrale est nulle, on atteindra un état d’équilibre thermique, qui
sera l’une des solutions de −∆neu u = f .
7.2.14 Sur la construction des opérateurs ∆dir et ∆neu
Nous avons défini l’opérateur ∆dir après avoir admis le théorème 7.2.1 sur
les fonctions propres. Si on veut démontrer ce dernier, on doit en fait procéder
dans l’ordre inverse.
Enonçons d’abord la formule de Green, valable pour deux fonctions u et v
appartenant à C 2 (Ω),
Z
Ω
(u∆v − v∆u) dx =
Z
∂Ω
∂v
∂u
u
−v
∂ν
∂ν
!
dσ
où ν désigne la normale extérieure unitaire en un point frontière et où dσ est,
selon la dimension, l’élément de longueur ou de surface à la frontière.
Le point clef, qui n’est pas facile, de la démonstration est le suivant : l’application qui à de bonnes fonctions f (dans C 1 (Ω) par exemple) fait correspondre
l’unique solution u nulle au bord de ∆u = f , se prolonge par continuité en un
opérateur linéaire, injectif, continu et même compact de L2 (Ω) dans lui-même.
On note G cet opérateur : la fonction u = Gf est donc toujours définie pour
f ∈ L2 , si f est une bonne fonction, u est la solution de classe C 2 de notre
problème, sinon c’en est une “solution généralisée”.
L’opérateur G est autoadjoint, c’est-à-dire que (Gf | g) = (f | Gg). La démonstration est facile au moins dans le cas où f et g sont de bonnes fonctions :
en posant u = Gf et v = Gg on a ∆u = f et ∆v = g et il faut donc prouver
120
Chapitre 7. Quelques autres EDP
que (u | ∆v) = (∆u | v) ce qui, compte tenu du fait que u et v sont nulles à la
frontière, résulte immédiatement de la formule de Green.
On peut donc appliquer les résultats généraux sur les opérateurs compacts
autoadjoints : il existe une base hilbertienne (Φj ) constituée de vecteurs propres
de G, correspondant à des valeurs propres αj tendant vers 0. L’opérateur G
étant injectif, 0 n’est pas valeur propre.
Il ne reste plus qu’à appeler D(∆dir ) l’image de G. L’opérateur G est une
bijection de L2 sur D(∆dir ), et on appelle ∆dir l’opérateur inverse, qui est donc
défini sur D(∆dir ) et à valeurs dans L2 . En appliquant ∆dir aux deux membres
de GΦj = αj Φj , on obtient Φj = αj ∆dir Φj , ce qui signifie que Φj est un vecteur
propre de ∆dir associé à la valeur propre λj = 1/αj . Cela montre l’existence
d’une base de vecteurs propres pour ∆dir , et le fait que les valeurs propres
tendent vers l’infini.
7.3
Equations d’évolution dans un domaine
borné
Nous nous limiterons aux équations classiques que l’on peut ramener à
la théorie spectrale du Laplacien, mais le lecteur verra aisément que toute
équation du type ∂u/∂t−Au = 0 ou ∂ 2 u/∂t2 −Au = 0 se traite essentiellement
de même, dès qu’il existe une base orthonormale de L2 constituée de fonctions
propres de A.
7.3.1 Equation de la chaleur dans un domaine régulier borné
Le problème de Cauchy avec condition de Dirichlet (resp. Neumann) se formule ainsi : étant donné u0 (x) définie dans Ω et f (t, x) définie dans [0, ∞[×Ω,
rechercher la solution de ∂u/∂t − ∆u = f définie dans [0, ∞[×Ω, vérifiant pour
tout t la condition de Dirichlet (resp. Neumann) à la frontière de Ω, et telle
que u(0, x) = u0 (x).
On suppose u0 ∈ D(∆dir ) et dans un premier temps f = 0. La fonction
inconnue u doit pouvoir se décomposer, pour chaque t, sur la base hilbertienne
(Φ ) des fonctions propres de ∆dir , et on cherche donc u sous la forme u(t, x) =
Pj
γj (t)Φj (x). En écrivant que u vérifie l’équation, et en faisant le produit
scalaire avec chacune des Φj , on obtient
γj0 (t) + λj γj (t) = 0 ,
γj (0) = cj (u0 ) .
7.3. Equations d’évolution dans un domaine borné
121
Ces équations ne sont pas difficiles à résoudre, et on obtient
u(t, x) =
X
cj (u0 )e−λj t Φj (x) .
Il est clair que λ2j |γj |2 ≤ λ2j |cj (u0 )|2 < ∞ et que u(t, ·) appartient donc,
pour chaque t à D(∆dir ). La fonction obtenue vérifie donc, en un sens éventuellement généralisé, l’équation et la condition de Dirichlet.
P
P
La résolution de l’équation en présence d’un second membre f n’est guère
plus compliquée. On demande que pour chaque t, la fonction f (t, ·) soit dans
L2 (Ω), et que pour tj → t0 , les fonctions f (tj , ·) convergent vers f (t0 , ·) en
moyenne quadratique. On pose alors
hj (t) = (Φj | f (t, ·)) =
Z
Ω
Φj (x)f (t, x) dx ,
et on vérifie que ces fonctions sont continues.
En cherchant u =
tions
P
γj (t)Φj sous la forme précédente, on obtient les équaγj0 (t) + λj γj (t) = hj (t)
avec la même condition initiale. La solution est encore explicite
u(t, x) =
X
−λj t
cj (u0 )e
+
Z t
0
e
−λj (t−s)
hj (s) ds Φj (x) .
La résolution du problème de Cauchy avec condition de Neumann est absolument identique, en développant selon les fonctions propres Ψj .
Exercice 7.3.2 Il s’agit de démontrer ce que l’on a affirmé à la fin du n◦ 7.2.13.
On résout l’équation de la chaleur avec un second membre f (x) ∈ L2 indépendant de t et pour une donnée de Cauchy u0 appartenant à D(∆dir ) ou à
D(∆neu ).
(a) Pour la condition de Dirichlet, montrer que la solution u(t, x) s’écrit comme
la somme d’une fonction v ne dépendant que de x (à savoir la solution stationnaire v de −∆dir v = f ) et d’une fonction w(t, x) qui décroît exponentiellement
avec t.
R
(b) Pour la conditionR de Neumann, montrer que si f (x) dx 6= 0, la solution
n’a pas de limite. Si f (x) dx = 0, montrer que la solution est somme d’une
fonction v d’intégrale nulle ne dépendant que de x (l’unique solution v de
−∆neu v = f qui soit d’intégrale nulle), d’une constante égale à l’intégrale de
u0 , et d’une fonction w(t, x) qui décroît exponentiellement avec t.
122
Chapitre 7. Quelques autres EDP
Exercice 7.3.3 Reprendre pour l’équation de Schrödinger libre dans Ω, avec
condition de Dirichlet ou de Neumann,
i
∂u
(t, x) + ∆u(t, x) = f (t, x) ;
∂t
u(0, x) = u0 (x) ,
l’analyse faite ci-dessus pour l’équation de la chaleur. On trouvera, pour la
condition de Dirichlet et avec les mêmes notations,
u(t, x) =
X
cj (u0 )e−iλj t − i
Z t
0
e−iλj (t−s) hj (s) ds Φj (x) .
7.3.4 Equation des ondes dans un domaine régulier borné
Il s’agit d’un problème important, notamment en mécanique et en acoustique (cordes vibrantes, tuyaux sonores, vibrations des membranes, plaques et
volumes). Selon les conditions expérimentales, c’est la condition de Dirichlet
ou de Neumann qui est pertinente.
Le problème de Cauchy, avec condition de Dirichlet pour fixer les idées
et en l’absence de second membre (vibrations libres) se formule ainsi : étant
donné u0 et u1 appartenant à D(∆dir ), déterminer u(t, x) telle que pour chaque
t, on ait u(t, ·) ∈ D(∆dir ) et que
∂u
∂ 2u
− ∆u = 0 ; u(0, x) = u0 (x) ;
(0, x) = u1 (x) ,
2
∂t
∂t
où nous interpréterons ∆, au cas où la solution ne serait pas de classe C 2 ,
comme ∆dir .
On note encore γj (t) les composantes de u(t, ·) dans la base des Φj , c’està-dire
Z
γj (t) = Φj (x)u(t, x) dx ,
Ω
et en prenant les composantes des deux membres de l’équation dans la même
base, on obtient l’équation
γj00 (t) + λj γj (t) = 0 ; γj (0) = cj (u0 ) ; γj0 (0) = cj (u1 ) .
La solution est facile à déterminer :
u(t, x) =

X
j
q
c (u ) cos(t
 j 0
cj (u1 )
λj ) + q
λj
q


sin(t λj ) Φj (x) ,

la série, pour chaque t fixé, convergeant en moyenne quadratique et définissant
un élément de D(∆dir ).
7.4. Equation de Schrödinger avec potentiel
123
La solution est une superposition de fonctions oscillant avec une fréquence
λj /2π. En dimension 1 (voir l’exemple 7.2.2), ces fréquences sont des mul√
tiples entiers de la fréquence dite fondamentale λ1 /2π — le son produit par
les instruments de musique unidimensionnels est souvent
√ considéré comme particulièrement harmonieux. En dimension supérieure, λ1 /2π est la plus basse
des fréquences produites, mais les autres n’en sont pas des multiples.
q
Nous ne détaillerons pas le cas de la condition de Neumann, dont l’étude
est identique.
Exercice 7.3.5 Oscillations forcées On considère l’équation des ondes avec un
second membre du type f (x)eiωt . Déterminer explicitement la solution sous la
P
forme γj (t)Φj . Si ω 2 n’est pas l’un des λj , on montrera que la solution s’écrit
comme somme de u(x)eiωt , où u est l’unique solution de −∆dir u − ω 2 u = f
déterminée au n◦ 7.2.6, et d’une solution de l’équation sans second membre.
Si ω 2 est une valeur propre (résonance), on décrira l’évolution, selon que f
est ou n’est pas orthogonale au sous-espace propre correspondant.
7.4
Equation de Schrödinger avec potentiel
Nous nous placerons dans R3 et chercherons d’abord à déterminer le spectre
de l’opérateur u 7→ −∆u + V u où V est une fonction donnée dans R3 .
Il nous faudra en fait définir avec précision un opérateur non borné autoadjoint HV qui pour de bonnes fonctions u coïncidera avec −∆u + V u, selon la
même démarche qui nous avait amené à considérer l’opérateur ∆dir . La théorie spectrale de l’opérateur HV sera le point clef de l’analyse de l’équation de
Schrödinger i∂u/∂t = HV u.
Nous ne traiterons bien sûr pas le cas général, nous regarderons trois
exemples assez typiques : le cas V = 0, le cas où V tend vers +∞ à l’infini, et
le cas (en quelque sorte intermédiaire) où V est à support compact.
7.4.1 Spectre du Hamiltonien libre H0
Nous le définirons comme suit : son domaine D(H0 ) = H 2 (R3 ) est l’espace
des fonctions u ∈ L2 (R3 ) telles que la fonction ξ 7→ |ξ|2 ub(ξ) soit également
de carré sommable. L’opérateur H0 est alors l’application de D(H0 ) dans L2
définie par
124
Chapitre 7. Quelques autres EDP
H0 u = (2π)−3 F(|ξ|2 ub) .
Si u est de classe C 2 et si ses dérivées partielles jusqu’à l’ordre 2 sont
de carré sommable, il résulte facilement du théorème 4.2.8 et de la formule
d’inversion de Fourier que H0 u = −∆u.
On démontre que H0 est autoadjoint, au sens donné dans la section A.6.
Nous allons montrer, ce qui est plus facile, qu’il est symétrique. En effet, pour
u et v dans D(H0 ), on a
(H0 u | v) = (2π)−3 |ξ|2 ub vb = (2π)−3
Z
|ξ|2 ub(ξ)vb(ξ) dξ
= (2π)−3 ub |ξ|2 vb = (u | H0 v) .
Le résultat principal est le suivant : L’opérateur H0 n’a pas de valeur
propre. Son spectre est constitué de l’intervalle [0, +∞[.
Nous avons en fait déjà démontré que les points de l’axe réel négatif appartiennent à l’ensemble résolvant dans le n◦ 5.1.1. Le lecteur vérifiera sans peine
que la “solution généralisée” de (−∆+λ)u = f dont nous avions donné l’expression u = (2π)−3 F(fb/(|ξ|2 + λ)) est exactement une solution de (H0 + λ)u = f .
Si λ > 0 était une valeur propre de H0 , et u un vecteur
√ propre correspondant, on aurait (|ξ|2 − λ)ub(ξ) = 0 p.p. La sphère de rayon λ étant de mesure
nulle, il en résulte que ub = 0 p.p. ce qui est impossible.
Par contre, un tel λ appartient au spectre. Si f appartient à l’image de
H0 − λ, il doit exister un u ∈ L2 tel que (|ξ|2 − λ)ub(ξ) = fb(ξ). En choisissant
√
f ∈ L2 , telle que fb soit égale à 1 au voisinage de la sphère de rayon λ, le
lecteur montrera que f ne peut pas appartenir à l’image et que H0 − λ n’est
donc pas surjectif de D(H0 ) sur L2 .
7.4.2 Potentiels tendant vers l’infini
Nous nous donnerons une fonction V définie sur R3 , de classe C ∞ et telle
que V (x) −→ +∞. Le hamiltonien HV est défini de la façon suivante :
|x|→∞
n
D(HV ) = u ∈ D(H0 ) V u ∈ L2
o
;
HV u = H0 u + V u .
Nous admettrons le résultat suivant.
L’opérateur HV est autoadjoint. Il existe une base hilbertienne ψj constituée de fonctions de classe C ∞ et appartenant à D(HV ), et une suite (λj ) de
nombres réels vérifiant les propriétés suivantes
HV ψj = λj ψj
7.4. Equation de Schrödinger avec potentiel
min V (x) < λ1 < λ2 ≤ λ3 ≤ . . . ;
x∈R3
125
λj −→ +∞ .
j→∞
Pour qu’une fonction u ∈ L2 appartienne
à D(HV ), il faut et il suffit que
P 2 2 ses composantes γj = (ψj | u) vérifient λj γj ≤ ∞.
Remarque 7.4.3 Le lecteur trouvera dans son cours de mécanique quantique le
cas de l’oscillateur harmonique (V (x) = |x|2 ) où tous les calculs sont explicites,
et pourra vérifier dans ce cas les propriétés énoncées ci-dessus.
7.4.4 Potentiels à support compact
La fonction V est maintenant de classe C ∞ et est nulle en dehors d’un
ensemble borné. Le hamiltonien HV est défini de la façon suivante
D(HV ) = D(H0 ) ;
HV u = H0 u + V u .
On a le résultat suivant.
L’opérateur HV est autoadjoint. Son spectre est constitué d’une part d’un
nombre fini (éventuellement nul) de valeurs propres λj ≤ 0, chacune d’elles
étant de multiplicité finie ; d’autre part de l’intervalle [0, ∞[.
7.4.5 Evolution des solutions
1. Potentiel tendant vers l’infini. Il s’agit donc de résoudre i∂u/∂t = HV u avec
u(0, x) = u0 (x). Il s’agit d’un cas très simple, où les calculs sont strictement
les mêmes que dans le cas d’un ouvert borné. On pose cj (u0 ) = (ψj | u0 ), et
les composantes γj (t) de u(t, ·) dans cette base doivent vérifier iγj0 = λj γj . On
obtient donc γj (t) = e−itλj γj (0) et la formule
u(t, x) =
X
cj (u0 )e−itλj ψj (x) .
(7.4)
j
Remarques 7.4.6 On a |γj (t)| = cj (u0 ) pour tout t, et donc
ku(t, ·)k22 =
X
|γj (t)|2 =
X
|cj (u0 )|2 = ku0 k22 .
La norme dans L2 est conservée au cours de l’évolution. Ceci est en fait valable pour tout potentiel V conduisant à un opérateur HV autoadjoint. En
particulier, si u0 est de norme 1, il en est de même de u(t, ·) pour tout t.
Si u0 ∈ D(HV ), on a λ2j |γj (t)|2 = λ2j |cj (u0 )|2 < ∞ et pour chaque
t la fonction u(t, ·) appartient à D(HV ). Cela permet de dire que l’on a bien
i∂u/∂t = HV u. Par contre, si u0 est seulement dans L2 , la formule (7.4) définit
toujours pour chaque t un élément de L2 , mais il faudrait recourir à la théorie
P
P
126
Chapitre 7. Quelques autres EDP
des distributions pour dire en quel sens c’est une solution de l’équation de
Schrödinger. C’est néanmoins cette solution que considère la mécanique quantique, où on ne souhaite pas imposer à u0 d’autre restriction que l’appartenance
à L2 .
Parmi les solutions de l’équation de Schrödinger, figurent les fonctions du
type u(t, x) = e−iλt ψ(x), lorsque λ est une valeur propre et ψ un vecteur propre
correspondant. Elles ont comme particularité le fait que |u(t, x)|2 = |ψ(x)|2 ne
dépend pas de t. L’interprétation en mécanique quantique est que la probabilité
de présence de la particule dans un ensemble donné ne dépend pas de t ou
encore qu’il s’agit d’un état stable du système.
2. Potentiel nul. Il s’agit de l’évolution libre que nous avons étudiée au n◦ 6.2.
Rappelons que la solution (éventuellement généralisée) est la fonction u(x, t)
2
dont la transformée de Fourier en x est e−it|ξ| uc0 (ξ).
Nous avons vu que H0 ne possède pas de fonctions propres. Il en existe toutefois de “fausses” en entendant par là des solutions de −∆u = λu qui n’appartiennent pas à L2 (et donc pas au domaine de H0 ). Les fonctions ψω (x) = eiω·x
vérifient effectivement −∆ψω = ω 2 ψω et l’ensemble des “fausses valeurs propres” est précisément le spectre de H0 .
On peut utiliser ces fausses fonctions propres pour en en construire des
combinaisons (paquets d’ondes) qui appartiennent à L2 et dont nous allons voir
que les propriétés sont relativement proches de celles des fonctions propres.
Donnons-nous a priori λ > 0, un intervalle de temps [0, T ] et ε > 0 (qui
représentera une erreur admissible). Soit u0 un élément de L2 de norme 1,
dont la transformée de Fourier est nulle en dehors de la couronne
ε
ε
.
Γ = ξ λ − ≤ |ξ|2 ≤ λ +
T
T
La solution correspondante u(t, x) vérifie
2
ub(t, ξ) = e−it|ξ| uc0 (ξ) = e−itλ uc0 (ξ) + ρt (ξ) .
Pour 0 ≤ t ≤ T , et pour ξ ∈ Γ, la quantité
t |ξ|2 − tλ est comprise entre −ε
et ε. En utilisant la majoration eia − eib ≤ |b − a|, on en déduit que l’erreur
commise vérifie |ρt (ξ)| ≤ ε |uc0 (ξ)|. On a donc kρt k2 ≤ ε kuc0 k2 .
En appelant rt la transformée de Fourier inverse de ρt , on a u(t, x) =
−iλt
e
u0 (x) + rt (x) avec krt k2 ≤ ε. En développant le carré, on obtient
|u(t, x)|2 = |u0 (x)|2 + st (x)
;
Z
|st (x)| dx ≤ 2ε + ε2 .
En prenant ε = 10−9 et T égal à quelques siècles, on voit qu’il peut être
difficile de distinguer pratiquement une vraie valeur propre d’un autre élément
7.4. Equation de Schrödinger avec potentiel
127
λ du spectre. Il faut toutefois ajouter que uc0 étant très concentré autour d’une
sphère, l’état u0 sera au contraire très étalé.
3. Potentiel à support compact. On observe dans une certaine mesure la superposition des deux situations précédentes. On peut considérer le sous-espace
F de L2 engendré par les vecteurs propres. Il est de dimension finie du fait
que les valeurs propres sont en nombre fini et qu’elles sont de multiplicité finie.
On choisira une base orthonormale ϕj de vecteurs propres (la valeur propre
associée étant notée λj ) et on notera F ⊥ le supplémentaire orthogonal de F .
Pour une donnée v0 ∈ F , la solution est donnée comme précédemment par
v(t, x) =
X
(ϕj | u0 ) e−iλj t ϕj (x) .
j
Pour une donnée w0 ∈ F ⊥ , on peut montrer que la solution w(t, ·) reste dans
F ⊥ . La situation est semblable à celle du hamiltonien libre, mais la résolution
n’est plus explicite en général.
Pour une donnée quelconque u0 ∈ L2 , on appelle v0 et w0 les projections
orthogonales sur F et F ⊥ respectivement, et on est ramené aux deux cas cidessus : u(t, x) = v(t, x) + w(t, x).
Annexe A
Éléments d’analyse fonctionnelle
A.1
Espaces vectoriels normés
Le corps des scalaires des espaces vectoriels considérés est R ou C.
a
Définitions élémentaires
Une norme sur espace vectoriel E est une application (notée souvent x 7→
kxkE ou kxk quand il n’y a pas d’ambiguïté) de E dans [0, ∞[ possédant les
trois propriétés suivantes
homogénéité
kλxk = |λ| kxk
sous-linéarité
kx + yk ≤ kxk + kyk
séparation
(kxk = 0) ⇔ (x = 0)
(A.1)
On appelle distance de deux éléments de E la quantité δ(x, y) = kx − yk.
L’inégalité triangulaire δ(x, z) ≤ δ(x, y) + δ(y, z) résulte de la sous-linéarité, la
symétrie δ(x, y) = δ(y, x) vient de l’homogénéité (pour λ = −1), et on a enfin
δ(x, y)=0 ⇔ x=y.
On appelle boule ouverte de centre x ∈ E et de rayon r > 0 l’ensemble
BE (x, r) = {y| ky − xk < r} aussi noté B(x, r). On dit qu’un sous-ensemble U
de E est ouvert si pour tout point x ∈ U il existe une boule ouverte centrée en x
et contenue dans U . Un sous-ensemble de E est dit fermé si son complémentaire
est ouvert.
La famille des ouverts est stable par réunion quelconque et par intersection
finie. La famille des fermés est stable par intersection quelconque et par réunion
finie.
130
Annexe A. Éléments d’analyse fonctionnelle
Pour x ∈ E, on appelle voisinage de x un ensemble contenant un ouvert
contenant x. Pour que V soit un voisinage de x, il faut et il suffit qu’il existe
r > 0 avec B(x, r) ⊂ V . Une intersection finie de voisinages de x est encore
un voisinage de x. Pour qu’un ensemble U soit ouvert, il faut et il suffit que U
soit voisinage de chacun de ses points.
Si A est un sous-ensemble de E, la réunion des ouverts contenus dans A,
qui est donc le plus grand ouvert contenu dans A, est appelée intérieur de A
et est notée Å. Pour que x ∈ Å, il faut et il suffit que A soit un voisinage
de x. L’intersection de tous les fermés contenant A, qui est donc le plus petit
fermé contenant A, est appelée adhérence (ou fermeture) de A et est notée A.
Pour que x ∈ A, il faut et il suffit que tout voisinage de x rencontre A. Le
complémentaire de l’adhérence de A est l’intérieur du complémentaire de A et
vice versa. L’ensemble A \ Å est appelé frontière de A.
b
Limites et continuité
On dit qu’une suite xj d’éléments de E converge vers x si pour tout voisinage V de x, il existe un indice j0 à partir duquel tous les xj appartiennent
à V . Il est équivalent de dire que la suite numérique j 7→ kx − xj k converge
vers 0.
Soient A un sous-ensemble de E et f une application définie dans A à
valeurs dans R ou C ou plus généralement un autre espace vectoriel normé
F . Soient x0 ∈ A et y0 ∈ F . On dit que limx→x0 ; x∈A f (x) = y0 si, pour tout
voisinage W de y0 , il existe un voisinage V de x0 tel que f (V ∩ A) ⊂ W .
La limite, si elle existe, est unique.
On dit que f est continue en x0 ∈ A si limx→x0 ; x∈A f (x) = f (x0 ) (on
sous-entend souvent le x ∈ A dans la notation). Il est équivalent de dire que
pour tout ε > 0, il existe η > 0 tel que x ∈ A et kx − x0 kE ≤ η implique
kf (x) − f (x0 )kF ≤ ε. On dit que f est continue sur A si elle est continue en
tout point de A.
Composition des limites. La composée de deux applications continues est
continue. Si limj→∞ xj = x et si f est continue en x, alors limj→∞ f (xj ) = f (x).
Théorème A.1.1 Soient E et F des espaces vectoriels normés, A un sousensemble de E et f une application de A dans F . Pour que f soit continue en
x ∈ A, il faut et il suffit que, pour toute suite xj d’éléments de A qui converge
vers x, on ait limj→∞ f (xj ) = f (x).
131
A.1. Espaces vectoriels normés
La norme, la distance, les opérations algébriques de E sont continues : si
xj → x et yj → y dans E, et si λj → λ dans C, on a
xj + yj → x + y et λj xj → λx dans E
kxj k → kxk et δ(xj , yj ) → δ(x, y) dans R .
Si A ⊂ E, et x ∈ E, on appelle distance de x à A la quantité δ(x, A) =
inf y∈A δ(x, y). La fonction x 7→ δ(x, A) est continue sur E. Pour que δ(x, A) =
0, il faut et il suffit que x ∈ A.
Normes équivalentes. Deux normes (notées k·k1 et k·k2 ) sur un même espace
vectoriel E sont dites équivalentes s’il existe une constante C telle que l’on ait
∀x ∈ E
,
kxk1 ≤ C kxk2
et
kxk2 ≤ C kxk1 .
Dans ce cas, une suite est convergente pour l’une des normes si et seulement
si elle est convergente pour l’autre. On sait que sur un espace de dimension
finie, toutes les normes sont équivalentes.
c
Compacité
Définition A.1.2 Soient E un espace vectoriel normé et A ⊂ E. On dit que A
est compact si, de toute suite d’éléments de A, on peut extraire une sous-suite
qui converge vers un élément de A.
Théorème A.1.3 Soit E un espace vectoriel normé de dimension finie. Pour
que A ⊂ E soit compact, il faut et il suffit que A soit fermé et borné.
Dans un espace vectoriel normé de dimension infinie, il est toujours vrai qu’un
compact est fermé et borné, mais la réciproque est fausse.
Théorème A.1.4 Soit E un espace vectoriel normé, A une partie compacte
de E et f une application continue de A dans un espace vectoriel normé F .
Alors l’image f (A) est un compact de F .
En particulier, si f est à valeurs dans R, alors f est bornée et atteint ses
bornes, c’est-à-dire qu’il existe a ∈ A et b ∈ A tels que
f (a) = sup f (x)
x∈A
,
f (b) = inf f (x) .
x∈A
132
Annexe A. Éléments d’analyse fonctionnelle
Définition A.1.5 Soient E et F des espaces vectoriels normés, A ⊂ E et f
une application de A dans F . On dit que f est uniformément continue si la
fonction ω, définie pour t > 0 par
ω(t) =
sup
x,y∈A ; kx−ykE ≤t
kf (x) − f (y)kF ,
tend vers 0 lorsque t tend vers 0.
Cette propriété est plus facile à manipuler que la définition équivalente “avec
ε et η” que connaît sans doute le lecteur. Si f est uniformément continue, on
dispose d’une fonction ω(t) positive et tendant vers 0 pour t → 0 telle que
kf (x) − f (y)kF ≤ ω (kx − ykE ) .
Théorème A.1.6 Soit E un espace vectoriel normé, A une partie compacte
de E et f une application continue de A dans un espace vectoriel normé F .
Alors f est uniformément continue.
d
Applications linéaires continues
Lorsqu’une application est linéaire, il est très facile d’exprimer qu’elle est
continue. Il serait très maladroit d’utiliser la définition “avec ε et η” et on se
servira toujours de la majoration (A.2) ci-dessous.
Théorème A.1.7 Soient E et F des espaces vectoriels normés, et L une application linéaire de E dans F . Les trois propriétés suivantes sont équivalentes.
(i) L’application L est continue à l’origine.
(ii) L’application L est continue en tout point.
(iii) Il existe une constante C ≥ 0 telle que l’on ait
∀x ∈ E,
kL(x)kF ≤ C kxkE .
(A.2)
On note L(E, F ) l’espace vectoriel des applications linéaires continues de
E dans F muni de la norme
kLkL(E,F ) = sup{kL(x)kF ; kxkE = 1}.
Lorsque F est le corps des scalaires, L(E, F ) est noté E 0 et appelé dual ou dual
topologique de E ; c’est l’ensemble des formes linéaires continues sur E.
133
A.2. Espaces de Banach
Lorsque F = E, on écrit L(E) au lieu de L(E, E) ; les éléments de cet
ensemble sont appelés opérateurs bornés ou parfois simplement opérateurs. Voir
la section A.4.
Montrons que (i) implique (iii). La continuité à l’origine, pour ε = 1 par
exemple, fournit η > 0 tel que kxkE ≤ η entraîne kL(x)kF ≤ 1. Par homogénéité, on a donc kL(x)kF ≤ (1/η) kxkE pour tout x.
L’implication (ii) ⇒ (i) étant triviale, il reste à montrer que (iii) entraîne
(ii). Pour tout ε > 0, il suffit de choisir η = ε/C et on a (kx − ykE ≤ η) ⇒
(kL(x) − L(y)kF ≤ ε).
A.2
Espaces de Banach
Lorsqu’il cherche à se représenter un espace vectoriel normé, le lecteur a
sans doute tendance à penser d’abord au plan ou à l’espace Rd . Les cas qui vont
nous intéresser maintenant seront des espaces de fonctions, dont la dimension
sera infinie, ce que nous suggérerons en désignant dorénavant par des lettres
telles que f ou u par exemple, les éléments des espaces considérés.
Lorsque l’on étudie un espace de fonctions qui sont définies sur Rd , il n’est
pas rare d’avoir à considérer simultanément la norme de certains vecteurs dans
Rd et la norme de certaines fonctions dans l’espace considéré. Pour éviter toute
confusion, nous notons |x| (et non pas kxk) la norme du vecteur x de Rd , et
kf k∗ la norme de la fonction f , où l’indice ∗ dépendra de l’espace normé
considéré.
a
Généralités
Soit E un espace vectoriel normé.
E est convergente et de somme
On dit qu’une série ∞
0 uj d’éléments de P
S ∈ E si la suite des sommes partielles SN = N
0 uj converge vers S.
P
Le lecteur connaît bien l’importance du critère de Cauchy pour montrer
l’existence de limites dans R, C ou dans les espaces vectoriels de dimension
finie. Dans le cas général, il est important de définir le cadre dans lequel on
peut l’utiliser.
Théorème et Définition A.2.1 Soit E un espace vectoriel normé.
(i) On appelle suite de Cauchy dans E une suite (fj ) vérifiant
lim kfj − fk k = 0 .
j,k→∞
134
Annexe A. Éléments d’analyse fonctionnelle
Une suite convergente est toujours de Cauchy.
(ii) On dit que E est un espace de Banach (ou espace vectoriel normé complet)
si toute suite de Cauchy est convergente.
(iii) Un espace vectoriel normé de dimension finie est toujours complet.
A.2.2 Un exemple typique Soit E l’espace des fonctions de classe C 1
sur l’intervalle [−1, 1] muni de la norme : kf kE = supx∈[−1,1] |f (x)|, appelée
norme uniforme
√et sur laquelle nous reviendrons. Considérons la suite de fonctions fn (x) = x2 + n−2 . Le lecteur montrera facilement que c’est une suite
de Cauchy. Il montrera aussi qu’elle ne converge pas dans E (elle converge
uniformément vers la fonction |x|, mais celle-ci n’appartient pas à E).
Les mathématiciens sont — à juste titre — tellement attachés au critère
de Cauchy que devant une situation de ce type, il vont s’empresser de changer
d’espace vectoriel normé pour se retrouver dans le cadre des espaces de Banach.
Cela peut se faire de deux manières.
– Ou bien on pense que l’espace vectoriel est le bon (dans cet exemple, pour
une raison ou une autre, on tient à travailler sur les fonctions de classe
C 1 ). On va alors conserver l’espace et essayer de remplacer la norme
par une norme plus grande (il sera alors plus difficile, pour une suite,
d’être de Cauchy ou d’être convergente). Exercice : montrer que l’espace
vectoriel normé F constitué des fonctions de classe C 1 sur [−1, 1] muni
de la norme
kf kF = sup |f (x)| + sup |f 0 (x)|
x∈[−1,1]
x∈[−1,1]
est un espace de Banach.
– Ou bien on pense que la norme, et donc la notion de convergence, sont
les bonnes (dans cet exemple, pour une raison ou une autre, on tient à
travailler avec la convergence uniforme). On va alors essayer de remplacer
l’espace par un espace plus grand auquel la norme initiale se prolonge. Ici,
l’espace des fonctions continues sur [−1, 1], toujours muni de la norme
uniforme, sera l’espace de Banach cherché.
Théorème et Définition A.2.3 Soit E un espace vectoriel normé.
(i) On dit qu’une série ∞
j d’éléments de E est normalement convergente
0 uP
si la série (à termes positifs) ∞
0 kuj k est convergente.
P
(ii) Si E est un espace de Banach, alors toute série normalement convergente
est convergente.
135
A.2. Espaces de Banach
Remarque A.2.4 Le lecteur est peut-être surpris de voir donner de la convergence normale une définition a priori différente de celle qu’il a vue en classes
préparatoires. Il y a en fait autant de notions de convergence normale qu’il
y a de normes, et le nom complet de celle que connaît le lecteur est “série
normalement convergente pour la norme uniforme”.
A.2.5 Démonstration du théorème A.2.3 Notons SN les sommes partielles de
la série, il faut montrer que la suite (SN ) est convergente. L’espace étant de
Banach, il suffit de montrer que c’est une suite de Cauchy. Si P et Q sont deux
entiers (en supposant que Q soit le plus petit des deux), on a
kSP − SQ k =
P
X
Q+1
uj ≤
P
X
kuj k ≤
Q+1
∞
X
kuj k ,
Q+1
en utilisant la sous-additivité. On utilise maintenant la théorie des séries numériques : le membre de droite est le reste (au rang Q) d’une série convergente,
et tend donc vers 0 pour Q → ∞. On a donc
kSP − SQ k −→ 0 ,
P,Q→∞
ce qui montre que la suite (SN ) est de Cauchy et achève la démonstration.
La démonstration utilise de manière cruciale le fait que les suites de Cauchy
sont convergentes, et la conclusion est fausse si E n’est pas un espace de
Banach.
A.2.6 Approximation et densité Etant donné une fonction f plus ou moins
quelconque, on souhaite souvent pouvoir l’approcher “à ε près” par des fonctions plus simples, ou bien l’écrire comme limite d’une suite ou somme d’une
série de telles fonctions. Ce sera possible si les fonctions “simples” forment un
sous-ensemble partout dense au sens ci-dessous.
Théorème A.2.7 Soient E un espace vectoriel normé et A ⊂ E.
(i) Si une suite aj d’éléments de A converge vers f dans E, alors on a f ∈ A.
(ii) Réciproquement, si f ∈ A, il existe une suite aj d’éléments de A telle que
limj→∞ aj = f .
On sait que f ∈ A si et seulement si tout voisinage de f rencontre A. Sous
l’hypothèse (i), un voisinage quelconque de f contient une boule de rayon ρ > 0
centrée en ce point et contient donc aj pourvu que j soit choisi assez grand.
Si on suppose maintenant f ∈ A, pour chaque j, on peut trouver un aj
appartenant à A et à la boule de centre f et de rayon 1/j. On a ainsi construit
une suite aj convergeant vers f , ce qui achève la démonstration.
136
Annexe A. Éléments d’analyse fonctionnelle
Définition A.2.8 Soient E un espace vectoriel normé et A un sous-ensemble
de E. On dit que A est dense dans E (ou que A est partout dense) si son
adhérence A est égale à E.
Théorème A.2.9 Soient E un espace vectoriel normé et A ⊂ E. Les trois
propriétés suivantes sont équivalentes.
(i) A est dense dans E.
(ii) Quels que soient f ∈ E et ε > 0, il existe a ∈ A tel que kf − ak ≤ ε.
(iii) Pour tout f ∈ E, il existe une suite aj d’éléments de A telle que
limj→∞ aj = f .
Il s’agit en fait d’un corollaire du théorème A.2.7. En effet, d’après ce dernier,
la propriété (iii) signifie que tout élément de E appartient à A. Quant à la
propriété (ii), elle exprime, pour tout f ∈ E, que tout voisinage de f coupe A,
et donc que f appartient à A.
Théorème A.2.10 Soit E un espace de Banach et soit F un sous-espace
vectoriel de E. Pour que F lui-même, muni de la même norme, soit un espace
de Banach, il faut et il suffit que F soit fermé.
Un sous-espace de dimension finie est toujours fermé.
Supposons F fermé et soit fj une suite de Cauchy d’éléments de F . C’est aussi
une suite de Cauchy dans E et elle converge donc vers un élément f ∈ E. Mais
d’après le théorème A.2.7, on doit avoir f ∈ F = F . On a donc montré que
toute suite de Cauchy dans F convergeait vers un élément de F , c’est-à-dire
que F est complet.
Réciproquement, supposons que F soit un espace de Banach, et soit f un
élément quelconque de F . D’après le théorème A.2.7, il existe une suite fj
d’éléments de F qui converge vers f . Une suite convergente est toujours de
Cauchy et, F étant complet, la suite fj doit converger vers un élément de F .
Par unicité de la limite, on a donc f ∈ F . On a ainsi montré que F coïncide
avec F c’est-à-dire que F est fermé.
Enfin, nous avons vu (définition A.2.1) qu’un espace de dimension finie
était toujours complet ce qui entraîne, d’après ce qui précède, qu’il est fermé.
Exercice A.2.11 Soit (E, k kE ), (F, k kF ) deux espaces vectoriels normés. Montrer que si F est complet, alors l’espace vectoriel L(E, F ) des applications
linéaires continues de E dans F est complet.
137
A.2. Espaces de Banach
b
Espaces de fonctions continues
Etant donné un ensemble quelconque X, on peut considérer l’espace vectoriel Fb (X) des fonctions bornées définies sur X et à valeurs dans C. Muni
de la norme
kf k∞ = sup |f (x)| ,
x∈X
c’est un espace de Banach.
La norme kf k∞ s’appelle la norme uniforme. Une suite fj converge vers
f pour cette norme si supx∈X |fj (x) − f (x)| −→ 0, c’est-à-dire si fj converge
uniformément vers f . Enfin, une série
pour cette norme si
∞
X
P∞ j→∞
0
uj est normalement convergente
sup |uj (x)| < ∞ ,
0 x∈X
notion déjà connue du lecteur sous le nom de convergence normale.
Il n’est pas difficile de vérifier que kf k∞ est une norme, et il reste à montrer
qu’une suite de Cauchy fj est convergente. Pour chaque point x fixé, on a
|fj (x) − fk (x)| ≤ kfj − fk k∞ , quantité qui tend vers 0 pour j, k → ∞. Cela
montre que la suite des fj (x) est de Cauchy dans C et converge donc vers une
limite que l’on notera f (x). Il reste à montrer que fj tend vers f pour la norme
uniforme.
Etant donné ε > 0, il existe j0 tel que, pour j ≥ j0 et k ≥ j0 , on ait
kfj − fk k∞ ≤ ε et donc |fj (x) − fk (x)| ≤ ε. En faisant tendre k vers +∞, on
obtient, pour j ≥ j0 , que |fj (x) − f (x)| ≤ ε pour tout x. On a donc la même
majoration pour la borne supérieure. Pour chaque ε > 0, on a ainsi trouvé j0
tel que l’on ait kfj − f k∞ ≤ ε pour j ≥ j0 , ce qui montre que fj → f pour la
norme considérée et achève la démonstration.
L’espace de toutes les fonctions bornées est trop gros pour être d’une grande
utilité. Par contre, les espaces suivants sont très importants.
Théorème et Définition A.2.12 Soit A un sous-ensemble de Rd . L’espace
Cb (A) des fonctions continues et bornées sur A, muni de la norme uniforme
(notée k·k∞ ou k·k∞,A si nécessaire), est un espace de Banach.
Si K est un compact de Rd , l’espace Cb (K) est identique à l’espace C(K)
des fonctions continues sur K.
Le dernier point est clair puisqu’une fonction continue sur un compact est
toujours bornée (théorème A.1.4). L’espace Cb (A) est un sous-espace vecto-
138
Annexe A. Éléments d’analyse fonctionnelle
riel, muni de la même norme, de l’espace de Banach Fb (A). D’après le théorème A.2.10, il suffit de montrer qu’il est fermé pour prouver qu’il est complet.
Soit donc f ∈ Fb (A) appartenant à l’adhérence de Cb (A). Il existe alors une
suite fj d’éléments de Cb (A) qui converge vers f uniformément. Une limite
uniforme de fonctions continues étant continue, on a f ∈ Cb (A). Cela montre
que Cb (A) coïncide avec son adhérence et est donc fermé, ce qui achève la
démonstration.
Le théorème suivant, que nous admettrons, permet d’approcher uniformément toute fonction continue sur un compact par des fonctions “plus simples”.
Théorème A.2.13 (Stone-Weierstrass) Soit K un compact de Rd et soit
C(K) l’espace des fonctions continues à valeurs complexes sur K muni de la
norme uniforme. Soit F un sous-espace vectoriel de C(K) vérifiant les trois
propriétés suivantes :
(i) F est stable par produit (c’est-à-dire que F est une algèbre) : si f et g
appartiennent à F , on a f g ∈ F .
(ii) F est stable par conjugaison complexe : si f ∈ F , alors f ∈ F .
(iii) F contient les constantes et sépare les points de K : si x 6= y sont deux
points de K, il existe f ∈ F tel que f (x) 6= f (y).
Alors F est dense dans C(K).
Pour l’espace des fonctions continues à valeurs réelles, le même résultat est
vrai sous les seules hypothèses (i) et (iii).
Exemple A.2.14 Soit [a, b] un intervalle compact de R et soit F le sous-espace
de C([a, b]) constitué des polynômes à coefficients complexes. Il est clairement
stable par produit et par conjugaison complexe, il contient les constantes, et
la fonction t → t suffit à séparer les points de [a, b].
Pour toute fonction continue f sur [a, b], on peut donc trouver une suite
Pk de polynômes qui converge vers f uniformément.
On peut aussi écrire f comme somme de la série téléscopique f = P0 +
(P1 −P0 )+(P2 −P1 )+. . ., série de polynômes qui converge uniformément. Cela
n’implique nullement que f soit somme d’une série uniformément convergente
de monômes (ce qui signifierait que f est développable en série entière).
Exercice A.2.15 Etendre ce résultat à un compact quelconque de Rd , l’espace
F étant constitué des polynômes de d variables.
Exemple A.2.16 On considère le sous-espace G de C([a, b]) constitué des “poP
lynômes trigonométriques”, c’est-à-dire des fonctions de la forme q−p ak eikt
A.3. Espaces de Hilbert
139
avec ak ∈ C. La stabilité par produit et par conjugaison complexe est encore
facile à prouver. Si b − a < 2π, la fonction eit suffit à séparer les points de [a, b].
On peut donc approcher uniformément toute fonction continue sur [a, b] par
des éléments de G. Si b − a ≥ 2π, les éléments g ∈ G vérifient g(a + 2π) = g(a)
et il en est de même de leurs limites. On ne pourra donc jamais approcher
uniformément (ni même pour la convergence simple) une fonction continue f
telle que f (a + 2π) 6= f (a).
Exercice A.2.17 Démontrer, selon les valeurs de b − a, que toute fonction
continue réelle sur [a, b] (ne) peut (pas) être approchée uniformément par des
P
fonctions du type a0 + p1 (ak cos kt + bk sin kt), avec ak , bk ∈ R.
Exemple A.2.18 Soit Γ = {z| |z| = 1} le cercle unité du plan complexe. Le
P
sous-ensemble H de C(Γ) constitué des fonctions de la forme q−p ak z k , ak ∈ C
est stable par produit. Il est aussi stable par conjugaison complexe, du fait que
l’on a z = z −1 sur Γ. Enfin, la fonction z → z suffit à séparer les points de Γ.
Toute fonction continue sur Γ est donc limite uniforme d’éléments de H.
Le changement de variable t 7→ eit permet d’identifier les fonctions h(z)
continues sur Γ soit aux fonctions f (t) = h(eit ) continues 2π-périodiques sur
R, soit aux fonctions f (t) = h(eit ) continues sur [0, 2π] vérifiant f (0) = f (2π).
P
Les fonctions q−p ak z k deviennent alors les polynômes trigonométriques. On
a donc les deux résultats suivants.
Pour toute fonction f continue sur [0, 2π] vérifiant f (0) = f (2π), il existe
une suite Pn de polynômes trigonométriques qui converge vers f uniformément
sur [0, 2π].
Pour toute fonction f continue sur R et 2π-périodique, il existe une suite
Pn de polynômes trigonométriques qui converge vers f uniformément sur R.
Il ne faut pas confondre cette propriété avec le fait que la série de Fourier
de f converge uniformément (ce qui n’est pas vrai pour toute fonction continue
périodique). Voir le Chapitre 3.
A.3
a
Espaces de Hilbert
Définition et exemples
Si H est un espace vectoriel sur C, un produit scalaire sur H est une application (f, g) 7→ (f | g) de H × H dans C possédant les propriétés suivantes.
140
Annexe A. Éléments d’analyse fonctionnelle
(i) sesquilinéarité : le produit scalaire est antilinéaire par rapport à la première
variable et linéaire par rapport à la seconde 1 . On a notamment
(λf | g) = λ (f | g)
,
(f | λg) = λ (f | g) .
(ii) symétrie hermitienne : (g | f ) = (f | g).
(iii) Le produit scalaire est défini positif : on a (f | f ) ≥ 0 pour tout f ∈ H et
(f 6= 0) ⇐⇒ ((f | f ) > 0) .
Un espace vectoriel muni d’un produit scalaire est appelé espace préhilbertien. Il est canoniquement muni d’une structure d’espace vectoriel normé en
posant
kf k = (f | f )1/2 ,
et on a l’inégalité de Cauchy-Schwarz
|(f | g)| ≤ kf k kgk .
On dit que deux éléments de H sont orthogonaux si leur produit scalaire
est nul. Si f et g sont orthogonaux, on a la relation de Pythagore : kf + gk2 =
kf k2 + kgk2 . Celle-ci s’étend sans difficulté aux sommes finies d’éléments deux
à deux orthogonaux :
(fj | fk ) = 0 pour j 6= k =⇒
2
X
N
fj 0
=
N
X
kfj k2 .
0
Définition A.3.1 On appelle espace de Hilbert un espace préhilbertien qui est
complet pour la norme associée.
Un espace de Hilbert est en particulier un espace de Banach et une série
normalement convergente y est donc convergente, ce que nous rappelons dans
la première partie du théorème ci-dessous. Le second résultat, où la condition
portant sur les normes est moins forte, est spécifique aux espaces de Hilbert.
Théorème A.3.2 Soit H un espace de Hilbert, et (uj ) une suite d’éléments
de H.
(i) Si la série de terme général uj est normalement convergente (c’est-à-dire
P∞
0 kuj k < ∞), alors la série
0 uj converge dans H.
P∞
1. Le lecteur prendra garde au fait que la plupart des ouvrages de mathématiques utilisent
la convention originale de Hilbert (linéarité par rapport à la première variable et antilinéarité
par rapport à la seconde). Nous suivons ici la convention adoptée par les physiciens.
141
A.3. Espaces de Hilbert
(ii) Supposons les uj deux à deux orthogonaux. Pour que la série ∞
0 uj soit
P
2
ku
k
soit
convergente.
On a
convergente, il faut et il suffit que la série ∞
j
0
alors
X 2
X
kuj k2 .
uj =
P
Supposons la série S = ∞
0 uj convergente et posons SN =
le théorème de Pythagore, on a
P
N
X
PN
0
uj . D’après
kuj k2 = kSN k2 .
0
Le membre de droite converge vers kSk2 par continuité de la norme, ce qui
P
2
entraîne que la série numérique ∞
0 kuj k converge.
Réciproquement, si cette série numérique converge, on a
kSN +P − SN k2 =
NX
+P
kuj k2 ≤
∞
X
kuj k2 ,
(A.3)
N +1
N +1
Le membre de droite de (A.3) est le reste à l’ordre N d’une série numérique
convergente, et tend donc vers 0 avec N . Cela assure que la suite SN est de
Cauchy dans H, et donc convergente, et achève la démonstration.
Exemple A.3.3 L’espace Cd des suites z = (z1 , . . . , zd ) de nombres complexes
est muni du produit scalaire suivant
d
X
(z | z 0 ) =
zk zk0 .
k=1
Les espaces normés de dimension finie étant toujours complets (voir le théorème A.2.1), l’espace Cd et plus généralement les espaces préhilbertiens de
dimension finie, appelés aussi espaces hermitiens, sont des espaces de Hilbert.
Exemple A.3.4 On note `2 l’espace des suites de carré sommable indexées par
N : un élément de `2 est une suite u = (uj )j∈N de nombre complexes vérifiant
P∞
2
0 |uj | < ∞. On vérifie facilement que l’expression
(u | v) =
∞
X
uk vk
0
est bien définie pour u, v ∈ `2 , et est un produit scalaire.
142
Annexe A. Éléments d’analyse fonctionnelle
Exercice A.3.5 Démontrer que `2 est un espace de Hilbert. Etant donné une
suite de Cauchy uν , on montrera d’abord que, pour k fixé, les uνk ont une
limite que l’on notera uk . On montrera ensuite que la suite u = (uk ) est de
carré sommable et que uν converge vers u dans `2 .
Exemple A.3.6 Les espaces des fonctions de carré sommable L2 (Rd ) et L2 (A)
définis à l’Appendice B sont des espaces de Hilbert. Voir section B.6.
Exercice A.3.7 Les isométries conservent les angles
Soient E et F des espaces préhilbertiens et soit L une application linéaire de
E dans F vérifiant kLf kF = kf kE pour tout f ∈ E. Montrer que, quels que
soient f et g dans E, on a (Lf | Lg)F = (f | g)E . On montrera d’abord l’identité
4 (f | g) = kf + gk2 − kf − gk2 − i kf + igk2 + i kf − igk2
b
(A.4)
Projections
Dans un espace vectoriel normé de dimension finie, étant donné un point
x et un fermé F , il existe toujours au moins un point y ∈ F dont la distance à
x soit minimum. Cela n’est plus vrai en dimension infinie, mais on dispose du
théorème suivant dont les conséquences sont importantes.
Théorème A.3.8 (projection sur un convexe fermé)
(a) Soient H un espace de Hilbert et Γ une partie convexe non vide et fermée
de H. Pour tout f ∈ H il existe un unique point de Γ (appelé projection de f
sur Γ) dont la distance à f soit minimum.
(b) La projection de f sur Γ est l’unique point g ∈ Γ tel que l’on ait
∀h ∈ Γ
,
Re (f − g | h − g) ≤ 0
(A.5)
(c) Dans le cas où Γ est un sous-espace vectoriel fermé de H, la projection de
f est l’unique point g ∈ Γ tel que f −g soit orthogonal à tous les éléments de Γ.
Le lecteur démontrera facilement, en développant les carrés scalaires du
membre de droite, l’identité de la médiane
u + v 2
1
+ ku − vk2
kuk2 + kvk2 = 2 2
2
qui remonte (au moins) à Euclide.
(A.6)
143
A.3. Espaces de Hilbert
f
h
gj
γ
gk
Γ
f
ht
g
Γ
Posons δ = inf {kf − gk | g ∈ Γ}. S’il existait g1 et g2 distincts réalisant
cette borne inférieure, leur milieu γ appartiendrait aussi à Γ et d’après (A.6)
on aurait 2 kf − γk2 = 2δ 2 − kg1 − g2 k2 /2 < 2δ 2 ce qui est impossible. Cela
établit l’unicité de la projection.
Par définition de la borne inférieure, il existe une suite gj d’éléments de
Γ telle que kf − gj k tende vers δ. En introduisant le milieu γ de gj et gk , on
déduit de (A.6)
1
kgj −gk k2 = kf −gj k2 + kf −gk k2 − 2 kγ−f k2 ≤ kf −gj k2 + kf −gk k2 − 2δ 2 .
2
Le membre de droite tend vers 0 lorsque j et k tendent vers l’infini. La suite
gj est donc de Cauchy. Elle converge vers un élément g de H et, l’ensemble Γ
étant fermé, on a g ∈ Γ. Par continuité, on a kf − gk = lim kf − gj k = δ ce
qui achève la démonstration du point (a).
Soit maintenant h ∈ Γ. Pour 0 < t < 1, le point ht = g +t(h−g) appartient
aussi à Γ. On a donc
kg − f k2 ≤ kht − f k2 = kg − f k2 +t2 kh − gk2 +2t Re (g − f | h − g) . (A.7)
En faisant tendre t vers 0, on voit que le coefficient de t doit donc être positif
ou nul, ce qui établit l’inégalité Re (f − g | h − g) ≤ 0. Réciproquement, si
un point g ∈ Γ vérifie cette inégalité pour tout h ∈ Γ, l’égalité de droite
dans (A.7), pour t = 1, montre que la distance de g à f est inférieure à celle
de h à f , ce qui caractérise la projection d’après la partie (a).
Il reste à considérer le cas où Γ est un sous-espace vectoriel. Soit g la
projection de f . Si v est un élément quelconque de Γ et si eiθ est un nombre
complexe de module 1, le point h = g + eiθ v appartient
à Γ. D’après la partie
iθ
(b) du théorème, on doit avoir Re g − f e v ≤ 0. Le nombre complexe
w = (g − f | v) est tel que Re eiθ w ≤ 0 pour tout θ et est nécessairement nul.
Réciproquement, si g ∈ Γ est tel que f − g est orthogonal aux éléments de Γ,
on a (f − g | h − g) = 0 et donc (A.5).
144
Annexe A. Éléments d’analyse fonctionnelle
Exercice A.3.9 On note f 7→ p(f ) la projection sur le convexe fermé Γ. Montrer que p est lipschitzienne de rapport 1, c’est-à-dire que kp(f )−p(g)k ≤
kf − gk (on pourra considérer Re (p(f )−p(g) | f −g)).
Définition A.3.10 Pour tout sous-ensemble A de l’espace de Hilbert H, on
pose
A⊥ = {f ∈ H | ∀a ∈ A , (a | f ) = 0} .
L’ensemble A⊥ est un sous-espace vectoriel fermé de H
Il est clair que, si f1 et f2 sont orthogonaux aux éléments de A, il en est de même
de f1 + f2 et de λf1 , ce qui montre que A⊥ est un espace vectoriel. En outre, si
une suite (fj ) d’éléments de A⊥ converge vers f , on a (a | f ) = lim (a | fj ) = 0
pour tout a ∈ A et donc f ∈ A⊥ . Cela montre que A⊥ est fermé.
Corollaire A.3.11 (supplémentaire orthogonal) Soit H un espace de
Hilbert et soit F un sous-espace vectoriel fermé de H. Tout élément h ∈ H
se décompose de manière unique sous la forme
h=f +g ,
f ∈F ,
g ∈ F⊥ .
(A.8)
En outre, les éléments f et g de la décomposition sont les projections de h sur
F et F ⊥ respectivement. L’espace F ⊥ est appelé supplémentaire orthogonal de
F . On a
(F ⊥ )⊥ = F , H ⊥ = {0} , {0}⊥ = H .
Soit en effet h ∈ H et notons f sa projection sur F . D’après la partie (c) du
théorème, on a (h − f | f 0 ) = 0 pour tout f 0 ∈ F . Si l’on pose g = h − f , on a
donc g ∈ F ⊥ ce qui prouve l’existence de la décomposition.
S’il existait une autre décomposition h = f1 + g1 du même type, le vecteur
f − f1 = g1 − g appartiendrait à F et à F ⊥ , il serait orthogonal à lui-même et
donc nul.
Il résulte de la définition qu’un élément de F est orthogonal à F ⊥ . Réciproquement, si h ∈ (F ⊥ )⊥ , sa projection g sur F ⊥ est nulle, et la décomposition (A.8) assure que h ∈ F .
Rappelons que, pour A ⊂ H, on note Vect(A) l’espace vectoriel engendré
par A, c’est-à-dire l’ensemble des éléments h ∈ H qui sont combinaison linéaire
(nécessairement finie) d’éléments de A :
h=
N
X
j=1
λ j aj ,
N ∈N,
λj ∈ C ,
aj ∈ A .
145
A.3. Espaces de Hilbert
Corollaire A.3.12 (critère de totalité) On dit qu’un sous-ensemble A de
l’espace de Hilbert H est total si Vect(A) est dense dans H.
Pour que A soit total, il faut et il suffit que A⊥ soit réduit à {0}.
Notons F le sous-espace vectoriel fermé Vect(A) et montrons que A⊥ = F ⊥ .
Tout vecteur orthogonal aux éléments de F est en particulier orthogonal aux
P
éléments de A. Réciproquement, si g appartient à A⊥ , on a (g | λj aj ) = 0
et g est orthogonal aux éléments de Vect(A). Tout élément f de F est limite
d’une suite fk d’éléments de Vect(A), on a donc 0 = (fk | g) → (f | g).
Par définition, A est total si F = H, ce qui est équivalent à F ⊥ = {0} et
donc à A⊥ = {0}.
Remarque A.3.13 La démonstration qui précède a montré plus généralement
que, pour tout sous-ensemble A ⊂ H, on a
(A⊥ )⊥ = Vect(A) .
Théorème A.3.14 (F. Riesz) Soit H un espace de Hilbert. A tout élément
h ∈ H, on peut faire correspondre la forme linéaire continue Lh définie par
Lh (f ) = (h | f ). Réciproquement, étant donné une forme linéaire continue L
sur H, il existe un et un seul h ∈ H tel que l’on ait L = Lh .
Pour f ∈ H, on a d’après l’inégalité de Cauchy-Schwarz
|Lh (f )| = |(h | f )| ≤ khkH kf kH ,
ce qui exprime (théorème A.1.7) que Lh est continue.
Soit maintenant L une forme linéaire continue et soit F = L−1 (0) son
noyau. C’est un sous-espace vectoriel de H qui est fermé du fait que L est
continue. On peut supposer que L n’est pas identiquement nulle (sinon, on a
L = L0 ). On a alors F 6= H et F ⊥ n’est pas réduit à {0}. Soit g un élément
non nul de F ⊥ . Il n’appartient pas à F et le scalaire λ = L(g) est non nul.
Pour tout f ∈ H, on peut poser
f=
L(f )
g
L(g)
+ f−
L(f )
g
L(g)
= f1 + f2
et on remarque que le second terme, qui verifie L(f2 ) = 0 appartient à F
tandis que le premier appartient à F ⊥ . En faisant le produit scalaire avec g,
on obtient
)
(g | f ) = L(f
kgk2 + 0 .
L(g)
146
Annexe A. Éléments d’analyse fonctionnelle
L(g)
Il suffit maintenant de poser h = kgk
2 g et on obtient L(f ) = (h | f ) pour tout
f . Cela montre donc que L est égale à Lh .
On montre facilement l’unicité : si Lh1 = Lh2 , le vecteur h1 − h2 est orthogonal à tout élément de H et est donc nul.
Remarque A.3.15 Si la forme linéaire L vérifie |L(f )| ≤ C kf k pour tout f ,
il en résulte que l’élément h associé vérifie khk ≤ C. En effet, on a alors
khk2 = (h | h) = L(h) ≤ C khk.
Remarque A.3.16 L’application h 7→ Lh est une bijection de H sur l’espace
H 0 des formes linéaires continues sur H. Il est clair que Lh1 +h2 = Lh1 + Lh2 ,
mais il faut prendre garde au fait que cette application est antilinéaire : on a
Lλh = λLh .
A.3.17 Notations de Dirac A la suite de Dirac, les physiciens utilisent la
notation |f i pour désigner un vecteur (rebaptisé “ket”) f de H. Une forme
linéaire continue (rebaptisée 2 “bra”), dont nous avons vu qu’elle peut s’écrire
de façon unique sous la forme Lh , sera notée ici hh|. Le théorème de Riesz
justifie la notation, et est incorporé dans celle-ci : on l’utilise ensuite sans y
penser. L’ensemble est complété par le fait que le produit scalaire se note hf | gi
au lieu de (f | g), et qu’on peut le penser comme l’action du bra hf | sur le ket
|gi.
La remarque précédente garde toute sa valeur : on a bien |λf i = λ |f i,
mais on a hλf | = λ hf |.
Lorsque H est l’espace Cd , muni du produit scalaire canonique hz | z 0 i =
zj zj0 , on peut interpréter l’espace des kets comme l’espace des vecteurscolonne et l’espace des bras comme celui des vecteurs-ligne, l’action d’un bra
sur un ket étant le produit matriciel. Pour z ∈ Cd , on a alors
P

hz| = (z1 , . . . , zd )
et

z1
 . 

|zi = 
 ..  .
zd
Cette interprétation peut être étendue à l’espace `2 , en considérant des matrices
infinies.
2. Nous n’avons pas jugé bon d’utiliser la terminologie “cro” et “het”.
147
A.3. Espaces de Hilbert
c
Bases hilbertiennes
Définition A.3.18 On dit qu’un espace de Hilbert H est séparable s’il existe
une suite finie ou infinie a1 , a2 , . . . d’éléments de H qui constitue un sousensemble total dans H.
Cette condition est satisfaite par les espaces de Hilbert que l’on rencontre en
pratique. Elle autorise l’espace H à être de dimension infinie, mais lui interdit
d’être “beaucoup trop gros”.
Il est utile de comparer la notion de sous-ensemble (dit aussi système) total
à la notion algébrique de partie génératrice (ou système de générateurs). On
sait que G ⊂ H est un système de générateurs si Vect(G) = H, alors que A est
un système total si Vect(A) est partout dense. Ces deux conditions coïncident
en dimension finie, mais en dimension infinie la seconde est beaucoup moins
exigeante.
De même, les “bases hilbertiennes” que nous allons définir ne sont pas (sauf
en dimension finie) des bases au sens algébrique du terme. Un élément de H ne
pourra pas s’écrire, en général, comme combinaison linéaire finie des vecteurs
de base, mais il pourra s’écrire (sous forme de série) comme limite de telles
combinaisons.
Théorème et Définition A.3.19 Soit H un espace de Hilbert séparable. On
appelle base hilbertienne (ou base orthonormale) de H une suite finie ou infinie (ej ), j = 1, 2, . . . qui constitue un système total dans H et qui vérifie les
relations d’orthonormalité
(ej | ek ) = δjk =
1 pour j = k
.
0 pour j 6= k
Dans tout espace de Hilbert séparable, il existe des bases hilbertiennes.
A partir d’un ensemble total fini ou dénombrable, numéroté a1 , a2 , . . ., nous
allons construire une base hilbertienne par le procédé dit d’orthonormalisation
de Schmidt. On commence par supprimer de la suite aj tout vecteur qui est
combinaison linéaire de ceux qui le précèdent. On obtient ainsi une suite bj
qui est telle que l’espace vectoriel En engendré par b1 , . . . , bn soit exactement
de dimension n. L’espace des combinaisons linéaires des aj est exactement la
réunion des En et l’hypothèse assure qu’il est partout dense.
Posons e1 = b1 / kb1 k, et montrons par récurrence que l’on peut construire
une suite orthonormale ej telle que pour tout n, les e1 , . . . , en forment une
148
Annexe A. Éléments d’analyse fonctionnelle
base orthonormale de En . L’espace des combinaisons linéaires des ej sera alors
également la réunion des En et le système des ej sera bien total.
Les ej étant supposés construits jusqu’au rang n, posons
fn+1 = bn+1 −
n
X
(ej | bn+1 ) ej .
j=1
Il est immédiat que ce vecteur est orthogonal aux vecteurs ej pour j =
1, . . . , n. D’autre part, il appartient à En+1 et pas à En , ce qui prouve que
(e1 , . . . , en , fn+1 ) est une base algébrique de En+1 . Il suffit de poser en+1 =
fn+1 / kfn+1 k pour en obtenir une base orthonormale, ce qui achève la récurrence et la démonstration.
Théorème A.3.20 Soient H un espace de Hilbert séparable, et (ej ), j =
1, 2, . . . une base hilbertienne de H.
(a) Tout élément f ∈ H peut se décomposer de façon unique sous forme d’une
série convergente dans H
f=
X
cj (f )ej
cj (f ) ∈ C .
j
Les composantes cj (f ) sont données par
cj (f ) = (ej | f ) ,
(A.9)
et vérifient
kf k2 =
X
|cj (f )|2
(Bessel-Parseval) .
(A.10)
j
(b) Réciproquement, étant donnés des scalaires γj vérifiant j |γj |2 < ∞, la
P
série j γj ej converge dans H et sa somme f vérifie cj (f ) = γj pour tout j.
P
Dans la partie (b) le fait que la série converge est un cas particulier du théorème A.3.2, les γj ej étant orthogonaux et de norme |γj |.
On obtient facilement le reste du point (b) et du même coup l’unicité de la
P
décomposition et la nécessité des formules (A.9) : si la série γj ej converge
P
vers f , par continuité du produit scalaire, on a ek N
j=1 γj ej → (ek | f ) et
le membre de gauche est égal à γk dès que N est supérieur à k.
Soit enfin f ∈ H, posons cj (f ) = (ej | f ) et fN =
(fN | f ) =
N
X
j=1
cj (f ) (ej | f ) =
N
X
j=1
PN
j=1 cj (f )ej .
|cj (f )|2 .
On a
149
A.3. Espaces de Hilbert
Le membre de droite est égal, d’après le théorème de Pythagore, à kfN k2 , et
on a donc kfN k2 = (fN | f ) ≤ kf k kfN k. Cela prouve que kfN k2 est majoré
P
pour tout N par kf k2 , et donc que la série |cj (f )|2 est convergente. Une
P
nouvelle application du théorème A.3.2 assure que la série cj (f )ej converge
vers un élément g ∈ H. Pour tout j, on a (ej | g − f ) = cj (f ) − cj (f ) = 0, et
l’élément g − f qui est orthogonal à un système total est nécessairement nul.
Cela achève la démonstration.
Remarque A.3.21 L’énoncé précédent peut être entièrement reformulé de la
façon suivante : l’application linéaire qui à f ∈ H fait correspondre la famille
des cp (f ) est une bijection isométrique de H sur `2 .
Comme les isométries conservent également le produit scalaire (exercice A.3.7), on a aussi, pour f et g dans H,
(f | g) =
∞
X
cp (f )cp (g) .
p=0
Nous renvoyons le lecteur au chapitre 3 pour l’exemple fondamental des
bases hilbertiennes de L2 ([0, 2π]) constituées de fonctions trigonométriques.
Voir également d’autres bases hilbertiennes classiques de L2 dans la section 3.4.
d
Convergence faible
Dans des espaces de Hilbert de dimension infinie, les ensembles bornés ne
sont pas d’adhérence compacte (voir l’exercice A.3.24 ci-dessous). Il convient
donc d’affaiblir la notion de convergence.
Définition A.3.22 Soient (fj )j∈N une suite d’éléments d’un espace de Hilbert H séparable et f un élément de H. On dit que la suite (fj )j∈N converge
faiblement vers f et l’on note fj * f si
∀h ∈ H , lim (h|fj ) = (h|f ).
j→∞
Il est facile de voir que si la limite faible existe, elle est unique. Comme son
nom l’indique, la notion de convergence faible est plus faible que la notion de
convergence en norme (appelée aussi convergence forte).
Proposition A.3.23 Soit (fj )j∈N une suite d’éléments d’un espace de Hilbert
séparable H. On a alors :
lim kfj − f k = 0 ⇒ fj * f
j→∞
150
Annexe A. Éléments d’analyse fonctionnelle
et
fj * f ⇒ (fj )j∈N est bornée et kf k ≤ lim inf kfj k.
(A.11)
Le premier résultat se démontre de manière évidente, en utilisant l’inégalité
de Cauchy-Schwartz :
∀h ∈ H,
|(h|fj − f )| ≤ khkkfj − f k.
Quant au second, c’est une conséquence du théorème de Banach-Steinhaus 3 :
on définit, pour tout entier j, l’application Lj définie sur H par
Lj (h) = (h|fj ).
Cette application est clairement linéaire et continue, et pour h ∈ H fixé, la
suite de terme général Lj (h) est convergente, et donc bornée. Le théorème de
Banach-Steinhaus implique que la suite (Lj )j∈N est bornée, et que l’application
linéaire limite L définie par
L : h 7→ (h|f )
est continue. En outre sa norme est inférieure à lim inf kLj kL(H) . Comme par
ailleurs kLj kL(H) = kfj k et kLkL(H) = kf k, le résultat suit.
Exercice A.3.24 Soit H un espace de Hilbert séparable de dimension infinie,
et soit (ej )j∈N une base hilbertienne, dont on suppose qu’elle admet une valeur
d’adhérence `. Montrer que pour tout x ∈ H, la suite de terme général (ej |x)
tend vers zéro. En déduire que ` = 0 et conclure au fait que la boule unité
d’un espace de Hilbert séparable de dimension infinie n’est pas d’adhérence
compacte.
Exercice A.3.25 Montrer que la convergence faible n’implique pas la convergence forte.
Exercice A.3.26 Soit (fj )j∈N une suite d’éléments d’un espace de Hilbert séparable H convergeant faiblement vers une limite f , et vérifiant
lim kfj k = kf k.
j→∞
Montrer que la suite (fj )j∈N converge fortement vers f dans H.
3. Théorème II.1.15 du cours [CO] et son Corollaire II.1.17 ou Cours de Tronc Commun,
exercice (17) du Chapitre IX
A.4. Opérateurs linéaires bornés
151
Exercice A.3.27 Soit C un ensemble convexe d’un espace de Hilbert séparable H. Montrer que les deux assertions suivantes sont équivalentes :
(i)
(ii)
C est fermé ;
la limite de toute suite fj convergeant faiblement, appartient à C.
Exercice A.3.28 Soit (fj )j∈N une suite bornée d’éléments d’un espace de Hilbert séparable H. Le but de l’exercice est de montrer qu’il existe f ∈ H et
une suite extraite de (fj )j∈N convergeant faiblement vers f . On va pour cela
considérer la suite (fj |en ) pour tout élément en d’une base hilbertienne (en )n≥1
de H et appliquer un procédé d’extraction diagonale.
(a) Montrer qu’il existe une sous-suite (fψ1 (j) ) telle que (fψ1 (j) |e1 ) converge vers
un scalaire γ1 (ψ1 : N → N strictement croissante).
(b) Montrer ensuite que l’on peut extraire de (fψ1 (j) ) une sous-suite (fψ1 ◦ψ2 (j) )
telle que (fψ1 ◦ψ2 (j) |e2 ) converge vers un scalaire γ2 . Continuer l’argument et
construire ainsi pour tout n une sous-suite (fψ1 ◦...◦ψn (j) ) extraite des précédentes
et telle que (fψ1 ◦...◦ψj (j) |en ) converge vers un scalaire γn .
(c) On définit pour tout j ∈ N, ϕ(j) = ψ1 ◦ . . . ◦ ψj (j). Montrer que
P
limj→+∞ (fϕ(j) |en ) = γn , pour tout n. Finalement, montrer que n γn en définit un élément de H vers lequel la sous-suite (fϕ(j) ) converge faiblement.
A.4
Opérateurs linéaires bornés
Dans cette section, on donne les premiers éléments de la théorie spectrale
des opérateurs bornés. Certaines démonstrations sont admises. Pour aller plus
loin, notamment sur la théorie des opérateurs non bornés, on pourra consulter
les ouvrages suivants : [BR], [GU], [H-L] ou [R-S].
a
Généralités
Soit H un espace de Hilbert.
Définition A.4.1 On appelle opérateur borné sur H une application linéaire
continue de H dans H. La composée de deux opérateurs bornés A et B, notée
A ◦ B ou multiplicativement AB, est un opérateur borné.
Nous appellerons parfois “opérateur linéaire” ou “opérateur” tout court un
opérateur borné.
152
Annexe A. Éléments d’analyse fonctionnelle
A.4.2 Opérateur inversible On dit qu’un opérateur (linéaire et continu) A est
inversible s’il existe un opérateur (linéaire et continu) B tel que AB = BA = I,
où I désigne l’opérateur identité de H.
Une remarque importante, mais dont la démonstration est hors programme,
est que si A est un opérateur borné bijectif, alors A est inversible (en d’autres
termes, A−1 est automatiquement un opérateur borné).
Théorème et Définition A.4.3 (adjoint d’un opérateur) Si A est un
opérateur linéaire, il existe un et un seul opérateur, appelé adjoint de A et
noté A∗ , vérifiant, quels que soient f et g dans H,
(f | Ag) = A∗ f g
.
On dit que l’opérateur A est autoadjoint (ou hermitien) si A∗ = A.
Le fait que A soit continu signifie qu’il existe une constante C telle que kAgk ≤
C kgk. Une fonction f étant donnée, considérons l’application L de H dans C
définie par L(g) = (f | Ag). Il est clair que c’est une forme linéaire, et l’on a
pour tout g
|L(g)| = |(f | Ag)| ≤ kf k kAgk ≤ (C kf k) kgk ,
(A.12)
ce qui signifie que L est continue. D’après le théorème A.3.14 de Riesz, il existe
un unique h ∈ H tel que l’on ait L(g) = (h | g) pour tout g.
L’élément h ci-dessus est uniquement déterminé par f et nous le noterons
A∗ f . Il est donc caractérisé par le fait que, pour tout g, on a
(f | Ag) = L(g) = A∗ f g .
L’opérateur A∗ que l’on a ainsi défini est linéaire : par définition l’élément
A∗ (λ1 f1 + λ2 f2 ) est l’unique h vérifiant (h | g) = (λ1 f1 + λ2 f2 | Ag), et il est
e = λ A∗ f + λ A∗ f jouit aussi de cette propriété.
facile de voir que h
1
1
2
2
Il reste à montrer que A∗ est continu. D’après la remarque A.3.15 suivant
le théorème de Riesz, le fait que la forme linéaire L vérifie l’estimation (A.12)
entraîne que l’élément h = A∗ f qui lui est associé vérifie
∗ A f = khk ≤ C kf k ,
ce qui exprime précisément que A∗ est continu.
153
A.4. Opérateurs linéaires bornés
Lemme A.4.4 Les propriétés suivantes sont satisfaites.
(i) Ker A = (Im A∗ )⊥
(ii) Ker A∗ = (Im A)⊥
(iii) Im A = (Ker A∗ )⊥
(iv) Im A∗ = (Ker A)⊥
Le fait que (A∗ )∗ = A assure que les propriétés (i) et (ii) (respectivement (iii)
et (iv) sont équivalentes). Nous démontrons donc seulement les propriétés (i)
et (iii). Soit u ∈ Ker A, v ∈ Im A∗ et f ∈ H tel que A∗ f = v. Alors on a
facilement que
(u | v) = (u | A∗ f ) = (Au | f ) = 0 .
Donc u ∈ (Im A∗ )⊥ . Réciproquement si u appartient à (Im A∗ )⊥ , alors pour
tout f ∈ H,
0 = (u | A∗ f ) = (Au | f )
donc Au = 0 et Ker A = (Im A∗ )⊥ . Pour démontrer (iii), il suffit de constater
que l’orthogonal de l’égalité (ii) s’écrit
(Ker A∗ )⊥ = ((Im A)⊥ )⊥ = Im A
par la remarque A.3.13.
Exemple A.4.5 On se place dans l’espace L2 (R) défini à l’appendice B.6. Soit
a une fonction bornée sur R et notons A l’opérateur de multiplication par
a, défini par Au = au. On vérifie immédiatement que A∗ est l’opérateur de
multiplication par a. L’opérateur A est autoadjoint si et seulement si a est
(presque partout) à valeurs réelles.
A.4.6 Matrice adjointe, matrices hermitiennes
Supposons H de dimension finie et muni d’une base orthonormale (ej ). Soit
(aij ) la matrice de A dans cette base, ce qui signifie que aij = (ei | Aej ). Si (bij )
est la matrice de A∗ , on doit avoir
aij = (ei | Aej ) = A∗ ei ej = ej A∗ ei = bji .
On appelle matrice adjointe d’une matrice donnée la complexe conjuguée de
sa transposée. La matrice de A∗ est donc l’adjointe de la matrice de A.
A.4.7 Notations de Dirac L’expression (f | Ag) s’écrira hf | A |gi et s’interprétera des deux façons suivantes. On peut la lire comme l’action du bra
(= forme linéaire) hf | sur le ket (= vecteur) |A |gi = |Agi. On peut aussi
154
Annexe A. Éléments d’analyse fonctionnelle
la penser comme l’action du bra noté hf | A|, qui est donc égal à hA∗ f |, sur
le ket |gi. Cette notation dispense ainsi d’écrire explicitement l’opérateur adjoint tant qu’il n’agit que sur des bras. Là encore, le théorème de Riesz et
la démonstration ci-dessus de l’existence de l’adjoint sont incorporés dans la
notation.
Théorème A.4.8 (i) Soient A et B deux opérateurs linéaires. On a alors
(A + B)∗ = A∗ + B ∗
;
(A ◦ B)∗ = B ∗ ◦ A∗ .
(ii) Si A est inversible, A∗ l’est aussi et on a (A−1 )∗ = (A∗ )−1 .
(iii) On a (f | Ag) = g A∗ f . En particulier, si A est autoadjoint, (f | Af )
est réel pour tout f .
(iv) Si A est autoadjoint, on a
4 (f | Ag) = ((f +g) | A(f +g)) − ((f −g) | A(f −g))
−i ((f + ig) | A(f + ig)) +i ((f − ig) | A(f − ig)) .
Les vérifications faciles sont laissées au lecteur. La dernière de ces propriétés se démontre exactement comme l’identité (A.4) et résulte du fait que la
forme bilinéaire (f, g) 7→ B(f, g) = (f | Ag), est hermitienne (c’est-à-dire est
sesquilinéaire et vérifie B(g, f ) = B(f, g)).
Théorème et Définition A.4.9 (a) On dit qu’un opérateur U est isométrique s’il vérifie (U f | U g) = (f | g) quels que soient f et g. On dit que U est
unitaire si de plus U est inversible.
(b) Pour que U soit isométrique, il faut et il suffit que l’on ait U ∗ U = I.
(c) Pour que U soit unitaire, il faut et il suffit que l’on ait U ∗ U = U U ∗ = I.
Pour tout opérateur U , on a (U ∗ U f | g) = (U f | U g). Le caractère isométrique
de U est équivalent au fait que (U ∗ U f | g) = (f | g) quels que soient f et g, ce
qui équivaut à U ∗ U = I.
Si de plus U est inversible, la relation U ∗ U = I signifie que U −1 = U ∗ , ce
qui entraîne la dernière partie de l’énoncé.
Remarque A.4.10 Un opérateur isométrique est toujours injectif (U f = 0
entraîne f = 0), mais en dimension infinie, il existe des opérateurs isométriques
qui ne sont pas surjectifs. Par exemple, dans l’espace L2 ([0, ∞[), les opérateurs
de translation τa , a > 0, définis par
τa f (x) =
f (x − a) si x > a
0
sinon ,
A.4. Opérateurs linéaires bornés
155
sont isométriques mais ne sont pas unitaires.
Pour que U soit une isométrie, il suffit que l’on ait kU f k = kf k pour tout f
(voir l’exercice A.3.7).
A.4.11 Matrices unitaires On dit qu’une matrice est unitaire si elle est inversible et si sa matrice inverse est égale à sa matrice adjointe.
Dans un espace hermitien de dimension finie, les notions d’opérateur isométrique et unitaire se confondent. Un opérateur est unitaire si et seulement
si sa matrice dans une base orthonormale est unitaire.
Soit (ej ) une base orthonormale, (fj ) une autre base et P la matrice de
passage. Pour que (fj ) soit une base orthonormale, il faut et il suffit que P
soit unitaire.
b
Spectre et valeurs propres
Pour λ ∈ C et A un opérateur, on note A−λ = A−λI, où I est l’opérateur
identité.
Définition A.4.12 Soit A un opérateur linéaire.
(a) On appelle ensemble résolvant de A et on le note ρ(A), l’ensemble des λ ∈ C
tels que l’opérateur A − λ est inversible. L’application λ ∈ ρ(A) 7→ (A − λ)−1
est appelé la résolvante de A.
(b) On appelle spectre de A le complémentaire de l’ensemble résolvant, noté
σ(A). C’est un sous ensemble fermé de C.
(c) On dit que λ est une valeur propre de A si A − λ n’est pas injectif, i.e.
Ker (A − λ) 6= {0}. Les vecteurs f 6= 0 tels que (A − λ)f = 0 s’appellent les
vecteurs propres de A relatifs à λ. L’ensemble des valeurs propres de A appelé
spectre ponctuel de A et noté σp (A) est inclus dans le spectre de A.
Commentaire A.4.13 D’après la remarque A.4.2, le nombre complexe λ appartient à l’ensemble résolvant si et seulement si A − λ est bijectif. Nous admettons le fait que l’ensemble résolvant est ouvert.
En dimension finie d, le spectre est réduit à l’ensemble des valeurs propres.
En effet, si A − λ est injectif, il est de rang d et est donc bijectif.
La situation est très différente en dimension infinie : il se peut très bien
que A − λ soit injectif, mais ne soit pas surjectif. Dans ce cas, λ n’est pas une
valeur propre, mais appartient au spectre.
156
Annexe A. Éléments d’analyse fonctionnelle
Exemple A.4.14 Considérons l’espace H = L2 (R) et appelons A l’opérateur de multiplication par la fonction a représentée ci-contre. On a la
situation suivante.
1
1
(a) Si λ n’appartient pas à l’intervalle [0, 1], il appartient à l’ensemble résolvant. En effet, la fonction x 7→ 1/(a(x)−λ) est alors bornée, et A − λ a pour
inverse l’opérateur de multiplication par cette fonction.
(b) L’opérateur A a deux valeurs propres : 0 et 1. L’espace propre relatif à 0
(resp. 1) est l’espace des fonctions de carré sommable nulles hors de ] − ∞, 0]
(resp. [1, ∞[) et est donc de dimension infinie.
(c) Les λ ∈]0, 1[ ne sont pas des valeurs propres : si une fonction f était un
vecteur propre relatif à λ, on aurait (a(x)−λ)f (x) = 0 p.p. et donc, la fonction
a − λ ne s’annulant qu’en un point, f (x) = 0 p.p.
Par contre, ces valeurs de λ appartiennent au spectre. Soit en effet une
fonction f ∈ L2 (R). Dire que f est dans l’image de A − λ, c’est dire qu’il
existe u ∈ L2 avec (a(x) − λ)u(x) = f (x) p.p. et c’est donc dire que (a(x) −
λ)−1 f (x) est de carré sommable. Il suffit de prendre f égale à 1 au voisinage
de λ pour voir que cela est impossible, et que f ne peut pas appartenir à
l’image de A − λ.
Théorème A.4.15 Soit H un espace de Hilbert et A un opérateur linéaire.
Alors le spectre de A est un compact de C borné par kAkL(H) .
Considérons un scalaire λ tel que |λ| > kAkL(H) et écrivons
A − λI = −λ(I − λ−1 A) .
Comme par hypothèse kλ−1 AkL(H) < 1, la série (λ−1 A)j est absolument
convergente, donc convergente car H est un espace de Banach. Il est facile de
vérifier que la somme de cette série est un isomorphisme continu de H, qui est
l’inverse de I − λ−1 A. On en conclut que I − λ−1 A est inversible, et donc que λ
n’appartient pas au spectre de A. Comme le spectre de A est un sous-ensemble
fermé de C et qu’il est borné par kAkL(H) , on conclut que c’est un compact
de C.
P
Théorème A.4.16 Si A est un opérateur autoadjoint, son spectre est contenu
dans R. De plus, si f1 et f2 sont des vecteurs propres relatifs à deux valeurs
propres distinctes, ils sont orthogonaux.
157
A.4. Opérateurs linéaires bornés
Il est facile de voir qu’une valeur propre λ est nécessairement réelle : si f est
un vecteur propre relatif à λ, on a
λ (f | f ) = (f | λf ) = (f | Af ) = (Af | f ) = (λf | f ) =λ (f | f ) .
De même, l’orthogonalité des vecteurs propres (relatifs aux valeurs λ1 6= λ2
qui sont réelles) se montre aisément :
λ1 (f1 | f2 ) = (Af1 | f2 ) = (f1 | Af2 ) = λ2 (f1 | f2 ) ,
ce qui impose (f1 | f2 ) = 0
Il reste à démontrer que A−λ est surjectif si λ n’est pas réel. Nous allons
d’abord établir l’estimation suivante, valable pour tout u ∈ H. Du fait que
(u | Au) est réel, on a
|Im λ| kuk2 = |Im (u | (A−λ)u)| ≤ kuk k(A−λ)uk
et donc
kuk ≤ |Im λ|−1 k(A−λ)uk .
(A.13)
Montrons ensuite que l’image de A−λ est dense en utilisant le critère de
totalité (théorème A.3.12) ; nous devons donc montrer qu’un vecteur h orthogonal à l’image
est nécessairement
nul. Si on a (h | (A−λ)f ) = 0 pour tout f ,
on a donc (A−λ)h f = 0 pour tout f . Le vecteur (A−λ)h doit donc être
nul et, λ ne pouvant être une valeur propre, on a h = 0.
Tout élément g de H est donc limite d’une suite d’éléments gn = (A−λ)un
de l’image. D’après l’estimation (A.13), on a
kup − uq k ≤ |Im λ|−1 kgp − gq k −−→ 0 .
p,q→∞
La suite un est de Cauchy, et converge donc vers un élément u ∈ H. Par
continuité, on a (A−λ)u = g. Cela montre que (A−λ) est surjectif et achève
la démonstration.
Remarque A.4.17 On déduit que si A est un opérateur autoadjoint et H est
séparable, alors σp (A) est dénombrable.
Théorème A.4.18 (i) Si U est un opérateur isométrique, alors les valeurs
propres de U sont de module 1. En outre, deux vecteurs propres relatifs à des
valeurs propres différentes sont orthogonaux.
(ii) Si U est unitaire, le spectre de U est contenu dans le cercle unité
{λ | |λ| = 1}.
158
Annexe A. Éléments d’analyse fonctionnelle
Nous admettrons la seconde partie du théorème. Si f est un vecteur propre
relatif à la valeur propre λ, on a
|λ| kf k = kλf k = kU f k = kf k ,
ce qui montre que |λ| = 1.
Si maintenant f1 et f2 sont des vecteurs propres relatifs à λ1 6= λ2 , on a
(f1 | f2 ) = (U f1 | U f2 ) = (λ1 f1 | λ2 f2 ) = λ1 λ2 (f1 | f2 ) .
Il suffit de remarquer que λ1 = λ−1
1 et que λ1 λ2 est donc différent de 1 pour
en déduire que (f1 | f2 ) = 0.
c
Opérateurs hermitiens en dimension finie
Soit un espace hermitien H de dimension d et A un opérateur autoadjoint.
Le point clef sera le lemme suivant, qui garantit l’existence de valeurs propres,
et qui repose sur une propriété spécifique des espaces de dimension finie : les
ensembles fermés et bornés sont compacts.
Lemme A.4.19 L’opérateur A possède un vecteur propre v relatif à une valeur propre λ. En notant F = {v}⊥ l’espace des vecteurs orthogonaux à v,
l’opérateur A applique F dans lui-même.
La fonction (f | Af ) est continue et à valeurs réelles sur la sphère unité qui
est compacte. Elle y possède donc un maximum λ qu’elle atteint en un point v.
Nous allons montrer que v est un vecteur propre de A relatif à λ.
Pour tout f ∈ H non nul, le vecteur g = f / kf k appartient à la sphère
unité et on a (g | Ag) ≤ λ. On en déduit que (f | Af ) ≤ λ kf k2 . Si on note C
l’opérateur A − λ, on a donc (f | Cf ) ≤ 0 pour tout f , et (v | Cv) = 0.
Pour tout w ∈ H et tout z = reiθ , avec r et θ réels, on a donc
n
o
((v+zw) | C(v+zw)) = (v | Cv) + 2r Re eiθ (w | Cv) + r2 (w | Cw) ≤ 0 .
A θn fixé, ce trinôme
en r doit être maximum pour r = 0. On doit donc avoir
o
iθ
Re e (w | Cv) = 0 pour tout θ. Cela n’est possible que si (w | Cv) = 0.
On a donc établi que (w | Cv) = 0 pour tout w, c’est-à-dire que Cv = 0 ou
encore que (A − λ)v = 0. Cela démontre que v est un vecteur propre.
Si maintenant f est orthogonal à v, on a
(Af | v) = (f | Av) = λ (f | v) = 0 ,
ce qui montre que Af est orthogonal à v et achève la démonstration.
A.5. Théorie spectrale des opérateurs compacts
159
Théorème A.4.20 Si A est un opérateur autoadjoint dans un espace hermitien H de dimension finie, il existe une base orthonormale de H formée de
vecteurs propres de A.
Le résultat est évident en dimension 1, et nous allons procéder par récurrence
en supposant le théorème établi en dimension d − 1. Supposons maintenant H
de dimension d. Le lemme précédent nous fournit un vecteur propre v1 de
norme 1, et nous assure que A applique F (l’orthogonal de v1 ) dans lui-même.
L’espace F , muni du produit scalaire induit, est hermitien. Quant à A, considéré comme opérateur de F dans F , il vérifie toujours (Af | g) = (f | Ag) et est
donc toujours autoadjoint. D’après l’hypothèse de récurrence, il existe une base
orthonormale (v2 , . . . , vd ) de F formée de vecteurs propres. En y adjoignant v1 ,
on obtient la base orthonormale de H voulue, ce qui achève la démonstration
par récurrence.
Remarque A.4.21 La méthode ci-dessus fournit même un algorithme pour
déterminer les valeurs propres et une base de vecteurs propres. On notera S
la sphère unité. On détermine d’abord v1 ∈ S tel que la restriction de (f | Af )
à S y atteigne son maximum λ1 . On note F1 l’orthogonal de v1 . On détermine
ensuite v2 ∈ F1 ∩ S tel que la restriction de (f | Af ) à F1 ∩ S y atteigne son
maximum λ2 . On note F2 l’espace des vecteurs orthogonaux à v1 et v2 ; etc.
On obtient ainsi la suite des valeurs propres, répétées selon leur multiplicité
et rangées par ordre décroissant (au sens large), et une base orthonormée de
vecteurs propres.
Corollaire A.4.22 Pour toute matrice hermitienne M , on peut trouver une
matrice diagonale réelle D et une matrice unitaire U telle que l’on ait
M = U −1 DU = U ∗ DU .
(A.14)
Si A est l’opérateur ayant M pour matrice dans une base orthonormale donnée,
le théorème précédent assure qu’il existe une autre base orthonormale dans
laquelle sa matrice est diagonale réelle. La formule (A.14) résulte du fait que
la matrice de passage, pour un changement de bases orthonormées, est unitaire.
A.5 Théorie spectrale des opérateurs compacts
En dimension infinie, le spectre d’un opérateur autoadjoint n’est pas toujours constitué de valeurs propres. Il existe néanmoins un cas où la situation
160
Annexe A. Éléments d’analyse fonctionnelle
est assez simple et proche de celle que nous avons rencontrée en dimension
finie : il s’agit du cas des opérateurs autoadjoints compacts. Pour déterminer
leur spectre, nous aurons besoin de la théorie dite de Fredholm.
On se donne dans cette section un espace de Hilbert séparable H de dimension infinie.
Définition A.5.1 On dit qu’un opérateur A est compact si, de toute suite
bornée (fn ) d’éléments de H, on peut extraire une sous-suite (fnk ) telle que la
suite (Afnk ) soit convergente.
Exercice A.5.2 Montrer qu’un opérateur A est compact si et seulement si
l’image par A de la boule unité (ou de tout ensemble borné) est contenue dans
un sous-ensemble compact de H.
Remarque A.5.3 Une autre définition équivalente joue un rôle important. On
a défini au Chapitre A.3 la notion de convergence faible ; la proposition A.3.23
et l’exercice A.3.28 montrent qu’un opérateur A est compact si et seulement si
pour toute suite (fn ) qui converge faiblement vers f , la suite (Afn ) converge
vers Af au sens fort (c’est-à-dire que kAfn −Af k →0).
Dans le cas d’un espace de Hilbert H de dimension infinie, l’opérateur
identité n’est pas compact. En effet, par l’exercice A.3.24, la boule unité de H
n’est pas contenue dans un compact de H. Alternativement, si (ej ) est une base
hilbertienne de H, la suite (ej ) converge faiblement vers 0 mais ne converge
pas fortement car kej k = 1.
Exercice A.5.4 Montrer que la composée d’un opérateur compact et d’un opérateur continu (dans un sens ou dans l’autre) est un opérateur compact.
A.5.5 Caractérisation des opérateurs compacts par ceux de rang fini On dit
qu’un opérateur B est de rang fini si l’image de H par B est de dimension
finie. Il est intéressant de savoir, et nous l’admettrons, qu’un opérateur A est
compact si et seulement s’il est limite d’opérateurs de rang fini (au sens de la
norme d’opérateur k kL(H) ).
On peut déduire de cette caractérisation que l’adjoint d’un opérateur compact est également compact.
Théorème A.5.6 (Alternative de Fredholm) Soit A un opérateur compact sur l’espace de Hilbert H. Alors on a les propriétés suivantes.
(i) Ker (I − A) est de dimension finie ;
A.5. Théorie spectrale des opérateurs compacts
161
(ii) Im (I − A) est fermée et Im (I − A) = (Ker (I − A∗ ))⊥ ;
(iii) Ker (I − A) = {0} si et seulement si Im (I − A) = H ;
(iv) dim Ker (I − A) = dim Ker (I − A∗ ).
Démontrons (i). Supposons dim Ker (I − A) = +∞. Alors, il existe un
système orthonormé infini (un )n∈N inclus dans Ker (I − A). Comme Aun = un
et kun − um k2 = 2 si n 6= m, la suite (Aun ) ne contient pas de sous-suite
convergente ce qui contredit le fait que l’opérateur A est compact.
Avant de démontrer (ii), on vérifie la propriété suivante : il existe une
constante c > 0 telle que pour tout u ∈ (Ker (I − A))⊥ , ku − Auk ≥ ckuk. En
effet, dans le cas contraire, on peut trouver une suite (un ) de (Ker(I−A))⊥ telle
que kun k = 1 et kun − Aun k ≤ n1 . La suite (un ) étant bornée, une sous-suite
(unk ) converge faiblement vers un certain u. Par compacité, (Aunk ) converge
vers Au et donc (unk ) converge vers u (en particulier kuk = 1). On en déduit
que Au = u and donc (unk , u) = 0. En passant à la limite, on trouve u = 0, ce
qui est une contradiction.
Soit maintenant une suite (vn ) de Im (I − A) telle vn → v. Pour tout n,
il existe un telle que un − Aun = vn et un ∈ (Ker (I − A))⊥ . Par la propriété
démontrée au dessus, on a kvn − vm k ≥ ckun − um k. Donc un → u, pour un
certain u et v = u − Au. Donc Im (I − A) est fermé. On utilise le lemme A.4.4
(iii) pour finir la preuve de (ii).
On vérifie maintenant (iii). Pour commencer, supposons Ker (I − A) = {0}
et E1 = Im (I − A) 6= H. D’après le point précédent, E1 est fermé. De plus,
E2 = (I − A)(E1 ) 6= E1 car Im (I − A) 6= H et I − A est injectif. De la
même façon, on définit En = (I − A)n (H), et on voit que En est une suite de
sous-espaces fermés strictement décroissante au sens de l’inclusion. On choisit
⊥
un ∈ En tel que kun k = 1 et un ∈ En+1
. Alors
Aun − Aum = −(un − Aun ) + (um − Aum ) + (un − um ).
⊥
On prend n > m. Comme un − Aun , um − Aum , un ∈ Em+1 et um ∈ Em+1
,
kum k = 1, on en déduit que kAun − Aum k ≥ 1. Mais ceci contredit le fait que
l’opérateur A est compact. Réciproquement, supposons Im (I − A) = H. Par
le point précédent, on sait que Ker (I − A∗ ) = {0}. Comme A∗ est compact, on
a Im (I − A∗ ) = H. Alors, Ker (I − A) = (Im (I − A∗ ))⊥ = {0}. Le point (iv)
est admis (voir par exemple [BR]).
A.5.7 Mode d’emploi Soit A un opérateur compact. On peut interpréter
l’alternative de Fredlhom portant sur l’image et le noyau de l’opérateur I − A
comme une alternative sur la résolution de l’équation u − Au = f :
162
Annexe A. Éléments d’analyse fonctionnelle
– Soit, pour tout f ∈ H, l’équation u − Au = f a une unique solution ;
– Soit l’équation u − Au = 0 a des solutions non nulles. Dans ce cas,
l’espace des solutions du problème u − Au = 0 est de dimension finie, et
l’équation non homogène u − Au = f a une solution si et seulement si
f ∈ (Ker (I − A∗ ))⊥ .
En effet, le premier cas correspond à Ker (I − A) = {0} et donc Im (I − A) = H.
Le second cas correspond à la situation où Ker (I − A) est de dimension non
nulle, finie, et f ∈ Im (I − A) si et seulement si f ∈ (Ker (I − A∗ ))⊥ , ce qui
correspond à imposer un nombre fini de relations d’orthogonalité sur f .
Théorème A.5.8 (Spectre d’un opérateur compact) Soit A un opérateur compact. Alors, les propriétés suivantes sont vérifiées :
(i) 0 ∈ σ(A) ;
(ii) σ(A) \ {0} = σp (A) \ {0} ;
(iii) De plus,
– soit σ(A) \ {0} est fini (éventuellement vide) ;
– soit σ(A) \ {0} est une suite qui tend vers 0.
Supposons que 0 n’appartient pas au spectre de A. Alors A est inversible
et on peut écrire I = A−1 ◦ A qui est compact comme composée d’un opérateur
continu et d’un opérateur compact. Ceci est en contradiction avec le fait que
H est de dimension infinie (voir Remarque A.5.3).
Démontrons à présent que tout élément non nul du spectre de A est une
valeur propre. Soit donc λ un tel élément, et supposons que λ n’est pas une
valeur propre. Alors I − λ−1 A est injectif, et donc surjectif d’après l’alternative
de Fredholm (Théorème A.5.6, (iii)). Par la remarque A.4.2, on en conclut
que λ ne peut appartenir au spectre de A.
Montrons maintenant que toute suite de points λn deux-à-deux distincts
du spectre de A (si une telle suite existe) converge nécessairement vers 0.
Une telle suite est bornée d’après le théorème A.4.15, donc elle admet une
valeur d’adhérence. On peut donc supposer, quitte à extraire une sous-suite,
que λn 6= 0 pour tout entier n, et que λn tend vers une limite λ. Soit alors pour
tout n ∈ N un vecteur propre en , de norme 1, associé à λn . Il est facile de voir
que (en )n∈N est une famille libre, et l’on définit l’espace vectoriel En engendré
par e1 , . . . en . Pour tout n ≥ 1, on choisit xn de norme 1 dans En ∩ (En−1 )⊥ .
Alors
−1
−1
−1
λ−1
n Axn − λm Axm = λn (Axn − λn xn ) − λm (Axm − λm xm ) + xn = fn−1 + xn
A.5. Théorie spectrale des opérateurs compacts
163
−1
avec fn−1 ∈ En−1 . On en déduit que kλ−1
n Axn −λm Axm k ≥ 1 si n > m, donc la
suite λ−1
n Axn n’a pas de valeur d’adhérence, ce qui contredit le fait que λ 6= 0.
Comme le spectre de A est compact et possède au plus un point d’accumulation (0), il est fini ou dénombrable (car pour tout entier n, son intersection
avec ] − ∞, −1/n] ∪ [1/n, ∞[ a un nombre fini d’élements).
A.5.9 Théorie spectrale des opérateurs autoadjoints compacts Dans
le cas où l’opérateur est autoadjoint et compact, on peut montrer qu’il est “diagonalisable” dans une base hilbertienne de vecteurs propres. Nous commençons
par le résultat suivant.
Lemme A.5.10 Soit A un opérateur compact, autoadjoint non nul. Alors A
possède une valeur propre non nulle.
Soit M = kAkL(H) > 0, et soit un une suite de la boule unité de H telle
que kAun k converge vers M . Quitte à extraire une sous-suite, on peut supposer
que Aun converge vers une limite v dans H. On a alors kvk = M , et comme A
est autoadjoint, on a
(Av | un ) = (v | Aun ) → M 2 .
Soit maintenant pn la projection orthogonale de un sur Av. Alors
(Av | un ) = (Av | pn ) ≤ kAkL(H) kvkkpn k = M 2 kpn k
ce qui implique que kpn k → 1. Mais alors un converge vers un vecteur porté
par Av, de norme 1, donc on a un → M −2 Av. Par conséquent, v = M −2 A2 v,
ce qui implique enfin que
(A + M I)(A − M I)v = 0 ,
donc A + M I et A − M I ne peuvent être tous deux injectifs. Donc M ou −M
est valeur propre de A.
Théorème A.5.11 (Théorème spectral) Soit A un opérateur autoadjoint
compact. Il existe une base hilbertienne de H formée de vecteurs propres de A.
Le théorème A.4.16 assure que le spectre de A est formé de réels.
Par l’alternative de Fredholm, pour toute valeur propre non nulle λj , l’espace des vecteurs propres correspondant est de dimension finie. On en choisit
une base orthonormale {ej,1 , . . . , ej,mj }. Par le théorème A.4.16, on sait que
164
Annexe A. Éléments d’analyse fonctionnelle
deux vecteurs propres relatifs à deux valeurs propres distinctes sont orthogonaux. Si 0 est valeur propre de A, l’espace propre associé est soit de dimension
finie (et donc admet une base orthonormale), soit est un Hilbert séparable (car
sous-espace vectoriel fermé d’un Hilbert séparable) et donc il admet une base
hilbertienne, notée {e0,1 , e0,2 , . . .}.
Pour construire une base hilbertienne constituée de vecteurs propres de H,
il suffit donc de montrer que le sous-espace vectoriel engendré par tous les
vecteurs propres de A est dense dans H, et considérer alors la réunion (au plus
dénombrable) des bases orthonormales (ou hilbertiennes) de tous les sousespaces propres de A. Soit donc F le sous-espace vectoriel engendré par tous
les vecteurs propres de A. Cet espace est clairement stable par A. En outre F ⊥
est un espace de Hilbert (car sous-espace fermé de H) qui est également stable
par A. En effet si (u, v) ∈ F ⊥ × F , alors comme A est autoadjoint et AF ⊂ F ,
on a
(Au | v) = (u | Av) = 0 .
Soit alors Ae l’application linéaire induite par A sur F ⊥ . C’est un opérateur
compact et autoadjoint sur F ⊥ . Montrons que son spectre ne peut contenir
e
d’élément non nul. Soit λ un tel élément. Alors c’est une valeur propre de A,
donc aussi de A, donc il existe un vecteur propre dans F , ce qui est impossible.
Le lemme A.5.10 implique alors que Ae = 0, et par conséquent F ⊥ est inclus
dans Ker A, qui est lui-même inclus dans F . Donc F ⊥ = {0} et F est dense
dans H.
A.6
Notions sur les opérateurs non bornés
Un opérateur non borné A dans un espace de Hilbert H est la donnée d’un
sous-espace vectoriel de H, noté D(A) et appelé le domaine de A, et d’une
application linéaire, notée aussi A de D(A) dans H. Dans la pratique, on ne
s’intéresse qu’aux opérateurs dont le domaine D(A) est dense dans H.
Si A est à domaine dense et s’il existe une constante C telle que kAf k ≤
C kf k, on dit que l’opérateur est borné. On peut alors le prolonger par continuité, de manière unique, en un opérateur linéaire continu de H dans lui-même
et on revient à la théorie des opérateurs que nous avons étudiés jusqu’ici.
On définit l’adjoint d’un opérateur A non borné à domaine dense de la
façon suivante. On dit que u appartient à D(A∗ ) s’il existe g ∈ H tel que
∀v ∈ D(A)
(u | Av) = (g | v) .
L’élément g en question est alors unique et on le note A∗ u.
A.6. Notions sur les opérateurs non bornés
165
On dit qu’un opérateur non borné à domaine dense est autoadjoint si
D(A∗ ) = D(A) et si, pour tout u ∈ D(A), on a Au = A∗ u. Cette propriété
implique immédiatement, par définition de A∗ que l’on a
(Au | v) = (u | Av)
pour u ∈ D(A) et v ∈ D(A) ,
(A.15)
mais elle est plus forte. En effet, un opérateur A vérifiant (A.15) (on dit alors
que A est symétrique) peut très bien être tel que D(A∗ ) soit strictement plus
grand que D(A). Il n’existe pas de bonne théorie spectrale pour les opérateurs
symétriques, mais il en existe une pour les opérateurs autoadjoints.
Pour un opérateur non borné autoadjoint, on définit l’ensemble résolvant :
c’est l’ensemble des λ ∈ C tels que A − λ soit une bijection de D(A) sur H.
Le complémentaire de l’ensemble résolvant est inclus dans R et s’appelle le
spectre de A. On dit que f ∈ D(A) est un vecteur propre relatif à la valeur
propre λ si on a Af = λf . L’ensemble des valeurs propres est inclus dans le
spectre de A. Deux vecteurs propres relatifs à des valeurs propres distinctes
sont orthogonaux.
Annexe B
Intégrale de Lebesgue
L’intégrale de Riemann est relativement simple à définir mais, pour l’étude
d’un certain nombre de concepts (séries de fonctions, fonctions définies par des
intégrales, . . .) qui joueront un rôle important dans ce cours, elle se révèle être
difficile d’emploi et à bien des égards insuffisante.
La théorie de l’intégration introduite en 1900 par H. Lebesgue demande
plus de travail pour arriver aux définitions et propriétés principales, et cette
étude excéderait de beaucoup le cadre de ce cours. En revanche, elle fournit des
énoncés simples, faciles à utiliser, et puissants : ce n’est que dans ce cadre que
l’on dispose des “bons” théorèmes de passage à la limite dans les intégrales, et
que les espaces de fonctions sommables jouissent de bonnes propriétés.
Pour des raisons de temps, la solution que nous adopterons consiste à admettre d’emblée un petit nombre de théorèmes, dont la démonstration est
longue mais dont l’énoncé est simple, et à en déduire les résultats fondamentaux de la théorie. Nous admettrons notamment dès le début l’existence et
les principales propriétés de l’intégrale des fonctions positives, ce qui dans un
exposé déductif nécessiterait toute la construction de la mesure de Lebesgue.
On trouvera dans la section B.5 quelques indications sur cette construction
et quelques mots sur les questions de mesurabilité. Le lecteur intéressé est
également renvoyé au cours de Tronc Commun de première année.
B.1
Intégrale des fonctions positives
Pour éviter d’avoir à distinguer plusieurs cas dans les énoncés, nous considérerons des fonctions à valeurs dans l’ensemble R+ = [0, ∞], constitué des
nombres réels ≥ 0 auxquels on adjoint un élément noté +∞. On étend de
168
Annexe B. Intégrale de Lebesgue
façon évidente à cet ensemble l’addition, la multiplication par les éléments de
]0, ∞[ et la relation d’ordre.
Cet ensemble possède une propriété bien agréable : toute suite croissante
d’éléments de R+ converge vers un élément de R+ . Si elle est bornée par un
(vrai) nombre réel, on sait en effet qu’elle converge vers un nombre réel. Sinon, on sait qu’elle tend vers l’infini (au sens classique), et nous dirons qu’elle
P
aj
converge vers l’élément +∞. En conséquence, la somme d’une série ∞
Pj=0
p
d’éléments de R+ est toujours définie : les sommes partielles Sp = j=0 aj
forment une suite croissante, qui converge soit vers un nombre réel, soit
vers +∞.
Nous admettrons qu’il existe une application
f 7→
Z
f (x) dx
Rd
R
R
(que l’on notera parfois f (x) dx voire f ) qui, à toute fonction f , définie sur
Rd et à valeurs dans R+ fait correspondre un élément de R+ , et qui vérifie les
quatre propriétés suivantes.
(a) Linéarité
: pour
f et g comme ci-dessus, et pour λ, µ ∈]0, ∞[, on a (λf +
R
R
µg) = λ f + µ g.
R
(b) Croissance : si f (x) ≤ g(x) pour tout x, on a
est en fait une conséquence de la précédente.
R
f ≤
R
g. Cette propriété
(c) Relation avec le volume : Pour un pavé P = [a1 , b1 ] × . . . [ad , bd ], si on
appelle 1P la fonction égale à 1 sur P et à 0 ailleurs, on a
Z
d
Y
1P (x) dx =
(bj − aj ) .
j=1
(d) Le théorème fondamental suivant :
Théorème B.1.1 (de Beppo Levi ou de la convergence monotone)
Si fj est une suite croissante de fonctions définies sur Rd et à valeurs dans R+ ,
on a
Z
Z
lim fj (x) dx = lim fj (x) dx ≤ +∞ .
(B.1)
j→∞
j→∞
En particulier, pour des fonctions uj positives, prenant éventuellement la valeur
+∞, on peut poser
Sp (x) =
p
X
j=0
uj .
B.1. Intégrale des fonctions positives
169
La suite des fonctions Sp est croissante et, pour chaque point x ∈ Rd , on a
P
Sp (x) → ∞
0 uj (x). Le théorème de Beppo Levi nous fournit donc le résultat
suivant.
Corollaire B.1.2 Soit uj une série de fonctions définies sur Rd et à valeurs
dans R+ . On peut alors l’“intégrer terme à terme”, c’est-à-dire que l’on a
P
Z X
∞
uj (x) dx =
j=1
∞ Z
X
uj (x) dx ≤ +∞ .
(B.2)
j=1
B.1.3 Mesure des ensembles Si A est un sous ensemble de Rd , on note 1A
la fonction égale à 1 sur A et à 0 ailleurs, et l’on pose
µ(A) =
Z
1A (x) dx .
L’application µ s’appelle la mesure de Lebesgue. C’est une application de l’ensemble des parties de Rd dans R+ qui vérifie les deux propriétés suivantes.
(a) Croissance : si A ⊂ B, on a µ(A) ≤ µ(B). Cela résulte de la croissance de
l’intégrale (ou si l’on veut de µ(B) = µ(A) + µ(B \ A)).
(b) Additivité dénombrable : si des sous-ensembles Aj , j ∈ N, sont deux à
S
P
S
deux disjoints, on a µ( Aj ) = µ(Aj ). En effet, en posant A = j Aj , on a
P
alors 1A = j 1Aj , et le résultat découle de (B.2).
Si on ne suppose pas les Aj disjoints deux à deux, on a seulement la sousS
P
additivité : µ( Aj ) ≤ µ(Aj ). On a également la relation µ(A ∪ B) + µ(A ∩
B) = µ(A) + µ(B).
Les ensembles de mesure nulle — on dit aussi ensembles négligeables —
jouent un rôle important dans la théorie. D’après la sous-additivité, la réunion
d’une infinité dénombrable d’ensembles de mesure nulle est de mesure nulle.
Un point (et plus généralement un pavé plat) étant de mesure nulle, il en
résulte qu’un ensemble dénombrable est de mesure nulle.
Exercice B.1.4 Démontrer que le graphe d’une application continue de R dans
R est un sous-ensemble de mesure nulle dans R2 (quels que soient ε et N , on
montrera que la portion du graphe comprise entre les abscisses −N et N est
contenue dans une réunion de rectangles dont la somme des mesures est ≤ ε).
Exercice B.1.5 Soit A ⊂ Rd et soit h la fonction égale à +∞ dans A et à 0
dans son complémentaire. Démontrer que l’on a
Z
Rd
h(x) dx =
0
si µ(A) = 0
.
+∞ si µ(A) > 0
170
Annexe B. Intégrale de Lebesgue
En déduire
que, si f est à ovaleurs dans R+ et vérifie
n
l’ensemble x ∈ Rd f (x) = +∞ est de mesure nulle.
R
f (x) dx < +∞,
On dit qu’une propriété P (x) dépendant d’un point x est vérifiée presque
partout (en abrégé p. p.) si l’ensemble {x| non P (x)} est de mesure nulle. Si
chacune des propriétés Pj (x) , j ∈ N est vraie presque partout, il en est donc
de même de [∀j, Pj (x)].
Exercice B.1.6 Soient f et g deux fonctions continues telles que f (x) =
g(x) p.p. Montrer que f et g sont égales en tout point.
Théorème B.1.7 Soit f définie dans Rd et à valeurs dans R+ . On a
Z
f (x) dx = 0 ⇐⇒ f (x) = 0 p. p.
Posons A = {x| f (x) 6= 0}. On a f (x) ≤ limj→∞ j1A (x). Si µ(A) = 0, on
obtient donc en utilisant (B.1)
Z
f (x) dx ≤ lim j
j→∞
Z
1A (x) dx = 0 .
Réciproquement, si l’intégrale de f est nulle et en remarquant que 1A (x) ≤
limj→∞ jf (x), on obtient
µ(A) =
B.2
Z
1A (x) dx ≤ lim j
j→∞
Z
f (x) dx = 0 .
Fonctions sommables
Définition B.2.1 Soit f une fonction définie dans Rd à valeurs dans C. On
dit que f est sommable (ou intégrable au sens de Lebesgue) si on a
Z
Rd
|f (x)| dx < ∞.
L’espace des fonctions sommables est noté L1 (Rd ).
Dans la pratique, pour montrer qu’une fonction est sommable, il suffit de
montrer qu’elle est majorée en module par une fonction positive dont on sait
déjà qu’elle est d’intégrale finie.
Dans le cas où une fonction sommable f est à valeurs réelles, on peut l’écrire sous la forme f = g − h où g et h sont positives et d’intégrales finies. On
171
B.2. Fonctions sommables
peut par exemple prendre f = f+ − f− , en posant f± (x) = max {±f (x) , 0},
et les fonctions f± sont majorées par la fonction |f | qui est d’intégrale finie.
On définit alors l’intégrale de f par
Z
Rn
f (x) dx =
Z
g(x) dx −
Rn
Z
Rn
h(x) dx ,
le résultat ne dépendant pas de la décomposition choisie. En effet, si on pose
r = g −f+ , on a également h−f− = r, la fonction
r étant
positive
et
d’intégrale
R
R
R
R
R
R
finie (elle
est
majorée
par
g).
On
a
alors
g
=
f
+
r,
h
=
f
+
− + r et
R
R
R
R
donc g − h = f+ − f− .
Si f = f1 + if2 est sommable
etR à valeurs
complexes, les fonctions fj sont
R
R
alors sommables, et on pose f = f1 + i f2 .
A partir des propriétés correspondantes pour les fonctions positives, on
montre facilement les propriétés élémentaires suivantes.
Linéarité : l’espace L1 (Rd ) est un espace vectoriel, et l’application f 7→ f est
linéaire de L1 (Rd ) dans C.
R
Croissance : si f et
fe, sommables
et à valeurs réelles, vérifient f (x) ≤ g(x)
R
R e
pour tout x, on a f ≤ f .
Pour f et fe sommables à valeurs complexes, on a
Z
et
f (x) dx
Z f (x) + fe(x)
dx ≤
≤
Z
Z
|f (x)| dx ,
|f (x)| dx +
(B.3)
Z e f (x)
dx .
(B.4)
Démontrons par exemple l’additivité pour des fonctions réelles. Si f = g −h
e sont des décompositions de f et fe en différences de fonctions
et fe = ge − h
e et
positives
d’intégrale
finie, onR a la décomposition f + fe = (g + ge) − (h + h)
R
R
e ce qui entraîne le résultat voulu.
donc (f + fe) = (g + ge) − (h + h),
Montrons également (B.3), qui
entraîne facilement (B.4). Soit θ un nombre
R
complexe de module 1 tel que θ f soit réel positif. On a alors
Z
f (x) dx
=
Z
Re(θf (x)) dx ≤
Z Re(θf (x))
+
dx ≤
Z
|f (x)| dx .
B.2.2 Intégration sur un sous-ensemble Soit A un sous-ensemble de Rd
et f une fonction définie sur A. On notera fA la fonction égale à f (x) pour
x ∈ A et à 0 sinon.
172
Annexe B. Intégrale de Lebesgue
On dit que la fonction f est sommable sur A si la fonction fA est sommable
dans Rd . On note L1 (A) l’espace des fonctions sommables sur A, et on pose
alors
Z
Z
f (x) dx =
fA (x) dx .
Rd
A
Le passage de f à fA permet d’associer à tout résultat sur l’espace L1 (Rd )
un résultat correspondant sur L1 (A), que nous laisserons au lecteur le soin
d’énoncer.
Remarque B.2.3 Si deux fonctions f et g sont égales presque partout, et si
l’une d’elles estR sommable,
l’autre
l’est aussi, et elles ont la même intégrale.
R
R
On a en effet | f − g| ≤ |f − g| , quantité qui est nulle d’après le théorème B.1.7. En particulier, l’intégrale d’une fonction sur un ensemble de mesure
nulle est toujours nulle. De même, en dimension 1, il est équivalent d’intégrer
une fonction f sur [a, b] ou sur ]a, b[, le résultat étant habituellement noté
Rb
a f (x) dx.
Intégrale d’une fonction définie presque partout. Lorsqu’une fonction f est
définie seulement presque partout dans Rd , si l’un de ses prolongements fe à
l’espace entier est sommable, il résulte de la remarque précédente que tous
les autres prolongements le sont aussi et qu’ils ont tous la même intégrale.
Par abus de langage et de notation,
on dit dans ce cas que la fonction f est
R
d
sommable dans R et on note Rd f (x) dx l’intégrale de fe.
Le théorème suivant est d’une importance capitale. La supériorité de l’intégrale de Lebesgue sur l’intégrale de Riemann est due en partie au fait que
l’on peut intégrer plus de fonctions, mais elle est surtout due au fait que l’on
dispose de théorèmes beaucoup plus efficaces.
Théorème B.2.4 (de Lebesgue ou de la convergence dominée)
Soit fj une suite de fonctions qui converge presque partout vers une fonction
f . On suppose qu’il existe une fonction positive sommable fixe h telle que l’on
ait |fj (x)| ≤ h(x) p.p. pour tout j. On a alors
Z
et
Z
|f (x) − fj (x)| dx → 0
fj (x) dx →
Z
f (x) dx .
(B.5)
(B.6)
Considérons les ensembles Aj = {x| |fj (x)| > h(x)} et l’ensemble B constitué des
points x où la suite fj (x) ne converge pas vers f (x). Ces ensembles
Ssont de me∞
sure nulle par hypothèse, et il en est donc de même de N = B ∪
j=0 Aj . En
173
B.2. Fonctions sommables
posant fej (x) = fj (x) pour x 6∈ N et fej (x) = 0 pour x ∈ N , et en définissant de
même fe, il suffit de démontrer le théorème en remplaçant les fonctions fj par les fej
(les intégrales sont inchangées), et nous nous sommes ainsi ramenés au cas où les
majorations et la convergence ont lieu partout.
En posant gj (x) = fej (x) − fe(x), puis hj (x) = supk≥j gk (x), on voit facilement
que hj est une suite décroissante de fonctions positives qui tend vers 0 en tout point,
et que l’on a hj (x) ≤ 2h(x) en tout point. Il nous reste à prouver que l’intégrale de
hj tend vers 0, ce qui entraîne immédiatement (B.5) et (B.6).
En appliquant le théorème de la convergence monotone à la suite croissante de
fonctions positives 2h − hj , qui tend vers 2h en tout point, on obtient
Z
lim
j→∞
[2h(x) − hj (x)] dx = 2
Z
h(x) dx .
Comme la fonction h est sommable, l’intégrale figurant au premier membre est la
R
différence des intégrales de 2h et de hj . Cela prouve que hj (x) dx → 0 et achève
la démonstration.
Commentaire B.2.5 On se contente souvent de la conclusion (B.6) (passage à la limite dans l’intégrale), mais la conclusion
(B.5)
est unR énoncé plus
R
R
fort qui entraîne immédiatement l’autre (on a | f − fj | ≤ |f −fj |). En
revanche, (B.6) n’entraîne pas (B.5).
Commentaire B.2.6 Même en dimension 1, ce théorème mérite d’être comparé à son analogue en intégrale de Riemann : si des fonctions fj (intégrables
au sens
de Riemann) convergent uniformément vers f sur [a, b], alors
Rb
Rb
f
dx
→
f
dx. L’hypothèse implique en fait qu’il existe M tel que
a j
a
|fj (x)| ≤ M quels que soient x et j, et la conclusion est donc un cas particulier
du théorème de Lebesgue (en prenant h égale à M sur [a, b] et 0 ailleurs).
Mais le théorème de Lebesgue donne beaucoup plus : il n’est pas nécessaire
de se limiter à un intervalle fini, on peut l’appliquer sur R entier ou sur un
sous-ensemble quelconque ; il n’est pas nécessaire de se limiter à des fonctions
bornées (on demande seulement que h soit d’intégrale finie) ; enfin et surtout,
on n’a nul besoin de convergence uniforme et il n’est même pas nécessaire que
fj (x) → f (x) en chaque point, le théorème acceptant des points exceptionnels
s’ils forment un ensemble négligeable.
Commentaire B.2.7 Le théorème de Lebesgue serre de très près la réalité : ce
n’est pas une condition nécessaire et suffisante mais presque (voir le théorème
ci-dessous). Si on s’aperçoit que les hypothèses ne sont pas vérifiées, il est
fréquent que l’intégrale de la limite diffère de la limite des intégrales. En voici
deux exemples typiques où, pour en avoir une représentation plus imagée, on
pourra penser que les fj sont des densités de masses positives.
174
Annexe B. Intégrale de Lebesgue
– La fonction fj est égale à 1 sur l’intervalle [j, j + 1] et à 0 dans
le compléR
mentaire. On a fj (x) → 0 en tout point x alors que lim fj (x) dx = 1.
On voit que “la masse disparaît à l’infini”. La meilleure fonction h qui
majore toutes les fj est la fonction valant 1 sur la demi-droite positive,
et bien entendu elle n’est pas sommable.
– La fonction fj est égale à j sur l’intervalle ]0, 1/j[ et à 0 dans
le compléR
mentaire. On a encore fj (x) → 0 en tout point x et lim fj (x) dx = 1.
On peut dire que “la masse se concentre sur un ensemble de mesure nulle”, en l’occurence l’ensemble réduit à l’origine. Une fonction simple qui
majore toutes les fj est la fonction h valant 1/x sur ]0, 1] et 0 ailleurs
(on peut faire un peu mieux mais pas beaucoup), et là encore elle n’est
pas sommable.
Le lecteur pourra construire beaucoup d’exemples analogues et on peut presque
dire que l’hypothèse principale du théorème de Lebesgue (la majoration par
une fonction sommable fixe) signifie que l’on se prémunit contre ces deux types
d’accident.
Nous admettrons le résultat suivant, qui est une réciproque partielle du théorème de Lebesgue.
Théorème B.2.8 Soient fj et f des fonctions sommables telles que l’on ait
|fj − f | dx → 0 pour j → 0. On peut alors extraire une sous-suite fjk de la
suite fj qui vérifie les hypothèses du théorème de Lebesgue : fjk (x) → f (x) p.p.
et les fjk sont majorées en module par une fonction h positive et sommable.
R
Exercice B.2.9 Soit h une fonction positive
sommable sur R, et soit (aj ) une
R
suite tendant vers +∞. Démontrer que a∞j h(x) dx −→ 0.
j→∞
d
Exercice B.2.10 Soit h une fonction positive sommable sur R
et soient Aj
R
d
des sous-ensembles de R tels que µ(Aj ) −→ 0. Démontrer que Aj h(x) dx tend
j→∞
vers 0 pour j → +∞.
Exercice B.2.11 Soit Aj une suite croissante de sous-ensembles de Rd et
S
posons
A = j Aj . Démontrer
que, pour toute fonction f ∈ L1 (A), on a
R
R
A f (x) dx = limj→∞ Aj f (x) dx. Démontrer qu’une fonction f définie sur A
R
appartient à L1 (A) si et seulement si supj Aj |f (x)| dx < ∞.
Théorème B.2.12 (de dérivation sous le signe somme) Soient I un intervalle de R et A un sous-ensemble de Rd . On se donne une fonction f définie
sur A × I vérifiant les trois hypothèses suivantes.
175
B.2. Fonctions sommables
(a) Pour tout λ ∈ I, la fonction x 7→ f (x, λ) est sommable sur A
(b) La dérivée partielle ∂f /∂λ (x, λ) existe en tout point de A × I
(c) Il existe une fonction h positive et sommable sur A telle que l’on ait
|∂f /∂λ (x, λ)| ≤ h(x) quels que soient x et λ.
Alors la fonction F définie par
Z
F (λ) =
f (x, λ) dx
(B.7)
∂f
(x, λ) dx .
∂λ
(B.8)
A
est dérivable dans I, et on a
0
F (λ) =
Z
A
B.2.13 Mode d’emploi Ce résultat ne prend toute sa force que si on l’accompagne des deux remarques suivantes.
1. Avant d’appliquer le théorème, on peut retirer du domaine d’intégration un ensemble de mesure nulle, ce qui ne change pas les intégrales
dans (B.7) et (B.8), et donc ne vérifier les hypothèses que dans l’ensemble
A0 ainsi obtenu.
Par contre, il ne suffirait pas que, pour chaque λ, les hypothèses soient
satisfaites sauf sur un sous-ensemble de A — fût-il réduit à un point —
qui dépend de λ (voir l’exercice B.2.17).
2. La dérivabilité est une propriété locale. Pour prouver que F est dérivable dans I, il suffit de montrer que F est dérivable dans tout intervalle
compact [c, d] ⊂ I. Il suffira donc de trouver des fonctions positives sommables hcd qui majorent ∂f /∂λ en module lorsque λ parcourt [c, d].
Remarque B.2.14
Il existe un théorème de continuité sous le signe somme
R
pour F (λ) = A f (x, λ) dx, lorsque λ parcourt un ouvert de Rp , et le lecteur
pourra l’énoncer s’il le désire. Il faut prouver que pour toute suite λj tendant
vers un point λ0 , on a F (λj ) → F (λ0 ), et le théorème de Lebesgue est là
pour ça.
Lorsque λ parcourt un ouvert ω ⊂ Rp , pour prouver que F est de classe
C on procède généralement en deux temps. On prouve d’abord l’existence des
∂F/∂λi en gelant les autres variables λj et en appliquant le théorème B.2.12
à la fonction de x et λi ainsi obtenue. On montre ensuite la continuité de ces
dérivées partielles dans ω à l’aide du théorème de Lebesgue.
1
176
Annexe B. Intégrale de Lebesgue
B.2.15 Démonstration du théorème B.2.12 On a, λ étant fixé,
Z
1
[F (λ + `) − F (λ)] = g` (x) dx ,
`
A
où on a posé
1
[f (x, λ + `) − f (x, λ)] .
`
La fonction g` converge en tout point vers ∂f /∂λ. D’autre part, on a |g` (x)| ≤
sup0≤θ≤1 |∂f /∂λ (x, λ + θ`)| ≤ h(x) d’après le théorème des accroissements
finis, et le théorème résulte immédiatement du théorème de Lebesgue.
g` (x) =
Nous nous bornons à énoncer l’équivalent, pour les fonctions holomorphes
d’une variable complexe (voir Appendice C) du théorème B.2.12.
Théorème B.2.16 Soient Ω un ouvert de C et A un sous-ensemble de Rd .
On se donne une fonction f (x, w) définie sur A × Ω vérifiant les trois hypothèses suivantes.
(a) Pour tout w ∈ Ω, la fonction x 7→ f (x, w) est sommable sur A
(b) Pour tout x ∈ A, la fonction w 7→ f (x, w) est holomorphe dans Ω (on note
∂f /∂w(x, w) sa dérivée)
(c) Il existe une fonction h positive et sommable sur A telle que l’on ait
|∂f /∂w (x, w)| ≤ h(x) quels que soient x et w.
Alors la fonction F définie par
F (w) =
Z
f (x, w) dx
A
est holomorphe dans Ω, et on a
0
F (w) =
Z
A
∂f
(x, w) dx .
∂w
Le “mode d’emploi” est le même que celui du théorème B.2.12 : on peut retirer
de A un ensemble de mesure nulle avant d’utiliser l’énoncé ; il suffit de vérifier,
pour chaque z0 ∈ Ω, que F est holomorphe dans un disque centré en z0 , et on
peut se contenter d’une fonction majorante h relative aux points de ce disque.
Exercice B.2.17 Soit ϕ une fonction continue sur [0, 1]. On considère, dans
[0, 1] × [0, 1] la fonctionR f définie par f (x, λ) = ϕ(x) si x ≤ λ et f (x, λ) = 0
sinon. On pose F (λ) = 01 f (x, λ) dx. Pour chaque λ la dérivée partielle ∂f /∂λ
existe sauf en un point, et elle est majorée par une fonction sommable fixe : la
fonction 0. Déterminer la dérivée de F .
177
B.3. Cas de la dimension 1
Exercice B.2.18
(a) Soit f une fonction sommable sur ]0,
∞[. Pour λ ∈ [0, ∞[, on définit sa
R ∞ −λt
transformée de Laplace F par F (λ) = 0 e f (t) dt. Démontrer que F est
continue sur [0, ∞[.
(b) On suppose maintenant que f , toujours définie sur ]0, ∞[, est telle que
(1 + t)−N f (t) est sommable pour un N convenable. Démontrer que F (λ) est
bien définie par la formule ci-dessus pour λ ∈]0, ∞[, et que la fonction F
est de classe C ∞ sur cet intervalle. Déterminer la transformée de Laplace de
t 7→ tk f (t).
(c) Sous les hypothèses
de (b), pour λ = µ + iν complexe vérifiant µ > 0, on
R ∞ −λt
pose F (λ) = 0 e f (t) dt. Démontrer que F est une fonction holomorphe
dans le demi-plan ouvert Re λ > 0.
Exercice B.2.19 Calculer la dérivée à droite en 0 de la fonction
λ 7→
Z 1
(g(x) + λ2 )1/2 dx
0
où g est une fonction bornée, positive ou nulle sur ]0, 1[.
Si g est continue, la fonction de λ ci-dessus est définie par une excellente
intégrale de Riemann, et la conclusion devrait surprendre le lecteur.
B.3
Cas de la dimension 1
Théorème B.3.1 Soit f une fonction continue sur un intervalle [a, b] et soit
F une primitive de f . On a alors
Z
f (x) dx = F (b) − F (a) .
[a,b]
Toute fonction continue par morceaux (ou plus généralement intégrable au
sens de Riemann) sur un intervalle borné [a, b] est sommable, et son intégrale
de Lebesgue coïncide avec son intégrale au sens de Riemann.
Considérons la fonction G(x) =
serait le même pour ` < 0)
R
[a,x]
f (t) dt. On a, pour ` > 0 (le raisonnement
1Z
1
[G(x + `) − G(x)] =
f (t) dt
`
` [x,x+`]
1Z
1Z
=
f (x) dt +
[f (t) − f (x)] dt .(B.9)
` [x,x+`]
` [x,x+`]
178
Annexe B. Intégrale de Lebesgue
D’après la propriété (c) de la section B.1, l’intégrale d’une constante M sur un
intervalle [a, b] est égale à M (b−a). Le membre de droite de (B.9) est la somme
de f (x) et d’une quantité majorée en module par max[x,x+`] |f (t) − f (x)| qui
tend vers 0 avec `. Il en résulte que G est dérivable, et que G0 (x) = f (x). La
fonction F − G est donc constante, et on a G(b) − G(a) = F (b) − F (a) ce qui
est le résultat voulu.
La seconde partie de l’énoncé est donc établie si f est continue. Si elle est
continue par morceaux, l’intervalle [a, b] est réunion finie d’intervalles [xj , xj+1 ]
pour lesquels on a égalité, et il suffit de faire la somme des égalités obtenues. Si
le lecteur a su, et n’a pas oublié, la définition générale des fonctions intégrables
au sens de Riemann, il trouvera dans l’exercice suivant la démonstration complète de l’énoncé.
Exercice B.3.2 Soit f une fonction intégrable au sens de Riemann sur [a, b].
Démontrer que f est sommable et que les deux définitions de l’intégrale de f
coïncident. On pourra, pour chaque entier m, poser h = (b−a)/2m et introduire
les fonctions ϕm [resp. ψm ] constantes sur chaque intervalle [kh, (k + 1)h[ et
y prenant comme valeur le sup [resp. inf] de f sur le même intervalle. On
montrera ensuite que les suites (ϕm ) et (ψm ) sont monotones et, en utilisant
le théorème B.1.7, que l’on a inf ϕm = sup ψm p.p.
Bien entendu, on ne se privera pas de la notation classique ab f (x) dx pour
désigner, selon les cas, l’intégrale sur ]a, b[ ou l’opposé de l’intégrale sur ]b, a[.
R
B.3.3 Qu’est-il advenu des intégrales absolument convergentes. . .
A la différence de celle de Riemann, l’intégrale de Lebesgue est directement
définie de manière globale sur R. Cela rend beaucoup plus nette la distinction
entre deux concepts de nature très différente mais qui sont souvent présentés
ensemble (sous le nom plus que discutable d’“intégrales impropres”) en théorie
de l’intégrale de Riemann.
Quoi qu’il en soit, il est important d’avoir des relations entre les intégrales
sur R entier, et celles sur les intervalles finis. Pour a < b, on notera fab la
fonction égale à f pour x ∈ [a, b] et à 0 ailleurs.
Théorème B.3.4 (i) Soit f une fonction positive définie sur R ; on a
Z
f (x) dx =
R
lim
Z b
a→−∞;b→+∞ a
f (x) dx ≤ +∞ .
(B.10)
(ii) Soit f à valeurs complexes définie sur R ; on a
1
f ∈ L (R)
⇐⇒
sup
Z b
a→−∞;b→+∞ a
|f (x)| dx < ∞ .
(B.11)
179
B.3. Cas de la dimension 1
(iii) Soit f sommable sur R ; on a
Z
R
f (x) dx =
lim
Z b
a→−∞;b→+∞ a
f (x) dx ∈ C .
(B.12)
Si f est une fonction positive, et si an et bn sont des suites respectivement
décroissant vers −∞ et croissant vers +∞, la suite des fonctions fan bn converge
en croissant vers la fonction f , et on a convergence des intégrales d’après le
théorème de Beppo Levi. On obtient donc la formule (B.10), dans laquelle on
peut remplacer lim par sup. Cela prouve la première assertion.
En particulier, une fonction f étant sommable si et seulement si |f | est
d’intégrale finie, l’énoncé précédent appliqué à |f | donne (B.11).
Si la fonction f est sommable, la suite des fonctions fan bn définies comme
ci-dessus converge vers f en chaque point, et est majorée en module par la
fonction sommable fixe |f (·)|. On a donc (B.12) en vertu du théorème de
Lebesgue.
Remarque B.3.5 Une fonction f continue (par morceaux) est donc sommable
si et seulement si son intégrale de Riemann est absolument convergente : c’est
ce qu’exprime (B.11).
Bien entendu R ce qui précède s’applique également aux rapports entre
Rb
bn
f
a (x) dx et les an f (x) dx lorsque an et bn tendent respectivement vers a
et b.
B.3.6 . . .et des intégrales semi-convergentes ?
Il peut arriver qu’une fonction (sommableR sur tout compact) f ne soit pas
sommable sur R, mais que les intégrales ab f (x) dx tendent vers une limite
pour a → −∞ , b → +∞. Nous en avons vu plusieurs cas dans le chapitre
précédent (par exemple
sin x/x). Il est traditionnel (et peut-être regrettable)
R +∞
de noter également −∞ f (x) dx la limite en question, parfois appelée intégrale
semi-convergente.
Malgré la notation, de telles expressions ne doivent pas être considérées
comme des intégrales — aucun théorème de la théorie de l’intégration ne s’applique à elles — ce sont des limites d’intégrales et il n’y a rien de plus à en dire.
Pour
les étudier, on applique la théorie de l’intégration aux vraies intégrales
Rb
a f (x) dx, et on passe à la limite avec les moyens du bord.
Exercice B.3.7 On se donne une fonction f de classe C 1 définie sur R dont la
dérivée f 0 est sommable et qui vérifie
f (x) → 0 pour x → ±∞. Montrer que,
Rb
pour α réel non nul, les intégrales a f (x)eiαx dx ont une limite pour a → −∞,
b → ∞. (On intégrera par parties comme dans la remarque C.6.5).
180
Annexe B. Intégrale de Lebesgue
Exercice B.3.8 On se donne une fonction f de classe C 1 , définie et bornée sur
R, telle que la fonction x 7→ f 0 (x)/(1
+ |x|) soit sommable. Montrer que, pour
Rb
2
α réel non nul, les intégrales a f (x)eiαx dx ont une limite pour a → −∞,
b → ∞.
B.4
Intégrales multiples
Théorème B.4.1 (Fubini) Soit f (x, y) une fonction définie dans Rp × Rq
(a) Si f est à valeurs dans R+ , on a l’égalité suivante, où les trois membres
définissent un élément de R+ ,
ZZ
Rp+q
f (x, y) dx dy =
Z
Rp
Z
Rq
f (x, y) dy dx =
Z
Z
Rq
Rp
f (x, y) dx dy .
(B.13)
(b) Si f est sommable dans R , les trois membres de (B.13) “ont un sens”
dans C et sont égaux. Dire que le troisième membre (par exemple) a un sens
signifie précisément que les deux assertions suivantes sont vérifiées :
• pour presque chaque y, la fonction x 7→ f (x, y) est sommable dans Rp ,
R
• la fonction ϕ(y) = f (x, y) dx qui est ainsi définie presque partout est sommable dans Rq .
p+q
B.4.2 Mode d’emploi On désire souvent intervertir les signes d’intégration, et prouver l’égalité des second et troisième membres de (B.13) pour une
fonction f à valeurs complexes. On procède en deux temps.
(a) On prouve d’abord que f est sommable dans Rp+q . Pour cela, on utilise
la forme (a) du théorème de Fubini pour calculer ou majorer l’intégrale
RR
|f (x, y)| dx dy par intégration successive dans l’ordre que l’on désire.
(b) Une fois établi le fait que f est sommable “du couple”, on utilise à nouveau
le théorème de Fubini sous la forme (b).
On prendra garde au fait suivant : il peut très bien arriver (pour une fonction non sommable dans Rp+q ) que les second et troisième membres de (B.13)
aient un sens dans C, et qu’ils soient différents.
B.4.3 Intégration sur un sous-ensemble Pour calculer l’intégrale double d’une
fonction f sur un sous-ensemble A de Rp+q , on se ramène au cas de l’intégration
de la fonction fA égale à f dans A et à 0 ailleurs. Par exemple, dans le troisième
membre de (B.13), l’accolade devient alors l’intégrale de f (·, y) sur la “tranche”
Ay = {x ∈ Rp | (x, y) ∈ A}. En notant π(A) la projection de A sur Rq , on a donc
ZZ
f (x, y) dx dy =
A
Z
π(A)
(Z
Ay
)
f (x, y) dx
dy .
181
B.4. Intégrales multiples
R
En particulier, on obtient µp+q (A) = π(A) µp (Ay ) dy, où µp est la mesure de
Lebesgue de l’espace Rp , en appliquant ce qui précède à la fonction 1. C’est la
formule usuelle de calcul des surfaces et volumes.
Exercice B.4.4 Soit A le graphe d’une application de Rd−1 dans R. Démontrer
que A est de mesure nulle dans Rd .
Exercice B.4.5 Soit uj une suite de fonctions définies (par exemple) sur R, et
considérons la fonction F (x, y) définie sur R2 , nulle pour y < 0 et valant fj (x)
pour j ≤ y < j + 1.
Montrer que la première partie du théorème de Fubini redonne le corollaire B.1.2 du théorème de Beppo Levi, tandis que la seconde partie redonne
une conséquence du théorème de Lebesgue.
Exercice B.4.6 Soit apq une famille indexée par N × N de nombre réels ou
complexes. Donner deux conditions suffisantes pour que l’on ait
∞
X

∞
X


apq  =

∞
X

q=0
q=0
p=0
∞
X

apq  .
p=0
On pourra former la fonction F (x, y) définie dans R2 égale à apq pour p ≤ x <
p + 1 et q ≤ y < q + 1 et appliquer les deux formes du théorème de Fubini.
(Bien entendu, la démonstration directe de ces propriétés est beaucoup plus
facile que celle du théorème de Fubini lui-même).
Théorème B.4.7 (de changement de variable) Soient Ω1 et Ω2 deux ouverts de Rd , et Φ un difféomorphisme 1 de Ω1 sur Ω2 . On notera JΦ (x) le
déterminant de la matrice jacobienne de Φ au point x
∂Φ1 /∂x1 · · · ∂Φ1 /∂xd
···
···
···
JΦ =
∂Φd /∂x1 · · · ∂Φd /∂xd
.
Soit f une fonction définie sur Ω2 .
(a) Si la fonction f est à valeurs dans R+ , on a l’égalité suivante, où les deux
membres ont un sens dans R+
Z
Ω2
f (y) dy =
Z
Ω1
f (Φ(x)) |JΦ (x)| dx .
(B.14)
(b) Si f est à valeurs complexes, elle est sommable dans Ω2 si et seulement
si l’application x 7→ f (Φ(x))JΦ (x) est sommable dans Ω1 et les deux membres
de (B.14) sont alors égaux.
1. C’est-à-dire une bijection de Ω1 sur Ω2 qui est de classe C 1 ainsi que son inverse.
182
Annexe B. Intégrale de Lebesgue
Le lecteur est peut-être surpris de voir apparaître la valeur absolue
du déterR ϕ(b)
minant jacobien, alors que, en dimension 1, la formule classique ϕ(a) f (y) dy =
Rb
0
a f (ϕ(x))ϕ (x) dx ne comporte pas de valeur absolue. Il faut bien voir, en
supposant par exemple a < b, que le membre de gauche est l’intégrale sur
l’intervalle image lorsque ϕ0 > 0 (on a ϕ(a) < ϕ(b)), mais qu’il en est l’opposé
lorsque ϕ0 < 0 (on a alors ϕ(a) > ϕ(b)).
Remarque B.4.8 Il est souvent utile, pour se trouver dans les conditions d’application du théorème, de retirer des domaines d’intégration des ensembles de
mesure nulle, ce qui ne change aucune des intégrales. Par exemple, les coordonnées polaires ne fournissent pas de difféomorphisme du plan sur un ouvert.
Par contre, si on retire du plan l’origine et le demi-axe des x négatif, on obtient
un difféomorphisme de ]0, ∞[×] − π, π[ sur l’ouvert ainsi obtenu, et donc la
formule classique (le jacobien étant égal à r)
ZZ
R2
f (x, y) dx dy =
ZZ
f (r cos θ, r sin θ)r dr dθ ,
]0,∞[×]−π,π[
valable pour f positive ou sommable.
On utilisera parfois la formule analogue dans R3 . Ce n’est pas exactement
une application directe du théorème, mais on s’y ramène facilement en prenant
des équations locales de portions de la sphère unité S2 de R3 . On notera θ le
point courant de celle-ci, et dσθ la mesure de surface.
ZZZ
Rn
f (x) dx =
Z ∞ ZZ
S2
0
f (rθ)r2 dr dσθ .
(B.15)
Exercice B.4.9 Volume d’un tronc de cône
Soit A un sous-ensemble de Rd−1 dont on notera S la mesure de Lebesgue
(d − 1)-dimensionnelle, et soit h > 0. On considère
n
C = (x0 , xd ) ∈ Rd−1 × R 0 < xd ≤ h ,
h
xd
o
x0 ∈ A .
Démontrer que la mesure n-dimensionnelle de C est Sh/d. (On utilisera la
remarque B.4.3 et le théorème de changement de variables pour les homothéties).
B.5
Sur la construction de l’intégrale
Le but de cette section est de donner un aperçu très superficiel de la
construction de l’intégrale de Lebesgue. Le lecteur intéressé par la théorie
pourra se reporter à [LA] ou [RU].
B.5. Sur la construction de l’intégrale
183
On définit d’abord la mesure des ensembles pavables, c’est à dire des ensembles qui sont
réunion finie de pavés d’intérieur disjoint, comme étant égale à la somme des volumes de ces
pavés — après avoir vérifié que le résultat ne dépend pas de la décomposition choisie.
Un premier passage à la limite définit la mesure d’un ouvert Ω de Rd comme étant
égale à la borne supérieure des mesures des ensembles pavables contenus dans Ω. Un second
passage à la limite définit la mesure d’un compact comme étant égale à la borne inférieure
des mesures des ouverts qui le contiennent. On dit alors qu’un ensemble A est mesurable
(pour la mesure de Lebesgue) si, pour tout ε > 0, on peut trouver une suite de compacts Kj
et une suite d’ouverts Ωj tels que l’on ait
∞
[
Kj ⊂ A ⊂
j=0
∞
[
Ωj
et
∞
X
µ(Ωj \ Kj ) ≤ ε .
0
j=0
On définit alors la mesure de A par
µ(A) =
inf
Ω⊃A
Ω ouvert
µ(Ω) =
sup
µ(K) ≤ +∞ .
K⊂A
K compact
Les résultats les plus importants que l’on obtient au terme de cette construction sont
les suivants.
– Les ensembles mesurables forment une tribu c’est-à-dire une famille de parties de Rd
qui est stable par passage au complémentaire et par réunion dénombrable (et donc par
intersection dénombrable). Cette tribu contient notamment les ouverts et les fermés.
– La mesure µ est une application croissante et dénombrablement additive (voir le
n◦ B.1.3) de la tribu des ensembles mesurables dans R+ .
On dit ensuite qu’une application f de Rd dans R+ est mesurable si l’image réciproque
de tout intervalle est un ensemble mesurable, et on définit enfin l’intégrale de f par la formule
Z
∞
X
µ f −1 ([jh, (j + 1)h[) j h
(B.16)
f (x) dx = sup
h>0 j=0
(sauf dans le cas oùR f prend la valeur +∞ sur un ensemble de mesure > 0, auquel cas on
pose bien entendu f = +∞). On peut d’ailleurs remplacer suph>0 par limh→0 dans la
formule ci-dessus.
3h
2h
h
La fonction fh et son intégrale
184
Annexe B. Intégrale de Lebesgue
On interprète souvent cette formule en disant que l’intégrale de Lebesgue découpe le
graphe de f selon l’axe des y, alors que l’intégrale
de Riemann le découpe selon l’axe
des x.
R
R
L’expression (B.16) exprime effectivement f (x) dx comme limite d’intégrales fh (x) dx,
où la fonction fh est égale à kh lorsque kh ≤ f (x) < (k + 1)h.
On voit les avantages de cette méthode : les fonctions fh approchent f à h près en norme
uniforme, même pour des fonctions f très irrégulières, alors que l’approximation uniforme
par des fonctions constantes sur des intervalles ne fonctionne que pour des fonctions très
particulières (continues ou plus généralement réglées).
Le prix à payer est bien sûr le fait que, pour définir l’intégrale de fh , il faut disposer de
la mesure des ensembles f −1 ([kh, (k + 1)h[) — ensembles qui peuvent être très compliqués
— ce qui nécessite toute la construction précédente. Au contraire, l’intégrale de Riemann
n’utilisait que la mesure des intervalles, ce qui est élémentaire.
B.5.1 Existe-t-il des ensembles et des fonctions non mesurables ?
L’expérience suggère la réponse non. En effet, il résulte du fait que les ensembles mesurables
forment une tribu contenant les ouverts que l’espace des fonctions mesurables contient les
fonctions continues et est stable par toutes les opérations dénombrables usuelles : limite
d’une suite de fonctions qui converge en chaque point, sup ou inf dénombrable, . . .
La véritable réponse à la question posée est : cela dépend des axiomes mis à la base des
mathématiques. On a en effet les deux résultats suivants.
(a) Si on adjoint l’axiome du choix aux axiomes usuels de la théorie des ensembles, on peut
prouver effectivement qu’il existe des ensembles non mesurables
(b) Par contre, un résultat relativement récent de logique mathématique (Solovay, 1966)
assure que l’on peut adjoindre à ces mêmes axiomes, sans introduire de contradiction, les
formes dénombrables de l’axiome du choix et l’axiome “tout sous-ensemble de Rd est mesurable”.
Dans la pratique cela signifie que, à moins de le faire exprès à l’aide de l’axiome du
choix, il est exclu que l’on ait à considérer des fonctions non mesurables en mathématiques
(et a fortiori dans les applications aux sciences physiques). C’est pourquoi ce cours a été
écrit comme si toutes les fonctions étaient mesurables. La véritable raison est bien sûr une
question de temps, il y a mieux à faire que de démontrer, par des méthodes répétitives, des
résultats dont on sait d’avance qu’ils sont toujours vrais.
Cela dit, le lecteur excessivement scrupuleux qui serait choqué par cette façon de faire
pourra soit ajouter mentalement l’adjectif “mesurable” chaque fois qu’il rencontrera le mot
“ensemble” ou “fonction”, soit se placer dans le système d’axiomes autorisé par Solovay. C’est
un cadre dans lequel on peut développer toute l’analyse classique, et où tous les énoncés de
ce chapitre sont effectivement des théorèmes.
B.6. Espaces L1 et L2
B.6
a
185
Espaces L1 et L2
Fonctions sommables et convergence en moyenne
Nous avons défini l’espace L1 (Rd ) des fonctions sommables sur Rd . Pour
f ∈ L1 , posons
Z
kf k1 =
|f (x)| dx .
(B.17)
Rd
Il est clair que l’on a kλf k1 = |λ| kf k1 et d’après (B.4), on a kf + gk1 ≤
kf k1 + kgk1 . Pour montrer qu’il s’agit d’une norme, il resterait à vérifier la
propriété (A.1). En fait, kf k1 est nul si la fonction positive |f | est d’intégrale
nulle, ce qui , d’après la proposition B.1.7 est équivalent à |f (x)| = 0 p.p. On
a ainsi
(kf k1 = 0) ⇐⇒ (f (x) = 0 p.p.) .
Il ne s’agit donc pas tout-à-fait d’une norme — la nullité de kf k1 n’entraîne
pas que f soit identique à la fonction 0 — à moins de modifier la signification
de l’égalité. La propriété (A.1) a essentiellement une seule conséquence, qui
est l’unicité de la limite. Dans notre cas, si kf − fj k1 → 0 et si kg − fj k1 → 0,
on peut seulement conclure que f (x) = g(x) p.p.
Nous allons effectivement changer la signification de l’égalité, en considérant comme égales deux fonctions égales presque partout, ce qui permettra
d’utiliser telle quelle toute la théorie des espaces vectoriels normés (nous noterons alors L1 l’espace des fonctions sommables). Cela n’aura aucune conséquence en ce qui concerne les expressions intégrales, qui restent inchangées
lorsque l’on modifie une fonction sur un ensemble de mesure nulle. Par contre,
un point étant de mesure nulle, si une fonction est obtenue comme limite dans
L1 , il faudra éviter de parler de sa valeur en un point particulier.
Remarque B.6.1 Contrairement à ce que l’on pourrait penser, cette convention
est en accord profond avec l’utilisation des fonctions par les sciences physiques.
Si on imagine que f et g représentent la répartition dans l’espace d’une certaine
grandeur, tout appareil qui mesure leurs valeurs en un point x0 aura nécessairement une certaine étendue spatiale, et mesurera en fait une moyenne (éventuellement pondérée) de f ou de g dans un petit voisinage de x0 . Ces moyennes
sont données par des intégrales et sont donc égales si f (x) = g(x) p.p. Aucune
mesure n’étant capable de distinguer f de g, il est plus que raisonnable de
considérer que ces fonctions représentent le même phénomène physique.
Théorème et Définition B.6.2 On note L1 (Rd ) l’espace des fonctions sommables, en convenant que deux fonctions égales presque partout sont égales.
Muni de la norme (B.17), c’est un espace de Banach.
186
Annexe B. Intégrale de Lebesgue
Si A est un sous-ensemble de Rd de mesure > 0, on note L1 (A) l’espace
des fonctions sommables sur A, avec la même convention. C’est un espace de
Banach pour la norme
Z
kf k1,A = |f (x)| dx .
A
La convergence dans ces espaces s’appelle aussi convergence en moyenne.
Le fait que l’espace L1 soit complet est une conséquence, que nous admettrons,
du théorème de Lebesgue. Par contre, l’espace des fonctions intégrables au sens
de Riemann, ne serait pas complet pour la norme (B.17).
On dit qu’une fonction continue est à support dans un compact K si elle est
nulle hors de K. Toute fonction continue f à support compact est sommable.
En effet, le compact K est borné et donc de mesure finie. D’autre part la
fonction continue |f | est bornée sur le compact K et on a donc
Z
Rd
|f (x)| dx =
Z
K
|f (x)| dx ≤ sup |f (x)|
x∈K
Z
1 dx = µ(K) sup |f (x)| < ∞ .
K
x∈K
De même, si A est un sous-ensemble borné de Rd , et si h ∈ Cb (A), on a
1
A |h(x)| dx ≤ supx∈A |h(x)| µ(A), ce qui montre que h ∈ L (A) et que
R
khk1,A ≤ µ(A) khk∞,A .
(B.18)
Nous admettrons l’important résultat suivant.
Théorème B.6.3 (i) Si Ω est un ouvert de Rd (pouvant être Rd lui-même),
l’espace des fonctions continues et à support dans un compact de Ω est dense
dans L1 (Ω).
(ii) Si A est un ensemble borné de Rd , l’espace Cb (A) est dense dans L1 (A).
Exercice B.6.4 Si f est une fonction sommable et continue sur R, démontrer sans utiliser le théorème précédent qu’il existe une suite fj de fonctions
continues à support compact qui converge vers f en moyenne. (On pourra par
exemple poser ϕ(x) = max(0, 1 − |x|), puis fj (x) = f (x)ϕ(x/j), et utiliser le
théorème de Lebesgue).
Remarque B.6.5 Si A est un sous-ensemble borné de Rd , et si on connaît un
sous-espace F de Cb (A) qui est dense dans Cb (A) pour la norme uniforme,
nous allons montrer que F est dense dans L1 (A) (pour la norme de L1 (A)).
B.6. Espaces L1 et L2
187
Etant donné f ∈ L1 (A), on peut d’abord trouver, grâce au théorème B.6.3
une fonction gj ∈ Cb (A) telle que kf − gj k1,A ≤ 1/j. En utilisant maintenant
la densité de F , on peut trouver hj ∈ F telle que kgj − hj k∞,A ≤ 1/j. On a
kf −hj k1,A ≤ kf −gj k1,A + kgj −hj k1,A ≤ 1/j + µ(A) kgj −hj k∞,A ≤
1+µ(A)
,
j
en utilisant (B.18). On a ainsi construit une suite hj d’éléments de F convergeant vers f , ce qui achève la preuve.
Exercice B.6.6 Soit [a, b] un intervalle compact. Démontrer que l’espace des
polynômes est dense dans L1 ([a, b]). Pour un compact K de Rd , démontrer de
même que l’espace des polynômes de n variables est dense dans L1 (K).
Exercice B.6.7 Pour b − a inférieur ou égal (attention à ce dernier cas) à
2π, démontrer que l’espace des polynômes trigonométriques est dense dans
L1 ([a, b]). Montrer qu’il n’en est pas de même pour b − a > 2π.
b
Fonctions de carré sommable et notion de convergence en moyenne quadratique
Une fonction f est de carré sommable dans Rd si |f (x)|2 dx < ∞. Il est
clair que l’espace formé de ces fonctions est stable par multiplication par un
scalaire, et il est aussi stable par somme du fait que |f (x) + g(x)|2 ≤ 2 |f (x)|2 +
2 |g(x)|2 . C’est donc un espace vectoriel.
R
En outre, si f et
g sont de carrésommable, la fonction f g est sommable :
on a |f (x)g(x)| ≤ |f (x)|2 + |g(x)|2 /2. On peut donc poser
(f | g) =
Z
f (x)g(x) dx ,
et
kf k2 =
q
(f | f ) =
Z
2
|f (x)| dx
(B.19)
1/2
.
(B.20)
Il est immédiat de vérifier que ces expressions vérifient toutes les propriétés
requises pour le produit scalaire et la norme d’un espace préhilbertien (elles
sont rappelées au début du chapitre suivant), sauf peut-être l’une d’entre elles.
En effet, la nullité de kf k2 équivaut à la nullité de l’intégrale de la fonction
|f (x)|2 et on a donc
(kf k2 = 0) ⇐⇒ (f (x) = 0 p.p.) .
188
Annexe B. Intégrale de Lebesgue
Nous devrons donc, comme nous l’avons fait pour les fonctions sommables,
remplacer l’égalité par l’égalité presque partout pour pouvoir utiliser la théorie
des espaces normés.
Théorème et Définition B.6.8 On note L2 (Rd ) l’espace des fonctions de
carré sommable, en convenant que deux fonctions égales presque partout sont
égales. Muni du produit scalaire (B.19), et donc de la norme (B.20), c’est un
espace de Hilbert c’est-à-dire un espace préhilbertien complet (voir le chapitre
suivant).
Si A est un sous-ensemble de Rd de mesure > 0, on note L2 (A) l’espace des
fonctions de carré sommable sur A, avec la même convention. C’est un espace
de Hilbert pour le produit scalaire (noté (· | ·)A lorsque c’est nécessaire)
(f | g) =
Z
f (x)g(x) dx
A
et la norme kf k2,A = (f | f )1/2
A .
La convergence associée à la norme de ces espaces porte le nom de convergence en moyenne quadratique.
Le résultat le plus important, que nous admettrons, est le fait que L2 soit
complet. Le chapitre suivant, consacré aux espaces de Hilbert, tirera les conséquences de l’existence d’un produit scalaire. Nous continuons ici par des propriétés d’inclusion et de densité tout-à-fait analogues à celles vues pour l’espace
L1 .
Théorème B.6.9 Si A est un sous-ensemble borné de Rd , on a Cb (A) ⊂
L2 (A) ⊂ L1 (A). On a en outre
∀f ∈ Cb (A),
kf k2,A ≤
q
∀f ∈ L1 (A),
kf k1,A ≤
q
µ(A) kf k∞,A ,
(B.21)
µ(A) kf k2,A .
On a en effet, pour f ∈ Cb (A),
kf k22,A =
Z
A
|f (x)|2 dx ≤ sup |f (x)|2
x∈A
Z
A
1 dx = kf k2∞,A µ(A) .
Cela montre que f est de carré sommable, et il suffit de prendre la racine carrée
pour obtenir la première relation.
B.6. Espaces L1 et L2
189
Si maintenant f appartient à L2 (A), nous allons poser |f | = g et utiliser
l’inégalité de Cauchy-Schwarz :
(g | 1)A ≤ kgk2,A k1k2,A .
Le membre de gauche est l’intégrale sur A de |f |, c’est-à-dire kf k1,A , tandis
que les normes de f et g sont égales et que k1k2,A vaut µ(A)1/2 . Cela montre
la seconde inégalité.
Remarque B.6.10 Les relations qui précèdent sont en fait valables pour un
ensemble A de mesure finie (même s’il n’est pas borné).
Par contre, dans Rd ou plus généralement un sous-ensemble A de mesure
infinie, il n’existe aucune relation d’inclusion entre les espaces Cb , L2 et L1 .
On a toutefois le résultat suivant : si f est à la fois sommable et bornée, elle
est de carré sommable. En effet, on a
kf k22
=
Z
2
|f (x)| dx ≤ sup |f (x)|
Z
|f (x)| dx ≤ kf k∞ kf k1
Exercice B.6.11 Montrer que sur [0, 1], en utilisant par exemple des fonctions
x 7→ x−α , les deux inclusions de la proposition B.6.9 sont strictes.
Exercice B.6.12 En considérant des suites αj bien choisies, et en formant une
fonction continue f nulle hors des intervalles [j − αj , j + αj ], linéaire dans
chaque intervalle [j − αj , j] et [j, j + αj ], et vérifiant f (j) = j, montrer qu’il
existe des fonctions continues appartenant à L1 (R) et pas à L2 (R), ainsi que
des fonctions continues appartenant à L2 (R) et non bornées.
Nous admettrons l’analogue suivant du théorème B.6.3.
Théorème B.6.13 (i) Si Ω est un ouvert de Rd (pouvant être Rd lui-même),
l’espace des fonctions continues et à support dans un compact de Ω est dense
dans L2 (Ω).
(ii) Si A est un ensemble borné de Rd , l’espace Cb (A) est dense dans L2 (A).
Exercice B.6.14 Énoncer et démontrer, en remplaçant L1 par L2 , l’analogue
de la remarque B.6.5 et des exercices B.6.6 et B.6.7.
Exercice B.6.15 Espaces L2 à poids.
On se donne une fonction ω strictement positive sur Rd . On appelle L2 (ωdx)
190
Annexe B. Intégrale de Lebesgue
l’espace des fonctions définies sur Rd vérifiant |f (x)|2 ω(x) dx < ∞, en convenant que deux fonctions égales presque partout sont égales. Montrer que cet
espace, muni du produit scalaire
R
(f | g) =
Z
f (x)g(x)ω(x) dx
√
est préhilbertien. Montrer que l’application f →
7 f ω est une isométrie de
L2 (ωdx) sur L2 (Rd ) et en déduire que L2 (ωdx) est un espace de Hilbert.
B.6.16 Bases de l’espace L2 (A × B). Des exemples et des applications de
bases hilbertiennes classiques de L2 en dimension un d’espace sont donnés au
chapitre 3. Montrons de façon générale que l’on peut les utiliser pour construire
des bases hilbertiennes en dimension d’espace quelconque.
Soient A ⊂ Rp et B ⊂ Rq , et soient (ej )j∈N et (fj )j∈N des bases hilbertiennes de L2 (A) et L2 (B) respectivement. Nous allons montrer que les fonctions ϕjk (x, y) = ej (x)fk (y), pour (j, k) ∈ N2 , forment une base hilbertienne
de L2 (A × B).
On a
(ϕjk | ϕj 0 k0 ) =
ZZ
A×B
ej (x) fk (y) ej 0 (x)fk0 (y) dx dy = δjj 0 δkk0
ce qui montre que le système est orthonormal. Pour démontrer qu’il est total,
il suffit de prouver, grâce au critère A.3.12, qu’une fonction F ∈ L2 (A × B)
orthogonale aux ϕjk est nulle presque partout.
Soit donc F une telle fonction, et définissons les Gj ∈ L2 (B) par Gj (y) =
A ej (x)F (x, y) dx. On doit avoir pour tout k
R
Z
B
fk (y)Gj (y) dy = 0 ,
l’utilisation du théorème de Fubini étant justifiée par le fait que F ϕjk ∈
L1 (A × B). Chacune des fonctions Gj étant orthogonale à tous les fk , on
a donc Gj (y) = 0, sauf peut-être pour y appartenant à un ensemble de mesure
nulle Nj . L’ensemble N = ∪j Nj est de mesure nulle dans Rq .
Si on fixe y0 n’appartenant pas à N , la fonction x → F (x, y0 ) est orthogonale à tous les ej . Elle est donc nulle, sauf peut-être pour x appartenant à un
sous-ensemble négligeable Ny0 0 ⊂ A. Les ensembles
(A × N )
et
n
(x, y) ∈ A × B x ∈ Ny0
o
sont de mesure nulle dans A × B (voir le n◦ B.4.3). On a montré que F était
nulle dans le complémentaire, ce qui achève la démonstration.
B.6. Espaces L1 et L2
c
191
Relations avec d’autres notions de convergence
B.6.17 Fonctions continues et convergence uniforme sur tout compact Si Ω
est un ouvert de Rd (pouvant être Rd lui-même), on note C(Ω) l’espace des
fonctions continues sur Ω. Ces fonctions étant en général non bornées, on ne
peut pas parler de leur norme uniforme. Par contre, elles sont bornées sur
chaque compact de Ω et la bonne notion de convergence est la suivante.
Définition B.6.18 Soient fj et f des fonctions continues sur Ω. On dit que
fj → f uniformément sur tout compact si, pour tout compact K contenu dans
Ω, on a
kf − fj k∞,K −→ 0 .
j→∞
Il n’y a guère plus à en dire, cette convergence n’est pas associée à une norme,
mais pour chaque compact on se ramène à l’espace de Banach C(K) muni de
la norme uniforme.
Exercice B.6.19 Pour chaque j, on notera Bj la boule fermée de Rd de rayon
j centrée à l’origine. Soit f ∈ C(Rd ). Montrer que, pour chaque j, on peut
trouver un polynôme Pj vérifiant kf − Pj k∞,Bj ≤ 1/j. Montrer que l’on a
ainsi construit une suite de polynômes qui converge vers f uniformément sur
tout compact.
B.6.20 Fonctions localement sommables et convergence en moyenne sur tout
compact L’espace des fonctions sommables sur un ouvert Ω contient des fonctions qui sont très loin d’être continues, mais en revanche il existe des fonctions
continues sur Ω qui ne sont pas sommables (leur croissance à l’infini ou à la
frontière n’est pas limitée). L’espace qui va suivre a le mérite de contenir à la
fois C(Ω) et L1 (Ω) (ainsi que presque tous les espaces que nous considérerons)
et d’être muni d’une notion de convergence très raisonnable.
Définition B.6.21 On note L1loc (Ω) l’espace des fonctions f qui sont localement sommables dansR Ω, c’est-à-dire telles que, pour chaque compact K
contenu dans Ω, on ait K |f (x)| dx < ∞.
Si fj et f appartiennent à cet espace, on dit que fj tend vers f en moyenne
sur tout compact si, pour tout compact K ⊂ Ω, on a
kf − fj k1,K −→ 0 .
j→∞
B.6.22 Fonctions localement de carré sommable et convergence en moyenne
quadratique sur tout compact Le lecteur en a sûrement deviné la définition.
192
Annexe B. Intégrale de Lebesgue
Définition B.6.23 On note L2loc (Ω) l’espace des fonctions f qui sont localement de carré sommable dans
Ω, c’est-à-dire telles que, pour chaque compact
R
K contenu dans Ω, on ait K |f (x)|2 dx < ∞.
Si fj et f appartiennent à cet espace, on dit que fj tend vers f en moyenne
quadratique sur tout compact si, pour tout compact K ⊂ Ω, on a
kf − fj k2,K −→ 0 .
j→∞
Exercice B.6.24 Soient fj et f appartenant à C(Ω) et tels que fj → f uniformément sur tout compact. Montrer que ces fonctions appartiennent à L2loc (Ω)
et que fj → f en moyenne quadratique sur tout compact.
Exercice B.6.25 Soient fj et f appartenant à L2loc (Ω) et tels que fj → f
en moyenne quadratique sur tout compact. Montrer que ces fonctions appartiennent à L1loc (Ω) et que fj → f en moyenne sur tout compact.
B.6.26 Espaces Lp Soit p ∈ [1, ∞[. OnR note Lp (Rd ) l’espace des fonctions f de puisp
sance peme sommable, c’est-à-dire vérifiant |f (x)| dx < ∞. On démontre que l’expression
suivante
Z
1/p
kf kp =
p
|f (x)| dx
Rd
est une norme (toujours en remplaçant l’égalité par l’égalité presque partout) et que Lp est
un espace de Banach.
Pour p = +∞, on introduit une norme qui, pour une fonction continue, est la norme
uniforme, mais qui n’est pas perturbée si on modifie une fonction sur un ensemble de mesure
nulle.
L’espace L∞ des fonctions essentiellement bornées est l’espace des f telles qu’il existe
M avec |f (x)| ≤ M p.p. (un tel nombre M est appelé un presque majorant de |f |). On
démontre que l’ensemble de ces presque majorants possède un plus petit élément que l’on
note kf k∞ . C’est une norme (avec la même convention sur l’égalité), et L∞ est un espace
de Banach.
On définit comme précédemment les espaces Lp (A) et Lploc (Ω).
Exercice B.6.27 Soit f une fonction continue à support compact. Démontrer que l’on a
kf kp → kf k∞ lorsque p → ∞.
B.6.28 Récapitulation On représente dans le tableau de la page suivante
les relations entre les principales notions de convergence vues dans ce chapitre.
Les flèches en pointillé représentent des “implications conditionnelles”, valables
moyennant des restrictions qui sont rappelées dans le schéma.
Les flèches verticales de la colonne de gauche réfèrent au théorème B.6.9, et
les flèches horizontales du bas respectivement au théorème de Lebesgue B.2.4
et à sa “réciproque” (théorème B.2.8). Comme le montrent les exercices cidessous, les deux autres flèches horizontales en sont des conséquences simples.
B.6. Espaces L1 et L2
193
Exercice B.6.29 Soient fj et f des fonctions majorées en module par une
fonction h positive et de carré sommable. On suppose que fj (x) → f (x) p.p.
Montrer que fj converge vers f en moyenne quadratique. (On considérera les
fonctions gj (x) = |f (x) − fj (x)|2 , dont on montrera qu’elles tendent vers 0
presque partout, et qu’elles sont majorées par la fonction sommable 4h2 ).
Exercice B.6.30 Soit fj une suite d’éléments de L2 qui converge vers f en
moyenne quadratique. Montrer que la suite des fonctions gj ci-dessus converge
vers 0 dans L1 . A l’aide du théorème B.2.8, en déduire qu’une suite extraite
gjk tend vers 0 presque partout. En déduire que fjk (x) → f (x) p.p. lorsque
k → ∞.
convergence
simple
convergence
uniforme
m
e
s
u
r
e
f
ı
n
ı
e
convergence
en moyenne
quadratique
pour une suite extraite
majoration par h ∈ L2
m
e
s
u
r
e
f
ı
n
ı
e
convergence
presque
partout
pour une suite extraite
convergence
en moyenne
majoration par h ∈ L1
194
Annexe B. Intégrale de Lebesgue
B.7
Convolution
Théorème et Définition B.7.1 Si f et g appartiennent à L1 (Rd ), alors le
produit de convolution f ?g est défini par
(f ?g) (x) =
Z
f (x − y)g(y) dy =
Z
g(x − y)f (y) dy,
(B.22)
la fonction de y figurant sous le signe somme étant sommable pour presque
tout x. En outre, la fonction f ?g appartient à L1 et on a
kf ?gk1 ≤ kf k1 kgk1 .
(B.23)
Pour x fixé, le membre de droite de (B.22) est l’intégrale du produit de
deux fonctions sommables (de la variable y), produit qui n’a en général aucune
raison d’être sommable. C’est le théorème de Fubini qui nous assurera de la
sommabilité pour presque tout x.
Montrons d’abord que la fonction f (x − y)g(y) est sommable dans R2d .
D’après le théorème de Fubini pour les fonctions positives, on a
ZZ
|f (x − y)g(y)| dx dy =
Z
|g(y)|
Z
|f (x − y)| dx dy .
(B.24)
Le changement de variable z = x − y, pour y fixé, a un jacobien égal à 1, et
on a donc
Z
Z
|f (x − y)| dx = |f (z)| dz = kf k1 .
La constante précédente sort de l’intégrale (B.24), et on obtient
ZZ
|f (x − y)g(y)| dx dy = kf k1 kgk1 < +∞ .
La fonction f (x−y)g(y) est donc sommable dans R2d , et le théorème de Fubini
nous assure que la fonction y 7→ f (x − y)g(y) est sommable pour presque tout
x et que la fonction (f ?g) (x) définie par (B.22) est elle-même sommable. On
a enfin
kf ?gk1 =
≤
Z
|(f ?g) (x)| dx
ZZ
|f (x − y)g(y)| dx dy = kf k1 kgk1 .
Il ne reste à vérifier que l’égalité de droite dans (B.22) (commutativité du
produit de convolution). Or, pour presque chaque x, la fonction f (x − y)g(y)
195
B.7. Convolution
est sommable en y, et on peut effectuer le changement de variable z = x − y,
dont le jacobien vaut (−1)d . On obtient donc
Z
f (x − y)g(y) dy =
Z
f (z)g(x − z) dz,
ce qui achève la démonstration.
Exercice B.7.2 Démontrer que le produit de convolution est associatif : si f ,
g et h appartiennent à L1 (Rd ), on a (f ?g)?h = f ?(g?h) p.p. On montrera
d’abord (Fubini) que pour presque tout x, la fonction (y, z) 7→ f (x − y)g(y −
z)h(z) est sommable dans R2d , et on calculera ensuite son intégrale de deux
manières différentes.
Théorème B.7.3 Soit f ∈ L1 (Rd ) et soit g une fonction continue et bornée
dans Rd . Alors, la fonction f ?g définie en tout point par (B.22) est continue
et bornée. Si de plus les dérivées partielles (d’ordre 1, 2, . . .) de g existent et
sont continues et bornées, il en est de même pour f ?g et on a
∂g
∂(f ?g)
= f?
∂xj
∂xj
,
∂ 2 (f ?g)
∂ 2g
= f?
∂xj ∂xk
∂xj ∂xk
, ···
(B.25)
Considérons d’abord le cas où g est continue et bornée. On a
|f ?g(x)| ≤
Z
|g(x − y)| |f (y)| dy ≤ kgk∞
Z
|f (y)| dy = kgk∞ kf k1 .
Cela montre que la fonction f ?g est bornée. Pour prouver sa continuité, appliquons le théorème de la convergence dominée (théorème B.2.4) à
(f ?g)(xν ) =
Z
g(xν − y)f (y) dy ,
(B.26)
où xν est une suite tendant vers un point x0 . Les fonctions à intégrer
dans (B.26) sont majorées par la fonction sommable fixe kgk∞ |f (y)|. D’autre
part, elles convergent pour chaque y vers g(x0 − y)f (y) par continuité de g.
On a donc
lim (f ?g)(xν ) = (f ?g)(x0 ) ,
j→∞
ce qui démontre la continuité de f ?g.
Montrons maintenant (B.25). Appliquons le théorème de dérivation sous le
signe somme à
∂ Z
g(x − y)f (y) dy.
∂xj
196
Annexe B. Intégrale de Lebesgue
La fonction à intégrer est dérivable partout par rapport au “paramètre” xj et
la fonction
∂/∂xj {g(x − y)f (y)} = (∂g/∂xj )(x − y) f (y)
(B.27)
est majorée en module par la fonction k∂g/∂xj k∞ |f (y)| qui est sommable
en y et indépendante de x. On peut donc appliquer le théorème B.2.12 et on
obtient (B.25) pour les dérivées premières. Le fait que ces dérivées soient continues et bornées résulte alors de la première partie du théorème, en remplaçant
g par ∂g/∂xj . L’extension aux dérivées d’ordre supérieur se fait par récurrence.
Donnons encore deux autres cas où le produit de convolution est défini, en
laissant les démonstrations en exercice.
Théorème B.7.4 (i) Soient f ∈ L1 (Rd ) et g ∈ L2 (Rd ). Alors l’intégrale (B.22) est définie pour presque tout x. La fonction f ?g est de carré
sommable, et on a
kf ?gk2 ≤ kf k1 kgk2
(ii) Soient f et g appartenant à L2 (Rd ). Alors l’intégrale (B.22) est définie
pour tout x. La fonction f ?g est continue, bornée et tend vers 0 à l’infini. On a
kf ?gk∞ ≤ kf k2 kgk2
(B.28)
Exercice B.7.5 Démontrer la première partie du théorème B.7.4. On montrera que
ZZZ
2
2
|g(x − y)| |g(x − z)| |f (y)| |f (z)| dx dy dz ≤ kf kL1 kgkL2
en intégrant d’abord en x et en utilisant l’inégalité de Cauchy-Schwarz.
Exercice B.7.6 (a) Montrer, sous les hypothèses de la seconde partie du théorème B.7.4, que
la formule (B.22) fournit une fonction bornée définie en chaque point, et que l’on a (B.28).
(b) Introduire une suite de fonctions continues à support compact gν qui convergent vers g
dans L2 et déduire de (B.28) que les f ?gν convergent uniformément vers f ?g. En utilisant
le théorème B.7.3, montrer que les f ?gν sont continues et bornées et en déduire que f ?g est
continue et bornée.
(c) Démontrer que les fonctions f ?gν tendent vers 0 à l’infini, et en déduire qu’il en est de
même pour f ?g.
B.7.7 Cas des fonctions localement sommables Le produit de convolution ne
peut certainement pas être défini en supposant seulement f et g localement
sommables : il suffit de considérer l’exemple f = g = 1 pour voir qu’il y a un
sérieux problème à l’infini. Toutefois, si les fonctions sont telles que l’on n’ait
à intégrer que sur un compact, la sommabilité sur tout compact pourra suffire
pour définir ce produit de convolution.
197
B.7. Convolution
Théorème B.7.8 (i) Soit f ∈ L1loc (Rd ) et soit g une fonction sommable nulle
hors d’un compact K. Alors l’intégrale
f ?g(x) =
Z
Rd
f (x − y)g(y) dy =
Z
f (x − y)g(y) dy
K
est définie pour presque tout x et on a f ?g ∈ L1loc (Rd ).
(ii) Soient f et g appartenant à L1loc (R) à support limité à gauche, c’est-à-dire
que l’on a f (x) = 0 pour x < a et g(x) = 0 pour x < b. Alors l’intégrale
f ?g(x) =
Z ∞
f (x − y)g(y) dy =
−∞
(R
x−a
b
f (x − y)g(y) dy
0
pour x ≥ a + b
pour x ≤ a + b
est définie pour presque tout x et on a f ?g ∈ L1loc (R).
Théorème B.7.9 Soit f ∈ L1loc (Rd ) et soit g une fonction continue et nulle
hors d’un compact K de Rd . Alors, la fonction f ?g définie en tout point
par (B.22) est continue et bornée. Si de plus les dérivées partielles (d’ordre
1, 2, . . .) de g existent et sont continues, il en est de même pour f ?g et on a
∂g
∂(f ?g)
= f?
∂xj
∂xj
,
∂ 2 (f ?g)
∂ 2g
= f?
∂xj ∂xk
∂xj ∂xk
, ···
(B.29)
B.7.10 Approximations de l’identité Le théorème suivant va donner un
procédé systématique pour approcher une fonction sommable quelconque f
par des fonctions plus régulières.
Théorème B.7.11 Soit h ∈ L1 (Rd ) vérifiant h(x) dx = 1. Posons, pour
ε > 0,
hε (x) = ε−d h(x/ε) .
R
Alors, pour toute fonction f ∈ L1 (Rd ) [resp. L2 (Rd )], les fonctions f ?hε
convergent vers f en moyenne [resp. en moyenne quadratique] lorsque ε tend
vers 0.
La famille des opérateurs f 7→ f ?hε , et par abus de langage la famille des
fonctions hε elle-même, portent le nom d’approximation de l’identité.
Exemple B.7.12 Considérons, en dimension 1, la fonction h égale à 1 dans
l’intervalle [−1, 0] et à 0 ailleurs. On a
1 Z x+ε
f (y) dy
f ?hε (x) =
ε x
198
Annexe B. Intégrale de Lebesgue
et le membre de droite est la moyenne de f sur l’intervalle [x, x + ε]. Pour
une fonction f continue, il est aussi égal à ε−1 (F (x + ε) − F (x)) où F est
une primitive de f , et f ?hε (x) converge donc vers f (x) en chaque point. La
conclusion du théorème est analogue : si f appartient à L1 ou à L2 , on a
convergence pour la norme correspondante.
Exemple B.7.13 Choisissons maintenant, en dimension d, une fonction h
sommable, de classe C ∞ et d’intégrale 1 ; par exemple la fonction h(x) =
2
π −d/2 e−|x| . On peut alors approcher en moyenne toute fonction f ∈ L1 par les
f ?hε qui sont de classe C ∞ en vertu du théorème B.7.3.
B.7.14 Démonstration du théorème B.7.11 Considérons d’abord le cas où f
est une fonction continue et nulle hors de la boule B(R) de centre 0 et de rayon
R. On a
f ?hε (x) = ε−d
En remarquant que
kf ?hε − f k1 ≤
R
Z
f (x − y)h(y/ε) dy =
Z
f (x − εs)h(s) ds .
f (x)h(s) ds = f (x), on a
ZZ
|f (x + εs) − f (x)| |h(s)| dx ds
|x|≤R+1
+
ZZ
|x|≥R+1
|f (x + εs)| |h(s)| dx ds = I1 +I2 .
Dans la seconde intégrale, la valeur prise par f est nulle si |εs| < 1. On a donc
I2 ≤
ZZ
s≥ε−1
|f (x + εs)| |h(s)| dx ds ≤ kf k∞
Z
s≥ε−1
|h(s)| ds −→ 0 .
ε→0
Dans la première intégrale, la fonction à intégrer est majorée par 2 kf k∞ |h(s)|
qui est sommable sur B(R + 1) × Rd . Pour chaque (x, s) elle tend vers 0 lorsque
ε → 0 et on a donc I1 → 0 pour ε → 0 en vertu du théorème de Lebesgue. On
a donc montré, dans le cas particulier où f est continue et à support compact,
que f ?hε tend vers f en moyenne.
Dans le cas général où f ∈ L1 , étant donné α > 0, il faut trouver ε0 > 0
tel que, pour ε < ε0 , on ait kf ?hε − f k1 ≤ α. On peut d’abord trouver une
fonction continue à support compact g telle que kf − gk1 ≤ α/3. D’après
l’inégalité du triangle, on a
kf ?hε − f k1 ≤ k(f − g)?hε k1 + kg?hε − gk1 + kg − f k1 .
Le troisième terme du membre de droite est majoré par α/3, et il en est de
même du premier en vertu de (B.23). D’après la première partie de la démonstration, on peut trouver ε0 tel que kg?hε − gk1 ≤ α/3 pour ε < ε0 . La preuve
du cas f ∈ L1 est complète, et nous admettrons le résultat correspondant pour
f ∈ L2 .
Annexe C
Éléments de la théorie des
fonctions holomorphes d’une
variable complexe
Au vu de la définition, la théorie des fonctions holomorphes d’une variable
complexe peut n’apparaître que comme une généralisation naturelle de la théorie des fonctions dérivables d’une variable réelle. Cependant, dès que l’on en
commence l’étude, on voit que ces fonctions possèdent beaucoup de propriétés
a priori surprenantes — au sens où rien d’analogue n’existe pour les fonctions
d’une variable réelle. C’est ainsi qu’une fonction est indéfiniment dérivable dès
qu’elle l’est une fois, qu’il existe une infinité de relations intégrales entre les
valeurs prises en un point et les valeurs prises sur des courbes, etc.
Cette théorie a déjà été développée en cours de Tronc Commun en première
année. Aussi nous nous contenterons ici que d’une petite partie de la théorie, en
renvoyant au cours de première année ainsi qu’au §C.8 pour des références et
quelques indications sur des points non abordés. C’est le théorème des résidus
qui jouera pour nous un rôle central, en raison de son utilité dans l’étude des
séries et de la transformation de Fourier.
C.1
Définition et propriétés élémentaires
Rappelons qu’une application (x, y) 7→ F (x, y) définie dans un ouvert Ω
de R2 est dite de classe C 1 si ses dérivées partielles ∂F/∂x et ∂F/∂y existent
et sont continues dans Ω. On sait que la fonction F est alors différentiable en
200
Annexe C. Fonctions holomorphes
tout point (x, y) de Ω, c’est-à-dire que l’on a
F (x+∆x, y+∆y) = F (x, y) +
∂F
∂F
(x, y)∆x +
(x, y)∆y + r(x, y, ∆x, ∆y)
∂x
∂y
(C.1)
avec
r(x, y, ∆x, ∆y)
√ 2
−−→ 0
∆x + ∆y 2 ∆x,∆y→0
(C.2)
Le plan complexe C est un espace vectoriel de dimension 2 sur R qui
s’identifie à R2 par l’application z 7→ (Re z, Im z). Une application f à valeurs complexes définie dans un ouvert Ω ⊂ C peut ainsi être considérée de
deux manières :
• comme fonction z → f (z) d’une variable complexe. Il est alors naturel de se
(z)
tend vers une limite lorsque ∆z tend vers
demander si le rapport f (z+∆z)−f
∆z
0.
• comme fonction (x, y) 7→ f (x + iy) de deux variables réelles, ce qui permet
de considérer (si elles existent) ses dérivées partielles ∂f /∂x et ∂f /∂y.
Théorème et Définition C.1.1 Les deux propriétés suivantes sont équivalentes
(z)
tend vers une limite notée f 0 (z)
(i) Pour tout z ∈ Ω, la quantité f (z+∆z)−f
∆z
lorsque ∆z 6= 0 tend vers 0 dans C et l’application z → f 0 (z) est continue
dans Ω.
(ii) La fonction f , considérée comme fonction de deux variables réelles, est de
classe C 1 dans Ω et vérifie
∂f
∂f
+i
=0.
∂x
∂y
(C.3)
On dit que f est holomorphe (ou analytique) dans Ω si ces propriétés sont
vérifiées. La fonction f 0 , notée aussi df /dz est appelée dérivée de la fonction f .
La propriété (i) permet d’écrire
f (z + ∆z) = f (z) + f 0 (z)∆z + r(z, ∆z)
avec r(z, ∆z)/∆z −→ 0. En posant ∆z = ∆x + i∆y, on obtient
∆z→0
f (x+∆x+i(y+∆y))=f (x+iy)+f 0 (x+iy)∆x+if 0 (x+iy)∆y+r(x+iy, ∆x+i∆y),
C.1. Définition et propriétés élémentaires
201
le reste r vérifiant (C.2). Cela exprime que (x, y) 7→ f (x + iy) est différentiable
en tout point, que ∂f /∂x = f 0 (x + iy) et que ∂f /∂y = if 0 (x + iy). On a
donc bien la relation (C.3). Enfin, l’application z → f 0 (z) étant continue, les
dérivées partielles de f sont donc continues et f est de classe C 1 .
Réciproquement, supposons (ii) vérifié. La relation (C.1) appliquée à f (x +
iy) s’écrit
f (z + ∆z) = f (z) +
∂f
∂f
∆x +
∆y + r(x, y, ∆x, ∆y) .
∂x
∂y
avec l’estimation (C.2). En remplaçant ∂f /∂y par i∂f /∂x en vertu de (C.3),
on obtient donc
f (z + ∆z) − f (z) =
∂f
∆z + r(x, y, ∆x, ∆y) .
∂x
En divisant les deux membres par ∆z, on voit que (f (z+∆z)−f (z)) /∆z tend,
pour ∆z → 0, vers une limite égale à ∂f /∂x. Cette dernière fonction étant
continue dans Ω, cela achève la démonstration.
Remarque C.1.2 Si la fonction f est holomorphe, nous venons donc de voir
que l’on a f 0 = df /dz = ∂f /∂x = −i∂f /∂y. La notation df /dz est strictement
réservée aux fonctions holomorphes : pour une application f de classe C 1 , les
dérivées partielles sont bien définies (leur rapport n’ayant aucune raison d’être
égal à −i) mais les notations f 0 ou df /dz n’ont aucun sens.
Si f est de classe C 1 , sa différentielle s’écrit df = (∂f /∂x)dx + (∂f /∂y)dy.
Dans le cas où f est holomorphe, on a donc df = f 0 (z)dx + (if 0 (z))dy, c’est-àdire
df = f 0 (z)dz
où dz = dx + idy est la différentielle de la fonction z 7→ z.
Si l’on pose P (x, y) = Re f (x + iy) et Q(x, y) = Im f (x + iy), la condition (C.3) s’écrit
∂P/∂x = ∂Q/∂y
;
∂P/∂y = −∂Q/∂x ,
ce qui fournit une autre caractérisation des fonctions holomorphes.
Remarque C.1.3 Un théorème (plus difficile) assure que l’existence de la dérivée f 0 (z) en tout point de Ω, sans exiger a priori sa continuité, entraîne
l’holomorphie de f (et donc la continuité de f 0 ).
202
Annexe C. Fonctions holomorphes
Exemples C.1.4 Les fonctions constantes sont holomorphes et ont une dérivée
nulle. Pour a ∈ C, la fonction z → az est holomorphe et sa dérivée est égale à
a. Par contre, les fonctions z → z, z → Re z et z → Im z sont de classe C 1 mais
ne sont pas holomorphes. Pour la première par exemple, on a f (x+iy) = x−iy
et donc ∂f /∂x = 1 et ∂f /∂y = −i. La relation (C.3) n’est pas satisfaite.
Théorème C.1.5 (i) Si f et g sont holomorphes dans Ω, les fonctions f + g
et f g le sont aussi, on a (f +g)0 = f 0 + g 0 et (f g)0 = f 0 g + f g 0 . Si de plus
g ne s’annule pas dans Ω, la fonction f /g est holomorphe et on a (f /g)0 =
(f 0 g − f g 0 )/g 2 .
(ii) Soit Ω0 est un autre ouvert de C et supposons que f applique Ω dans
Ω0 , que f soit holomorphe dans Ω et que g soit holomorphe dans Ω0 . Alors la
fonction g ◦ f est holomorphe dans Ω et on a (g ◦ f )0 (z) = g 0 (f (z))f 0 (z).
Le lecteur connaît bien l’équivalent de ces énoncés pour les fonctions d’une
variable réelle, et a bien en tête leurs démonstrations. En y remplaçant x par
z et en utilisant la définition C.1.1 (i) il obtiendra sans difficulté les résultats
ci-dessus.
Corollaire C.1.6 Un polynôme P (z) = n0 ak z k est une fonction holomorphe
Pn
k−1
. Une fraction rationnelle
dans C entier, de dérivée P 0 (z) =
1 kak z
P (z)/Q(z) est holomorphe dans tout ouvert où Q ne s’annule pas.
P
Ces fonctions sont en effet des (quotients de) sommes de produits de fonctions égales à z → z ou à une constante, dont nous savons déjà qu’elles sont
holomorphes. Leurs dérivées se calculent par les formules habituelles.
Le théorème ci-dessous ne fait que rappeler quelques points de la théorie
des séries entières qui sont bien connus du lecteur.
n
Théorème C.1.7 On considère une série entière ∞
n=0 an z . Il existe alors
R ∈ [0, +∞] (le rayon de convergence de la série) tel que
P
(i) En tout point du disque de convergence DR = {z| |z| < R} (ou C tout
entier si R = +∞) la série est convergente. Pour R > 0, ce disque est non
P
n
vide, et la somme S(z) = ∞
n=0 an z est une fonction bien définie dans DR .
En outre, pour tout ρ < R, les sommes partielles de la série convergent
vers S uniformément sur le disque fermé Dρ , c’est-à-dire que l’on a
N
X
n
sup S(z) −
an z −→ 0
N →∞
|z|≤ρ 0
203
C.2. Intégrales curvilignes
(ii) La série an z n est divergente pour tout z tel que |z| > R (le théorème
n’affirme rien pour |z| = R).
P
(iii) La fonction S est holomorphe dans DR et on a
S 0 (z) =
∞
X
nan z n−1 ,
n=1
le rayon de convergence de la série figurant au membre de droite étant égal
à R.
Le cas de séries entières en z − z0 se ramène immédiatement au précédent.
La fonction
X
f (z) =
an (z − z0 )n
est holomorphe dans le disque ouvert de centre z0 et de rayon R (encore appelé
disque de convergence). En appliquant le théorème à la série dérivée, on voit
que f 0 est elle-même holomorphe dans le disque de convergence et sa dérivée
est notée f 00 . Plus généralement, la dérivée d’ordre p de f est donnée par la
série entière suivante, dont le rayon de convergence est R
f
C.2
(p)
(z) =
∞
X
n!
an (z − z0 )n−p .
n=p (n − p)!
Intégrales curvilignes
Une forme différentielle dans un ouvert Ω ⊂ R2 est une expression
ω = P dx + Q dy
où les coefficients P et Q sont des fonctions définies et continues dans Ω, à
valeurs réelles ou complexes.
Un chemin de classe C 1 dans Ω est une application t→γ(t)= x(t), y(t)
d’un intervalle [a, b] dans Ω dont les composantes x(t) et y(t) sont continûment dérivables. Les points γ(a) et γ(b) s’appellent respectivement l’origine et
l’extrémité de γ. On dit que le chemin γ est fermé si γ(a) = γ(b).
Avec les notations ci-dessus, on définit l’intégrale de la forme différentielle
ω le long du chemin γ par
Z
γ
ω=
Z b
a
{P (x(t), y(t))x0 (t) + Q(x(t), y(t))y 0 (t)} dt
(C.4)
204
Annexe C. Fonctions holomorphes
Théorème C.2.1 (changement de paramètre) Soit s → T (s) une application de classe C 1 d’un intervalle [c, d] dans R, à dérivée partout strictement
positive, vérifiant T (c) = a et T (d) = b. L’application γe définie dans [c, d] par
γe (s) = γ(T (s)) est un chemin de classe C 1 et on a
Z
ω=
Z
γ
ω
e
γ
Si par contre T a une dérivée strictement négative, avec T (c) = b et T (d) =
a, l’intégrale curviligne est multipliée par −1.
Il suffit de faire le changement de variable t = T (s) dans l’intégrale simple
figurant au membre de droite de (C.4) pour obtenir le résultat.
On dit que γe se déduit de γ par changement de paramètre, conservant ou
inversant le sens de parcours. En introduisant la fonction réciproque t → T −1 (t)
de [a, b] dans [c, d], on voit que γ se déduit aussi de γe par changement de
paramètre.
Définition C.2.2 On appelle chemin de classe C 1 par morceaux dans Ω une
application continue γ de [a, b] dans Ω tel qu’il existe une subdivision
a = t0 < t1 < . . . < tn−1 < tn = b
de l’intervalle [a, b] pour laquelle la restriction de γ à chaque sous-intervalle
[tj , tj+1 ] soit un chemin de classe C 1 . On dit que le chemin est fermé si γ(a) =
γ(b).
En tout point t ∈ [a, b] qui n’est pas l’un des tj , on peut parler du vecteur
dérivé γ 0 (t). Si ce vecteur n’est pas nul, il permet de définir la tangente au
point γ(t). Aux points de subdivision, il existe un vecteur dérivé à droite et un
vecteur dérivé à gauche qui sont en général distincts.
Pour un tel chemin, on peut encore définir l’intégrale curviligne
Z
γ
ω=
n−1
XZ
j=0
R
γ
ω par
ω
γ
j
où le chemin de classe C 1 noté γj est la restriction de γ à l’intervalle [tj , tj+1 ].
La manière de choisir les tj n’étant pas unique (on peut toujours ajouter
artificiellement des points de subdivision supplémentaires) il faudrait vérifier,
ce qui est facile et laissé au lecteur, que le résultat ne dépend pas de ce choix.
205
C.2. Intégrales curvilignes
C.2.3 Notations dans le plan complexe Un chemin γ est alors une application à valeurs complexes : t 7→ γ(t) = x(t) + iy(t), où les applications x
et y sont à valeurs réelles et définies sur un intervalle [a, b].
Rappelons que dz désigne la forme différentielle dx + idy. Les formes différentielles du type ω = f (z)dz joueront un rôle important dans la suite. On a
dans ce cas, par définition
Z
ω=
γ
Z b
{f (x(t)+iy(t))x0 (t) + if (x(t)+iy(t))y 0 (t)} dt ,
a
c’est-à-dire la formule facile à mémoriser (on “remplace z et dz par leurs valeurs”)
Z
f (z) dz =
Z b
γ
f (γ(t))γ 0 (t) dt .
(C.5)
a
Exemple C.2.4 Considérons, pour n ∈ Z la forme différentielle z n dz définie
dans le plan éventuellement privé de l’origine, et calculons son intégrale le long
du cercle γr de rayon r parcouru dans le sens positif. Nous pouvons donc poser
γr (t) = reit pour t ∈ [0, 2π]. On a alors
Z
z n dz =
Z 2π
γr
rn eint ireit dt =
0
pour n 6= −1
pour n = −1
0
2iπ
C.2.5 Majoration et convergence des intégrales curvilignes En majorant en module l’intégrale (C.5), on obtient
Z
γ
f (z) dz ≤
Z b
|f (γ(t))| |γ 0 (t)| dt =
Z b
q
|f (γ(t))| x02 (t) + y 02 (t) dt .
a
a
q
On reconnait l’élément d’abscisse curviligne ds = x02 (t) + y 02 (t) dt. Notons
γ1 l’arc déduit de γ en prenant comme nouveau paramètre l’abscisse curviligne
s ∈ [0, L], où L est la longueur de l’arc. On obtient
Z
γ
f (z) dz ≤
Z L
f (γ1 (s))
ds .
0
En particulier, si |f (z)| ≤ M sur l’image de γ, on a
Z
γ
f (z) dz ≤ ML ,
L = longueur(γ) .
(C.6)
Nous allons en déduire facilement des résultats de convergence. Nous noterons Γ l’image de γ, c’est-à-dire l’ensemble des points du plan de la forme γ(t)
avec t ∈ [a, b].
206
Annexe C. Fonctions holomorphes
Théorème C.2.6 Si une suite fn de fonctions continues converge uniformément vers f sur Γ, c’est-à-dire si
Mn = sup |fn (z) − f (z)| −→ 0 ,
n→∞
z∈Γ
alors
Z
γ
fn (z) dz n→∞
−→
Z
f (z) dz .
γ
On a en effet
Z
γ
fn (z) − f (z) dz ≤ Mn longueur(γ) −→ 0 .
n→∞
Un résultat sur les suites de fonctions peut toujours être transformé en un
résultat sur les séries de fonctions. Soit un (z) une suite de fonctions continues,
P
P∞
et notons SN (z) = N
0 un (z). Si la série S(z) =
0 un (z) converge uniformément sur Γ, c’est-à-dire si
sup |SN (z) − S(z)| −→ 0 ,
N →∞
z∈Γ
on a
N Z
X
n=0 γ
un (z) dz =
Z
γ
SN (z) dz −→
Z
N →∞ γ
S(z) dz .
R
Cela signifie que la série numérique de terme général γ un (z) dz converge et
que l’on a
)
Z (X
∞
∞ Z
X
un (z) dz .
un (z) dz =
γ
n=0 γ
n=0
On dit que l’on peut intégrer terme à terme les séries uniformément convergentes. Nous rappelons au lecteur que, pour qu’une série de fonctions converge
uniformément, il suffit qu’elle vérifie la propriété de convergence normale suivante
∞
X
sup |un (z)| < ∞ .
n=0 z∈Γ
C.3
Formule de Green-Riemann
Il s’agit d’une formule qui permet de ramener le calcul de certaines intégrales doubles à une intégrale curviligne. Le lecteur en connait sans doute
la démonstration dans le cas d’un rectangle. Dans la pratique, nous n’aurons
guère à l’utiliser que dans des domaines limités par un nombre fini de segments
de droite et d’arcs de cercle. En donner un énoncé correct et suffisamment général demande néanmoins un peu de soin. Nous admettrons le résultat.
207
C.3. Formule de Green-Riemann
Définition C.3.1 (bord orienté d’un compact) Soient K un compact du
plan et γ = (γj )j∈J une famille finie de chemins fermés de classe C 1 par
morceaux, respectivement définis sur [aj , bj ]. On dit que γ est le bord orienté
de K si les propriétés suivantes sont vérifiées.
1. Les images γj ([aj , bj ]) sont disjointes et leur réunion constitue la frontière de K (ensemble des points de K qui n’appartiennent pas à son
intérieur K̊).
2. Chacun des chemins γj est sans point double, c’est-à-dire que pour s < t
on a γj (s) 6= γj (t) à l’exception du cas s = aj , t = bj .
3. Pour t ∈ [aj , bj ], le vecteur dérivé γj0 (t) est non nul si t n’est pas un point
de subdivision. Dans le cas contraire, les vecteurs dérivés à droite et à
gauche sont non nuls.
4. En tout point t ∈ [aj , bj ] qui n’est pas un point de subdivision, soit νt le
vecteur déduit de γj0 (t) par la rotation de +π/2. Alors, pour tout ε > 0
assez petit, le point γj (t) + ενt appartient à K et le point γj (t) − ενt
appartient à son complémentaire.
La dernière condition est la plus importante. Intuitivement, elle assure que, si on se
déplace le long de chacun des γj dans le sens des
t croissants, on a en permanence à sa gauche
des points de K et à sa droite des points du
complémentaire. C’est elle qui garantit que le
bord de K est bien orienté.
K
γ2
γ3
γ10 (t)
γ1 (t)
νt
Les trois premières conditions sont
essentiellement nécessaires pour énoncer
correctement cette propriété : elles garantissent l’existence d’un vecteur tangent orienté non nul en chaque point frontière, à l’exception d’un nombre fini de points anguleux.
Théorème C.3.2 (Green-Riemann) Soit ω = P dx + Q dy une forme différentielle dans un ouvert Ω, et supposons que les fonctions P et Q soient
de classe C 1 dans Ω. Soit K un compact contenu dans Ω de bord orienté
γ = (γj )j∈J . On a alors
XZ
j∈J
γ
j
ω=
ZZ
K
∂Q ∂P
−
∂x
∂y
!
dx dy .
208
Annexe C. Fonctions holomorphes
Corollaire C.3.3 Soit γ = (γj )j∈J le bord orienté d’un compact K et soit f
une fonction holomorphe dans un ouvert Ω contenant K. On a alors
XZ
j∈J
f (z) dz = 0 .
(C.7)
γ
j
Plus généralement, si f est une fonction définie et continue dans K et
holomorphe dans l’intérieur K̊, on a encore (C.7).
On peut en effet, sous la première hypothèse, écriref (z)dz = P dx + Qdy
avec
P = f et Q = if . On a alors ∂Q/∂x − ∂P/∂y = i ∂f /∂x + i∂f /∂y = 0 en
vertu de (C.3), d’où le résultat.
Nous admettrons le résultat sous la seconde hypothèse. La démonstration
repose sur une idée simple mais assez longue à mettre en forme : 1. approcher
le compact K par des compacts Kε un peu plus petits contenus dans K̊ et dont
le bord orienté est proche des γj ; 2. appliquer la première partie du corollaire
à Kε qui est contenu dans l’ouvert K̊ où f est holomorphe ; 3. passer à la limite
pour ε → 0 en utilisant la continuité de f .
Remarque C.3.4 Il est important de noter que l’énoncé demande que Ω (ou
l’ensemble de définition de f ) contienne non seulement γ (ce qui suffit pour
définir le membre de gauche de (C.7)), mais K tout entier. Pour illustrer ceci,
revenons à l’exemple C.2.4 en distinguant deux cas. Pour n ≥ 0, la fonction z n
est holomorphe dans C entier. Le cercle γr est le bord
orienté du disque fermé
R
Dr ⊂ C et le corollaire ci-dessus redonne le fait que γr z n dz = 0. Pour n < 0,
la situation est différente. La fonction z n est bien holomorphe dans l’ouvert
formé du plan privé de l’origine, mais Dr n’est pas contenu dans cet ouvert et
le corollaireR n’est plus applicable. Nous avons d’ailleurs vu que, pour n = −1,
l’intégrale γr dz/z = 2iπ n’est pas nulle.
C.4
Développement d’une fonction holomorphe dans un disque
Théorème C.4.1 (Formule intégrale de Cauchy)
Soit Ω un ouvert contenant le disque fermé de centre z0 et de rayon r, et soit
f holomorphe dans Ω. Pour tout z vérifiant |z − z0 | < r, on a
1 Z f (w)
f (z) =
dw
2iπ γ w − z
en notant γ le cercle de centre z0 et de rayon r orienté dans le sens positif.
209
C.4. Développement dans un disque
Soit donc z vérifiant |z − z0 | < r.
Pour 0 < ε < r − |z − z0 |, nous
noterons γε0 le cercle de centre z et
de rayon ε orienté dans le sens positif. La fonction w 7→ f (w)/(w − z)
est holomorphe dans Ω \ {z}. En appliquant le corollaire C.3.3 au compact constitué des points w vérifiant
|w − z0 | ≤ r et |w − z| ≥ ε, dont le
bord orienté est formé de γ et de γε0
changé d’orientation, on obtient
Z
γ
ou encore
Z
γ
γε0
z
z0
γ
f (w)
dw −
w−z
f (w)
dw =
w−z
Z
γ0
ε
Z
γε0
f (w)
dw = 0 ,
w−z
f (z)
dw +
w−z
Z
γ0
ε
f (w) − f (z)
dw .
w−z
La première intégrale du membre de droite, en posant ζ = w − z, devient f (z)
(C.8)
R
γ
dζ/ζ, où
1
γ1 est un cercle entourant l’origine, et vaut donc 2iπf (z) d’après le calcul de l’exemple C.2.4.
Dans la seconde intégrale, la longueur du cercle γε0 est 2πε, et |w − z| vaut ε. En majorant
à l’aide de la formule (C.6), on obtient
Z
f (w) − f (z)
(C.9)
dw ≤ 2π sup |f (w) − f (z)| .
γ0
w−z
|w−z|=ε
ε
Faisons maintenant tendre ε vers 0. La fonction f étant continue en z, le membre de droite
de (C.9) tend vers 0, et la formule cherchée
Z
f (w)
dw = 2iπf (z)
γ w−z
résulte de l’égalité (C.8).
Remarque C.4.2 Plus généralement, soit f holomorphe dans Ω, et soit γ =
(γj )j∈J le bord orienté d’un compact K contenu dans Ω. Pour tout point z
appartenant à l’intérieur de K, on a
1 X Z f (w)
f (z) =
dw .
2iπ j∈J γj w − z
La démonstration est essentiellement la même. Notons γε0 le cercle de centre z et de rayon
ε. Pour ε assez petit, le disque fermé limité par ce cercle est contenu dans l’intérieur de K
et on considère le compact Kε obtenu en retirant de K le disque ouvert. Son bord orienté
est constitué des γj , avec leur orientation, et de γε0 changé d’orientation.
210
Annexe C. Fonctions holomorphes
D’après le corollaire C.3.3, on a
XZ
j∈J
γ
j
f (w)
−
w−z
Z
γε0
f (w)
=0,
w−z
et on démontre comme ci-dessus que la dernière intégrale tend vers 2iπf (z) lorsque ε → 0.
Théorème C.4.3 Toute fonction f holomorphe dans le disque ouvert D de
centre z0 et de rayon r est développable en série entière dans ce disque : on a
∀z ∈ D
,
f (z) =
∞
X
an (z − z0 )n ,
n=0
la série entière ayant un rayon de convergence ≥ r. Les coefficients an sont
donnés par la formule
f (w)
1 Z
dw ,
an =
2iπ γρ (w − z0 )n+1
(C.10)
où γρ est un cercle de rayon ρ < r, centré en z0 et orienté dans le sens positif.
Pour simplifier les notations, nous ferons la démonstration dans le cas z0 = 0, cas auquel on
se ramène immédiatement en prenant z − z0 comme variable.
Montrons d’abord que le second membre de (C.10) ne dépend
pas du choix
de ρ. Soient
donc 0 < ρ1 < ρ2 < r, et considérons la couronne C = w ρ1 ≤ |w| ≤ ρ2 . La fonction
w 7→ f (w)/wn+1 est définie dans le disque de rayon r privé de l’origine, ouvert qui contient
la couronne C. Le bord orienté de celle-ci est constitué des cercles de rayon ρ1 et ρ2 parcourus
respectivement dans les sens négatif et positif. D’après le corollaire C.3.3, on a
Z
Z
f (w)
f (w)
dw −
dw = 0 .
n+1
n+1
w
w
γρ
γρ
2
1
On peut donc définir les nombres
la formule (C.10), le résultat ne dépendant pas de
P an par
ρ, et considérer la série entière
an z n . Fixons maintenant z vérifiant |z| < r et choisissons
ρ tel que |z| < ρ < r. D’après la formule intégrale de Cauchy, on a
Z
1
f (w)
f (z) =
dw .
2iπ γρ w − z
Pour w ∈ γρ , et donc |z/w| = |z| /ρ < 1, on a
∞
X zn
1
1
1
=
=
,
w−z
w 1 − z/w
wn+1
0
et donc
1
f (z) =
2iπ
Z
γρ
∞
X
0
zn
f (w)
dw .
wn+1
C.4. Développement dans un disque
211
La série convergeant uniformément lorsque w parcourt le cercle de rayon ρ, on peut l’intégrer
terme à terme et on obtient
!
Z
∞
∞
X
X
f (w)
n
dw
z
=
an z n .
f (z) =
n+1
w
γρ
0
0
P
Cela montre d’une part que la série entière
an z n converge pour tout z vérifiant |z| < r,
et donc que son rayon de convergence est ≥ r, d’autre part que la somme de cette série
coïncide avec f dans le disque ouvert de rayon r, ce qui achève la démonstration.
Exemple C.4.4 La fonction 1/z est holomorphe dans C\{0}. Pour tout z0 6= 0,
elle est holomorphe dans le disque de centre z0 et de rayon |z0 | et doit donc être
développable en série entière dans ce disque. On a en effet le développement en
P
série géométrique 1/z = (−1)n z0−n−1 (z−z0 )n , dont le rayon de convergence
est |z0 |.
Corollaire C.4.5 Si f est holomorphe dans un ouvert Ω, alors f possède des
dérivées de tout ordre f 0 , f 00 , . . .,f (n) qui sont également holomorphe dans Ω.
Soit z0 ∈ Ω et notons ρ le rayon du plus grand disque ouvert D centré en z0 et
contenu dans Ω. Alors la série de Taylor
X
f (n) (z0 )(z − z0 )n /n!
a un rayon de convergence ≥ ρ, et sa somme coïncide avec f dans D.
P
On sait en effet que l’on a f (z) = an (z − z0 )n dans D, le rayon de convergence de la série
étant ≥ ρ. La somme d’une série entière admettant des dérivées de tout ordre, il en résulte
que f 0 , f 00 , . . .existent et sont holomorphes dans D. Cela étant valable pour tout z0 ∈ Ω,
ces dérivées successives existent et sont holomorphes dans Ω tout entier. Il suffit enfin de
dériver n fois la série et de prendre sa valeur en z = z0 pour vérifier que f (n) (z0 ) = n!an .
Remarque C.4.6 On voit là apparaître une différence considérable entre les
fonctions holomorphes d’une variable complexe et les fonctions continûment
dérivables d’une variable réelle. On sait bien qu’il existe des fonctions de classe
C 1 sur un intervalle qui ne sont pas de classe C 2 . Il existe aussi des fonctions
t → f (t) indéfiniment dérivables sur un intervalle contenant 0 (par exemple),
P
dont la série de Taylor à l’origine f (n) (0)tn /n! a un rayon de convergence nul.
Il existe enfin des fonctions f dont la série de Taylor a un rayon de convergence
non nul, mais telles que la somme de cette série soit différente de la fonction
f . Rien de tout ceci ne se produit pour les fonctions holomorphes.
C.4.7 Structure d’une fonction holomorphe s’annulant en un point
Soit f holomorphe dans un ouvert Ω s’annulant en un point z0 ∈ Ω. Soit D un
212
Annexe C. Fonctions holomorphes
(n)
(z0 )(z−z0 )n /n!
disque centré en z0 contenu dans Ω. On a alors f (z) = ∞
1 f
dans D. Deux cas peuvent se présenter.
• Toutes les dérivées f (n) (z0 ) sont nulles. La fonction f est identiquement nulle
dans D.
• Sinon, soit p le plus petit entier tel que f (p) (z0 ) 6= 0. On dit alors que p est
l’ordre de multiplicité du zéro z0 . On a
P
p
f (z) = (z−z0 )
∞
X
f (p+k) (z0 )
(z−z0 )k = (z−z0 )p g(z) ,
k=0 (p+k)!
où la fonction g, somme d’une série entière convergente dans D est holomorphe
et ne s’annule pas au point z0 . Elle est donc non nulle dans un petit disque D1
centré en z0 . En particulier, le seul zéro de f situé dans D1 est le point z0 .
Lorsque l’ouvert Ω est “d’un seul morceau”, le premier des cas précédents
ne se produit que pour la fonction identiquement nulle dans Ω. C’est ce qu’affirment la définition et le théorème suivants.
Définition C.4.8 On dit qu’un ouvert Ω du plan est connexe par arc si, quels
que soient les points z0 et z1 de Ω, on peut trouver une application continue
t → γ(t) de [0, 1] dans Ω telle que γ(0) = z0 et γ(1) = z1 .
z0
z0
z1
connexe par arc
z1
non connexe par arc
Remarque C.4.9 On peut démontrer, si Ω est connexe par arc, que le chemin
joignant deux points quelconques peut toujours être choisi de classe C 1 . On
peut aussi montrer qu’un ouvert n’est pas connexe par arc si et seulement s’il
est réunion de deux ouverts (non vides) disjoints.
Un exemple typique d’ouvert non-connexe par arc est le plan privé de l’axe
réel. Dans ce cas, on construit facilement des fonctions holomorphes nulles au
voisinage d’un point sans être identiquement nulles : par exemple la fonction
égale à 1 (resp. 0) dans le demi-plan ouvert supérieur (resp. inférieur).
On définit aussi, en topologie générale, la notion d’espace topologique connexe. Pour un
ouvert du plan ou de Rd , les deux notions coïncident.
213
C.5. Théorème des résidus
Théorème C.4.10 Soit f holomorphe dans un ouvert connexe par arc Ω. Si
toutes les dérivées f (n) (z0 ) s’annulent en un même point z0 ∈ Ω, alors f est
identiquement nulle dans Ω.
Soit z1 un point quelconque de Ω et soit t → γ(t) continue de [0, 1] dans Ω avec γ(0) = z0
et γ(1) = z1 . Soit A l’ensemble des t ∈ [0, 1] tels que l’on ait f (n) (γ(t)) = 0 pour tout n.
L’ensemble A est non vide puisqu’il contient 0. Notons a ∈ [0, 1] la borne supérieure de A.
On ne sait pas a priori si a ∈ A, ce qui est sûr, c’est qu’il existe une suite ak d’éléments de
A qui converge vers a. Pour tout n, on a f (n) (γ(ak )) = 0 et donc par continuité f (n) (γ(a)) =
0. La fonction f , dont toutes les dérivées sont nulles en γ(a) est donc identiquement nulle
dans un petit disque D centré en γ(a).
Si on avait a < 1, par continuité de γ, on pourrait trouver a0 > a tel que γ(a0 ) ∈ D.
Toutes les dérivées de f s’annuleraient en γ(a0 ) et on aurait a0 ∈ A ce qui contredit le fait
que a en est la borne supérieure. On a donc a = 1 et f (z1 ) = 0 quel que soit le choix initial
de z1 . Cela achève la démonstration.
C.4.11 Prolongement analytique Considérons une série entière an z n dont le
rayon de convergence R est > 0 mais fini. Elle définit une fonction holomorphe
dans le disque ouvert D de rayon R centré en 0. Il est certainement impossible
de prolonger f en une fonction holomorphe dans un disque de rayon R0 > R
centré en 0 : cela entraînerait que le rayon de convergence est ≥ R0 . Par contre,
il est parfaitement possible que f se prolonge en une fonction holomorphe dans
un ouvert plus grand que D. Ainsi, si tous les an sont égaux à 1, le rayon de
convergence est 1, mais f se prolonge en la fonction 1/(1−z) qui est holomorphe
dans C \ {1}.
P
Plus généralement, étant donnés deux ouverts non vides Ω1 ⊂ Ω2 , avec Ω2
connexe par arc, et f holomorphe dans Ω1 , on peut en chercher un prolongement holomorphe dans Ω2 , c’est-à-dire une fonction g holomorphe dans Ω2
vérifiant f (z) = g(z) pour z ∈ Ω1 . Ce problème n’a pas toujours de solution,
mais ce qu’affirme le théorème C.4.10, c’est que si ce prolongement existe, il
est unique.
En effet, si g1 et g2 sont deux tels prolongements, on applique ce théorème
à la différence h = g1 − g2 qui est holomorphe dans l’ouvert connexe par arc
Ω2 , et est nulle au voisinage de tout point de Ω1 . On a donc h = 0 dans Ω2 et
les fonctions g1 et g2 coïncident.
C.5
Théorème des résidus
Théorème C.5.1 (Développement en série de Laurent) Soit f holomorphe dans le disque épointé Ḋ = {z| 0 < |z − z0 | < r}. On a alors, pour
214
Annexe C. Fonctions holomorphes
z ∈ Ḋ,
f (z) =
+∞
X
an (z − z0 )n ,
(C.11)
n=−∞
n o
la série convergeant uniformément dans toute couronne z ρ1 ≤ |z| ≤ ρ2 avec
P
n
0 < ρ1 < ρ2 < r. Plus précisément, la série entière ∞
0 an z a un rayon de
convergence ≥ r (ce qui donne un sens à la somme des termes d’indice positif
P
n
a un
dans (C.11) pour |z − z0 | < r), tandis que la série entière ∞
1 a−n ζ
rayon de convergence infini (ce qui donne un sens à la somme des termes
d’indice négatif pour z 6= z0 ).
Les coefficients an sont donnés par la formule
1 Z
f (w)
an =
dw ,
2iπ γρ (w − z0 )n+1
(C.12)
où γρ est un cercle de rayon ρ < r, centré en z0 et orienté dans le sens positif.
La démonstration est très semblable à celle du théorème C.4.3, et nous ne détaillerons que les
points qui diffèrent. Nous supposerons également, pour simplifier les notations, que z0 = 0.
Comme dans le théorème C.4.3, on montre d’abord que le membre de droite de (C.12) ne
dépend pas du choix de ρ et on définit les an , n ∈ Z, par cette formule. On fixe ensuite z ∈ Ḋ,
et on choisit ρ1 et ρ2 tels que 0 < ρ1 < |z| < ρ2 < r. On considère la couronne ρ1 ≤ |z| ≤ ρ2
et on utilise la formule intégrale de Cauchy sous la forme générale de la remarque C.4.2 :
Z
Z
1
f (w)
1
f (w)
f (z) =
dw −
dw .
(C.13)
2iπ γρ w − z
2iπ γρ w − z
2
1
Le calcul du développement en série de l’intégrale sur γρ est exactement le même que celui
2
que nous avons fait dans la démonstration du théorème C.4.3 et on obtient
1
2iπ
Z
γρ
1
∞
X
f (w)
dw =
an z n ,
w−z
n=0
(C.14)
la série figurant au membre de droite convergeant au point z. Ceci étant valable pour tout
point z de Ḋ, le rayon de convergence de la série entière est ≥ r. Dans l’intégrale sur γρ ,
1
où on a cette fois-ci |w/z| = ρ1 / |z| < 1, on écrit
∞
−
X
1
1
1
=
=
wp z −p−1 .
w−z
z 1 − w/z
p=0
on a donc
−
1
2iπ
Z
γρ
1
f (w)
1
dw =
w−z
2iπ
Z
∞
X
γρ p=0
1
z −p−1
f (w)
dw ,
w−p
215
C.5. Théorème des résidus
la série de fonctions de w figurant au membre de droite convergeant uniformément sur le
cercle. On peut donc l’intégrer terme à terme et on obtient
1
−
2iπ
∞
Z
γρ
1
X
f (w)
dw =
a−p−1
w−z
0
p+1
1
,
z
(C.15)
la série figurant au membre de droite étant convergente. Cela étant valable pour tout z ∈ Ḋ,
et donc pour des valeurs arbitrairement
grandes de |1/z|, il en résulte que le rayon de converP∞
gence de la série entière p=0 a−p−1 ζ p est infini. Revenons à l’écriture (C.13) de f (z). En
remplaçant la première intégrale par son développement (C.14) et la seconde par son développement (C.15) (après le changement d’indice −p − 1 = n), on obtient l’expression (C.11),
ce qui achève la démonstration.
C.5.2 Structure d’une fonction holomorphe dans un disque pointé
On notera D un disque ouvert de centre z0 et de rayon r, et Ḋ = D \ {z0 }
le disque pointé correspondant. Si f est holomorphe dans Ḋ, on dit aussi que
f est une fonction holomorphe ayant une singularité en z0 , ou que z0 est un
P
n
point singulier de f . Soit f (z) = ∞
−∞ an (z − z0 ) le développement en série
de Laurent de f . Trois cas peuvent se produire.
• Tous les an sont nuls pour n ≤ −1. La fonction f se prolonge alors en une
P
n
fonction holomorphe dans tout le disque : la somme de la série entière ∞
0 an z .
On dit alors que z0 est une singularité apparente de f . Dans la pratique, on
s’empresse alors de prolonger f en posant f (z0 ) = a0 pour supprimer la singularité, et on préfère réserver le terme de point singulier aux deux cas qui vont
suivre.
• Il n’existe qu’un nombre fini (non nul) d’entiers n < 0 tels que an 6= 0. Soit
−p le plus petit d’entre eux. On a alors
P∞
f (z) =
k=0
h(z)
a−p+k (z − z0 )k
=
p
(z − z0 )
(z − z0 )p
la fonction h étant holomorphe dans le disque D et ne s’annulant pas au point
z0 . On dit alors que f a une singularité polaire (ou encore est méromorphe)
en z0 , et que z0 est un pôle d’ordre p de f (on dit couramment pôle simple,
double, . . . pour pôle d’ordre 1, 2, . . .).
• Il existe une infinité d’entiers n négatifs tels que an 6= 0. On dit que z0 est
un point singulier essentiel de f .
Définition C.5.3 Soit f une fonction holomorphe ayant un point singulier
en z0 . On appelle résidu de f en z0 , et on note Res (f ; z0 ) le coefficient a−1
du développement de Laurent de f en z0 .
216
Annexe C. Fonctions holomorphes
D’après la formule (C.12), on a
Res (f ; z0 ) =
1 Z
f (w) dw
2iπ γρ
(C.16)
où γρ est un cercle centré en z0 , orienté dans le sens positif, et de rayon ρ assez
petit pour être contenu dans un disque pointé où f est holomorphe.
Théorème C.5.4 (des résidus) Soient γ = (γj )j∈J le bord orienté d’un
compact K et Z = {zl }l∈L un ensemble fini de points appartenant à son intérieur K̊. On se donne une fonction f définie et continue dans K \ Z et
holomorphe dans K̊ \ Z. On a alors
XZ
j∈J
f (z) dz = 2iπ
γ
j
X
Res (f ; zl ) .
l∈L
K
γj
zl
γel
Soit δ > 0 inférieur à la distance de deux points quelconques (distincts) de Z, et inférieur
à la distance d’un point quelconque de Z à la frontière de K. Soit ρ vérifiant 0 < ρ < δ/2.
Notons Dl et γel le disque ouvert et le cercle (orienté dans le sens positif) de rayon ρ centrés
en zl . Les disques fermés Dl sont deux à deux disjoints, et sont contenus dans l’intérieur K̊.
e le compact obtenu en retirant de K les disques Dl . Son bord orienté est constitué
Soit K
des courbes γj , avec leur orientation, et des cercles γel changés d’orientation. D’autre part,
e et est holomorphe dans l’intérieur de celui-ci.
la fonction f est continue sur le compact K
On peut donc appliquer le corollaire (C.3.3) et on obtient
XZ
XZ
f (z) dz −
f (z) dz = 0 .
(C.17)
j∈J γj
l∈L γel
Enfin, la fonction f est holomorphe dans le disque pointé de centre zl et de rayon δ, qui
contient le cercle γl . On a donc, d’après (C.16), l’égalité
Z
f (z) dz = 2iπ Res (f ; zl ) ,
γe
l
217
C.6. Application au calcul d’intégrales
qu’il suffit de reporter dans (C.17) pour obtenir le résultat.
C.5.5 Calcul pratique d’un résidu Lorsque f a un pôle d’ordre p en z0 ,
nous avons vu que f peut se mettre sous la forme f (z) = h(z)/(z−z0 )p où
h est holomorphe au voisinage de z0 . Si on sait calculer le développement en
P
série entière h(z) = an (z−z0 )n , on obtient donc
Res (f ; z0 ) = ap−1 = h(p−1) (z0 )/(p−1)! .
Dans le cas particulier d’un pôle simple, le coefficient a0 est la limite de
h(z) pour z → z0 et on a donc Res (f ; z0 ) = limz→z0 (z−z0 )f (z).
Un cas important est celui où f est donnée sous la forme d’un quotient g/h
de deux fonctions holomorphes au voisinage de z0 . Si g et h ont respectivement
un zéro d’ordre p et q en z0 , on a donc
P∞
am (z−z0 )m
n
n=q bn (z−z0 )
f (z) = Pm=p
∞
,
ap 6= 0 ,
bq 6= 0 .
Si q−p > 0, la fonction f a un pôle d’ordre q−p, on est ramené au calcul du
développement limité généralisé de f en puissances de (z−z0 ) : le coefficient
de (z−z0 )−1 sera le résidu de f en z0 . On aura souvent intérêt à prendre
ζ = (z−z0 ) comme nouvelle variable.
Là encore, le cas d’un pôle simple (q = p+1) est . . . plus simple : on a
Res (f ; z0 ) = ap /bq .
Il n’y a pas de méthode générale pour déterminer le résidu d’une fonction
ayant un point singulier essentiel. Le meilleur des cas est celui où on peut
obtenir explicitement le développement de Laurent. Par exemple, la fonction
z 7→ e1/z est holomorphe dans le plan privé de l’origine comme composée de
deux fonctions holomorphes. En substituant 1/z à ζ dans le développement
en
P0
ζ
1/z
n
1/z
série entière de e , on obtient e = −∞ z /(−n)! et donc Res e ; 0 = 1.
C.6
Application au calcul d’intégrales
Le théorème des résidus ne permet pas de calculer la primitive d’une fonction d’une variable réelle. Par contre, y compris dans des cas où la primitive
n’est pas une “fonction élémentaire”, il permet de calculer explicitement l’intégrale de certaines fonctions sur certains intervalles. Nous allons passer en
revue quelques exemples.
218
Annexe C. Fonctions holomorphes
C.6.1 Intégrale d’une fraction rationnelle en cos θ et sin θ sur un intervalle période
Z 2π
P (cos θ, sin θ)
I=
dθ ,
Q(cos θ, sin θ)
0
les fonctions P et Q étant des polynômes de deux variables, Q ne s’annulant
pas sur le cercle unité. Ce cercle γ, parcouru dans le sens positif, se paramètre
par z = eiθ pour θ ∈ [0, 2π]. On a alors cos θ = (z +1/z)/2, sin θ = (z −1/z)/2i,
dz = ieiθ dθ = iz dθ et donc
I=
Z
γ
P (z+1/z)/2, (z−1/z)/2i
Z
1
dz = F (z) dz ,
γ
Q (z+1/z)/2, (z−1/z)/2i iz
où F (z) est une fraction rationnelle n’ayant pas de pôles sur le cercle unité.
Soient z1 , . . . , zp les pôles de F situés à l’intérieur du cercle unité. On a
I = 2iπ
p
X
Res (F ; zj ) .
j=1
Le calcul à effectuer : recherche des pôles, et développement limité en ceux-ci
est purement algébrique. Il est souvent plus simple que la méthode classique,
elle aussi purement algébrique, qui permet de calculer la primitive (se ramener
à une fraction rationnelle en t = tg(θ/2), puis la décomposer en éléments
simples).
C.6.2 Intégrale d’une fraction rationnelle sur R
I=
Z ∞
F (x) dx ,
F (x) =
−∞
P (x)
,
Q(x)
où P et Q sont des polynômes, ce dernier ne s’annulant pas sur R. En outre,
pour garantir la convergence de l’intégrale à l’infini, on suppose deg(Q) ≥
deg(P ) + 2.
R
Nous allons considérer γr F (z) dz, où γr est le bord orienté du demi disque
de centre 0, de rayon r, situé dans le demi-plan supérieur. Nous appellerons
z1 , . . . , zp les pôles de F situés dans le demi-plan supérieur et nous supposerons
r assez grand pour que le demi-disque contienne tous les zj . On a donc
Z r
−r
F (x) dx +
Z
γer
F (z) dz = 2iπ
p
X
Res (F ; zj ) ,
j=1
où γfr est le demi-cercle de rayon r parcouru dans le sens positif.
219
C.6. Application au calcul d’intégrales
zj
γfr
r
Lorsque r tend vers l’infini, la première intégrale tend vers I, et nous allons
montrer que la seconde tend vers 0. On a en effet d’après (C.6)
Z
γer
F (z) dz ≤ sup |F (z)| longueur(γfr ) ,
|z|=r
et, en vertu de la condition sur les degrés de P et Q, on a sup|z|=r |F (z)| ≤
Cte /r2 , tandis que la longueur du demi-cercle est πr. On a donc
I=
p
X
Res (F ; zj ) .
j=1
C.6.3 Intégrales sur R de F (x)eiax , F (x) sin(ax), . . .
Considérons l’intégrale
Ir =
Z r
F (x)eiax dx ,
F (x) =
−r
P (x)
Q(x)
,
a>0,
où P et Q sont des polynômes, ce dernier ne s’annulant pas sur R. Nous
supposerons seulement ici que deg(Q) ≥ deg(P ) + 1.
Remarquons que cette condition n’entraîne pas que la fonction F (x)eiax soit
sommable sur R (c’est-à-dire que son intégrale soit absolument convergente).
En effet, si deg(Q) = deg(P )+1, la fonction |F (x)eiax | = |F (x)| est équivalente
à Cte /|x| à l’infini et n’est donc pas sommable. Comme nous allons le voir, cela
n’empéchera pas Ir d’avoir une limite pour r → ∞.
En appliquant le théorème des résidus sur le même demi-disque que précédemment, et en utilisant les mêmes notations, on obtient
Ir +
Z
γer
F (z)e
iaz
dz = 2iπ
p
X
Res (F (z)eiaz ) ; zj
,
(C.18)
j=1
Pour majorer l’intégrale sur le demi-cercle, nous utiliserons le lemme suivant.
220
Annexe C. Fonctions holomorphes
Lemme C.6.4 Soit f (z) une fonction
continue définie dans le demi-plan suR
périeur vérifiant f (z) −→ 0. Alors γer f (z)eiaz dz −→ 0 pour a > 0.
z→∞
r→∞
Notons M (r) la borne supérieure de |f (z)| lorsque z parcourt γ
fr . Par hypothèse, M (r) −→ 0.
r→∞
D’autre part, on a
Z
Z π
iaz
e−ar sin θ r dθ ,
f (z)e dz ≤ M (r)
γer
0
et, en utilisant le fait que sin θ ≥ 2θ/π dans [0, π/2],
Z
π
e−ar sin θ r dθ = 2
0
Z
π/2
e−ar sin θ r dθ ≤ 2
0
Z
π/2
e−2arθ/π r dθ ≤ 2
0
Z
∞
e−2arθ/π r dθ = π/a .
0
L’intégrale curviligne est donc majorée en module par πM (r)/a et tend vers 0 pour r → ∞
ce qui achève la démonstration du lemme.
En revenant à l’estimation (C.18), on obtient donc
lim
Z r
r→∞ −r
F (x)e
iax
dx = 2iπ
p
X
Res (F (z)eiaz ) ; zj
,
(C.19)
j=1
où les zj sont les pôles de F situés dans le demi-plan supérieur.
Attention Pour a < 0, la formule et le lemme ci-dessus sont faux (le module
de eiaz est très grand sur γfr ). Il faut faire un raisonnement analogue, mais en
prenant le demi-disque dans le demi-plan inférieur. Le bord de celui-ci devant
être orienté dans le sens positif, c’est l’opposé de l’intégrale qui sera égal au
produit par 2iπ de la somme des résidus situés dans le demi-plan inférieur.
Pour calculer les intégrales de F (x) cos(ax) et de F (x) sin(ax), il faut les
exprimer à partir de celles de F (x)e±iax et donc en principe appliquer la méthode dans les deux demi-plans. Si on a la chance que F soit réelle pour x réel,
il est plus économique de remarquer que ce sont les parties réelle et imaginaire
de (C.19).
Remarque C.6.5 Pour a 6= 0, bien que la fonction considéréeRne soit pas né∞
cessairement sommable
sur R, il est classique de noter encore −∞
F (x)eiax dx
Rs
iax
la limite limr,s→+∞ −r F (x)e dx, à condition qu’elle existe (nous n’avons
prouvé jusqu’ici que l’existence de la limite des intégrales sur des intervalles
symétriques). C’est effectivement le cas : on a, par intégration par parties,
Z s
−r
h
F (x)eiax dx = F (x)eiax /ia
is
−r
−
Z s
−r
F 0 (x)eiax /ia dx ,
221
C.6. Application au calcul d’intégrales
le terme tout intégré tend vers 0 pour r, s → +∞ et, la fraction rationnelle
F 0 étant équivalente à Cte xdeg(P )−deg(Q)−1 à l’infini, l’intégrale a également une
limite. On peut donc réécrire (C.19) sous la forme
Z ∞
F (x)eiax dx = 2iπ
−∞
p
X
Res (F (z)eiaz ) ; zj
.
j=1
Exercice C.6.6 Il s’agit de démontrer l’égalité
I=
Z ∞
0
π
sin x
dx = ,
x
2
où le membre de gauche est la limite, pour r → ∞, de l’intégrale sur l’intervalle
[0, r]. Ce cas ne se ramène pas à ceux étudiés au n◦ C.6.3 à cause de la présence
d’un pôle sur l’axe réel. On a
I=
lim
ε→0 ; r→∞
Im
Z r ix
e
ε
(Z
)
Z r ix
−ε eix
1
e
dx = Im
dx +
dx .
x
2
−r x
ε x
γfr
γfε
ε
r
En appliquant le théorème des résidus au contour ci-dessus, et en faisant
tendre r vers l’infini puis ε vers 0, démontrer que l’on a
Z
1
eiz
I = lim Im
dz ,
2 ε→0
γeε z
où le demi-cercle γfε est orienté dans le sens positif. En posant eiz /z = 1/z +
(eiz − 1)/z, calculer la limite de l’intégrale sur le demi-cercle (on trouvera le
produit du résidu 1 par iπ) et conclure.
222
Annexe C. Fonctions holomorphes
C.7
Primitives d’une fonction holomorphe
Etant donné f holomorphe dans Ω, une primitive de f dans Ω est une
fonction F holomorphe dans Ω et vérifiant F 0 = f . Comme nous allons le
voir, le problème de l’existence d’une primitive dépend fortement de l’ouvert
Ω lui-même.
Théorème C.7.1 Soit f holomorphe dans Ω et possédant une primitive F
dans cet ouvert. Soit t 7→ γ(t) un chemin de classe C 1 par morceaux, défini
sur [a, b] et à valeurs dans Ω. Notons z0 = γ(a) et z1 = γ(b) l’origine et
l’extrémité de ce chemin. On a
Z
γ
En particulier, l’intégrale
f (z) dz = F (z1 ) − F (z0 ) .
R
γ
f (z) dz est nulle pour tout chemin fermé.
Dans le cas où γ est de classe C 1 , on a
Z
Z
f (z) dz =
γ
b
0
Z
f (γ(t))γ (t) dt =
a
a
b
∂
{F (γ(t))} dt = F (γ(b)) − F (γ(a)) ,
∂t
ce qui donne le résultat dans ce cas. Si γ est de classe C 1 par morceaux, notons a < t1 <
. . . < tp < b les points de subdivision. En appliquant ce qui précède à la restriction de γ aux
intervalles [a, t1 ], [t1 , t2 ], . . ., on obtient
Z
f (z) dz = F (γ(t1 ))−F (γ(a))+F (γ(t2 ))−F (γ(t1 ))+ · · · +F (γ(b))−F (γ(tp ))
γ
et donc le résultat.
Corollaire C.7.2 Soit f holomorphe dans un ouvert Ω connexe par arc et
possédant une primitive F dans cet ouvert. Alors les primitives de f dans Ω
sont exactement les fonctions z 7→ F (z) + C, avec C ∈ C.
Soit en effet G une autre primitive de f , et fixons un point z0 ∈ Ω. Pour tout point z ∈ Ω, il
existe un cheminRγ de classe C 1 (voir la remarque C.4.9) joignant z0 à z. D’après le théorème
précédent, on a γ f (w) dw = F (z) − F (z0 ) = G(z) − G(z0 ). On a donc G(z) = F (z) + C en
tout point, avec C = G(z0 ) − F (z0 ).
Si l’hypothèse portant sur Ω n’est pas satisfaite, par exemple dans le plan
privé de l’axe réel, le lecteur montrera aisément que la conclusion du théorème
est fausse.
C.8. Déterminations du logarithme
223
Théorème C.7.3 (i) Si f est holomorphe dans un disque, elle y possède
toujours une primitive.
(ii) Si f est holomorphe dans un disque pointé de centre z0 , elle y possède une
primitive si et seulement si Res (f ; z0 ) = 0.
On sePramène aisément au cas z0 = 0. Dans le premier
P∞ cas, f se développe en série en∞
tière 0 an z n convergente dans le disque. La série 0 an z n+1 /(n+1) a le même rayon de
convergence et définit une primitive de f .
P
Si f est holomorphe dans un disque pointé et a un résidu nul, on a f (z) = n6=−1 an z n ,
P
et on peut poser F (z) = n6=−1 an z n+1 /(n+1). Nous laissons au lecteur le soin de vérifier
(en séparant les indices positifs et négatifs) que la série de Laurent ci-dessus converge dans
le même disque pointé que la série initiale.
Réciproquement, supposons que f possède une primitive dans le disque pointé, et soit
γ un cercle centré à l’origine
contenu dans ce disque et orienté dans
le sens positif. D’après
R
R
le théorème C.7.1, on a γ f (z) dz = 0. Mais on a d’autre part γ f (z) dz = 2iπ Res (f ; 0),
d’où le résultat.
C.8
Déterminations du logarithme
On sait que l’équation ew = z, pour z 6= 0 donné, possède une infinité de
solutions : les nombres complexes wk = log |z| + iα + 2ikπ, k ∈ Z, où α est
l’un des arguments de z. Si on veut trouver une solution qui dépende de z
de manière holomorphe, on peut utiliser le théorème général suivant, qui ne
fournit toutefois qu’un résultat local.
Théorème C.8.1 (inversion locale) Soit f une fonction holomorphe dans
un ouvert Ω, et soit w0 ∈ Ω tel que f 0 (w0 ) 6= 0. Il existe alors un ouvert U ,
avec w0 ∈ U ⊂ Ω et un ouvert V contenant z0 = f (w0 ) tels que
(a) f est une bijection de U sur V ,
(b) la fonction réciproque g = f −1 appliquant V sur U est holomorphe dans V ,
(c) on a g 0 (z) = 1/f 0 (g(z)) pour tout z ∈ V .
Etant donnés z0 et w0 avec ew0 = z0 , le théorème précédent appliqué à la
fonction w 7→ ew assure l’existence d’un certain voisinage V de z0 et d’une
fonction g holomorphe dans V , avec g(z0 ) = w0 telle que eg(z) = z dans V
et que g 0 (z) = 1/eg(z) = 1/z. Une telle fonction semble mériter le nom de
logarithme, et on souhaiterait pouvoir la définir dans l’ouvert le plus grand
possible, à savoir C \ {0}. Ce souhait ne sera pas exaucé. En effet, la fonction
1/z est holomorphe dans l’ouvert C \ {0} et son résidu à l’origine est 1. Il
résulte du théorème C.7.3 qu’elle ne possède pas de primitive dans cet ouvert.
224
Annexe C. Fonctions holomorphes
On ne peut donc pas espérer définir une “bonne” fonction logarithme dans
C \ {0}, il faudrait renoncer au fait que sa dérivée est 1/z. En fait, on peut
même montrer qu’il est impossible de définir une fonction continue z 7→ l(z)
dans C \ {0} qui vérifie el(z) = z.
La situation est différente si on considère un ouvert Ω = C \ D, où D est
une demi-droite issue de l’origine (on dit que l’on a fait une coupure dans le
plan complexe).
Théorème et Définition C.8.2 (détermination du logarithme dans
un plan coupé) Choisissons α ∈ R tel que eiα ∈ D (c’est-à-dire l’un des arguments des points de D). Pour tout z ∈ C\D, on note a(z) l’unique argument
de z qui soit compris entre α et α + 2π, et on pose
l(z) = log |z| + ia(z) .
La fonction l est holomorphe dans C \ D et on a
∀z ∈ C \ D
,
el(z) = z
,
l0 (z) = 1/z .
On a el(z) = elog|z| eia(z) = |z| eia(z) = z, du fait que a(z) est un des arguments de z. Il reste
à montrer que l est holomorphe. Soit z ∈ C \ D, soit ρ la distance de z à D et soit ∆z ∈ C
vérifiant 0 < |∆z| < ρ. En posant w = l(z) et w + ∆w = l(z + ∆z), on a
l(z + ∆z) − l(z)
w + ∆w − w
l(z + ∆z) − l(z)
=
= w+∆w
=
∆z
z + ∆z − z
e
− ew
ew+∆w − ew
∆w
−1
,
en remarquant que z + ∆z et z n’ont pas à la fois le même module et le même argument,
et que ∆w est donc non nul. Les fonctions log |z| et a(z) étant continues dans C \ D, il en
résulte que ∆w tend vers 0 lorsque ∆z tend vers 0 et on a donc
l(z + ∆z) − l(z)
1
−1
= (ew ) = .
∆z→0
∆z
z
lim
Cela montre que l(z) est dérivable en tout point de C \ D, que sa dérivée vaut 1/z et est
donc continue, ce qui achève la démonstration.
Remarque C.8.3 Une détermination du logarithme dépend non seulement de
la coupure D, mais aussi du choix de l’argument α. Modifier ce dernier choix
revient à remplacer la détermination z 7→ l(z) par une autre détermination
z 7→ l(z) + 2kiπ, k ∈ Z.
On appelle détermination principale du logarithme la fonction correspondant au cas où D est le demi-axe réel négatif, et où α = −π. Dans ce cas,
a(z) = Arg(z) (détermination principale de l’argument, comprise entre −π et
π), et on a l(z) = log |z| + i Arg(z).
C.8. Déterminations du logarithme
225
C.8.4 Déterminations des fonctions puissances Si σ ∈ C, et si l est
une détermination du logarithme dans un plan coupé C \ D, on définira la
détermination correspondante de z σ par
z σ = eσl(z) ,
en étant bien conscient que la notation est dangereuse, et ne doit être employée
qu’après avoir précisé la coupure et la détermination du logarithme utilisées.
On a
d σ σl(z) 0
= σeσl(z) /z = σeσl(z) e−l(z) = σe(σ−1)l(z) = σz σ−1 ,
z = e
dz
où les mêmes déterminations sont choisies dans les membres de gauche et de
droite.
On se gardera de croire que l’on a toujours (z1 z2 )σ = z1σ z2σ ou (z σ )τ =
z στ . C’est parfois vrai, pour certains domaines de valeurs qui dépendent de
la détermination choisie, mais il faut le prouver en vérifiant soigneusement les
valeurs des arguments.
Pour en savoir plus
Nous n’avons pu rappeller ici qu’une petite partie, non seulement de la
théorie des fonctions holomorphes, mais même des aspects de cette théorie
qui sont couramment utilisés en physique. Nous pouvons d’abord proposer au
lecteur deux excellents ouvrages sur le sujet [CA] et [RU], et indiquer quelques
directions d’approfondissement.
Nous avons vu apparaître à plusieurs reprises des problèmes de topologie
plane (conditions sur les ouverts pour qu’il existe des primitives, déterminations du logarithme . . .). Ils relèvent d’abord de la théorie de l’homotopie, le
bon concept généralisant celui d’ouvert étoilé étant celui d’ouvert simplement
connexe. Une étude plus poussée comprendrait les concepts de revêtement et
de fonction multivoque et la théorie des surfaces de Riemann.
Un aspect important que nous n’avons pas abordé est celui de la représentation conforme. Si une application f est holomorphe et a une dérivée non
nulle, alors sa différentielle, comme application du plan dans lui-même est une
similitude directe (de “petits” ensembles sont transformés en ensembles ayant
la même forme, c’est le sens étymologique à la fois de “holomorphe” et de
“conforme”). En particulier, si on transforme par f deux courbes se coupant
en faisant un angle orienté α, les courbes images font entre elles le même angle
226
Annexe C. Fonctions holomorphes
orienté — et cette propriété caractérise les applications holomorphes parmi les
difféomorphismes du plan.
Le problème de la représentation conforme consiste à chercher une bijection,
holomorphe ainsi que son inverse, entre deux ouverts donnés du plan. Il s’agit
d’un problème à la fois théorique (un théorème de Riemann assure que tout
ouvert simplement connexe du plan distinct de C possède une représentation
conforme sur le disque unité), et pratique : pour de larges classes d’ouverts,
déterminer explicitement leurs représentations conformes sur le disque.
Rappelons le principe du maximum qui s’énonce ainsi : si f est holomorphe
(ou plus généralement harmonique) dans un ouvert connexe Ω, et si |f | atteint
son maximum en un point z0 de Ω (c’est-à-dire si |f (z0 )| = sup |f (z)|), alors
f est constante dans Ω. Ce théorème permet, à partir d’estimations sur f à la
frontière de Ω d’en déduire des estimations à l’intérieur de Ω.
Il faudrait enfin parler des “fonctions spéciales” qui apparaissent naturellement (séries ou intégrales de fonctions, solutions d’équations différentielles)
comme des fonctions holomorphes d’une variable complexe : fonction Γ d’Euler, fonction ζ de Riemann, fonctions elliptiques . . .
Bibliographie
[B-E-M-O-T] H. Bateman, A. Erdelyi, W. Magnus, F. Oberhettinger, F. Tricomi, Tables of integral transforms (McGraw Hill).
[B-G] J.-M. Bony, I. Gallagher, Analyse de Fourier et théorie spectrale,
Cours de l’École Polytechnique.
[BR] H. Brézis, Analyse fonctionnelle, théorie et applications, (Masson).
[CA] H. Cartan, Théorie élémentaire des fonctions analytiques d’une ou
plusieurs variables complexes (Hermann),
[CO] P. Colmez, Éléments d’analyse et d’algèbre, Cours de l’École Polytechnique.
[C-H] R. Courant et D. Hilbert, Méthods of mathematical physics (John
Wiley & sons).
[EV] L. C. Evans, Partial Differential Equations, Graduate Studies in Mathematics, (American Mathematical Society).
[GO] F. Golse, Distributions, analyse de Fourier et équations aux dérivées
partielles, Cours de l’École Polytechnique.
[G-L-V] F. Golse, Y. Laszlo et C. Viterbo, Analyse réelle et complexe,
Cours de l’École Polytechnique.
[GU] A. Guichardet, Intégration, analyse hilbertienne, Cours de l’École
Polytechnique, (Ellipses).
[H-L] F. Hirsch et G. Lacombe, Éléments d’analyse fonctionnelle, (Dunod).
[JO] F. John, Nonlinear wave equations, (American Mathematical Society).
[LA] F. Laudenbach, Calcul différentiel et intégral. Cours de l’École Polytechnique).
[R-S] M. Reed et B. Simon, Méthods of modern mathematical physics
(Academic Press).
[RU] W. Rudin, Analyse réelle et complexe (Masson).
228
Annexe C. Fonctions holomorphes
[SC1] L. Schwartz, Théorie des distributions (Hermann).
[SC2] L. Schwartz, Méthodes mathématiques pour les sciences physiques
(Hermann).
[WH] G. B. Whitham, Linear and nonlinear waves, (Wiley-Intersciences).
Table des matières
1 EDP d’ordre un
1.1
13
Équations de transport . . . . . . . . . . . . . . . . . . . . . . . 13
a
Problème de Cauchy homogène . . . . . . . . . . . . . . 14
b
Équation non homogène . . . . . . . . . . . . . . . . . . 15
1.2
Équation des ondes en dimension un . . . . . . . . . . . . . . . 16
1.3
EDP non linéaire d’ordre un . . . . . . . . . . . . . . . . . . . . 18
2 Équations de Laplace et de Poisson
23
2.1
Solution fondamentale du laplacien . . . . . . . . . . . . . . . . 23
2.2
Résolution de l’équation de Poisson . . . . . . . . . . . . . . . . 25
3 Séries de Fourier et applications
31
3.1
Méthode de séparation des variables . . . . . . . . . . . . . . . . 31
3.2
Séries de Fourier en dimension un d’espace . . . . . . . . . . . . 33
a
Convergence en moyenne quadratique . . . . . . . . . . . 33
b
Propriétés élémentaires . . . . . . . . . . . . . . . . . . . 35
c
Autres résultats de convergence . . . . . . . . . . . . . . 38
d
Espaces de Sobolev HTs . . . . . . . . . . . . . . . . . . . 41
3.3
Application à l’équation de la chaleur . . . . . . . . . . . . . . . 42
3.4
Autres bases hilbertiennes classiques de L2 . . . . . . . . . . . . 46
3.5
Séries de Fourier multidimensionnelles . . . . . . . . . . . . . . 48
4 Transformée de Fourier
4.1
53
Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
a
Transformée de Fourier des fonctions sommables . . . . . 54
230
4.2
Table des matières
b
Propriétés fondamentales . . . . . . . . . . . . . . . . . . 58
c
Fonctions de la distance à l’origine . . . . . . . . . . . . 64
Transformation de Fourier dans L2 . . . . . . . . . . . . . . . . 66
a
Définition, propriétés . . . . . . . . . . . . . . . . . . . . 66
b
Le principe d’incertitude . . . . . . . . . . . . . . . . . . 71
c
Espaces de Sobolev H s (Rd ) . . . . . . . . . . . . . . . . 72
4.3
Caractère universel de la convolution . . . . . . . . . . . . . . . 75
4.4
Récapitulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5 EDP linéaires du second ordre
85
5.1
EDP à coefficients constants . . . . . . . . . . . . . . . . . . . . 85
5.2
EDP à coefficients variables . . . . . . . . . . . . . . . . . . . . 91
6 Équations d’évolution sur Rd
97
6.1
Equation de la chaleur . . . . . . . . . . . . . . . . . . . . . . . 97
6.2
Equation de Schrödinger libre . . . . . . . . . . . . . . . . . . . 103
6.3
Equation des ondes . . . . . . . . . . . . . . . . . . . . . . . . . 105
7 Quelques autres EDP
111
7.1
Équation elliptique dans un domaine borné . . . . . . . . . . . . 111
7.2
Le Laplacien dans un domaine borné . . . . . . . . . . . . . . . 114
7.3
Equations d’évolution dans un domaine borné . . . . . . . . . . 120
7.4
Equation de Schrödinger avec potentiel . . . . . . . . . . . . . . 123
A Éléments d’analyse fonctionnelle
129
A.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . 129
a
Définitions élémentaires . . . . . . . . . . . . . . . . . . 129
b
Limites et continuité . . . . . . . . . . . . . . . . . . . . 130
c
Compacité . . . . . . . . . . . . . . . . . . . . . . . . . . 131
d
Applications linéaires continues . . . . . . . . . . . . . . 132
A.2 Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . 133
a
Généralités . . . . . . . . . . . . . . . . . . . . . . . . . 133
b
Espaces de fonctions continues . . . . . . . . . . . . . . . 137
231
Table des matières
A.3 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 139
a
Définition et exemples . . . . . . . . . . . . . . . . . . . 139
b
Projections . . . . . . . . . . . . . . . . . . . . . . . . . 142
c
Bases hilbertiennes . . . . . . . . . . . . . . . . . . . . . 147
d
Convergence faible . . . . . . . . . . . . . . . . . . . . . 149
A.4 Opérateurs linéaires bornés
. . . . . . . . . . . . . . . . . . . . 151
a
Généralités . . . . . . . . . . . . . . . . . . . . . . . . . 151
b
Spectre et valeurs propres . . . . . . . . . . . . . . . . . 155
c
Opérateurs hermitiens en dimension finie . . . . . . . . . 158
A.5 Théorie spectrale des opérateurs compacts . . . . . . . . . . . . 159
A.6 Notions sur les opérateurs non bornés . . . . . . . . . . . . . . . 164
B Intégrale de Lebesgue
167
B.1 Intégrale des fonctions positives . . . . . . . . . . . . . . . . . . 167
B.2 Fonctions sommables . . . . . . . . . . . . . . . . . . . . . . . . 170
B.3 Cas de la dimension 1
. . . . . . . . . . . . . . . . . . . . . . . 177
B.4 Intégrales multiples . . . . . . . . . . . . . . . . . . . . . . . . . 180
B.5 Sur la construction de l’intégrale . . . . . . . . . . . . . . . . . . 182
B.6 Espaces L1 et L2 . . . . . . . . . . . . . . . . . . . . . . . . . . 185
a
Convergence en moyenne . . . . . . . . . . . . . . . . . . 185
b
Fonctions de carré sommable . . . . . . . . . . . . . . . . 187
c
Relations avec d’autres notions de convergence . . . . . . 191
B.7 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
C Fonctions holomorphes
199
C.1 Définition et propriétés élémentaires . . . . . . . . . . . . . . . . 199
C.2 Intégrales curvilignes . . . . . . . . . . . . . . . . . . . . . . . . 203
C.3 Formule de Green-Riemann . . . . . . . . . . . . . . . . . . . . 206
C.4 Développement dans un disque . . . . . . . . . . . . . . . . . . 208
C.5 Théorème des résidus . . . . . . . . . . . . . . . . . . . . . . . . 213
C.6 Application au calcul d’intégrales . . . . . . . . . . . . . . . . . 217
C.7 Primitives d’une fonction holomorphe . . . . . . . . . . . . . . . 222
C.8 Déterminations du logarithme . . . . . . . . . . . . . . . . . . . 223
Téléchargement