ANALYSE DE HILBERT ET DE FOURIER, VI MARC CHAPERON 15. Intermède (suite) : espaces de Sobolev sur le cercle Appelons série de Fourier toute famille (am em )m∈Z de « monômes trigonométriques », où les am sont des constantes complexes, et notonsP la am em . P Proposition. Pour tout s > 1/2, si la série de Fourier am em vérifie X (29) (1 + m2 )s |am |2 < ∞ m∈Z alors elle est normalement sommable dans C(T) et a donc une somme f ∈ C(T) telle que fc m = am pour tout m ∈ Z. s Démonstration. La famille u = (um )m∈Z définie par um := (1+m2 ) 2 |am | appartient à `2 (Z) ; il en va X de même de laX famille v = (vm )m∈Z donnée 2 2 − 2s (1 + n2 )−s < ∞ ; comme par vm := (1 + m ) car |vm | = 2 n∈N m∈Z |am | = um v̄m pour tout m, on a donc X |am | = hu|vi2 ≤ |u|2 |v|2 < ∞ , m∈Z d’où l’uniforme sommabilité puisque |am em |∞ = |am |. L’identité fc m = am s’obtient donc immédiatement en appliquant à la suite (a−n e−n + · · · + an en )n∈N le Lemme. Si une suite (g n ) converge uniformément vers f dans C(T), n c alors fc m = lim g m pour tout m ∈ Z. n→∞ n c Preuve. On a |fc m−g m| ≤ R1 0 |f (t) − g n (t)| dt = |f − g n |1 ≤ |f − g n |∞ .1 Date: 15 et 22 mars 2013. 1On voit donc que l’on peut remplacer la convergence uniforme par la convergence L1 , ce qui améliore le lemme. 42 ANALYSE DE HILBERT ET DE FOURIER, VI 43 Espaces de Sobolev. Pour tout réel s, l’ensemble des séries de Fourier P am em vérifiantP(29) est l’espace de Sobolev H s (T). s L’application am em 7→ (1 + m2 ) 2 am m∈Z étant une bijection de s H s (T) sur `2 (Z), on que HP (T) est unPespace vectoriel si l’on pose P voit m (comme de juste) am e + λ bm em = (am + λbm )em pour λ ∈ C, ce qui fait de la bijection précédente un isomorphisme d’espaces vectoriels complexes ; l’image réciproque du produit scalaire `2 par cet isomorphisme est un produit scalaire hermitien sur H s (T) appelé produit scalaire H s et donné par X P P hf |giH s = (1 + |m|2 )s am bm pour f = am em et g = bm em ; m∈Z l’isomorphisme précédent étant par définition une isométrie de l’espace préhilbertien H s (T) sur l’espace de Hilbert `2 (Z), on voit que H s (T), muni du produit scalaire H s , est un espace de Hilbert2. s Pour s > 1/2, d’après la proposition précédente, HP (T) s’identifie à un sous-espace de C(T), la notation « formelle » f = am em pouvant alors désigner la somme de la famille absolument sommable (am em )m∈Z dans C(T) ; cela se généralise ainsi : Théorème. Pour tout entier k ≥ 0, soit C k (T) l’espace vectoriel des fonctions complexes d’une variable réelle périodiques de période 1 et de classe C k . Quel que soit s > 1/2, on a H s+k (T) ⊂ C k (T) ⊂ H k (T), la première inclusion au sens que nous venons de définir, la seconde par l’identification de chaque f ∈ C k (T) à sa série de Fourier3. Démonstration. L’inclusion C k (T) ⊂ H k (T) va résulter de l’important Scolie . Quelle que soit f ∈ C 1 (T), la série de Fourier de f 0 est obtenue par dérivation terme à terme de celle de f , c’est-à-dire que 0 c fc m = 2πimfm pour tout m ∈ Z. Preuve. Simple intégration par parties : Z 1 Z 1 t=1 −2πimt 0 −2πimt 0 c fm = e f (t) dt = e f (t) t=0 − −2πim e−2πimt f (t) dt 0 0 Z 1 = 2πim e−2πimt f (t) dt = 2πimfc m 0 −2πimt puisque e 2Si t=1 f (t)]t=0 = f (1) − f (0) = 0. s = 0, il s’appelle L2 (T) et la théorie de l’intégrale de Lebesgue montre qu’il est formé de classes de fonctions mesurables. 3Le problème ne se pose que si k = 0, où l’inclusion résulte de l’identité de Bessel-Parseval ; pour k ≥ 1 et f ∈ C k (T), en effet, la série de Fourier de f converge normalement vers f d’après l’inclusion C k (T) ⊂ H k (T) et la proposition précédente. 44 MARC CHAPERON d (k) (k) est continue, Pour f ∈ C k (T), on a donc fm = (2πim)k fc m ; comme f P (k) 2 2 k 2k c 2 on a |f |2 = (4π ) m |fm | < ∞ (Bessel-Parseval) d’où4 X X (1 + m2 )k 2 2 2 b (1 + m2 )k |fc | = | f | + m2k |fc m 0 m| 2k m m∈Z m∈Z∗ X 2 ≤ |fb0 |2 + 2k m2k |fc m | < ∞, m∈Z k c’est-à-dire f ∈ H (T), ce qui prouve l’inclusion C k (T) ⊂ H k (T). Étant donnée f ∈ H s+k (T) avec s > 1/2, le même calcul montre que, P m (j) pour tout j ∈ N, la série de Fourier (fc obtenue en dérivant j me ) fois terme à terme la série de Fourier de f appartient à H s+k−j (T) ; pour 0 ≤ j ≤ k, elle est donc normalement sommable dans C(T) d’après la proposition précédente car on a s + k − j > 1/2, ; en particulier, la suite (Sn f )(j) n∈N converge uniformément pour 0 ≤ j ≤ k, donc la suite (Sn f )n∈N converge au sens C k (annexe F, p. 50) ; par conséquent, sa limite f appartient à C k (T), ce qui prouve l’inclusion H s+k (T) ⊂ C k (T). Corollaire. L’intersection de tous les H s (T) avec s > 1/2 est égale à P C ∞ (T), qui est donc l’ensemble des am em telles que ∀α > 0 lim |m|α am = 0 . |m|→∞ La démonstration est laissée en exercice. 16. Application à l’équation de la chaleur Rappelons qu’il s’agit de résoudre le problème de Cauchy ( 2 ∂u = ∂∂xu2 ∂t (30) u(0, x) = u0 (x), c’est-à-dire de trouver une fonction complexe u des variables t ∈ R+ et x ∈ R, de période 1 par rapport à x et égale à une fonction donnée u0 pour t = 0. Théorème. Si u0 ∈ H s (T) avec s > 25 , le problème (30) a une solution, donnée par X 2 2 (31) u(t, x) = ûm (0)e−4π m t+2πimx , m∈Z où les nombres complexes ûm (0) sont les coefficients de Fourier de la donnée initiale u0 . La solution u est C ∞ dans R∗+ × R et la fonction 4Puisque supm∈Z∗ (1+m2 )k m2k = supn≥1 ( n12 + 1)k = 2k . ANALYSE DE HILBERT ET DE FOURIER, VI 45 ut : x 7→ u(t, x) converge au sens C ∞ vers la constante û0 (0) quand t → +∞. Plus précisément, u(t, x) converge uniformément vers û0 (0) et ses dérivées partielles ∂ α u avec |α|1 > 0 vers 0 quand t → +∞. La démonstration est laissée en exercice (lire l’annexe G). En fait, le résultat vaut (au sens des distributions) pour toute distribution5 u0 et (31) en définit, nous le verrons, l’unique solution. 17. Existence de bases hilbertiennes Théorème. Tout espace de Hilbert E a des bases hilbertiennes. Démonstration. Soit B l’ensemble des familles orthonormales B ⊂ E, ordonné par inclusion. Lemme. Cet ordre est inductif : B est non vide et toute partie A de B totalement ordonnée par inclusion possède un majorant. Preuve. L’ensemble B est non vide puiqu’il contient l’ensemble vide ! Si A ⊂ B est totalement ordonnée par inclusion, la réunion BA de tous les B ∈ A est une famille orthonormale : en effet, tout v ∈ BA est évidemment de norme 1 puisqu’il appartient à un B ∈ A ; tout vecteur w ∈ BA r {v} est aussi de norme 1 car il appartient à un B 0 ∈ A ; en outre, l’ensemble A étant totalement ordonné par inclusion, on a B ⊂ B 0 ou B 0 ⊂ B ; les vecteurs v, w appartiennent donc à un même élément de A, ce qui implique qu’ils sont orthogonaux et prouve que BA est une famille orthonormale ; c’est le majorant cherché puisqu’elle contient par définition tous les B ∈ A. Il résulte donc du lemme de Zorn que B possède un élément Bmax maximal pour l’inclusion. Si le sous-espace EBmax engendré par Bmax n’était pas dense dans E, son adhérence EBmax serait un sous-espace strict de E, donc son orthogonal serait non trivial ; ledit orthogonal contiendrait donc un vecteur u de norme 1, orthogonal à EBmax et en particulier à tous les éléments de Bmax ; par conséquent, Bmax ∪ {u} serait une famille orthonormale et Bmax ne serait pas maximale. Il en résulte bien que Bmax est une base hilbertienne. Remarque. Cet argument de « récurrence transfinie » donne lorsque E est de dimension finie n une preuve légèrement différente du théorème 5Annexe H, hors programme mais instructive. 46 MARC CHAPERON p. 6 : on considère une famille B = {u1 , . . . , up } orthonormale—c’està-dire vérifiant (5)—dont le nombre d’éléments p est maximal6, et l’argument qui termine la preuve ci-dessus montre que le sous-espace EB engendré par B est forcément E tout entier. Le lemme de Zorn repose sur une version assez forte de l’axiome du choix que certains mathématiciens, ayant peur que le ciel leur tombe sur la tête, répugnent à utiliser. Nous y reviendrons dans le cas de loin le plus courant, celui des espaces séparables. Annexe E. Intégrale des fonctions continues7 On se donne un intervalle compact I = [a, b] avec a < b, un espace de Banach E, et l’on note S = S(I, E) le sous-espace vectoriel (exercice8) de `∞ (I, E) formé des fonctions en escalier, définies comme suit : on a f ∈ S si et seulement s’il existe k ∈ N, a0 , · · · , ak+1 ∈ I avec a = a0 ≤ · · · ≤ ak+1 = b et v0 , · · · , vk ∈ E tels que f (t) = vj pour tout t ∈]aj , aj+1 [ et tout j ∈ {0, · · · , k}. Etant donné un tel f , son intégrale de a à b Z b k X f (t) dt = (aj+1 − aj ) vj ∈ E a j=0 ne dépend que de f , et non du choix d’une « subdivision » (a0 , · · · , ak+1 ) de I : le résultat sera le même pour toute autre subdivision (a00 , · · · , a0k0 +1 ) telle que f soit constante sur chaque ]a0j , a0j+1 [ (exercice). Rb L’application J : S → E donnée par J (f ) = a f (t) dt est lineaire (autre exercice) ; en outre, elle vérifie Z b Z b ≤ (32) |f (t)| dt ≤ (b − a) |f |∞ f (t) dt a a et est donc continue de S muni de la norme L∞ dans E. Les fonctions en escalier présentent un intérêt limité, mais nous allons exploiter le fait que S n’est pas fermé pour la norme L∞ : 6Ce qui a un sens car B est un système libre, d’où p ≤ n. 7On fait ici à la fois beaucoup moins que dans la théorie de l’intégrale de Lebesgue et un peu plus, les fonctions considérées étant à valeurs dans un espace de Banach. 8L’idée-clé de presque toutes les démonstrations concernant les fonctions en escalier est la suivante : si f ∈ S (resp. g ∈ S) est constante sur les intervalles ouverts entre deux points successifs d’une subdivision (a0 , · · · , ak+1 ) (resp. (b0 , · · · , bm+1 )) de I, alors f et g sont constantes sur les intervalles ouverts entre deux points successifs de la subdivision dont les points sont les ai et les bj . ANALYSE DE HILBERT ET DE FOURIER, VI 47 Lemme. Toute f ∈ C(I, E) est la limite uniforme d’une suite (fn ) à valeurs dans S(I, E). Si E = R et que f est positive, les fn peuvent être choisies positives. Démonstration. Par continuité uniforme de f (annexe D p. 33), pour tout n ∈ N, il existe kn ∈ N tel qu’on ait |f (t) − f (s)| ≤ 2−n pour |t − (n) (n) s| ≤ (b−a)2−kn et l’on peut supposer (kn ) croissante. Soit (a0 , · · · , a2kn ) (n) la subdivision de I définie par aj = a + j(b − a)2−kn ; si l’on définit (n) (n) (n) fn ∈ S par fn (b) = f (b) et fn (t) = f (aj ) pour tout t ∈ [aj , aj+1 [ et (n) (n) tout j, on voit que |fn − f |∞ ≤ 2−n puisque chaque [aj , aj+1 ] est de longueur (b − a)2−kn . La suite (fn ) converge donc uniformément vers f . Si f est positive, les fn aussi. Proposition et définition . Etant donnée f ∈ C(I, E), pour toute suite (fn ) dans S qui converge uniformément vers f , la suite (J (fn )) Rb tend vers le même élément J (f ) = a f (t) dt de E, appelé l’ intégrale de a à b de f . L’intégrale J : C(I, E) → E ainsi définie est linéaire et continue, de norme b − a. Démonstration. D’après le lemme précédent, l’adhérence S ⊂ `∞ (I, E) de S contient C(I, E). Il suffit d’appliquer le lemme 1 p. 419, en y remplaçant E par S, Ê par S et L par J , qui est continue et de norme b − a d’après (32)10. Etant donnée f dans S(I, E) (resp. C(I, E)), sa restriction à un intervalle compact J = [c, d] ⊂ I appartient à S(J, E) (resp. C(J, E)), Rd et l’intégrale de c à d de ladite restriction est notée c f (t) dt. On note Rc Rc Rd f (t) dt = 0 et d f (t) dt = − c f (t) dt. c Proposition. L’intégrale des fonctions continues vérifie (32) et possède les propriétés suivantes : i) Pour a ≤ c ≤ b, Z b Z c Z b (33) f (t) dt = f (t) dt + f (t) dt . a a c Rb ii) Si E = R et que f ∈ C(I, R) est positive,on a a f (t) dt ≥ 0, avec égalité si et seulement si f est identiquement nulle. iii) On définit une norme f 7→ |f |1 sur C(I, E), la norme L1 , par Rb |f |1 = a |f (t)| dt ; elle vérifie |f |1 ≤ (b − a)|f |∞ d’après (32). 9Qui 10On n’utilise absolument pas le fait que E est un espace de Hilbert. voit qu’elle est de norme exactement b−a en prenant pour f une constante. 48 MARC CHAPERON Démonstration. Étant donnée une suite (fn ) dans S tendant uniformé ment vers f ∈ C(I, E), l’inégalité |f (t)| − |fn (t)| ≤ |f (t) − fn (t)| entraı̂ne que la suite des fonctions en escalier t 7→ |fn (t)| converge uniformément vers t 7→ |f (t)| ; on déduit donc (32) dans C(I, E) de (32) dans S(I, E). On procède de même pour (33). ii) D’après le lemme, f est la limite uniforme d’une suite (fn ) de fonctions en escalier positives, dont l’intégrale est positive ; la limite J (f ) de la suite J (fn ) est donc bien positive. Comme I est compact et f continue, il existe α ∈ I tel qu’on ait f (t) ≤ f (α) = M pour tout t ∈ I, et l’on a M ≥ 0, avec égalité si et seulement si f est identiquement nulle. Si l’on suppose f 6= 0, la continuité de f au point α entraı̂ne l’existence d’un intervalle fermé J = [c, d] ⊂ I contenant α tel qu’on ait c < d et f (t) ≥ M/2 > 0 pour tout t ∈ J, d’où Z b Z c f (t) dt = a d Z Z f (t) dt + a Z f (t) dt + c d d Z c f (t) dt d f (t) dt ≥ ≥ b c M M (d − c) dt = > 0. 2 2 iii) L’inégalité triangulaire est laissée en exercice. Pour voir que |f |1 = 0 entraı̂ne f = 0 lorsque f est continue11, il suffit d’appliquer (ii) à la fonction continue t 7→ |f (t)|. Annexe F. Le théorème fondamental du calcul infinitésimal et quelques conséquences Théorème fondamental du calcul infinitésimal. Soient I un intervalle et E un espace normé complet. Rt i) Pour g ∈ C(I, E) et a ∈ I, l’application G : t 7→ a g(s) ds est de classe C 1 et a pour dérivée g. ii) Si f ∈ C(I, E) est de classe C 1 alors, quels que soient a, b ∈ I, Z f (b) − f (a) = b f 0 (t) dt . a 11C’est évidemment faux dans S, une fonction en escalier pouvant être nulle sauf en un nombre fini de points. ANALYSE DE HILBERT ET DE FOURIER, VI 49 Démonstration. i) Pour t, t + h ∈ I, Z t Z t+h g(s) ds − h g(t) g(s) ds − G(t + h) − G(t) − h g(t) = a a Z t+h Z t+h = g(s) ds − g(t) ds t t Z t+h g(s) − g(t) ds = t d’où, d’après (32), en posant [t, t + h] := [t + h, t] pour h < 0, |G(t + h) − G(t) − h g(t)| ≤ |h| max |g(s) − g(t)| s∈[t,t+h] et donc, pour h 6= 0, G(t + h) − G(t) − g(t) ≤ max |g(s) − g(t)| , s∈[t,t+h] h qui tend vers 0 quand h → 0 parce que g estRcontinue au point t. t ii) D’après (i), l’application f1 : t 7→ f (a)+ a f 0 (s) ds est continue, de classe C 1 et a pour dérivée f 0 . En d’autres termes, f − f1 est continue, de classe C 1 et sa dérivée est partout nulle. Il en résulte qu’elle est constante12. Comme elle est nulle au point a, on a donc bien f = f1 . Proposition. Soit (fn ) une suite de fonctions continues sur un intervalle J ⊂ R, à valeurs dans un espace de Banach Y et telle que (fn |K ) converge uniformément quel que soit le compact K ⊂ J (en particulier, (fn ) converge simplement vers une fonction continue f ). Alors, pour chaque a R∈ J, la suite (Fn ) de fonctions J → Y de classe C 1 définie par t Fn (t) = a fn (s) ds converge simplement vers la fonction F : J → Y Rt de classe C 1 définie par F (t) = a f (s) ds ; en outre, la convergence de (Fn |K ) vers (F |K ) est uniforme quel que soit le compact K ⊂ J. Démonstration. Il suffit de prouver que (Fn |[α,β] ) converge uniformément vers (F |[α,β] ) quels que soient α, β ∈ J avec α ≤ a ≤ β, tout compact K ⊂ J étant contenu dans un tel [α, β]. Or, pour tout t ∈ [α, β], on a Z t |F (t) − Fn (t)| = (f (s) − fn (s)) ds ≤ |t − a| max |f (s) − fn (s)| α≤s≤β a ≤ (β − α) max |f (s) − fn (s)|; α≤s≤β comme le second membre de cette inégalité ne dépend pas de t et tend vers 0 par hypothèse, la proposition en résulte. 12« Théorème fondamental du calcul différentiel », conséquence du théorème des accroissements finis. 50 MARC CHAPERON Corollaire 1. Soit (fn ) une suite de fonctions de classe C 1 sur un intervalle J ⊂ R, à valeurs dans un espace de Banach Y et possédant les deux propriétés suivantes : i) Il existe a ∈ J tel que la suite fn (a) ait pour limite un f (a) ∈ Y . ii) La suite (fn0 |K ) converge uniformément quel que soit le compact K ⊂ J (en particulier, (fn0 ) converge simplement et a pour limite une fonction continue g). Alors (fn ) converge simplement et a pour limite une fonction f : J → Y de classe C 1 telle que f 0 = g ; en outre, la convergence de la suite (fn |K ) vers (f |K ) est uniforme quel que soit le compact K ⊂ J. Démonstration. Il résulteRde la proposition que la suite (hn ) définie par t hn (t) = fn (t) − fn (a) = a fn0 (s) ds (point (ii) du théorème) converge Rt uniformément sur tout compact vers G : t 7→ a g(s) ds ; la suite (fn ) converge donc uniformément R t sur tout compact1 vers l’application f donnée par f (t) = f (a) + a g(s) ds, qui est C et a pour dérivée g d’après le point (i) du théorème. Corollaire 2. Soit (fn ) une suite de fonctions C k (1 ≤ k < ∞) sur un intervalle J ⊂ R, à valeurs dans un espace de Banach Y et possédant les deux propriétés suivantes : (j) i) Pour 0 ≤ j < k, il existe aj ∈ J tel que la suite fn (aj )) ait pour limite un f (j) (aj ) ∈ Y . (k) ii) La suite (fn |K ) converge uniformément quel que soit le compact (k) K ⊂ J (en particulier, (fn ) converge simplement et a pour limite une fonction continue g). Alors (fn ) converge simplement vers une fonction f : J → Y de classe C 1 telle que f (k) = g ; en outre, pour 0 ≤ j < k, la convergence de la (j) suite (fn |K ) vers (f (j) |K ) est uniforme quel que soit le compact K ⊂ J. Démonstration. Si k = 1, c’est le corollaire 1. Sinon, on peut faire l’hypothèse de récurrence que c’est vrai pour k − 1, l’appliquer à la suite (fn0 ) et conclure grâce au corollaire 1. Définition. Sous les hypothèses du corollaire 1, on dit que la suite (fn ) converge au sens C 1 . Plus généralement, elle converge au sens C k , (j) 1 ≤ k ≤ ∞, lorsque la suite (fn ) de ses dérivées j-ièmes converge uniformément sur tout compact pour 0 ≤ j ≤ k. Quand k est fini, le (k) corollaire 2 nous dit que c’est le cas si et seulement si la suite (fn ) converge uniformément sur tout compact et qu’en outre chacune des (j) suites fn avec 0 ≤ j < k converge en un point de J. ANALYSE DE HILBERT ET DE FOURIER, VI 51 Corollaire 3. Soit (fn ) une suite dans C k (T) (1 ≤ k < ∞) possédant les deux propriétés suivantes : (j) i) Pour 0 ≤ j < k, il existe aj ∈ R tel que la suite fn (aj )) ait pour limite un f (j) (aj ) ∈ Y . (k) ii) La suite (fn ) converge uniformément13, et a donc pour limite une fonction g ∈ C(T). Alors (fn ) converge simplement vers une fonction f ∈ C k (T) telle que (j) f (k) = g ; en outre, pour 0 ≤ j < k, la convergence de la suite (fn ) vers (f (j) ) est uniforme. Démonstration. Cela résulte du cas particulier J = R, Y = C du corollaire 2 et de la remarque qu’une limite simple de fonctions de période 1 est de période 1. Annexe G. Application aux fonctions de plusieurs variables Rappels et compléments. Soient X un ouvert non vide de Rn , et Y un espace normé complet. On dit14 que f : X → Y est de classe C 1 lorsqu’il existe des applications continues ∂1 f, · · · , ∂n f : X → Y telles que, pour toute application γ : t 7→ (γ1 (t), · · · , γn (t)) de classe C 1 d’un intervalle [t0 , t1 ] ⊂ R dans X (« arc C 1 dans X »), l’application f ◦ γ de [t0 , t1 ] dans Y soit de classe C 1 et vérifie (f ◦ γ)0 (t) = γ10 (t) ∂1 f γ(t) + · · · + γn0 (t) ∂n f γ(t) , d’où, par le théorème fondamental p. 48, n Z t1 X (34) f γ(t1 ) − f γ(t0 ) = γj0 (t) ∂j f γ(t) dt . j=1 t0 On en déduit que f est continue15 et que ses dérivées partielles ∂j f sont définies de manière unique. Exemple : fonctions holomorphes. Si X est un ouvert de C et Y un espace normé complexe (par exemple C), on dit que f : X → Y est 13Pour cela, il suffit évidemment que ce soit le cas sur [a, a + 1] pour un réel a. définition n’est pas habituelle, mais elle est très commode 15Etant donnés a ∈ X et (une norme étant choisie sur Rn ) r > 0 tel que X contienne la boule ouverte de centre a et de rayon r, il suffit d’appliquer la formule précédente aux chemins γ : [0, 1] → X définis par γ(t) = a + th avec |h| < r, puis d’utiliser la continuité des ∂j f . 14Cette 52 MARC CHAPERON holomorphe lorsqu’elle est de classe C 1 (en considérant C comme R2 ) et vérifie ∂2 f = i∂1 f , ce qui s’écrit aussi (équation de Cauchy-Riemann) ¯ := 1 (∂1 f + i∂2 f ) = 0. ∂f 2 (35) On dit alors que f 0 := ∂1 f : X → Y est la dérivée de f , et la formule (34) se lit Z b f (γ(b)) − f (γ(a)) = γ 0 (t) f 0 (γ(t)) dt. a En considérant les chemins γ(t) = z + th et en utilisant la continuité de f 0 , on en déduit que ∀z ∈ U f (z + h) − f (z) , h→0 h f 0 (z) = lim ce qui est la définition classique de Cauchy. Pour montrer qu’une fonction est bien de classe C 1 , il peut être utile d’appliquer le critère suivant, qui fait le lien avec la définition habituelle des dérivées partielles et que nous admettrons sans démonstration16 (le « seulement si » est clair) : Proposition. Soit (e1 , · · · , en ) la base canonique de Rn . Sous les hypothèses précédentes, une application f : X → Y est de classe C 1 si et seulement si elle possède les deux propriétés suivantes : a) Pour tout a ∈ X et 1 ≤ j ≤ n, le chemin t 7→ f (a + tej ) est f (a+tej )−f (a) dérivable en 0, c’est-à-dire que tend vers une limite t gj (a) ∈ Y quand t ∈ R \ {0} tend vers 0. b) Les applications g1 , · · · , gn : X → Y ainsi définies sont continues. On a alors gj = ∂j f pour tout j. Remarque. On définit inductivement la notion d’application de classe C k+1 , k > 1, comme suit : f est de classe C k+1 quand elle est de classe C 1 et que ses dérivées partielles sont de classe C k . Le théorème de Schwarz affirmant que ∂j ∂` f = ∂` ∂j f pour 1 ≤ j ≤ ` ≤ n si f est C 2 , on en déduit que si elle est C k avec k quelconque, ses dérivées partielles d’ordre k (obtenues en appliquant les opérateurs de dérivation partielle ∂j dans un ordre quelconque) sont les ∂ α f := ∂1α1 · · · ∂nαn f avec α = (α1 , . . . , αn ) ∈ Nn (« multi-indice ») et |α|1 := α1 + · · · + αn = k. 16Pour un traitement concis et assez complet du sujet, voir par exemple mon livre Calcul différentiel et calcul intégral, deuxième édition, Dunod, Paris, 2008. ANALYSE DE HILBERT ET DE FOURIER, VI 53 Dérivation terme à terme des suites de fonctions de plusieurs variables. Un ouvert X de Rm est connexe quand il est « d’une seule pièce », ce qui s’exprime comme suit17 : quels que soient a, b ∈ X, il existe un arc C ∞ joignant a à b dans X, c’est-à-dire une application γ : [0, 1] → X de classe C ∞ telle que γ(0) = a et γ(1) = b. Les seuls ouverts connexes de R sont les intervalles ouverts, mais les ouverts connexes de Rm sont très loin de se ressembler tous pour m > 1. Théorème. Soit (fn ) une suite de fonctions de classe C 1 sur un ouvert connexe X ⊂ Rm , à valeurs dans un espace normé complet Y et possédant les deux propriétés suivantes : i) Il existe a ∈ X tel que la suite fn (a) converge vers un f (a) ∈ Y . ii) Pour tout j ∈ {1, · · · , m}, la suite (∂j fn |K ) converge uniformément quel que soit le compact K ⊂ X (en particulier, (∂j fn ) converge simplement et a pour limite une fonction continue gj ). Alors (fn ) converge simplement vers une fonction f : X → Y de classe C 1 telle que ∂j f = gj pour tout j ; en outre, la convergence de la suite (fn |K ) vers (f |K ) est uniforme quel que soit le compact K ⊂ X. Démonstration. Pour tout x ∈ X et tout arc γ de classe C ∞ joignant a à x dans X, l’image γ([0, 1]) est compacte. Notre hypothèse entraı̂ne donc en particulier que les suites (∂1 fn ) ◦ γ, . . . , (∂m fn ) ◦ γ sont uniformément convergentes ; la suite (fn ◦ γ) vérifie donc les hypothèses du corollaire 1 p. 50 ; en particulier, (fn (x)) converge, d’où la convergence simple. La limite simple f de la suite (fn ) est de classe C 1 et admet pour dérivées partielles les gj : en effet, pour tout x ∈ X, 1 ≤ j ≤ n, il existe Tj > 0 tel qu’on ait [x, x + Tj ej ] ⊂ X ; la suite [0, Tj ] 3 t 7→ fn (x + tej ) vérifie les hypothèses du corollaire 1 p. 50, puisque fn (x) tend vers f (x) et que [0, Tj ] 3 t 7→ dtd fn (x+tej ) = ∂j fn (x+tej ) converge uniformément vers [0, Tj ] 3 t 7→ gj (x + tej ) ; par conséquent, [0, Tj ] 3 t 7→ f (x + tej ) est C 1 et a pour dérivée gj (x) en t = 0, d’où le résultat cherché. Reste à prouver que la convergence de (fn ) vers f est uniforme sur tout compact K ⊂ X. Comme K est contenu dans la réunion d’un nombre fini de boules fermées Br (y) = {x ∈ Rm : |x − y|∞ ≤ r} contenues dans X (en prenant donc sur Rm la norme `∞ ), il suffit de montrer que la convergence est uniforme sur chacune d’entre elles ; or, 17Voir par exemple la référence citée. 54 MARC CHAPERON pour chaque x = (x1 , · · · , xm ) ∈ Br (y), on a Z 1 m X j j (∂j fn − gj )(y + t(x − y))dt (x − y ) |fn (x) − f (x)| = 0 j=0 ≤ |x − y|∞ m X j=0 max |(∂j fn − gj )(z)| , z∈Br (y) qui tend vers 0 quand n → ∞, les boules fermées étant compactes. Corollaire. Soit (fn ) une suite de fonctions C k , 1 ≤ k < ∞, sur un ouvert connexe X ⊂ Rm , à valeurs dans un espace normé complet Y et possédant les deux propriétés suivantes : i) Pour tout multi-indice β ∈ Nn avec |β|1 < k, il existe aβ ∈ X tel que la suite ∂ β fn (aβ ) soit convergente. ii) Pour tout multi-indice α ∈ Nn avec |α|1 = k, la suite (∂ α fn |K ) converge uniformément quel que soit le compact K ⊂ X (en particulier, (∂ α fn ) converge simplement et a pour limite une fonction continue gα ). Alors (fn ) converge simplement vers une fonction f : X → Y de classe C k telle que ∂ α f = gα pour tout multi-indice α ∈ Nn avec |α|1 = k ; en outre, la convergence de la suite (∂ β fn |K ) vers (∂ β f |K ) est uniforme quels que soient le multi-indice β avec |β|1 < k et le compact K ⊂ X. Démonstration. Si k = 1, c’est le théorème précédent ; sinon, on peut supposer qu’il est vrai pour k − 1, l’appliquer aux ∂j f et conclure en l’appliquant à f . Définition. Sous les hypothèses du corollaire, on dit que (fn ) converge vers f au sens C k , et au sens C ∞ si c’est le cas pour tout k. Annexe H. Distributions sur le cercle Les notations sont celles de la section 15. L’espace P (T)∗ . C’est le dual algébrique de l’espace vectoriel complexe P (T), c’est-à-dire l’espace vectoriel complexe des applications C–linéaires de P (T) dans C ; pour T ∈ P (T)∗ et ϕ ∈ P (T), on notera < T, ϕ >:= T (ϕ). On définit un plongement linéaire f 7→ Tf de C(T) dans P (T)∗ par Z 1 X < Tf , ϕ >= f (t)ϕ(t) dt =< f |ϕ >2 = fbm ϕ b−m . 0 On identifiera souvent Tf à f . m∈Z ANALYSE DE HILBERT ET DE FOURIER, VI 55 La transformation de Fourier. Définissons le coefficient de Fourier d’ordre m de T ∈ P (T)∗ par Tbm =< T, e−m > (ce qui donne le même pour Tf que pour f ). L’application T 7→ Tb := (Tbm )m∈Z est un isomorphisme de P (T)∗ sur l’espace vectoriel CZ , appelé transformation de Fourier, et l’on a X (36) < T, ϕ >= Tbm ϕ b−m m∈Z pour T ∈ P (T)∗ et ϕ ∈ P (T). Espaces de Sobolev et distributions. On voit donc que P (T)∗ s’identifie à l’espace vectoriel de toutes les séries de Fourier. L’espace de Hilbert H s (T) de la section 15 est le sous-espace de P (T)∗ formé donc 2 P (1 + m2 )s Tbm < ∞. Pour s > 1/2, il s’identifie des T tels que m∈Z donc par le plongement g 7→ Tg à un sous-espace de C(T). Les H s (T) formant une famille décroissante (par rapport à s) de sous-espaces vectoriels de P (T)∗ , leur réunion est aussi un sous-espace vectoriel, noté D0 (T) et dont les éléments sont les distributions sur le cercle. Il est clair que T ∈ P (T)∗ appartient à D0 (T) si et seulement s’il existe un réel α tel que la famille (|m|α Tbm )m6=0 soit bornée. Les espaces H s (T) comme complétés. Pour tout réel s, l’inclusion naturelle f 7→ Tf identifie P (T) au sous-espace de H s (T) formé des T tels que Tbm = 0 sauf pour un nombre fini d’indices m, et ce sous-espace est dense18 pour la norme H s ; en termes concis, P (T) est dense dans H s (T). C’est donc a fortiori le cas de H t (T) pour t > s. Les distributions comme opérateurs sur les espaces de Sobolev. Pour tout réel s et tout T ∈ H −s (T), (36) s’écrit X 2 −s/2 b < T, ϕ >= (1 + m ) Tm (1 + m2 )s/2 ϕ b−m , ϕ ∈ P (T) m∈Z et l’inégalité de Cauchy-Schwarz donne donc | < T, ϕ > | ≤ |T |H −s |ϕ|H s ; en d’autres termes, la forme linéaire T sur P (T) est continue pour la norme H s ; elle s’étend donc en une unique forme linéaire continue (encore notée T ) sur H s (T), de norme |T |H −s . Inversement, si T ∈ P (T)∗ est continue pour la norme H s , on a forcément T ∈ H −s (T). 18Son s image par l’isométrie T 7→ (1 + m2 ) 2 Tbm de H s (T) sur `2 (Z) est le m∈Z sous-espace engendré par les vecteurs de la base hilbertienne canonique. 56 MARC CHAPERON Démonstration. Appliquons (36) à la suite de polynômes trigonométriques ϕ = ϕ(k) définis par ( 2 −s b d = (1 + m ) T−m pour |m| ≤ k, ϕ(k) m 0 sinon. la continuité de T s’exprime par l’existence d’une constante C ≤ 0 telle que | < T, ϕ(k) > | ≤ C|ϕ(k)|H s pour tout k ; si T n’est pas nulle, cela s’écrit s 2 2 X X 2 −s b (1 + m2 )−s Tbm 0< (1 + m ) Tm ≤ C |m|≤k |m|≤k pour k assez grand, d’où à la limite |T |H −s ≤ C. En résumé, pour tout réel s, H −s (T) est le dual de H s (T), c’està-dire que (36) vaut pour T ∈ H −s (T) et ϕ ∈ H s (T). En particulier, L2 (T) := H 0 (T) est son propre dual, et toute distribution est une forme linéaire continue sur H s (T) pour s assez grand. Commentaire. Pour s > 1/2, nous avons vu que les éléments de H s (T) étaient des fonctions continues. Pour s ≥ 0, ce sont des (classes de) fonctions mesurables périodiques d’après la théorie de Lebesgue. Pour s < 0, ce sont des opérateurs, auxquels nous pourrons néanmoins généraliser les opérations du calcul différentiel. Digression : transposée d’une application linéaire. Soit L une application linéaire d’un espace vectoriel E dans un espace vectoriel F , et soient E ∗ et F ∗ les duaux (algébriques) de ces espaces ; la transposée de L est l’application t L : F ∗ → E ∗ définie par t L(A) = A ◦ L. Lorsque E et F sont normés et que L est continue, la restriction de t L au dual topologique F 0 de F est une application linéaire continue à valeurs dans F 0 (en vertu de l’inégalité |A ◦ L| ≤ |A| |L|), qui est injective si et seulement si L(E) est dense dans F . Dans le cas particulier où L est l’inclusion de E comme sous-espace dense dans F (sa continuité signifiant que la norme donnée sur E est plus fine que la restriction de celle de F ), t L : F 0 → E 0 (qui n’est autre que l’application restriction A 7→ A|E ) est donc une injection linéaire continue, autrement dit une inclusion qui va en sens inverse de l’inclusion E ⊂ F . Ce phénomène est visible dans le paragraphe précédent, puisqu’on a H s ⊂ H t et H −t ⊂ H −s pour s > t. Distributions comme opérateurs sur les C k (T). Pour k ∈ N et s > 1/2, les inclusions H s+k (T) ⊂ C k (T) ⊂ H k (T), continues et d’image dense, donnent par transposition d’après 6.6 des inclusions H k (T)0 ⊂ C k (T)0 ⊂ H s+k (T)0 , bref H −k (T) ⊂ C k (T)0 ⊂ H −(s+k) (T). ANALYSE DE HILBERT ET DE FOURIER, VI 57 Toute distribution T ∈ D0 (T) appartient donc à C k (T)0 pour k assez grand ; le plus petit de ces k est l’ordre de la distribution T . Par exemple, la masse de Dirac δ : ϕ 7→ ϕ(0) en 0 ∈ T est une distribution d’ordre 0, ou mesure de Radon. Remarque. L’avantage de notre premier point de vue est que les H s (T) sont des espaces de Hilbert, d’une structure beaucoup plus simple et maniable que les espaces de Banach plus généraux. En outre, pour k < ∞, il est impossible de caractériser simplement les transformées de Fourier d’éléments de C k (T), alors qu’une telle caractérisation constitue la définition même de H s (T). Enfin, on a le Théorème . Pour s > 1/2, H s (T) est une algèbre normée pour la multiplication, c’est-à-dire que la fonction continue ϕψ appartient à H s (T) quelles que soient ϕ, ψ ∈ H s (T), et qu’en outre l’application bilinéaire (ϕ, ψ) 7→ ϕψ de H s (T) dans lui-même est continue. Démonstration. Il suffit de montrer l’existence d’une constante C ≥ 0 telle qu’on ait |ϕψ|H s ≤ C |ϕ|H s |ψ|H s quels que soient les polynômes trigonométriques ϕ, ψ ; en effet, si ϕ, ψ ∈ H s (T) sont respectivement limites de suites (ϕk ), (ψk ) de polynômes trigonométriques pour la norme H s , la suite (ϕk ψk ) sera une suite de Cauchy dans H s (T), donc y aura une limite ; celle-ci sera forcément ϕψ, car pour la norme de la convergence uniforme (moins fine que la norme H s ), ϕk → ϕ et ψk → ψ, donc ϕk ψk → ϕψ. Soient donc ϕ, ψ ∈ P (T) ; en effectuant la multiplication [ =P ϕ b de ϕ et ψ, on voit que (ϕψ) m p bp ψm−p , d’où !2 |ϕψ|2H s X X [ |2 ≤ = (1 + m2 )s |(ϕψ) (1 + m2 )s m m m X |ϕ bp | |ψbm−p | ; p comme il existe c > 0 telle qu’on ait (1 + m2 )s/2 ≤ c[(1 + p2 )s/2 + (1 + (m − p)2 )s/2 ] pour m, p ∈ Z (exercice), on en déduit s |ϕψ |H s ≤ c XX m ≤ c (1 + p ) 2 2 s/2 b b |ϕ bp | |ψm−p | + |ϕ bp | (1 + (m − p) ) |ψm−p | p s XX m 2 s/2 p s X X 2 2 s s (1 + p2 ) 2 |ϕ bp | |ψbm−p | + |ϕ bp | (1 + (m − p)2 ) 2 |ψbm−p | m p 58 MARC CHAPERON par l’inégalité triangulaire. Majorons la seconde racine carrée : ! 2 X X s |ϕ bp | (1 + (m − p)2 ) 2 |ψbm−p | = m p X s s bq | (1 + (m − q)2 ) 2 |ψbm−q | = |ϕ bp | (1 + (m − p)2 ) 2 |ψbm−p | |ϕ m,p,q X X s s = |ϕ bp | |ϕ bq | (1 + (m − p)2 ) 2 |ψbm−p | (1 + (m − q)2 ) 2 |ψbm−q | = p,q m d’où, par l’inégalité de Cauchy-Schwarz, X m ! 2 |ϕ bp | (1 + (m − p)2 ) |ψbm−p | ≤ p s s X X X (1 + (m − p)2 )s |ψbm−p |2 (1 + (m − q)2 )s |ψbm−q |2 = |ϕ bp | |ϕ bq | ≤ X s 2 m p,q m !2 ≤ X X |ϕ bp | |ϕ bq | |ψ|2H s = p,q |ϕ bp | |ψ|2H s ; p comme on obtient la même majoration pour la première racine carrée (en échangeant les rôles de ϕ et ψ) et que l’on a, par Cauchy-Schwarz, ! 21 X X X −s s bp | ≤ (1 + p2 )−s |ϕ bp | = (1 + p2 ) 2 (1 + p2 ) 2 |ϕ |ϕ|H s , p p p on en déduit finalement bien l’inégalité ! 12 |ϕψ|H s ≤ 2c X (1 + p2 )−s |ϕ|H s |ψ|H s . p Remarque importante. Ce théorème est résolument faux pour s < 1/2 : une des rares choses que l’on ne puisse pas faire en général avec des distributions est de les multiplier. Dérivation des distributions. On sait que, pour ϕ ∈ C 1 (T) la série de Fourier de ϕ0 s’obtient par dérivation terme à terme de celle de ϕ ; il est donc raisonnable, pour chaque T ∈ P (T)∗ de définir sa dérivée d0 ) = 2πimTbm . T 0 par la formule (T m Si T est une distribution, il en va de même de T 0 , qui est dans H s−1 (T) si et seulement si T ∈ H s (T). D’après (36), on a (37) < T 0 , ϕ >= − < T, ϕ0 > ANALYSE DE HILBERT ET DE FOURIER, VI 59 pour toute « fonction d’essai » ϕ (dans P (T) ou, pour T ∈ D0 (T), dans C ∞ (T)), ce qui est usuellement pris pour définition (« la dérivation des distributions est l’opposé de la transposée de la dérivation des fonctions »). Remarque. L’équation T 0 = 0 a les mêmes solutions dans P (T)∗ que dans C ∞ (T). Toute S ∈ D0 (T) est la somme d’une constante et de la dérivée j–ième au sens des distributions d’une fonction continue f . En effet, supposons S ∈ H s (T) ; pour tout j ∈ N, il existe une unique T ∈ P (T)∗ telle que Tb0 = 0 et T (j) = S − Sb0 , et on a T ∈ H s+j (T) car Tbm = (2πim)−j Sbm pour m 6= 0. Il suffit donc de choisir j > −s + 1/2 pour que cette distribution T soit une fonction continue f . Multiplication d’une distribution par une fonction. Pour chaque f dans C k (T), k ∈ N (resp. H s (T), s > 1/2) l’application linéaire ϕ 7→ f ϕ de C k (T) (resp. H s (T)) dans lui-même est continue ; sa transposée est donc une endomorphisme continu de C k (T)0 (resp. H −s (T)), appelé multiplication par f et noté T 7→ f T . La distribution f T est donc définie par ce que (38) < f T, ϕ >=< T, f ϕ > pour toute fonction d’essai ϕ. Puisqu’on peut multiplier une distribution d’ordre k par une fonction C k , on peut toujours multiplier une distribution par une fonction C ∞ . De (38), (37) et de la formule de Leibniz pour les fonctions, on déduit la formule de Leibniz k X k (k) (f T ) = f (j) T (k−j) , j j=0 valide lorsque T est d’ordre k et f de classe C k . Images directes de distributions. Si F : R → R est de la forme t 7→ pt + g(t) avec p ∈ Z et g ∈ C k (T) (c’est-à-dire définit une application C k du cercle T = R/Z dans lui-même), l’application F ∗ : ϕ 7→ ϕ ◦ F (image inverse par F ) est linéaire et continue de C k (T) dans lui-même. Sa transposée F∗ : C k (T)0 → C k (T)0 s’appelle image directe par F ; elle est donc définie par ce que (39) < F∗ T, ϕ >=< T, ϕ ◦ F > pour toute fonction d’essai ϕ et toute distribution T d’ordre k. En particulier, si F est C ∞ , on peut définir F∗ T pour toute distribution T. 60 MARC CHAPERON Remarques. Lorsque F définit un difféomorphisme de T sur lui-même (ce qui signifie que p = ±1 et que F 0 ne s’annule pas), F −1 est du même type que F et l’on peut donc définir l’image inverse par F comme étant l’image directe par F −1 . −2πmiα b \ Si F est la translation t 7→ t + α, on a (F Tm d’après ∗ T )m = e d b (39), mais il faut savoir que le lien entre F∗ T et T est loin d’être aussi simple en général : c’est une des difficultés de l’analyse de Fourier. Convolution des distributions. Pour ϕ, ψ ∈ P (T), rappelons que \ (ϕ ∗ ψ)m = ϕ bm ψbm . Cette formule garde un sens pour ϕ, ψ ∈ P (T)∗ : le produit de convolution ∗ ainsi défini est une application bilinéaire de P (T)∗ × P (T)∗ dans P (T)∗ , et son élément neutre est la masse de Dirac δ, puisque δbm = 1 pour tout m. La convolée de deux distributions est une distribution ; plus précisément, pour S ∈ H s (T) et T ∈ H t (T), on a S ∗ T ∈ H s+t (T) et |S ∗ T |s+t,2 ≤ |S|H s |T |t,2 (exercice facile) ; en particulier, quelles que soient ϕ ∈ C ∞ (T) et T ∈ D0 (T), on a ϕ ∗ T ∈ C ∞ (T).