Université Pierre & Marie Curie (Paris 6) Licence de Mathématiques L3 UE 3M263 Intégration Année 2016–2017 Théorie de la Mesure et Intégration François Bolley et Romain Dujardin Notes de cours d’Amaury Lambert Table des matières 1 Suites, ensembles 1.1 La droite achevée . . . . . . . . . . . . 1.2 Suites et séries numériques . . . . . . . 1.3 Ensembles . . . . . . . . . . . . . . . . 1.3.1 Opérations classiques . . . . . . 1.3.2 Suites de parties d’un ensemble 1.3.3 Fonctions indicatrices . . . . . . 1.3.4 Fonctions et ensembles . . . . . 1.3.5 Cardinaux, équipotence . . . . 1.3.6 Dénombrabilité . . . . . . . . . . . . . . . . . . 4 4 4 5 6 6 7 8 9 9 2 Tribus 2.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Tribu engendrée. Tribu borélienne sur R . . . . . . . . . . . . . . . . . . 2.3 Tribus image et image réciproque . . . . . . . . . . . . . . . . . . . . . . 12 12 13 14 3 Tribu borélienne sur un espace topologique 3.1 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Tribu borélienne et fonctions boréliennes . . . . . . . . . . . . 3.3 Complément hors programme : l’ensemble triadique de Cantor 3.4 Complément hors programme : une partie de R non borélienne . . . . . . . . . . . . . . . . . . . . . . . . 16 16 18 19 20 4 Mesures 4.1 Définitions et propriétés . . . . . . . . 4.2 Mesure de Lebesgue . . . . . . . . . . . 4.3 Théorème de la classe monotone . . . . 4.3.1 Classe monotone . . . . . . . . 4.3.2 Théorème de la classe monotone 4.3.3 Applications . . . . . . . . . . . 4.4 Théorème de Caratheodory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 22 26 27 27 28 30 31 5 Applications mesurables 5.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Exemples et opérations stables pour la mesurabilité . . . . . . . . . . . . 33 33 33 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . et corollaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 5.3 5.4 3 Applications boréliennes entre espaces topologiques . . . . . . . . . . . . Fonctions étagées, en escalier . . . . . . . . . . . . . . . . . . . . . . . . . 34 35 6 Intégrale des fonctions positives 6.1 Intégrale des fonctions étagées positives . . . . . . . . . . . . . . . . . . . 6.2 Intégrale des fonctions mesurables positives . . . . . . . . . . . . . . . . . 38 38 40 7 Intégrale des fonctions de signe quelconque 7.1 Intégrale des fonctions mesurables de signe quelconque . . . . . . . . . . 7.2 Le théorème de convergence dominée de Lebesgue . . . . . . . . . . . . . 7.3 Intégrale des fonctions à valeurs complexes . . . . . . . . . . . . . . . . . 46 46 48 48 8 Applications 8.1 Intégrale de Lebesgue et intégrale de Riemann 8.2 Dérivées et primitives . . . . . . . . . . . . . . 8.3 Intégrales dépendant d’un paramètre . . . . . 8.4 Applications . . . . . . . . . . . . . . . . . . . 8.4.1 Dérivation sous le signe somme . . . . 8.4.2 Convolution . . . . . . . . . . . . . . . 8.4.3 Transformée de Fourier . . . . . . . . . . . . . . . . 50 50 52 54 55 55 56 56 . . . . . . 57 57 57 59 60 61 63 10 Mesure image et changement de variable 10.1 Mesure image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Formule du changement de variable . . . . . . . . . . . . . . . . . . . . . 66 66 69 9 Tribu produit et mesure produit 9.1 Tribu produit . . . . . . . . . . 9.1.1 Cas général . . . . . . . 9.1.2 Le cas borélien . . . . . 9.1.3 Sections . . . . . . . . . 9.2 Mesure produit . . . . . . . . . 9.3 Théorèmes de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chapitre 1 Suites, ensembles 1.1 La droite achevée Définition 1.1 On appelle droite achevée l’ensemble R̄ := R ∪ {−∞} ∪ {+∞}. On considérera toujours la droite achevée comme l’espace métrique associé à une distance du type d(x, y) := |f (x) − f (y)| où f (x) = √xx2 +1 si x ∈ R et f (±∞) = ±1. Autrement dit, R̄ est muni de la topologie usuelle de R, complétée avec les notions usuelles de convergence vers +∞ et vers −∞. La droite achevée est munie d’un ordre total : pour tous x ≤ y ∈ R, −∞ < x ≤ y < +∞. La droite achevée est également munie des opérations algébriques usuelles, avec les conventions suivantes : +∞ + ∞ = +∞, −∞ − ∞ = −∞, a + ∞ = +∞, a − ∞ = −∞, pour tout a ∈ R, ainsi que 0 × ∞ = 0, et a ∈]0, ∞] ⇒ a × ∞ = +∞, a ∈ [−∞, 0[ ⇒ a × ∞ = −∞. Remarque 1.2 Tout au long de ce cours, il faudra acquérir le réflexe de ne jamais écrire les opérations interdites (+∞) − (+∞), (−∞) − (−∞) et (±∞)/(±∞). 1.2 Suites et séries numériques Une suite numérique est une suite à valeurs dans R ou dans R̄. Définition 1.3 On dit que a ∈ R̄ est une valeur d’adhérence de la suite (un ) s’il existe une suite extraite (uϕ(n) ) qui converge vers a. 4 CHAPITRE 1. SUITES, ENSEMBLES 5 Exemple 1.4 Les valeurs d’adhérence de la suite (cos(πn/2)) sont −1, 0 et 1. Celles de la suite ((−1)n + n1 ) sont −1 et +1. Notation 1.5 (importante) Lorsqu’une suite (un ) est croissante (resp. décroissante), on notera souvent limn ↑ un (resp. limn ↓ un ) sa limite, pour rappeler que la suite est monotone, et surtout pour indiquer que cette limite existe donc toujours (dans R̄). Définition 1.6 La borne supérieure (∈ R̄) de l’ensemble des valeurs d’adhérence de la suite (un ) est aussi une valeur d’adhérence de (un ). On la note lim un ou lim sup un . n→∞ n→∞ C’est donc la plus grande valeur d’adhérence de (un ) et elle vérifie lim un = lim ↓ (sup uk ) = inf (sup uk ). n n k≥n n k≥n De même, la plus petite valeur d’adhérence de (un ) est notée lim un ou lim inf un , etc. n→∞ n→∞ Définition 1.7 On dit que la série Pn de terme général (un ) est absolument convergente si la suite des sommes partielles ( k=0 |uk |)n converge dans R, ce que l’on note également P n |un | < ∞. Théorème 1.8 Si la série de terme général (un ) est absolument convergente, alors elle Pn est convergente, c’est-à-dire que la suite des sommes partielles ( k=0 uk )n converge dans R. Proposition 1.9 La somme de la série de terme général un ≥ 0 (c’est-à-dire la limite de la suite des sommes partielles, qui existe toujours dans R̄+ ) ne dépend pas de l’ordre de sommation. Soit une bijection ϕ : N −→ N. On veut montrer que la suite Sn0 := P n n k=0 uϕ(k) a même limite dans R̄+ que Sn := k=0 uk . P Soit n ≥ 0 et N := max{ϕ(0), . . . , ϕ(n)}. Alors Sn0 = uϕ(0) + · · · + uϕ(n) ≤ N j=0 uj = 0 0 SN , donc Sn ≤ SN ≤ S∞ . Faisant tendre n → ∞ on obtient S∞ ≤ S∞ . L’inégalité opposée s’obtient par symétrie. 2 Démonstration. P 1.3 Ensembles Soit E un ensemble. — A ⊆ E sera appelé sous-ensemble ou partie de E ; — on note P(E) la famille (l’ensemble) des parties de E ; — A ⊆ P(E) sera appelé famille de parties de E ou classe de parties de E ; — nous serons amenés à considérer des ensembles de familles de parties, que l’on appellera alors collections de familles de parties de E. CHAPITRE 1. SUITES, ENSEMBLES 1.3.1 6 Opérations classiques Soient A1 et A2 deux parties d’un ensemble E. — La réunion de A1 et A2 , notée A1 ∪ A2 : ∀x ∈ E, x ∈ A1 ∪ A2 ⇔ ∃i ∈ {1, 2}, x ∈ Ai — L’intersection de A1 et A2 , notée A1 ∩ A2 : ∀x ∈ E, x ∈ A1 ∩ A2 ⇔ ∀i ∈ {1, 2}, x ∈ Ai — Le complémentaire de A1 , noté cA1 : ∀x ∈ E, x ∈ cA1 ⇔ x ∈ / A1 — La différence de A1 avec A2 , notée A1 \ A2 et dite différence propre dans le cas où A2 ⊆ A1 : ∀x ∈ E, x ∈ A1 \ A2 ⇔ x ∈ A1 et x ∈ / A2 — La différence symétrique de A1 et A2 , notée A1 ∆A2 : ∀x ∈ E, x ∈ A1 ∆A2 ⇔ x ∈ A1 ∪ A2 et x ∈ / A1 ∩ A2 . Remarque 1.10 Remarquer l’association de la réunion avec le quantificateur « ∃ », de l’intersection avec le quantificateur « ∀ », ainsi que l’association du passage au complémentaire avec la négation et de l’inclusion avec l’implication : A1 ⊆ A2 ssi ∀x ∈ E, x ∈ A1 ⇒ x ∈ A2 . Exercice 1.11 Montrer les identités suivantes : c (A1 ∪ A2 ) = cA1 ∩ cA2 c (A1 ∩ A2 ) = cA1 ∪ cA2 A1 \ A2 = A1 ∩ cA2 A1 ∆A2 = (A1 ∪ A2 ) \ (A1 ∩ A2 ) = (A1 \ A2 ) ∪ (A2 \ A1 ). 1.3.2 Suites de parties d’un ensemble Soit (An ) une suite de parties de E. Définition 1.12 La suite (An ) est dite croissante (resp. décroissante) lorsque pour tout entier n, An ⊆ An+1 (resp. An+1 ⊆ An ). Dans ce cas, la limite de la suite (An ) est définie naturellement comme la réunion (resp. l’ intersection) de tous les An : [ \ lim An := An (resp. An ). n→∞ n n Par analogie avec le cas réel, on notera cette limite lim ↑ (resp. lim ↓) pour faire référence au fait que la suite (An ) est croissante et que la limite est donc la réunion (resp. l’intersection) de tous ses éléments. CHAPITRE 1. SUITES, ENSEMBLES 7 Définition 1.13 On définit les deux parties de E suivantes : [ \[ lim sup An (ou lim An ) := lim ↓ Ak = Ak , n→∞ n→∞ n→∞ n k≥n k≥n où la notation lim ↓ fait référence au fait que la suite A est décroissante, si k k≥n n bien que sa limite existe toujours (et est l’intersection de tous ses éléments, ce qu’indique la dernière égalité) ; \ [\ Ak = Ak , lim inf An (ou lim An ) := lim ↑ S n→∞ n→∞ n→∞ n k≥n k≥n où la notation lim ↑ fait référence au fait que la suite A est croissante, si bien k k≥n n que sa limite existe toujours (et est la réunion de tous ses éléments, ce qu’indique la dernière égalité). T Remarque 1.14 On peut aussi caractériser la limite supérieure et la limite inférieure par les assertions suivantes : pour tout x ∈ E, x ∈ lim sup An ⇔ ∀n ∃k ≥ n, x ∈ Ak ⇔ {n : x ∈ An } est infini. n→∞ x ∈ lim inf An ⇔ ∃n ∀k ≥ n, x ∈ Ak ⇔ {n : x ∈ / An } est fini. n→∞ Noter que lim inf n An ⊆ lim supn An . Définition 1.15 On dit que la suite (An ) converge si lim inf n An = lim supn An . Lorsque c’est le cas on définit limn An := lim inf n An = lim supn An . Remarque 1.16 La limite A d’une suite (An ) convergente est caractérisée par : ∀x ∈ A ∃n0 ∀n ≥ n0 x ∈ An ∀x ∈ / A ∃n1 ∀n ≥ n1 x ∈ / An . Exercice 1.17 Montrer les égalités lim sup cAn = c (lim inf An ) n n c lim inf An = c n 1.3.3 (lim sup An ). n Fonctions indicatrices Définition 1.18 On appelle indicatrice ou fonction indicatrice de la partie A la fonction 1A : E −→ {0, 1} x 7−→ 0 1 si si x∈ /A x ∈ A. Remarque 1.19 Noter que 1cA = 1 − 1A . Proposition 1.20 Au sens de la convergence simple, lim 1An = 1lim A n n n et lim 1An = 1limn An . n CHAPITRE 1. SUITES, ENSEMBLES 8 Pour tout x ∈ E, Dém. lim 1An (x) = 1 ⇔ ∀n ∃k ≥ n, 1Ak (x) = 1 ⇔ ∀n ∃k ≥ n, x ∈ Ak n ⇔ x ∈ lim An n ⇔ 1lim A (x) = 1. n n L’autre assertion se démontre de la même manière, ou en se servant de l’assertion précédente : lim 1An = lim(1 − 1cAn ) = 1 − lim 1cAn = 1 − 1lim n n n n cA n = 1 − 1c(limn An ) = 1limn An , 2 ce qui achève la démonstration. Remarque 1.21 Conséquence de cette proposition : la suite de parties (An ) converge ssi la suite de fonctions (1An ) converge simplement (et lorsque c’est le cas, la convergence a lieu vers 1limn An ). 1.3.4 Fonctions et ensembles Définition 1.22 Soient E, F deux ensembles et f : E −→ F . — pour tout A ⊆ E, on note f (A) l’ image directe de A par f : f (A) := {y ∈ F : ∃x ∈ A, f (x) = y}. — pour tout B ⊆ F , on note f −1 (B) l’ image réciproque de B par f : f −1 (B) := {x ∈ E : f (x) ∈ B}. Remarque 1.23 La notation f −1 (B) ne fera que très rarement, sinon jamais, référence à l’application inverse ou réciproque de l’application f dans les cas où elle serait par hasard bijective. Néanmoins, noter la cohérence de ces notations, au sens où si f est bijective, alors on a bien égalité entre l’image réciproque f −1 (B) de B par f et l’image directe f −1 (B) de B par l’inverse f −1 de f . Exercice 1.24 Montrer les formules de Hausdorff (cf feuille de TD) : pour tous I et J ensembles d’indices non vides, pour toutes familles (Ai )i∈I de parties de E et (Bj )j∈J de parties de F , tout B ⊆ F et toute fonction f : E −→ F , ! [ [ f Ai = f (Ai ), i i ! f \ Ai ⊆ i avec égalité si f est injective ; ! [ [ Bj = f −1 (Bj ), f −1 j j \ f (Ai ) i ! f −1 \ j Bj = \ j f −1 (Bj ), c f −1 (B) = f −1 (cB) . CHAPITRE 1. SUITES, ENSEMBLES 1.3.5 9 Cardinaux, équipotence Définition 1.25 Deux ensembles E et F sont dits équipotents, ou avoir même cardinal, ou encore même puissance, s’il existe une bijection de l’un sur l’autre. On note alors Card(E) = Card(F ). Définition 1.26 On notera Card(E) ≤ Card(F ) s’il existe une injection de E dans F , c’est-à-dire si E a même cardinal qu’une partie de F . Si de plus E et F n’ont pas même cardinal, on notera Card(E) < Card(F ). Exemple 1.27 — L’ensemble P(E) et l’ensemble {0, 1}E des applications : E −→ {0, 1} sont équipotents car l’application A 7→ 1A est une bijection de l’un sur l’autre ; — les ensembles N et 2N (entiers pairs) sont équipotents car l’application n 7→ 2n est une bijection de l’un sur l’autre ; — les ensembles N et N × N sont équipotents car on peut bien énumérer de manière injective les couples d’entiers (par exemple en suivant les points des droites d’équation y = −x + c, lorsque c croît dans N) ; — par récurrence, N est équipotent avec tous les produits cartésiens Np (p ∈ N? ). Théorème 1.28 (théorème de Cantor–Bernstein, admis) Si Card(E1 ) ≤ Card(E2 ) et Card(E2 ) ≤ Card(E1 ), alors Card(E1 ) = Card(E2 ). Proposition 1.29 Card(E) < Card(P(E)). D’une part il existe une injection de E dans P(E), par exemple celle qui à x associe {x}. Soit d’autre part f : E → P(E) et montrons que f ne peut être surjective (et donc ne peut être bijective). Soit pour cela Dém. Ω := {x ∈ E : x ∈ / f (x)}. Montrons que par l’absurde que Ω ne peut avoir d’antécédent par f . S’il existe z ∈ E tel que f (z) = Ω alors — soit z ∈ Ω, et alors z ∈ / f (z), c’est-à-dire z ∈ / Ω; — soit z ∈ / Ω, et alors z ∈ f (z), c’est-à-dire z ∈ Ω, ce qui constitue une contradiction. 2 1.3.6 Dénombrabilité Définition 1.30 E est dit dénombrable (ou : au plus dénombrable) si Card(E) ≤ Card(N). E est dit non dénombrable si Card(E) > Card(N). Proposition 1.31 Les ensembles Z, Np (p ∈ N? ) et Q sont dénombrables. CHAPITRE 1. SUITES, ENSEMBLES Dém. 10 On a déjà vu que Np était équipotent à N. Pour ce qui est de Z, la fonction f : Z −→ N −2n n 7−→ 2n − 1 si si n≤0 n>0 est une bijection. Enfin, rappelons que pour tout x ∈ Q? , il existe un unique couple (p, q) ∈ Z? × N? tel que x = p/q et p ∧ q = 1. Ainsi la fonction qui à 0 associe (0, 1) et qui est définie sur Q? par f : Q? −→ Z × N? p/q 7−→ (p, q) est une injection de Q dans Z × N? , donc Card(Q) ≤ Card(Z × N? ). Or il existe une injection g : Z → N, donc l’application qui à (x, y) associe (g(x), y) est une injection de Z × N? dans N2 , ce qui montre que Card(Z × N? ) ≤ Card(N2 ) = Card(N). Donc Card(Q) ≤ Card(N). 2 Proposition 1.32 Toute réunion dénombrable d’ensembles dénombrables est dénombrable. S Soit E = n∈N En , où pour tout n ∈ N, En est dénombrable. Alors par définition, pour tout n ∈ N il existe une injection ϕn : En → N. Pour tout x ∈ E on définit alors Dém. N (x) := min{n ≥ 0 : x ∈ En } < ∞. Alors la fonction φ : E −→ N2 x 7−→ (N (x), ϕN (x) (x)) est une injection car pour tous x, y ∈ E tels que φ(x) = φ(y), on a N (x) = N (y) =: n puis ϕN (x) (x) = ϕN (y) (y), c’est-à-dire ϕn (x) = ϕn (y), donc x = y, puisque ϕn est injective. Par conséquent, Card(E) ≤ Card(N2 ) = Card(N). 2 Proposition 1.33 Tout produit cartésien fini d’ensembles dénombrables est dénombrable. Pour i = 1, . . . , n, soit Ei dénombrable et une injection ϕi : Ei → N. Alors la fonction Dém. φ: Πni=1 Ei −→ Nn (x1 , . . . , xn ) 7−→ (ϕ1 (x1 ), . . . , ϕn (xn )) est injective donc Card(Πi Ei ) ≤ Card(Nn ) = Card(N). 2 Proposition 1.34 Un produit cartésien infini dénombrable d’ensembles non vides (même finis) est non dénombrable dès qu’une infinité d’entre eux ne sont pas réduits à un singleton. CHAPITRE 1. SUITES, ENSEMBLES 11 Admettons pour simplifier que pour tout i ∈ N, Card(Ei ) ≥ 2. Alors pour tout i, il existe une injection ϕi : {0, 1} → Ei . Donc l’application Dém. φ: {0, 1}N −→ E0 × E1 × · · · (x0 , x1 , . . .) 7−→ (ϕ0 (x0 ), ϕ1 (x1 ), . . .) est injective, donc Card(Πi Ei ) ≥ Card({0, 1}N ) = CardP(N) > Card(N). 2 Théorème 1.35 Les ensembles R et P(N) sont équipotents. Première étape : montrons que toute partie de R contenant un intervalle ouvert est équipotente à R. Soit A ⊆ R contenant un intervalle I qu’on écrira sous la forme I =]b − a, b + a[ : alors A s’injecte bien sûr dans R, mais R s’injecte aussi dans A par exemple par l’application Dém. φ : R −→ A x 7−→ a √ x +b x2 + 1 . Deuxième étape : montrons que Card(P(N)) ≤ Card([0, 1/2]). On sait d’après l’étape précédente que ce cardinal vaut Card(R). Soit l’application φ : {0, 1}N −→ [0, 1/2] X xn x = (xn ) 7−→ . 3n+1 n≥0 Montrons que φ est bien injective. Pour tous x 6= y, soit n := min{k ≥ 0 : xk 6= yk } < ∞. Alors x − y X xk − yk n n |φ(x) − φ(y)| = n+1 + 3 3k+1 k≥n+1 |xn − yn | X yk − xk ≥ − k+1 3n+1 3 k≥n+1 X 1 1 1 1 1 1 ≥ n+1 − = n+1 − n+2 = > 0, k+1 n+1 3 3 3 3 1 − 1/3 2 · 3 k≥n+1 ce qui prouve que φ(x) 6= φ(y). Troisième étape : montrons que Card({0, 1}N ) ≥ Card([0, 1[), ce qui équivaut à Card(P(N)) ≥ Card(R). Soit ψ : [0, 1[→ {0, 1}N l’application qui à x ∈ [0, 1[ associe son développement dyadique propre, c’est-à-dire la suite (xn ) de 0 et de 1 définie récursivement par x0 := [2x], et " !# n−1 X x k xn := 2n+1 x − . k+1 2 k=0 P xk On a x = k≥0 2k+1 . La fonction ψ est alors injective (car x = y si ψ(x) = ψ(y)). 2 Chapitre 2 Tribus 2.1 Définitions et exemples Définition 2.1 Une classe A de parties d’un ensemble E est appelée tribu ou σ-algèbre (sur E) si (i) elle contient E : E ∈ A ; (ii) elle est stable par passage au complémentaire : cA ∈ A pour tout A ⊆ E, A ∈ A ; (iii) elle est stable par réunion dénombrable : si (An ) est une famille dénombrable d’éléments de A , alors ∪n An ∈ A . On dit alors que (E, A ) est un espace mesurable. Remarque 2.2 Cette définition a quelques conséquences immédiates : — ∅ ∈ A car ∅ = cE ; — stabilité par intersection dénombrable car ∩n An = c(∪n cAn ) ; — stabilité par différence car A \ B = A ∩ cB ; — stabilité par différence symétrique car A∆B = (A \ B) ∪ (B \ A) ; — stabilité par limite supérieure car limn An = ∩n ∪k≥n Ak ; — stabilité par limite inférieure. Exercice 2.3 Il est équivalent de définir une tribu comme une classe A de parties de E vérifiant les propriétés suivantes : A contient ∅, est stable par passage au complémentaire et est stable par intersection dénombrable. Exemple 2.4 Quelques exemples de tribus : — {∅, E} est une tribu (parfois appelée la tribu grossière) ; — P(E) est une tribu (parfois appelée la tribu triviale) ; — si (An )n∈N est une partition de E dénombrable (finie ou infinie), alors A := {∪i∈I Ai : I ⊆ N} est une tribu sur E ; — si A ⊆ E, la plus petite (voir section suivante) tribu contenant A est {∅, E, A, cA} ; — enfin, A := {A ⊆ E : A ou cA est dénombrable} est une tribu, ce que nous démontrons ci-dessous. 12 CHAPITRE 2. TRIBUS 13 Nous démontrerons uniquement la stabilité par réunion dénombrable. Soient (An )n ∈ A . Alors — ou bien pour tout n, An est dénombrable et alors ∪n An est dénombrable ; — ou bien il existe n0 tel que An0 est non dénombrable, et alors cAn0 est dénombrable, donc ∩n cAn ⊆ cAn0 est dénombrable, et par conséquent ∪n An est de complémentaire ∩n cAn dénombrable ; Dans les deux cas ∪n An ∈ A . 2 Dém. 2.2 Tribu engendrée. Tribu borélienne sur R Proposition 2.5 (et définition) a) L’intersection d’une collection non vide quelconque 1 de tribus de parties de E est elle-même une tribu. b) Pour toute classe C de parties de E, l’intersection de toutes les tribus contenant 2 C est (donc 3 ) une tribu : elle est appelée la plus petite tribu contenant C , ou tribu engendrée par C , et notée σ(C ) : \ σ(C ) := A. A tribu,C ⊆A Remarque 2.6 — On rappelle que le terme collection désigne un ensemble de famille de parties ; — il faut garder à l’esprit que si A et B sont des familles de parties de E alors C ∈ A ∩ B ssi C ∈ A et C ∈ B (on n’intersecte pas ici les parties de E) ; — le terme de plus petite tribu n’a de sens qu’à la lumière de la définition précédente, car il n’existe pas d’ordre total sur les tribus. Remarque 2.7 — Pour toute classe B de parties de E, B ⊆ σ(B), par définition ; — si C est une classe de parties de E et A est une tribu de parties de E telle que C ⊆ A , alors A est élément de la collection des tribus contenant C , donc contient son intersection σ(C ), autrement dit σ(C ) ⊆ A ; — première conséquence : si A est une tribu de parties de E, alors σ(A ) = A ; — deuxième conséquence : si C ⊆ B alors B ⊆ σ(B) implique C ⊆ σ(B), et comme σ(B) est une tribu, σ(C ) ⊆ σ(B). Remarque 2.8 (méthodologie) — Si A est une tribu, pour montrer que A = σ(C ), on montre que A ⊆ σ(C ) et que C ⊆ A ; — pour montrer que σ(C1 ) = σ(C2 ), on montre que C1 ⊆ σ(C2 ) et que C2 ⊆ σ(C1 ). Définition 2.9 On note B(R), ou Bor(R), et on appelle tribu de Borel sur R la tribu engendrée par les intervalles ouverts de R. La tribu de Borel sur R̄ est l’ensemble des parties de R prenant l’une des formes A, A ∪ {+∞}, A ∪ {−∞} ou A ∪ {−∞, +∞}, où A ∈ Bor(R). Proposition 2.10 Soit S une partie dense de R 4 . Alors Bor(R) est la tribu engendrée 1. 2. 3. 4. quelconque au sens de « pas forcément dénombrable » au sens de l’inclusion cette collection est non vide car un de ses éléments est P(E) c’est-à-dire telle que tout nombre réel est limite d’une suite à valeurs dans S ; par exemple S = Q CHAPITRE 2. TRIBUS 14 par les intervalles du type a) [a, +∞[, a ∈ S; b) ]b, +∞[, b ∈ S; c) ] − ∞, c[, c ∈ S; d) ] − ∞, d], d ∈ S. Il en est de même pour Bor(R̄) avec les intervalles du type [a, +∞], etc. Dém. [de a)] Soit IS l’ensemble des intervalles de la forme [a, +∞[ pour a ∈ S. Tout d’abord, B(R) contient tous les intervalles fermés de R car est stable par passage au complémentaire ; on a donc l’inclusion σ(IS ) ⊆ B(R). Soit maintenant a ∈ [−∞, +∞[. Comme S est dense, il existe une suite décroissante (an ) d’éléments de S tels que an 6= a pour tout n, et limn ↓ an = a. Comme [an , +∞[∈ IS , on a [an , +∞[∈ σ(IS ), donc par stabilité par réunion dénombrable de la tribu σ(IS ), ]a, +∞[= ∪n [an , +∞[∈ σ(IS ). On démontre avec une suite croissante que [a, +∞[∈ σ(IS ). De plus, pour tous a, b ∈ [−∞, +∞[, l’intervalle ]a, b[ s’écrit ]a, +∞[\[b, +∞[∈ σ(IS ). Par conséquent I ⊆ σ(IS ), où I est l’ensemble des intervalles ouverts de R et B(R) = σ(I ) ⊆ σ(IS ). 2 2.3 Tribus image et image réciproque Soit f : E1 −→ E2 . Proposition 2.11 Si A2 est une tribu sur E2 , alors f −1 (A2 ) := {f −1 (Y ), Y ∈ A2 } est une tribu sur E1 , appelée tribu image réciproque (de A2 par f ). Par les formules de Hausdorff : i) f (E2 ) = E1 ∈ f −1 (A2 ) ; ii) pour tout Y ∈ A2 , c(f −1 (Y )) = f −1 (cY ) ∈ f −1 (A2 ) ; iii) pour toute suite (Yn ) ∈ A2 , ∪n f −1 (Yn ) = f −1 (∪n Yn ) ∈ f −1 (A2 ) car ∪n Yn ∈ A2 .2 Dém. −1 Proposition 2.12 Si A1 est une tribu sur E1 , B = {Y ⊆ E2 : f −1 (Y ) ∈ A1 } est une tribu sur E2 , appelée tribu image (de A1 par f ). Remarque 2.13 La tribu image n’est PAS f (A1 ) qui en général n’est pas une tribu. Dém. Par les formules de Hausdorff également. 2 Définition 2.14 (et proposition) Soit (E, A ) un ensemble mesurable et X une partie de E. La classe C = {A ∩ X : A ∈ A } de parties de X est une tribu sur X appelée tribu trace de A sur X. Remarque 2.15 Cette définition a surtout de l’intérêt dans le cas où X ∈ / A. CHAPITRE 2. TRIBUS 15 La classe C est la tribu image réciproque de A par l’injection canonique i : X → E : en effet pour tout A ∈ A , i−1 (A) = A ∩ X. 2 Dém. Théorème 2.16 (lemme de transport) Soit f : E1 −→ E2 et C une classe de parties de E2 . Alors σ(f −1 (C )) = f −1 (σ(C )). Montrons l’inclusion ⊆. Tout d’abord C ⊆ σ(C ), donc f −1 (C ) ⊆ f −1 (σ(C )). Ainsi f −1 (σ(C )) est une tribu contenant f −1 (C ) donc σ(f −1 (C )) ⊆ f −1 (σ(C )). Inversement, soit B la tribu image de σ(f −1 (C )) par f , c’est-à-dire Dém. B := {Y ⊆ E2 : f −1 (Y ) ∈ σ(f −1 (C ))}. Alors C ⊆ B, et B est une tribu, donc σ(C ) ⊆ B, puis f −1 (σ(C )) ⊆ f −1 (B). Mais par définition de B, f −1 (B) ⊆ σ(f −1 (C )) donc f −1 (σ(C )) ⊆ σ(f −1 (C )). 2 Chapitre 3 Tribu borélienne sur un espace topologique 3.1 Topologie Définition 3.1 Une famille O(E) de parties d’un ensemble E est appelée topologie, et ses éléments des ouverts, si i) elle contient ∅ et E : ∅ ∈ O(E) et E ∈ O(E) ; ii) elle est stable par intersection finie : U ∩ V ∈ O(E) pour tous U, V ∈ O(E), ; iii) elle est stable par réunion quelconque 1 : pour tout I ensemble d’indices et pour toute famille d’ouverts (Oi , i ∈ I), ∪i∈I Oi est un ouvert. Les complémentaires des ouverts sont appelés des fermés. Remarque 3.2 Les ouverts ∅ et E sont aussi des fermés ; les fermés sont stables par réunions finies et par intersections quelconques. Définition 3.3 Dans un espace métrique (E, d), la topologie dite relative à la distance d est constituée des réunions quelconques de parties du type B(x, r) := {y ∈ E : d(x, y) < r} appelée boule ouverte de centre x et de rayon r. Remarque 3.4 Une partie O de l’espace métrique (E, d) est ouverte ssi pour tout x ∈ O il existe r > 0, B(x, r) ⊆ O (un ouvert O d’un espace métrique est la réunion des boules ouvertes contenues dans O). Une partie A de l’espace métrique (E, d) est fermée ssi pour toute suite (xn ) à valeurs dans A et convergeant vers une limite x, x ∈ A. Définition 3.5 Soient E et F deux espaces topologiques. Une fonction f : E −→ F est dite continue si l’image réciproque par f de tout ouvert est un ouvert (ce qui est équivalent à dire que l’image réciproque par f de tout fermé est un fermé). 1. au sens où l’on ne fait pas d’hypothèse sur le cardinal de I 16 CHAPITRE 3. TRIBU BORÉLIENNE SUR UN ESPACE TOPOLOGIQUE 17 Proposition 3.6 Soient E et F deux espaces métriques. Une fonction f : E −→ F est dite continue ssi pour toute suite (xn ) de E convergeant vers x, la suite (f (xn )) est aussi convergente et limn f (xn ) = f (x). Définition 3.7 Soit X ⊆ E. La topologie trace 2 de O(E) sur X est constituée des intersections des ouverts de E avec X. Dans le cas métrique, la topologie trace est la topologie relative à la restriction de la distance à X × X. Définition 3.8 La topologie produit de E × F est constituée des réunions quelconques de pavés à côtés ouverts : O(E × F ) := {∪i∈I Ui × Vi , Ui ∈ O(E), Vi ∈ O(F ), I ensemble d’indices quelconque}. Proposition 3.9 La topologie produit est aussi la plus petite topologie qui rendent les projections canoniques πE : E × F −→ E (x, y) 7−→ x et πF : E × F −→ F (x, y) 7−→ y continues. Dans le cas métrique, la topologie produit est la topologie relative à toute distance classique du type d((x, y), (x0 , y 0 )) := dE (x, x0 ) + dF (y, y 0 ) p ou dE (x, x0 )2 + dF (y, y 0 )2 ou dE (x, x0 ) ∨ dF (y, y 0 ). Définition 3.10 On dit qu’une famille dénombrable d’ouverts (ωn )n∈N de E est une base dénombrable d’ouverts si tout ouvert de E s’écrit comme réunion d’éléments de cette famille, autrement dit : ∀O ∈ O(E), ∃I ⊆ N : O = ∪i∈I ωi ; ou de manière équivalente : ∀O ∈ O(E), ∀x ∈ O, ∃n ∈ N : x ∈ ωn ⊆ O. Proposition 3.11 Un espace métrique (E, d) est à base dénombrable d’ouverts ssi il contient une suite dense 3 . On dit alors que E est séparable. Sens ⇒ : soit (ωn )n∈N une famille dénombrable d’ouverts de E, et (xn ) une suite de E telle que pour tout n, xn ∈ ωn . Alors la suite (xn ) est dense, en effet : pour tout x ∈ E, l’ouvert B(x, 1/n) s’écrit comme réunion d’ouverts du type ωi , donc il existe i(n) tel que ωi(n) ⊆ B(x, 1/n). Soit yn := xi(n) , alors d(yn , x) ≤ 1/n, donc yn → x. Dém. 2. dite aussi topologie induite 3. autrement dit : il existe un ensemble dénombrable A tel que Ā = E (A est alors dit dense dans E) CHAPITRE 3. TRIBU BORÉLIENNE SUR UN ESPACE TOPOLOGIQUE 18 Sens ⇐ : si (xn ) est une suite dense, alors la famille {B(xn , r), n ∈ N, r ∈ Q?+ } est une base dénombrable d’ouverts car elle s’injecte dans N × Q (qui est dénombrable) et pour tout O ∈ O(E), [ O= B(xn , r), n,r:B(xn ,r)⊆O ce qui achève la démonstration. 2 Remarque 3.12 Rd est séparable car Qd est une suite dense. Les rectangles ouverts (produits d’intervalles ouverts) à extrémités rationnelles forment une base dénombrable d’ouverts de Rd . Remarque 3.13 Le cadre usuel pour les applications en probabilités est celui des espaces polonais, qui sont les espaces métriques complets et séparables. Les fermés des espaces vectoriels normés de dimension finie et la plupart des espaces de Banach usuels sont des espaces polonais. 3.2 Tribu borélienne et fonctions boréliennes Définition 3.14 Si E est un espace topologique, on note Bor(E) ou B(E) et on appelle tribu de Borel ou tribu borélienne, la tribu engendrée par les ouverts de E : autrement dit, B(E) := σ(O(E)). Les éléments de B(E) sont appelés parties boréliennes ou boréliens de E. Remarque 3.15 La tribu de Borel est aussi la tribu engendrée par la classe C des fermés de E, en effet : d’une part C ⊆ B(E), donc σ(C ) ⊆ B(E) car tout fermé est le complémentaire d’un ouvert, qui appartient à B(E), donc appartient aussi à B(E) ; d’autre part O(E) ⊆ σ(C ), donc (B(E) =)σ(O(E)) ⊆ σ(C )) car tout ouvert est le complémentaire d’un fermé, qui appartient à σ(C ), donc appartient aussi à σ(C ) (même raisonnement). Remarque 3.16 Il existe des parties de R non boréliennes (voir dernière section de ce chapitre). En revanche, si E est dénombrable, muni de la topologie discrète : toute partie est ouverte (et fermée), donc borélienne : B(E) = P(E). Proposition 3.17 Si E admet une base dénombrable d’ouverts (ωn )n∈N , alors Bor(E) = σ({ωn ; n ∈ N}). Par double inclusion : {ωn ; n ∈ N} ⊆ O(E) ⊆ B(E), donc σ({ωn ; n ∈ N}) ⊆ B(E). Dans l’autre sens, on sait que tout ouvert O s’écrit comme réunion d’éléments de {ωn ; n ∈ N}. Comme une telle réunion est forcément dénombrable, O est un élément de σ({ωn ; n ∈ N}). On a donc O(E) ⊆ σ({ωn ; n ∈ N}), ce qui implique B(E) ⊆ σ({ωn ; n ∈ N}). 2 Dém. CHAPITRE 3. TRIBU BORÉLIENNE SUR UN ESPACE TOPOLOGIQUE 19 Corollaire 3.18 La tribu Bor(Rd ) est la tribu engendrée par la classe des rectangles ouverts 4 , mais est aussi la tribu engendrée par les rectangles ouverts à extrémités à coordonnées dans Q ou dans toute autre partie dense de R. Proposition 3.19 La tribu trace de Bor(E) sur une partie X de E est la tribu engendrée par la topologie trace de X. Soit i : X → E l’injection canonique. La tribu trace est i−1 (B(E)) = i−1 (σ(O(E)) = σ(i (O(E)), par le lemme de transport. Mais i−1 (O(E) n’est autre que la topologie trace, c’est-à-dire {A ∩ X, A ∈ O(E)}. 2 Dém. −1 3.3 Complément hors programme : l’ensemble triadique de Cantor L’ensemble triadique de Cantor est un sous-ensemble de l’intervalle [0, 1]. C’est un exemple de partie de R qui ne contient aucun point isolé mais ne contient pas non plus d’intervalle ouvert. Il est défini comme la limite d’une suite décroissante de réunions finies d’intervalles fermés, ce qui en fait un fermé (comme intersection de fermés). Plus précisément, soit A0 l’intervalle [0, 1], A1 la réunion de l’intervalle [0, 1/3] et de l’intervalle [2/3, 1], et plus généralement An+1 la partie de An obtenue en divisant chaque composante connexe de An en trois sous-intervalles de tailles égales et en lui en ôtant le sous-intervalle central. Plus rigoureusement, An+1 := 31 An ∪ 13 (2 + An ). Définition 3.20 Le fermé K := limn ↓ An est appelé ensemble triadique de Cantor. Dans la proposition suivante, on appelle (provisoirement sans précautions mathématiques) « mesure de Lebesgue » d’une partie de R, sa longueur totale. Une définition rigoureuse de cette « mesure » sera donnée dans le chapitre suivant. Proposition 3.21 L’ensemble triadique de Cantor peut s’écrire sous la forme ( ) X xn , xn ∈ {0, 2} . K= n 3 n≥1 Il est compact, d’intérieur vide, équipotent à R, de mesure de Lebesgue nulle. Remarque 3.22 Tout ensemble dénombrable est de mesure de Lebesgue nulle, comme réunion dénombrable d’ensembles de mesure nulle (les singletons le constituant). On voit ici que la réciproque est fausse : K est un exemple d’ensemble de mesure de Lebesgue nulle mais non dénombrable. 4. rectangle = produit d’intervalles ; rectangle ouvert = produit d’intervalles ouverts CHAPITRE 3. TRIBU BORÉLIENNE SUR UN ESPACE TOPOLOGIQUE 20 K est fermé borné dans R donc compact. Par récurrence, on voit que les composantes connexes de An sont des intervalles fermés de longueur 3−n dont les extrémités Pn x(n) (n) εn k sont les nombres réels de la forme ∈ {0, 2} et εn ∈ {0, 1} : k=1 3n + 3n , où xk pour chaque intervalle, εn = 0 correspond à l’extrémité gauche, et εn = 1 correspond à l’extrémité droite. Montrons l’égalité annoncée par double inclusionP : n xk ⊇ : pour toute suite P∞ (xxkk) à valeurs dans {0, 2}, pour tout entier n, k=1 3n ∈ An ⊆ K ; par suite la limite k=1 3n ∈ K puisque K est fermé. ⊆ : soit x ∈ K et soit x(n) l’extrémité gauche de la composante connexe de An qui contient x. En particulier |x(n) − x| ≤ 3−n . Cherchons une relation entre x(n) et x(n+1) . Lorsqu’on passe de An à An+1 , soit x est dans le sous-intervalle de gauche, auquel cas 2 x(n+1) = x(n) , soit x est dans le sous-intervalle de droite, auquel cas x(n+1) = x(n) + 3n+1 . n+1 On peut donc écrire x(n+1) = x(n) + x3n+1 , où xn+1 ∈ {0, 2}, et comme x(0) = 0, cela donne P P xk (n) − x| ≤ 3−n donc x(n) = nk=1 x3kk , qui converge en croissant vers y := ∞ k=1 3k . Or |x la suite (x(n) ) converge vers x, ce qui implique y = x. Montrons que K est d’intérieur vide. Soit x ∈ K et ε > 0. La boule B(x, ε) intersecte c An pour tout n dès que 3−n < ε. Donc B(x, ε) intersecte ∪n cAn , qui n’est autre que le complémentaire de ∩n An = K. Ainsi, K ne contient aucune boule ouverte centrée sur x, c’est-à-dire que x n’est pas intérieur à K. Montrons que K est équipotent à R. L’application Dém. ? f : {0, 2}N −→ K X xn (xn ) 7−→ 3n n≥1 ? est une injection donc Card(K) ≥ Card({0, 2}N ) = Card(R). D’autre part Card(R) ≤ Card(K) puisque K ⊆ R. Enfin K est de mesure de Lebesgue nulle car K = limn ↓ An donc 5 λ(K) = limn ↓ n λ(An ) = limn ↓ 32 = 0. 2 3.4 Complément hors programme : une partie de R non borélienne Les tribus sont des familles de parties qui sont destinées à être mesurées. Pour pouvoir mesurer des parties suffisamment compliquées comme celles qui ne peuvent être définies que par des passages à la limite (comme l’ensemble triadique de Cantor), les tribus doivent être assez fines pour être stables par des opérations relativement générales comme le passage au complémentaire, les réunions et intersections dénombrables. Néanmoins, elles ne doivent pas être si fines qu’elles contiennent des parties non mesurables, comme l’exemple qui va suivre. On définit la relation d’équivalence ∼ sur R : x ∼ y ⇔ x − y ∈ Q. 5. Propriété de continuité de la mesure pour les suites décroissantes dont un élément est de mesure finie, ce que nous verrons dans le chapitre suivant CHAPITRE 3. TRIBU BORÉLIENNE SUR UN ESPACE TOPOLOGIQUE 21 En se servant de l’axiome du choix, on peut supposer l’existence d’une partie A de ]0, 1[ qui contient exactement un représentant et un seul de chaque classe d’équivalence de la relation ∼. En particulier, A n’est pas dénombrable, mais surtout nous allons montrer que A ne peut admettre de mesure de Lebesgue. Cette assertion implique l’assertion suivante : A n’est pas borélienne. En effet, nous verrons (plus tard) que tout borélien admet une mesure de Lebesgue. Montrons par l’absurde que A ne peut admettre de mesure de Lebesgue : soit λ(A) ∈ [0, +∞] la mesure de A (nous verrons que λ est la notation usuelle de la mesure de Lebesgue). Soit [ L := (r + A), r∈Q∩]−1,1[ où r + A = {r + x, x ∈ A}. Comme A admet une mesure, alors chaque partie r + A en admet une aussi, qui vaut d’ailleurs λ(A) par invariance par translation de la mesure de Lebesgue. Comme L est réunion dénombrable de parties admettant une mesure, ce doit être également son cas. Montrons que ]0, 1[⊆ L. Pour tout x ∈]0, 1[, désignons par a = a(x) le représentant de sa classe d’équivalence contenu dans A. Alors en particulier, x − a ∈ Q, et x − a ∈] − 1, 1[, donc r := x − a ∈ Q∩] − 1, 1[, et comme x ∈ r + A, x ∈ L. On a aussi L ⊆] − 1, 2[, donc on en déduit 1 ≤ λ(L) ≤ 3. Montrons que les parties r + A (r ∈ Q) sont deux à deux disjointes. Soient r, s ∈ Q. Si (r + A) ∩ (s + A) 6= ∅, alors il existe a, b ∈ A tels que z = r + a = s + b, donc b − a = r − s ∈ Q. Par conséquent a ∼ b, mais comme a, b ∈ A qui ne contient qu’un représentant de chaque classe d’équivalence, a = b, donc r = s. Par σ-additivité, nous en déduisons X X λ(A). λ(r + A) = λ(L) = λ(∪r (r + A)) = r r Cette somme ne peut être qu’infinie (si λ(A) 6= 0) ou nulle (si λ(A) = 0), ce qui contredit l’inégalité 1 ≤ λ(L) ≤ 3. 2 Chapitre 4 Mesures 4.1 Définitions et propriétés Définition 4.1 Une mesure 1 sur l’espace mesurable (E, A ) est une application µ : A → [0, +∞] qui : (i) associe la valeur 0 à l’ensemble vide : µ(∅) = 0 ; (ii) est σ-additive : pour toute suite (An ) d’éléments de A deux à deux disjoints, X µ(∪n An ) = µ(An ). n On dit que (E, A , µ) est un espace mesuré, et pour tout A ∈ A , on appelle µ(A) la mesure de A. Remarque 4.2 On a besoin de la σ-additivité pour pouvoir calculer la mesure de parties compliquées construites comme limites d’ensembles plus simples que l’on sait mesurer. P Remarque 4.3 Dans l’égalité µ(∪n An ) = n µ(An ), on remarque que l’ordre de sommation (membre de droite) n’intervient pas car la série est à termes positifs, ce qui est cohérent avec le membre de gauche. On remarque également que la σ-additivité implique l’additivité finie grâce P à (i) : si l’on définit Ai = ∅ pour tout i ≥ n + 1, alors µ(∪ni=1 Ai ) = µ(∪∞ A ) = i=1 i i≥1 µ(Ai ) = Pn i=1 µ(Ai ). Proposition 4.4 Une mesure µ sur un (E, A ) vérifie pour tous A, B ∈ A : (i) Additivité finie : µ(A) = µ(A \ B) + µ(A ∩ B) ; (ii) Additivité forte : µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B) ; (iii) Sous-additivité : µ(A ∪ B) ≤ µ(A) + µ(B) ; (iv) Croissance : si A ⊆ B, µ(A) ≤ µ(B). Remarque 4.5 En (ii), prendre garde de ne pas écrire µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B), qui pourrait être une forme indéterminée, si µ(A ∩ B) = +∞. 1. Dans ce cours nous ne considérerons que des mesures positives 22 CHAPITRE 4. MESURES 23 (i) A \ B et A ∩ B sont disjoints et leur réunion est A. (ii) A \ B, A ∩ B et B \ A sont disjoints et leur réunion est A ∪ B, donc Dém. µ(A \ B) + µ(A ∩ B) + µ(B \ A) = µ(A ∪ B), donc en ajoutant µ(A ∩ B) à chaque membre on obtient µ(A \ B) + µ(A ∩ B) + µ(B \ A) + µ(A ∩ B) = µ(A ∪ B) + µ(A ∩ B), mais dans le premier membre, grâce à (i), la somme des deux premiers termes vaut µ(A) et la somme des deux derniers termes vaut µ(B). (iii) Conséquence de (ii). (iv) D’après (ii) si A ⊆ B, alors µ(B) = µ(B \ A) + µ(B ∩ A) = µ(B \ A) + µ(A) ≥ µ(A), 2 qui est l’inégalité souhaitée. Proposition 4.6 Une application µ : A → [0, +∞] est une mesure ssi : (i) µ(∅) = 0 ; (ii) µ est finiment additive : pour tous éléments P Ai (i ∈ I) deux à deux disjoints de la tribu A , si I est fini, alors µ(∪i∈I Ai ) = i∈I µ(Ai ). (iii) µ est continue à gauche 2 : pour toute suite croissante (An )n∈N d’éléments de A , µ(lim ↑ An ) = lim ↑ µ(An ). n n Remarque 4.7 La suite (An )n∈N étant croissante, limn ↑ An n’est autre que ∪n An . Montrons d’abord le sens ⇒ et supposons donc que µ est une mesure. On a déjà vu que (i) et (ii) sont vraies. Montrons la continuité à gauche. Soit (An ) une suite croissante de parties mesurables et soient B0 := A0 , et pour tout entier naturel non nul n, Bn := An \ An−1 . Alors les (Bn ) sont des éléments de A deux à deux disjoints, donc X µ(∪n Bn ) = µ(Bn ). Dém. n Mais d’une part, ∪n Bn = ∪n An = limn ↑ An et d’autre part, X n µ(Bn ) = lim n n X k=0 µ(Bk ) = lim µ(∪nk=0 Bk ) = lim µ(An ). n n Montrons maintenant ⇐. Soit donc µ vérifiant les trois propriétés de la proposition. Il nous suffit de montrer que µ est bien σ-additive. Soient (An ) mesurables et deux à deux disjointes. Soit Bn := ∪nk=0 Ak , alors (Bn ) est une suite croissante donc µ(∪n Bn ) = 2. il s’agit d’une expression figurée qui signifie ‘continue pour les suites croissantes’ et est utilisée par analogie avec les fonctions : R → R pour qui ces deux expressions sont synonymes CHAPITRE 4. MESURES 24 limn µ(Bn ). Mais d’une part µ(∪n Bn ) = µ(∪n ∪nk=0 AP k ) = µ(∪n An ), et d’autre part, n comme µ est finiment additive, µ(Bn ) = µ(∪k=0 Ak ) = nk=0 µ(Ak ). Ainsi µ(∪n An ) = µ(∪n Bn ) = lim µ(Bn ) = lim n n n X µ(Ak ) = X µ(An ), n k=0 2 ce qui montre la σ-additivité de µ. Corollaire 4.8 Toute mesureP µ est sous σ-additive, au sens où pour toute suite (An ) d’éléments de A , µ(∪n An ) ≤ n µ(An ). P Soit Bn := ∪nk=0 Ak . Par sous-additivité, µ(Bn ) ≤ nk=0 µ(Ak ). Mais comme la suite (Bn ) croît et converge vers ∪n An , en passant à la limite dans l’inégalité précédente, on obtient Dém. µ(∪n An ) = µ(∪n Bn ) = lim µ(Bn ) ≤ lim n n n X µ(Ak ) = k=0 X µ(An ), n où la deuxième égalité est due à la continuité à gauche des mesures. 2 Exemple 4.9 Quelques exemples de mesures : — la mesure nulle est définie sur P(E) (et donc sur toute autre tribu) par µ(A) := 0 pour tout A ⊆ E ; — la mesure grossière sur P(E) : µ(A) := +∞ dès que A 6= ∅ (et µ(∅) = 0) ; — pour tout a ∈ E, la mesure de Dirac au point a est définie pour tout A ∈ P(E) par 1 si a ∈ A µ(A) := 0 sinon. Cette mesure est souvent notée δa ; — la mesure de comptage sur P(E) : Card(A) si A est fini µ(A) := +∞ sinon, où Card(A) désigne ici le nombre d’éléments de l’ensemble A. — soit un espace mesuré (E, A , µ) et X une partie de E. SI X ∈ A , alors on peut définir la mesure trace µX de µ sur X par µX (A) := µ(A ∩ X) pour tout A ∈ A . Exercice 4.10 Montrer que la mesure de comptage est bien une mesure en prouvant qu’elle vérifie les trois propriétés de la Proposition 4.6. Définition 4.11 Une mesure µ sur un espace mesurable (E, A ) : — est dite finie, ou bornée, si µ(E) < ∞ (ce qui équivaut à : µ(A) < ∞ pour tout A ∈ A ). Le nombre réel µ(E) est alors appelé masse totale de µ ; — est appelée (mesure de) probabilité si sa masse totale vaut 1 ; CHAPITRE 4. MESURES 25 — est dite σ-finie s’il existe une suite (En ) de parties mesurables de E telles que µ(En ) < ∞ et ∪n En = E ; Proposition 4.12 (Continuité pour les suites décroissantes de mesure finie) Si (An ) est une suite décroissante de A telle que µ(An ) < ∞ à partir d’un certain rang, alors lim ↓ µ(An ) = µ(lim ↓ An ), n n qui n’est autre que µ(∩n An ). Remarque 4.13 Un corollaire immédiat de la proposition précédente est que les mesures finies sont continues à droite. La mesure de Lebesgue est un exemple de mesure non continue à droite : si An := [n, +∞[, alors (An ) est une suite décroissante de limite ∅, mais comme (λ(An )) est identiquement égale à +∞, elle converge vers +∞, et non pas vers λ(∅) = 0. Dém. Par hypothèse, il existe n0 tel que pour tout n ≥ n0 , µ(An ) < ∞. Soit alors Bn := An0 \ An . La suite (Bn ) est croissante et converge vers An0 \ ∩n An , donc µ(An0 )−µ(∩n An ) = µ(lim ↑ Bn ) = lim ↑ µ(Bn ) = lim ↑ (µ(An0 )−µ(An )) = µ(An0 )−lim ↓ µ(An ), n n n n 2 ce qui donne bien µ(∩n An ) = limn ↓ µ(An ). Proposition 4.14 Pour toute suite (An ) d’éléments de la tribu A , si µ est une mesure finie (ou s’il existe B de mesure finie tel que An ⊆ B à partir d’un certain rang), alors µ lim inf An ≤ lim inf µ(An ) ≤ lim sup µ(An ) ≤ µ lim sup An . n n n n La première inégalité reste valable sans les hypothèses qui précèdent. Soit Bn := ∩k≥n Ak . Alors (Bn ) est une suite croissante qui converge vers lim inf n An , donc µ(lim inf n An ) = limn ↑ µ(Bn ). Or Bn ⊆ An donc µ(Bn ) ≤ µ(An ) et par conséquent limn µ(Bn ) = lim inf n µ(Bn ) ≤ lim inf n µ(An ), ce qui assure la première inégalité. Concernant les limites supérieures, supposons que µ est finie (mais sous l’hypothèse plus faible de l’énoncé, la démonstration est la même ). Alors µ lim sup An = µ(E) − µ lim inf cAn ≥ µ(E) − lim inf µ(cAn ) Dém. n n n = µ(E) − lim inf (µ(E) − µ(An )) = lim sup µ(An ), n où l’inégalité est due à la conclusion précédente. n 2 Proposition 4.15 a) Si (µn ) est une suite croissante de mesures, au sens où pour tout A ∈ A , µn (A) ≤ µn+1 (A), alors l’égalité µ(A) := limn ↑ µn (A) ∈ [0, +∞] définit une mesure µ sur A . b) Tout combinaison linéaire dénombrable, à coefficients positifs, de mesures, est une mesure. CHAPITRE 4. MESURES 26 Pour b), il suffitPde montrer qu’une combinaison linéaire finie, à coefficients positifs, de mesures, soit nk=0 αk µk , est toujours une mesure, car alors a) impliquera b). En effet, une combinaison linéaire à coefficients positifs dénombrable est simplement la limite croissante d’une suite de sommes partielles. La démonstration se fait (par exemple) sur le même modèle que celle qui suit. Démontrons a) grâce à la Proposition 4.6. (i) comme µn (∅) = 0, µ(∅) = limn µn (∅) = 0. (ii) pour tout ensemble d’indices fini I, pour toutes parties mesurables (Ai )i∈I deux à deux disjointes, l’additivité finie de chaque µn s’écrit X µn (∪i∈I Ai ) = µn (Ai ). Dém. i∈I L’additivité finie de µ s’obtient en faisant tendre n → ∞ dans chaque membre (car le membre de droite est une somme finie). (iii) soit maintenant une suite croissante (Ak ) d’éléments de la tribu A . La suite doublement indicée (µn (Ak )) est croissante en k ET en n, ce qui garantit que l’on peut intervertir les limites en n et en k, d’où : µ lim ↑ Ak = lim ↑ µn lim ↑ Ak = lim ↑ lim ↑ µn (Ak ) = lim ↑ lim ↑ µn (Ak ) = lim ↑ µ(Ak ), k n k n k k n où la deuxième égalité est due à la continuité à gauche de chaque mesure µn . k 2 Corollaire 4.16 Pour toute P suite (xn ) d’éléments d’un ensemble E, pour toute suite (αn ) de nombre réels positifs, n αn δxn est une mesure sur P(E). 4.2 Mesure de Lebesgue La mesure de Lebesgue est une mesure définie sur la tribu de Borel de Rd . Elle donne un sens mathématique à la notion physique de volume (de surface si d = 2, de longueur si d = 1). Théorème 4.17Q Il existe une unique mesure surQ les boréliens de Rd telle que la mesure d de tout rectangle i=1 ]ai , bi [ soit égale au produit di=1 (bi − ai ). Cette mesure est appelée mesure de Lebesgue et est ordinairement notée λd , voire λ s’il n’y a pas d’ambiguïté sur la dimension. La démonstration requiert le théorème de la classe monotone pour l’unicité et le théorème de Caratheodory pour l’existence, que nous verrons dans les paragraphes suivants. Exercice 4.18 Montrer que si A est un borélien de Rd alors tous les translatés de A sont des boréliens (se servir du fait qu’une translation est une application bijective et continue). Proposition 4.19 Soit µ une mesure sur Bor(Rd ) vérifiant les propriétés (i) invariance par translation : pour tout borélien A et toute translation f , µ(f (A)) = µ(A) ; (ii) le rectangle unité est de mesure 1 : µ [0, 1]d = 1. Alors µ est la mesure de Lebesgue. CHAPITRE 4. MESURES 27 Nous ne détaillons ici que le cas d = 1. a) Montrons d’abord par l’absurde que µ est nulle sur les singletons. S’il existe x ∈ R tel que µ({x}) = ε > 0, alors par P invariance par translation, µ({y}) = ε pour tout y ∈ R. Par conséquent, µ(Q ∩ [0, 1]) = y∈Q∩[0,1] ε = +∞, ce qui constitue une contradiction puisque µ(Q ∩ [0, 1]) ≤ µ([0, 1]) = 1. b) D’après ce qui précède, pour tout entier naturel n ≥ 1, X n n X 1 k−1 k 1 1 = µ([0, 1]) = , = = nµ 0, , µ µ 0, n n n n k=1 k=1 Dém. d’où µ(]0, 1/n[) = 1/n. Par suite, pour tous entiers k1 ≤ k2 , µ k1 k2 , n n = k2 X j=k1 +1 µ j−1 j , n n k2 X = j=k1 1 k2 − k1 µ 0, = . n n +1 c) Soient r < r0 deux rationnels, que l’on peut écrire sous la forme r = p/q et r0 = p0 /q 0 , où p, p0 , q, q 0 sont des entiers. Alors d’après ce qui précède, 0 0 p p0 pq p q p0 q − pq 0 0 , 0 , = r0 − r. µ (]r, r [) = µ =µ = 0 0 0 q q qq qq qq d) Passons maintenant à la limite sur les rationnels. Soient a < b deux nombres réels. Alors il existe une suite décroissante (an ) et une suite croissante (bn ), toutes deux constituées de nombres rationnels, dont les limites sont resp. a et b. Alors la suite d’intervalles (]an , bn [) est une suite croissante qui converge vers ]a, b[, donc par continuité à gauche des mesures, µ(]a, b[) = µ(lim ↑]an , bn [) = lim ↑ µ(]an , bn [) = lim ↑ (bn − an ) = b − a, n n n ce qui montre que la mesure de tout intervalle est sa longueur, et garantit ainsi que µ est la mesure de Lebesgue sur R. 2 4.3 4.3.1 Théorème de la classe monotone Classe monotone Définition 4.20 Une classe M de parties d’un ensemble E est appelée classe monotone si (i) elle contient E ; (ii) elle est stable par différence propre : pour tous A, B ∈ M , A ⊆ B ⇒ B \A ∈ M ; (iii) elle est stable par réunion dénombrable croissante : si (An ) est une suite croissante d’éléments de M , alors ∪n An ∈ M . Proposition 4.21 a) L’intersection d’une collection quelconque non vide de classes monotones est une classe monotone. CHAPITRE 4. MESURES 28 b) Pour toute classe C de parties de E, l’intersection 3 de toutes les classes monotones contenant tous les éléments de C est donc une classe monotone, noté M (C ), et appelée classe monotone engendrée par C ou plus petite classe monotone contenant C . Proposition 4.22 a) Une tribu est une classe monotone. b) Une classe monotone stable par intersections finies est une tribu. Montrons b). Soit M une telle classe monotone et vérifions les trois propriétés caractéristiques des tribus. (i) E ∈ M puisque M est une classe monotone. (ii) Comme E ∈ M , pour tout A ∈ M , le complémentaire de A est la différence propre E \ A, qui appartient donc à M . (iii) Soit (An ) une suite d’éléments de M . Pour tout entier n, soit Bn := ∪nk=0 Ak . Comme ∪n An = ∪n Bn et que (Bn ) est une suite croissante, la propriété (iii) des classes monotones assure qu’il suffit de montrer que Bn ∈ M pour tout n. Autrement dit, il suffit de montrer que M est stable par réunions finies. Or M est stable par passage au complémentaire d’après (ii) et, par hypothèse, stable par intersections finies : ainsi A ∪ B = c(cA ∩ cB) ∈ M pour tous A, B ∈ M , ce qui assure que M est stable par réunions finies. 2 Dém. 4.3.2 Théorème de la classe monotone et corollaires Théorème 4.23 (Théorème de la classe monotone) Si C ⊆ P(E) est stable par intersections finies, alors M (C ) = σ(C ). De manière générale, comme σ(C ) est une tribu contenant C , c’est une classe monotone contenant C , et donc contenant M (C ) puisque M (C ) est la plus petite classe monotone contenant C . Supposons à présent avoir montré que M (C ) est une tribu. Alors M (C ) est une tribu contenant C , donc contenant σ(C ) puisque σ(C ) est la plus petite tribu contenant C. Montrons à présent que M (C ) est une tribu. D’après la proposition qui précède, il suffit de montrer que M (C ) est stable par intersections finies, en utilisant le fait que C l’est. 1. Soit M1 := {A ∈ M (C ); A ∩ C ∈ M (C ) ∀C ∈ C } et montrons que M1 = M (C ). C’est une conséquence des trois points suivants : 1.1. M1 ⊆ M (C ) par définition. 1.2. M1 est une classe monotone, comme on le voit en vérifiant les trois propriétés caractéristiques : (i) E ∈ M1 puisque pour tout C ∈ C on a E ∩ C = C ∈ C ⊆ M (C ) ; (ii) soit A, B ∈ M1 avec A ⊆ B et montrons que B \ A ∈ M1 . En effet, pour tout C ∈ C , (B \ A) ∩ C = (B ∩ C) \ (A ∩ C) appartient à la classe monotone M (C ) comme différence de deux éléments de M (C ), inclus l’un dans l’autre ; Dém. 3. non vide puisque P(E) est une classe monotone CHAPITRE 4. MESURES 29 (iii) soit (An ) ∈ M1 croissante et montrons que ∪n An ∈ M1 . En effet, pour tout C ∈ C , (∪n An ) ∩ C = ∪n (An ∩ C) appartient à la classe monotone M (C ) comme union croissante d’éléments de M (C ). 1.3. M1 contient C . En effet, si A ∈ C , alors pour tout C ∈ C on a A ∩ C ∈ C car C est stable par intersections finies. Donc A ∩ C ∈ M (C ), puis A ∈ M1 . 2. On montre de même que M2 = {A ∈ M (C ); A ∩ C ∈ M (C ) ∀C ∈ M (C )} est une classe monotone, puis est égale à M (C ). 3. Autrement dit, pour tout A ∈ M (C ), on a A ∈ M2 , c’est-à-dire que pour tout C ∈ M (C ) on a A ∩ C ∈ M (C ). Ainsi M (C ) est stable par intersection de deux éléments, puis par intersections finies, ce que l’on cherchait à montrer. 2 On en déduit les deux résultats d’unicité suivants : Corollaire 4.24 Soient µ et ν deux mesures finies sur un espace mesurable (E, A ), telles que µ(E) = ν(E) et qui coïncident 4 sur une classe C ⊆ A stable par intersections finies et engendrant 5 A . Alors µ et ν coïncident sur A . Corollaire 4.25 Soient µ et ν deux mesures σ-finies sur un espace mesurable (E, A ) telles que : a) il existe une suite croissante (En ) d’ensembles mesurable telle que ∪n En = E ; b) pour tout entier n, µ(En ) = ν(En ) < ∞ ; c) µ et ν coïncident sur une classe C ⊆ A stable par intersections finies, engendrant A et contenant chaque En . Alors µ et ν coïncident sur A . Remarque 4.26 Le fait que µ et ν sont σ-finies est une conséquence des conditions (a) et (b). Soit M := {A ∈ A : µ(A) = ν(A)} et montrons que M = A . M contient C par hypothèse et est une classe monotone comme on le voit en vérifiant les trois propriétés caractéristiques. Par conséquent M contient la classe monotone engendrée M (C ). Or C est stable par intersections finies, donc M (C ) = σ(C ) par le théorème de la classe monotone, qui est A par hypothèse. Ainsi M contient A , et est donc égal à A . 2 Démonstration du Corollaire 4.24. On applique le corollaire 4.24 aux mesures traces µn := µ(· ∩ En ) et νn := ν(· ∩ En ) qui sont finies grâce à l’hypothèse (b). Elles coïncident bien sur C par l’hypothèse (c) : en effet, pour tout C ∈ C , on a C ∩ En ∈ C car En ∈ C et C est stable par intersection, puis Démonstration du Corollaire 4.25. µn (C) = µ(C ∩ En ) = ν(C ∩ En ) = νn (C). 4. c’est-à-dire que pour tout A ∈ C , µ(A) = ν(A) 5. c’est-à-dire que A = σ(C ) CHAPITRE 4. MESURES 30 Donc µn et νn coïncident sur A d’après le corollaire 4.24 . Maintenant l’hypothèse (a) permet de conclure en utilisant la continuité à gauche de la mesure, car pour tout A ∈ A , µ(A) = µ ∪n (En ∩ A) = µ lim ↑ (En ∩ A) = lim ↑ µ(En ∩ A) = lim ↑ µn (A), n n n et de même pour ν. Or µn (A) = νn (A), donc µ(A) = lim ↑ µn (A) = lim ↑ νn (A) = ν(A), n n ce qui montre que µ et ν coïncident sur A . 4.3.3 2 Applications Unicité de la mesure de Lebesgue Supposons qu’il existe deux mesures µ et ν sur B(Rd ) telles que pour tout rectangle Q ouvert R = dk=1 ]ak , bk [, avec −∞ ≤ ak ≤ bk ≤ +∞ on ait µ(R) = d Y (bk − ak ) = ν(R), k=1 avec la convention habituelle 0 × ∞ = 0. Montrons qu’alors µ et ν coïncident sur B(Rd ). Ceci prouvera l’unicité de la mesure de Lebesgue (dont nous montrerons l’existence à la section suivante). Soit C l’ensemble des rectangles ouverts de Rd (produits d’intervalles ouverts pouvant être infinis, donc en particulier pouvant être égaux à R tout entier). Alors C contient Rd , est stable par intersections finies et de tribu engendrée égale à B(Rd ). Soit En le Q produit des intervalles ] − n, n[, c’est-à-dire En := dk=1 ] − n, n[. Alors les propriétés du corollaire 4.25 sont bien vérifiées : a) ∪n En = Rd ; b) pour tout entier n, µ(En ) = ν(En ) = (2n)d < ∞ ; c) En ∈ C , et σ(C ) = B(Rd ). On peut donc conclure que µ et ν coïncident sur B(Rd ). Caractérisation d’une mesure par sa fonction de répartition Définition 4.27 Si µ est une mesure finie sur (R, B(R)), on appelle fonction de répartition de µ la fonction F : R → R+ définie par F (x) := µ(] − ∞, x]). Proposition 4.28 La fonction de répartition F d’une mesure finie est continue à droite, croissante, et vérifie lim F (x) = 0 x→−∞ et lim F (x) = µ(R). x→+∞ De plus, pour tous réels a < b i) µ(]a, b]) = F (b) − F (a) iii) µ(]a, b[) = F (b−) − F (a) ii) µ([a, b]) = F (b) − F (a−) iv) µ([a, b[) = F (b−) − F (a−). CHAPITRE 4. MESURES Dém. 31 2 À faire en exercice. P Exemple 4.29 Si µ = δa , alors F = 1[a,+∞[ . De manière générale, si µ = n αn δxn , alors F est discontinue en tout point xn tel que αn > 0 et continue partout ailleurs X F (x) = αn 1[xn ,+∞[ . n Théorème 4.30 Deux mesures finies sur (R, B(R)) de même fonction de répartition sont égales. Dém. Soit µ et ν ces deux mesures, et soit C := {] − ∞, x] : x ∈ R} ∪ {R}. Alors C est stable par intersection finie et engendre B(R). De plus µ et ν coïncident sur C car µ(] − ∞, x]) = ν(] − ∞, x]) pour tout x, l’égalité µ(R) = ν(R) s’obtenant par passage à la limite. Le corollaire 4.24 permet de conclure que µ et ν coïncident sur B(R). 2 4.4 Théorème de Caratheodory Définition 4.31 Une classe B de parties d’un ensemble E est appelée algèbre ou algèbre de Boole si (i) elle contient E : E ∈ B ; (ii) elle est stable par passage au complémentaire : cA ∈ B pour tout A ⊆ E, A ∈ B ; (iii) elle est stable par réunions finies : A ∪ B ∈ B pour tous A, B ∈ B. Remarque 4.32 Une tribu est une algèbre de Boole stable par réunion dénombrable, d’où le nom de σ-algèbre. Remarque 4.33 Dans Rd , l’ensemble des réunions finies de rectangles forment une algèbre, ainsi que l’ensemble des réunions finies de rectangles disjoints. Théorème de Caratheodory Définition 4.34 Soit B une algèbre de Boole sur un ensemble E. Une mesure d’algèbre sur (E, B) est une application m : B → [0, +∞] qui : (i) associe la valeur 0 à l’ensemble vide : m(∅) = 0 ; (ii) est finiment additive : pour tous A, B ∈ B tels que A ∩ B = ∅, m(A ∪ B) = m(A) + m(B) ; (iii) satisfait la popriété suivante : il existe une suite croissante (En ) d’éléments de B convergeant vers E telle que m(En ) < ∞ pour chaque entier n et telle que pour tout A ∈ B, limn ↑ m(A ∩ En ) = m(A) ; (iv) satisfait la propriété de Caratheodory : pour toute suite décroissante (An ) d’éléments de B convergeant vers ∅ et telle que m(A0 ) < ∞, limn ↓ m(An ) = 0. CHAPITRE 4. MESURES 32 Proposition 4.35 Une mesure d’algèbre m sur (E, B) vérifie pour tous A, B ∈ B : (i) Additivité finie : m(A) = m(A \ B) + m(A ∩ B) ; (ii) Additivité forte : m(A ∪ B) + m(A ∩ B) = m(A) + m(B) ; (iii) Sous-additivité : m(A ∪ B) ≤ m(A) + m(B) ; (iv) Croissance : si A ⊆ B, m(A) ≤ m(B). Théorème 4.36 (de prolongement de Caratheodory) Soit B une algèbre de Boole sur un ensemble E. Si m est une mesure d’algèbre sur (E, B), alors il existe une mesure µ sur la tribu σ(B) qui coïncide 6 avec m sur B. Remarque 4.37 On dit alors que µ est un prolongement de la mesure (d’algèbre) m, qui elle est seulement définie sur l’algèbre B, à la tribu σ(B). Ce théorème de prolongement est admis. Remarque 4.38 Le prolongement construit dans le théorème est en fait unique. En effet, si µ et ν sont deux prolongements d’une même mesure d’algèbre B, alors µ et ν coïncident sur B, qui contient E et est stable par intersections finies. Comme de plus il existe une suite mesurable (En ) convergeant vers E telle que µ(En ) = ν(En ) < ∞, alors µ et ν coïncident sur σ(B) d’après le corollaire 4.25. Application : existence de la mesure de Lebesgue Montrons l’existence d’une mesure sur Bor(Rd ) telle que la mesure d’un rectangle Q R = dk=1 Ik , où chaque Ik est un intervalle de R d’extrémité gauche ak ≥ −∞ et d’extrémité droite bk ≤ +∞ (les extrémités pouvant être fermées ou ouvertes), vaut Qd k=1 (bk − ak ). On définit B l’ensemble des réunions finies de rectangles deux à deux disjoints. Alors pour tout A ∈ B, A s’écrit de manière unique 7 sous la forme A = ∪ji=1 Ri , où les (Ri ) sont des rectangles deux à deux disjoints, et l’on peut définir sans ambiguïté Pj la mesure d’algèbre m sur B par m(A) = i=1 m(Ri ), où la mesure d’un rectangle a été définie précédemment. On peut alors vérifier que B est une algèbre et que m est une mesure d’algèbre sur (E, B) avec En définie comme le produit des intervalles ] − n, n[. Comme σ(B) = Bor(Rd ), le théorème de Caratheodory permet bien de déduire l’existence d’une mesure, appelée mesure de Lebesgue, prolongeant la mesure m à tous les boréliens de Rd . Remarque 4.39 Si F : R → R+ est une fonction croissante, bornée, continue à droite et telle que limx→−∞ F (x) = 0, on peut déduire du théorème de Caratheodory l’existence d’une (unique) mesure µ sur Bor(R) qui admet F pour fonction de répartition. 6. c’est-à-dire que pour tout B ∈ B, µ(B) = m(B) 7. Cette écriture n’est unique que si elle est supposée minimale, c’est-à-dire utilisant un minimum de rectangles ; de plus, si les rectangles ne sont plus supposés disjoints, il n’existe même plus de décomposition minimale unique, et il faut donc montrer que la définition de m ne dépend pas de la décomposition choisie Chapitre 5 Applications mesurables Dans ce chapitre et dans la suite la notation (E, A ) signifie un ensemble E muni d’une tribu A . De même pour (Ei , Ai ), i = 1, 2, ... 5.1 Définitions Notation 5.1 Soit f : E1 −→ E2 et B ⊆ E2 . On utilise très fréquemment la notation {f ∈ B} à la place de f −1 (B), ce qui peut se voir comme une écriture condensée de {x : f (x) ∈ B}. Par exemple, dans le cas où E2 = R et B = [a, +∞[, on pourra écrire f −1 (B) sous la forme {f ≥ a}. Définition 5.2 Une fonction f : (E1 , A1 ) −→ (E2 , A2 ) est dite mesurable 1 si f −1 (A2 ) ⊆ A1 , c’est-a-dire si f −1 (B) ∈ A1 pour tout B ∈ A2 . On note F (A1 , A2 ) l’ensemble des fonctions mesurables : (E1 , A1 ) → (E2 , A2 ). Remarque 5.3 Si on ne se donne que la tribu A1 , alors la tribu image de A1 par f est la plus grande tribu sur E2 qui rende f mesurable. Si on ne se donne que A2 , alors la tribu image réciproque de A2 par f est la plus petite tribu sur E1 qui rende f mesurable. On note aussi cette tribu σ(f ). Remarque 5.4 Soit A ⊆ E. Une fonction indicatrice 1A : (E, A ) −→ ({0, 1}, P({0, 1})) est mesurable ssi A ∈ A . On dit alors que « A est mesurable » 2 . Remarque 5.5 Si E1 et E2 sont R ou R̄ muni de la tribu borélienne, on dit « fonction borélienne » pour « fonction mesurable ». 5.2 Exemples et opérations stables pour la mesurabilité Proposition 5.6 Soit C une classe de parties de F et B := σ(C ). Alors f : (E, A ) → (F, B) est mesurable ssi f −1 (C ) ⊆ A . 1. sous-entendu par rapport aux deux tribus A1 et A2 2. toujours en référence sous-entendue à la tribu A 33 CHAPITRE 5. APPLICATIONS MESURABLES 34 L’application f est mesurable ssi f −1 (B) ⊆ A , mais d’une part f −1 (B) = f −1 (σ(C )) = σ(f −1 (C )) par le lemme de transport, et d’autre part σ(f −1 (C )) ⊆ A ssi f −1 (C ) ⊆ A . 2 Dém. Application. Soit S une partie dense de R. Alors la fonction f : (E, A ) → (R, B(R)) est mesurable ssi {f ≥ a} ∈ A pour tout a ∈ S. On peut remplacer {f ≥ a} par {f > a}, {f ≤ a} ou {f < a}. Remarque 5.7 Toute fonction monotone est borélienne. En effet pour tout a ∈ R, {f ≥ a} est une demi-droite, en effet : si m(a) := inf{x : f (x) ≥ a}, alors dans le cas où f est croissante par exemple, {f ≥ a} coïncide soit avec [m(a), +∞[, soit avec ]m(a), +∞[. Proposition 5.8 Soient f1 : (E1 , A1 ) → (E2 , A2 ) et f2 : (E2 , A2 ) → (E3 , A3 ). Si f1 et f2 sont mesurables, alors f2 ◦ f1 : (E1 , A1 ) → (E3 , A3 ) est aussi mesurable. Pour tout A3 ⊆ A3 , on vérifie que (f2 ◦ f1 )−1 (A3 ) = f1−1 (f2−1 (A3 )). Comme f2 est mesurable, f2−1 (A3 ) ∈ A2 . De plus, comme f1 est mesurable f1−1 (f2−1 (A3 )) ∈ A1 . 2 Dém. Proposition 5.9 Soit une suite (fn ) de F (A , Bor(R̄)). Alors a) supn fn et inf n fn sont mesurables ; b) lim supn fn et lim inf n fn sont mesurables ; c) si (fn ) converge simplement vers une fonction f 3 (dans R̄), alors f est mesurable. a) Pour tout a ∈ R, {supn fn ≤ a} = ∩n {fn ≤ a} ∈ A et {inf n fn ≥ a} = ∩n {fn ≥ a} ∈ A . b) D’après a), pour tout n ∈ N, la fonction supk≥n fk est mesurable, donc la fonction lim supn fn = inf n supk≥n fk est mesurable. De même pour lim inf n fn . c) Si fn → f , alors f = lim supn fn , qui est mesurable d’après b). 2 Dém. 5.3 Applications boréliennes entre espaces topologiques Définition 5.10 (terminologie) Soit E1 et E2 des espaces topologiques, Ai := Bor(Ei ), i = 1, 2. Les éléments de F (A1 , A2 ) sont appelés fonctions boréliennes. Proposition 5.11 Soit f : (E1 , A1 ) → (E2 , A2 ). Si E2 est topologique et A2 = Bor(E2 ), alors f est mesurable ssi pour tout ouvert O de E2 , f −1 (O) ∈ A1 . 3. autrement dit : ∀x ∈ E, fn (x) → f (x) lorsque n → ∞ CHAPITRE 5. APPLICATIONS MESURABLES 35 Par le lemme de transport : f −1 (σ(O(E2 ))) = σ(f −1 (O(E2 ))). Or f est mesurable ssi f −1 (B(E2 )) ⊆ A1 , donc ssi σ(f −1 (O(E2 ))) ⊆ A1 , c’est-à-dire ssi f −1 (O(E2 )) ⊆ A1 . 2 Dém. Corollaire 5.12 Si E1 et E2 sont topologiques, alors toute fonction continue est borélienne. Proposition 5.13 Soit f : (E, A ) −→ (R2 , B(R2 )) x 7−→ (f1 (x), f2 (x)) Alors f est mesurable ssi fi ∈ F (A , B(R)) pour tout i = 1, 2. Remarque 5.14 Si C est identifié à R2 , une fonction complexe f est mesurable ssi <(f ) et =(f ) le sont. Sens ⇒ : pour tout i = 1, 2, la projection canonique πi : R2 → R est continue par définition de la topologie produit, donc borélienne, ainsi fi = πi ◦ f est mesurable comme composée de fonctions mesurables. Sens ⇐ : on sait que Bor(R2 ) est engendrée (par exemple) par les rectangles ouverts. Donc par le lemme de transport, f est mesurable ssi pour tous intervalles ouverts U et V , f −1 (U × V ) ∈ A . Or f −1 (U × V ) = {f1 ∈ U } ∩ {f2 ∈ V }. Mais par hypothèse {f1 ∈ U } ∈ A et {f2 ∈ V } ∈ A , donc leur intersection est aussi dans A . 2 Dém. Pour toutes fonctions f, g ∈ F (A , B(R)) et pour tout λ ∈ R, les fonctions λf + g, f g, f ∧ g, f ∨ g, f + , f − , |f |, |f |p , etc sont mesurables. Il suffit pour le voir d’utiliser la continuité des applications qui à (x, y) associent λx + y, xy, x ∧ y, etc ainsi que le fait que la composée de deux applications mesurables est mesurable. Applications. 5.4 Fonctions étagées, en escalier Définition 5.15 Une fonction f ∈ F (A , Bor(R)) est dite étagée si elle ne prend qu’un nombre fini de valeurs. Autrement dit il existe une partition P finie (Ai , i ∈ I) de E, A 4 mesurable , et des nombres réels (αi , i ∈ I) tels que f = i∈I αi 1Ai . Notation 5.16 On note E (A ) l’ensemble des fonctions étagées : (E, A ) → (R, B(R)). P Remarque 5.17 Il existe une représentation canonique de f sous la forme i∈I αi 1Ai où les αi sont deux à deux distincts et Ai = {f = αi }. On notera qu’une fonction indicatrice est bien sûr étagée car 1A = 1 · 1A + 0 · 1cA . Proposition 5.18 Pour toutes fonctions étagées f, g et pour tout λ ∈ R, les fonctions λf + g, f g, f ∧ g et f ∨ g 5 sont étagées. 4. au sens où Ai ∈ A pour tout i ∈ I 5. a ∧ b est une notation alternative pour min(a, b), et a ∨ b pour max(a, b) CHAPITRE 5. APPLICATIONS MESURABLES 36 P P On écrit f et g sous la forme f = i∈I αi 1Ai et g = j∈J βj 1Bj . Alors (Ai ∩ P Bj ; (i, j) ∈ I × J) est une partition finie de E et on peut écrire λf + g = (i,j)∈I×J (λαi + P βj )1Ai ∩Bj , f g = (i,j)∈I×J αi βj 1Ai ∩Bj , etc. 2 Dém. Théorème 5.19 (lemme fondamental d’approximation) Pour toute f ∈ F (A , B(R̄)), il existe une suite (fn ) de fonctions étagées convergeant simplement vers f . De plus, a) si f est positive, on peut choisir la suite (fn ) positive et croissante 6 ; b) si f est bornée, on peut choisir (fn ) de sorte que la convergence soit uniforme 7 . Dém. Commençons par le cas où f est positive. On définit alors n fn := n2 X k−1 k=1 2n 1{(k−1)2−n <f ≤k2−n } + n1{f >n} . Alors pour tout x ∈ E, la suite (fn (x))n est bien (positive et) croissante et converge vers f (x), en effet : si f (x) = +∞, alors fn (x) = n → ∞ ; sinon il existe n0 tel que f (x) < n0 , ce qui implique que pour tout n ≥ n0 , |fn (x) − f (x)| ≤ 2−n → 0. Si f est bornée et positive, alors il existe n0 tel que pour tout x ∈ E, f (x) < n0 , donc pour tout x ∈ E, pour tout n ≥ n0 , |fn (x) − f (x)| ≤ 2−n → 0. Ainsi (fn ) converge uniformément vers f . Si f est de signe quelconque, on écrit f sous la forme f = f + − f − , où f + := f 1{f >0} et f − := −f 1{f <0} . La somme f + − f − n’est jamais indéterminée, car pour tout x ∈ E, au moins un des deux termes f + (x) ou f − (x) est nul. On notera également que f + (et f − , par un même raisonnement) est mesurable car pour tout a ≥ 0, {f + ≥ a} = {f ≥ a} et pour tout a < 0, {f + ≥ a} = E. À présent, comme f + et f − sont positives, il existe deux suites croissantes (un ) et (vn ) de fonctions étagées positives convergeant resp. vers f + et f − . De plus, si l’on utilise la construction de ces suites proposée plus haut, on a un vn = 0, de sorte que l’on peut toujours définir fn := un − vn , qui définit une suite de fonctions étagées convergeant vers f + − f − = f . Si f est de signe quelconque mais bornée, f + et f − sont bornées, donc on peut choisir les suites (un ) et (vn ) pour que les convergences vers f + et f − soient toutes deux uniformes. Alors la suite (un − vn ) converge uniformément vers f . 2 Définition 5.20 Une fonction f : [a, b] −→ R est dite en escalier s’il existe une subdivision finie a = a0 < a1 < · · · < an = b de l’intervalle [a, b] telle que f soit constante sur chaque intervalle ]ai , ai+1 [. Remarque 5.21 Les valeurs prises exactement en chaque point a0 , a1 , . . . , an sont sans importance. 6. autrement dit : ∀x ∈ E, ∀n ∈ N, 0 ≤ fn (x) ≤ fn+1 (x) – rien à voir avec des fonctions croissantes, ce qui n’aurait d’ailleurs pas de sens ici. 7. autrement dit : supx∈E |fn (x) − f (x)| → 0 lorsque n → ∞ CHAPITRE 5. APPLICATIONS MESURABLES 37 Remarque 5.22 Une fonction en escalier a toujours pour espace de départ un intervalle compact de R, ce qui en fait un objet beaucoup moins général qu’une fonction étagée. D’ailleurs, une fonction en escalier est toujours un cas particulier de fonction étagée, au sens où elle est un élément de E (Bor([a, b])), car elle ne prend qu’un nombre fini de valeurs et elle est mesurable, en effet : les parties de [a, b] sur lesquelles f est constante sont des intervalles (les singletons sont bien sûr des intervalles) ou des réunions d’intervalles, donc des boréliens, donc l’image réciproque de toute partie de R est toujours un borélien de [a, b]. Le contre-exemple classique de la réciproque est 1Q , qui est étagée mais n’est en escalier sur aucun intervalle de R (non réduit à un point). Remarque 5.23 L’intégrale de Riemann est définie par approximation à partir de l’intégrale des fonctions en escalier, tandis que celle que nous étudions dans ce cours (parfois dite de Lebesgue) est construite à partir des fonctions étagées. Dans le premier cas, on approche l’intégrale d’une fonction quelconque par celle d’une fonction en escalier, c’est-à-dire en découpant l’espace de départ (un intervalle) en petits morceaux (les subdivisions), tandis que dans le second cas, c’est l’espace d’arrivée (qui est toujours R ou R̄) qui est découpé. Cette différence est fondamentale car la première approche ne peut se généraliser facilement à des fonctions ayant un autre espace de départ que R. Mais surtout les espaces de fonctions mesurables (celles qui admettront une intégrale au sens de Lebesgue) sont beaucoup plus grands que celui des fonctions Riemann-intégrables et ils sont stables sous l’action de multiples opérations comme le passage à la limite. Enfin, nous allons définir dans ce cours l’intégrale par rapport à une mesure quelconque, et pas seulement l’intégrale par rapport à la mesure de Lebesgue (celle qui a ceci de commun avec l’intégrale de Riemann qu’elle donne un sens mathématique à la notion physique de volume). Chapitre 6 Intégrale par rapport à une mesure des fonctions mesurables positives 6.1 Intégrale des fonctions étagées positives Notation 6.1 Pour tout espace mesurable (E, A ), on notera E+ (A ) l’ensemble des éléments de E (A ) (fonctions étagées) à valeurs positives. Définition 6.2 Pour toute fonction f ∈ R E+ (A ), on appelle intégrale de f par rapport à une mesure µ sur (E, A ), et l’on note E f dµ l’élément de [0, +∞] Z X f dµ := αµ({f = α}), E α∈f (E) avec la convention habituelle 0 × ∞ = 0. Remarque 6.3 La définition P précédente ne dépend (heureusement) pas de la représentation de f sous la forme f = i∈I αi 1Ai , car on a toujours l’égalité Z X f dµ = αi µ(Ai ). E i∈I Notation 6.4 On notera indifféremment l’intégrale de f par rapport à la mesure µ sous une des formes suivantes Z Z Z f dµ, f (x) dµ(x), f (x) µ(dx), E E E voire en omettant l’indice E du signe intégral. Proposition 6.5 Pour tout f ∈ E+ (A ), Z f dµ < ∞ ⇔ µ({f 6= 0}) < ∞. E 38 CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES Dém. P Soit f = i∈I αi 1Ai . Alors X αi µ(Ai ) < ∞ ⇐⇒ ∀i ∈ I 39 (αi 6= 0 ⇒ µ(Ai ) < ∞) i∈I X ⇐⇒ µ(Ai ) < ∞ i∈I:αi 6=0 ! [ ⇐⇒ µ < ∞, Ai i∈I:αi 6=0 S 2 Ai = {f 6= 0}. R Exemple 6.6 Si f ∈ E+ (A ) est nulle alors E f dµ = 0. Si µ = δa , alors Z X f dµ = αµ({f = α}) = f (a). ce qui achève la démonstration, car E i∈I:αi 6=0 α∈f (E) Si µ est la mesure de Lebesgue sur R, Z 1Q dλ = λ(Q) = 0. R R Proposition 6.7 L’application f 7→ E f dµ du cône E+ (A ) dans R̄+ jouit des propriétés suivantes : R R R (i) additivité : (f + g) dµ = f dµ + g dµ ; R R (ii) positive homogénéité : pour tout réel positif a, R(af ) dµ =R a f dµ ; (iii) croissance : pour tous f, g ∈ E+ (A ), f ≤ g ⇒ f dµ ≤ g dµ. P P Soient f = i∈I αi 1Ai et g = j∈J βj 1Bj , où les αi , βj sont des réels positifs ou nuls, et (Ai )i∈I , (Bj )j∈J sont des partitions finies de E. (i) Remarquons que (Ai ∩ Bj )(i,j)∈I×J est une partition finie de E et que X f +g = (αi + βj )1Ai ∩Bj . Dém. (i,j)∈I×J Par conséquent, Z X (f + g) dµ = (αi + βj )µ(Ai ∩ Bj ) E i,j = X = X αi µ(Ai ∩ Bj ) + i,j αi X µ(Ai ∩ Bj ) + j∈J X i∈I X βj µ(Bj ) j∈J Z f dµ + E X j∈J αi µ(Ai ) + Z = βj µ(Ai ∩ Bj ) i,j i∈I = X g dµ. E βj X i∈I µ(Ai ∩ Bj ) CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 40 P (ii) Pour tout a ≥ 0, af = i∈I aαi 1Ai , d’où Z Z X X (af ) dµ = aαi µ(Ai ) = a αi µ(Ai ) = a f dµ. E i∈I E i∈I R (iii) En R écrivant g = f +R (g − f ),Roù g − f est étagée positive, d’après (i), f dµ + (g − f ) dµ, donc g dµ ≥ f dµ. 6.2 R g dµ = 2 Intégrale des fonctions mesurables positives Notation 6.8 Pour tout espace mesurable (E, A ), on notera F+ (A ) l’ensemble des éléments de F (A , Bor(R̄)) (fonctions mesurables à valeurs dans R̄) à valeurs positives. Définition 6.9 Pour tout f ∈ F+ (A ), on appelle intégrale de f par rapport à µ, et l’on R 1 note E f dµ l’élément de [0, +∞] Z Z g dµ : g ∈ E+ (A ), g ≤ f . f dµ := sup E E Si R E f dµ < ∞, on dira que f est intégrable. Proposition 6.10 R R (croissance de l’intégrale) Pour toutes f, g ∈ F+ (A ), si f ≤ g, alors E f dµ ≤ E g dµ. Dém. Si ϕ ∈ E+ (A ) est telle que ϕ ≤ f alors ϕ ≤ g donc Z Z ϕ dµ : ϕ ∈ E+ (A ), ϕ ≤ g ϕ dµ : ϕ ∈ E+ (A ), ϕ ≤ f ≤ sup sup E E 2 ce qui est l’inégalité recherchée. Théorème 6.11 (Théorème de Beppo Levi, ou de convergence monotone) Si (fn ) est une suite croissante de F+ (A ), alors f := limn ↑ fn ∈ F+ (A ) et Z Z f dµ = lim ↑ fn dµ. E R n E Corollaire 6.12 L’intégrale E f dµ est la limite des intégrales suite arbitraire de fonctions étagées positives croissant vers f . R E fn dµ, où (fn ) est une 1. la même notation est encore utilisée, car il s’agit d’un prolongement de l’intégrale initialement définie pour les fonctions étagées positives, aux fonctions mesurables positives CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 41 Nous avons déjà vu que limn ↑ fn ∈ F+ (A ). Montrons d’abord l’inégalité ≥. Comme pour tout entier n, on a fn ≤ fn+1 ≤ f , par croissance de l’intégrale on a également Z Z Z fn dµ ≤ fn+1 dµ ≤ f dµ, Dém. du théorème de Beppo Levi. E E E R R ce qui prouve en passant à la limite que limn ↑ E fn dµ ≤ E f dµ. Montrons maintenant l’autre inégalité. Par définition de l’intégrale de f , ilR suffit de montrerR que pour toute fonction étagée positive ϕ telle que ϕ ≤ f , on a ϕ dµ ≤ limn ↑ E fn dµ. Soit alors a ∈ [0, 1[ et En := {aϕ ≤ fn }. Comme ϕ ≤ f , on a l’égalité E = ∪n En , en effet : — sur {f = 0}, fn = ϕ = 0 pour tout entier n, donc {f = 0} ⊆ En et par conséquent {f = 0} ⊆ ∪n En ; — sur {f > 0}, aϕ < f car ϕ ne prend que des valeurs finies. Donc pour tout x ∈ {f > 0}, il existe un rang N (x) tel que pour tout n ≥ N (x), aϕ(x) ≤ fn (x), autrement dit x ∈ En , et par conséquent x ∈ ∪n En . P En conclusion, E = {f = 0} ∪ {f > 0} ⊆ ∪n En . Or en notant ϕ = i∈I αi 1Ai , Z Z X X aαi µ(Ai ∩ En ). aϕ1En dµ = a αi 1Ai ∩En dµ = E E i∈I i∈I Ainsi comme les En croissent vers E, par continuité à gauche de la mesure, limn ↑ µ(Ai ∩ En ) = µ(Ai ) pour tout i ∈ I, ce qui s’écrit, I étant fini, Z Z X aαi µ(Ai ) = a ϕ dµ. lim ↑ aϕ1En dµ = n E E i∈I D’autre part En = {aϕ ≤ fn }, donc aϕ1En ≤ fn , d’où Z Z Z fn dµ ≤ lim ↑ fn dµ. aϕ1En dµ ≤ n E E E En se servant des deux équations qui précédent et notamment en passant à la limite dans la dernière inégalité, on trouve Z Z a ϕ dµ ≤ lim ↑ fn dµ. E n E L’inégalité cherchée est donc prouvée, car a est arbitrairement proche de 1. 2 Proposition 6.13 (Lemme de Fatou) Pour toute suite (fn ) de F+ (A ), alors lim inf n fn ∈ F+ (A ) et Z Z lim inf fn dµ ≤ lim inf fn dµ. E n n E Remarque 6.14 Pour fn = 1An où An ∈ A , le lemme de Fatou se traduit par une inégalité que nous connaissions déjà µ lim inf An ≤ lim inf µ(An ). n n CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 42 Nous avons déjà vu que lim inf n ↑ fn ∈ F+ (A ). Soit gn := inf k≥n fk et g := lim inf n fn = limn ↑ gn . Comme g est la limite de la suite croissante (gn ), le théorème de Beppo Levi assure que Z Z Dém. g dµ = lim ↑ n E gn dµ. E R R D’autre part, gn ≤ fn donc par croissance de l’intégrale, E gn dµ ≤ E fn dµ et Z Z gn dµ ≤ lim inf fn dµ. lim inf n n E Mais d’après ce qui précède, lim inf n l’inégalité souhaitée. R E E gn dµ = limn R E gn dµ = R E g dµ, ce qui fournit 2 Proposition 6.15 Les propriétés de positive homogénéité et d’additivité passent (comme celle de croissance) aux intégrales de fonctions mesurables positives. En d’autres termes pour tout a ≥ 0 et pour tout f ∈ F+ (A ), Z Z Z Z Z (af ) dµ = a f dµ et (f + g) dµ = f dµ + g dµ. E E E E E Comme f et g sont mesurables et positives, d’après le lemme fondamental d’approximation il existe des suites croissantes (fn ) et (gn ) de fonctions étagées positives croissant vers f et g respectivement. La proposition se prouve en écrivant les propriétés de positive homogénéité et d’additivité pour ces fonctions étagées et en appliquant à chaque suite d’intégrales le théorème de Beppo Levi. 2 P Proposition 6.16 Pour toute suite (fn ) de F+ (A ), on a n fn ∈ F+ (A ) et ! Z XZ X fn dµ. fn dµ = Dém. E n n E P Il suffit de poser gn := nk=0 fk , d’utiliser l’additivité de l’intégrale et d’appliquer le théorème de Beppo Levi à la suite croissante (gn ) . 2 Dém. Corollaire 6.17 Pour tout f ∈ F+ (A ), l’application ν : A −→ [0, +∞] Z A 7−→ f 1A dµ E est une mesure sur (E, A ) appelée mesure de densité f par rapport à µ. R R Notation 6.18 On note souvent A f dµ à la place de E f 1A dµ. CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 43 Vérifions les deux propriétés caractérisant les mesures. Tout d’abord ν(∅) = 0 car f 1∅ est la fonction étagée nulle partout. Montrons à présent que ν est σ-additive. Soient (An ) une suite d’éléments de A deux à deux disjoints. D’après la proposition qui précède le corollaire, nous pouvons échanger sommation et intégrale de sorte que Z Z X f 1∪n An dµ = f 1An dµ ν (∪n An ) = Dém. E E n = Z X E f 1An dµ = XZ n n f 1An dµ = E X ν(An ), n 2 ce qui achève la démonstration. Proposition 6.19 Si µ est finie alors pour tout f ∈ F+ (A ), f bornée =⇒ f intégrable. Si f est bornée, il existe un nombre réel positif a tel que f ≤ a1E , donc aµ(E) < ∞, car par hypothèse µ est finie. Dém. R E f dµ ≤ 2 Proposition 6.20 (Inégalité de Markov) Pour tout f ∈ F+ (A ), pour tout a > 0, Z 1 f dµ. µ ({f ≥ a}) ≤ a E Dém. Comme f ≥ a1{f ≥a} , par croissance R E f dµ ≥ aµ({f ≥ a}). 2 Proposition 6.21 Pour tout f ∈ F+ (A ), Z f dµ = 0 ⇐⇒ µ({f 6= 0}) = 0. E Pour le sens ⇒, Rsoit An := {f ≥ 1/n}. Par l’inégalité de Markov, µ(An ) ≤ n An f dµ, donc comme E f dµ = 0, µ(An ) = 0. Or A := {f 6= 0} = limn ↑ An , donc par continuité à gauche de µ, µ(A) = limn ↑ µ(An ) = 0. Inversement, par additivité Z Z Z Z f dµ = f dµ + f dµ = f dµ, Dém. R E A cA A car f est nulle sur cA, donc si µ(A) = 0 on a bien R E f dµ = 0. 2 Notation 6.22 (importante) Au lieu d’écrire µ({f 6= 0}) = 0, on notera souvent f = 0 µ-presque partout ou f = 0 µ-p.p. CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 44 De manière générale, soit N ∈ A tel que µ(N ) = 0, et une certaine propriété P (x) qui dépend de x ∈ E. Si {x ∈ E : P (x) est fausse} ⊆ N , on dira que P (x) est vraie « pour µ-presque tout x », ou « µ(dx)-presque partout », ou que P est vraie µ-p.p. L’ensemble N est appelé ensemble négligeable, ou µ-négligeable. Les ensembles dénombrables, l’ensemble triadique de Cantor, sont des ensembles λ-négligeables. Dans certains contextes, une partie de E sera dite négligeable même si elle n’est pas mesurable mais si elle est incluse dans une partie mesurable de mesure nulle. Proposition 6.23 Pour tous f, g ∈ F+ (A ), Z Z f = g µ-p.p. ⇒ f dµ = g dµ. E Dém. E On pose h := max(f, g) − min(f, g) 0 sur {min(f, g) < ∞} sur {f = g = ∞}. Comme {f = g} = {h = 0}, par passage au complémentaire {h 6= 0} R = {f 6= g} donc µ({h 6= 0}) = 0 (ce qui s’écrit aussi h = 0 µ-p.p.), par conséquent E h dµ = 0 (par la Proposition 6.21). Mais comme max(f, g) = min(f, g) + h, par additivité on a Z Z Z Z max(f, g) dµ = min(f, g) dµ + h dµ = min(f, g) dµ. E E E E Et comme f ∧ g ≤ f ≤ f ∨ g et f ∧ g ≤ g ≤ f ∨ g, par croissance on a Z Z Z Z max(f, g) dµ = min(f, g) dµ = f dµ = g dµ, E E E E 2 ce qui achève la démonstration. Proposition 6.24 Pour tout f ∈ F+ (A ), Z f dµ < +∞ =⇒ µ({f = +∞}) = 0. E R R Soit A := {f = +∞}. Par contraposée, si µ(A) 6= 0, alors E f dµ ≥ A f dµ = (+∞)µ(A) = +∞. Autre possibilité : se servir de l’inégalité de Markov. R Soit An := {f ≥ n}, alors A = limn ↓ An . Or par l’inégalité de Markov, µ(A1 ) ≤ E f dµ < +∞. Or comme toute mesure, µ est continue pour les suites décroissantes (on dit aussi continue à droite) dont un des termes est de mesure finie, R donc µ(A) = limn ↓ µ(An ). Mais par l’inégalité de −1 Markov à nouveau, µ(An ) ≤ n f dµ −→ 0 quand n → ∞. 2 E Dém. Corollaire 6.25 (Lemme de Borel–Cantelli) Soit (An ) une suite d’éléments de A . Alors X µ(An ) < +∞ =⇒ µ lim sup An = 0. n≥0 n CHAPITRE 6. INTÉGRALE DES FONCTIONS POSITIVES 45 R P P Soit f := f dµ < ∞. Donc par le n 1An . Par hypothèse, n µ(An ) = E résultat précédent, µ({f = +∞}) = 0. Montrons que lim supn An = {f = +∞}. Dém. X 1An (x) < ∞ ⇔ 1An (x) = 0 à partir d’un certain rang n0 n ⇔ ∃n0 , ∀n ≥ n0 , x ∈ cAn ⇔ x ∈ lim inf cAn ⇔ x 6∈ lim sup An . n n Exemple 6.26 (mesure de comptage) L’intégration par rapport à la mesure de comptage sur N est tout simplement la sommation de série. En effet u ∈ F+ (P(N)) est tout simplement une suite (un ) de réels positifs et pour tout N ∈ N, la suite ϕN := (un 1n≤N ) est une fonction étagée positive qui converge en croissant vers u. Donc si m désigne la mesure de comptage sur (N, P(N)), alors Z Z u dm = lim N N →∞ ϕN dm = lim N N →∞ N X n=0 un m({n}) = lim N →∞ N X n=0 un = X n un . Chapitre 7 Intégrale des fonctions mesurables de signe quelconque et l’espace L 1(µ) 7.1 Intégrale des fonctions mesurables de signe quelconque On note F (A ) l’ensemble des fonctions mesurables : (E, A ) → (R̄, Bor(R̄)). R R Définition 7.1 RSoit f ∈ F (A ), Si les deux intégrales E f + dµ et E f − dµ sont finies, autrement dit si E | f | dµ < ∞, ou encore si | f | est µ-intégrable, alors on dit que f est µ-intégrable et l’on définit alors l’intégrale de f par rapport à µ le réel Z Z Z + f dµ = f dµ − f − dµ. E E E L’intégrale vérifie l’inégalité triangulaire Z Z f dµ ≤ | f | dµ. E E Par définition, Z Z Z Z Z Z + − + − f dµ = f dµ − f dµ ≤ f dµ + f dµ = | f | dµ, Dém. de l’inégalité. E E E E par additivité. De même, on démontre que − E R E f dµ ≤ R E E | f | dµ. 2 Définition 7.2 (et proposition) L’espace L 1 (E , A , µ), noté aussi L 1 (µ), des foncR tions µ-intégrables, est un espace vectoriel et l’application f 7→ E f dµ est une forme linéaire positive donc croissante. Remarque 7.3 Bien noter L 1 car la notation L1 fera plus tard référence à un autre espace. 46 CHAPITRE 7. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 47 Pour tous f, g ∈ L 1 (µ), pour tout λ ∈ R, | λf + g | ≤ | λ |.| f | + | g | donc λf + g est intégrable par additivité. De plus, en se servant des égalités du type f = f + − f − appliquées à f , g et f + g, on obtient f + g = (f + g)+ − (f + g)− = f + − f − + g + − g − et par conséquent (f + g)+ + f − + g − = (f + g)− + f + + g + , Dém. d’où en passant aux intégrales, Z Z Z Z Z Z + − − − + (f + g) dµ + f dµ + g dµ = (f + g) dµ + f dµ + g + dµ. E E E E E E Comme toutes ces quantités sont finies, on peut les retrancher, ce qui donne Z Z Z Z + − (f + g) dµ − (f + g) dµ = f dµ + g dµ, E E R R E E R autrement dit E (f + g) dµ = E f dµ + E g dµ. De même, en utilisant les égalités (λf )+ = λf + , (λf )− = λf − lorsque λ > 0 et (λf )+ = −λf − , (λf )− = −λf + lorsque λ < 0, et en utilisant la positive homogénéité de l’intégrale sur F+ , on obtient : a) dans le cas λ > 0, Z Z Z Z Z Z + − + − (λf ) dµ = (λf ) dµ − (λf ) dµ = λ f dµ − λ f dµ = λ f dµ, E Z E E E E E b) dans le cas λ < 0, Z Z Z Z Z − + − + (λf ) dµ = (−λf ) dµ− (−λf ) dµ = (−λ) f dµ−(−λ) f dµ = λ f dµ. E E E E E E L’intégrale est donc bien une forme linéaire. R R Elle est positive car si f ≥ 0, alors f = f + et par définition E f dµ = E f + dµ ≥ 0. Elle est finalement croissante : soit en effet g, h R∈ L 1 (µ) avec R R g ≥ h.R Écrivant 1 g = (g − h) + h avec g − h ∈ L (µ), on a gdµ = (g − h)dµ + hdµ ≥ hdµ par linéarité de l’intégrale dans L 1 (µ) puis positivité de la fonction g − h et donc de son intégrale. 2 Remarque 7.4 Si m est la mesure de comptage sur N alors L 1 (m) est l’ensemble, souvent noté `1 , des suites dont la série est absolument convergente. Lemme 7.5 Si f = g µ-p.p., alors f est intégrable ssi g est intégrable . Si f = g µ-p.p., alors f + = g + µ-p.p. et que f − =R g − µ-p.p. Il suffit R donc de montrer que pour tous f, g positives, si f = g µ-p.p. alors f dµ < ∞ ssi g dµ < ∞. En fait on a déjà montré Rmieux (Corollaire 6.23) : si f et g sont positives et si f = g R µ-p.p. alors on a l’égalité f dµ = g dµ dans R̄+ . 2 Dém. CHAPITRE 7. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 7.2 48 Le théorème de convergence dominée de Lebesgue Théorème 7.6 (Théorème de Lebesgue, ou de convergence dominée) Soit (fn ) une suite d’éléments de L 1 (µ) convergeant 1 µ-p.p. vers une fonction f et telle qu’il existe g ∈ L 1 (µ) Ztelle que pour tout n ∈ N, | fn | ≤ g µ-p.p. Alors f ∈ L 1 (µ) et | f − fn | dµ = 0 a) lim n→∞ E et Z Z b) lim fn dµ = f dµ. n→∞ E E Soit A := {x ∈ E : limn fn (x) = f (x)} ∩ ∩n {| fn | ≤ g}. Alors A est de complémentaire négligeable et pour tout x ∈ A, | fn (x)R| ≤ g(x), donc R | f (x) | R≤ g(x). ParRconséquent, ayant | fRn |, | f | ≤ g µ-p.p., nous avons | fn | dµ ≤ g dµ et | f | dµ ≤ g dµ. En particulier | f | dµ < ∞. Pour obtenir a), on remarque que | f − fn | ≤ | f | + | fn | ≤ 2g ∈ L 1 (µ) et on applique le lemme de Fatou à la fonction p. p. positive 2g − |fn − f |. On obtient Z Z lim inf 2g − |fn − f | dµ ≤ lim inf 2g − |fn − f | dµ Dém. E soit n n Z Z Z n E Z 2g dµ − lim sup lim sup |fn − f |dµ ≤ 2g dµ − E E n E |fn − f |dµ E par linéarité, soit encore Z Z lim sup | f − fn | dµ ≥ lim sup | f − fn | dµ n E n E puisque g ∈ L 1 (µ). Ceci implique lim supn E | f − fn | dµ = 0, autrement dit a). On en déduit b) par inégalité triangulaire : Z Z Z f dµ ≤ |fn − f |dµ → 0. fn dµ − R E E E 2 7.3 Intégrale des fonctions à valeurs complexes Définition 7.7 Une fonction f : (E, A ) → (C, Bor(C)) est dite µ-intégrable si f est mesurable et | f | est intégrable. Ceci entraîne que <(f ) et =(f ) sont intégrables et l’intégrale de f par rapport à µ est définie comme le nombre complexe Z Z Z f dµ = <(f ) dµ + i =(f ) dµ. E 1. simplement E E CHAPITRE 7. INTÉGRALE DES FONCTIONS DE SIGNE QUELCONQUE 49 Théorème 7.8 L’ensemble LC1 (E, A , µ) Rdes fonctions complexes µ-intégrables est un espace vectoriel sur C. L’application f 7→ E f dµ est une C-forme linéaire et pour tout f ∈ LC1 (µ), Z Z f dµ ≤ | f | dµ. E E Il suffit de montrer la dernière inégalité, le reste découlant de la linéarité de l’intégrale réelle et de la définition. R Il existe z ∈ C tel que z f dµ est réel et | z | = 1, donc Z Z Z f dµ = | z | f dµ = z f dµ . Or par linéarité de l’intégrale complexe, Z Z Z Z z f dµ = (zf ) dµ = <(zf ) dµ + i =(zf ) dµ. E E R R Or on a choisi z pour que z f dµ soit réel donc E =(zf ) dµ = 0. De plus, | <(zf ) | ≤ | zf | = | f |, donc comme Z Z Z <(zf ) dµ ≤ | <(zf ) | dµ ≤ | f |dµ, E on a E E Z Z Z Z f dµ = z | f |dµ, f dµ = <(zf ) dµ ≤ E E E E 2 ce qui constitue l’inégalité souhaitée. Proposition 7.9 Soit (ϕn ) une R suite de fonctions mesurables à valeurs dans P R̄ ou C. Si la série de terme général E | ϕn | dµ est convergente, alors la fonction n | ϕn | est P intégrable ainsi que la fonction définie µ-p.p. n ϕn et ! Z X Z X ϕn dµ . ϕn dµ = E E n n R P Soit g := n | ϕn |. Alors g < ∞ µ-p.p. car E g dµ < ∞ par le corollaire du théorème de convergence monotone sur les séries. Autrement dit il existe une partie mesurable A de E, de complémentaire µ-négligeable, telle que g(x) < ∞ pour tout x ∈ A. Autrement dit, pour tout x ∈ A, la sérieP de terme général ϕn (x) est absolument convergente, donc convergente. La suite f := n k≤n ϕk converge donc sur A, vers une P fonction f := n ϕn ; par la domination des | fn | par g, le théorème de convergence dominée assure alors que Z Z n Z X XZ f dµ = lim fn dµ = lim ϕk dµ = ϕn dµ, Dém. E n→∞ E ce qui achève la démonstration. n→∞ k=0 E n E 2 Chapitre 8 Applications 8.1 Intégrale de Lebesgue et intégrale de Riemann Définition 8.1 Une fonction f : [a, b] → R est dite Riemann-intégrable si pour tout ε > 0 il existe une fonction φε en escalier sur [a, b] et une fonction ψε positive et en escalier sur [a, b] telles que Z b |f − φε | ≤ ψε et ψε ≤ ε, (8.1) a Rb où l’ intégrale de Riemann d’une fonction en escalier ϕ, notée ϕ, est définie 1 comme a P i αi (ai − ai−1 ) si ϕ vaut αi sur ]ai−1 , ai [. Rb De plus, pour tous φε , ψε vérifiant (8.1), la limite lorsque ε → 0 de a φε est toujours Rb la même, et est égale, par définition, au nombre réel aussi noté a f et appelé intégrale de Riemann de f . Remarque 8.2 Toute fonction Riemann-intégrable est bornée (car φε et ψε le sont). Théorème 8.3 Pour tout f Riemann-intégrable sur [a, b], il existe g ∈ L 1 ([a, b], Bor([a, b]), λ) tel que a) f = g µ-p.p. Z b Z b) f= g dλ . a [a,b] Remarque 8.4 On peut prendre g = f si f est borélienne. Pour tout n il existe φn , ψn en escalier telles que |f − φn | ≤ ψn et Rappelons déjà que par définition, Z b Z b f = lim φn . Dém. a n→∞ Rb a a 1. cette définition ne dépend pas de la subdivision choisie a < a1 < · · · < b pour représenter ϕ 50 ψn ≤ 1/n. CHAPITRE 8. APPLICATIONS 51 Soit alors αn := φn − ψn βn := φn + ψn . et Comme |f − φn | ≤ ψn , on a φn − f ≤ ψn et f − φn ≤ ψn , c’est-à-dire αn ≤ f ≤ βn . D’autre part, comme βn − αn = 2ψn , on a Z b lim (βn − αn ) = 0, n et donc a b Z Z b n βn . αn = lim f = lim a b Z n a a Soient à présent α̃n := max(α1 , . . . , αn ) β̃n := min(β1 , . . . , βn ). et On obtient alors l’encadrement αn ≤ α̃n ≤ f ≤ β̃n ≤ βn . On définit encore α̃ := lim ↑ αn β̃ := lim ↓ βn , et n n ce qui donne α̃ ≤ f ≤ β̃. De plus, comme une fonction en escalier est étagée, pour tout n, φn et ψn sont étagées donc boréliennes, ainsi que αn , βn , puis α̃n , β̃n par stabilité de la mesurabilité par passage à la borne supérieure ou inférieure, et enfin α̃, β̃ sont boréliennes par stabilité de la mesurabilité par passage à la limite. Par la définition donnée plus haut pour les fonctions en escalier (donc étagées), intégrales de Riemann et de Lebesgue (i.e., par rapport à la mesure de Lebesgue) coïncident, donc pour tout n Z b Z Z b Z αn = αn dλ et βn = βn dλ, a d’où Z b Z αn = a [a,b] [a,b] a Z αn dλ ≤ Z α̃n dλ ≤ [a,b] Z α̃ dλ ≤ [a,b] En passant à la limite, comme déduit que Z Rb a αn et Z β̃ dλ ≤ [a,b] Rb a Z Z [a,b] Z β̃ dλ = [a,b] b f. a Z β̃n dλ ≤ βn dλ = [a,b] βn convergent toutes deux vers α̃ dλ = [a,b] [a,b] Rb a βn . a f , on en b CHAPITRE 8. APPLICATIONS 52 Remarquons que α1 ≤ α̃ ≤ β̃ ≤ β1 , si bien que α̃ et β̃ sont bornées. Ainsi ces deux fonctions sont λ-intégrables sur [a, b], la fonction γ := β̃ − α̃ est bien définie, et Z Z Z γ dλ = α̃ dλ − β̃ dλ = 0. [a,b] [a,b] [a,b] Comme γ ≥ 0, ceci implique que γ = 0 λ-p.p. Mais α̃ ≤ f ≤ β̃, donc α̃ = f sur {γ = 0} et si g := f 1{γ=0} , alors g = α̃1{γ=0} et Z Z g dλ = [a,b] α̃1{γ=0} dλ = [a,b] Z Z α̃ dλ = [a,b] b f, a ce qui donne bien l’égalité entre l’intégrale de Riemann de f et l’intégrale de Lebesgue d’une certaine fonction g égale à f λ-p.p. 2 8.2 Dérivées et primitives Proposition 8.5 Soit a ∈ R et f : [a, +∞[→ R borélienne. Si f est λ-localement R intégrable, au sens où pour tout b > a, f 1[a,b] ∈ L 1 (λ) alors la fonction F : x 7→ [a,x] f dλ est continue. Soit x ≥ a et une suite (xn ) convergeant vers x en croissant, et telle que xn 6= x pour tout n. Alors les fonctions f 1[a,xn ] convergent vers f 1[a,x[ tout en étant dominées par | f |1[a,x] qui est λ-intégrable par hypothèse. Donc par convergence dominée, Z Z Z lim F (xn ) = lim f 1[a,xn ] dλ = f 1[a,x[ dλ = f 1[a,x] dλ = F (x). Dém. n n Ceci prouve que F est continue à gauche. La démonstration est identique lorsque (xn ) est décroissante, ce qui prouve que F est aussi continue à droite. 2 Théorème 8.6 Soit [a, b] un intervalle compact de R et f : [a, b] → R une fonction dérivable de dérivée f 0 bornée. Alors f 0 est mesurable et l’intégrale de f 0 par rapport à λ est égale à sa primitive f au sens où Z f 0 dλ = f (b) − f (a). [a,b] Dém. Soit gn (x) := n f x+ 1 n 0 − f (x) si si x ∈ [a, b − 1/n] x ∈ ]b − 1/n, b]. Alors pour tout x ∈ [a, b[, limn gn (x) = f 0 (x), ce qui montre que f 0 1[a,b[ est mesurable comme limite de fonctions mesurables, et donc f 0 1[a,b] est mesurable. Par l’inégalité des CHAPITRE 8. APPLICATIONS 53 accroissements finis, pour tous n ∈ N et x ∈ [a, b], | gn (x) | ≤ M := sup[a,b] | f 0 | qui est fini par hypothèse. Or M 1[a,b] ∈ L 1 (λ) donc par convergence dominée, Z Z Z 0 lim gn dλ = f dλ = f 0 dλ. n→∞ [a,b] [a,b[ [a,b] Montrons à présent que l’on a également Z lim gn dλ = f (b) − f (a). n→∞ [a,b] Dans les égalités suivantes, nous utilisons la linéarité des intégrales de Lebesgue et de Riemann, ainsi que l’égalité entre ces intégrales due à la continuité de f : Z Z 1 − f (x) dλ(x) f x+ gn (x) dλ(x) = n n [a,b] [a,b−1/n] Z b−1/n ! Z b−1/n 1 f ·+ f = n − n a a Z b−1/n ! Z b f f− = n a a+1/n Z b Z f− = n ! a+1/n f a b−1/n Z Z f dλ − n = n [b−1/n,b] f dλ. [a,a+1/n] Ces passages entre intégrale de Riemann et de Lebesgue servent uniquement à justifier le changement de variable (translation, troisième égalité) que nous ne connaissons pas (encore) dans le cas de l’intégrale de Lebesgue. Il ne reste plus qu’à montrer que le second terme de la dernière différence tend vers f (a) quand n → ∞, et la même méthode s’appliquera pour montrer que le premier terme tend vers f (b). Soit αn := inf [a,a+1/n] f et βn := sup[a,a+1/n] f . Alors Z Z Z αn = n αn dλ ≤ n f dλ ≤ n βn dλ = βn , [a,a+1/n] [a,a+1/n] [a,a+1/n] mais comme f est continue, limn αn = limn βn = f (a), ce qui achève la démonstration.2 Remarque 8.7 Le théorème précédent serait faux si l’on ne faisait pas l’hypothèse que f 0 est bornée, comme on peut le voir sur le contre-exemple suivant : n Z 3 fn (x) := 1An dλ x ≥ 0, 2 [0,x] où An est le n-ième élément de la suite qui converge vers l’ensemble triadique de Cantor. En effet, la limite f de la suite (fn ), appelée fonction de Lebesgue, ou « escalier du diableR», est continue, dérivable λ-p.p. avec pour dérivée f 0 = 0 λ-p.p. (mais non bornée), donc [0,1] f 0 dλ = 0. Pourtant f (1) − f (0) = 1 − 0 = 1. CHAPITRE 8. APPLICATIONS 8.3 54 Intégrales dépendant d’un paramètre Théorème 8.8 Soit f : I × E → R, où I est un intervalle de R tel que pour tout t ∈ I, f (t, ·) : (E, A ) → (R, B(R) est mesurable. Alors a) S’il existe t0 ∈ I tel que pour µ-presque tout x, t 7→ f (t, x) est continue en t0 , et s’il existe g : (E, A ) → (R, B(R) intégrable telle que pour µ-presque tout x, pour tout t ∈ I, | f (t, x) | ≤ g(x), R alors la fonction h : t 7→ E f (t, x) dµ(x) est bien définie et elle est continue en t0 . b) Si pour tout t ∈ I, f (t, ·) est intégrable 2 , si pour µ-presque tout x, t 7→ f (t, x) est dérivable sur tout l’intervalle I, et s’il existe g1 : (E, A ) → (R, B(R) intégrable telle que ∂f pour µ-presque tout x, pour tout t ∈ I, (t, x) ≤ g1 (x), ∂t alors la fonction h est bien définie et est dérivable sur tout I, de dérivée Z ∂f 0 h (t) = (t, x) dµ(x) t ∈ I. E ∂t Remarque 8.9 Les hypothèses commençant par « pour µ-presque tout x » peuvent toutes (sauf une, voir plus bas) être affaiblies en échangeant les quantificateurs. Pour voir la différence, à titre d’exemple, l’assertion pour µ-presque tout x, pour tout t ∈ I, | f (t, x) | ≤ g(x), signifie qu’il existe un élément A de la tribu A de complémentaire négligeable, tel que pour tout x ∈ A, pour tout t ∈ I, | f (t, x) | ≤ g(x). D’autre part, l’assertion pour tout t ∈ I, pour µ-presque tout x, | f (t, x) | ≤ g(x), signifie que pour tout t ∈ I il existe un élément At de la tribu A , dépendant de t, de complémentaire négligeable, tel que pour tout x ∈ At , | f (t, x) | ≤ g(x). Si I était dénombrable les deux assertions seraient équivalentes, quitte à définir A, dans la première assertion, comme l’intersection de tous les ensembles At de la seconde assertion. Ici I est un intervalle, donc la seconde assertion peut inclure strictement la première. Lorsque nous n’utilisons dans la démonstration que des suites à valeurs dans I, cette distinction est sans conséquence. En revanche, la domination des dérivées partielles doit être énoncée telle quelle, pour avoir une inégalité des accroissements finis vraie p.p. 2. pour que h soit bien définie CHAPITRE 8. APPLICATIONS 55 a) Pour tout t ∈ I, la domination p.p. de f (t, ·) par la fonction intégrable g garantit que f (t, ·) est intégrable et donc que h est bien définie. Soit une suite (sn ) de I de limite t0 . Montrons que limn h(sn ) = h(t0 ). Soit fn (x) := f (sn , x). De la continuité pour p.t. x de la fonction f (·, x) en t0 , on déduit la convergence p.p. de fn vers f (t0 , ·). Comme la suite (fn ) est dominée p.p. par la fonction intégrable g, le théorème de convergence dominée assure que Z Z lim h(sn ) = lim fn dµ = f (t0 , x) dµ(x) = h(t0 ), Dém. n n E E ce qui est la limite souhaitée. b) Soit t ∈ I et (sn ) une suite de I convergeant vers t telle que sn 6= t pour tout n. Soit fn : (E, A ) → (R, B(R)) la fonction intégrable suivante fn (x) := f (sn , x) − f (t, x) sn − t x ∈ E. Alors pour p.t. x, la suite (fn ) converge vers ∂f /∂t(t, x), ce qui fait de cette dérivée partielle une fonction mesurable de x. L’hypothèse de R domination p.p. de cette fonction mesurable par la fonction intégrable g1 garantit que E ∂f /∂t(t, x) dµ(x) est bien définie pour tout t ∈ I. De plus, par l’intégrabilité de fn Z Z Z h(sn ) − h(t) 1 f (t, ·) dµ = fn dµ = f (sn , ·) dµ − . sn − t sn − t E E E Or par l’inégalité des accroissements finis, pour µ-presque tout x, ∂f | fn (x) | ≤ sup (s, x) ≤ g1 (x), ∂t s∈I et comme g1 est intégrable, on obtient h(sn ) − h(t) lim = lim n n sn − t Z Z fn dµ = E par le théorème de convergence dominée. 8.4 8.4.1 E ∂f (t, x) dµ(x) ∂t 2 Applications Dérivation sous le signe somme Soit (un ) une suite de P fonctions dérivables sur un intervalle I de R telle que (i) pour tout t ∈ I, n | un (t) | converge ; P 0 (ii) pour tout Pt ∈ I, | un (t) | ≤ wn pour une suite (wn ) telle que n wn < ∞. 0 Alors n un (t) est bien définie et est dérivable en tout t ∈ I, avec S (t) = P 0 S(t) := u (t). n n CHAPITRE 8. APPLICATIONS 8.4.2 56 Convolution Soit f ∈ L 1 (R, B(R), λ) et ϕ dérivable de dérivée bornée. Alors la fonction f ? ϕ définie par Z f ? ϕ(t) := ϕ(t − x) f (x) dλ(x) t ∈ R, R est bien définie et dérivable sur R de dérivée Z 0 (f ? ϕ) (t) = ϕ(t − x) f (x) dλ(x) = f ? ϕ0 (t). R 8.4.3 Transformée de Fourier R Soit f : R → R λ-intégrable et F (t) := R eitx f (x) dλ(x). Si x 7→ xf (x) est intégrable, alors F est dérivable sur R et Z 0 F (t) = i eitx xf (x) dλ(x). R Chapitre 9 Tribu produit, mesure produit 9.1 9.1.1 Tribu produit Cas général Soient (E1 , A1 ) et (E2 , A2 ) deux espaces mesurables. Définition 9.1 On appelle tribu produit sur E1 × E2 , et l’on note A1 ⊗ A2 , la plus petite tribu contenant les pavés à côtés mesurables : A1 ⊗ A2 := σ (A1 × A2 ) , où l’on a noté A1 × A2 := {A1 × A2 : A1 ∈ A1 , A2 ∈ A2 }. Le couple (E1 × E2 , A1 ⊗ A2 ) est appelé espace mesurable produit. Remarque 9.2 La famille A1 × A2 des pavés à côtés mesurables n’est en général pas une tribu. Proposition 9.3 La tribu A1 ⊗ A2 est aussi la tribu engendrée par les projections canoniques π1 et π2 , c’est-à-dire la plus petite tribu sur E1 ×E2 qui rende π1 et π2 mesurables 1 . Soit B la tribu engendrée par π1 et π2 . Par définition, B est la plus petite tribu contenant les parties de E1 × E2 de la forme π1−1 (A1 ) et π2−1 (A2 ) où Ai ∈ Ai , i = 1, 2. Or π1−1 (A1 ) = A1 × E2 et π2−1 (A2 ) = E1 × A2 , donc B est aussi la plus petite tribu qui contient les parties de E1 × E2 de la forme (A1 × E2 ) ∩ (E1 × A2 ) = A1 × A2 , c’est-à-dire σ(A1 × A2 ). 2 Dém. Proposition 9.4 Soit f : (X, T ) −→ (E1 × E2 , A1 ⊗ A2 ) x 7−→ f (x) = (f1 (x), f2 (x)) Alors la fonction f est mesurable ssi f1 et f2 sont mesurables 2 . 1. On rappelle que π1 et π2 sont définies par : π1 (x, y) = x et que π2 (x, y) = y 2. comme fonctions de (X, T ) vers (E1 , A1 ) et (E2 , A2 ) respectivement 57 CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 58 Sens direct de l’équivalence : si f est mesurable alors pour tout i = 1, 2, fi = πi ◦f est mesurable comme composée de fonctions mesurables. Réciproquement, supposons f1 et f2 mesurables. Alors pour tous A1 ∈ A1 et A2 ∈ A2 , Dém. f −1 (A1 × A2 ) = {x ∈ X : f (x) ∈ A1 × A2 } = {x ∈ X : f1 (x) ∈ A1 , f2 (x) ∈ A2 } = f1−1 (A1 ) ∩ f2−1 (A2 ). Par hypothèse f1−1 (A1 ) ∈ T et f2−1 (A2 ) ∈ T , donc f −1 (A1 × A2 ) ∈ T par stabilité des tribus par intersection. En conclusion, f −1 (A1 × A2 ) ⊆ T , donc f −1 (A1 ⊗ A2 ) = σ f −1 (A1 × A2 ) ⊆ T , où la première égalité est une application du lemme de transport, et l’inclusion n’est autre que la mesurabilité de f . 2 Remarque 9.5 Ce qui précède peut s’énoncer de manière similaire pour tout produit cartésien fini d’ensembles. Si ((Ei , Ai ))1≤i≤d sont d espaces mesurables, alors on définit A1 ⊗ · · · ⊗ Ad comme la plus petite tribu sur E1 × · · · × Ed contenant tous les pavés de la forme A1 × · · · × Ad , où Ai ∈ Ai pour tous i = 1, . . . , d ; c’est aussi la tribu engendrée par les projections canoniques πi : d Y Ej −→ Ei j=1 (x1 , . . . , xd ) 7−→ xi pour i parcourant {1, . . . , d}. Proposition 9.6 (associativité de ⊗) On a l’égalité suivante entre tribus (A1 ⊗ · · · ⊗ Aj ) ⊗ (Aj+1 ⊗ · · · ⊗ Ad ) = A1 ⊗ · · · ⊗ Ad , où l’on a identifié (E1 × · · · × Ej ) × (Ej+1 × · · · × Ed ) et E1 × · · · × Ed . Montrons la proposition dans le cas où j = 2 et d = 3. La tribu (A1 ⊗ A2 ) ⊗ A3 est la plus petite tribu qui rende mesurables les applications Dém. f1,2 : E1 × E2 × E3 −→ (E1 × E2 , A1 ⊗ A2 ) ((x1 , x2 ), x3 ) 7−→ (x1 , x2 ) et f3 : E1 × E2 × E3 −→ (E3 , A3 ) ((x1 , x2 ), x3 ) 7−→ x3 Or f1,2 est mesurable ssi ses applications coordonnées le sont. Par conséquent, ces deux applications sont mesurables ssi les trois applications (x1 , x2 , x3 ) 7→ xi , pour i = 1, 2, 3, sont mesurables. Donc (A1 ⊗ A2 ) ⊗ A3 est la tribu engendrée par ces trois applications, c’est donc A1 ⊗ A2 ⊗ A3 . 2 CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 9.1.2 59 Le cas borélien Lorsque E1 et E2 sont des espaces topologiques, la tribu borélienne Bor(E1 × E2 ) sur E1 × E2 est la tribu engendrée par la topologie produit, dont les éléments sont les réunions (quelconques) de produits d’ouverts (dits aussi pavés à côtés ouverts). Proposition 9.7 a) On a toujours l’inclusion Bor(E1 ) ⊗ Bor(E2 ) ⊆ Bor(E1 × E2 ). b) Si E1 et E2 sont tous deux à base dénombrable d’ouverts (en particulier si E1 et E2 sont des espaces métriques séparables), alors l’inclusion précédente devient une égalité. a) Par définition de la topologie produit, πi : E1 × E2 → Ei est continue pour i = 1, 2 (i = 1 : si O1 est un ouvert de E1 , π1−1 (O1 ) = O1 × E2 est un ouvert de E1 × E2 ), et par conséquent πi est borélienne 3 . Or la plus petite tribu qui rende mesurables π1 et π2 est Bor(E1 ) ⊗ Bor(E2 ), d’où le résultat. (i) b) Pour tout i = 1, 2, soit Ui = (Un )n∈N une base dénombrable d’ouverts de Ei , c’est-à-dire que tout ouvert de Ei peut s’écrire comme réunion (forcément dénombrable, donc) d’éléments de Ui . Par définition de la topologie produit, tout ouvert Ω de E1 × E2 est une réunion (quelconque, cette fois) de produits d’ouverts [ (1) (2) Ω= Oj × Oj , Dém. j∈J (i) où J est un ensemble d’indices quelconque et pour tous i, j, Oj est un ouvert de Ei . (i) (i) Comme Oj est un ouvert de Ei , Oj s’écrit comme réunion d’éléments de Ui , c’est-à-dire (i) qu’il existe une partie Kj de N telle que [ (i) (i) Oj = Uh , (i) h∈Kj et ainsi [ [ (1) (2) (1) (2) Oj × Oj = Uh × Uk = (1) h∈Kj (2) [ (1) (1) (2) Uh × Uk . (2) (h,k)∈Kj ×Kj k∈Kj En conclusion, Ω= [ (1) (2) Uh × Uk , (1) (2) (h,k)∈∪j∈J Kj ×Kj (1) (2) qui est une réunion dénombrable de produits d’ouverts car ∪j∈J Kj ×Kj ⊆ N2 . Comme un produit d’ouverts est élément de Bor(E1 ) ⊗ Bor(E2 ), c’est le cas également de Ω, 3. sans ambiguïté : l’espace d’arrivée Ei est muni de sa tribu borélienne Bor(Ei ) et l’espace de départ E1 ×E2 est muni de sa tribu borélienne Bor(E1 × E2 ) CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 60 par stabilité des tribus par réunion dénombrable. Ainsi les ouverts de E1 × E2 sont des éléments de la tribu Bor(E1 )⊗Bor(E2 ), et par conséquent la plus petite tribu contenant les ouverts de E1 × E2 , à savoir Bor(E1 × E2 ), est incluse dans Bor(E1 ) ⊗ Bor(E2 ). 2 Corollaire 9.8 Comme R est un espace métrique séparable, Bor(R)⊗Bor(R) = Bor(R2 ) et plus généralement, pour tout entier d ≥ 2, Bor(R)⊗d = Bor(Rd ). Ce corollaire permet, par exemple, de voir pourquoi, si f, g : R → R sont deux fonctions boréliennes, alors f + g et f g sont aussi boréliennes. En effet, l’application somme S S : (R2 , Bor(R2 )) −→ (R, Bor(R)) (x, y) 7−→ x + y et l’application produit P P : (R2 , Bor(R2 )) −→ (R, Bor(R)) (x, y) 7−→ xy sont boréliennes car continues. De plus, l’application C : (R, Bor(R)) −→ (R2 , Bor(R) ⊗ Bor(R)) x 7−→ (f (x), g(x)) est mesurable, car les deux applications coordonnées f et g sont mesurables. Ayant l’égalité entre Bor(R2 ) et Bor(R) ⊗ Bor(R), on a donc la mesurabilité de f + g = S ◦ C et de f g = P ◦ C. 9.1.3 Sections Définition 9.9 Si C ∈ A1 ⊗ A2 , pour tous x1 ∈ E1 et x2 ∈ E2 , on note Cx1 := {y2 ∈ E2 : (x1 , y2 ) ∈ C} et C x2 := {y1 ∈ E1 : (y1 , x2 ) ∈ C}, que l’on appelle sections de C. Proposition 9.10 Soit f ∈ F (A1 ⊗A2 , Bor(R)). Alors pour tout x1 ∈ E1 , l’application partielle fx1 : (E2 , A2 ) −→ (R, Bor(R)) x2 7−→ f (x1 , x2 ) est mesurable. Remarque 9.11 Attention, la réciproque est fausse : le fait que toutes les applications partielles soient mesurables n’implique pas forcément que f soit mesurable. CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT Dém. 61 L’application gx1 : (E2 , A2 ) −→ (E1 × E2 , A1 ⊗ A2 ) x2 7−→ (x1 , x2 ) est mesurable car chacune des applications coordonnées l’est de façon évidente. Donc fx1 = f ◦ gx1 est mesurable. 2 Proposition 9.12 Les sections d’éléments de la tribu produit sont mesurables. Autrement dit, pour tout C ∈ A1 ⊗ A2 et pour tous x1 ∈ E1 et x2 ∈ E2 : Cx1 ∈ A2 et C x2 ∈ A1 . Il suffit d’appliquer la proposition précédente à la fonction f = 1C , qui est mesurable par hypothèse. On obtient donc que fx1 est mesurable, mais fx1 = 1Cx1 , donc Cx1 ∈ A2 . 2 Dém. 9.2 Mesure produit Soient µ1 et µ2 deux mesures σ-finies, sur (E1 , A1 ) et (E2 , A2 ) respectivement. Lemme 9.13 Pour tout C ∈ A1 ⊗ A2 , l’application hC : (E1 , A1 ) −→ (R̄+ , Bor(R̄+ )) x1 7−→ µ2 (Cx1 ) est mesurable. Dém. Supposons d’abord que µ2 est finie, soit C := {C ∈ A1 ⊗ A2 : hC est mesurable} et montrons que C = A1 ⊗ A2 . En effet d’une part C contient A1 × A2 . En effet, pour tout C = A1 × A2 ∈ A1 × A2 , A2 si x1 ∈ A1 C x1 = ∅ sinon, donc hC = µ2 (A2 )1A1 , qui est bien mesurable. D’autre part C est une classe monotone. En effet i) C contient E ; ii) Soient C ⊆ D deux éléments de C . Alors hC et hD sont mesurables, et hD\C = hD − hC , car (D \ C)x1 = Dx1 \ Cx1 , avec Cx1 ⊆ Dx1 . Donc hD\C est mesurable, et D \ C ∈ C. iii) Soit (C (n) )n une suite croissante d’éléments de C et C sa limite. Alors la suite (n) (Cx1 ) est croissante, donc par continuité à gauche de la mesure µ2 , hC (x1 ) = µ2 ((∪n C (n) )x1 ) = µ2 (∪n Cx(n) ) = µ2 (lim ↑ Cx(n) ) = lim ↑ µ2 (Cx(n) ) = lim hCn (x1 ), 1 1 1 n n n CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 62 qui est bien mesurable, comme limite de fonctions mesurables. Par conséquent C contient la classe monotone engendrée M (A1 × A2 ). Or A1 × A2 est stable par intersections finies, donc le théorème de la classe monotone assure que M (A1 × A2 ) = σ(A1 × A2 ), qui n’est autre que A1 ⊗ A2 par définition. Ainsi C contient A1 ⊗ A2 . La proposition est donc démontrée dans le cas où µ2 est finie. (n) Si µ2 est seulement σ-finie, alors par définition, il existe une suite croissante (E2 )n (n) d’éléments de A2 convergeant vers E2 telle que µ2 (E2 ) < ∞ pour tout entier n. En (n) particulier, pour tout A2 ∈ A2 , µ2 (A2 ) = limn ↑ µ2 (A2 ∩ E2 ). En appliquant ce qui (n) précède à la mesure trace de µ2 sur E2 , on obtient que l’application hn : x1 7→ µ2 (Cx1 ∩ (n) E2 ) est mesurable, et par conséquent l’application hC est également mesurable, comme limite (croissante) de la suite de fonctions (hn ). 2 Théorème 9.14 Il existe une unique mesure m sur l’espace produit (E1 × E2 , A1 ⊗ A2 ) vérifiant m(A1 × A2 ) = µ1 (A1 )µ2 (A2 ) pour tous A1 ∈ A1 et A2 ∈ A2 . Cette mesure est σ-finie et est appelée mesure produit. On la note m = µ1 ⊗ µ2 . De plus, pour tout C ∈ A1 ⊗ A2 , Z Z µ2 (Cx1 ) dµ1 (x1 ) = µ1 ⊗ µ2 (C) = µ1 (C x2 ) dµ2 (x2 ). E1 E2 En utilisant la coïncidence des deux mesures sur les pavés à côtés mesurables, on en déduit : Proposition 9.15 La mesure de Lebesgue λd sur (Rd , Bor(Rd )) est aussi la mesure produit λ1⊗d . Remarque 9.16 Le théorème 9.14 est faux lorsque µ1 ou µ2 n’est pas σ-finie. Soit en effet par exemple la mesure de Lebesgue sur (E1 , A1 ) = (R, Bor(R)) pour µ1 (qui est bien σ-finie), et la mesure de comptage sur (E2 , A2 ) = (R, P(R)) pour µ2 (qui n’est pas σ-finie). En prenant par exemple C = {(x, x) : x ∈ R} la première bissectrice de R2 , alors Cx1 = {x1 } et C x2 = {x2 }, donc µ1 (C x2 ) = 0, tandis que µ2 (Cx1 ) = 1. Par conséquent, Z Z µ2 (Cx1 ) dµ1 (x1 ) = µ1 (E1 ) = +∞ = 6 0= µ1 (Cx2 ) dµ2 (x2 ). E1 E2 a) Unicité. Si m et m0 vérifient la propriété du théorème, c’est qu’elles coïncident sur la classe A1 × A2 qui contient E1 × E2 , engendre A1 ⊗ A2 et est stable par intersection finie. De plus, comme µ1 et µ2 sont toutes deux σ-finies, (n) alors pour i = 1, 2, il existe une suite croissante (Ei ) d’éléments de Ai convergeant (n) (n) (n) vers Ei et tels que µi (Ei ) < ∞. Alors m(Cn ) = m0 (Cn ) = µ1 (E1 ) µ2 (E2 ) < ∞ si (n) (n) Cn = E1 × E2 , avec ∪n Cn = E1 × E2 . Ceci permet de conclure que m = m0 par le Corollaire 4.25. Dém. du théorème 9.14. CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 63 b) Existence. On définit m1 : A1 ⊗ A2 → R̄+ par Z µ2 (Cx1 ) dµ1 (x1 ). m1 (C) := E1 Montrons que m1 est une mesure. i) m1 (∅) = 0 car toutes les sections de l’ensemble vide sont vides. ii) Soit (C (n) ) une suite d’éléments de A1 ⊗ A2 deux à deux disjoints. Alors pour tout (n) (n) x1 ∈ E1 , les sections (Cx1 ) sont deux à deux disjointes et ∪n C (n) x1 = ∪n Cx1 , si bien que, par le théorème de Beppo Levi, ! Z X XZ X (n) (n) (n) = µ2 Cx1 dµ1 (x1 ) = , m1 ∪n C µ2 Cx(n) dµ (x ) = m C 1 1 1 1 E1 n n E1 n ce qui prouve la σ-additivité de m1 . De plus, pour tous A1 ∈ A1 et A2 ∈ A2 , et pour tout x1 ∈ E1 , la section (A1 × A2 )x1 vaut A2 si x1 ∈ A1 et est vide sinon. Ainsi, Z m1 (A1 × A2 ) = µ2 (A2 ) dµ1 (x1 ) = µ1 (A1 )µ2 (A2 ). A1 Il existe donc bien une mesure m = m1 satisfaisant m(A1 × A2 ) = µ1 (A1 )µ2 (A2 ) et cette mesure vérifie Z m(C) = µ2 (Cx1 ) dµ1 (x1 ). E1 De même, on définit la mesure m2 par Z m2 (C) := µ1 (C x2 ) dµ2 (x2 ), E2 et l’on montre que m2 est une mesure qui coïncide avec m sur A1 × A2 , donc est égale à m (cf. a)). On se reportera aussi à a) pour voir que m est σ-finie. 2 9.3 Théorèmes de Fubini Théorème 9.17 (de Fubini–Tonelli) Si f : (E1 × E2 , A1 ⊗ A2 ) → (R̄+ , Bor(R̄+ )) est mesurable, alors les fonctions φ et ψ définies resp. sur E1 et E2 par Z Z φ(x1 ) := f (x1 , x2 ) dµ2 (x2 ) et ψ(x2 ) := f (x1 , x2 ) dµ1 (x1 ) E2 E1 sont toutes deux mesurables et dans R̄+ Z Z Z φ dµ1 = f d(µ1 ⊗ µ2 ) = E1 E1 ×E2 E2 ψ dµ2 . (9.1) CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 64 Si f = 1C pour C ∈ A1 ⊗ A2 , alors φ(x1 ) = µ2 (Cx1 ) et ψ(x2 ) = µ1 (Cx2 ), et donc 9.13 assure que φ et ψ sont mesurables et les trois termes de l’équation (9.1) sont égaux à µ1 ⊗ µ2 (C) par le théorème 9.14. Cette assertion s’étend aux fonctions étagées positives pas linéarité de l’intégrale, puis aux fonctions mesurables positives par le lemme fondamental d’approximation et le théorème de Beppo Levi. 2 Dém. Théorème 9.18 (de Fubini–Lebesgue) Soit f comme dans le théorème de Fubini– Tonelli mais de signe quelconque, et µ1 ⊗ µ2 -intégrable. Alors les fonctions φ et ψ du théorème sont resp. définies µ1 -p.p. et µ2 -p.p., sont resp. µ1 -intégrables et µ2 -intégrables, et vérifient la double égalité (9.1) dans R. Dém. On définit Z φ+ (x1 ) = f + (x1 , x2 ) dµ2 (x2 ), E2 ainsi que de manière évidente, φ− , ψ+ et ψ− . D’après le théorème de Fubini–Tonelli, Z Z Z + φ+ dµ1 = f d(µ1 ⊗ µ2 ) = ψ+ dµ2 , E1 ×E2 E1 E2 qui est un nombre réel fini par hypothèse (se référer au terme du milieu). Par conséquent, φ+ est finie µ1 -p.p. et ψ+ est finie µ2 -p.p., ainsi que φ− et ψ− respectivement. Donc la fonction φ est définie µ1 -p.p. (comme différence de deux fonctions finies p.p.) et l’intégrale de | φ | est finie car égale à la somme des intégrales de φ+ et de φ− , qui sont toutes deux finies. Le résultat analogue se démontre de la même manière pour ψ, et ainsi l’égalité (9.1) s’obtient en faisant la différence de deux quantités finies. 2 Remarque 9.19 Si f est positive, le théorème de Fubini–Tonelli assure que l’intégrale de f par rapport à µ1 ⊗ µ2 peut toujours se calculer en faisant deux intégrales « simples » successives dans l’ordre que l’on souhaite. Si f est de signe quelconque, il faut, pour appliquer le théorème de Fubini-Lebesgue, d’abord vérifier l’intégrabilité de | f | par rapport à µ1 ⊗ µ2 en utilisant le théorème de Fubini–Tonelli (il suffit de vérifier que l’une des intégrales« doubles » est finie). Remarque 9.20 Par convention d’écriture, on écrira invariablement : Z Z hZ i f d(µ1 ⊗ µ2 ) = f (x1 , x2 ) dµ2 (x2 ) dµ1 (x1 ) E1 ×E2 E1 E2 Z hZ Z Z i = f (x1 , x2 ) dµ1 (x1 ) dµ2 (x2 ) = f (x1 , x2 ) dµ1 (x1 )dµ2 (dx2 ). E2 E1 E1 E2 Remarque 9.21 Si (an,m ) est une suite doublement indicée de nombres réels positifs et si µ est la mesure de comptage sur (N, P(N)), alors l’interversion suivante XX XX an,m = an,m n m m n CHAPITRE 9. TRIBU PRODUIT ET MESURE PRODUIT 65 R P peut être vue comme une application du théorème de Beppo Levi, car m an,m = N an,m dµ(m), comme du théorème de Fubini–Tonelli, car les termes de l’équation sont tous deux égaux R à N×N an,m dµ⊗2 (n, m). Chapitre 10 Mesure image et changement de variable 10.1 Mesure image Soient (E1 , A1 ) et (E2 , A2 ) deux espaces mesurables, µ une mesure sur (E1 , A1 ) et h ∈ F (A1 , A2 ). Définition 10.1 (et proposition) L’égalité ν(A2 ) := µ h−1 (A2 ) A2 ∈ A2 définit une mesure ν sur (E2 , A2 ) appelée mesure image et notée µ ◦ h−1 , h]µ, h(µ), ou encore µh . i) ν(∅) = µ(h−1 (∅)) = µ(∅) = 0. ii) Soit (Bn ) une suite d’éléments de A2 deux à deux disjoints, alors d’après les formules de Hausdorff, pour tous i 6= j, Dém. h−1 (Bi ) ∩ h−1 (Bj ) = h−1 (Bi ∩ Bj ) = h−1 (∅) = ∅, et ainsi X X ν (∪n Bn ) = µ h−1 (∪n Bn ) = µ ∪n h−1 (Bn ) = µ h−1 (Bn ) = ν(Bn ), n n 2 par σ-additivité de µ. Théorème 10.2 Soit f ∈ F (A2 , Bor(R)). Si f est positive µh -p.p. alors dans R̄+ Z Z f dµh = f ◦ h dµ. (10.1) E2 E1 De même, f est µh -intégrable ssi f ◦h est µ-intégrable, et on a alors l’égalité (10.1) dans R. 66 CHAPITRE 10. MESURE IMAGE ET CHANGEMENT DE VARIABLE Dém. Z 67 Si f = 1B , où B ∈ A2 , alors Z Z Z −1 f ◦ h dµ = 1B ◦ h dµ = 1h−1 (B) dµ = µ h (B) = µh (B) = E1 E1 E1 f dµh . E2 La linéarité de l’intégrale, le lemme fondamental d’approximation et le théorème de Beppo Levi impliquent (10.1) dès que f est positive µh -p.p. L’extension aux fonctions mesurables de signe quelconque et l’équivalence des intégrabilités se déduisent de la décomposition f = f + − f − . 2 Application. Soit h ∈ F (A , A ) telle que µh = µ. Alors Z Z f dµ = f ◦ h dµ E E pour toute fonction positive µ-p.p. ou µ-intégrable. En particulier, si µ est la mesure de Lebesgue sur Rd et h = τa est la translation de vecteur a ∈ Rd , alors µh = µ et donc Z Z f dλ. f (x + a) dλ(x) = Rd Rd À partir de maintenant on suppose que µ = λd dans Rd , que l’on note λ. Proposition 10.3 Soit A ∈ GLd (R) et b ∈ Rd . Soit h l’application affine définie par h(x) = Ax + b. Alors λh = | det A |−1 λ. En particulier, pour tout f positive ou λ-intégrable, on a Z Z 1 f ◦ h dλ = f dλ. | det A | Rd Rd Soit Bn (r) la boule (centrée sur l’origine) de rayon r dans Rn muni de la norme euclidienne. Alors par la proposition précédente, si h est l’homothétie de paramètre r−1 , Application (vue en détail en TD) : calcul du volume de la boule unité. Vol(Bn (r)) = λ(h−1 (Bn (1))) = | det(h) |−1 λ(Bn (1)) = rn λ(Bn (1)). D’autre part si cn := Vol(Bn (1)), alors Z 1 Z Z cn = dx1 dx2 · · · dxn = −1 x22 +···+x2n ≤1−x21 1 q dx1 Vol Bn−1 1 − x21 = cn−1 In−1 , −1 où Z 1 In := 1 − x2 n/2 dx. −1 Une intégration par parties permet de voir que In = nIn−2 /(n + 1). Après calculs, on obtient pour tout entier k c2k = πk , k! c2k+1 = 2k+1 π k . 1 · 3 · 5 · · · (2k + 1) On retrouve ainsi c1 = 2, c2 = π et c3 = 4π/3. CHAPITRE 10. MESURE IMAGE ET CHANGEMENT DE VARIABLE 68 Montrons qu’on peut supposer que b = 0. Admettons la proposition dans le cas où b = 0, c’est-à-dire que λ ◦ A−1 = | det A |−1 λ. Maintenant si h(x) = Ax + b, c’est-à-dire h = τb ◦ A, on a Dém. de la proposition. λ ◦ h−1 = λ ◦ (τb ◦ A)−1 = λ ◦ A−1 ◦ τb−1 = | det A |−1 λ ◦ τb−1 = | det A |−1 λ. On peut donc supposer dorénavant que b = 0. Soit ν := λ ◦ A−1 . Il faut montrer que ν = | det A |−1 λ. Montrons d’abord que ν est invariante par translation. En effet, comme pour tout c ∈ Rd , A−1 ◦ τc−1 (x) = A−1 (x − c) = A−1 (x) − A−1 (c) = τ−A−1 (c) ◦ A−1 (x), ν ◦ τc−1 = λ ◦ A−1 ◦ τc−1 = λ ◦ τ−A−1 (c) ◦ A−1 = λ ◦ A−1 = ν. Soit Cd le rectangle unité [0, 1]d . Montrons que ν(Cd ) > 0. Comme Rd ⊆ ∪x∈Zd (x + Cd ), par invariance par translation de ν, X X ν Rd ≤ ν(x + Cd ) = ν(Cd ). x∈Zd x∈Zd Ainsi,si ν(Cd ) = 0, alors ν Rd = 0, ce qui n’est pas possible car ν Rd = λ◦A−1 Rd = λ Rd = +∞. Montrons maintenant que ν(Cd ) < ∞. L’application A−1 est linéaire, donc continue, donc l’image Cd0 du compact (fermé borné) Cd par A−1 est également compacte. 0 Comme λ est finie sur les compacts, ν(Cd ) = λ(Cd ) < ∞. −1 d Soit c = c(A) = λ ◦ A [0, 1] . D’après ce qui précède, c ∈]0, ∞[ et ν 0 = c−1 ν est une mesure invariante par translation telle que ν 0 [0, 1]d = 1, donc ν 0 est la mesure de Lebesgue sur Rd . Il suffit donc de montrer que c(A) = | det A |−1 . Montrons que c est un morphisme. Si ϕ1 et ϕ2 sont deux endomorphismes inversibles de Rd , alors d’après ce qui précède, λ ◦ (ϕ1 ◦ ϕ2 )−1 = c(ϕ1 ◦ ϕ2 ) λ, mais également −1 −1 λ ◦ (ϕ1 ◦ ϕ2 )−1 = λ ◦ ϕ−1 2 ◦ ϕ1 = c(ϕ2 ) λ ◦ ϕ1 = c(ϕ2 ) c(ϕ1 ) λ, ce qui implique effectivement que c(ϕ1 ◦ ϕ2 ) = c(ϕ1 ) c(ϕ2 ). Comme tout endomorphisme inversible Φ de Rd s’écrit comme produit fini d’endomorphismes du type ϕ1 , ϕ2 , ϕ3 , où (en écrivant ei le i-ème vecteur de la base canonique) ϕ1 (ei ) = eσ(i) ϕ2 (e1 ) = αe1 pour σ une permutation de {1, . . . , d}, et ϕ2 (ej ) = ej ∀j 6= 1 ϕ3 (e1 ) = e1 + e2 , et (avec α 6= 0), ϕ3 (ej ) = ej ∀j 6= 1, il suffit de montrer que c(ϕ) = | det ϕ |−1 pour chacune de ces trois (sortes d’)applications. En effet, ceci étant démontré, nous aurons pour Φ = Πni=1 φi , où les φi sont du type ciavant (et où le produit est un produit matriciel, c’est à-dire une composition), c(Φ) = c (Πni=1 φi ) = Πni=1 c(φi ) = Πni=1 | det φi |−1 = | Πni=1 det φi |−1 = | det Φ |−1 . CHAPITRE 10. MESURE IMAGE ET CHANGEMENT DE VARIABLE 69 Le rectangle unité Cd est invariant par ϕ1 donc c(ϕ1 ) = λ(Cd ) = 1 = | det ϕ1 |−1 . Dans le cas de ϕ2 , ϕ−1 2 (Cd ) = Iα × Cd−1 , où Iα = [0, 1/α] si α > 0 et Iα = [1/α, 0] si α < 0. Par conséquent c(ϕ2 ) = λ1 (Iα )λd−1 (Cd−1 ) = | α |−1 = | det ϕ2 |−1 . Enfin, ϕ−1 3 (Cd ) = P2 × Cd−2 , où P2 est un losange du plan d’aire 1, donc c(ϕ3 ) = λ2 (P2 )λd−2 (Cd−2 ) = 1 = | det ϕ3 |−1 , ce qui achève la démonstration. 2 10.2 Formule du changement de variable Soient U et V deux ouverts de Rd et φ un C 1 -difféomorphisme entre U et V , c’est-àdire une bijection φ : U → V telle que φ est de classe C 1 sur U et φ−1 est de classe C 1 sur V . Pour tout u ∈ U , on note φ0 (u) la matrice carrée d × d des dérivées partielles de φ évaluées en u, autrement dit la matrice représentative de l’application linéaire tangente à φ en u, appelée matrice jacobienne de φ en u. On note Jφ (u) le déterminant de φ0 (u), appelé jacobien de φ en u. Nous allons montrer que l’image par φ de la mesure de densité | Jφ | par rapport à λ (sur U ) est λ (sur V ), et que l’image par φ de λ (sur U ) est la mesure de densité | Jφ−1 | par rapport à λ (sur V ). Théorème 10.4 (formule de changement de variable) Soit f une fonction borélienne sur V . Si f est positive ou λ-intégrable, alors Z Z f ◦ φ | Jφ | dλ. f dλ = V U De manière équivalente, si f est positive ou si f ◦ φ est λ-intégrable, alors Z Z f ◦ φ dλ = f | Jφ−1 | dλ. U V Remarque 10.5 En dimension 1, si φ :]α, β[−→]a, b[ est un C 1 -difféomorphisme, alors φ0 ne peut pas s’annuler et en particulier, φ0 est de signe constant. Avec les notations de l’intégrale de Riemann, si l’on applique la formule de changement de variable pour cette intégrale, on retombe bien entendu sur la formule du théorème précédent. Si φ0 > 0, alors Z b Z φ−1 (b) Z β 0 f (x) dx = f ◦ φ(u) φ (u) du = f ◦ φ(u) | φ0 (u) | du. φ−1 (a) a α 0 Si φ < 0, alors Z b Z f (x) dx = a φ−1 (b) φ−1 (a) 0 Z β f ◦ φ(u) φ (u) du = − 0 Z β f ◦ φ(u) φ (u) du = α f ◦ φ(u) | φ0 (u) | du. α Corollaire 10.6 Si µ est la mesure de densité f par rapport à λ et si φ : Rd → Rd est un C 1 -difféomorphisme, alors la mesure image de µ par φ admet une densité g par rapport à λ, et g est donnée par g(x) = f ◦ φ−1 (x) | Jφ−1 (x) | x ∈ Rd . CHAPITRE 10. MESURE IMAGE ET CHANGEMENT DE VARIABLE Dém. 70 Pour toute fonction borélienne positive h, en se servant du théorème précédent, Z Z Z Z −1 h dµφ = h ◦ φ f dλ = h ◦ φ f ◦ φ ◦ φ dλ = h f ◦ φ−1 | Jφ−1 | dλ, ce qui prouve le corollaire (en prenant une indicatrice pour h). 2 Remarque 10.7 Pour vérifier que φ est un C 1 -difféomorphisme, on applique ordinairement le théorème d’inversion locale : soit U un ouvert de Rd et φ : U → Rd . Soit V := φ(U ). Alors φ est un C 1 -difféomorphisme entre U et V ssi i) φ est injective ; ii) φ est de classe C 1 ; iii) pour tout u ∈ U , Jφ (u) 6= 0. 0 −1 Sous ces conditions, V est un ouvert et pour tout x ∈ V , (φ−1 ) (x) = (φ0 ◦ φ−1 (x)) . Exemple 10.8 (coordonnées polaires) Par le théorème d’inversion locale, la fonction φ : ]0, ∞[×]0, 2π[ −→ R2 \ ([0, ∞[×{0}) (ρ, θ) 7−→ (ρ cos θ, ρ sin θ) est un C 1 -difféomorphisme, avec 0 φ (ρ, θ) = cos θ −ρ sin θ sin θ ρ cos θ et Jφ (ρ, θ) = ρ. Ainsi pour toute fonction borélienne f λ2 -intégrable, Z Z f (x, y) dx dy = f (x, y) dx dy R2 R2 \([0,∞[×{0}) Z Z = f ◦ φ(ρ, θ) Jφ (ρ, θ) dρ dθ = f ◦ φ(ρ, θ) ρ dρ dθ. ]0,∞[×]0,2π[ [0,∞[×[0,2π] −x2 R En particulier, l’intégrale I = R e dx peut se calculer comme suit, grâce à deux applications du théorème de Fubini–Tonelli : Z Z Z 2 2 −(x2 +y 2 ) −ρ2 I = e dx dy = e ρ dρ dθ = 2π e−ρ ρ dρ = π, R2 [0,∞[×[0,2π] d’où l’égalité bien connue I = √ [0,∞[ π. La démonstration de la formule du changement de variable est technique. L’idée en est la suivante. On recouvre l’ouvert U par une réunion dénombrable d’hypercubes semiouverts (Ci ) deux à deux disjoints et de mesure de Lebesgue arbitrairement petite fixée. On note ui le centre de Ci . Comme φ est bijective, V = φ(U ) s’écrit à son tour comme réunion disjointe des φ(Ci ), donc pour toute fonction borélienne f positive, Z XZ X f dλ = f dλ ≈ f (φ(ui ))λ(φ(Ci )). V i φ(Ci ) i CHAPITRE 10. MESURE IMAGE ET CHANGEMENT DE VARIABLE 71 Mais localement, φ peut être approchée par son application linéaire tangente φ0 (ui ). Ainsi, comme λ(φ(Ci )) est la mesure de Ci par la mesure image de λ par φ−1 , et comme φ−1 (x) ≈ Ax + b, avec A = (φ−1 )0 (et b = φ−1 (ui ) − Aui ), on a λ(φ(Ci )) ≈ | det A |−1 λ(Ci ) = | det φ0 (ui ) |λ(Ci ). Ainsi, Z f dλ ≈ V X f (φ(ui )) | Jφ (ui ) | λ(Ci ) i ≈ XZ Zi f ◦ φ(u) | Jφ (u) | dλ(u) Ci f ◦ φ | Jφ | dλ, = U ce qui achève cette esquisse de démonstration.