ENS-Cachan 2D2 / 1&2D3 Hugo Harari-Kermadec [email protected] Théorie de la mesure et intégration Notes du cours 12 janvier 2016 1 Table des matières Introduction générale 4 1 Ensembles, Algèbres et Tribus 1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Propositions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 7 9 2 Mesures 2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Mesure de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Exemples et compléments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 14 15 3 Fonctions Mesurables 3.1 Définitions . . . . . . 3.2 Propriétés générales 3.3 Fonctions mesurables 3.4 Approximation d’une . . . . 18 18 18 19 21 4 Mesures de probabilité 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 24 26 5 Intégration des fonctions mesurables positives 5.1 Intégrale des fonctions étagées positives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Intégrale des fonctions mesurables positives . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 29 6 Intégrale des fonctions mesurables quelconques 6.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 32 . . . . . . . . . . réelles . fonction . . . . . . . . . . . . . . . . . . mesurable . . . . . . . . . . . . réelle 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliographie George, C. (1980). Exercices et problèmes d’intégration. Gauthier-Villars. Gramain, A. (1988). Intégration. Hermann. Jacod, J. Théorie de l’intégration. http://www.proba.jussieu.fr/pageperso/amaury/LM364/jacod.pdf. Ovide, A. (1976). Mesure et intégration ; exo et pb avec solutions. Vuibert. Vo Khac, K. (1993). Théorie de la mesure ; exo et pb corrigés. Hermann. Moodle Exercices, corrigés et annales sur la page moodle du cours : https://elearn.ens-cachan.fr/course/view.php?id=558 Remerciements Merci à Amélie Carrère pour son aide dans la rédaction de la première version de ces notes. 3 Introduction générale Objectif : Construire une mesure qui généralise la longueur, que l’on sait calculer pour les intervalles. En dimension plus grande, on veut généraliser la surface, le volume… On cherche donc une fonction λ : P Rd −→ R+ = avec les propriétés suivantes : Invariance par translation : où A + x = λ(A) = λ (A + x) σ-additivité : Soit (A1 ... An ...) = (An )n∈N une suite de parties de Rp . ! [ λ An = n∈N Normalisation : d λ [0; 1] = 1 Théorème 1 (Vitali, 1905 :) Il n’existe aucune fonction −→ R+ λ: qui vérifie ces trois propriétés. Astuce : On laisse tomber les ensembles trop compliqués à mesurer. On va donc définir une (immense) classe d’ensembles mesurables. Pour la classe des Boréliens (classe engendrée par les intervalles), il existe une unique fonction λ qui vérifie les 3 propriétés, que l’on appelle mesure de Lebesgue. Intégration de Riemann versus intégration de Lebesgue : — Riemann On a à faire à des fonctions constantes par morceaux : les fonctions ”en escaliers”, qu’on intègre en mesurant la surface sous chaque marche (un rectangle par marche): Z X f= f (xk ) · (xk+1 − xk ) k — Lebesgue On a à faire à des fonctions qui prennent un nombre fini de valeurs : les fonctions ”étagées”, qu’on intègre en multipliant la hauteur du palier par la mesure du palier (éventuellement composé d’une infinité de morceaux) : Z f= X yi · λ (f ← ({yi })) où i On peut en profiter pour remarquer que l’inverse f ← est ici définie pour les parties : elle prend comme argument un singleton et comme valeur une partie. On y reviendra. 4 Chapitre 1 Ensembles, Algèbres et Tribus On cherche à construire une collection de parties de Rd , contenant les ensembles que l’on pourra mesurer. 1.1 Définitions La théorie des ensembles est l’un des fondements les plus profonds des mathématiques, base théorique de l’arithmétique elle-même. Bolzano puis Cantor étudient ce domaine au XIXe. Alors qu’on pensait formaliser des notions «naturelles», on y a découvert des problèmes ardus, comme le paradoxe du barbier (Russell, début XXe). Paradoxe du barbier Soit A l’ensemble des ensembles qui ne se contiennent pas : A = {E, } L’ensemble A se contient-il ? D’où la contradiction. Et réciproquement... Pour casser ce paradoxe, on sépare éléments et ensembles, en définissant une série de «natures» hiérarchisées : éléments, parties, ensembles, ensembles de parties, etc. Les notations signalent les niveaux : en minuscule les éléments, en majuscule les parties, en majuscule ronde les collections et en double barre les ensembles : Rang 0 Rang 1 Rang 2 élément A partie A collection de parties e {e} La plus grande partie est l’ensemble E {{e}} La plus grande collection est P(E). P(E) est l’ensemble des parties de E. On distingue bien les opérateurs ∈ et ⊂ : e ∈ E, a ∈ {a}, Il faut donc se méfier des termes comme «contient» qui marche à la fois pour les parties (E contient A) et les éléments (E contient a). En particulier, on ne peut jamais écrire e ∈ A, puisque On se place donc dans un ensemble E (par exemple R) et on considère l’ensemble de ses parties, P (E). Définition 1 (Complémentaire) Soit A ∈ P (E) une partie de E, son complémentaire est Ac = {x ∈ E, x 6∈ A} = E \ A 5 Définition 2 (Union et intersection de deux parties) 2 Soit (A, B) ∈ P (E) , on définit leur union et leur intersection par : A∪B = {x ∈ E| A∩B = {x ∈ E| } et }. Définition 3 (Algèbre A) Soit A une collection de parties de E, A ⊂ P (E). C’est une algèbre si et seulement si : — ∅∈A — A est stable par intersection : si (A, B) ∈ A2 alors, A ∩ B ∈ A — A est stable par passage au complémentaire : si A ∈ A, alors, Ac ∈ A Propriété 1 Si A est une algèbre, alors : a) E ∈ A Démonstration : Cf. DM , Définition 4 (Union et intersection infinies) I Soit (Ai )i∈I ∈ P (E) , une suite de parties de E indexée par I, un ensemble de cardinal infini éventuellement indénombrable, on définit leur union et leur intersection par : [ Ai = {x ∈ E| , x ∈ Ai } et i∈I \ Ai = {x ∈ E| , x ∈ Ai } i∈I Définition 5 (Tribu) Une tribu est une algèbre stable par réunion dénombrable : si A est une tribu, ∀(An )n∈N ∈ AN avec ∀n, on a , [ An ∈ A n∈N Remarque 1 Pour une suite croissante de parties, une union finie est égale à la dernière partie : Sn A = A , l’union infinie est donc une sorte de limite. Pour une suite décroissante, c’est l’intersection i n i=1 infinie qui donne la limite. Propriété 2 Si A est une tribu, alors : 1. A est stable par réunion (quelconque) dénombrable : ! N ∀(An )n∈N ∈ A , [ ∈A An n∈N 2. A est stable par intersection (quelconque) dénombrable. ! N ∀(An )n∈N ∈ A , \ An ∈A n∈N Démonstration : Cf. DM , Définition 6 (Espace mesurable) Un ensemble E avec une tribu A ⊂ P(E) est un espace mesurable : (E, A). Les parties de E qui sont dans A sont les parties mesurables de l’espace. De façon plus concrète, se donner un espace (E, A), c’est dire qu’on ne cherchera pas à mesurer les parties de E qui ne sont pas dans A. C’est ce qui permet de contourner le Théorème 1 de Vitali. 6 1.2 Propositions Ici, il faut commencer à s’accrocher : les tribus sont des collections de parties, chaque tribu contient donc des parties qui contiennent elles-mêmes des éléments. Remarque 2 (Ensembles infinis dénombrables et indénombrables) Un ensemble I est dénombrable s’il existe une fonction injective de I dans N. Ce qui est équivalent à construire une fonction surjective de N dans I, c’est-à-dire une suite à valeur dans I parcourant tout l’ensemble. On peut alors montrer que Z est dénombrable à l’aide de la suite zn définie par z2k = k pour n = 2k paire et z2k+1 = −k − 1 pour n = 2k + 1 impaire. De façon peut-être plus surprenante, Q est également dénombrable. La démonstration de Cantor de ce résultat consiste à construire un tableau contenant les rationnels positifs avec le numérateur en colonne et le dénominateur en ligne. 1 2 3 4 1 2 3 4 1 /1 /1 /1 /1 2 1/2 2/2 3/2 4/2 3 1/3 2/3 3/3 4/3 On construit alors la suite en partant du coin en haut a gauche et en parcourant les diagonales une par une : u1 = 11 , u2 = 21 , u3 = 12 , u4 = 31 , u5 = 22 , u6 = 13 , etc. On a donc une fonction surjective de N sur Q+ , et par symétrie on construit facilement une fonction surjective de Z sur Q. Comme Z est dénombrable, Q aussi. Par contre R n’est par dénombrable, donc l’ensemble des irrationnels non plus, ni C, et Rd pour tout d > 1. Mais tous ces ensembles sont de même cardinal (on peut construire une bijection entre eux). Propriété 3 (Toute intersection de tribus est une tribu) Soit, (Ai )i∈I (I est éventuellement de cardinal infini indénombrable) avec ∀i ∈ I, Ai ⊂ P(E) une tribu. Leur intersection : \ Ai = {A, tel que ∀i ∈ I, A ∈ Ai } i∈I est une tribu. Remarque 3 Ici on utilise l’intersection pour les collections de parties. L’intersection est la collection des parties qui sont contenues dans chacune des collections. C’est clair, non ? Démonstration : On suit T le «Commandement de Wirth»: toujours donner un nom à ce que l’on cherche. On pose donc B = i∈I Ai et on démontre chacune des propriétés des tribus. a) Ensemble vide ∀i, Ai est une tribu donc Comme c’est vrai pour tout i, \ ∅∈ Ai = B i∈I b) Intersection Soit (A, B) ∈ B 2 , ∀i (A, B) ∈ A2i donc car Ai est une algèbre et finalement A∩B ∈ \ Ai = B i∈I c) Complémentaire Ac ∈ \ Ai = B i∈I d) Union croissante Soit (An )N ∈ B, une suite croissante : A1 ⊂ A2 ⊂ .... Pour chaque n, An est dans l’intersection doncS dans tous les Ai . Comme Ai est une tribu, elle est stable par union croissante dénombrable donc n∈N An ∈ Ai . Comme c’est vrai pour tout i, ! [ \ An ∈ Ai = B i∈I n∈N 7 Remarque 4 Une union de tribus n’est pas toujours une tribu. Cf. Exercice 1 du devoir maison. , Définition 7 (Tribu engendrée) Soit M ⊂ P(E). On appelle tribu engendrée par M On la note σ(M). C’est la plus petite tribu contenant M (petite au sens de l’inclusion, c’est-à-dire contenue dans toutes les autres). La définition est justifiée par la proposition 3 : est bien une tribu. La définition n’est pas vide puisque M est toujours incluse dans P(E) au moins. Définition 8 (Application réciproque) Soit f : E → F. On ne peut pas toujours définir de fonction réciproque de F → E (il faudrait que f soit ). Mais on peut toujours définir une réciproque de P(F) dans P(E) : pour tout partie B ∈ P(F), on pose f ← (B) = {x , f (x) ∈ B} On peut ensuite étendre cette définition aux collections de parties : pour toute collection B de parties de F, on pose f ⇐ (B) = {f ← (B), B ∈ B} Théorème 2 (Lemme de transport : tribu image réciproque) Soient E et F des ensembles, B une tribu de P(F) et f : E → F, alors : 1. A = f ⇐ (B) = {A ∈ P(E) tq ∃B ∈ B et A = f ← (B)} est une tribu 2. Soit M ⊂ P(F), σ (f ⇐ (M)) = f ⇐ (σ (M)) Démonstration de la première partie : On montre les 4 propriétés des tribus pour A = f ⇐ (B). Ensemble vide ∅ ∈ B et f ← (∅) = ∅ ∈ A Complémentaire Si A ∈ A, ∃B ∈ B tel que A = f ← (B). B est une tribu, donc B c ∈ B. Or f ← (B c ) = {x tq f (x) ∈ B c } = E \ {x tq f (x) ∈ B} = E \ {f ← (B)} c = (f ← (B)) = Ac . Finalement, Ac = f ← (B c ) ∈ f ⇐ (B) = A. Intersection Soit (A1 , A2 ) ∈ A, il existe (B1 , B2 ) ∈ B tels que A1 = f ← (B1 ) et A2 = f ← (B2 ). On a A1 ∩ A2 = f ← (B1 ) ∩ f ← (B2 ) = {x ∈ E| } = f ← (B1 ∩ B2 ) Or B1 ∩ B2 ∈ B car B est une algèbre donc A1 ∩ A2 ∈ A. Union S croissante Soit (An )n∈N une suite croissante d’éléments de A. Montrons que leur union n∈N An est dans A. Pour chaque n, An ∈ A, donc . B est une tribu donc, ! [ Bn ∈ B et donc f n∈N ! ← [ n∈N 8 Bn ∈A Or ! f ← [ Bn ( = x ∈ E tq f (x) ∈ n∈N ) [ Bn = {x ∈ E tq ∃n, f (x) ∈ Bn )} n∈N = {x ∈ E tq ∃n, x ∈ f ← (Bn )} = [ f ← (Bn ) = n∈N [ An n∈N Finalement ! [ An = f ← n∈N [ Bn ∈A n∈N Finalement A = f ⇐ (B) est bien une tribu. Démonstration de la seconde partie : Soit M ⊂ P(F). Pour démontrer l’égalité σ (f ⇐ (M)) = f ⇐ (σ (M)), on démontre la double inclusion. Soient R = σ(f ⇐ (M)) et T = f ⇐ (σ(M)). , 1. σ(M) est une tribu engendrée par M donc d’après la première partie du théorème, T = f ⇐ (σ(M)) est une tribu. Pour montrer que R ⊂ T , montrons que f ⇐ (M) ⊂ T . Soit, A ∈ f ⇐ (M), ∃B ∈ M tel que A = f ← (B). Comme M ⊂ σ(M), B ∈ σ(M) et donc A ∈ f ⇐ (σ(M)) = T . Comme c’est vrai pour tout A ∈ f ⇐ (M), f ⇐ (M) ⊂ T . T est donc une tribu qui contient f ⇐ (M). Or justement R = σ(f ⇐ (M)) est la plus petite tribu contenant f ⇐ (M), donc R ⊂ T . 2. Montrons maintenant l’inclusion inverse : T ⊂ R. Soit D = {D ∈ σ(M)|f ← (D) ∈ σ(f ⇐ (M))} = {D ∈ σ(M)|f ← (D) ∈ R} On a tout de suite f ⇐ (D) ⊂ R. Reste à montrer que T ⊂ f ⇐ (D). Soit M ∈ M, f ← (M ) ∈ f ⇐ (M) ⊂ R donc M est dans D et finalement M ⊂ D. Puisque D est une tribu (il faudrait démontrer les 4 propriétés, promis ça marche) contenant M, elle contient aussi σ(M) (en fait D = σ(M)). σ(M) ⊂ D donc T = f ⇐ (σ(M)) ⊂ f ⇐ (D) ⊂ R Donc, T ⊂ R. Nous avons alors R ⊂ T et T ⊂ R, donc R = T . 1.3 , Exemples 1. {∅, E} est une tribu, appelée tribu triviale. 2. P(E) est une tribu, appelée tribu discrète. Définition 9 (Tribu borélienne B(R)) Soit E = R, la tribu engendrée par les intervalles ouverts est appelée la tribu des boréliens, notée B(R). On peut également définir B R : c’est la tribu engendrée par B(R) et les intervalles de la forme [−∞; a[ et ]a; +∞]. On définit de même les boréliens de R2 , comme les éléments de la tribu engendrée par les carrés ouverts, par les cubes ouverts pour R3 et par les hypercubes ouverts pour Rp Toutes les algèbres ne sont pas des tribus Soit l’ensemble E = [0; 1] et C la collection des [0; 1/n] pour n ∈ N∗ . L’algèbre engendrée par C contient toutes réunions finies d’intervalles dont les bornes sont de la forme 1/n ou égales à 0. Mais elle ne contient pas le singleton {0}. Pourtant, \ {0} = [0; 1/n] n∈N∗ donc ce singleton est dans σ(C). 9 Exercice : Topologie a) Montrez que la tribu engendrée par les intervalles fermés de R est aussi la tribu borélienne. b) Montrez que la tribu engendrée par les intervalles semi-fermés (à gauche ou à droite au choix) de R est encore la tribu borélienne. 10 Chapitre 2 Mesures Dans ce chapitre, on va généraliser la longueur, que l’on sait calculer sur les intervalles, à la tribu engendrée par les intervalles, nommée tribu des boréliens. 2.1 Définitions Définition 10 (Longueur) On définit la longueur l comme l’application de l’ensemble des intervalles de R dans R+ qui a un intervalle (ouvert, fermé ou semi-ouvert) ayant pour borne inférieure a et pour borne supérieure b associe b − a : l([a; b]) = l(]a; b]) = l([a; b[) = l(]a; b[) = b − a. On a alors l(∅) = l(]a; a[) = 0. On prolonge l sur les réunions d’intervalles disjoints par la somme des longueurs, ce qui assure l’additivité. Définition 11 (Mesure) Soit (E, A) un espace mesurable, alors, µ : A → R+ = [0; +∞] est une mesure si et seulement si : 1. µ 6≡ +∞ c’est-à-dire ∃A ∈ A telle que 2. µ est σ-additive : pour toute suite (An )n∈N d’éléments de A, la mesure de l’union est la somme des mesures, ∀(An )n∈N ∈ A avec ∀i 6= j, Ai ∩ Aj = ∅, N µ +∞ [ ! Ai i=1 = +∞ X i=1 Définition 12 (Espace mesuré) (E, A, µ) est un espace mesuré. Définition 13 (Typologie des mesures) 1. Si , µ est une mesure de probabilité. 2. Si µ(E) < +∞ alors, µ est dite mesure finie. S+∞ 3. Si ∃ (An )n∈N ∈ AN , n=1 An = E et ∀n µ(An ) < ∞ alors, µ est dite σ-finie. Remarque 5 La mesure prolongeant la longueur que l’on cherche est σ-finie : R= +∞ [ [−n; n], n=1 et pour tout n, la longueur de [−n; n] = 2n < ∞. 11 µ(Ai ) Remarque 6 (Attention aux démonstrations par récurrence) Supposons que l’on veuille démontrer par récurrence que ∪+∞ n=1 [−n; n] estSde longueur finie. 1 On commence par l’initialisation : n=1 [−n; n] = [−1; 1] est de longueur 2 < ∞. SN Passons à l’hérédité en supposant que n=1 [−n; n] est de longueur finie. On a alors : ! ! ! N[ +1 N N [ [ l [−n; n] = l [−n; n] ∪ [−N − 1; −N [∪]N ; N + 1] = l [−n; n] +l ([−N − 1; −N [)+l (]N ; N + 1]) n=1 n=1 n=1 par additivité. Or, N [ l ! [−n; n] < ∞ et l ([−N − 1; −N [) + l (]N ; N + 1]) = 2 < ∞ n=1 donc l N[ +1 ! [−n; n] < ∞. On a bien hérédité de la proposition. Pourtant n=1 l ∞ [ ! [−n; n] = l(R) = +∞ n=1 Théorème 3 (Propriétés des mesures) 1. µ(∅) = 0 2. Monotonie Soient (A, B) ∈ A2 , A ⊂ B, alors, µ(A) ≤ µ(B) N 3. Continuité S+∞ Soit (An )n∈N ∈ A , une suite croissante de parties emboitées, An ⊂ An+1 , et sa limite n=0 An = A∞ (qui appartient également à A, par définition des tribus). On a n→∞ µ(An ) −−−−→ µ(A∞ ). Dit autrement, la mesure de la limite d’une suite croissante de parties emboitées est la limite de la suite de leurs mesures. SN 3bis. Soit (Bn )n∈N ∈ AN , une suite quelconque de parties appartenant à A et UN = n=0 Bn . La mesure de la limite des unions partielles est la limite des mesures des unions partielles. ! ! N ∞ [ [ n→∞ µ(UN ) = µ Bn −−−−→ µ(U∞ ) = µ Bn . n=0 n=0 4. σ-sous-additivité Soit une suite d’ensembles (An )N ∈ AN n’étant ni nécessairement disjoints ni nécessairement emboités, ! +∞ +∞ [ X µ An ≤ µ(An ), n=0 n=0 Démonstration : 1. µ est une mesure donc ∃A ∈ A tq µ(A) < ∞ et µ est car, A ∩ ∅ = ∅. Or, µ(A ∪ ∅) = µ(A) = µ(A) + µ(∅) donc µ(∅) = 0. 12 , donc µ(A∪∅) = µ(A)+µ(∅), 2. On a B = A∪{B\A}, où l’union est disjointe. On peut donc utiliser la σ-addivité : µ(B) = µ(A)+µ(B\A). Or, µ : A → R+ , donc, µ(B\A) ≥ 0. Finalement, µ(B) ≥ µ(A). 3. Continuité : on pose A00 = A0 et pour n ≥ 1, A0n = An \ An−1 , de façon à construire une suite d’ensemble disjoints. On a par une récurrence immédiate l’égalité des unions finies ∪ni=0 A0i = ∪ni=0 Ai . La suite des An étant croissante au sens de l’inclusion, An = ∪ni=0 Ai et donc An = ∪ni=0 A0i . On a donc, par σ-additivité de µ sur les A0n , Vérifions que les unions infinies des A0n et des An sont bien égales : ( ) +∞ +∞ n [ [ [ 0 An = {x ∈ E|∃n ∈ N, x ∈ An } = x ∈ E|∃n ∈ N, x ∈ Ai = n=0 i=0 On a donc µ (A∞ ) = µ +∞ [ ! A0n = n=0 Comme série croissante de réels, PN µ(AN ) = 0 n=0 µ(An ) N X ! A0i = +∞ [ A0n n=0 i=0 µ(A0n ). n=0 converge (éventuellement vers +∞) : +∞ X µ(A0n ) −−−−→ N →∞ n=0 +∞ X n=0 n [ µ(A0n ) = µ (A∞ ) . n=0 4. Si les An sont disjoints, c’est la σ-additivité, sinon onoreprend l’astuce précédente en l’adaptant au nS SN SN n−1 0 0 0 cas non emboité : on pose An = An \ i=0 (Ai ∩ An ) . Les An sont disjoints et n=0 An = n=0 An Donc ! N N [ X ∗ ∀N ∈ N , µ An = ≤ µ(An ), n=0 n=0 l’inégalité provenant de l’inclusion A0n ⊂ An et de PN P+∞ µ est positive, n=0 µ(An ) ≤ n=0 µ(An ). SN De plus, n=0 An est une suite emboitée, donc ! N [ µ An →µ n=0 chaque terme étant inférieur à la croissance de µ démontrée ci-dessus. Comme +∞ [ ! An , n=0 µ(An ), la limite aussi : ! +∞ +∞ [ X µ An ≤ µ(An ) P+∞ n=0 n=0 n=0 , Remarque 7 (Suite décroissante) Attention, la propriété de continuité n’est pas nécessairement vérifiée pourTune suite décroissante d’ensembles emboités. En effet, soit Bn = [n; +∞[. On a Bn ⊃ Bn+1 , +∞ de limite n=1 Bn = ∅, et on a n→∞ µ(Bn ) = +∞ −−−−→ +∞ 6= 0 = µ(∅). Par contre ça marche pour la suite croissante des complémentaires Bnc =] − ∞; n[ : n→∞ µ(Bnc ) = +∞ −−−−→ +∞ = µ(R). Par contre c’est vrai dès que l’une des parties de la suite est de mesure finie, par exemple BN . On peut alors raisonner pour n > N sur les complémentaires An = BN \ Bn . Les An sont croissants donc par continuité : µ(BN \ Bn ) = µ(An ) → µ(A∞ ) = µ(BN \ B∞ ). Par σ-additivité de µ, µ(Bn ) = µ(BN ) − µ(BN \ Bn ) et µ(B∞ ) = µ(BN ) − µ(BN \ B∞ ) toutes ces valeurs étant finies car majorées par µ(BN ). Finalement µ(Bn ) = µ(BN ) − µ(BN \ Bn ) → µ(BN ) − µ(BN \ B∞ ) = µ(B∞ ). 13 2.2 Mesure de Lebesgue Théorème 4 (de prolongement de Carathéodory) Soit S, l’ensemble des intervalles ouverts de R et l définie sur S, la longueur des intervalles. Alors, il existe une unique mesure qui prolonge l sur la tribu des boréliens B(R) engendrée par S. Idée de démonstration : On procède par «bootstrap »à partir de S : on s’appuie sur chaque étape pour passer à la suivante, comme le baron de Müchhausen s’est sorti de sables mouvants en se tirant par la queue de cheval. 1. On a déjà prolongé l sur l’algèbre engendrée par S. En effet, cette algèbre contient tout ce qui peut être construit à partir des intervalles par les opérations des algèbres. Par complémentaire, union finie et intersection finie, on n’obtient que des unions finies d’intervalles disjoints. Soit A dans l’algèbre, A est donc une union finie d’intervalles disjoints : A = ∪N n=1 In . On pose alors N X l∗ (A) = l(In ) n=1 pour respecter la σ-additivité. 2. On prolonge ensuite aux unions infinies d’intervalles disjoints par passage à la limite en posant : ! ∞ N [ X ∗∗ l In = lim l(In ). N →+∞ n=1 Cette définition est valide car PN n=1 n=1 l(In ) est une suite croissante donc convergente dans R. 3. On prolonge enfin à la tribu B(R) en posant pour A ∈ B(R), λ(A) = A⊂ Sinf ∞ n=1 +∞ X l∗∗ (An ) où chaque An est une union au plus dénombrable d’intervalles. An n=1 , Définition 14 Ce prolongement de la longueur aux boréliens est appelée mesure de Lebesgue. Elle est notée λ. 14 2.3 Exemples et compléments Propriété 4 (Mesure de Stieljes) Soit F croissante, continue à droite, ∃!µF (notée parfois dF ) définie sur (R, B(R)) telle que dF (]a; b]) = F (b) − F (a). Démonstration : La démonstration reprend celle de la définition de la meure de Lebesgue. On montre en DM que les conditions F croissante et continue à droite sont nécessaires, et on donne des exemples. , Définition 15 (Ensemble négligeable) Soit (E, A, µ) un espace mesuré. B ∈ P(E) est dit négligeable s’il existe A ∈ A avec tel que B ⊂ A. Remarque 8 On peut alors prolonger µ en posant µ(B) = 0. Plus généralement, pour C = A ∪ B, avec A ∈ A et µ(B) = 0 alors on pose µ(C) = µ(A). On appelle «tribu de Lebesgue» la tribu engendrée par l’union de la tribu borélienne et des ensembles négligeables pour la mesure de Lebesgue, sur laquelle on prolonge trivialement λ. On obtient alors un espace mesuré (R, L(R), λ) dont la tribu des parties mesurables est la plus grande envisagée dans ce cours. Définition 16 (Propriété vraie presque partout et presque sûrement) Soit (E, A, µ) un espace mesuré et pour x ∈ E, R(x) une propriété. S’il existe N ∈ A une partie négligeable telle que pour tout x ∈ N c , R(x) est vraie, alors R est vraie presque partout. Si µ est une probabilité, on dit que Q est vraie presque sûrement. Remarque 9 La propriété “x est irrationnel” est vraie presque partout pour la mesure de Lebesgue. La propriété “Le résultat du tirage du dé est entier” est vraie presque sûrement pour la loi associée. L’ensemble de Cantor ci-dessous illustre la richesse de la tribu des boréliens en donnant un exemple d’ensemble indénombrable dans R mesurable (et négligeable) pour la mesure de Lebesgue λ. Exemple : Ensemble de Cantor La mesure de Lebesgue de tout singleton est nulle. Par , tout ensemble dénom- brable est de mesure de Lebesgue nulle, par exemple Q. Par complémentaire, la mesure des irrationnels de [0; 1] est donc 1 : λ([0; 1]\Q) = 1. Il existe pourtant des ensembles indénombrables de mesure nulle. C’est le cas de l’ensemble de Cantor, l’ensemble des réels de [0; 1] ayant une écriture en base 3 ne contenant pas de 1 (écriture propre ou impropre). On peut le construire de façon récursive. Soit T l’opérateur sur unions finies de segments de [0; 1] qui retire les tiers centraux : b−a b−a T : [a; b] 7→ a; a + ∪ b− ;b 3 3 et pour une union de segment, on applique T indépendamment sur chaque segment. On pose K1 = T ([0; 1]) et par récurrence Kn+1 = T (Kn ). L’ensemble de Cantor K est la limite de Kn lorsque n → ∞ : K = ∩∞ n=1 Kn . L’ensemble K est une intersection dénombrable de réunions d’intervalles, c’est donc un Borélien. On a alors b−a b−a b−a b−a 2(b − a) λ(T ([a; b])) = λ a; a + ∪ b− ;b = λ a; a + +λ b − ;b = 3 3 3 3 3 n+1 donc λ(K1 ) = 23 et λ(Kn+1 ) = 23 λ(Kn ) = 23 . La suite des Kn étant monotone, λ(K) = lim λ(Kn ) = 0. n→∞ K est donc négligeable pour la mesure de Lebesgue. Pourtant il est indénombrable et on peut construire un injection de [0; 1] dans K ! Soit x ∈ [0; 1], il s’écrit en base 2 x= ∞ X xn , avec ∀n, xn ∈ {0, 1}. 2n n=1 15 On pose k(x) = ∞ X 2 × xn . 3n n=1 La fonction k arrive dans K et est bijective. Remarque 10 (La mesure n’est pas conservée par bijection) C’est particulièrement manifeste pour la fonction k puisqu’elle réduit «infiniment» la mesure de [0; 1]. C’est plus simplement le cas de toutes les homothéties, qui sont des bijection et pourtant modifient la mesure (avec un rapport égal au coefficient d’homothétie). Les bijections qui conservent la longueur sont appelées isométries. Définition 17 (Mesures produits) Soit (Rn , B(Rn )) et (µ1 , . . . , µn ) n mesures sur R. On définit la mesure produit µ = ⊗ni=1 µi d’abords sur les pavés ouverts de Rn par µ(A) = n Y µ(Ai ) où A = ×ni=1 Ai avec chaque Ai intervalle ouvert de R i=1 puis, on prolonge µ sur B(Rn ) par σ-additivité et continuité. Les mesures de probabilité ainsi obtenues correspondent à des échantillons de variables aléatoires indépendantes. Remarque 11 Si tous les µi sont égaux : ∀i µi = ν alors, µ = ⊗ni=1 µi = ⊗ni=1 ν = ν ⊗n Pour une mesure de probabilité, c’est le cas de l’échantillon i.i.d. . Partie non mesurable pour λ : Il est très difficile de construire une partie de R non mesurable par la mesure de Lebesgue. En effet, tout ce qui peut être construit avec les opérations élémentaires sur les intervalles ou les points, même répété une infinité dénombrable de fois, reste dans la tribu des boréliens, donc mesurable. L’existence d’une partie de R n’appartenant pas à la tribu de Lebesgue peut pratiquement être posé comme axiome. En tout cas, le contre-exemple que nous proposons ici est basé sur l’axiome du choix, un axiome refusé par un partie des mathématiciens, les plus constructivistes. On considère la collection D = {x + Q, x ∈ R}, où, pour une partie H, x + H est la partie {x + h, h ∈ H}. Pour chaque D ∈ D, on choisit à l’aide de l’axiome du choix un élément d et on pose aD = d − bdc qui est donc dans [0; 1[. Soit A = {aD , D ∈ D}. Les éléments de A sont donc chacun dans une même partie D différente de la collection D. Deux éléments distincts de A ont donc, par définition, toujours une différence irrationnelle. On va montrer que A n’est pas mesurable par la mesure de Lebesgue, et donc qu’il n’est ni borélien ni même dans la tribu de Lebesgue. On raisonne par l’absurde et on suppose qu’il existe α = λ(A) ∈ R+ . Soient p et p0 deux rationnels différents. On a \ (A + p) (A + p0 ) = ∅. En effet, sinon on aurait l’existence de (a, a0 ) ∈ A2 vérifiant a + p = a0 + p0 donc a − a0 ∈ Q ce qui est contradictoire avec la définition de A. S Soit B = p∈Q T]−1;1[ (A+p). B est donc et par σ-additivité, λ(B) = λ p∈Q [ T X (A + p) = p∈Q ]−1;1[ T λ(A + p) ]−1;1[ Par invariance par translation, λ(A + p) = λ(A) = α. Comme il y a une infinité de rationnels entre -1 et 1, λ(B) est une soit nulle (si α = 0) soit infinie (si α > 0). Or [0; 1[⊂ B : ∀x ∈ [0; 1[, ∃(D, q) ∈ D × Q, x = aD + q 16 et comme (x, aD ) ∈ [0; 1[2 , q = x − aD ∈] − 1; 1[ donc x est la somme d’un élément de A et d’un rationnel de ] − 1; 1[, il est donc dans B. On a donc par croissance des mesures 0 < 1 = λ([0; 1[) ≤ λ(B) donc λ(B) 6= 0 et α 6= 0. Mais on a également B ⊂ [−1; 2] simplement parce que B n’est composée que de somme d’éléments de [0; 1[ et d’éléments de ] − 1; 1[. Donc λ(B) ≤ λ([−1; 2]) = 3 < +∞ et donc α n’est pas non plus strictement positif. D’où la contradiction. 17 Chapitre 3 Fonctions Mesurables 3.1 Définitions Définition 18 (Fonctions mesurables) Une fonction f : (Ω, A) → (E, B) est mesurable si et seulement si, ∀B ∈ B, f ← (B) ∈ A On peut noter plus rapidement Remarque 12 (Exemple fondamental) Soit f de (R, B(R)) dans ({0; 1}, P({0; 1})). f est l’indicatrice d’une partie A de R. f est alors mesurable si et seulement si A est un borélien. Si on considère désormais la fonction indicatrice f comme une fonction de (R, B(R)) dans (R, B(R)), on garde cette équivalence puisque : ∀B ∈ B(R), f ← (B) = f ← (B ∩ {0; 1}). Les indicatrices des boréliens (et donc des intervalles) sont donc mesurables. On va étendre l’ensemble des fonctions mesurables à partir des indicatrices. 3.2 Propriétés générales Propriété 5 Soit f : (Ω, A) → (E, B). a) S’il existe une collection D telle que B = σ(D) alors f est mesurable ssi ∀D ∈ D, f ← (D) ∈ A. Il suffit donc de vérifier la mesurabilité sur une collection engendrant B. b) Soit E = R et B = B(R). f est mesurable ssi ∀x ∈ R, f ← (] − ∞; x[) ∈ A. c) Soit g : (E, B) → (F, C) mesurable. Si f est mesurable alors, g ◦ f est mesurable. La composée de deux fonctions mesurables est donc mesurable. d) Soit h : (Ω, A) → (F, C) mesurable. Si f est mesurable, alors (f, h) : (Ω, A) → (E × F, σ(B × C)) est mesurable. Démonstration : a) sens direct Soit D telle que B = σ(D) et supposons f mesurable. Par définition de la mesurabilité, . Or, comme B = σ(D), D ⊂ B et donc f ⇐ (D) ⊂ A. a) sens réciproque On suppose f ⇐ (D) ⊂ A et on applique le Lemme de Transport à B = σ(D): σ(f ⇐ (D)) = f ⇐ (σ(D)) = f ⇐ (B) donc si f ⇐ (D) est dans A, σ(f ⇐ (D) aussi. On a donc f ⇐ (B) = σ(f ⇐ (D)) ⊂ A ce qui donne la mesurabilité de f . 18 b) On remarque simplement que B(R) = σ ] − ∞; x[, x ∈ R et on applique le a). c) On a (g◦f )⇐ (C) = f ⇐ (g ⇐ (C)). Comme g est mesurable, donc (g◦f )⇐ (C) ⊂ f ⇐ (B). Par mesurabilité de f , f ⇐ (B) ⊂ A. Finalement (g ◦ f )⇐ (C) ⊂ A, ce qui donne la mesurabilité de g ◦ f. d) D’après a), il suffit de démontrer que pour tout (B, C) ∈ B × C, (f, h)← (B, C) ∈ A. Or (f, h)← (B, C) = (f ← , h← )(B, C) = f ← (B) ∩ h← (C) qui appartiennent à A par mesurabilité respectivement de f et h. Comme une tribu est stable par intersection, (f, h)← (B, C) ∈ A. , 3.3 Fonctions mesurables réelles On considère les fonctions à valeurs réelles, f : (Ω, A) → R̄, B R̄ , λ . On réinterprétera bientôt une telle fonction comme Propriété 6 (Fonctions continues) Les fonctions de R dans R continues sont mesurables pour la tribu des boréliens. Démonstration : Soit f continue. L’image réciproque d’un intervalle ouvert par un fonction continue est une réunion au plus dénombrable d’intervalles ouverts, donc un borélien (c’est ce que l’on appelle un ouvert en topologie de R). D’après la Proposition 5 (b), f est alors mesurable. , Propriété 7 (Opérations) Soit f et g mesurables et α ∈ R, les fonctions suivantes sont mesurables : f + g, αf, |f |, max(f, g) : ω 7→ max{f (ω), g(ω)}, min(f, g). Démonstration : On utilise la continuité des opérations et la stabilité de la mesurabilité par composition. , 19 Définition 19 (Limites supérieure et inférieure) Soit un une suite réelle. On appelle limites supérieure et inférieure de un les expressions : lim sup un = lim sup uk et lim inf un = lim inf uk n→+∞ k≥n n→+∞ n→+∞ n→+∞ k≥n On peut remarquer que la suite sn = supk≥n uk est puisqu’il s’agit d’un sup sur un ensemble de plus en plus petit. La limite de sn existe donc. De même in = inf k≥n un est . Pour une suite de fonctions fn , on pose lim sup fn : ω 7→ lim sup fn (ω) n→+∞ n→+∞ Remarque 13 lim supn→+∞ un = lim inf n→+∞ un si et seulement si la suite est convergente. Dans ce cas, la limite est cette valeur commune. Exemple : Soit un = (−1)n . n (−1)k = k k≥n sn = sup uk = sup k≥n De même, (−1)k = k≥n k in = inf un = inf k≥n On a alors lim sn = lim in = 0. Propriété 8 (Limite) Soit (fn )N une suite de fonctions mesurables, les fonctions suivantes sont mesurables : sup fn , inf fn , lim sup fn , lim inf fn N N n→+∞ n→+∞ De plus si pour tout ω ∈ Ω, fn (ω) → f (ω) alors la fonction limite f est mesurable. Démonstration : sup : On utilise la caractérisation établie à la Proposition 5 (b), il suffit donc de montrer que les images réciproques de intervalles ] − ∞, x[ sont dans A. On a ← (sup fn ) (] − ∞, x[) = ω, sup fn (ω) ∈] − ∞, x[ = ω, sup fn (ω) < x N N N \ \ = {ω, ∀n, fn (ω) < x} = {ω, fn (ω) < x} = fn← (] − ∞, x[) n∈N n∈N Comme les fn sont mesurables, tous ces ensembles sont dans A. Or A est une tribu, l’intersection est donc également dans A. lim sup : On suit la même démarche : pour x ∈ R, (lim sup fn )← (] − ∞, x[) = ω, lim sup fk (ω) < x . n→+∞ k≥n n→+∞ Soit un tel ω. Comme la suite sn = supk≥n fk (ω) est décroissante, si sa limite est strictement inférieure à x, c’est qu’il existe un rang N tel que sN < x. Ensuite ∀n ≥ N, sn < x. (lim sup fn )← (] − ∞, x[) = ω, ∃N, sup fk (ω) < x n→+∞ = [ \ = [ {ω, ∀k ≥ N, fk (ω) < x} k≥N N ∈N {ω, fk (ω) < x} = [ \ N ∈N k≥N fk← (] − ∞, x[) N ∈N k≥N Cet ensemble est dans A par mesurabilité des fk et stabilité des tribus par intersection et réunion dénombrables. On obtient inf et lim inf en étudiant la suite des −fn . Enfin, lorsqu’elle existe la limite f est égale à la lim sup (et aussi à la lim inf) donc f est mesurable. , 20 Exemple : Soit fn (x) = xn définie sur R+ . A x ≥ 0 fixé, fn (x) est une suite monotone, décroissante si x < 1, constante si x = 1 et croissante de limite +∞ si x > 1. On a alors sup fn (x) = k≥n et donc lim sup fn = 3.4 . Approximation d’une fonction mesurable réelle Pour construire l’intégrale de Riemann, on commence par intégrer des fonctions simples (les fonctions constantes par morceaux) puis on montre qu’on peut approcher toutes les fonctions continues par des fonctions constantes par morceaux. On va suivre la même démarche pour l’intégrale de Lebesgue à partir des fonctions étagées, mais on obtiendra une classe de fonctions beaucoup plus vaste, celle des fonctions mesurables. Définition 20 (Fonction étagée) On appelle fonction étagée une fonction f : (Ω, A) → (R, B(R)) de la forme n X f (ω) = xi 1lAi (ω), avec n ∈ N, xi ∈ R, Ai ∈ A. i=1 Remarque 14 Les indicatrices d’ensemble mesurable sont mesurables. De plus, la mesurabilité est conservée par produit par un réel et par somme, les fonctions étagées sont donc toujours mesurables. Théorème 5 (Approximation) a) Toute fonction mesurable est limite d’une suite de fonctions étagées positives. b) Toute fonction mesurable est limite d’une suite de fonctions étagées. Démonstration : Un exemple détaillé est traité en DM. a-1) On commence par faire la démonstration pour les fonctions bornées. Soit donc M > 0 et f : (Ω, A) → [0, M ], B(R̄) . On va raisonner pour la fonction sur Ω en entier, donc la variable ω ne sera pas explicitée à chaque ligne. Il faut donc lire les égalités et les inégalités comme fonctionnelles, c’est-à-dire valable pour tout ω. On pose M g1 = 1l M 2 f> 2 de sorte que g1 est une fonction étagée positive à un étage approchant f par dessous à M/2 près. On approche de même f − g1 par une fonction g2 à M/4 et on obtient ainsi une suite de Petc... n fonctions étagées positives à un étage dont la série Gn = i=1 gi approche f à M/2n près par en dessous : 0 ≤ Gn = n X gi % f, où % indique la convergence pour les suites croissantes. i=1 a-2) Si f n’est pas bornée, on utilise un procédé diagonal : pour chaque n, on approche la fonction fn = min{f, n} (qui est évidemment bornée par n) par une fonction hn étagée positive à n/2n près par en dessous. On vérifie à chaque étape que hn est supérieure à hn−1 (en prenant la fonction max des deux). Reste à démontrer la convergence. En ω tel que f (ω) est fini, alors il existe N , tel que pour tout n > N , fn = f et donc hn (ω)−fn (ω) % 0 entraine hn (ω) % f (ω). En ω tel que f (ω) = +∞ (on rappelle que f arrive dans R̄+ ), fn (ω) = n pour tout n et donc hn (ω) ≥ n − n/2n pour tout n. hn (ω) est alors une suite croissante et divergente, c’est-à-dire hn (ω) % +∞ = f (ω). Finalement, on a bien sur Ω : hn % f 21 b) On considère cette fois-ci une fonction f : (Ω, A) → R̄, B(R̄) , que l’on découpe en ses parties positive et négative : f + = max{f, 0} et f − = max{−f, 0}, si bien que f = f + − f − . On peut remarquer que dans cette décomposition de f , en chaque point ω, l’un des deux termes (au moins) est nul : f + (ω) = 0 ou f + (ω) = 0. En particuliers, il n’y a pas de risque de forme indéterminée du type +∞ − ∞. Les deux fonctions f + et f − sont mesurables et positives donc on peut les approcher d’après a) − + − par des suites de fonctions étagées h+ n et hn . On pose hn = hn − hn et on obtient une suite de fonctions étagées qui converge point par point vers f en s’éloignant de 0 sans jamais dépasser f . Remarque 15 Une suite croissante de fonction fn vérifie : , ∀(n, ω), fn (ω) ≤ fn+1 (ω). Ceci ne veux pas dire que chaque fonction fn est croissante. D’ailleurs, une fonction de ω croissante, ça ne veut pas dire grand chose, parce qu’il n’y a pas d’ordre sur Ω : ∀(n, ω, ω 0 ), ω < ω 0 ⇒ fn (ω) ≤ fn (ω 0 ) ?? 22 Chapitre 4 Mesures de probabilité 4.1 Introduction Définition 21 (Expérience aléatoire) C’est un espace Ω, représentant les différents résultats possibles. Il peut être fini, dénombrable ou indénombrable. Exemples : — Pour le tirage d’un dé, on pose Ω = [|1; 6|]. — Pour une infinité de tirage à “Pile” ou “Face”, on pose l’ensemble des suites à valeurs dans {0; 1}. Définition 22 (Évènement aléatoire) C’est une affirmation sur le résultat d’une expérience aléatoire, représentée par la partie A de Ω des résultats vérifiant cette affirmation. Exemples : — Le tirage du dé donne 6 : A = {6}. — On obtient 100 “Pile” consécutifs : A = {(un )n∈N | ∃N ∈ N, ∀k ∈ [|1; 100|], uN +k = 1} Si l’on se donne une mesure de probabilité sur Ω, on peut alors définir la probabilité d’un évènement comme la mesure de la partie A correspondante, à condition qu’elle soit mesurable. Les propriétés des tribus et des mesures permettent de calculer les probabilités des évènements complémentaires, des intersections et des unions. Ensemble fini Ω = {ω1 , . . . , ωn } On associe à Ω la tribu discrète P(Ω) composée de l’ensemble des parties. Par additivité des mesures, on peut définir une probabilité P sur (Ω, P(Ω)) par sa valeur sur les singletons : pi = P({ωi }). En effet : ∀A ∈ P(Ω), P(A) = X P({ωi }) = i, ωi ∈A X i, ωi ∈A pi = n X pi 1lωi ∈A i=1 Si P est uniforme, i.e. pour tout i, pi = 1/n, alors Le calcul de probabilité se résume donc à du dénombrement. Ensemble infini dénombrable Ω = N On peut à nouveau choisir la tribu discrète et définir une probabilité à partir des pi . On note δj la mesure de probabilité telle que pj = 1 et pi = 0 pour i 6= j. 23 Il n’existe plus de probabilité uniforme, puisque la somme des pi doit valoir 1, donc les pi doivent tendre vers 0. On peut néanmoins définir une mesure uniforme (de masse totale infinie) qui donne une P mesure de 1 à chaque entier. On l’appelle mesure de comptage : µ = i∈N δi . On a alors µ(A) = X X δi (A) = i∈N 1li∈A = Card(A). i∈N Ensemble infini indénombrable On ne peut plus définir les pi ni faire de somme, et il faut donc introduire une version continue de chacun de ces deux objets, la densité et l’intégrale. C’est pour le chapitre suivant. 4.2 Indépendance On se place dans (Ω, T , P) un ensemble probabilisé. Définition 23 (Évènements indépendants) Deux évènements mesurables (A, B) ∈ T 2 sont indépendants ssi On note alors A |= P(A ∩ B) = B. B ⇔ Ac |= A |= Propriété 9 (Indépendance des complémentaires) Bc La démonstration est laissée en exercice. ∀(A, B) ∈ (A, B), A |= Définition 24 (Collections indépendantes) Soient A et B deux collections incluses dans T ; A et B sont indépendantes ssi tous leurs évènements sont indépendants : B B ⇔ σ(A) |= A |= Propriété 10 (Indépendance des tribus engendrées) σ(B) La démonstration est immédiate. On a vu que l’union (respectivement l’intersection) d’une suite croissante (respectivement décroissante) de parties était une sorte de limite. On peut donc définir : Définition 25 (lim sup et lim inf d’une suite de parties) La lim sup d’une suite de parties (An ) est ce qu’il reste dans l’union lorsque l’on a tout enlevé : lim sup An = lim n→∞ ∞ [ Ak = ∞ [ ∞ \ Ak . n=1 k=n k=n La lim inf est l’ensemble des points qui sont au moins dans la dernière partie de la suite. lim inf An = lim n→∞ ∞ \ k=n Ak = ∞ \ ∞ [ Ak . n=1 k=n Exemple : Soit An = [n; +∞] et Bn = [n; n + 1]. lim sup An = ∞ [ ∞ \ et [k; +∞] = n=1 k=n lim inf An = ∞ \ ∞ [ [k; +∞] = n=1 k=n Les deux limites sont donc identiques et la suite converge. D’autre part, 24 lim sup Bn = ∞ [ ∞ \ et [k; k + 1] = n=1 k=n lim inf Bn = ∞ \ ∞ [ [k; k + 1] = n=1 k=n Les deux limites sont donc identiques et la suite converge également. Le résultat suivant est très puissant. Propriété 11 (Lemme de Borel-Cantelli et Loi 0-1 de Kolmogorov) Soit (Ak ) une suite infinie d’évènements mesurables ( ∀k, Ak ∈ T ). a) Si la somme des probabilités des Ak est finie alors avec une probabilité de 1, seul un nombre fini des Ak sont vrais : ∃B négligeable pour P, ∀ω ∈ / B, ∃N ∈ N, ∀k ≥ N, ω ∈ / Ak ou plus simplement : P(lim sup Ak ) = 0 b) Si les Ak sont indépendants alors P(lim sup Ak ) ∈ {0; 1} La loi 0-1 de Kolmogorov dit que les évènements portant sur une infinité d’expériences aléatoires indépendantes sont soit certains soit impossibles. L’exemple le plus classique est celui du singe tapant sur un clavier. S’il ne s’arrête jamais, on est sûr qu’il finira pas taper ce cours en intégralité à l’identique. Démonstration : n X P∞ a) Par hypothèse, k=1 P(Ak ) est finie. On pose L cette somme : L = lim P(Ak ). n→∞ On a alors k=1 n X ∀ε > 0, ∃N ∈ N, n ≥ N ⇒ P(Ak ) − L < ε ⇒ k=1 Donc par σ-sous-additivité des mesures : ∞ [ P ! Ak ≤ k=N +1 Or lim sup An = ∞ [ ∞ \ n=1 k≥n Ak ⊂ ∞ [ X P(Ak ) < ε. k>N Ak , donc par croissance de P : k≥N +1 P(lim sup An ) ≤ P ∞ [ ! Ak <ε k=N +1 Comme c’est vrai pour tout ε, P(lim sup An ) = 0. b) On considère 2 cas : P∞ Soit k=1 P(Ak ) est finie et d’après a), P(lim sup An ) =P0. Soit la somme est infinie et dans ce cas pour tout n, k>n P(Ak ) = ∞ (en effet, on n’a retiré qu’une quantité finie puisque majorée par n). En utilisant l’inégalité log(1 − x) ≤ −x, on a ! ! Y X X (1 − P(Ak )) = exp log (1 − P(Ak )) ≤ exp − P(Ak ) = 0. k>n k>n k>n Soit K = {k ∈ N, P(Ak ) = 1}. Comme pour tout n, k>n (1 − P(Ak )) = 0, on peut toujours trouver unSk aussi grand que l’on veut pour lequel P(Ak ) = 1. Donc K n’est pas majoré. Soit B = k∈K Ack . Par σ-sous-additivité, B est négligeable : ! [ X P(B) = P Ack ≤ P(Ack ) = 0 Q k∈K 25 k∈K Le complémentaire de B est donc de probabilité 1. Il suffit alors de montrer qu’il est contenu dans lim supn→∞ An . !c [ \ \ [ c c B = Ak = Ak ⊂ Ap k∈K k∈K Or la suite ∪p≥k Ap est décroissante, donc [ Ap = k∈K n≤k p≥n \ [ Ap n≤k p≥n p≥k et comme K n’est pas borné, \ \ [ k∈K p≥k \ [ Ap = n∈N p≥n Ap = lim sup An n→∞ Finalement, lim supn→∞ An contient B c qui est de probabilité 1, et donc par croissance des mesures, ( lim supn→∞ An ) = 1. , 4.3 Variables aléatoires Définition 26 (Variable aléatoire réelle) Soit (Ω, A, P) un espace probabilisé. Une variable aléatoire réelle est une fonction X mesurable de (Ω, A) dans (R, B(R)). Exemple : Pour le dé, on a Ω = [|1; 6|], A = P(Ω) et P la probabilité uniforme sur Ω. On peut alors définir X comme l’identité de Ω dans R. PX est alors une simple extension de P à B(R)). On peut aussi définir Y = X 2 de Ω dans R. Que vaut PY ? Définition 27 X est discrète si X(Ω) est dénombrable, sinon est elle diffuse (ou mixte). Définition 28 (Loi d’une v.a.) La probabilité associée à X, PX , est la mesure image de P par X : ∀B ∈ B(R), PX (B) = P(X ∈ B) = La fonction de répartition de X et donnée par ∀x ∈ R, FX (x) = PX (] − ∞; x]). Propriété 12 FX est croissante de R dans [0; 1], càdlàg (continue à droite, limite à gauche). Réciproquement, toute fonction avec ces propriétés permet de construire une mesure de probabilité de Stieljes. Propriété 13 (Indépendance et probabilité) X 26 |= Y ⇔ X ⇐ (B(R)) |= X |= Définition 29 (indépendance de v.a.) Deux variables aléatoires sont dites indépendantes si et seulement si les tribus images réciproques associées sont indépendantes : Y ⇐ (B(R)) Y si et seulement si P(X,Y ) = PX ⊗ PY . Chapitre 5 Intégration des fonctions mesurables positives On se place dans un espace mesuré (X, A, µ), typiquement (R, B(R), λ). On construit l’intégrale de Lebesgue à partir des fonctions étagées positives. On étendra facilement la définition de l’intégrale puisque l’on a montré que les fonctions mesurables étaient des limites monotones (en un sens un peu spécifique pour les fonctions changeant de signes) de ces fonctions. 5.1 Intégrale des fonctions étagées positives Soit E + l’ensemble des fonctions étagées positives. Pn Définition 30 Soit g ∈ E + , g s’écrit g = i=1 ai 1lAi où les ai sont positifs et les Ai dans A. On pose Z gdµ = également notée R X gdµ = R x∈X g(x)dµ(x) = R x∈X g(x)µ(dx). Remarque 16 Une intégrale peut valoir +∞, par exemple l’intégrale de l’indicatrice de R. Propriété 14 (Propriétés usuelles de l’intégrale) 1lA dµ = µ(A) R R R b. (Additivité) (f + g)dµ = f dµ + gdµ. a. R R R c. (Homogénéité) Pour tout a > 0, agdµ = a gdµ. L’intégrale est donc R R d. (Croissance) Si f ≤ g alors f dµ ≤ gdµ . Démonstration : Puisque l’on se restreint pour l’instant à E + , tout est trivial. Les points a, b et c sont de simples applications de la définition. Pn Pour Pm démontrer très précisément la croissance, il faut décomposer les fonctions f = i=1 ai 1lAi et g = j=1 bj 1lBj sur les mêmes parties. On s’assure que les Ai soient disjoints (quitte à les découper) et on pose An+1 = (∪ni=1 Ai )c et an+1 = 0 afin d’avoir une décomposition de f sur X en entier. On fait pareil pour les Bj . On pose qui sont bien mesurables. Soit (i, j) tel que C(i,j) soit non vide. Sur C(i,j) , f = ai et g = bj , et puisque f ≤ g, ai ≤ bj . On a alors n+1 n+1 m+1 m+1 m+1 X X X X n+1 X X n+1 X f= ai 1lAi = ai 1lC(i,j) = ai 1lC(i,j) ≤ bj 1lC(i,j) = g i=1 i=1 j=1 j=1 i=1 j=1 i=1 , 27 Théorème 6 (Lemme de Beppo-Levy) Soit gn une suite croissante de fonctions de E + et h ∈ E + . gn est une suite croissante, donc elle converge simplement vers une fonction lim gn mesurable (mais pas forcément dans E + ). Si h est inférieure à cette limite, son intégrale est inférieure à la limite des intégrales des gn . Z Z h ≤ lim gn ⇒ hdµ ≤ lim gn dµ. n→∞ n→∞ Par contre, sur l’intégrale de lim gn . Démonstration : Soit ε > 0 et x ∈ X. Comme la limite des gn est supérieure ou égale à h, il existe n tel que gn (x) ≥ (1 − ε)h(x). Donc Bnε = {x, gn (x) ≥ (1 − ε)h(x)} est un suite de parties qui converge vers . A n fixé, gn ≥ (1 − ε)h1lBnε . Comme h ∈ E + , il existe des ai positifs et des Ai mesurables tels que h = Z h1lBnε dµ = N X PN i=1 ai 1lAi et donc ai µ(Ai ∩ Bnε ). i=1 Comme Bnε converge vers X, Ai ∩ Bnε converge vers Ai et donc par Z h1l ε Bn dµ = N X ai µ(Ai ∩ Bnε ) % i=1 N X des mesures, Z ai µ(Ai ) = hdµ. i=1 Enfin, comme gn ≥ (1 − ε)h1lBnε , par croissance et linéarité de l’intégrale Z Z Z gn dµ ≥ (1 − ε)h1lBnε dµ = (1 − ε) h1lBnε dµ. Comme la suite gn est croissante, pour k Z gk dµ Z donc lim gk dµ k→∞ Z et donc lim gn dµ n→∞ ≥ n, Z ≥ (1 − ε) h1lBnε dµ. Z h1lBnε dµ Z Z lim (1 − ε) h1lBnε dµ = (1 − ε) hdµ. ≥ (1 − ε) ≥ n→∞ Comme c’est vrai pour tout ε > 0, on a Z lim n→∞ Z gn dµ ≥ hdµ. , Théorème 7 (Corolaire) Soit gn une suite croissante de E + qui converge simplement (c’est-à-dire point par point) vers g ∈ E + : gn % g, alors Z Z gn dµ % gdµ Démonstration : D’après le Lemme de Beppo-Levy, comme g ≤ lim gn , on a Z Z lim gn dµ ≥ gdµ. n→∞ Par ailleurs, la suite étant croissante, gn ≤ g et par croissance de l’intégrale, Z Z lim gn dµ ≤ gdµ. R gn dµ ≤ R gdµ et donc n→∞ il y a donc égalité. , 28 5.2 Intégrale des fonctions mesurables positives Soit M + l’ensemble des fonctions mesurables positives (à valeurs éventuellement infinies). Définition 31 Soit f ∈ M + , on pose (Z Z f dµ = sup hdµ, avec et h ≤ f ) . Pour f une fonction de E + , f est la fonction inférieure à elle-même d’intégrale maximale donc les deux définition sont bien cohérentes. Pour une fonction f ∈ M + \ E + , la proposition suivante montre qu’on peut alors calculer l’intégrale à partir d’une suite de fonctions étagées positives qui converge vers f . Propriété 15 Soit f ∈ M + et hn une de fonctions de E + convergeant vers f (typiquement celle construite au chapitre 3), Z Z f dµ = lim hn dµ n→∞ Démonstration : Soit h ∈ E + avec h ≤ f = lim hn . D’après Beppo-Levy, . Donc Z Z f dµ = sup hdµ, avec h ∈ E + et h ≤ f Z ≤ lim hn dµ. Comme les hn sont dans E + et inférieures à f , leurs intégrales sont dans l’ensemble dont on cherche le sup, donc inférieures à ce sup : Z Z Z hn dµ ≤ sup hdµ, avec h ∈ E + et h ≤ f = f dµ. Puisque c’est Rvrai pour tout n, c’est vrai pour lim R lim hn dµ = f dµ R hn dµ aussi. On a donc les deux inégalités, d’où , Propriété 16 L’intégrale sur M + est toujours linéaire (pour des fonctions et des réels positifs) et croissante. Démonstration : Les démonstrations se font en utilisant chaque propriété sur des suites de fonctions étagées qui convergent vers les fonctions mesurables. 29 , Théorème 8 (Convergence monotone) Si gn est une suite croissante de fonctions de M + alors ∃g ∈ M + telle que gn converge vers g et la suite des intégrales converge vers l’intégrale de g : Z Z gn dµ % gdµ Démonstration : D’après la proposition (8), la limite d’une suite de fonctions mesurables est mesurable. Et la positivité est triviale. g est donc dans M + . A n fixé, soit fk,n la suite croissante de fonctions étagées positives convergeant vers gn lorsque k → ∞. On pose par h0 = 0 et pour n > 0, hn = max(hn−1 , fn,n ). On a alors hn % g. On est donc ramené à une suite croissante de fonctions de E + . D’après la propriété (15), Z Z hn dµ % gdµ Reste à récupérer la suite des gn . On a hn = max(hn−1 , fn,n ) ≤ max(hn−1 , gn ) puisque , fk,n % gn . Par une récurrence immédiate, hn ≤ max(max(hn−2 , gn−1 ), gn ) ≤ · · · ≤ max(0, g1 , . . . , gn ) = gn car gn est une suite croissante de fonctions positives. Donc Z Z Z hn ≤ gn ≤ g d’où hn dµ ≤ gn dµ ≤ gdµ Par encadrement, R gn dµ % R , gdµ. Propriété 17 (Lemme de Fatou) Soit gn une suite quelconque de fonctions de M + , ni nécessairement croissante ni nécessairement convergente, Z Z (lim inf gn dµ) ≤ lim inf gn dµ . Remarque 17 (Astuce mnémotechnique) «L’intégrale de la liminf est inférieure à la limite inférieure de l’intégrale». Les inf sont tous collés. Démonstration : L’idée est simplement de se ramener à une suite croissante. On pose ik = inf n≥k gn . ik est alors une suite croissante de limite lim inf gn . D’après le Théorème de convergence monotone, on a alors Z Z ik dµ % lim inf gn dµ R R De plus, par définition de ik , pour tout n ≥ k, gn ≥ ik et donc gn dµ ≥ ik dµ. En passant à la limite inférieure , Z lim inf Z Z Z gn dµ ≥ lim inf ik dµ = lim ik dµ = lim inf gn dµ. , Remarque 18 Le lemme de Fatou est un peu compliqué. Le Théorème de convergence monotone est plus agréable, mais il faut la monotonie. En fait il n’existe pas de théorème simple du type «si gn converge vers g alors la suite des intégrales converge vers l’intégrale de la limite». Voici un contre exemple : soit gn = 1l]n;+∞[ . Pour tout x, gn (x) finit par être nul et donc gn converge vers la fonction nulle (mais en décroissant). R R Or pour tout n, gn dλ = mais 0dλ = 0. Par contre le Lemme de Fatou reste valable : Z Z Z 0 = 0dλ = (lim inf gn ) dλ ≤ lim inf gn dλ = lim inf (+∞) = +∞. 30 Remarque 19 (Mesures discrètes) Si µ est discrète, l’intégrale est une somme : X ∃(xi , pi )i∈N ∈ (XN , (R+ )N ), ∀A ∈ A, µ(A) = pi 1lxi ∈A i∈N et donc ∀f ∈ M + , Z f dµ = X pi f (xi ) i∈N Définition 32 (Espérance) Si µ est une mesure de probabilité associée à une v.a. X alors Z Z gdµ = gdPX = E[g(X)]. Propriété 18 Si f ∈ M + est intégrable au sens de Riemann, les deux intégrales coïncident: Z Z f (x)dx = f dλ. Démonstration : Les fonctions en escalier sont des fonctions étagées, donc si f est la limite d’une suite croissante de fonctions en escalier, c’est aussi la limite d’une suite croissante de fonctions étagées. Enfin, les deux définitions de l’intégrale coïncident sur les fonctions en escalier. , Propriété 19 Une fonction de M + nulle presque partout est d’intégrale nulle. Plus généralement, deux fonctions de M + égales presque partout sont d’intégrales égales. On peut donc omettre de définir les fonctions sur un ensemble négligeable, en particulier pour λ sur tout ensemble fini de points. Remarque 20 (Attention à l’ordre des quantificateurs) ∀y ∈ R, λ {x|1ly (x) = 0} alors que λ {x|∀y ∈ R, 1ly (x) = 0} et pourtant λ {x|∀n ∈ N, 1ln (x) = 0} 31 = +∞ = 0 = +∞ Chapitre 6 Intégrale des fonctions mesurables quelconques 6.1 Définitions On ne peut malheureusement pas étendre notre définition de l’intégrale de Lebesgue de M + à toutes les fonctions mesurables M . Mais la restriction reste satisfaisante : les seules fonctions dont on ne peut définir l’intégrale sont celles dont les parties positives et négatives ont une intégrale infinie, ce qui correspond à la forme indéterminée ∞ − ∞. Définition 33 (Fonction mesurable intégrable) Soit f ∈ M , f + et f − ces parties positives et négatives. f est dite intégrable ssi f + et f − ont des intégrales finies. On pose alors Z Z f dµ = Z + f dµ f − dµ. R L’ensemble des fonctions intégrables est noté L1 = f ∈ M, |f |dµ < ∞ . Pour les fonctions intégrables, on a donc les propriétés usuelles de l’intégrale (linéarité, croissance, définition à un ensemble négligeable près), comme sur E + et M + . Définition 34 (Fonction mesurable admettant une intégrale) Soit f ∈ M , f admet une intégrale si une et une seule de ses parties est d’intégrale finie. L’intégrale de f est alors infinie (positive ou négative). On a toujours Z Z Z + f dµ = f dµ − f − dµ Remarque 21 On ne peut donc pas donner de valeur à 6.2 R R sin dλ. Propriétés Propriété 20 Soient f ∈ M et g ∈ M + intégrable. Si |f | ≤ g presque partout alors f est intégrable. Démonstration : On a f + 1l|f |≤g ≤ g et f + 1l|f |≤g est dans M + , on peut donc utiliser les propriétés de l’intégrale sur M + : Z Z Z + + f dµ = f 1l|f |≤g dµ ≤ gdµ < ∞. On obtient de même que l’intégrale de f − est finie. f est donc intégrable. , Théorème 9 (Primitive) Soit f une fonction de ([a; b], B([a; b]), λ), dans (R, B(R)) et pour x ∈ [a; b] : Z F (x) = 1l[a;x] f dλ. Si f est continue alors F est continue, nulle en a et dérivable de dérivée F 0 = f . 32 Démonstration : f est continue sur un segment donc bornée : il existe A > 0 tel que |f | ≤ A1l[a;b] donc f est intégrable et Z Z |F (x + ε) − F (x)| ≤ 1l[x;x+ε] |f |dλ ≤ 1l[x;x+ε] Adλ = Aλ([x; x + ε]) = εA −−−→ 0. ε→0 F est donc continue. On a de même F (a) = 0. Pour la formule de la primitive, on se place en un point x0 et on considère le taux d’accroissement T = On a T = F (x0 + δ) − F (x0 ) . δ . Comme δ −1 R 1l[x0 ;x0 +δ] dλ = 1, on peut écrire : Z Z −1 |T − f (x0 )| = δ 1l[x0 ;x0 +δ] (f − f (x0 ))dλ ≤ δ −1 1l[x0 ;x0 +δ] |f − f (x0 )|dλ. Or f est continue en x0 , pour tout ε > 0, il existe δ tel que si |t − x0 | ≤ δ, |f (x0 + t) − f (x0 )| ≤ ε et donc Z |T − f (x0 )| =≤ δ −1 1l[x0 ;x0 +δ] εdλ = δ −1 ελ([x0 ; x0 + δ]) = ε. T converge donc vers f (x0 ) lorsque δ → 0, ce qui prouve que F est dérivable en x0 , de dérivée f (x0 ). Plus précisément, on n’a que la dérivabilité à droite en a (avec δ > 0) et à gauche en b (avec δ < 0). , Propriété 21 (Lemme de Fatou II, le retour) Soient h intégrable et gn une suite de fonctions mesurables. 1. Si pour tout n, gn ≥ h presque partout, alors Z Z (lim inf gn dµ) ≤ lim inf gn dµ . 2. Si pour tout n, gn ≤ h presque partout, alors Z Z (lim sup gn dµ) ≥ lim sup gn dµ . Par rapport au Lemme de Fatou des fonctions mesurables positives, il faut donc ajouter un contrôle par une fonction intégrable. Démonstration : Pour commencer, on a pour chaque n un ensemble An négligeable de points où le contrôle n’est pas assuré. Cet ensemble peut changer à chaque n, mais de toute façon il n’y en a un qu’un nombre dénombrable. Une réunion dénombrable d’ensemble négligeable étant négligeable, µ(A) = µ(∪n An ) = 0 et on peut travailler sur le complémentaire Ac uniquement. Sur ce complémentaire, gn − h est positive, on peut donc lui appliquer le lemme de Fatou I. Z Z c c (lim inf(gn − h)1lA dµ) ≤ lim inf (gn − h)1lA dµ Z Z Z Z (lim inf gn dµ) − hdµ ≤ lim inf gn dµ − hdµ Z Z (lim inf gn dµ) ≤ lim inf gn dµ La démonstration du point 2 est immédiate en considérant −gn . , Théorème 10 (Convergence dominée) Soient gn une suite de fonctions mesurables et h intégrable telles que presque partout. S’il existe g limite simple presque partout de la suite gn alors cette limite g est intégrable et Z Z gn dµ −−−−→ n→∞ 33 gdµ. Les gn sont bien sûr intégrables, à cause de la majoration |gn | ≤ h. Démonstration : Comme pour Fatou, on se place sur Ac , l’ensemble où la majoration est vraie pour tout n, et où la suite converge tant qu’à faire. Sur cet ensemble, g est la limite des gn , donc à la fois la limite sup et la limite inf. Le Lemme de Fatou II (avec les 2 contrôles issus du contrôle en valeur absolue) donne : Z Z Z Z Z lim sup gn dµ ≤ (lim sup gn dµ) = gdµ = (lim inf gn dµ) ≤ lim inf gn dµ . Comme la limite sup est forcément supérieure à la limite inf, il y a égalité et donc R gdµ. R gn dµ converge vers , Propriété 22 (Corolaire) Soit gn une suite de fonctions mesurables telles que presque partout PN et pour tout N , n=1 gn ≤ h avec h ∈ L1 alors +∞ Z X gn dµ = n=1 Z X +∞ P+∞ n=1 gn ∈R gn dµ n=1 Démonstration : Il s’agit simplement du théorème de convergence dominée pour la suite (et de la linéarité de l’intégrale sur les fonctions intégrables). , Théorème 11 (Dérivation sous l’intégrale) Soit (gt ) ∈ M R une famille indexée par R de fonctions intégrables. Si t 7→ gt (x) est dérivable pour presque tout x et qu’il existe h intégrable telle que ∂gt (x) ≤ h(x) presque partout alors ∂t Z I(t) = gt dµ est dérivable, de dérivée I 0 (t) = Z ∂gt dµ ∂t Démonstration : Comme pour les séries, on écrit la dérivée comme la limite d’une suite. On se restreint comme d’habitude au complémentaire de l’ensemble négligeable qui pose éventuellement problème. Soit t et sn une suite qui tend vers t avec ∀n, sn 6= t. On pose rn (x) = gsn (x) − gt (x) ∂gt −−−−→ (x). n→∞ ∂t sn − t Par le théorème des accroissements finis, |rn (x)| ≤ h(x). On peut donc lui appliquer le Théorème de convergence dominée : Z Z ∂gt rn (x)dµ(x) −−−−→ (x)dµ(x). n→∞ ∂t Z I(sn ) − I(t) Or rn (x)dµ(x) = −−−−→ I 0 (t), n→∞ sn − t R t les deux limites sont donc égales : I 0 (t) = ∂g , ∂t (x)dµ(x). P Remarque 22 On peut également dériver les séries n∈N gt (n). Il suffit d’utiliser la mesure de comptage P : µ = n∈N δn . En effet, pour gt (n) une famille de fonctions intégrables pour la tribu discrète (c’est-à-dire t sommable en n) telle que | ∂g ∂t (n)| ≤ h(n) avec h(n) intégrable (pour la mesure de comptage, c’est-à-dire sommable), alors la somme des gt (n) est dérivable : P X ∂gt ∂ n∈N gt (n) = (n). ∂t ∂t n∈N On note plutôt gt (n) = un (t) et U = 0 n∈N un , et on a U (t) = P X n∈N 34 u0n (t)