Variables aléatoires continues Samy Tindel Université de Lorraine Telecom Nancy - Module MAP Samy T. (IECL) TN - V.a. continues Module MAP 1 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 2 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 3 / 51 Variable aléatoire Définition Soit (Ω, A, P) un espace de probabilités. Soit E un espace vectoriel (R, Rd ). Une application X : Ω → E se nomme variable aléatoire. Remarque: Ici encore, pour être rigoureux, il faudrait introduire la notion de mesurabilité. Remarque: Une variable aléatoire discrète est aussi une variable aléatoire! Samy T. (IECL) TN - V.a. continues Module MAP 4 / 51 Mesure image Type d’information d’intérêt: pour A ⊂ E , calcul de P({ω; X (ω) ∈ A}) Abus de notation: on note P({ω; X (ω) ∈ A}) = PX (A)= P(X ∈ A) Définition: PX est une probabilité sur E . On la nomme mesure image. On a souvent accès à (E , PX ) au lieu de (Ω, P) Correspondance avec le monde réel: Ω = espace des expériences possibles X = résultat ou résumé de l’expérience Samy T. (IECL) TN - V.a. continues Module MAP 5 / 51 Loi d’une v.a. Définition Soit X : Ω → E une v.a. L’ensemble {P(X ∈ A); A ⊂ E } se nomme loi de probabilité de X Problème: la famille {P(X ∈ A); A ⊂ E } est trop vaste pour pouvoir la décrire de manière satisfaisante. Samy T. (IECL) TN - V.a. continues Module MAP 6 / 51 Fonction de répartition Définition Soit X : Ω → R une v.a réelle. La fonction de répartition FX de X est définie par FX (x ) = PX (] − ∞, x ]) = P(X ≤ x ) Exemple: Soit X ∼ P(λ). P On pose pj = e −λ λj /j! et qk = kj=0 pj . Alors X FX (x ) = qk 1[k,k+1[ (x ). k≥0 Samy T. (IECL) TN - V.a. continues Module MAP 7 / 51 Propriétés de la fonction de répartition Théorème Soit FX la f.r d’une v.a réelle X . Alors (1) FX est croissante. (2) limx →−∞ FX (x ) = 0 et limx →∞ FX (x ) = 1 (3) FX est continue à droite et admet une limite à gauche en tout point x ∈ R. Samy T. (IECL) TN - V.a. continues Module MAP 8 / 51 Fonction de répartition et loi de v.a Théorème Soit X une v.a réelle. Alors la loi de X est déterminée par {FX (x ); x ∈ R} Pseudo-démonstration: Les ensembles A mesurables peuvent se décomposer comme A = ∪i ∩j Aij , Samy T. (IECL) avec Aij =] − ∞, xij ] TN - V.a. continues Module MAP 9 / 51 V.a discrètes et continues Définition Soit FX la f.r d’une v.a réelle X . Alors (1) Si FX est constante par morceaux, on dit que X est discrète. (2) Si FX est continue, on dit que X est continue (3) Cas particulier important: si FX peut s’écrire FX (x ) = Z x −∞ fX (ξ) dξ, avec fX positive, on dit que La loi de X est absolument continue. fX est la densité de X (ou de la loi de X ). Samy T. (IECL) TN - V.a. continues Module MAP 10 / 51 Loi d’une v.a. à densité Proposition Soit X : Ω → R v.a. de densité fX . Soit A ⊂ R. Alors P(X ∈ A) = Z A fX (ξ) dξ Remarques: (1) En particulier, la densité caractérise une loi. (2) Certaines variables aléatoires sont continues sans densité ,→ Exemple typique: loi U(C ), où C = ensemble de Cantor. (3) Une fonction f : R → R définit une densité si R ,→ f ≥ 0 et R f (x ) dx = 1. Samy T. (IECL) TN - V.a. continues Module MAP 11 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 12 / 51 Loi uniforme Notation: U([a, b]) pour −∞ < a < b < ∞ Ensemble des valeurs: E = [a, b] Densité: fX (x ) = 1 1[a,b] (x ) b−a Utilisation: U([0, 1]) est la seule v.a. accessible directement sur ordinateur ,→ fonction rand Exemple de calcul: si X ∼ U([8, 10]), alors 1 Z 9.5 9.5 − 8 3 P(7.5 < X < 9.5) = dx = = 2 8 2 4 Samy T. (IECL) TN - V.a. continues Module MAP 13 / 51 Loi Exponentielle Notation: E(λ), pour λ > 0 Ensemble des valeurs: E = R+ Densité: fX (x ) = λe −λx 1R+ (x ) Utilisation: Temps d’attente entre Arrivée de deux clients dans un magasin de 14h à 17h Passage de deux bus à un arrêt sur une période de temps Deux requêtes sur un serveur de minuit à 6h Exemple de calcul: si X ∼ E(λ), alors pour x ≥ 0, P(X > x ) = Z ∞ λ e −λz dz = e −λx x Samy T. (IECL) TN - V.a. continues Module MAP 14 / 51 Loi exponentielle: illustration 2.0 1.8 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 Figure : Loi E(1), E(2), E(1/2). Abscisses: x . Ordonnées: fX (x ) Samy T. (IECL) TN - V.a. continues Module MAP 15 / 51 Loi gaussienne (ou normale) Notation: N (µ, σ 2 ) pour µ ∈ R et σ 2 > 0 Ensemble des valeurs: E = R Densité: ! (x − µ)2 1 exp − fX (x ) = √ 2σ 2 2π σ 2 Utilisation: Phénomènes dépendant d’un grand nombre de petits paramètres Nombreux exemples en Biologie Physique et industrie Economie Problème: les primitives de fx ne sont pas directement calculables ,→ utilisation de tables pour les calculs de probabilité Samy T. (IECL) TN - V.a. continues Module MAP 16 / 51 Loi normale: illustration 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 !5 !4 !3 !2 !1 0 1 2 3 4 5 Figure : Loi N (0, 1), N (1, 1), N (0, 9), N (0, 1/4). Samy T. (IECL) TN - V.a. continues Module MAP 17 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 18 / 51 Espérance mathématique Définition Soit X : Ω → R une v.a. réelle de densité fX . Soit g : R → R. On pose E[g(X )] = Z g(x )fX (x ) dx . R Cette quantité se nomme espérance de g(X ). Remarque: Il faut en principe vérifier que l’intégrale définissant E[g(X )] est absolument convergente, i.e. Z |g(x )|fX (x ) dx < ∞. R Samy T. (IECL) TN - V.a. continues Module MAP 19 / 51 Cas particuliers importants Soit X : Ω → R une v.a. réelle de densité fX . (1) Espérance de X : E[X ] = Z x fX (x ) dx . R (2) Moment d’ordre r (resp. centré d’ordre r ) de X , pour r > 0: Z r E[X ] = x r fX (x ) dx ZR E [(X − E[X ])r ] = (x − E[X ])r fX (x ) dx R (3) Variance de X : h 2 Var(X ) = E (X − E[X ]) i = Z (x − E[X ])2 fX (x ) dx . R Samy T. (IECL) TN - V.a. continues Module MAP 20 / 51 Exemple de calcul Exemple: soit X ∼ U([a, b]) avec a < b. On a E[X ] = h ib 1 a+b 1 Zb x dx = x2 = . a b−a a 2(b − a) 2 On a aussi 1 Zb a+b x− Var(X ) = b−a a 2 2 = (b − a) Z 1/2 y 2 dy −1/2 !2 dx cv: y = x − (a + b)/2 b−a 2 = Samy T. (IECL) (b − a) 12 TN - V.a. continues Module MAP 21 / 51 Interprétation Espérance: Pour une v.a. X , l’espérance E[X ] représente la valeur moyenne que prend X . Variance: Pour une v.a. X , l’espérance Var(X ) représente la dispersion de X autour de sa moyenne. Plus Var(X ) est grande et Plus le système représenté par X est aléatoire Moins ce système est prévisible Ecart type: pour des raisons d’unités physiques, il est plus clair de raisonner en termes d’écart type σX , avec σX := Samy T. (IECL) q Var(X ). TN - V.a. continues Module MAP 22 / 51 Propriétés de l’espérance Proposition Soit X : Ω → R une variable aléatoire réelle. Soient f , g : R → R et a, b ∈ R. Alors (1) On a E [a f (X ) + b g(X )] = a E [f (X )] + b E [g(X )] (2) Dans le cas particulier affine, on a E[aX + b] = a E[X ] + b, Samy T. (IECL) et Var(aX + b) = a2 Var(X ) TN - V.a. continues Module MAP 23 / 51 Propriétés de l’espérance (2) Proposition (1) Soit X : Ω → R une variable aléatoire. Alors i h Var(X ) = E X 2 − (E[X ])2 (2) Soient d variables aléatoires réelles X1 , . . . , Xd . Alors d X E Xj j=1 = d X E[Xj ] j=1 Démonstration de (1): On a, si m := E[X ], h Var(X ) = E (X − m)2 h i = E X 2 − 2m X + m2 h i i = E X 2 − m2 Samy T. (IECL) TN - V.a. continues Module MAP 24 / 51 Propriétés de l’espérance (3) Définition: Soit A ⊂ R. La fonction 1A : R → {0, 1} est définie par 1A (x ) = 1 si x ∈ A, et 1A (x ) = 0 si x 6∈ A Proposition Soit X : Ω → R une variable aléatoire. Soit A ⊂ R. Alors E[1A (X )] = P(X ∈ A) Samy T. (IECL) TN - V.a. continues Module MAP 25 / 51 Valeurs pour les v.a. usuelles Tableau récapitulatif: Loi E[X ] Var(X ) (b−a)2 U([a, b]) a+b 2 12 1 1 E(λ) λ λ2 N (µ, σ 2 ) µ σ2 Calculs: au tableau (et à savoir faire) Remarque: La loi N (0, 1) se nomme gaussienne centrée réduite. Samy T. (IECL) TN - V.a. continues Module MAP 26 / 51 Caractérisation de la loi par l’espérance Notation: Cb (R) ≡ ensemble des fonctions continues et bornées sur R. Théorème Soit X une v.a. réelle. On suppose que E[ϕ(X )] = Z ϕ(x ) f (x ) dx , pour toute fonction ϕ ∈ Cb (R). R Alors X est absolument continue, de densité f . Samy T. (IECL) TN - V.a. continues Module MAP 27 / 51 Application: changements de variable Problème: Soit X une variable aléatoire de densité f . On pose Y = h(X ) avec h : R → R. On aimerait trouver la densité de Y . Recette: on procède selon les étapes suivantes. 1 Pour ϕ ∈ Cb (R), on écrit E[ϕ(Y )] = E[ϕ(h(X ))] = Z ϕ(h(x )) f (x ) dx . R 2 On fait le changement de variable y = h(x ) dans l’intégrale. Après calcul, on obtient E[ϕ(Y )] = Z ϕ(y ) g(y ) dy . R 3 Ceci caractérise la loi de Y , qui admet g pour densité. Samy T. (IECL) TN - V.a. continues Module MAP 28 / 51 Exemple 1 Proposition Soit X ∼ N (0, 1). Soient µ ∈ R et σ > 0. On pose Y = σX + µ. Alors Y ∼ N (µ, σ 2 ). Démonstration: pour ϕ ∈ Cb (R), on écrit 2 e −x /2 dx . E[ϕ(Y )] = E[ϕ(σX + µ)] = ϕ(σx + µ) √ R 2π Z Changement de variable: y = σx + µ: E[ϕ(Y )] = Z R 2 ϕ(y ) g(y ) dx , 2 e −(y −µ) /(2σ ) √ avec g(y ) = . 2πσ 2 Donc Y admet g pour densité, et Y ∼ N (µ, σ 2 ). Samy T. (IECL) TN - V.a. continues Module MAP 29 / 51 Exemple 2 Question 1: Le temps d’attente (en mn) des patients chez le docteur Mutzig peut se modéliser par une v.a Y de la forme Y = 5 + X , où X ∼ E(λ) avec λ = 1/2. Quelle est la densité de Y ? On trouve fY (y ) = λe −λ(y −5) 1[5,∞[ (y ). Question 2: Le mécontentement des patients peut se mesurer par la v.a. Z = ln(X ). Quelle est la densité de Z ? On trouve fZ (z) = λ exp(−λe z + z). Samy T. (IECL) TN - V.a. continues Module MAP 30 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 31 / 51 Définitions de base Définition Soient d v.a. réelles X1 , . . . , Xd définies sur (Ω, A, P). (1) On pose X = (X1 , . . . , Xd ). X se nomme vecteur aléatoire de Rd . (2) La fonction de répartition de X est FX : Rd → R, définie par FX (x1 , . . . , xd ) = P (X1 ≤ x1 , . . . , Xd ≤ xd ) (3) Soit X un vecteur aléatoire de Rd . On dit que X admet une densité fX : Rd → R+ si FX (x1 , . . . , xd ) = Samy T. (IECL) Z x1 −∞ ··· Z xd −∞ fX (u1 , . . . , ud ) du1 · · · dud TN - V.a. continues Module MAP 32 / 51 Loi marginale et indépendance Définition Soit X un vecteur aléatoire de Rd défini sur (Ω, A, P). On suppose que X admet une densité fX . (1) La loi marginale de X1 est donnée par la densité fX1 (x1 ) = Z Rd−1 fX (x1 , u2 , . . . , ud ) du2 · · · dud (2) Les v.a X1 , . . . , Xd sont indépendantes si fX (u1 , . . . , ud ) = d Y fXi (ui ), pour tout (u1 , . . . , ud ) ∈ Rd . i=1 Samy T. (IECL) TN - V.a. continues Module MAP 33 / 51 Application (1) Expérience: tirage de nombre au hasard dans [0, 1]2 . ,→ X vecteur aléatoire de R2 , de densité fX (x1 , x2 ) = 1[0,1]2 (x1 , x2 ). Fonction de répartition: pour (x1 , x2 ) ∈ R2 , FX (x1 , x2 ) = = Z x1 Z x2 −∞ Z x1 −∞ Z x2 −∞ −∞ fX (u1 , u2 ) du1 du2 1[0,1] (u1 ) 1[0,1] (u2 ) du1 du2 = (x1 ∧ 1) (x2 ∧ 1) 1R2+ (x1 , x2 ). Samy T. (IECL) TN - V.a. continues Module MAP 34 / 51 Application (2) Lois marginales: fX1 (x1 ) = Z 1 0 fX (x1 , u2 ) du2 = = 1[0,1] (x1 ) Z 1 0 Z 1 0 1[0,1] (x1 ) 1[0,1] (u2 ) du2 1[0,1] (u2 ) du2 = 1[0,1] (x1 ). Donc X1 ∼ U([0, 1]). De même, X2 ∼ U([0, 1]). Indépendance: on a fX (x1 , x2 ) = 1[0,1]2 (x1 , x2 ) = 1[0,1] (x1 ) 1[0,1] (x2 )= fX1 (x1 ) fX2 (x2 ). Donc X1 ⊥ ⊥ X2 . Samy T. (IECL) TN - V.a. continues Module MAP 35 / 51 Indépendance et espérance Proposition Soient d v.a. indépendantes X1 , . . . , Xd : Ω → E . Soient d fonctions f1 , . . . , fd : E → R. Alors (1) On a " # E d Y fi (Xi ) = i=1 d Y E [fi (Xi )] i=1 (2) Corrollaire: on a aussi Var d X i=1 ! Xi = d X Var (Xi ) i=1 Remarque: Le point (1) estR un analogue Rprobabiliste de: R R2 ϕ1 (x1 ) ϕ2 (x2 ) dx1 dx2 = R ϕ1 (x1 ) dx1 R ϕ2 (x2 ) dx2 Samy T. (IECL) TN - V.a. continues Module MAP 36 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 37 / 51 Covariance Définition Soient X1 , X2 : Ω → R, de loi conjointe P. On suppose que X = (X1 , X2 ) admet une densité fX La covariance de X1 et X2 est définie par Cov(X1 , X2 ) = E [(X1 − m1 ) (X2 − m2 )] = Samy T. (IECL) Z R2 (x1 − m1 ) (x2 − m2 ) fX (x1 , x2 ) dx1 dx2 TN - V.a. continues Module MAP 38 / 51 Covariance (2) Proposition Expression alternative pour la covariance: Cov(X1 , X2 ) = E [X1 X2 ] − m1 m2 = Z R2 x1 x2 fX (x1 , x2 ) dx1 dx2 − m1 m2 Démonstration: comme pour la variance. Remarque: Si X1 ⊥⊥ X2 , on a Cov(X1 , X2 ) = 0. En effet: E [(X1 − m1 ) (X2 − m2 )] = E [X1 − m1 ] E [X2 − m2 ] = 0. Samy T. (IECL) TN - V.a. continues Module MAP 39 / 51 Corrélation Définition Soient X1 , X2 : Ω → E , de loi conjointe P. On note σX1 et σX2 les écarts-type de X1 et X2 . Le coefficient de corrélation de X1 et X2 est défini par ρX1 ,X2 = Cov(X1 , X2 ) Cov(X1 , X2 ) =q σX1 σX2 Var(X1 ) Var(X2 ) Interprétation: on a toujours −1 ≤ ρX1 ,X2 ≤ 1 et Si ρX1 ,X2 ' 1: dép. linéaire positive forte entre X1 et X2 Si ρX1 ,X2 ' −1: dép. linéaire négative forte entre X1 et X2 Si ρX1 ,X2 ' 0: indépendance linéaire entre X1 et X2 Samy T. (IECL) TN - V.a. continues Module MAP 40 / 51 Plan 1 Définitions 2 Variables aléatoires continues usuelles 3 Moments des variables aléatoires 4 Vecteurs aléatoires continus 5 Dépendance linéaire 6 Limites de v.a Samy T. (IECL) TN - V.a. continues Module MAP 41 / 51 n-échantillon Définition Soit (X1 , . . . , Xn ) une famille de n variables aléatoires i.i.d. (X1 , . . . , Xn ) se nomme n-échantillon. Exemple: On fait n = 50 tirages de dé. Au i ème tirage, on pose Xi = 1 si on obtient 6, et Xi = 0 sinon. Alors (X1 , . . . , X50 ) est un 50-échantillon de loi B(1/6). Notation: Soit (X1 , . . . , Xn ) un n-échantillon. La v.a n 1X X̄n := Xi n i=1 se nomme moyenne empirique du n-échantillon. Samy T. (IECL) TN - V.a. continues Module MAP 42 / 51 Loi forte des grands nombres Théorème Soit (Xn ; n ≥ 1) un n-échantillon de v.a. à valeurs dans R On suppose E [|X1 |] < ∞, E [X1 ] = m ∈ R. Alors X̄n (ω) −→ m, quand n → ∞, pour tout ω ∈ Ω sauf sur un ensemble de probabilité nulle. Définition La convergence pour tout ω ci-dessus se nomme convergence presque sûre. Samy T. (IECL) TN - V.a. continues Module MAP 43 / 51 Théorème central de la limite Théorème Soit (Xn ; n ≥ 1) un n-échantillon de v.a. à valeurs dans R On suppose E [|X1 |2 ] < ∞ Soit m ∈ R la moyenne de X1 , σ 2 > 0 sa variance. Alors √ X̄n − m (d) n −→ N (0, 1) σ lorsque n → ∞, c’est-à-dire que pour tout x ∈ R, lim P n→∞ √ X̄n − m n σ ! ! ≤x = Z x −∞ 2 e −z /2 √ dz. 2π Interprétation: X̄n converge vers m à vitesse n1/2 Samy T. (IECL) TN - V.a. continues Module MAP 44 / 51 Exemple: loi de Bernoulli Corollaire Soit (Xn ; n ≥ 1) suite i.i.d de v.a. B(p) Alors ! √ X̄n − p (d) −→ N (0, 1). n 1/2 [p(1 − p)] Remarque: En pratique dès que np > 15, on approche la loi de X1 + · · · + Xn − np √ npq par N1 (0, 1). Notons que X1 + · · · + Xn suit une loi Bin(n, p). Samy T. (IECL) TN - V.a. continues Module MAP 45 / 51 Loi Binomiale: illustration (1) 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 Figure : Loi Bin(6; 0.5). Abscisses: k. Ordonnées: P(X = k) Samy T. (IECL) TN - V.a. continues Module MAP 46 / 51 Loi Binomiale: illustration (2) 0.15 0.10 0.05 0.00 0 5 10 15 20 25 30 Figure : Loi Bin(30; 0.5). Abscisses: k. Ordonnées: P(X = k) Samy T. (IECL) TN - V.a. continues Module MAP 47 / 51 Application Exemple: On considère des rouleaux de pièces contenant théoriquement 25 pièces. La distribution réelle du nombre X de pièces par rouleau est plutôt: P(X = 24) = 0.03, P(X = 25) = 0.96, P(X = 26) = 0.01 Question: Calculer de manière approchée la proba que sur 400 rouleaux il y ait: (1) Moins de 10000 pièces. (2) Moins de 9990 pièces. Samy T. (IECL) TN - V.a. continues Module MAP 48 / 51 Application (2) Calcul de E[X ] et Var(X ): On a E[X ] = E[X 2 ] = 26 X i=24 26 X i P(X = i) = 24.98 := m i 2 P(X = i) = 624.04 i=24 Var(X ) = E[X 2 ] − E2 [X ] = 0.0396 σ(X ) = Samy T. (IECL) q Var(X ) = 0.2 TN - V.a. continues Module MAP 49 / 51 Application (3) Modélisation: On considère n = 400 rouleaux. Soit Xi ≡ nombre de pièces dans le ième rouleau. Hypothèse: (X1 , . . . , Xn ) est un n-échantillon de même loi que X . Position du problème: On cherche P( M = 10000, M = 9990. Comme n est grand, on utilise: Y := Samy T. (IECL) Pn i=1 Xi ≤ M), avec √ X̄n − m n ≈ Z ∼ N (0, 1) σ TN - V.a. continues Module MAP 50 / 51 Application (4) Calcul: P n X ! Xi ≤ M i=1 √ M/n − m = P X̄n ≤ M/n = P Y ≤ n σ ! √ M/n − m ' P Z≤ n σ ! Applications numériques: On obtient P P n X ! Xi ≤ 10000 i=1 n X ' P(Z ≤ 2) = 0.9772 ! Xi ≤ 9990 ' P(Z ≤ −0.5) = 0.3085 i=1 Samy T. (IECL) TN - V.a. continues Module MAP 51 / 51