École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année Statistiques Appliquées TD 4 Variables aléatoires continues 4 Rappels sur les changements de variables 4.1 Cas uni-dimensionnel On considère une variable aléatoire Y, fonction de la variable aléatoire X telle que Y = g(X). Dans le cas général, la fonction n’est pas bijective, comme illustré dans la figure ci-dessous. Y dy dx1 dx2 dx3 dx4 X On sépare la fonction en tronçons i sur lesquels la fonction est bijective (Y = gi (X), i = 1, ..n). Sur ces tronçons, on peut écrire X = gi−1 (Y) où gi−1 (.) est la fonction inverse de g(.). Comme on l’a vu au cours, on a PY (y)|dy| = xi |y=g(xi ) PX (xi )|dxi |, par conséquent : −1 −1 dg1 (y) dg (y) −1 −1 . + · · · + PX (gn (y)) n PY (y) = PX (g1 (y)) dy dy Exemple 4.1 Changement de variable Y = X2 Statistique Appliquée 1 École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année On considère la transformation Y = X2 sur [-1,1]. Dans ce cas, on a deux tronçons : √ p a. sur x ∈ [−1, 0] : X = − Y (g1−1 (.) = − (.)) p √ b. sur x ∈ [0, 1] : X = Y (g2−1 (.) = (.)) On obtient alors PY (y) = = ˛ −1 ˛ −1 ˛ ˛ ˛ dg (y) ˛ ˛ ˛ ˛ + PX (g2−1 (y)) ˛ dg2 (y) ˛ PX (g1−1 (y)) ˛˛ 1 ˛ dy ˛ dy ˛ √ 1 1 √ 1 1 PX ( y) √ + PX (− y) √ . 2 y 2 y La figure ci-dessous illustre ce résultat. Y = X2 Y PY (y) 10 0.5 1 1 0 0 X PX (x) 0.5 0 1 4.2 Cas multi-dimensionnel On considère un changement de variables multi-dimensionnel que l’on peut écrire sous la forme : Y1 = .. . g1 (X1 , . . . , Xn ) Yn = gn (X1 , . . . , Xn ) Pour des fonctions gi continues et différentiables (et à condition que le jacobien défini ci-dessous soit non nul), on peut faire le même raisonnement que ci-dessous. Donc, dans un tronçon, on a : ∂(x1 , . . . , xn ) , PY (y1 , . . . , yn ) = PX (x1 , . . . , xn ) ∂(y1 , . . . , yn ) on notera que dans ce cas-ci, il est plus compliqué d’écrire l’expression en fonction de gi−1 , mais on aurait plutôt des fonctions de type Xi = fi (Y1 , . . . , Yn ). Exemple 4.2 Précision de fabrication en microélectronique Statistique Appliquée 2 X École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année Dans le processus de fabrication de circuits intégrés, une des parties cruciales est la précision de la lithographie. On peut quantifier cette précision comme étant la déviation en coordonnées horizontales et verticales (x et y) par rapport à l’endroit à graver. Dans le cas de technologies “70 nm”, on peut considérer que les déviations en x et y sont des variables aléatoires indépendantes qui suivent des lois gaussiennes de moyenne nulle et de variance σ 2 = 0.2nm2 . La densité de probabilité conjointe des déviations (X, Y) est donnée par : PXY (x, y) = PX (x)PY (y) = 1 −(x2 +y 2 )/2σ 2 e 2πσ 2 La caractérisation de la précision en x et en y ne répond pas à la question suivante : “quelle est la loi de probabilité de la distance entre le point désiré et le point obtenu par la lithographie ?” Pour obtenir cette loi, on passe des coordonnées cartésiennes aux coordonnées polaires selon la transformation : (X, Y) = (R cos(Θ), R sin(Θ)). Le jacobien de la transformation vaut r : ˛ ˛ ˛ ˛ ∂(x, y) ˛ ˛ cos(θ) ˛ ˛ ˛ ˛ ∂(r, θ) ˛ = ˛ −r sin(θ) ˛ sin(θ) ˛˛ = r, r cos(θ) ˛ et donc PR,Θ (r, θ) 2 2 2 r e−[(r cos(θ)) +(r sin(θ)) ]/2σ 2 2πσ 2 2 r e−r /2σ 2πσ 2 = = Pour trouver les marginales, il faut intégrer sur l’autre variable aléatoire, soit : Z ∞ PΘ (θ) = PR,Θ dr r=0 Z = = ∞ r=0 2 2 r e−r /2σ dr 2πσ 2 1 2π L’angle est donc uniformément distribué sur [0, 2π]. D’autre part, on en déduit que 2 2 r PR (r) = 2 e−r /2σ σ On en déduit également que les variables aléatoires R et Θ sont indépendantes (la loi conjointe est donnée par le produit des lois marginales). La densité de probabilité suivie par la distance R est celle d’une variable dite de Rayleigh. Statistique Appliquée 3 École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année densité de probabilité de R en nm (Rayleigh pour sigma=0.2 nm) 3.5 3.0 P_R(r) 2.5 2.0 1.5 1.0 0.5 0.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 r (en nm) 4.3 4.3.1 Exercices Fonction de répartition Trouver la loi de probabilité, la moyenne et la variance de la v.a. X dont la fonction de répartition est : 3 1 − ax3 si x ≥ a, FX (x) = , 0 si x < a où a est une constante positive. On a que PX (x) = dFX (x) = dx de même : ∞ xPX (x)dx = E[X] = −∞ ∞ a 3 3 xa4 0 si x ≥ a, , si x < a a3 x3 4 = 3a3 x ∞ a ∞ 1 3a 1 1 3 dx = 3a − 2 = x3 2x 2 a Et finalement : E[X] = 4.3.2 ∞ −∞ x2 PX (x)dx = a ∞ x2 3 a3 = 3a3 x4 a ∞ ∞ 1 1 3 dx = 3a = 3a2 − x2 x a Où on mélange majuscules et minuscules ... Soit X une variable aléatoire de distribution exponentielle et de moyenne = 1 (PX (x) = λe−λx , x ≥ 0, E[X] = 1/λ, var(X) = 1/λ2 ). Une fois qu’on a Statistique Appliquée 4 École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année observé la valeur expérimentale (réalisation) x de X, on génère une variable aléatoire Y normale, de moyenne nulle et de variance x + 1 (pour rappel, la loi de probabilité gaussienne d’une v.a. T de moyenne µ et de variance σ 2 vaut 2 2 1 PT (t) = √ e−(t−µ) /2σ ). On demande la loi de probabilité jointe de X et 2πσ Y. On a PX (x) = e−x pour x ≥ 0, et 2 1 PY |X (y|x) = e−y /2(x+1) , 2π(x + 1) pour tout x ≥ 0 et tout y. On en déduit alors 2 1 e−y /2(x+1) PX,Y (x, y) = PX (x)PY |X (y|x) = e−x 2π(x + 1) 4.3.3 Détection de signal Un message binaire est transmis par les valeurs -1 ou +1. Le canal de communication corrompt le signal en ajoutant un bruit gaussien de moyenne µ et de variance σ 2 . Le récepteur décide que le signal envoyé était -1 si le signal reçu est négatif, et +1 si le signal reçu est positif. Donnez la probabilité d’erreur (sous la forme d’une intégrale). Il y a erreur si – le bruit est plus grand que 1 si le signal transmis vaut -1 – le bruit est plus petit que -1 si le signal transmis vaut +1. On appelle N la v.a. Gaussienne qui représente le bruit. On a donc, pour le premier cas, que la probabilité d’erreur est donnée par : P (N ≥ 1) = 1 − P (N < 1) où P (N < 1) est la fonction de répartition d’une Gaussienne de moyenne µ et de variance σ 2 . Par définition de loi de probabilité Gaussienne et de fonction de répartition, on obtient P (N < 1) = 1 √ σ 2π 1 e−(v−µ) 2 /2σ2 dv, −∞ et pour le deuxième cas, par symétrie, on obtient le même résultat. Pour σ = 1, on a P (N < 1) = 0.8413 et la probabilité d’erreur est 0.3174 4.3.4 Un point sur un demi-disque Un point est choisi sur un demi-disque de rayon R. Le demi-disque est centré à l’origine et est situé dans le demi-plan supérieur. On demande : a. La loi de probabilité conjointe de ses coordonnées X et Y b. la loi de probabilité marginale Y et sa moyenne. c. Vérifiér (2) en calculant E(Y) sans utiliser la loi marginale de Y. Statistique Appliquée 5 École Polytechnique de l’UNSA Polytech’Nice-Sophia Département d’Électronique 3e année a. La point étant choisi “au hasard” sur un demi-disque de rayon R, cela veut dire que l’on a une distribution 2 uniforme sur le demi-disque et donc PX,Y (x, y) = πR 2. b. Pour trouver la loi marginale de Y, on intègre la loi jointe sur X : PY (y) = où A = A −A 2 dx = πR2 4A πR2 si 0 ≤ y ≤ R, sinon. 0 R2 − y 2 . On a alors E[Y] = 4 πR2 R y 0 4R R2 − y 2 dy = 3π en utilisant le changement de variable z = R2 − y 2 pour l’intégration. c. On peut trouver l’espérance en utilisant directement la loi conjointe. En notant D le demi-disque, on a : E[Y] = Statistique Appliquée D yPX,Y (x, y)dxdy = 6 0 π 0 R 2 4R r sin θrdrdθ = πR2 3π