Chapitre 26 : Variables aléatoires réelles à densité

publicité
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Chapitre 26 : Variables aléatoires réelles
à densité
Dans tout ce chapitre (Ω, A, P ) est un espace probabilisé.
1
Généralités
1.1
Densité
Définition 1.1.1
On dit qu’une variable aléatoire réelle X est à densité lorsque sa fonction de répartition
FX est continue sur R et de classe C 1 sur R sauf en un nombre fini de points.
Toute fonction f à valeurs positives qui ne diffère de F ′ qu’en un nombre fini de
points est appelée une densité de f .
Remarque.
1. Il faut être précis. X est à densité ssi FX ∈ C 0 (R) et il existe {x0 , . . . , xn }
un ensemble fini de points tel que FX est de classe C 1 sur R r {x0 , . . . , xn }. Mais elle
est continue partout.
2. Bien entendu on ne peut donc définir FX′ qu’à un nombre fini de points prêt c’est
pourquoi il y a plusieurs densités possibles.
3. Et il est clair, pour des raison de continuité, qu’une variable aléatoire discrète n’est
pas à densité !
4. La loi de X est bien déterminée si on connait sa fonction de répartition.

 0 si x 6 0
Exemple. Soit X la variable aléatoire de fonction de répartition FX : x 7→
x si x ∈]0, 1[ .

1 si x > 1
Vérifions que FX est bien une fonction de répartition : elle est bien croissante, de limite
nulle en −∞, de limite 1 en +∞. Vérifions la continuité : sur ] − ∞, 0[, sur ]0, 1[ et sur
]1, +∞[, c’est clair car ce sont des fonctions classiques.
En 0, la limite à gauche est 0 et à droite lim x = 0 donc FX est continue en 0.
x→0+
En 1 la limite à droite est 1 et à gauche lim x = 1.
x→1−
FX est donc une fonction de répartition (croissante, continue à droite, limite à gauche
et limites en ±∞ qui correspondent) continue. Elles est de plus clairement de classe C 1 sur
R r {0, 1}.
Ainsi X est bien une variable aléatoire réelle à densité (c’estune loi classique, c.f. ci0 si x ∈] − ∞, 0] ∪ [1, +∞[
dessous). Une densité est donnée par exemple par la fonction x 7→
.
1 sinon
Mais on peut changer la valeur d’un nombre fini de points sans changer la propriété « être
une densité de X ».
Théorème 1.1.1
Soit X une variable aléatoire réelle à densité, de fonction
R x de répartition F : R → R. Si
f est une densité de X, alors pour tout x ∈ R F (x) = −∞ f (t)dt.
J. Gärtner.
1
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Démonstration : La seule difficulté (comme souvent dans ce chapitre) est de gérer les points
« à problèmes » : soit a1 < a2 · · · < a − n les points où F ′ n’est pas définie ou en lesquels f
diffère de F ′ . PourR être plus pratique, on ajoute a0 = −∞ et an+1 = +∞. Soit x ∈ R. On
x
doit montrer que −∞ f (t)dt converge et vaut F (x).
Si x < a1 alors F est une primitive de f sur ] − ∞, a1 [ avec lim F (t) = 0. Ainsi
t→−∞
Rx
l’intégrale −∞ f (t)dt converge et vaut F (x).
Si x > a1 , il existe un unique p tel que ap 6 x < ap+1 . On peut quand même utiliser
F qui est maintenant une primitive de f sur tous les ]ak , ak+1 [ avec k ∈ [[ 0 ; p ]]. Comme
F est continue par hypothèse, lim− F (t) = lim+ F (t) = F (y) ce qui montre que pour
t→y
R a t→y
k ∈ [[ 1 ; n − 1 ]], l’intégrales akk+1 f (t)dt converge et vaut F (ak+1 ) − F (ak ). Comme dans
R a1
Rx
le cas précédent, −∞
f (t)dt converge et vaut F (a1 ) et enfin ap f (t)dt converge et vaut
F (x) − F (ap ).
Bref par définition de l’intégrale d’une fonction continue sauf en un nombre fini de
p−1
Rx
Rx
P R ak+1
f (t)dt + ap f (t)dt =
points, on a −∞ f (t)dt qui converge et sa valeur, à savoir
ak
k=0
F (a1 ) +
p−1
P
k=1
F (ak+1 ) − F (ak ) + F (x) − F (ap ) = F (x).
Théorème 1.1.2
Soit f une fonction définie sur R. Alors f est une densité de probabilité ssi
1. f est continue sur R sauf éventuellement en un nombre fini de points.
2. ∀x ∈ R, f (x) > 0.
R +∞
3. −∞ f (t)dt converge et vaut 1.
Démonstration : Si f est une densité, toutes ces propriétés ont déjà été montrées. La réciproque est admise, car nécessite des manipulation fines sur Ω...
π
cos x si x ∈ [0, ]
Exemple. Soit f la fonction définie sur R par f (x) =
2 . f est conti0
sinon
R +∞
nue sur R∗ , positive, et −∞ f (t)dt converge et vaut 1. C’est une densité de probabilité

0
si x 6 0



π
Rx
sin x si x ∈]0, ] .
pour une variable X de fonction de répartition x 7→ −∞ f (t)dt =

π2

 1
si x >
2
Proposition 1.1.1
(
Soit X une variable aléatoire réelle de densité f . Alors
1. ∀a ∈ R, P (X = a) = 0
2. Pour tout a, b ∈ R tels que a 6 b on a
P (a < X < b) = P (a < X 6 b) = P (a 6 X < b) = P (a 6 X 6 b) =
Z
a
3. Pour tout a, b ∈ R,
P (X < a) = P (X 6 a) =
Z
a
f (t)dt
−∞
P (X > b) = P (X > b) =
Z
b
J. Gärtner.
2
+∞
f (t)dt
b
f (t)dt.
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Démonstration : Soit F la fonction de répartition de X
1. Cette propriété, appelée "absence d’atomes" montre qu’une variable à densité est à
l’opposé d’une variable discrète.
1
1
Soit a ∈ R et n ∈ N. Alors 0 6 P (X = a) 6 P (a − < X 6 a) = F (a) − F (a − ).
n
n
Le membre de droite converge vers 0 par continuité de F , donc P (X = a) = 0 (il y a
un lien avec le théorème de la limite monotone, lequel ?)
Rb
Ra
Rb
2. On a P (a < X 6 b) = −∞ f (t)dt − −∞ f (t)dt = a f (t)dt et comme P (X = a) =
P (X = b) = 0 on en déduit que toutes les autres probabilités proposées sont égales.
3. De même, évident.
Proposition 1.1.2
Si f est nulle en dehors de [a, b], alors P (X < a) = P (X > b) = 0 et X est à valeurs
dans [a, b] presque sûrement.
1.2
Transferts, exemples
L’exemple le plus important de transfert, à bien comprendre, est le transfert affine.
Soit X une variable aléatoire réelle à densité, de fonction de répartition FX . Soit a, b ∈ R
avec a 6= 0. On pose Y = aX + b qui est bien une variable aléatoire réelle, et on note FY
sa fonction de répartition. Alors
∀x ∈ R, FY (x) = P (Y 6 x) = P (aX + b 6 x)
Autrement dit si a > 0 on a
FY (x) = P (X 6
et si a < 0
FY (x) = P (X >
x−b
x−b
) = FX (
)
a
a
x−b
x−b
) = 1 − FX (
)
a
a
x−b
est de classe C 1 sur R donc FY est de classe C 1 sur R sauf
Par composition, x 7→
a
en un certain nombre de point. Il est important de préciser que ce "certain nombre" est
x−b
est bijective
fini car FX est de classe C 1 sauf en un nombre fini de points et x 7→
a
(et donc le "certain nombre" de points où FY n’est pas C 1 est le même que pour FX ). Bref
Y est une variable aléatoire réelle à densité, et en tout point où FY est dérivable on a
Si a > 0
1 x−b
)
FY′ (x) = f (
a
a
Si a < 0
1 x−b
FY′ (x) = − f (
)
a
a
Bref dans tous les cas, une densité de Y est donnée par la fonction
x−b
1
f
.
x 7→
|a|
a
Les autres exemples peuvent être intéressants, mais ne sont pas au programme de
première année. En général un transfert bijectif se gère bien, de même que le cas de X 2 .
J. Gärtner.
3
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Exercice. Soit X une variable aléatoire réelle à densité, de fonction de répartition FX , de
densité fX .
1. Soit Y = X 2 . Montrer que Y est une variable aléatoire réelle à densité, préciser FY
et une densité fY .
2. Soit ϕ : R → R une fonction de classe C 1 sur R, de dérivée strictement positive sur
R. Montrer que Z = ϕ(X) est une variable aléatoire réelle à densité, préciser FZ et
une densité de Z.
1.3
Espérance
Définition 1.3.1
Soit X une variable aléatoire réelle à densité,
R +∞ et f une densité de X. On dit que X
admet une espérance lorsque l’intégrale −∞ xf (x)dx est absolument convergente.
R +∞
Dans ce cas on appelle espérance de X le réel E(X) = −∞ xf (x)dx.
Remarque. La définition ci-dessus est indépendante du choix d’une densité de X puisque
deux densités ne diffèrent que d’un nombre fini de points.

 0 si x 6 0
x si x ∈]0, 1[ .
Exemple.
1. Soit X la variable aléatoire de fonction de répartition FX : x 7→

1 si x > 1
1
Alors X admet une espérance, qui vaut .
2 (
π
R0
cos x si x ∈ [0, ]
2. Soit X la variable aléatoire de densité f (x) =
2 . Alors −∞ xf (x)dx =
0
sinon
R +∞
R π2
0 et 0 xf (x)dx = 0 x cos xdx est absolument convergente et vaut (après intégraπ
π
tion par parties) − 1. Bref X a une espérance, et E(X) = − 1.
2
2
1
. C’est une fonction continue sur R, positive sur R et
3. Soit f : x 7→
π(1 + x2 )
R +∞
−∞ f (x)dx converge et vaut 1. Bref f est densité d’une variable aléatoire X. PourR +∞ dx
x
1
tant pour tout x ∈ R, on a xf (x) =
∼x→1
> 0 et 1
diverge. On
2
π(1 + x )
πx
x
R +∞
en déduit que −∞ |x| f (x)dx diverge. Autrement dit, on a un exemple de variable
aléatoire à densité qui n’admet pas d’espérance.
Remarque. On voit au passage
R +∞ que pour montrer que X a une espérance, on doit étudier
la convergence absolue de −∞ xf (x)dx ce qu’on peut faire en découpant en 0 : c’est la
R0
R +∞
convergence absolue de −∞ xf (x)dx et de 0 xf (x)dx. Mais comme f > 0, on s’est
ramené à l’étude de la convergence d’intégrales de fonction de signe constant.
Proposition 1.3.1 (Positivité)
Soit X une variable aléatoire à densité, admettant une espérance. Si X > 0 p.s., alors
E(X) > 0.
Démonstration : Pour tout x < 0 on a 0 6 P (X 6 x) 6 P (X < 0) = 0 donc FX est nulle sur
R +∞
R−∗ et F ′ y est nulle. X admet donc une densité nulle sur R−∗ et E(X) = 0 xf (x)dx > 0
puisque ∀x > 0, xf (x) > 0.
J. Gärtner.
4
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Proposition 1.3.2 (Linéarité faible)
Soit X une variable aléatoire réelle à densité admettant une espérance, soit a, b deux
réels avec a 6= 0. Alors la variable aléatoire aX + b admet une espérance et E(aX + b) =
aE(X) + b.
Démonstration : PRECISER
Soit fX une densité de X et Y = aX + b. On a vu que Y était
unevariable aléatoire à
x−b
1
. On en déduit que
f
densité, et qu’une densité de Y était donnée par fY : x 7→
|a|
a
R +∞ |x|
x−b
Y admet une espérance ssi l’intégrale −∞
dx converge. Soit A 6 B deux
f
|a|
a
réels.
x−b
Supposons par exemple a > 0. On a, à l’aide du changement de variables y =
a
(Attention, c’est ici que le signe de a a de l’importance !)
Z
B
A
|x|
f
a
x−b
a
dx =
Z
B−b
a
A−b
a
|ay + b| f (y)dy 6
Z
B−b
a
A−b
a
a |y| f (y)dy + |b|
Z
B−b
a
A−b
a
f (y)dy
Où l’inégalité découle de l’inégalité triangulaire, sachant que les intégrales convergent par
hypothèse. On en déduit la majoration
Z B
x−b
|x|
dx 6 aE(|X|) + b
f
a
a
A
R +∞
D’après le théorème de majoration des intégrales de fonctions positives, −∞ |x| fY (x)dx
converge, donc Y admet une espérance et le même changement de variable donne E(Y ) =
aE(X) + b.
Définition 1.3.2
Soit X une variable aléatoire réelle à densité admettant une espérance. On dit que X
est centrée lorsque E(X) = 0. Sinon, on peut s’interesser à la variable X − E(X) qui
est la variable centrée associée à X.
En effet E(X − E(X)) = E(X) − E(X) = 0 !
Par exemple si X admet une densité paire et une espérance, X est centrée.
1.4
2
Variance (HP de première année)
Lois classiques
2.1
Loi uniforme
Définition 2.1.1
On dit que
 X suit la loi uniforme sur [a, b] lorsque X admet pour densité la fonction
 1
si x ∈ [a, b]
f : x 7→
. On note X ֒→ U([a, b]).
b−a
 0
sinon
Comme X est à densité, P (X = x) = 0 pour tout x et la loi uniforme sur [a, b] est la
même que sur [a, b[, ]a, b] ou ]a, b[.
Vérifions que c’est bien une densité de probabilité : f est continue sur Rr{a, b}, positive
R +∞
R +∞
Ra
R b dt
+ b 0dt = 1 (et est convergente...)
et −∞ f (t)dt = −∞ 0dt + a
b−a
J. Gärtner.
5
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
La loi uniforme est interessante pour modéliser des phénomènes continus et "équiprobables", et permet théoriquement de simuler informatiquement les autres lois de probabilité.
Proposition 2.1.1
Soit X ֒→ U([a, b]). Alors X admet une espérance et E(X) =
a+b
.
2
Remarquons que le résultat est "normal" et dans la droite lignée de la loi uniforme
discrète que l’on a déjà rencontrée.
R b |x|
dx qui existe car la fonction intégrée est
a b−a
Rb x
x2
dx = [
]b =
continue sur le segment [a, b] donc X a une espérance qui vaut a
b−a
2(b − a) a
a+b
.
2
Démonstration : On a
R +∞
−∞
|x| f (x)dx =
Remarquons que la variance, qui est au programme de l’année prochaine, existe aussi
(b − a)2
et vaut
.
12
De même que pour la loi uniforme discrète il y a un lien entre U([a, b]) et U([0, 1]).
Proposition 2.1.2
Soit X une variable aléatoire à densité.
X suit la loi uniforme sur [0, 1] ssi Y = a + (b − a)X suit la loi uniforme sur [a, b].
Démonstration : Soit f une densité de X et g une densité de Y = a + (b − a)X. Alors on a
vu que (en remarquant que |b − a| = b − a)
x−a
1
f
∀x ∈ R, g(x) =
b−a
b−a
Et comme
x−a
∈ [0, 1] ssi x ∈ [a, b] on a
b−a
(
1
f (x) = 1 si x ∈ [0, 1]
g(x) =
ssi
b−a
f (x) = 0 sinon
g(x) = 0
si x ∈ [a, b]
sinon
Remarque. Remarquonspour finir que la fonction de répartition de la loi uniforme sur

 0x − a si x 6 a
si x ∈ [a, b]
[a, b] est donnée par x 7→

 b−a
1
sinon
2.2
Loi exponentielle
Définition 2.2.1
Soit α > 0. On dit qu’une variable aléatoire réelle suitune loi exponentielle de paramètre
αe−αx si x > 0
α lorsque X admet pour densité la fonction f : x 7→
. On note dans
0
sinon
ce cas X ֒→ E(α).
R +∞
Vérifions que f est bien une densité. f est continue sur R∗ , positive et −∞ f (x)dx =
R +∞ −αx
αe
dx = 1.
0
J. Gärtner.
6
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014
Proposition 2.2.1
Si X suit une loi exponentielle de paramètre α, alors X admet une espérance et E(X) =
1
.
α
Démonstration : Comme f est nulle sur R− et positive, X a une espérance ssi
converge. On effectue une i.p.p. :
Z
A
0
Comme
αxe−αx dx = [−xe−αx ]A
0 +
lim (−A −
A→+∞
Z
A
0
R +∞
0
αxe−αx dx
1
e−αx dx = −Ae−αA + [− e−αx ]A
0
α
1 −αA
1
)e
= 0 on en déduit que E(X) et vaut .
α
α
Remarquons que X admet une variance qui vaut
1
.
α2
Remarque. On pourra
vérifier que la fonction de répartition d’une loi exponentielle de
0
si x < 0
paramètre α est x 7→
−αx
1−e
si x > 0
Proposition 2.2.2 (Absence de mémoire)
Soit X une variable aléatoire réelle à densité. X suit une loi exponentielle ssi

 X(Ω) = R+
∀(s, t) ∈ R+ × R+ , P[X>s] (X > s + t) = P (X > t)

∀s ∈ R+ , P (X > s) 6= 0
Démonstration :
1. Si X suit une loi exponentielle, alors X(Ω) = R+ et si s > 0, P (X >
R +∞ −αx
s) = s αe
dx = e−αx 6= 0. De plus si s, t > 0 on a
P[X>s] (X > s + t) =
=
P ([X > s + t] ∩ [X > s])
P (X > s + t)
=
P (X > s)
P (X > s)
e−α(s+t)
= e−αt = P (X > t)
e−αs

 X(Ω) = R+
2. Supposons que
∀(s, t) ∈ R+ × R+ , P[X>s] (X > s + t) = P (X > t) . Posons G(t) =

∀s ∈ R+ , P (X > s) 6= 0
P (X > t). Alors Par hypothèse on a G(s + t) = G(s)G(t) pour tout s, t > 0.
La fonction G est continue, vérifie G(1) 6= 0, G(s + t) = G(s)G(t) (et que G est
décroissante sur R+ (car G = 1 − FX et FX est croissante sur R).
On peut sous ces hypothèses (c.f. TD : on a montré que si f est continue et vérifie f (x + y) = f (x) + f (y) alors f : x 7→ xf (1). Ce qui est le cas de ln ◦G sur
R+∗ , etcommeGestentre0 et 1 on a ln(G(1)) 6 0) montrer qu’il existe α > 0 tel que
∀t > 0, G(t) = e−αt . On a aussi par hypothèse G(t) = 1 sur R− donc 1 − G est la
fonction de répartition d’une variable de loi exponentielle de paramètre α (on peut
vérifier si on veut que la fonction de répartition donnée plus haut est continue de
classe C 1 sauf éventuellement en 0.
Proposition 2.2.3
X suit la loi exponentielle E(1) ssi Y =
J. Gärtner.
1
X suit la loi exponentielle E(α).
α
7
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
2013/2014


1 x
Démonstration : Si X admet f pour densité, alors Y admet pour densité g : x 7→ f   =
1
1
α
α
−x
e
si x > 0
αe−αx si x > 0
αf (αx) puisque α > 0. Donc f : x 7→
ssi g : x 7→
0
si x < 0
0
si x < 0
Exercice. Loi gamma.
2.3
Loi normale
Au contraire des deux lois précédentes, nous n’expliquerons l’intérêt de cette loi qu’au
moment de faire le théorème de la limite centrale.
Définition 2.3.1 (Centrée réduite)
Une variable aléatoire X suit la loi normale centrée réduite lorsque X admet pour
x2
1
densité la fonction ϕ définie par ϕ(x) = √ e− 2 pour tout x. On note X ֒→ N (0, 1).
2π
On note Φ la fonction de répartition de X, cette fonction ne s’explicite pas à l’aide de
fonctions « classiques ».
ϕ est bien continue et positive sur R. On montrera en TD (c.f. formules de Taylor par
√
R +∞ x2
exemple) que −∞ e− 2 dx = 2π.
Remarquons que l’on parle aussi de loi de Gauss-Laplace.
GRaphe
La courbe est symétrique car ϕ est paire.
Proposition 2.3.1
Soit X ֒→ N (0, 1). Alors X est centrée (et réduite). Autrement dit X admet une
espérance et E(X) = 0 (et une variance qui vaut 1).
R +∞
Démonstration : On se rappelle que la convergence absolue de −∞ xϕ(x)dx revient à la
R +∞
convergence de 0 xϕ(x)dx puisque la fonction intégrée est positive sur R+ et impaire.
2
RA
x2
x2
− A2
admet une limite
Cette dernière intégrale converge car 0 xe− 2 dx = [−e− 2 ]A
0 = 1−e
lorsque A tend vers +∞. On a une intégrale convergente de fonction impaire, qui est donc
nulle.
Pour la variance, hors programme de cette année : i.p.p.
Proposition 2.3.2 (Symétries de la fonction de répartition)
On a ∀x ∈ R, Φ(−x) = 1 − Φ(x).
Rx
1
1
t2
u2
√ e− 2 dt = − +∞ √ e− 2 du.
2π
R +∞ 2π
R +∞
On prend la limite lorsque A tend vers −∞ qui donne Φ(−x) = x ϕ(t)dt = −∞ ϕ(t)dt−
Rx
−∞ ϕ(t)dt = 1 − Φ(x).
Démonstration : On effectue un changement de variable u = −t :
R −x
A
Remarque. Quelques valeurs classiques : même si on ne sait pas expliciter Φ, on peut en
donner des valeurs approchées. Par exemple Φ(1, 96) = 0, 9750, c.f. table.
Définition 2.3.2
Soit m ∈ R et σ > 0. On dit que X suit la loi normale de paramètre (m, σ 2 ) lorsque X
admet pour densité la fonction
1 x−m 2
1
f : x 7→ √ e− 2 ( σ )
σ 8 2π
J. Gärtner.
ECS3 Carnot
Chapitre 26 — Variables aléatoires réelles à densité.
On note dans ce cas X ֒→ N (m, σ 2 ).
f est bien continue positive sur R et le changement de variable t =
2
R +∞
RB
1 R B−m
− t2
σ
√
dt donc −∞ f (t)dt converge et vaut 1.
f
(x)dx
=
e
A−m
A
σ
2π
2013/2014
x−m
donne
σ
Graphe
Proposition 2.3.3
Soit X une variable aléatoire à densité. Alors X ֒→ N (m, σ 2 ) ssi X ∗ =
N (0, 1).
X −m
֒→
σ
1
m
Démonstration : Soit f une densité de X et g une densité de X ∗ = X − . Alors on sait que
σ
σ
1 x−m 2
1
1
m
1
x−b
g : x 7→
avec a = et b = − . On en déduit que f : x 7→ √ e− 2 ( σ )
f
|a|
a
σ
σ
σ 2π
ssi g = ϕ.
Proposition 2.3.4
Soit X une variable aléatoire de loi normale N (m, σ 2 ). Alors X admet une espérance
(et une variance). On a E(X) = m (et V (X) = σ 2 )
Démonstration : En effet X ∗ suit la loi normale centrée réduite (qui du coup est vraiment
centrée et réduite !) donc E(X ∗ ) = 0 et par linéarité E(X) = m. (de même pour la variance).
Remarque. Il peut être utile de savoir que si X ֒→ N (m, σ 2 ), alors P (X ∈ [m − σ, m +
σ]) ≃ 0.68, que P (X ∈ [m − 2σ, m + 2σ]) ≃ 0.95 et que P (X ∈ [m − 3σ, m + 3σ]) ≃ 0.997.
J. Gärtner.
9
Téléchargement