TD 3 : Variables aléatoires continues

publicité
TD 3 : Variables aléatoires continues
13 avril 2012
La formule vue au début du TD 2 se généralise au cas des v.a. à densité : si
X est une v.a. à valeurs dans l’intervalle I, de densité fX et si h : I → R est
une fonction, on peut calculer :
Z
E[h(X)] = h(x)fX (x)dx.
I
V.a. à densité sur [0,6]
1. Cette fonction est bien positive, définie sur R. Pour qu’elle soit la densité
de probabilité d’une variable aléatoire, il faut et il suffit donc que son
intégrale sur R vaille 1. Puisque fX (x) = 0 si x ∈
/ [0, 6], on a
Z
6
Z
fX (x) dx
3
Z
fX (x) dx =
=
R
0
Z
0
6
k(6 − x) dx
kx dx +
3
[kx2 /2]30 + [k(6x − x2 /2)]63 = 9k.
=
R6
Ainsi, on a 0 fX (x) dx = 1 si et seulement si k = 1/9. C’est la seule valeur
de k pour laquelle la fonction fX est bien une densité de probabilité.
2. Conformément au cours, ces probabilités correspondent aux intégrales
suivantes :
Z 2
P(X ≤ 2) =
fX (x) dx = [kx2 /2]20 = 2/9 ' 0, 22
0
Z
4,5
fX (x) dx = [kx2 /2]31,5 +[k(6x−x2 /2)]4,5
3 ' 0, 42
P(1, 5 ≤ X ≤ 4, 5) =
1,5
3
Z
fX (x) dx
P(X = 3) =
3
Le dernier calcul est évidemment vrai de façon générale : pour toutes les
v.a. à densité, la probabilité d’être exactement égale à une valeur donnée
est toujours 0.
3. On utilise les formules du cours :
Z 6
Z
E[X] =
xfX (x) dx =
0
=
[kx3 /3]30 +
=
3.
3
0
[6kx2 /2]63
1
2
Z
3
− [kx3 /3]63
6
kx(6 − x) dx
kx dx +
De même, pour la variance,
V ar(X)
=
2
6
Z
2
(x − 3)2 fX (x) dx
E[(X − E[X]) ] = E[(X − 3) ] =
0
Z
3
Z
2
kx(x − 3) dx +
=
k(6 − x)(x − 3)2 dx
3
0
=
6
3/4 + 3/4 = 3/2.
(Pour le calcul des intégrales, développer et utiliser la primitive xn+1 /(n+
1) de la fonction xn .)
Normalisations
1. Il y a une erreur d’énoncé : c’est λX qui est exponentielle. Pour démontrer
cela, on peut utiliser la définition de la densité d’une variable aléatoire et
calculer les probabilités P(c ≤ λX ≤ d) pour tous réels c, d. On trouve
Z
d/λ
P(c ≤ λX ≤ d) = P(c/λ ≤ X ≤ d/λ) =
λ exp(−λx) dx.
c/λ
On peut calculer cette intégrale directement, en remarquant qu’une primitive de la fonction x 7→ λ exp(−λx) est la fonction x 7→ − exp(−λx), donc
d/λ
l’intégrale vaut [− exp(−λx)]c/λ = exp(−c) − exp(−d). Or, cette expresRd
sion est égale à c exp(−x) dx, ce qui est égal à P(c ≤ Y ≤ d), si Y est
une v.a. exponentielle de paramètre 1. Ceci montre bien que λX et Y ont
la même loi. Cette méthode ne s’adapte pas bien au cas général. Il vaut
mieux utiliser le changement de variable y = λx pour trouver :
Z
d/λ
d
Z
λ exp(−λx) dx =
c/λ
λ exp(−y)
c
dy
=
λ
Z
d
exp(−y) dy.
c
2. On utilise la même méthode de changement de variable. Si c ≤ d sont
deux réels, on a
P(c ≤ (X − µ)/σ ≤ d)
=
=
P(µ + cσ ≤ X ≤ µ + dσ)
Z µ+dσ
1
(x − µ)2
√
exp −
dx
2σ 2
2πσ 2
µ+cσ
On utilise alors le changement de variables y = (x − µ)/σ, tel que dy =
dx/σ :
Z
µ+dσ
µ+cσ
(x − µ)2
√
exp −
2σ 2
2πσ 2
1
Z
dx
d
1
exp(−y 2 /2) σdx
2πσ 2
= P(c ≤ Y ≤ d),
=
√
c
où Y est une v.a. de loi gaussienne, de paramètres 0 et 1. Ainsi, (X − µ)/σ
et Y ont la même loi.
2
Loi parabolique
Pour connaître la valeur de c, il faut déterminer à quelle condition l’intégrale
de fX sur [0, 1] est égale à 1. On calcule :
1
Z
cx(1 − x) dx = [cx2 /2 − cx3 /3]10 = c/6.
0
Ainsi, fX définit une densité de probabilité si et seulement si c = 6. Dans ces
conditions, on peut alors calculer les quantités demandées, en utilisant la formule
donnée au début du TD :
Z 1
E[X] =
6x2 (1 − x) dx = [2x3 − 3x4 /2]10 = 1/2.
0
La loi de X étant symétrique par rapport à x = 1/2, ce résultat est logique.
Z
V ar(X)
1
Z
2
6(x − 1/2) x(1 − x) dx =
=
0
1
6(x2 − x + 1/4)(x − x2 ) dx
0
6[−x5 /5 + x4 /2 − 5x3 /12 + x2 /8]10 = 1/20.
Z 1
=
1/x · 6x(1 − x) dx = 6[x − x2 /2]10 = 3.
=
E[1/X]
0
C’est la première fois que je vois pousser un chêne
1. Pour modéliser une durée de vie, le plus simple est d’utiliser une loi exponentielle. En effet, c’est la loi des durées de vie lorsqu’il n’y a pas d’usure,
ce qui est une hypothèse qu’on peut faire en première approximation (en
supposant que les arbres ne meurent qu’à cause de facteurs extérieurs
(maladie, foudre, feu...) et qu’il n’y a pas de vieillissement. L’espérance
d’une v.a. exponentielle de paramètre λ est 1/λ, donc il faut prendre une
v.a. X exponentielle de paramètre 1/250 pour modéliser la durée de vie
d’un chêne. Attention à ne pas confondre la durée de vie d’un arbre moyen
(qui comprend le passé et le futur) et l’âge d’un arbre choisi au hasard
(qui ne comprend que le passé), qui serait plutôt de loi gaussienne.
2. La question est mal formulée. Il aurait fallu demander la probabilité qu’un
arbre termine Rsa croissance avant de mourir, ce qui revient à calculer
∞
P(X ≥ 200) = 200 λ exp(−λx) dx = [− exp(−λx)]∞
200 = exp(−200/250) '
0, 45.
R 200
3. Il s’agit ici de calculer P(100 ≤ X ≤ 200) = 100 λ exp(−λx) dx =
[− exp(−λx)]200
100 = exp(−100/250) − exp(−200/250) ' 0, 22.
4. Les lois de Weibull modélisent les durées de vie dans les situations suivantes : avec usure (k > 1), sans usure (k = 1) et avec “mortalité infantile”
(k < 1). Si on prend k = 1, on obtient en effet pour densité
fλ,1 (x) =
1
exp(−x/λ)
λ
ce qui est bien la densité d’une v.a. exponentielle de paramètre 1/λ. La
loi exponentielle est donc un cas particulier de loi de Weibull.
3
Hauteur des portes
Si X est la v.a. représentant la taille d’un individu pris au hasard, on suppose
donc que X est de loi gaussienne de paramètres µ = 1, 78m et σ = 7, 6cm.
Un individu se cogne la tête si X ≥ 2, 02m. Pour calculer la probabilité que
X ≥ 2, 02m, on peut utiliser une table de la loi gaussienne. Comme celle-ci vaut
pour une v.a. gaussienne normalisée, c’est-à-dire de moyenne 0, d’écart-type 1,
il faut se ramener à ce cas-là, en utilisant l’exercice 2. On a donc
2, 02 − 1, 78
X − 1, 78
≥
= P(Y ≥ 3, 08),
P(X ≥ 2, 02) = P
0, 078
0, 078
où Y est de loi gaussienne de paramètres 0 et 1. Un coup d’oeil sur la table de la
loi gaussienne normalisée donne P(Y ≥ 3, 08) ' 0, 9990. Il y a donc en moyenne
moins d’une personne sur 10.000 qui se cogne dans une telle porte.
Contrôle qualité
1. Le nombre de vis avec défauts dans ce lot de 1000 est modélisé par une
v.a. binomiale X de paramètres n = 1000, p = 0, 03. Pour estimer la
probabilité d’avoir plus de 50 vis défectueuses, il faut calculer l’une des
deux sommes suivantes :
49 1000
X
X 1000
1000
k
1000−k
1−
(0, 03) (0, 97)
=
(0, 03)k (0, 97)1000−k
k
k
k=0
k=50
Il est beaucoup plus facile d’utiliser une des deux approximations de la
loi binomiale vues en cours. On a np = 30 > 10, donc il est préférable
d’utiliser une v.a. Y gaussienne de paramètres µ = np = 30 et σ 2 =
np(1 − p) = 29, 1. On peut alors approcher la probabilité d’avoir plus de
50 vis défectueuses de la façon suivante :
P(X ≥ 50) ' P(Y ≥ 50) = P((Y − µ)/σ ≥ (50 − µ)/σ),
avec la v.a. Z = (Y − µ)/σ qui est de loi gaussienne normalisée, et (50 −
µ)/σ ' 3, 71. On trouve P(X ≥ 50) ' 1 − 0, 9999 grâce à la table de la loi
gaussienne normalisée. On a donc une chance inférieure à 0,01% d’avoir
plus de 50 vis défectueuses. Pour évaluer la probabilité d’avoir entre 20 et
40 vis défectueuses, on procède de la même manière :
P(20 ≤ X ≤ 40) ' P(−1, 85 ≤ Z ≤ 1, 85),
avec Z de loi gaussienne de paramètres 0 et 1. On trouve
P(−1, 85 ≤ Z ≤ 1, 85)
= P(Z ≤ 1, 85) − P(Z < −1, 85)
= P(Z ≤ 1, 85) − P(Z > 1, 85)
= P(Z ≤ 1, 85) − (1 − P(Z ≤ 1, 85))
= 2P(Z ≤ 1, 85) − 1 ' 0, 9356
C’est une des caractéristiques de la loi gaussienne : elle est très concentrée
autour de sa moyenne. Ici, la probabilité
de s’écarter de sa moyenne (30)
p
d’au plus deux écart-types (σ = (29, 1) ' 5, 4) est inférieure à 7%.
4
2. La modélisation précédente est toujours valide, la question est la même,
avec µ = np = 60, ainsi que σ 2 = np(1 − p) ' 58, 2. On trouve que la
probabilité d’avoir plus de 50 vis défectueuses parmi les 2000 est
p
p
P(X ≥ 50) ' P((Y − 60)/ 58, 2 ≥ (50 − 60)/ 58, 2) = P(Z ≥ −1, 31),
où Z est une v.a. de loi gaussienne, de paramètres 0 et 1. En consultant
la table, on trouve P(X ≥ 50) ' 0, 90. On a donc plus de 90% de chances
d’avoir plus de 50 vis défectueuses parmi les 2000.
5
Téléchargement