Loi binomiale

publicité
Loi binomiale - loi normale
1) Premier exemple
Soit Y une variable aléatoire suivant une loi binomiale
de paramètres n = 16 et p = 0,5.
espérance = E(Y) = n p = 8,
variance = V(Y) = n p (1-p) = 4
écart-type = σ(Y) = 2
Les valeurs prises sont les 17 entiers de 0 à 16.
Représentation en bâtons (c’est une variable discrète) :
Les proba sont en ordonnée.
Par exemple la proba P(7  Y  10) est la somme des hauteurs des 4 bâtons d’abscisses 7 à 10.
Soit la nouvelle variable aléatoire : Z = Y - 8 = Y - E(Y)
Les valeurs prises sont les 17 entiers de -8 à 8.
7  Y  10 <=> -1  Z  2
P(7  Y  10) = P(-1  Z  2) = somme des hauteurs des
4 bâtons d’abscisses -1 à 2.
espérance de Z : E(Z)= 0
écart-type de Z : σ(Z)= σ(Y) = 2
Soit la nouvelle variable aléatoire :
Z Y −8 Y −E (Y )
T= =
=
2
2
σ (Y )
Les valeurs prises par T sont les 17 nombres -4 ; -3,5 ;
-3 ; ... jusqu’à 4.
7  Y  10 <=> -0,5  T  1
et P(-0,5  T  1) = somme des hauteurs des 4 bâtons
d’abscisses -0,5 , 0 , 0,5 , 1.
espérance de T : E(T)= 0
écart-type de T : σ(T)= 1
(T est une variable centrée réduite)
On change complètement de représentation graphique :
on dessine des rectangles dont l’aire est égale à la proba.
Pour un rectangle : hauteur =
proba
largeur
Ici, comme les largeurs sont de 0,5, les hauteurs sont les
doubles des hauteurs des bâtons du graphique précédent.
(les rectangles sont "centrés" sur 0 ; 0,5 ; 1 ; 1,5 ; etc...)
La hauteur d’un rectangle est analogue à une densité
(comme par exemple :
densité de population=
population
).
superficie
Ici, on obtient une densité de probabilité.
Cela revient à considérer une nouvelle variable aléatoire
continue qui prolonge T sur [-4,5 ; 4,5] et dont la densité
est constante par intervalles.
Michel Brissaud (88) ([email protected])
février 2014
1/4
Revenons à P(7  Y  10) :
P(7  Y  10) = P(-0,5  T  1) et c’est alors la somme
des aires des 4 rectangles centrés sur les abscisses -0,5 ;
0 ; 0,5 ; 1 :
0,4
Voici la courbe de la densité f de proba d’une variable aléatoire X de loi
normale d’espérance 0 et d’écart-type 1 (variance 1), notée N (0,1).
1 2
1 − 2x
f ( x)=
e
√2 π
0,3
Elle est définie sur ℝ , on l’a tracée sur [- 4 ; 4] ; en dehors de cet
intervalle, les valeurs sont extrèmement faibles.
0,2
0,1
-4
-2
0
2
4
Cette courbe est proche des rectangles. Et la somme des aires des 4 rectangles est proche de l’aire sous la courbe que l’on
peut écrire comme une intégrale.
Dans notre cas, une bonne approximation de
P(−0,5⩽T ⩽1) par une intégrale serait
1,25
∫0,75 f ( x) dx
car les rectangles sont centrés sur -0,5, 0, 0,5, 1 avec une
largeur de 0,5.
Une approximation plus grossière est :
P(−0,5⩽T ⩽1) ≈
1
∫0,5 f ( x)dx
= P(−0,5⩽ X ⩽1)
avec X suivant la loi N (0,1).
Ce serait meilleur si les rectangles étaient plus "fins". Leur
1
1
=
, il faudrait avoir un écart-type
2 σ( Y )
plus grand pour Y .
largeur étant de
Michel Brissaud (88) ([email protected])
février 2014
2/4
2) Deuxième exemple
On suit la même démarche avec :
Y : Loi binomiale B (48 ; 0,25) de
paramètres n = 48 et p = 0,25.
Espérance E(Y) = n p = 12
Variance V(Y) = n p (1- p) = 9
Écart-type : σ (Y) = 3
Les proba au delà de 24 sont très faibles.
La distribution de proba est très dissymétrique sur [0 ; 48], mais presque symétrique sur [4 ; 20].
Soit Z = Y - 12 = Y - E(Y)
les valeurs de Z vont de -12 à 36
Les proba au delà de 12 sont très faibles.
Soit T =
Y −12 Y −E (Y )
=
3
σ (Y )
E(T) = 0 et σ (T) = 1 (T est centrée réduite)
Les valeurs de T vont de - 4 à 12 au pas de 1/3.
Les proba au delà de 4 sont très faibles.
Ci-dessous à gauche, on remplace les bâtons par des rectangles dont l’aire est égale aux proba. Comme la largeur est 1/3, la
hauteur est égale à 3 fois la proba, ce qui correspond à la densité de proba (voir au §1) portée en ordonnée.
densité de la loi N (0 ; 1)
On les rassemble :
0,4
0,3
0,2
0,1
-4 -2 0
2
4
6
8 10 12
Les rectangles ayant une largeur de 1/3, ils sont plus fins que dans le §1, et la courbe est plus proche des rectangles.
On a alors une bonne approximation avec :
En rappelant que T =
b
P( a⩽T ⩽b)≈∫a f ( x) dx= P (a ⩽ X ⩽b) .
Y −E (Y )
Y −E (Y )
, on a finalement : P a⩽
⩽b ≈ P ( a⩽ X ⩽b ) avec Y suivant une loi binomiale et
σ (Y )
σ(Y )
(
)
X suivant la loi normale centrée réduite N (0,1).
Michel Brissaud (88) ([email protected])
février 2014
3/4
3) Deux mauvais exemples
A] Avec Y suivant la loi B (48 ; 0,05) :
Espérance E(Y) = n p = 2,4
Variance V(Y) = n p (1- p) = 2,28
Écart-type : σ (Y) ≈ 1,5
On remarque une forte dissymétrie qui s’explique par une espérance np trop faible.
De plus l’écart-type étant faible, en représentant la variable aléatoire T =
Y −E (Y )
sous forme de rectangles, ceux ci
σ (Y )
seraient trop larges.
La variable aléatoire T =
Y −E (Y )
ne pourra pas être considérée comme proche de X suivant la loi N (0,1).
σ (Y )
B] Avec Y suivant la loi B (48 ; 0,95) :
Espérance E(Y) = n p = 45,6
Variance V(Y) = n p (1- p) = 2,28
Écart-type : σ (Y) ≈ 1,5
On remarque encore une forte dissymétrie qui s’explique par une espérance np trop forte, et un écart-type faible.
Là encore, la variable aléatoire T =
Y −E (Y )
ne pourra pas être considérée comme proche de X suivant la loi N (0,1).
σ (Y )
C] Remarques :
Ici, on a n(1- p) = 2,4, et : np + n(1- p) = n ; "np trop grand" correspond à "n(1- p) trop petit"
Si on compare les 2 cas précédents, le diagramme de l’un est symétrique de l’autre et cela peut se justifier facilement en
revenant à la formule de calcul des proba pour une loi binomiale car le paramètre p est 0,05 en A] et 0,95 en B] (somme 1).
Des graphiques semblables montrent que np et n(1- p) doivent être plus grands que 5 pour éviter les dissymétries observées
ci-dessus. L’écart-type est assez grand si n est grand.
4) Conclusion
Si Y suit la loi B (n ; p) avec n "assez grand" (quelques dizaines au moins), np et n(1- p) plus grands que 5, on a
l’approximation :
(
P a⩽
Y −E (Y )
⩽b ≈ P ( a⩽ X ⩽b )
σ(Y )
)
b
a
∫
où X suit la loi normale centrée réduite N (0,1) : P (a⩽ X ⩽b )=
Michel Brissaud (88) ([email protected])
février 2014
b
a
f ( x) dx=∫
1 2
1 −2x
e
dx
√2 π
4/4
Téléchargement