Loi binomiale - loi normale 1) Premier exemple Soit Y une variable aléatoire suivant une loi binomiale de paramètres n = 16 et p = 0,5. espérance = E(Y) = n p = 8, variance = V(Y) = n p (1-p) = 4 écart-type = σ(Y) = 2 Les valeurs prises sont les 17 entiers de 0 à 16. Représentation en bâtons (c’est une variable discrète) : Les proba sont en ordonnée. Par exemple la proba P(7 Y 10) est la somme des hauteurs des 4 bâtons d’abscisses 7 à 10. Soit la nouvelle variable aléatoire : Z = Y - 8 = Y - E(Y) Les valeurs prises sont les 17 entiers de -8 à 8. 7 Y 10 <=> -1 Z 2 P(7 Y 10) = P(-1 Z 2) = somme des hauteurs des 4 bâtons d’abscisses -1 à 2. espérance de Z : E(Z)= 0 écart-type de Z : σ(Z)= σ(Y) = 2 Soit la nouvelle variable aléatoire : Z Y −8 Y −E (Y ) T= = = 2 2 σ (Y ) Les valeurs prises par T sont les 17 nombres -4 ; -3,5 ; -3 ; ... jusqu’à 4. 7 Y 10 <=> -0,5 T 1 et P(-0,5 T 1) = somme des hauteurs des 4 bâtons d’abscisses -0,5 , 0 , 0,5 , 1. espérance de T : E(T)= 0 écart-type de T : σ(T)= 1 (T est une variable centrée réduite) On change complètement de représentation graphique : on dessine des rectangles dont l’aire est égale à la proba. Pour un rectangle : hauteur = proba largeur Ici, comme les largeurs sont de 0,5, les hauteurs sont les doubles des hauteurs des bâtons du graphique précédent. (les rectangles sont "centrés" sur 0 ; 0,5 ; 1 ; 1,5 ; etc...) La hauteur d’un rectangle est analogue à une densité (comme par exemple : densité de population= population ). superficie Ici, on obtient une densité de probabilité. Cela revient à considérer une nouvelle variable aléatoire continue qui prolonge T sur [-4,5 ; 4,5] et dont la densité est constante par intervalles. Michel Brissaud (88) ([email protected]) février 2014 1/4 Revenons à P(7 Y 10) : P(7 Y 10) = P(-0,5 T 1) et c’est alors la somme des aires des 4 rectangles centrés sur les abscisses -0,5 ; 0 ; 0,5 ; 1 : 0,4 Voici la courbe de la densité f de proba d’une variable aléatoire X de loi normale d’espérance 0 et d’écart-type 1 (variance 1), notée N (0,1). 1 2 1 − 2x f ( x)= e √2 π 0,3 Elle est définie sur ℝ , on l’a tracée sur [- 4 ; 4] ; en dehors de cet intervalle, les valeurs sont extrèmement faibles. 0,2 0,1 -4 -2 0 2 4 Cette courbe est proche des rectangles. Et la somme des aires des 4 rectangles est proche de l’aire sous la courbe que l’on peut écrire comme une intégrale. Dans notre cas, une bonne approximation de P(−0,5⩽T ⩽1) par une intégrale serait 1,25 ∫0,75 f ( x) dx car les rectangles sont centrés sur -0,5, 0, 0,5, 1 avec une largeur de 0,5. Une approximation plus grossière est : P(−0,5⩽T ⩽1) ≈ 1 ∫0,5 f ( x)dx = P(−0,5⩽ X ⩽1) avec X suivant la loi N (0,1). Ce serait meilleur si les rectangles étaient plus "fins". Leur 1 1 = , il faudrait avoir un écart-type 2 σ( Y ) plus grand pour Y . largeur étant de Michel Brissaud (88) ([email protected]) février 2014 2/4 2) Deuxième exemple On suit la même démarche avec : Y : Loi binomiale B (48 ; 0,25) de paramètres n = 48 et p = 0,25. Espérance E(Y) = n p = 12 Variance V(Y) = n p (1- p) = 9 Écart-type : σ (Y) = 3 Les proba au delà de 24 sont très faibles. La distribution de proba est très dissymétrique sur [0 ; 48], mais presque symétrique sur [4 ; 20]. Soit Z = Y - 12 = Y - E(Y) les valeurs de Z vont de -12 à 36 Les proba au delà de 12 sont très faibles. Soit T = Y −12 Y −E (Y ) = 3 σ (Y ) E(T) = 0 et σ (T) = 1 (T est centrée réduite) Les valeurs de T vont de - 4 à 12 au pas de 1/3. Les proba au delà de 4 sont très faibles. Ci-dessous à gauche, on remplace les bâtons par des rectangles dont l’aire est égale aux proba. Comme la largeur est 1/3, la hauteur est égale à 3 fois la proba, ce qui correspond à la densité de proba (voir au §1) portée en ordonnée. densité de la loi N (0 ; 1) On les rassemble : 0,4 0,3 0,2 0,1 -4 -2 0 2 4 6 8 10 12 Les rectangles ayant une largeur de 1/3, ils sont plus fins que dans le §1, et la courbe est plus proche des rectangles. On a alors une bonne approximation avec : En rappelant que T = b P( a⩽T ⩽b)≈∫a f ( x) dx= P (a ⩽ X ⩽b) . Y −E (Y ) Y −E (Y ) , on a finalement : P a⩽ ⩽b ≈ P ( a⩽ X ⩽b ) avec Y suivant une loi binomiale et σ (Y ) σ(Y ) ( ) X suivant la loi normale centrée réduite N (0,1). Michel Brissaud (88) ([email protected]) février 2014 3/4 3) Deux mauvais exemples A] Avec Y suivant la loi B (48 ; 0,05) : Espérance E(Y) = n p = 2,4 Variance V(Y) = n p (1- p) = 2,28 Écart-type : σ (Y) ≈ 1,5 On remarque une forte dissymétrie qui s’explique par une espérance np trop faible. De plus l’écart-type étant faible, en représentant la variable aléatoire T = Y −E (Y ) sous forme de rectangles, ceux ci σ (Y ) seraient trop larges. La variable aléatoire T = Y −E (Y ) ne pourra pas être considérée comme proche de X suivant la loi N (0,1). σ (Y ) B] Avec Y suivant la loi B (48 ; 0,95) : Espérance E(Y) = n p = 45,6 Variance V(Y) = n p (1- p) = 2,28 Écart-type : σ (Y) ≈ 1,5 On remarque encore une forte dissymétrie qui s’explique par une espérance np trop forte, et un écart-type faible. Là encore, la variable aléatoire T = Y −E (Y ) ne pourra pas être considérée comme proche de X suivant la loi N (0,1). σ (Y ) C] Remarques : Ici, on a n(1- p) = 2,4, et : np + n(1- p) = n ; "np trop grand" correspond à "n(1- p) trop petit" Si on compare les 2 cas précédents, le diagramme de l’un est symétrique de l’autre et cela peut se justifier facilement en revenant à la formule de calcul des proba pour une loi binomiale car le paramètre p est 0,05 en A] et 0,95 en B] (somme 1). Des graphiques semblables montrent que np et n(1- p) doivent être plus grands que 5 pour éviter les dissymétries observées ci-dessus. L’écart-type est assez grand si n est grand. 4) Conclusion Si Y suit la loi B (n ; p) avec n "assez grand" (quelques dizaines au moins), np et n(1- p) plus grands que 5, on a l’approximation : ( P a⩽ Y −E (Y ) ⩽b ≈ P ( a⩽ X ⩽b ) σ(Y ) ) b a ∫ où X suit la loi normale centrée réduite N (0,1) : P (a⩽ X ⩽b )= Michel Brissaud (88) ([email protected]) février 2014 b a f ( x) dx=∫ 1 2 1 −2x e dx √2 π 4/4