La loi Normale LOI NORMALE I Passage de la loi binomiale à la loi normale réduite Soit une loi binomiale avec n grand et p et q non très petits, donnant donc une distribution en cloche : on peut représenter graphiquement les probabilités P(k) données par cette loi binomiale par des rectangles de hauteur P(k) et de base (k + 0,5) – (k – 0,5) = 1 P(k) - l'aire des rectangles est égale à P(k) la somme des aires est égale à 1 le maximum se trouve vers np k Si n tend vers l'infini, on a un étalement de la distribution. On remplace alors k par la variable réduite U(k ) = 0 1 2 3 4 5 k − μ K k − np = σK npq Si on veut représenter graphiquement la distribution par des rectangles comme précédemment, on multiplie P(k) par npq pour conserver une aire des rectangles égales à P(k) = P(U) On obtient la représentation suivante - y=P(k). npq l'aire des rectangles est égale à P(k) la somme des aires est égale à 1 le maximum se trouve vers l'origine k -2 npq -1 npq 0 1 npq 2 npq Le théorème de Moivre ou de Laplace dit que lorsque n tend vers l'infini, la variable U tend à devenir une variable aléatoire continue variant entre −∞ et +∞ . Le polygone formé par la partie supérieure des rectangles tend vers une courbe d'équation : 1 −U 2 / 2 y= e 2π C'est la courbe de Gauss ou la courbe normale réduite. 1 La loi Normale II La loi normale réduite II.1 Sa forme La fonction de densité de probabilité de la variable aléatoire U suivant une loi normale réduite est notée : 2 1 e −u / 2 ϕ( u ) = 2π - elle est symétrique par rapport à l'axe des ordonnées elle a son seul maximum pour u = 0 qui vaut à peu près 0,4 elle a deux points d'inflexion pour u valant –1 et 1 elle est asymptotique à l'axe des u elle ne dépend d'aucun paramètre 68% des valeurs de u sont comprises entre u=–1 et u=+1 et 95% des valeurs de u entre u=-2 et +2. 0.5 ϕ(u) 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4 u 68% 95% u La fonction de répartition se note φ( u ) = Pr ob(U < u ) = ∫ ϕ(x)dx (appelée aussi courbe sigmoïde) −∞ - φ (u) elle a la forme d'un S ouvert elle présente un point d'inflexion et de 1 0.8 symétrie pour u = 0 et φ( u ) = 0,5 0.6 φ( −∞ ) = 0 et φ( +∞ ) = 1 0.4 0.2 u 0 -4 -2 0 2 4 Le calcul de l'intégrale donnant la fonction de répartition est généralement réalisé par une approximation polynomiale. On trouve des tables donnant la valeur de φ( u ) pour différentes valeurs de u dans les ouvrages de statistiques. Ces tables étant présentées de différentes façons, il faut se référer à l'intégrale calculée et présentée en en-tête de la table. Ces tables concernent généralement que les valeurs positives de U, les valeurs négatives étant déduites par raison de symétrie de la loi. 2 La loi Normale II.2 Ses moments E(U) = µ = 0 : moyenne 2 σU =1 : variance μ3 = 0 = γ1 : symétrie μ4 = 3 = γ2 : aplatissement II.3 Autres caractéristiques • Médiane = Mode = Moyenne = 0 • L'écart moyen absolu : ε m = +∞ ∫ u − µ ϕ (u) du = 2 / π ≅ 0,7979 −∞ • L'écart médian ou probable : ε p est tel que Pr ob( u − µ < ε p ) = 0,5 donc ε p = U 1− 0 , 5 / 2 = U 0 ,75 = 0 ,6745 II.4 Approximations Sous les conditions d'un n grand et de p et q pas très petits, la pratique montre que l'approximation de la loi binomiale par la loi normale n'est satisfaisante que si les produits np et nq sont supérieurs à 5. Dans le cas contraire (np ou nq inférieur à 5), n étant suffisamment grand, c'est la loi de Poisson qui sert habituellement d'approximation à la loi binomiale. III La loi normale généralisée III.1 Formulation et forme D'une manière générale, on appelle distribution normale de paramètre α et β toute distribution continue dont la densité de probabilité est donnée par l'expression : ϕ ( x) = 1 e β 2π 1 ⎛ x −α ⎞ ⎟ − ⎜⎜ 2 ⎝ β ⎟⎠ 2 On peut vérifier que les paramètres correspondent à la moyenne α=µ et à l'écart-type β=σ de la distribution. Les propriétés de la loi normale réduite s'étendent facilement à l'ensemble des distributions normales. La fonction de densité de probabilité a les caractéristiques suivantes : - elle est symétrique par rapport à la droite x = µ - elle admet un maximum en x = m qui vaut 1 /(σ 2 π ) 3 La loi Normale elle possède deux points d'inflexion en x = µ ± σ - - elle est asymptotique à l'axe des x La fonction de répartition est toujours caractérisée par deux asymptotes et un point d'inflexion et de symétrie en x = µ et F(x) = 0,5. De plus, une modification de la moyenne µ correspond à un déplacement latéral des deux courbes (fonction de densité et fonction de répartition), tandis qu'à un accroissement ou une diminution de l'écart-type correspond un plus ou moins grand étalement de la courbe de densité et une plus ou moins faible inclinaison de la fonction de répartition. On dit que µ est un paramètre de position et que σ est un paramètre d'échelle. 0.8 ϕ (x) φ (x) µ= 3 σ= 0 0.7 0.6 µ= 0 σ= 1 0.4 0.2 µ= 1 σ= 2 µ= 3 σ= 1 µ= 1 σ= 2 0.1 0.25 µ= 3 x 0 -2 -1 µ= 3 σ= 1 0.5 0.3 -3 µ= 0 σ= 1 0.75 0.5 -4 1 0 1 2 3 4 5 6 0 -4 -3 -2 Fonction de densité -1 x σ= 0 0 1 2 3 4 5 6 Fonction de répartition III.2 Caractéristiques Du fait de la symétrie de la distribution μ3 = 0 = γ1 : symétrie On trouve aussi les moments suivants μ4 = 3 σ4 d'où γ2 = 3 : aplatissement Et les caractéristiques suivantes 2 ⋅ σ ≅ 0 ,7979 σ π ε p = 0 ,6745 σ εm = La fonction génératrice des moments s'exprime par : [ ]= e m x (t ) = E e xt μt + σ 2t 2 2 4 La loi Normale III.3 Passage de la loi réduite à la loi généralisée Si on fait subir à la variable aléatoire U, suivant une loi normale réduite N (0 ; 1), la transformation linéaire X = µ + σ U, on obtient une variable aléatoire X suivant une loi normale de paramètres α=μ et β=σ : N (µ ; σ) La réciproque est vrai : si X suit une loi normale N (µ ; σ), alors la variable réduite U = (X-µ)/ σ suit une loi normale réduite N (0 ; 1). Cette propriété est utilisée pour le calcul des probabilités. Ainsi, si X suit une loi normale N (µ ; σ), pour calculer x p tel que Pr ob( X < x p ) = φ( x p ) = p , on lit u p dans la table de la loi normale réduite et on en déduit x p = u p ⋅ σ + µ III.4 Propriétés Toute fonction linéaire de plusieurs variables normales indépendantes suit une loi normale. • Si U suit N (0 ; 1) et si X = a + b U ⎣ alors X suit N (a ; b) • Si Y = c X + d ⎣ alors Y suit N (ca+d ; cb) • Si X suit N ( µx ; σ x ) et si Y suit N( µ y ; σ y ) et si Z = aX ± bY ⎣ alors Z suit N (a µx ± b µ y ; a 2 σ 2x + b 2 σ 2y ) III.5 Théorème central limite Toute somme de variables aléatoires indépendantes tend vers une loi normale, à condition qu'aucune d'elles n'ait une importance prépondérante par rapport aux autres. Cette propriété a beaucoup de conséquences pratiques. On a vu par exemple que la loi binomiale tend vers la loi normale, or la loi binomiale est une somme de variables alternatives (ou de Bernouilli). La convergence vers une loi normale est d'autant plus rapide que les lois de probabilité des variables initiales sont symétriques. Pour des variables aléatoires uniformes U(0;1), on considère qu'il y a convergence dès que l'on somme 12 variables : la somme de 12 variables uniformes entre 0 et 1 suit une loi normale N (6 ; 1). Exemple : la moyenne qui est une somme, suit très rapidement une loi normale si l'effectif est supérieur à 30. 5 La loi Normale III.6 Représentation Gausso-arithmétique L'intérêt du papier Gausso-arithmétique est de représenter la loi normale par une droite. Il est gradué de manière arithmétique en X et de manière arithmétique en U avec une correspondance en φ( u ) . u φ(u) 2 0.98 1 0.84 0 0.50 -1 0.16 -2 0.02 µ-σ µ µ+σ Si X suit N(α ; β), alors porter φ( u( x )) en fonction de x revient à porter u en fonction de x. Comme il y a une relation linéaire entre les variables aléatoires U et X, la loi normale est représentée par une droite sur ce système d'axes. Cette droite est appelée droite de Henry. Pour vérifier si un échantillon de n valeurs ( x i avec i = 1 à n) suit une loi normale, on les classe par ordre croissant ( xr avec r = 1 à n), on calcule les fréquences empiriques par la formule de Hazen : Fr = F(xr) = [rang(xr)-0,5]/n, puis on reporte sur le papier Gausso-arithmétique les points ( xr ; Fr ). Si les points s'alignent, on peut dire que l'on a affaire à une distribution normale. IV Usages des lois normales Compte tenu du théorème central limite, on considère que les variables suivantes suivent une loi de Gauss : - erreurs de mesures : elles résultent de la somme de différentes erreurs indépendantes (lecture, manipulation, etc…) ; - taille des organismes vivants en biologie : on peut considérer que la taille résulte de la somme des actions de différents gènes intervenant indépendamment et de façon additive ; - en climatologie et hydrologie : les hauteurs de pluie annuelles, les températures moyennes annuelles, parfois les débits moyens annuels ; 6