La loi log-normale La loi log-normale Définition On a pu voir que les valeurs possibles d’une variable aléatoire normale étaient l’ensemble des nombres réels. Pour une situation réelle ne pouvant prendre des valeurs négatives, on peut malgré tout utiliser une loi normale lorsque la moyenne et l’écart type sont tels que la probabilité théorique d’avoir une valeur négative est à toute fin pratique nulle. Exemple : Prenons une loi normale X de moyenne µ = 30 et d’écart type σ = 10. P( X < 0) = P X − µ < 0 − 30 = P(Z < −3) = 0,0013 10 σ Par contre, pour une situation réelle ayant une moyenne très faible (ce qui est souvent le cas d’analyses en météorologie ou d’analyses sur la concentration de produits chimiques), il est très difficile d’oublier ce fait. De plus, les situations ne pouvant prendre des valeurs négatives et ayant une moyenne très faible ont tendance à présenter une distribution dissymétrique, donnant ainsi une proportion d’événements extrêmes plus grande que celle prévue par la loi normale. Voici une courbe typique d’une telle situation : Puisque nous avons affaire à une situation ne prenant pas de valeurs négatives, il est possible de calculer le logarithme de ces valeurs dans une base quelconque et ces nouvelles valeurs se distribuent sur tous les réels, les valeurs comprises entre 0 et 1 ayant des valeurs logarithmiques négatives et les valeurs supérieures à 1 ayant des valeurs logarithmiques positives. Ce raisonnement est à la base de la loi log-normale. Une distribution de probabilité d’une variable aléatoire X est dite log-normale si la distribution de probabilité de la variable aléatoire Y = ln X est normale. Les caractéristiques de la loi log-normale Tout comme la loi normale, une distribution log-normale est complètement définie p ar deux paramètres. Si on note X la variable aléatoire qui suit une loi log-normale et Y = ln X la variable aléatoire qui suit une loi normale, les deux paramètres qui caractériseront la variable aléatoire log-normale seront habituellement µ la moyenne de la variable aléatoire normale et σ 2 la variance de la variable aléatoire normale (ou σ l’écart type de la variable aléatoire normale). Par contre, dans certaines applications, on préfère utiliser comme paramètres connus GMX la moyenne géométrique de la variable aléatoire X et GSDX l’écart type géométrique de la variable aléatoire X. Voici quatre courbes log-normales. Elles diffèrent énormément mais pourtant elles ont une caractéristique commune : la moyenne arithmétique de ces variables aléatoire s log-normale s est 10. On peut noter à partir des ces quatre courbes que la moyenne arithmétique de 10 semble plus appropriée comme évaluation du centre de la courbe pour la courbe qui est la plus symétrique. Les principales caractéristiques de ces quatre courbes sont : X variable aléatoire log-normale et Y = ln X variable aléatoire normale MO X ME X = GM X µX σX GSD X µY = µ σY = σ 1,8 5,7 10,0 14,6 2,9 1,7 1,1 4,9 7,9 10,0 7,9 2,0 2,1 0,7 7,8 9,2 10,0 4,2 1,5 2,2 0,4 9,5 9,8 10,0 1,8 1,2 2,3 0,2 Si on connaît la moyenne géométrique et l’écart type géométrique de la variable aléatoire X qui est log-normale, il est possible de calculer les caractéristiques moyenne et variance (ou écart type) de la variable aléatoire Y = ln X qui est normale en utilisant les propriétés suivantes : Soit X la variable aléatoire log-normale ayant moyenne géométrique GM X connue, écart type géométrique GSD X connu. Si Y = ln X est la variable aléatoire normale ayant moyenne µY = µ , variance σ Y2 = σ 2 , écart type σ Y = σ alors µ = µY = ln GM X , σ = σ Y = ln GSDX . Si on connaît les caractéristiques moyenne et variance (ou écart type) de la variable aléatoire Y = ln X qui est normale, il est possible d’établir un lien entre ces caractéristiques connus et les caractéristiques correspondantes de la loi lognormale. Soit X la variable aléatoire log-normale ayant moyenne µ X , variance σ 2X , écart type σ X , moyenne géométrique GM X , écart type géométrique GSD X . Si Y = ln X est la variable aléatoire normale ayant moyenne µY = µ connue , variance σY2 = σ 2 connue, écart type σ Y = σ connu, alors µX = e µ +σ 2 2 , σ 2X = e 2(µ +σ ) ⋅ (1 − e−σ ) , 2 2 σ X = e(µ +σ ) ⋅ 1 − e−σ 2 , GM X = eµ , 2 GSDX = eσ . Les autres caractéristiques de la loi log-normale peuvent aussi être évaluées de la connaissance des paramètres µ et σ2 (ou σ) de la loi normale correspondante. Soit X la variable aléatoire log-normale Si Y = ln X est une variable aléatoire normale ayant moyenne µY = µ connue, variance σ Y2 = σ 2 connue, écart type σY = σ connu, alors la fonction de densité de la variable aléatoire X est 0 si x ≤ 0 2 (ln x − µ ) f ( x) = 1 − 2 e 2σ si x > 0 σ x 2π la médiane de la variable aléatoire X est MEX = e µ ; le premier quartile de la variable aléatoire X est Q1 = e µ − 0,6745σ ; le troisième quartile de la variable aléatoire X est Q3 = e µ + 0,6745σ ; µ −σ le mode de la variable aléatoire X est MO X = e 2 On peut constater puisque MEX = e µ et que GM X = eµ , on a donc MEX = GM X c’est-à-dire que la médiane et la moyenne géométrique sont égales. De plus, puisque MO X = eµ −σ , MEX = e µ et µ X = e 2 µ +σ 2 2 , on a donc MO X < MEX < µ X c’est-à-dire que la médiane est toujours comprise entre le mode et la moyenne. Exemple : Soit X une variable aléatoire log-normale ayant une moyenne géométrique de 9,8 et un écart type géométrique de 1,2. Déterminer la moyenne et l’écart type de la variable aléatoire Y = ln X correspondante. Déterminer la moyenne arithmétique, la médiane, le mode, l’écart type de la variable aléatoire X. Il est possible algébriquement d’inverser les calculs. Soit Y une variable aléatoire normale ayant moyenne µY = µ , variance σ Y2 = σ 2 , écart type σ Y = σ , Si X = eY est une variable aléatoire log-normale ayant moyenne µ X connue , variance σ 2X connue, écart type σ X connu, moyenne géométrique GM X , écart type géométrique GSD X alors 1 µ = 2ln µ X − ln(µ 2X +σ 2X ) , 2 σ 2 = ln(µ 2X + σ X2 ) − 2ln µ X , σ = ln(µ 2X + σ 2X ) − 2ln µ X , GM X = eµ , GSDX = eσ . Exemple : Soit X une variable aléatoire log-normale de moyenne arithmétique 10 et d’écart type 1.8. Calculer la moyenne et l’écart type de la variable aléatoire Y = ln X correspondante. Calculer la moyenne géométrique et l’écart type géométrique de la variable aléatoire X. Calcul de probabilités pour une loi log-normale Pour évaluer des probabilités sur une loi log-normale, il est possible d’utiliser la loi normale qui lui correspond. Soit X une variable aléatoire log-normale. Pour calculer P(a ≤ X ≤ b) on utilise le fait que la variable aléatoire Y = ln X est normale et que P(a ≤ X ≤ b ) = P(ln a ≤ ln X ≤ ln b ) = P(ln a ≤ Y ≤ ln b) Si la moyenne géométrique GM X et l’écart type géométrique GSD X de la variable aléatoire X log-normale sont connus alors µY = µ = ln GM X , σ Y = σ = ln GSDX et ln b − µ ln a − µ Y − µ ln b − µ ln a − µ P(a ≤ X ≤ b) = P(ln a ≤ Y ≤ ln b) = P ≤ ≤ ≤Z≤ = P σ σ σ σ σ Exemple : Si X = «les concentrations d’un contaminant auxquelles est exposé un employé dans une journée de travail de 8 heures» est une variable aléatoire qui suit une loi log-normale de paramètre GM X = 5,5 ppm et GSDX = 3,0 ppm, calculer P(2,5 ≤ X ≤ 8,5) Ajustement graphique d’une loi log-normale On peut utiliser le fait que si X est une variable aléatoire log-normale alors la variable aléatoire Y = ln X est une variable aléatoire normale. Si nous prenons un échantillon de taille n X = { x1, x2 ,K, xn} provenant d’une population qui suit une loi log-normale, l’ensemble Y Y = {ln x1 ,ln x2,K,ln xn } proviendrait d’une population qui suit une loi normale. L’ajustement de l’ensemble de données Y avec une droite de Henry sur papier gaussoarithmétique permettra de décider de la pertinence ou non de l’ajustement de la variable X à une loi log-normale. Exercices 1. Soit X une variable aléatoire log-normale ayant une moyenne géométrique et un écart type géométrique connus. a) Déterminer la moyenne et l’écart type de la variable aléatoire Y = ln X correspondante. b) Déterminer la moyenne arithmétique, la médiane, le mode, l’écart type de la variable aléatoire X. i) GM X = 5,7 et GSDX = 2,9. ii) GM X = 7,9 et GSDX = 2,1. iii) GM X = 9,2 et GSDX = 1,5. 2. Soit X une variable aléatoire log-normale de moyenne arithmétique et d’écart type connus. a) Calculer la moyenne géométrique et l’écart type géométrique de la variable aléatoire X. b) Calculer la moyenne et l’écart type de la variable aléatoire Y = ln X correspondante. i) µ X = 2,2et σ X = 0,9 . ii) µ X = 16,1 et σ X = 26. iii) µ X = 16,3et σ X = 6,9. 3. Soit X une variable aléatoire log-normale de paramètres GM X = 5,7 et GSDX = 2,9. Calculer les probabilités suivantes : a) P(0 ≤ X ≤ 10) b) P(X ≥ 15) c) P(0 ≤ X ≤ 5,7) d) P(5 ≤ X ≤ 15) 4. Déterminer si les données du no. 4 des exercices sur «La droite de Henry» suivent une loi log-normale en utilisant la droite de Henry et si l’ajustement semble satisfaisant calculer une approximation de la moyenne et de l’écart type de ces données à partir de la droite de Henry. Réponses aux exercices 1. X variable aléatoire log-normale et Y = ln X variable aléatoire normale MO X MEX = GM X µX σX GSDX µY = µ σY = σ 1,8 5,7 10,0 14,6 2,9 1,7 1,1 4,9 7,9 10,0 7,9 2,0 2,1 0,7 7,8 9,2 10,0 4,2 1,5 2,2 0,4 2. xxx X variable aléatoire log-normale et Y = ln X variable aléatoire normale MO X ME X = GM X µX σX GSD X µY = µ σY = σ 1,7 2,4 12,7 2,0 8,5 15,0 2,2 16,1 16,3 0,9 26,0 6,9 1,5 3,1 1,5 0,7 2,1 2,7 3. a) 0,7012 b) 0,1817 c) 0,5 d) 0,3672 4. L’ajustement semble raisonnable µY ≅ -0,7 et σ Y ≅ 1,05. µX ≅ 0,86 et σ X ≅ 1,22. 0,4 1,1 0,4