THEORIE ELEMENTAIRE DES PROBABILITES

publicité
La loi Normale
LOI NORMALE
I Passage de la loi binomiale à la loi normale réduite
Soit une loi binomiale avec n grand et p et q non très petits, donnant donc une distribution
en cloche : on peut représenter graphiquement les probabilités P(k) données par cette loi binomiale
par des rectangles de hauteur P(k) et de base (k + 0,5) – (k – 0,5) = 1
P(k)
-
l'aire des rectangles est égale à P(k)
la somme des aires est égale à 1
le maximum se trouve vers np
k
Si n tend vers l'infini, on a un étalement de la
distribution.
On remplace alors k par la variable réduite U(k ) =
0
1
2
3
4
5
k − μ K k − np
=
σK
npq
Si on veut représenter graphiquement la distribution par des rectangles comme précédemment, on
multiplie P(k) par
npq pour conserver une aire des rectangles égales à P(k) = P(U)
On obtient la représentation suivante
-
y=P(k). npq
l'aire des rectangles est égale à P(k)
la somme des aires est égale à 1
le maximum se trouve vers l'origine
k
-2
npq
-1
npq
0
1
npq
2
npq
Le théorème de Moivre ou de Laplace dit que lorsque n tend vers l'infini, la variable U tend à
devenir une variable aléatoire continue variant entre −∞ et +∞ . Le polygone formé par la partie
supérieure des rectangles tend vers une courbe d'équation :
1 −U 2 / 2
y=
e
2π
C'est la courbe de Gauss ou la courbe normale réduite.
1
La loi Normale
II La loi normale réduite
II.1 Sa forme
La fonction de densité de probabilité de la variable aléatoire U suivant une loi normale réduite est
notée :
2
1
e −u / 2
ϕ( u ) =
2π
-
elle est symétrique par rapport à l'axe
des ordonnées
elle a son seul maximum pour u = 0
qui vaut à peu près 0,4
elle a deux points d'inflexion pour u
valant –1 et 1
elle est asymptotique à l'axe des u
elle ne dépend d'aucun paramètre
68% des valeurs de u sont comprises
entre u=–1 et u=+1 et 95% des valeurs
de u entre u=-2 et +2.
0.5
ϕ(u)
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
u
68%
95%
u
La fonction de répartition se note φ( u ) = Pr ob(U < u ) =
∫ ϕ(x)dx
(appelée aussi courbe sigmoïde)
−∞
-
φ (u)
elle a la forme d'un S ouvert
elle présente un point d'inflexion et de
1
0.8
symétrie pour u = 0 et φ( u ) = 0,5
0.6
φ( −∞ ) = 0 et φ( +∞ ) = 1
0.4
0.2
u
0
-4
-2
0
2
4
Le calcul de l'intégrale donnant la fonction de répartition est généralement réalisé par une
approximation polynomiale. On trouve des tables donnant la valeur de φ( u ) pour différentes
valeurs de u dans les ouvrages de statistiques. Ces tables étant présentées de différentes façons, il
faut se référer à l'intégrale calculée et présentée en en-tête de la table. Ces tables concernent
généralement que les valeurs positives de U, les valeurs négatives étant déduites par raison de
symétrie de la loi.
2
La loi Normale
II.2 Ses moments
E(U) = µ = 0
: moyenne
2
σU
=1
: variance
μ3 = 0 = γ1
: symétrie
μ4 = 3 = γ2
: aplatissement
II.3 Autres caractéristiques
•
Médiane = Mode = Moyenne = 0
•
L'écart moyen absolu : ε m =
+∞
∫ u − µ ϕ (u) du =
2 / π ≅ 0,7979
−∞
•
L'écart
médian
ou
probable
:
ε p est tel que Pr ob( u − µ < ε p ) = 0,5
donc
ε p = U 1− 0 , 5 / 2 = U 0 ,75 = 0 ,6745
II.4 Approximations
Sous les conditions d'un n grand et de p et q pas très petits, la pratique montre que
l'approximation de la loi binomiale par la loi normale n'est satisfaisante que si les produits np et nq
sont supérieurs à 5.
Dans le cas contraire (np ou nq inférieur à 5), n étant suffisamment grand, c'est la loi de
Poisson qui sert habituellement d'approximation à la loi binomiale.
III La loi normale généralisée
III.1 Formulation et forme
D'une manière générale, on appelle distribution normale de paramètre α et β toute distribution
continue dont la densité de probabilité est donnée par l'expression :
ϕ ( x) =
1
e
β 2π
1 ⎛ x −α ⎞
⎟
− ⎜⎜
2 ⎝ β ⎟⎠
2
On peut vérifier que les paramètres correspondent à la moyenne α=µ et à l'écart-type β=σ de la
distribution.
Les propriétés de la loi normale réduite s'étendent facilement à l'ensemble des distributions
normales.
La fonction de densité de probabilité a les caractéristiques suivantes :
- elle est symétrique par rapport à la droite x = µ
-
elle admet un maximum en x = m qui vaut 1 /(σ 2 π )
3
La loi Normale
elle possède deux points d'inflexion en x = µ ± σ
-
- elle est asymptotique à l'axe des x
La fonction de répartition est toujours caractérisée par deux asymptotes et un point d'inflexion et de
symétrie en x = µ et F(x) = 0,5.
De plus, une modification de la moyenne µ correspond à un déplacement latéral des deux courbes
(fonction de densité et fonction de répartition), tandis qu'à un accroissement ou une diminution de
l'écart-type correspond un plus ou moins grand étalement de la courbe de densité et une plus ou
moins faible inclinaison de la fonction de répartition.
On dit que µ est un paramètre de position et que σ est un paramètre d'échelle.
0.8
ϕ (x)
φ (x)
µ= 3
σ=
0
0.7
0.6
µ= 0
σ= 1
0.4
0.2
µ= 1
σ= 2
µ= 3
σ= 1
µ= 1
σ= 2
0.1
0.25
µ= 3
x
0
-2
-1
µ= 3
σ= 1
0.5
0.3
-3
µ= 0
σ= 1
0.75
0.5
-4
1
0
1
2
3
4
5
6
0
-4
-3
-2
Fonction de densité
-1
x
σ=
0
0
1
2
3
4
5
6
Fonction de répartition
III.2 Caractéristiques
Du fait de la symétrie de la distribution
μ3 = 0 = γ1
: symétrie
On trouve aussi les moments suivants
μ4 = 3 σ4
d'où
γ2 = 3
: aplatissement
Et les caractéristiques suivantes
2
⋅ σ ≅ 0 ,7979 σ
π
ε p = 0 ,6745 σ
εm =
La fonction génératrice des moments s'exprime par :
[ ]= e
m x (t ) = E e
xt
μt +
σ 2t 2
2
4
La loi Normale
III.3 Passage de la loi réduite à la loi généralisée
Si on fait subir à la variable aléatoire U, suivant une loi normale réduite N (0 ; 1), la
transformation linéaire X = µ + σ U, on obtient une variable aléatoire X suivant une loi normale de
paramètres α=μ et β=σ : N (µ ; σ)
La réciproque est vrai :
si X suit une loi normale N (µ ; σ), alors la variable réduite U = (X-µ)/ σ suit une loi normale réduite
N (0 ; 1).
Cette propriété est utilisée pour le calcul des probabilités. Ainsi, si X suit une loi normale N (µ ; σ),
pour calculer x p tel que Pr ob( X < x p ) = φ( x p ) = p , on lit u p dans la table de la loi normale réduite
et on en déduit x p = u p ⋅ σ + µ
III.4 Propriétés
Toute fonction linéaire de plusieurs variables normales indépendantes suit une loi normale.
•
Si U suit N (0 ; 1) et si X = a + b U
⎣
alors
X suit N (a ; b)
•
Si Y = c X + d
⎣
alors
Y suit N (ca+d ; cb)
•
Si X suit N ( µx ; σ x ) et si Y suit N( µ y ; σ y ) et si Z = aX ± bY
⎣
alors Z suit N (a µx ± b µ y ;
a 2 σ 2x + b 2 σ 2y )
III.5 Théorème central limite
Toute somme de variables aléatoires indépendantes tend vers une loi normale, à condition
qu'aucune d'elles n'ait une importance prépondérante par rapport aux autres.
Cette propriété a beaucoup de conséquences pratiques. On a vu par exemple que la loi binomiale
tend vers la loi normale, or la loi binomiale est une somme de variables alternatives (ou de
Bernouilli).
La convergence vers une loi normale est d'autant plus rapide que les lois de probabilité des
variables initiales sont symétriques.
Pour des variables aléatoires uniformes U(0;1), on considère qu'il y a convergence dès que l'on
somme 12 variables : la somme de 12 variables uniformes entre 0 et 1 suit une loi normale N (6 ; 1).
Exemple : la moyenne qui est une somme, suit très rapidement une loi normale si l'effectif est
supérieur à 30.
5
La loi Normale
III.6 Représentation Gausso-arithmétique
L'intérêt du papier Gausso-arithmétique est de représenter la loi normale par une droite. Il
est gradué de manière arithmétique en X et de manière arithmétique en U avec une correspondance
en φ( u ) .
u
φ(u)
2
0.98
1
0.84
0
0.50
-1
0.16
-2
0.02
µ-σ
µ
µ+σ
Si X suit N(α ; β), alors porter φ( u( x )) en fonction de x revient à porter u en fonction de x. Comme il
y a une relation linéaire entre les variables aléatoires U et X, la loi normale est représentée par une
droite sur ce système d'axes. Cette droite est appelée droite de Henry.
Pour vérifier si un échantillon de n valeurs ( x i avec i = 1 à n) suit une loi normale, on les
classe par ordre croissant ( xr avec r = 1 à n), on calcule les fréquences empiriques par la formule de
Hazen : Fr = F(xr) = [rang(xr)-0,5]/n, puis on reporte sur le papier Gausso-arithmétique les points
( xr ; Fr ).
Si les points s'alignent, on peut dire que l'on a affaire à une distribution normale.
IV Usages des lois normales
Compte tenu du théorème central limite, on considère que les variables suivantes suivent une loi de
Gauss :
- erreurs de mesures : elles résultent de la somme de différentes erreurs indépendantes (lecture,
manipulation, etc…) ;
- taille des organismes vivants en biologie : on peut considérer que la taille résulte de la somme des
actions de différents gènes intervenant indépendamment et de façon additive ;
- en climatologie et hydrologie : les hauteurs de pluie annuelles, les températures moyennes
annuelles, parfois les débits moyens annuels ;
6
Téléchargement