1. Identification d`une densité de probabilité p(v) par la "Méthode

PdF(V) è Stat-iii_pdf.doc è Proba_PDF-Moments.doc
1
IDENTIFICATION DE LOIS DE PROBABILITES UNIVARIEES :
MOMENTS ET DENSITE DE PROBABILITE P(V)
D'UNE VARIABLE ALEATOIRE "V"
1. Identification d'une densité de probabilité p(v)
par la "Méthode des Moments"
1.1. Méthode des moments
La "méthode des moments" consiste à comparer, pour une loi de probabilité théorique donnée,
les moments théoriques aux moments empiriques d'ordres élevés, ceci en attribuant aux
moments théoriques d'ordre moins élevés leurs valeurs empiriques (rappelons que les
moments dits "empiriques" sont issus du dépouillement statistique des simulations
numériques).
On utilisera ici les quatre premiers moments statistiques, ou certains coefficients obtenus à
partir de ces quatre premiers moments : coefficients de variation, d'asymétrie, et
d'aplatissement. On peut par exemple, pour une loi à deux paramètres, fixer les deux premiers
moments, ou la moyenne et le coefficient de variation, pour essayer de prédire/ajuster les
moments d'ordre 3 et 4, ou les coefficients d'asymétrie et d'aplatissement.
On présentera sous forme de tableaux les comparaisons entre les moments empiriques d'ordre
3 et 4 obtenus pour certains jeux de données, et les moments théoriques correspondants
prédits par les modèles (les "modèles" étant les lois théoriques à tester).
Le calcul des moments théoriques (prédits) se fait, autant que possible, grâce à des formules
analytiques closes, de la forme:
(1) ms
3 ou 4
th emp emp
fm
...
(,)=
On peut alors calculer une erreur relative, ou écart relatif, défini par :
(2) emm
m
=
-
n
th
n
emp
n
th
..
.
Ce critère nous permettra d'évaluer l'adéquation des modèles théoriques testés à la loi
empirique, ainsi que la marge de confiance associée.
PdF(V) è Stat-iii_pdf.doc è Proba_PDF-Moments.doc
2
1.2. Définitions des moments et des coefficients associés
Les moments centrés d'ordre n sont définis par la relation :
(3) mn=<(x-m)n>,
où <> représente l'opérateur d'espérance mathématique et m la moyenne, qui est aussi le
moment non centré d'ordre 1. Nous nous intéresserons plus particulièrement ici, outre la
moyenne, aux moments centrés d'ordre 2, 3 et 4, ainsi qu'à divers coefficients adimensionnels
pouvant être formés à partir de ces moments.
Le moment centré d'ordre 2 (m2) est représente la variance, encore notée plus couramment s2 .
On a donc :
(4) m2 =s2 =<(x-m)2>.
A partir de la moyenne (m) et de l'écart-type (s), on peut définir un coefficient de variation
noté "CV" ou simplement "C". Le coefficient de variation est particulièrement utile pour
quantifier le degré de variabilité d'une variable aléatoire positive. Il est défini par la relation :
(5) C = s/m.
Les moments centrés d'ordre 3 et 4, et. Les moments centrés d'ordre 3 et 4 sont définis par :
(6) m3=<(x-m)3>.
(7) m4=<(x-m)4>
A partir de ces deux derniers moments centrés, on définit les coefficients d'asymétrie et
d'aplatissement, ou coefficients de Fisher (Ventsel 1973, Tassi 1989) :
(8)
ï
ï
î
ï
ï
í
ì
-=
=
. (Kurtosis)ent aplatissemd't coefficien : 3
.(Skewness) asymétried't coefficien :
4
4
3
3
s
m
k
s
m
g
Il est facile de montrer que g = 0 pour une distribution symétrique, puisque les moments
d'ordre impairs sont alors nuls. Le coefficient g est un bon indicateur de symétrie de la loi
considérée. Ce coefficient est positif pour une loi asymétrique telle que la loi log-normale, la
loi exponentielle, etc. Il serait négatif, par exemple, pour une variable aléatoire x < x0 telle
que (x0-x) suit une loi exponentielle ou log-normale.
La définition du coefficient k fait référence à la forme de la loi normale N(0,1). En effet, on
obtient pour la loi normale (voir par exemple Tassi 1989) :
PdF(V) è Stat-iii_pdf.doc è Proba_PDF-Moments.doc
3
(9) x
p
pp2
4
2
1
2
1
2
4
5
2
1
2
3=
+
Þ= =
G
G
G
G
()
()
()
()
m
On en déduit que k = 0 pour une loi normale.
Plus généralement, k est positif pour une densité de probabilité "pointue" (plus pointue que la
loi normale), et négatif pour une densité de probabilité "aplatie" (plus aplatie que la loi
normale). La loi de Laplace, qui est une loi exponentielle symétrique présentant un point de
rebroussement à l'origine, a un coefficient d'aplatissement positif (k = +6).
On retiendra donc que les coefficients g et k sont définis de telle manière que la loi de
probabilité empirique s'approche d'une loi normale, du moins en ce qui concerne les moments
jusqu'à l'ordre 4, dès lors que |g| et |k| sont très inférieurs à l'unité.
PdF(V) è Stat-iii_pdf.doc è Proba_PDF-Moments.doc
4
1.3. Relations entre paramètres et moments de queqlues lois
a. Loi normale:
La loi normale, ou gaussienne, est une loi à deux paramètres (m,s). Sa densité
de probabilité est donnée par :
(10) f x e pour
X
xm
()
()
-
-
1
2
2
2
2
sp
s xR
Les coefficients d'asymétrie et d'aplatissement de la loi normale sont nuls, soit :
(11) î
í
ì
=
=
0
0
k
g
b. Loi log-normale :
On considère ici la loi log-normale à deux paramètres (m,s). Il s'agit d'une loi
de probabilité à support positif, dont la densité de probabilité est donnée par :
(12) fx xe
X
Ln x m
()
(() )
-
-
1
2
2
2
2
sp
s pour x R+
où m et s2 représentent la moyenne et la variance du logarithme de x. La loi
lognormale est directement liée à la loi normale. En effet, si la variable
y = ln(x) suit une loi normale N(m,s), alors la variable x = exp(y) suit une loi
log-normale donnée par l'équation ci-dessus.
Désignons plus précisément par mx et my les moyennes de x et y, et par sx2 et
sy2 les variances de x et y. On a alors les relations suivantes, extraites de
Ababou et Wood (1990), Tassi (1989), et Vanmarcke (1983).
La moyenne (arithmétique) de la variable lognormale x satisfait la relation :
(13) áñ= = ×xmxe
xg
y
s2
2 ,
où xg est la moyenne géométrique de x, définie par
PdF(V) è Stat-iii_pdf.doc è Proba_PDF-Moments.doc
5
(14) xe e
g
xmy
==
áñln( ) .
D'où la relation :
(15) me
x
my
y
=
+()
s2
2.
De plus, la variance de la variable lognormale x satisfait la relation :
(16) s
ss
xg
xe e
yy
22 1
22
=× ×
-()
En combinant ces relations, on obtient alors :
(17) s
ss
xx
me C
y
222
1=× - Þ = -() (e1)
x
1
2
y
2
Cette dernière équation donne la variance, et le coefficient de variation, de la
variable lognormale x en fonction des deux premiers moments de la variable
normale y = ln(x). On peut montrer que :
(18) gx = 3 Cx + Cx 3
(19) kx = Cx 8 + 6 Cx 6 + 15 Cx 4 + 16 Cx 2
Ces deux dernières équations donnent les coefficients d'asymétrie et
d'aplatissement d'une variable lognormale x en fonction de son coefficient de
variation.
Lorsque sy est faible ou au plus de l'ordre de l'unité, on peut en déduire par
développement de Taylor que Cx ~ sy. En d'autres termes, on obtient pour une
variable lognormale x la relation approchée:
(20) Cx ~ sLn(x) ,
Considérons le cas des variables hydrologiques K positives, strictement ou non
(débits Q, précipitations P, mais aussi paramètres physiques tels que
perméabilité, etc). Le dernier résultat ci-dessus montre que sLnK est un bon
indicateur adimensionnel du degré de variabilité du phénomène lorsque K est
supposée distribuée suivant une loi lognormale.
1 / 12 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !