Modélisation de la dépendance par la théorie des copules : une

publicité
18 ème Congrès Français de Mécanique
Grenoble, 27-31 août 2007
Modélisation de la dépendance par la théorie des copules :
une généralisation de la transformation de Nataf.
Anne Dutfoy & Régis Lebrun
EDF R&D
EADS Innovation Works
MRI
IW-SE-AM
1, avenue du Général De Gaulle
12, rue Pasteur BP76
92140 CLAMART Cedex
92152 SURESNES Cedex
[email protected]
Résumé :
Dans l’étude de la fiabilité d’un système, il est fréquent que les paramètres aléatoires du modèle de fiabilité
soient dépendantes. L’évaluation de la probabilité de défaillance du système nécessite alors de connaître la loi
jointe de ces paramètres, qui est souvent supposée inaccessible. La dépendance est alors décrite par une matrice
de corrélation (linéaire ou des rangs), et une procédure algorithmique fournit ensuite une estimation de cette
probabilité. Dans le cas de la méthode analytique FORM (First Order Reliability Method), cette procédure prend
le nom de transformation de Nataf, (Nataf (1962) et Liu et al. (1986)). Après une rapide présentation de la théorie
des copules, nous analysons la transformation de Nataf à la lumière de cette théorie, puis proposons une extension
de cette transformation aux copules elliptiques. L’intérêt majeur de cette analyse est de montrer les conséquences
de l’utilisation de la transformation de Nataf en terme de modélisation probabiliste.
Abstract :
When we study the reliability of a system, it is common to be faced of dependent stochastic parameters. Thus,
to compute a probability of failure, we must proceed with the full joint distribution, which is oftenly said to be
unavailable. The dependence is then described through a (rank or linear) correlation matrix, and an algorithmic
procedure leads to an evaluation of this probability. In the case of the First Order Reliability Method (FORM),
this procedure is called the Nataf transform. After a short presentation of copulas theory, we analyse the Nataf
transform in the light of this theory, then we propose an extention of this transformation to any elliptical copula.
The key point of this analysis is to show the consequences of the use of the Nataf transform in term of probabilistic
modelling.
Mots-clefs :
FORM, copule, transformation de Nataf
1 Introduction
L’évaluation de la probabilité de défaillance d’un système dont la performance est décrite
par un modèle numérique f se ramène à l’évaluation d’une intégrale multidimensionnelle :
Z
Pdef =
pX (x) dx
(1)
D
n
où X ∈ R est le vecteur aléatoire (supposé continu) décrivant les paramètres incertains du système, de densité pX , et D est le domaine de défaillance du système : D = {x ∈ Rn | : f (x) ≤ 0}.
Dans le cas où pX est inconnue, on suppose connaître les lois marginales (pXi )i=1,...,n de X,
ainsi que la matrice de corrélation (linéaire par exemple) R de X.
La méthode FORM (cf. Madsen et al. (1986)) permet d’évaluer une approximation de Pdef
à l’aide d’un nombre limité d’évaluations de la fonction f , qui est souvent complexe à évaluer.
Pour cela, elle enchaîne les étapes suivantes :
1
18 ème Congrès Français de Mécanique
Grenoble, 27-31 août 2007
1. Le vecteur aléatoire X est transformé en un vecteur aléatoire U gaussien de même dimension, mais dont les composantes sont indépendantes, centrées et réduites. Dans le cas qui
nous intéresse, cette transformation T est la transformation de Nataf. On a alors :
Z
Pdef =
ϕn (u) du
(2)
D
où u = T (x), ϕn (u) = 1/(2π)n/2 exp(−kuk2 /2) = ψ(kuk) et D = T (D).
2. Le domaine D est remplacé par un demi-espace Π par linéarisation de la frontière de D
au voisinage du point de conception u∗ qui réalise le maximum de ϕn sur D (on suppose
que 0 ∈
/ D) : u∗ = argmaxD ϕn (u).
3. La probabilité de défaillance est approchée par :
Z
F ORM
Pdef
=
ϕn (u) du = Φ(−β)
(3)
Π
où Φ est la fonction de répartition de la loi normal centrée réduite monodimensionnelle et
β = kuk.
Après une rapide présentation de la théorie des copules, nous analysons la transformation de
Nataf à l’aide de cette théorie, puis nous proposons une extension de cette transformation aux
copules elliptiques.
2 Théorie des copule
On commence par définir la notion de copule, puis on énonce le théorème central de la
théorie des copules. On donne ensuite la définition des lois et des copules elliptiques.
2.1
Généralités sur les copules
La notion de copule permet de décomposer la loi jointe d’un vecteur aléatoire de dimension
n en n fonctions décrivant les lois marginales seules et une fonction décrivant la dépendance
entre les composantes de ce vecteur indépendamment des lois marginales, la copule du vecteur.
Plus précisément, nous avons :
Définition 1. On appelle copule C de dimension n une fonction de répartition n dimensionnelle
définie sur [0, 1]n et dont les lois marginales sont uniformes sur [0, 1] :
1. Pour tout u ∈ [0, 1]n ayant au moins une composante nulle, C(u) = 0 ;
P
P
2. C est n-croissante : 2i1 =1 · · · 2in =1 (−1)i1 +···+in C(u1i1 , . . . , unin ) ≥ 0 avec uj1 = aj et
uj2 = bj pour tout j ∈ {1, . . . , n} et a, b ∈ [0, 1]n , a ≤ b.
3. Pour tout u ∈ [0, 1]n ayant toutes ses composantes égales à 1 sauf éventuellement uk ,
C(u) = uk .
Le théorème suivant (voir Nelsen (1999) pour une démonstration) justifie l’intérêt de la
notion de copule :
Théorème 1 (Sklar (1959)). Soit F une fonction de répartition n-dimensionnelle dont les lois
n
marginales sont F1 , . . . , Fn . Il existe une copule C de dimension n telle que pour x ∈ R on
ait :
F (x1 , . . . , xn ) = C(F1 (x1 ), . . . , Fn (xn )).
(4)
2
18 ème Congrès Français de Mécanique
Grenoble, 27-31 août 2007
Si les lois marginales F1 , . . . , Fn sont continues, la copule C est unique, sinon elle est déterminée de manière unique sur Im(F1 ) × · · · × Im(Fn ).
Dans le cas de lois marginales continues, pour tout U ∈ [0, 1]n on a :
C(u) = F (F1−1 (u1 ), . . . , Fn−1 (un ))
et
p(x) = c(F1 (x1 ), . . . , Fn (xn ))
n
Y
pi (xi )
(5)
(6)
i=1
où c est la densité associée à C et les pi , les densités marginales de F .
On montre (voir Nelsen (1999)) qu’une transformation monotone des composantes d’un
vecteur aléatoire ne modifie pas sa copule.
La relation (4) permet de construire une loi jointe à partir de lois marginales et d’une copule,
alors que la relation (5) permet de construire des copules à partir de lois jointes. On construit
ainsi les copules elliptiques à partir des lois elliptiques. Pour une présentation détaillée des
copules, voir Nelsen (1999).
2.2
Lois et copules elliptiques
Définition 2. Une loi continue est dite elliptique de paramètre de position µ et de matrice de
forme symétrique définie positive Σ si sa densité p peut s’écrire :
p(x) = (det Σ)−1/2 q (x − µ)t Σ−1 (x − µ)
(7)
R
où q est une fonction scalaire à valeur positive telle que Rn q(kyk2 ) dy = 1. On note E(µ, Σ, q)
une telle loi.
La loi est dite sphérique si Σ = k Idn avec k > 0.
Les lois elliptiques associées à la même fonction q font parties de la même famille elliptique,
dans laquelle on distingue le représentant standard pour lequel µ = 0 et Σ = Idn et les éléments
centrés réduits pour lesquels µ = 0 et diag Σ = Idn , la matrice Σ étant alors la matrice
de corrélation linéaire de la loi si elle admet des seconds moments finis (ce qui dépend de
la décroissance à l’infini de q). La loi d’un vecteur gaussien est un exemple de loi elliptique,
d’autres exemples classiques sont donnés dans Fang et al. (1990). Les lois elliptiques jouissent
des mêmes propriétés algébriques que les vecteurs gaussiens, à savoir qu’elles forment une
classe stable par transformation affine : si X suit la loi E(µ, Σ, q), alors le vecteur Y = V +
M X suit la loi E(V + M µ, M ΣM t ). Pour une présentation détaillée des lois elliptiques,
voir Fang et al. (1990).
On peu maintenant définir les copules elliptiques :
Définition 3. Une copule est dite elliptique si elle est la copule d’une loi elliptique.
Exemples 1.
– La copule gaussienne n-dimensionnelle a pour expression :
Z Φ−1 (x1 ) Z Φ−1 (xn )
Gauss
CR (x) =
...
(det R)−1/2 (2π)−n/2 exp(−xt R−1 x/2) dxn . . . dx1
−∞
où Φ : x ∈ R 7→ Φ(x) =
−∞
√
2
2π dx
exp(−t
/2)/
−∞
Rx
3
18 ème Congrès Français de Mécanique
Grenoble, 27-31 août 2007
– La copule de Student n-dimensionnelle a pour expression :
−(n+ν)/2
Z t−1
Z t−1
ν (xn )
ν (x1 )
xt R−1 x
−1/2
Student
dxn . . . dx1
(det R)
Kn,ν 1 +
...
CR
(x) =
ν
−∞
−∞
Rx
Γ( n+ν
)
−(1+ν)/2
2
2
où Kn,ν = Γ(ν/2)(νπ)
dt
n/2 et tν : x ∈ R 7→ tν (x) = −∞ K1,ν (1 + t /ν)
On peut montrer (Embrechts et al. (2003)) qu’il y a une bijection entre les copules elliptiques et les éléments centrés réduits des familles elliptiques, une copule elliptique est donc
paramétrée par la matrice de corrélation linéaire du représentant centré réduit qui lui est associé.
Attention, cette matrice n’est pas la matrice de corrélation linéaire de la copule : la modification
des lois marginales modifie la matrice de corrélation linéaire !
3 Transformation de Nataf et copules elliptiques
Les résultats de la section précédente permettent d’apporter un nouvel éclairage sur la transformation de Nataf, et d’en proposer une extension naturelle. Un exemple analytique permet de
confirmer l’intérêt d’une telle extension.
3.1
Lien entre transformation de Nataf et copule gaussienne
La transformation de Nataf procède en deux étapes :
– On applique une transformation des lois marginales de X pour que le vecteur Y résultant
soit un vecteur gaussien à composantes centrées et réduites :
Yi = Φ−1 (FXi (Xi ))
∀i = 1, . . . , n,
(8)
où Φ est la fonction de répartition de la loi gaussienne monodimensionnelle centrée réduite. Ce vecteur gaussien a une matrice de corrélation R obtenue à partir de la matrice
de corrélation RX selon une transformation qui dépend de la nature de RX (corrélation
des rangs, corrélation linéaire).
– On applique une transformation linéaire à Y afin de décorréler ses composantes, ce qui
revient à les rendre indépendantes puisque Y est gaussien. On obtient ainsi le vecteur U :
U = ΓY où Γ−t Γ−1 = R
(9)
En terme de copule, puisque la première étape de la transformation de Nataf est une transformation monotone des composantes de X, les vecteurs X et Y ont la même copule, à savoir
la copule gaussienne de matrice de corrélation R. Lorsqu’on affirme ne pas connaître la loi
jointe de X, en utilisant la transformation de Nataf, on choisit implicitement une copule gaussienne pour X : on fait donc un choix implicite de loi jointe pour X, que cette analyse de la
transformation de Nataf a rendu explicite. Ceci a des conséquences qui peuvent être très importantes sur l’évaluation d’une probabilité de défaillance. Par exemple, si la probabilité cherchée
est faible, il est probable que dans le domaine de défaillance, plusieurs composantes du vecteur X prennent des valeurs associées à des quantiles élevés, or le comportement joint de deux
composantes d’un vecteur aléatoire de copule elliptique de matrice de corrélation donnée peut
être très variable selon la famille de copule elliptique considéré, c’est-à dire selon la fonction
q choisie. Ainsi, le coefficient de dépendance de queue (cf. Embrechts et al. (2003)) est nul
pour une copule gaussienne, alors qu’il est non nul pour une copule de Student de paramètre
ν < 2, ce qui peut modifier l’évaluation d’une probabilité de défaillance de plusieurs ordres de
grandeur. Il est donc souhaitable d’étendre la transformation à d’autres copules que la copule
gaussienne.
4
18 ème Congrès Français de Mécanique
3.2
Grenoble, 27-31 août 2007
Extension de la transformation de Nataf à une loi de compule elliptique quelconque
L’intérêt de la transformation de Nataf est de transformer l’expression (1) de la probabilité
de défaillance en l’expression (2), où la loi de u est sphérique, ce qui simplifie considérablement
la recherche du point de conception qui devient une recherche de point le plus proche. Le fait
que cette loi sphérique soit la loi gaussienne centrée réduite n’intervient que dans la formule
(3) permettant de calculer l’approximation FORM de la probabilité de défaillance. Plutôt que
de définir la transformation de Nataf généralisée en décrivant la loi du vecteur résultant de la
première étape de transformation des marginales, on part directement d’un vecteur X de copule
E
elliptique Cq,R
et de lois marginales FX1 , . . . , FXn données :
E
Définition 4. Soit X un vecteur aléatoire de copule elliptique Cq,R
et de lois marginales
FX1 , . . . , FXn . On définit la transformation de Nataf généralisée T par :
T : Rn → Rn

E −1 (FX1 (X1 ))
..

X →
7
U = Γ
.
E −1 (FX1 (X1 ))

(10)
où E est la fonction de répartition marginale du représentant standard de la famille elliptique
E
associée à Cq,R
et Γ a la même définition que pour la transformation de Nataf classique.
L’utilisation de cette tranformation généralisée pour un calcul FORM se fait de façon identique à la transformation classique, en remplaçant l’estimation de la probabilité de défaillance
Φ(−β) par E(−β). Dans le cas de la copule gaussienne, E = P hi, et dans le cas de la copule
de Student, E = tν .
On peut illustrer l’intérêt de cette extension sur un problème simple : considérons un vecteur
aléatoire de lois marginales gaussiennes centrées réduites, ayant un coefficient de corrélation de
Kendall
de τ = 1/2. On considère le domaine de défaillance D = {(x1 , x2 ) ∈ R2 | x1 + x2 ≥
√
δ 2}, et on trace en fonction de δ l’évolution de la probabilité de défaillance calculée par la
méthode FORM en utilisant la transformation de Nataf généralisée et en prenant pour X soit la
copule gaussienne, soit la copule de Student (avec ν = 3). On obtient la figure 1.
Sur cet exemple, on constate l’intérêt de pouvoir explorer d’autres structures de dépendance
que la structure gaussienne pour ce type de calcul : alors que pour les niveaux de probabilité
élevés, le choix de la structure de dépendance a une influence très faible, pour les faibles niveaux
de probabilité de défaillance, le choix de la copule conduit à une variation de plus d’un ordre
de grandeur de la probabilité de défaillance bien que les lois marginales de X soient identiques
dans les deux cas, ainsi que la corrélation de Kendall. On constate également qu’un scalaire
comme τ est loin de pouvoir synthétiser seul la dépendance entre les composantes de X.
4 Conclusions
Nous avons montré que les concepts de copule et de loi elliptique permettent à la fois d’apporter un éclairage plus profond de la transformation de Nataf et d’en proposer une généralisation naturelle. Cette généralisation permet d’explorer l’influence de la structure de dépendance
dans le calcul d’une probabilité de défaillance par la méthode FORM, qui est également généralisée pour prendre en compte la nouvelle formulation de la transformation isoprobabiliste.
Le concept de copule est au cœur du logiciel OpenTURNS (www.openturns.org), un logiciel
Open Source dédié à la propagation probabiliste d’incertitudes dans les modèles numériques
réalisé en partenariat par EDF R&D, EADS Innovation Works et PhiMECA. La transformation
de Nataf généralisée ainsi que la méthode FORM généralisée sont disponibles dans ce logiciel.
5
18 ème Congrès Français de Mécanique
Grenoble, 27-31 août 2007
F ORM avec δ, dans le cas d’une copule gaussienne
F IG . 1 – Évolution de la probabilité de défaillance Pdef
et d’une copule de Student avec ν = 3.
Références
Embrechts, P., Lindskog, F., McNeil, A. 2003 Modelling Dependence with Copulas and Applications to Risk Management. In Handbook of Heavy Tailed Distributions in Finance (ed. S.
Rachev) Chapter 8, pp. 329-384, Elsevier.
Fang, K-T., Kotz, S., Ng, K. W. 1990 Symmetric Multivariate and Related Distributions. Monographs on statistics and applied probability (ed. D. R. Cox, D. V. Hinkley, D. Rubin and B.
W. Silverman) Chapman and Hall, London, New York.
Liu, P-L., Der Kiureghian, A. 1986 Multivariate distribution models with prescribed marginals
and covariances. Probabilistic Engineering Mechanics 1(2) 105-112
Madsen, H. O., Krenk, S., Lind, N. C. 1986 Methods of Structural Safety. Prentice Hall.
Nataf, A. 1962 Détermination des distributions de probabilités dont les marges sont données.
Comptes Rendus de l’Académie des Sciences 225 42-43.
Nelsen, R. B. 1999 An intruduction to copulas. Lecture Notes in Statistics 139, Springer.
6
Téléchargement