18 ème Congrès Français de Mécanique Grenoble, 27-31 août 2007 Modélisation de la dépendance par la théorie des copules : une généralisation de la transformation de Nataf. Anne Dutfoy & Régis Lebrun EDF R&D EADS Innovation Works MRI IW-SE-AM 1, avenue du Général De Gaulle 12, rue Pasteur BP76 92140 CLAMART Cedex 92152 SURESNES Cedex [email protected] Résumé : Dans l’étude de la fiabilité d’un système, il est fréquent que les paramètres aléatoires du modèle de fiabilité soient dépendantes. L’évaluation de la probabilité de défaillance du système nécessite alors de connaître la loi jointe de ces paramètres, qui est souvent supposée inaccessible. La dépendance est alors décrite par une matrice de corrélation (linéaire ou des rangs), et une procédure algorithmique fournit ensuite une estimation de cette probabilité. Dans le cas de la méthode analytique FORM (First Order Reliability Method), cette procédure prend le nom de transformation de Nataf, (Nataf (1962) et Liu et al. (1986)). Après une rapide présentation de la théorie des copules, nous analysons la transformation de Nataf à la lumière de cette théorie, puis proposons une extension de cette transformation aux copules elliptiques. L’intérêt majeur de cette analyse est de montrer les conséquences de l’utilisation de la transformation de Nataf en terme de modélisation probabiliste. Abstract : When we study the reliability of a system, it is common to be faced of dependent stochastic parameters. Thus, to compute a probability of failure, we must proceed with the full joint distribution, which is oftenly said to be unavailable. The dependence is then described through a (rank or linear) correlation matrix, and an algorithmic procedure leads to an evaluation of this probability. In the case of the First Order Reliability Method (FORM), this procedure is called the Nataf transform. After a short presentation of copulas theory, we analyse the Nataf transform in the light of this theory, then we propose an extention of this transformation to any elliptical copula. The key point of this analysis is to show the consequences of the use of the Nataf transform in term of probabilistic modelling. Mots-clefs : FORM, copule, transformation de Nataf 1 Introduction L’évaluation de la probabilité de défaillance d’un système dont la performance est décrite par un modèle numérique f se ramène à l’évaluation d’une intégrale multidimensionnelle : Z Pdef = pX (x) dx (1) D n où X ∈ R est le vecteur aléatoire (supposé continu) décrivant les paramètres incertains du système, de densité pX , et D est le domaine de défaillance du système : D = {x ∈ Rn | : f (x) ≤ 0}. Dans le cas où pX est inconnue, on suppose connaître les lois marginales (pXi )i=1,...,n de X, ainsi que la matrice de corrélation (linéaire par exemple) R de X. La méthode FORM (cf. Madsen et al. (1986)) permet d’évaluer une approximation de Pdef à l’aide d’un nombre limité d’évaluations de la fonction f , qui est souvent complexe à évaluer. Pour cela, elle enchaîne les étapes suivantes : 1 18 ème Congrès Français de Mécanique Grenoble, 27-31 août 2007 1. Le vecteur aléatoire X est transformé en un vecteur aléatoire U gaussien de même dimension, mais dont les composantes sont indépendantes, centrées et réduites. Dans le cas qui nous intéresse, cette transformation T est la transformation de Nataf. On a alors : Z Pdef = ϕn (u) du (2) D où u = T (x), ϕn (u) = 1/(2π)n/2 exp(−kuk2 /2) = ψ(kuk) et D = T (D). 2. Le domaine D est remplacé par un demi-espace Π par linéarisation de la frontière de D au voisinage du point de conception u∗ qui réalise le maximum de ϕn sur D (on suppose que 0 ∈ / D) : u∗ = argmaxD ϕn (u). 3. La probabilité de défaillance est approchée par : Z F ORM Pdef = ϕn (u) du = Φ(−β) (3) Π où Φ est la fonction de répartition de la loi normal centrée réduite monodimensionnelle et β = kuk. Après une rapide présentation de la théorie des copules, nous analysons la transformation de Nataf à l’aide de cette théorie, puis nous proposons une extension de cette transformation aux copules elliptiques. 2 Théorie des copule On commence par définir la notion de copule, puis on énonce le théorème central de la théorie des copules. On donne ensuite la définition des lois et des copules elliptiques. 2.1 Généralités sur les copules La notion de copule permet de décomposer la loi jointe d’un vecteur aléatoire de dimension n en n fonctions décrivant les lois marginales seules et une fonction décrivant la dépendance entre les composantes de ce vecteur indépendamment des lois marginales, la copule du vecteur. Plus précisément, nous avons : Définition 1. On appelle copule C de dimension n une fonction de répartition n dimensionnelle définie sur [0, 1]n et dont les lois marginales sont uniformes sur [0, 1] : 1. Pour tout u ∈ [0, 1]n ayant au moins une composante nulle, C(u) = 0 ; P P 2. C est n-croissante : 2i1 =1 · · · 2in =1 (−1)i1 +···+in C(u1i1 , . . . , unin ) ≥ 0 avec uj1 = aj et uj2 = bj pour tout j ∈ {1, . . . , n} et a, b ∈ [0, 1]n , a ≤ b. 3. Pour tout u ∈ [0, 1]n ayant toutes ses composantes égales à 1 sauf éventuellement uk , C(u) = uk . Le théorème suivant (voir Nelsen (1999) pour une démonstration) justifie l’intérêt de la notion de copule : Théorème 1 (Sklar (1959)). Soit F une fonction de répartition n-dimensionnelle dont les lois n marginales sont F1 , . . . , Fn . Il existe une copule C de dimension n telle que pour x ∈ R on ait : F (x1 , . . . , xn ) = C(F1 (x1 ), . . . , Fn (xn )). (4) 2 18 ème Congrès Français de Mécanique Grenoble, 27-31 août 2007 Si les lois marginales F1 , . . . , Fn sont continues, la copule C est unique, sinon elle est déterminée de manière unique sur Im(F1 ) × · · · × Im(Fn ). Dans le cas de lois marginales continues, pour tout U ∈ [0, 1]n on a : C(u) = F (F1−1 (u1 ), . . . , Fn−1 (un )) et p(x) = c(F1 (x1 ), . . . , Fn (xn )) n Y pi (xi ) (5) (6) i=1 où c est la densité associée à C et les pi , les densités marginales de F . On montre (voir Nelsen (1999)) qu’une transformation monotone des composantes d’un vecteur aléatoire ne modifie pas sa copule. La relation (4) permet de construire une loi jointe à partir de lois marginales et d’une copule, alors que la relation (5) permet de construire des copules à partir de lois jointes. On construit ainsi les copules elliptiques à partir des lois elliptiques. Pour une présentation détaillée des copules, voir Nelsen (1999). 2.2 Lois et copules elliptiques Définition 2. Une loi continue est dite elliptique de paramètre de position µ et de matrice de forme symétrique définie positive Σ si sa densité p peut s’écrire : p(x) = (det Σ)−1/2 q (x − µ)t Σ−1 (x − µ) (7) R où q est une fonction scalaire à valeur positive telle que Rn q(kyk2 ) dy = 1. On note E(µ, Σ, q) une telle loi. La loi est dite sphérique si Σ = k Idn avec k > 0. Les lois elliptiques associées à la même fonction q font parties de la même famille elliptique, dans laquelle on distingue le représentant standard pour lequel µ = 0 et Σ = Idn et les éléments centrés réduits pour lesquels µ = 0 et diag Σ = Idn , la matrice Σ étant alors la matrice de corrélation linéaire de la loi si elle admet des seconds moments finis (ce qui dépend de la décroissance à l’infini de q). La loi d’un vecteur gaussien est un exemple de loi elliptique, d’autres exemples classiques sont donnés dans Fang et al. (1990). Les lois elliptiques jouissent des mêmes propriétés algébriques que les vecteurs gaussiens, à savoir qu’elles forment une classe stable par transformation affine : si X suit la loi E(µ, Σ, q), alors le vecteur Y = V + M X suit la loi E(V + M µ, M ΣM t ). Pour une présentation détaillée des lois elliptiques, voir Fang et al. (1990). On peu maintenant définir les copules elliptiques : Définition 3. Une copule est dite elliptique si elle est la copule d’une loi elliptique. Exemples 1. – La copule gaussienne n-dimensionnelle a pour expression : Z Φ−1 (x1 ) Z Φ−1 (xn ) Gauss CR (x) = ... (det R)−1/2 (2π)−n/2 exp(−xt R−1 x/2) dxn . . . dx1 −∞ où Φ : x ∈ R 7→ Φ(x) = −∞ √ 2 2π dx exp(−t /2)/ −∞ Rx 3 18 ème Congrès Français de Mécanique Grenoble, 27-31 août 2007 – La copule de Student n-dimensionnelle a pour expression : −(n+ν)/2 Z t−1 Z t−1 ν (xn ) ν (x1 ) xt R−1 x −1/2 Student dxn . . . dx1 (det R) Kn,ν 1 + ... CR (x) = ν −∞ −∞ Rx Γ( n+ν ) −(1+ν)/2 2 2 où Kn,ν = Γ(ν/2)(νπ) dt n/2 et tν : x ∈ R 7→ tν (x) = −∞ K1,ν (1 + t /ν) On peut montrer (Embrechts et al. (2003)) qu’il y a une bijection entre les copules elliptiques et les éléments centrés réduits des familles elliptiques, une copule elliptique est donc paramétrée par la matrice de corrélation linéaire du représentant centré réduit qui lui est associé. Attention, cette matrice n’est pas la matrice de corrélation linéaire de la copule : la modification des lois marginales modifie la matrice de corrélation linéaire ! 3 Transformation de Nataf et copules elliptiques Les résultats de la section précédente permettent d’apporter un nouvel éclairage sur la transformation de Nataf, et d’en proposer une extension naturelle. Un exemple analytique permet de confirmer l’intérêt d’une telle extension. 3.1 Lien entre transformation de Nataf et copule gaussienne La transformation de Nataf procède en deux étapes : – On applique une transformation des lois marginales de X pour que le vecteur Y résultant soit un vecteur gaussien à composantes centrées et réduites : Yi = Φ−1 (FXi (Xi )) ∀i = 1, . . . , n, (8) où Φ est la fonction de répartition de la loi gaussienne monodimensionnelle centrée réduite. Ce vecteur gaussien a une matrice de corrélation R obtenue à partir de la matrice de corrélation RX selon une transformation qui dépend de la nature de RX (corrélation des rangs, corrélation linéaire). – On applique une transformation linéaire à Y afin de décorréler ses composantes, ce qui revient à les rendre indépendantes puisque Y est gaussien. On obtient ainsi le vecteur U : U = ΓY où Γ−t Γ−1 = R (9) En terme de copule, puisque la première étape de la transformation de Nataf est une transformation monotone des composantes de X, les vecteurs X et Y ont la même copule, à savoir la copule gaussienne de matrice de corrélation R. Lorsqu’on affirme ne pas connaître la loi jointe de X, en utilisant la transformation de Nataf, on choisit implicitement une copule gaussienne pour X : on fait donc un choix implicite de loi jointe pour X, que cette analyse de la transformation de Nataf a rendu explicite. Ceci a des conséquences qui peuvent être très importantes sur l’évaluation d’une probabilité de défaillance. Par exemple, si la probabilité cherchée est faible, il est probable que dans le domaine de défaillance, plusieurs composantes du vecteur X prennent des valeurs associées à des quantiles élevés, or le comportement joint de deux composantes d’un vecteur aléatoire de copule elliptique de matrice de corrélation donnée peut être très variable selon la famille de copule elliptique considéré, c’est-à dire selon la fonction q choisie. Ainsi, le coefficient de dépendance de queue (cf. Embrechts et al. (2003)) est nul pour une copule gaussienne, alors qu’il est non nul pour une copule de Student de paramètre ν < 2, ce qui peut modifier l’évaluation d’une probabilité de défaillance de plusieurs ordres de grandeur. Il est donc souhaitable d’étendre la transformation à d’autres copules que la copule gaussienne. 4 18 ème Congrès Français de Mécanique 3.2 Grenoble, 27-31 août 2007 Extension de la transformation de Nataf à une loi de compule elliptique quelconque L’intérêt de la transformation de Nataf est de transformer l’expression (1) de la probabilité de défaillance en l’expression (2), où la loi de u est sphérique, ce qui simplifie considérablement la recherche du point de conception qui devient une recherche de point le plus proche. Le fait que cette loi sphérique soit la loi gaussienne centrée réduite n’intervient que dans la formule (3) permettant de calculer l’approximation FORM de la probabilité de défaillance. Plutôt que de définir la transformation de Nataf généralisée en décrivant la loi du vecteur résultant de la première étape de transformation des marginales, on part directement d’un vecteur X de copule E elliptique Cq,R et de lois marginales FX1 , . . . , FXn données : E Définition 4. Soit X un vecteur aléatoire de copule elliptique Cq,R et de lois marginales FX1 , . . . , FXn . On définit la transformation de Nataf généralisée T par : T : Rn → Rn E −1 (FX1 (X1 )) .. X → 7 U = Γ . E −1 (FX1 (X1 )) (10) où E est la fonction de répartition marginale du représentant standard de la famille elliptique E associée à Cq,R et Γ a la même définition que pour la transformation de Nataf classique. L’utilisation de cette tranformation généralisée pour un calcul FORM se fait de façon identique à la transformation classique, en remplaçant l’estimation de la probabilité de défaillance Φ(−β) par E(−β). Dans le cas de la copule gaussienne, E = P hi, et dans le cas de la copule de Student, E = tν . On peut illustrer l’intérêt de cette extension sur un problème simple : considérons un vecteur aléatoire de lois marginales gaussiennes centrées réduites, ayant un coefficient de corrélation de Kendall de τ = 1/2. On considère le domaine de défaillance D = {(x1 , x2 ) ∈ R2 | x1 + x2 ≥ √ δ 2}, et on trace en fonction de δ l’évolution de la probabilité de défaillance calculée par la méthode FORM en utilisant la transformation de Nataf généralisée et en prenant pour X soit la copule gaussienne, soit la copule de Student (avec ν = 3). On obtient la figure 1. Sur cet exemple, on constate l’intérêt de pouvoir explorer d’autres structures de dépendance que la structure gaussienne pour ce type de calcul : alors que pour les niveaux de probabilité élevés, le choix de la structure de dépendance a une influence très faible, pour les faibles niveaux de probabilité de défaillance, le choix de la copule conduit à une variation de plus d’un ordre de grandeur de la probabilité de défaillance bien que les lois marginales de X soient identiques dans les deux cas, ainsi que la corrélation de Kendall. On constate également qu’un scalaire comme τ est loin de pouvoir synthétiser seul la dépendance entre les composantes de X. 4 Conclusions Nous avons montré que les concepts de copule et de loi elliptique permettent à la fois d’apporter un éclairage plus profond de la transformation de Nataf et d’en proposer une généralisation naturelle. Cette généralisation permet d’explorer l’influence de la structure de dépendance dans le calcul d’une probabilité de défaillance par la méthode FORM, qui est également généralisée pour prendre en compte la nouvelle formulation de la transformation isoprobabiliste. Le concept de copule est au cœur du logiciel OpenTURNS (www.openturns.org), un logiciel Open Source dédié à la propagation probabiliste d’incertitudes dans les modèles numériques réalisé en partenariat par EDF R&D, EADS Innovation Works et PhiMECA. La transformation de Nataf généralisée ainsi que la méthode FORM généralisée sont disponibles dans ce logiciel. 5 18 ème Congrès Français de Mécanique Grenoble, 27-31 août 2007 F ORM avec δ, dans le cas d’une copule gaussienne F IG . 1 – Évolution de la probabilité de défaillance Pdef et d’une copule de Student avec ν = 3. Références Embrechts, P., Lindskog, F., McNeil, A. 2003 Modelling Dependence with Copulas and Applications to Risk Management. In Handbook of Heavy Tailed Distributions in Finance (ed. S. Rachev) Chapter 8, pp. 329-384, Elsevier. Fang, K-T., Kotz, S., Ng, K. W. 1990 Symmetric Multivariate and Related Distributions. Monographs on statistics and applied probability (ed. D. R. Cox, D. V. Hinkley, D. Rubin and B. W. Silverman) Chapman and Hall, London, New York. Liu, P-L., Der Kiureghian, A. 1986 Multivariate distribution models with prescribed marginals and covariances. Probabilistic Engineering Mechanics 1(2) 105-112 Madsen, H. O., Krenk, S., Lind, N. C. 1986 Methods of Structural Safety. Prentice Hall. Nataf, A. 1962 Détermination des distributions de probabilités dont les marges sont données. Comptes Rendus de l’Académie des Sciences 225 42-43. Nelsen, R. B. 1999 An intruduction to copulas. Lecture Notes in Statistics 139, Springer. 6