1/28 Estimation de probabilité d’événement rare sous contraintes de monotonie Journée MAS 27-29.08.2014 Vincent Moutoussamy Nicolas Bousquet, Bertrand Iooss - EDF R&D - MRI Fabrice Gamboa, Thierry Klein - Université Toulouse Paul Sabatier Contexte 2/28 ➧ Fournir des indicateurs de fiabilité d’un composant par des méthodes statistiques ➧ on dispose de peu d’observations, cette étude de fiabilité passe par un modèle numérique simulant le comportement physique du composant ➧ ce code permet d’obtenir une grandeurs physique représentant la fiabilité du composant étudié ➧ on considère qu’il y a évévenement indésirable lorsque la sortie du code dépasse un seuil fixé ➧ de plus ce code est - coûteux en temps de calcul - déterministe - de type boîte noire - présence possible d’effets-falaises Notations ➧ On note - X = (X1 , . . . , Xd ) le vecteur aléatoire d’entrée - g le code numérique ➧ Sans perte de généralité - X ∼ Nd (0, Id ) - G (X) = g (X) − seuil - on veut estimer Pf = P(G (X) ≤ 0) 3/28 Quelques méthodes classiques 4/28 ➧ Méthode de Monte Carlo, on estime Pf par n X 1{G (Xi )≤0} où (Xi )i ≥1 est une suite de variables p̂n = n1 i =1 aléatoires indépendantes de même loi que X ➧ facile à estimer et aucune hypothèse sur le code n’est nécessaire ➧ mais pour obtenir un coefficient de variation de 10% lorsque Pf = 10−k il faut environ 10k+2 appels au code numérique ➧ si un appel au code dure une seconde, il faut pour - k = 3 attendre 1 jour - k = 4 attendre 11 jours - k = 5 attendre 4 mois - k = 6 attendre 3 ans Quelques méthodes classiques 5/28 ➧ Méthode de simulation préférentielle (ou tirage d’importance), n 1 X fX (Vi ) 1{G (Vi )≤0} où (Vi )i ≥1 est on estime Pf par p̃n = n f˜(Vi ) i =1 une suite de variables aléatoires indépendantes ayant pour fonction de densité f˜ ➧ f˜ doit être facile à calculer et Vi facile à simuler ➧ obtenir f˜ qui minimise la variance de p̃n revient à connaître Pf Quelques méthodes classiques 6/28 ➧ Méthode de Subset Simulation, consiste à décomposer l’ensemble U− = {x : G (x) ≤ 0} en plusieurs ensembles A0 = IR d ⊃ A1 ⊃ · · · ⊃ Ak−1 ⊃ Ak = U− et k Y Pf = P(X ∈ Ai |X ∈ Ai −1) i =1 ➧ on estime Carlo P(X ∈ Ai |X ∈ Ai −1) par une méthode de Monte ➧ Si Pf = 10−k et P(X ∈ Ai |X ∈ Ai −1 ) = 10−1 , avoir un coefficient de variation de 10% sur chacune des quantités nécessitera 103 appels au code numérique ➧ si un appel au code dure une seconde, il faut pour k = 7 attendre 2 heures Quelques méthodes classiques 7/28 ➧ Méthode FORM est une méthode "ingénieure" ➧ consiste à approcher l’état limite Γ = {x : G (x) = 0} par une surface linéaire ➧ Deux étapes 1) trouver le point x∗ le plus proche de l’origine appartenant àΓ 2) estimer Pf par Φ(−kx∗ k) ➧ nécessite peu d’appels au code, facile à coder ➧ il faut que le code soit régulier et l’approximation dépend fortement de la forme de Γ ➧ aucun contrôle sur l’estimation (pas d’intervalle de confiance) ➧ peut être couplé au tirage d’importance en prenant V ∼ Nd (x∗ , Id ) Quelques méthodes classiques 8/28 0 1 0 x∗ Apport de la monotonie 9/28 ➧ Connaissance partielle du phénomène étudié : hypothèse de monotonie ➧ permet d’encadrer les probabilités de façon sûre à 100% ➧ obtenir une délimitation fine de l’espace des entrées menant à l’événement indésirable ➧ on considère maintenant que G renvoi une valeur binaire −1\ + 1 Principe général 1/5 10/28 {1}d {G (x) > 0} {G (x) = 0} {G (x) < 0} {0}d Principe général 2/5 11/28 {1}d {G (x) > 0} {G (x) = 0} x1 {G (x) < 0} {0}d Principe général 3/5 12/28 {1}d {G (x) > 0} {G (x) = 0} x2 x1 {G (x) < 0} {0}d Principe général 4/5 13/28 {1}d {G (x) > 0} {G (x) = 0} x2 x3 x1 {G (x) < 0} {0}d Principe général 5/5 14/28 {1}d {G (x) > 0} x8 {G (x) = 0} x4 x2 x7 x5 x3 x1 {G (x) < 0} {0}d x6 Première approche: tirage uniforme 15/28 ➧ A l’étape n, on simule xn uniformément dans l’espace non dominé [Bousquet, 2012] ! − Pf − pn−1 ξxn = 1{G (xn )≤0} ∼ Ber + − pn−1 − pn−1 ➧ l’estimateur du maximum de vraisemblance conditionnel p̂nu maximise !ξx !1−ξx n − + k k Y p − pk−1 pk−1 −p Ln (p) = + − + − pk−1 − pk−1 pk−1 − pk−1 k=1 et l’information de Fisher associée est égale à n h X + −1 i − Jn (Pf ) = E pk−1 − p Pf − pk−1 k=1 sous certaines conditions théoriques: 1/2 Jn (Pf )(p̂nu − Pf ) L −→ n→+∞ N (0, 1) Tirage d’importance séquentiel 16/28 ➧ On propose de revenir dans l’espace gaussien: X ∼ Nd (0, Id ) U = IR d et ➧ à l’étape i, on pose Vi ∼ Nd (xi , Id ) de fonction de densité f˜i −1 et xi ∈ Ui −1 n 1 X fX (Vi ) ξ ➧ on estime Pf par p̂n,1 = ˜i −1 (Vi ) Vi n f i =1 ➧ on a L (p̂n,1 −Pf ) √ −→ vn,1 n→+∞ n X vn,1 = 1 n2 Var i =1 N (0, 1) avec ! fX (Vi ) ξVi f˜i −1 (Vi ) Tirage d’importance séquentiel / Ui −1 alors ξVi ➧ Mais à l’étape i, P(Vi ∈ / Ui −1 ) > 0. Si Vi ∈ est connu sans faire d’appel au code numérique ➧ On pose T0 = 0 et pour tout (k−1) ∈ UTk−1 } k ≥ 1, Tk = inf {j ≥ 1 : Vj ➧ pour un budget de n appels au code, on a donc fait n X Nn = Tk simulations. k=1 ➧ on propose d’estimer Pf par (k−1) n Tk ) fX (Vj 1 XX ξV(k−1) p̂n,2 = (k−1) Nn ˜k−1 (V j ) f k=1 j=1 j 17/28 Résultats numériques ➧ Un exemple test en dimension d . Soit X = (X1 . . . , Xd ) avec Xi ∼ Γ(i + 1, 1) ➧ on note Zd = X1 d X ∼ Beta(2, (d + 1)(d + 2)/2 − 3) Xi i =1 ➧ G (X) = Zd − qd,Pf où qd,p est le quantile d’ordre p de Z ➧ on cherche à estimer Pf = P(G (X) ≤ 0) 18/28 19/28 0.004 0.003 IS 0.002 0.001 0.000 0.001 0.000 MLE 0.002 0.003 0.004 Méthode d’estimation de probabilité - d = 3 ; Pf = 10−3 0 50 100 d = 3 ; p = 0.001 150 0 50 100 d = 3 ; p = 0.001 150 Encadrement de quantiles 20/28 ➧ Etude connexe à l’estimation de probabilité d’événement indésirable ➧ pour une valeur de Pf fixée on cherche à estimer le seuil qPf définissant une enveloppe de sécurité ➧ comme pour l’estimation de probabilité on peut obtenir deux bornes sûres à 100% pour qPf ➧ travaux en cours: méthode géométrique 21/28 {1}d {0}d 22/28 {1}d {0}d 23/28 {1}d 11 00 00 11 11 00 00 11 00 11 11 00 00 11 1 0 0 1 1 0 0 1 0 1 {0}d 24/28 {1}d 1 0 0 1 0 1 00 11 00 11 ∂Γ− (p + ε+ ) 11 00 00 11 00 11 11 00 00 11 00 11 {0}d 25/28 {1}d 1 0 0 1 0 1 11 00 00 11 00 11 00 11 ∂Γ− (p + ε+ ) 11 00 00 11 11 00 00 11 00 11 11 00 00 11 00 11 11 00 00 11 ∂Γ+ (1 − p + ε− ) 11 00 00 11 {0}d Résultats numériques 26/28 ➧ Un un exemple test en dimension d . Soit X = (X1 . . . , Xd ) avec Xi ∼ Γ(i + 1, 1) ➧ on note G (X) = X1 ∼ Beta(2, (d + 1)(d + 2)/2 − 3) d X Xi i =1 ➧ soit qd,p le quantile d’ordre p de G (X) ➧ soit Pf la probabilité de l’événement indésirable ➧ on cherche à estimer qPf = inf y ∈IR (P(G (X) ≤ y ) > Pf ) Résultats numériques 27/28 n = 1000, Pf = 10−2 Dimension qn− qn+ qPf 2 0.44927246 0.04199864 3 0.18560746 0.01965787 4 0.23161791 0.01182391 n = 1000, Pf = 10−3 qPf qn+ Dimension qn− 2 0.03320955 0.01302295 3 0.192127468 0.006048936 4 0.195553283 0.003628516 Références [1] Bousquet N. (2012). Accelerated monte carlo estimation of exceedance probabilities under monotonicity constraints. Annales de la Faculté des Sciences de Toulouse. XXI(3), 557 − 592 [2] De Rocquigny, E. (2009). Structural reliability under monotony: A review of properties of form and associated simulation methods and a new class of monotonous reliability methods (MRM). Structural Safety 31, 363 − 374 [3] Hall P. & Heyde C. C. (1980). Martingale limit theory and its application. Academic press New York. [4] Kroese D. & Rubinstein R. (2007). Simulation and the Monte Carlo Method (Wiley ed.) [5] Lemaire M. (2009). Structural reliability. Wiley [6] Madsen H. & Ditlevsen O.(1996). Structural reliability methods (Wiley ed.) [7] V. Moutoussamy, N. Bousquet, B. Iooss, P. Rochet & F. Gamboa (2013). Comparing conservative estimations of an exceedance probabilities using sequential designs of experiments. ICOSSAR. 28/28