Quelques voies d`améliorations en importance sampling et

publicité
Synthèse sur les méthodes d'estimation
d'évènements rares – Quelques
développements réalisés à l'Onera
Jérôme Morio – Mathieu Balesdent
(ONERA/DCPS)
15/11/2012
Plan
•
Synthèse sur les méthodes d'estimation d'évènements
rares
•
Quelques développements réalisés à l'Onera
JSO Evènements rares 15/11/2012
•
•
•
2
Estimations de courbes de niveaux de probabilités faibles
Réglage d'estimateur d'importance splitting (avec J. Marzat)
Analyse de la sensibilité des paramètres des densités des entrées d'un
code de calcul sur la probabilité d'un évènement rare
Analyse du problème
Cas général
Code de calcul Φ
Boîte noire Φ
Aléatoires de PDF
JSO Evènements rares 15/11/2012
Code Φ déterministe
3
de PDF inconnue g
Estimation de probabilités et de quantiles sur Y
Simulation d’évènements rares
Il faut estimer la probabilité de dépassement d’un seuil S par Y avec un nombre
"raisonnable" de simulations.
Exemple : retombée d’un étage d'engin
N entrées :
- aérodynamique
- masses
- caractéristiques
injection
-…
JSO Evènements rares 15/11/2012
500 échantillons Monte
Carlo
4
Code de
calcul Φ
2 sorties :
- Position
horizontale de
la retombée
10000 échantillons Monte
Carlo
Techniques d'estimation d'évènements rares
•
Techniques statistiques :
- théorie des valeurs extrêmes : à partir d'un jeu d'échantillons de la
sortie du code, estimation paramétrique de la PDF de sortie du code
- théorie des grandes déviations : caractériser les bornes de variations
d'un estimateur
•
Techniques de simulation :
- Monte-Carlo
- importance sampling : générer des échantillons en entrée selon une
JSO Evènements rares 15/11/2012
densité auxiliaire f', favorisant les évènements rares
5
- importance splitting : méthodes multi-niveaux qui permettent d'estimer la
probabilité cible rare par un produit de probabilités conditionnelles peu rares
Techniques d'estimation d'évènements rares
•
Techniques issues des études de fiabilité:
- FORM/SORM/FOSPA, line sampling : estimation par approximation
paramétrique de la probabilité de défaillance
•
Techniques utilisant des métamodèles (couplage métamodèlestechniques de simulation-optimisation)
•
Autres algorithmes : variables de contrôle, antithétiques: méthodes
JSO Evènements rares 15/11/2012
simples de réduction de variance
6
Quelles méthodes choisir selon la situation ?
Retour d'expériences
-
JSO Evènements rares 15/11/2012
-
7
Peut-on utiliser le code Φ pour obtenir des échantillons de
la sortie Y ?
NON : Utiliser la théorie des valeurs extrêmes ou des
métamodèles pour représenter Φ
OUI : Eviter la théorie des valeurs extrêmes et se
focaliser sur les autres algorithmes
Le code de calcul Φ est-il analytiquement connu ?
OUI : Regarder l'applicabilité de méthodes simples
comme importance sampling (avec de simples changements de mesures,
exponential twisting), variables de contrôle, antithétiques, les
bornes définies par la théorie des grandes déviations.
NON : Se tourner vers des algorithmes plus
complexes comme importance sampling, splitting,
métamodèle
Retour d'expériences
-
JSO Evènements rares 15/11/2012
-
8
Quelle est la dimension du problème ?
d<10 : FORM/SORM, line sampling et non parametric
importance sampling, métamodèles sont efficaces
d>10 : importance splitting et importance sampling
optimisé par cross-entropy résistent bien à la dimension
Quel est le budget de simulation disponible ?
N<1000 : FORM/SORM, line sampling, métamodèles
peuvent être envisagés
N>1000 : importance sampling et splitting nécessitent
un budget de simulation plus important
Retour d'expériences
-
-
JSO Evènements rares 15/11/2012
-
9
Le code Φ est-il fortement non linéaire ?
OUI : Attention à l'utilisation de FORM/SORM, Line
sampling et métamodèle
La région de l'entrée du code de calcul qui aboutit à
l'évènement rare est-elle multimodale ?
OUI ou réponse inconnue : Attention à l'utilisation de
FORM/SORM et importance sampling optimisé par cross
entropy
La région de l'entrée du code de calcul qui aboutit à
l'évènement rare est-elle approximativement connue ?
OUI : stratified sampling et FORM/SORM peuvent être
efficaces
Conclusion
JSO Evènements rares 15/11/2012
Souvent difficile de choisir a priori la méthode la plus
adaptée à une situation donnée
10
1)
Bien définir, étudier le problème et notamment les
caractéristiques du code de calcul Φ
2)
Eviter l'utilisation à contre-emploi de certains algorithmes
3)
Caractériser l'estimation de la probabilité donnée par un
algorithme par son erreur relative (bornes, estimation Monte
Carlo,…)
Plan
•
Synthèse sur les méthodes d'estimation d'évènements
rares
•
Quelques développements réalisés à l'Onera
JSO Evènements rares 15/11/2012
•
•
•
11
Estimations de courbes de niveaux de probabilités faibles
Réglage d'estimateur d'importance splitting (avec J. Marzat)
Analyse de la sensibilité des paramètres des densités des entrées d'un
code de calcul sur la probabilité d'un évènement rare
Développements réalisés à l’Onera
•
Quelques sujets d’intérêt
Réduction des coûts calculatoires
Utilisation de méta-modèles
Méthodes adaptatives
Evénements rares
dynamiques (Imp. Splitting)
Applicabilité des méthodes
dans cas industriels et challenges induits
(quelle méthode choisir, quels réglages?)
JSO Evènements rares 15/11/2012
Collisions d’avions
Collisions débris - satellites
Retombéesd’étages,
d’étages…
Retombées
12
Détermination des caractéristiques
des densités d’entrée conduisant
à l'évènement rare
analyses de
de sensibilité
sensibilité
analyses
méthodes particulaires
particulaires
méthodes
Représentation des quantiles
multidimensionnels
courbes de niveaux
Définition d’une courbe de niveau pour les plages
engagées horizontales
Auparavant : calcul de CEP (Circular Error Probable) à X% =
rayon du cercle contenant X% des points d’impacts
Pas efficace lorsque la distribution est non isotrope
Définition de la notion de courbe de niveau pour les zones
engagées à X% ?
80%
JSO Evènements rares 15/11/2012
Exemple - Cas gaussien:
13
R
1
1000 simulations
Densité de probabilité
Courbe de niveaux
50%
Courbe de niveau à 50% = 50 % des
impacts sont situés à l’intérieur de la
courbe bleue
Définition d’une courbe de niveau pour les plages
engagées horizontales
Définition d'une courbe
de niveau t
Mapping avec les
probabilités
JSO Evènements rares 15/11/2012
une courbe de niveau t correspond une aire de
volume minimal de probabilité α (réciproque fausse)
14
densité de Y, g inconnue
à noyaux
utilisation d'un estimateur
Niveau t inconnu
estimé à l'aide du α-quantile de la
densité estimée des échantillons (estimation plug-in)
Définition d’une courbe de niveau pour les plages
engagées horizontales
JSO Evènements rares 15/11/2012
Cas simple Gaussien 2D N(0,I2)
avec méthodes de Monte Carlo
(10000 échantillons)
15
R
1
Courbe bleue= estimation Monte Carlo et courbe verte= théorie
Définition d’une courbe de niveau pour les plages
engagées horizontales
Cas simple Gaussien 2D N(0,I2) avec importance sampling
non parametrique adaptatif (10000 échantillons)
JSO Evènements rares 15/11/2012
R
1
16
Courbe bleue= estimation Importance Sampling et courbe verte= théorie
Définition d’une courbe de niveau pour les plages
engagées horizontales
Cas d'une retombée d'un engin
JSO Evènements rares 15/11/2012
Importance Sampling non
paramétrique (10000 échantillons)
17
Monte Carlo (1000000 échantillons)
Niveau : 0.95, 0.99, 0.999, 0.99999
J. Morio and R. Pastel, Plug-in estimation of d-dimensional density minimum volume set of a rare event in a complex system, Proceedings
of the IMechE, Part O, Journal of Risk and Reliability, 2012, 226, 3, 347-345
Plan
•
Synthèse sur les méthodes d'estimation d'évènements
rares
•
Quelques développements réalisés à l'Onera
JSO Evènements rares 15/11/2012
•
•
•
18
Estimations de courbes de niveaux de probabilités faibles
Réglage d'estimateur d'importance splitting (avec J. Marzat)
Analyse de la sensibilité des paramètres des densités des entrées d'un
code de calcul sur la probabilité d'un évènement rare
Principe du splitting
PDF
Échantillons
S
y
JSO Evènements rares 15/11/2012
Seuil S trop difficile à atteindre en une seule fois
19
Principe du splitting
PDF
Échantillons
S1
S
JSO Evènements rares 15/11/2012
y
20
On va considérer un seuil S1<S plus facile à atteindre par
les échantillons
Importance Splitting
- Duplication des échantillons qui ont passé le seuil S1 pour conserver N
constant (doublons) : perte de diversité et corrélation
- Agitation des échantillons par un noyau markovien réversible pour explorer
l’espace et ajouter de l'indépendance sans changer la densité des échantillons
(algorithme de Metropolis-Hastings ; expression analytique pour certaines
densités usuelles comme les gaussiennes)
PDF
S1
S
JSO Evènements rares 15/11/2012
y
21
On peut donc estimer la probabilité P1 :
P1=P(Y>S1)
Principe du splitting
On va considérer un nouveau seuil S2
PDF
S1
S2
S
JSO Evènements rares 15/11/2012
y
22
Estimation de P2 puis on régénère et mute à nouveau les
échantillons
P1=P(Y>S1)
P2=P(Y>S2|Y>S1)
Principe du splitting
De façon répétitive, on définit les seuils S3 et S4
PDF
S1
S3
S
JSO Evènements rares 15/11/2012
y
P1=P(Y>S1)
P2=P(Y>S2|Y>S1)
S2
P3=P(Y>S3|Y>S2)
P4=P(Y>S|Y>S3)
P(Y > S) = P1 x P2 x P3 x P4
La meilleure estimation est réalisée lorsque P1=P2=P3=P4…
23
1) Réglage de l’estimateur Splitting
Paramètres à fixer avant d'utiliser les techniques de splitting :
Le quantile β définissant les seuils S1, S2,…
La taille de la population de particules N
La force α d'agitation du noyau
JSO Evènements rares 15/11/2012
-
24
Le nombre d'application du noyau Napp
Comment trouver des réglages « optimaux »,
minimisant l'erreur relative d'estimation de la probabilité
donnée par le splitting ?
1) Réglage de l’estimateur Splitting
JSO Evènements rares 15/11/2012
Détermination automatique et optimale des paramètres de réglage de
l’estimateur
o
Détermination d’un modèle de substitution (krigeage) représentatif du
comportement de l’estimateur
o
Optimisation globale des paramètres de réglage en utilisant et
raffinant ce modèle de substitution (optimisation du progrès espéré –
algorithme « Efficient Global Optimization »)
25
1) Réglage de l’estimateur Splitting
JSO Evènements rares 15/11/2012
Réalisation d’une « campagne d’essais » sur une série représentative
de fonctions test
26
•
Fonction « Ackley »
dimension 2
•
Fonction « Ackley »
multimodale, dimension 4
•
Fonction « Rayleigh »
multimodale, dimension 15
1) Réglage de l’estimateur Splitting
JSO Evènements rares 15/11/2012
Détermination d’ensembles de réglages « optimaux »
27
1) Réglage de l’estimateur Splitting
JSO Evènements rares 15/11/2012
Test de ces réglages sur un cas de retombée d’étage
28
M. Balesdent, J. Morio, J. Marzat, Recommendations for the tuning of rare event probability
estimators, soumis à Reliability engineering and System Safety
Plan
•
Synthèse sur les méthodes d'estimation d'évènements
rares
•
Quelques développements réalisés à l'Onera
JSO Evènements rares 15/11/2012
•
•
•
29
Estimations de courbes de niveaux de probabilités faibles
Réglage d'estimateur d'importance splitting (avec J. Marzat)
Analyse de la sensibilité des paramètres des densités des entrées d'un
code de calcul sur la probabilité d'un évènement rare
Analyse de sensibilité
Code de calcul Φ
Boîte noire Φ
Aléatoires de PDF
Paramétrisée par
JSO Evènements rares 15/11/2012
Supposés indépendants et
aléatoires (uniformes ou
Gaussien)
30
Estimation de la probabilité de
dépassement du seuil S par Y
Erreur sur les paramètres des PDF en entrées du code
de calcul rarement prise en compte dans les modèles
J. Morio, « Influence of input PDF parameters of a model on a failure probability estimation », Simulation Modelling Practice and
Theory, 19, 10, 2011, 2244-2255
Analyse de sensibilité
La densité de Y dépend la valeur des paramètres de δi
JSO Evènements rares 15/11/2012
Exemple de densités Y sur le code de retombée
Quelle est l'influence des paramètres δi sur l'estimation de
P(Y>S) ?
31
Analyse de sensibilité
Les échantillons "utiles" pour estimer P(Y>S) le sont
pour tout δi car le code Φ est déterministe.
Par importance sampling,
JSO Evènements rares 15/11/2012
Où les échantillons Xi sont générés selon la
densité optimale des paramètres moyens δi
(Condition sur la variation de la probabilité en fonction de δi pour que l'estimée soit correcte)
Analyse de l'influence des δi sur
32
J. Morio, « Influence of input PDF parameters of a model on a failure probability estimation », Simulation Modelling Practice and
Theory, 19, 10, 2011, 2244-2255
Analyse de sensibilité
Utilisation des indices de Sobol :
Pas de problème de temps de calcul pour l'estimation
d'indice de Sobol car relation analytique entre δi et probabilité
JSO Evènements rares 15/11/2012
Exemple de résultats sur l'estimation de P(Y>5)
33
Paramètre
Indice de Sobol total
δ1
0.22
δ2
0.13
δ3
0.42
δ4
δ5
δ6
0.07
0.38
0.08
Monte Carlo 50000 échantillons
JSO Evènements rares 15/11/2012
Merci de votre attention.
Questions ?
34
Téléchargement