Métamodèles en grande dimension : Application au calcul

publicité
Métamodèles en grande dimension :
Application au calcul de la signature d'engins
JSO Modèles de substitution et Optimisation sous incertitudes
13/11/2014
S. Lefebvre - DOTA MPSO
[email protected]
DOTA
Plan de l’exposé
• Problématique
• Modélisation des incertitudes
• Cas 20 MHz : Réduction de dimension par ACP
Métamodèles
Analyse de sensibilité
• Cas 400 MHz : Réduction de dimension non linéaire
Métamodèles
Analyse de sensibilité
• Perspectives
2
DOTA
Signatures d’engins : contexte et enjeux
Propagation incertitudes
dispersion de S => Valeur + IC
Quantification - Modélisation
incertitudes
!
Variables
d’entrée
Code de calcul
( x,d )
COUTEUX
Code = boîte noire
Incertaines
Optimisation
Variables d’intérêt : vectorielles
Spectrales, spatiales,
temporelles
S = P ( x,d )
Fixes
(composition des ergols,
paramètres modèles,
géométrie, nature des
matériaux…)
Améliorer précision de
modules
certains
Analyse de sensibilité
Identification des variables
Précision nécessaire sur données, priorité
d’acquisition
3
DOTA
les plus influentes sur S
!
Signatures d’engins : contexte et enjeux
Propagation incertitudes
dispersion de S => Valeur + IC
Quantification - Modélisation
incertitudes
Optimisation
Variables d’intérêt : vectorielles
Variables
d’entrée
METAMODELE
( x,d )
Estimation très rapide
signatures IR et radar
Incertaines
Spectrales, spatiales,
temporelles
S = P ( x,d )
Fixes
Améliorer précision de
modules
certains
Analyse de sensibilité
Identification des variables
Précision nécessaire sur données, priorité
d’acquisition
4
DOTA
les plus influentes sur S
Contexte : Signature radar de corps de fusée sonde
Chaîne de calcul PRECISE (Plateforme
de Recherche pour l’Évaluation de la
Cinématique et des Signatures d’Engins)
dév. par ONERA
=> dimensionnement des systèmes
d’alerte, de surveillance ou de
détection multicapteurs
Focus sur la Signature radar (SER) de corps
Code Maxwell3D (ONERA DEMR) –
formulation EFIE (Electric Field Integral Equation)
=> SER monostatiques sous hypothèse d’onde plane
Incertitudes sur données entrée :
CAO engin + conditions de présentation mal connus
5
DOTA
• Problématique
• Modélisation des incertitudes
• Cas 20 MHz : Réduction de dimension par ACP
Métamodèles
Analyse de sensibilité
• Cas 400 MHz : Réduction de dimension non linéaire
Métamodèles
Analyse de sensibilité
• Perspectives
6
DOTA
Scénario d’intérêt
Paramètres fixes :
• On s’intéresse à la fusée-sonde Black Brant IX.
• Les paramètres de tir sont fixés : date et instant tir donnés, pt tir connu
• L’observation est faite par un radar mono-statique à 20 MHz ou 400 MHz
• La masse de charge utile est connue + certaines dimensions
Paramètres incertains : 11 variables CAO – lois uniformes en millimètres sauf les flèches, en degrés
Nb de CAO limité (vérification cohérence nécessaire)
= > plan space filling (LHS optimisés / discrépance )de 110 simulations + 1 simulation de référence
7
DOTA
Scénario d’intérêt
θ site
19 valeurs de 0 à 90° par pas de 5 ° pour 20 MHz
focus vue avant 10 valeurs de 45 à 90° pour 400 MHz
φ gisement 19 valeurs de 0 à 90 ° par pas de 5 ° pour 20 MHz
focus vue avant 10 valeurs de 0 à 45° pour 400 MHz
On analyse 10log10 |polarisation φφ| : 361 sorties à 20 MHz et 100 à 400 MHz
⇒
8
Réduction de dimension sur les sorties
DOTA
• Problématique
• Modélisation des incertitudes
• Cas 20 MHz : Réduction de dimension par ACP
Métamodèles
Analyse de sensibilité
• Cas 400 MHz : Réduction de dimension non linéaire
Métamodèles
Analyse de sensibilité
• Perspectives
9
DOTA
Réduction dimension sorties SER corps – 20 MHz
On a 19 x 19 = 361 sorties à analyser
Variations importantes suivant conditions de présentation : entre – 12 et 8 dB
1er test : Réduction de dimension linéaire : Analyse en Composantes Principales (ACP)
But ACP : explorer liaisons entre variables – ressemblances entre individus
Principe : extraction axes indépendants qui expliquent le plus de variance : composantes
principales (PC)
méthode linéaire – PC = combinaisons linéaires base d'origine
diagonalisation de la matrice de variance-covariance
Utilité : réduction dimension en conservant n premiers axes
débruitage : axes non conservés = « bruit »
3 composantes expliquent plus de 99.5 % de la variance – on passe de 361 à 3 dimensions
10
DOTA
Métamodèle SER corps – 20 MHz
Ensuite on estime un métamodèle par composante
Le modèle
permet de prédire les sorties avec un coefficient de
détermination R2 > 0.95
Sur ce type de métamodèle calcul analytique des indices de sensibilité
11
DOTA
Analyse de sensibilité : Analyse de variance fonctionnelle
Hyp : facteurs Xi indépendants
E (f2(X)) < ∞
f ( X ) = f 0 + ∑ fi ( X ) + ∑
d
Décomposition unique (Hoeffding 1948) :
d
i
i =1
∫
avec
[0,1)
∫
(
(
ij
)
)
f i1 ,...,i j xi1 ,..., x j dxik = 0 1 ≤ k ≤ j
i
fu ( x ) f v ( x ) dx = 0 u ≠ v, u ⊆ {1,..., d } , v ⊆ {1,..., d }
[0,1)d
⇒ Décomposition de la variance
d
(
avec Di = var f i ( X i )
SI =
Sti =
DI
Var ( f ( X ) )
∑
I ⊂{1,..., d }
i∈I
SI = 1 −
)
d
Var ( f ( X ) ) = ∑ Di + ∑
i =1
12
∑
j = 2 1≤i1 <...<i j ≤ d
fi1 ...i j X i1 ,..., X
(
et Dij = var f ij ( X i , X
j
))
∑
j = 2 1≤i1 <...<i j ≤ d
Di1 ...i j
…
décrit la part de variance de Y expliquée par interactions des facteurs d’indices dans I
D−i
décrit la contribution totale d’un facteur Xi (ttes interactions avec autres facteurs)
Var ( f ( X ) )
DOTA
Analyse de sensibilité SER corps – 20 MHz
90
Indices de sensibilité (%)
80
70
SI1
60
SItot1
74.5 %
50
SI2
20 %
40
SItot2
30
SI3
20
SItot3
2%
10
es
ia
m
et
re
.e
ng
Pr
in
of
on
de
ur
. fe
nt
e
La
rg
eu
r. f
en
te
D
pe
nn
ag
.d
e.
ne
z
en
t. e
m
it e
Em
pl
ac
em
R
ay
on
rd
. fu
gi
ve
ch
e.
bo
Fl
e
Lo
ng
ue
u
r.o
qu
e
e
rd
.a
t ta
nt
ur
Fl
e
ch
e.
bo
s
e.
em
pl
a
na
ge
or
d
C
r.e
m
pe
n
au
te
u
H
Lo
ng
ue
u
r.e
ta
g
e.
BB
0
|φφ| (dB)
Variables les plus influentes : longueur étage BB - hauteur des empennages - corde à
l'emplanture
Egalement influentes : flèche bord d'attaque - longueur de l'ogive – diamètre engin rayon de nez - flèche bord de fuite
3 variables négligeables : largeur et profondeur de fente – emplacement empennages
13
DOTA
Dispersion SER corps – 20 MHz
Dispersion : 50000 calculs QMC avec modèle linéaire avec interactions
10log10|φφ|
Plage variation < 8dB sauf gisement de 45°, 50°ou 55°et site de 85°ou 90°
=> Influence conditions présentation >> influence incertitude CAO pour ce scénario
14
DOTA
• Problématique
• Modélisation des incertitudes
• Cas 20 MHz : Réduction de dimension par ACP
Métamodèles
Analyse de sensibilité
• Cas 400 MHz : Réduction de dimension non linéaire
Métamodèles
Analyse de sensibilité
• Perspectives
15
DOTA
Réduction dimension sorties SER corps – 400 MHz
Variations importantes suivant conditions de présentation : entre – 12 et 12 dB
Test réduction dimension par ACP : on passe de 100 à 40 environ : pas suffisant
=> Réduction de dimension non linéaire
Rq : appliquer une transformation non linéaire sur les sorties du code de SER de corps peut
modifier l'ordre d'influence des variables lors de l'analyse de sensibilité
+ la technique de réduction de dimension doit permettre :
- de calculer facilement les coordonnées d'un nouveau point (au sens sortie vectorielle, de
dimension 100 ou 361) dans l'espace de dimension réduite
- de pouvoir reconstruire toutes les sorties d'origine à partir des composantes issues de la réduction
de dimension.
Très peu de méthodes de réduction de dimension non linéaires satisfont ces deux conditions
Test de deux méthodes :
-
Kernel ACP (drtoolbox Matlab) : pas de bons résultats
-
Autoencoders (NLPCA Matlab) : réseau de neurone MLP 3 couches cachées et 1 couche de
sortie Kramer 1991, DeMers et Cottrell 1993, Hinton et Salakhutdinov 2006
16
DOTA
Réseaux de neurones Autoencoders
K neurones linéaires
2ème couche – K =
dimension réduite
Couches cachées nc neurones
fonction sigmoïde th
100 Neurones de sortie
fonction linéaire
Kramer 1991
17
DOTA
Réduction de dimension - Métamodèles
ACP 20
composantes
kernelACP 15
composantes
Autoencoder 7
composantes
Autoencoder
15
composantes
Médiane Erreur de
reconstruction sur
10log10|polarisation
φφ| (dB)
0.4
0.27
0.14
0.07
Médiane des écarts de reconstruction
Leave 11 out
⇒ Autoencoder avec 7 composantes
Ensuite on estime un métamodèle par composante
-
Pas de bons résultats en prédiction avec Perceptron Multi Couches
-
Utilisation métamodèle de type Kriging => indices de Sobol
+ Validation avec sélection variable en norme L1 sur modèle de type splines ACOSSO
Rq : avantage de ce type de métamodèle : on peut prendre en compte variables qualitatives
18
DOTA
Processus gaussiens
(
On suppose que le code est une réalisation d’un processus gaussien Y ( x )
Y ( x) = µ + Z ( x)
Tendance constante
) x∈Dtel que

E ( Z ( x )) = 0

2
Cov ( Z ( x ) , Z ( x + h ) ) = σ R ( h | θ ) + ν I
Partie aléatoire, variations à petite échelle
σ2 : amplitude R(.|θ) : régularité
ici Matern 5/2
•
Apprentissage sous R avec DiceKriging
•
Modèle quasi interpolant car faible effet de pépite ν estimé
•
Modèle probabiliste : on a une distribution au point de prédiction et non une simple valeur
=> construction adaptative à partir de 50 points de base, en ajoutant points qui maximisent MSE
Test en prédiction : 100 tirages de 50 points de base, puis ajout adaptatif de 50 points dans chaque cas
et estimation R2 en prédiction sur les 11 points non utilisés pour l’apprentissage
=> Toutes les bases de départ ne donnent pas de bons résultats, mais Q75% des R2 > 0.75, sauf pour
composantes 1 et 3 (0.55 et 0.58) – médiane des R2 > 0.65 sauf composantes 1, 3 et 4 - max > 0.85
=> Résultats Analyse de sensibilité à conforter avec ACOSSO pour composantes 1 et 3
19
DOTA
Analyse de sensibilité SER corps – 400 MHz
Variable la plus influente : longueur étage BB – idem cas 20 MHz
Egalement influentes : hauteur empennages – idem cas 20 MHz
flèche bord d'attaque – corde emplanture – idem cas 20 MHZ
+ longueur de l'ogive
3 variables négligeables : profondeur de fente – diamètre engin – rayon de nez
20
DOTA
ACOSSO =>
résultats
similaires
Analyse de sensibilité SER corps – 400 MHz
ACOSSO =>
résultats
similaires
Variable la plus influente : longueur étage BB
Egalement influentes : hauteur empennages – emplacement empennages - flèche bord
d'attaque – corde emplanture - longueur de l'ogive - flèche bord de fuite – largeur de fente
3 variables négligeables : profondeur de fente – diamètre engin – rayon de nez
21
DOTA
Analyse de sensibilité SER corps – 400 MHz
Longueur ogive
Rayon de nez
Largeur fente
Profondeur fente
Diamètre engin
Longueur étage BB
Emplacement
empennages
Flèche bord attaque
Flèche bord fuite
Corde emplanture
Hauteur empennages
Nb fois où
variable
influente sur
100 sorties
25
5
15
10
8
90
35
22
24
21
72
Comparaison / indices obtenus avec 1 métamodèle de type Kriging pour chacune des 100 sorties
2 variables les plus influentes : longueur étage BB - hauteur empennages confirmées :
resp. 90 % cas et 72 % cas
Hiérarchie variables également identifiées comme influentes confirmée : emplacement
empennages (35 % cas) - flèche bord d'attaque – corde emplanture - longueur de l'ogive flèche bord de fuite (20-25 % des cas) – largeur de fente (15 % cas)
3 variables ~négligeables confirmées : profondeur de fente – diamètre engin – rayon de nez
22
DOTA
Dispersion SER corps – 400 MHz
Dispersion : 50000 calculs QMC avec métamodèle Kriging pour 7 composantes puis
reconstruction 100 sorties avec Autoencoder
10log10|φφ|
Plage variation importante, entre 3 et 38 dB
=> Influence incertitude CAO importante à 400 MHz
23
DOTA
Réduction de dimension t-SNE
Méthode t-SNE (t Distributed Stochastic Neighbor Embedding) => visualisation en 2D de
données en grande dimension
Méthode de réduction de dimension non linéaire qui préserve les similitudes entre les individus
-
Elle se déroule en 2 étapes :
On commence par construire une loi de probabilité sur les paires d’individus (xi,xj) dans
l’espace d’origine, qui favorise les individus similaires :
avec N le nombre d’individus et σi la variance de la Gaussienne. La similitude entre
un individu xj et un individu xi correspond à la probabilité conditionnelle pj|i que xi choisisse
xj comme voisin, si les voisins étaient choisis proportionnellement à leur densité de
probabilité, une Gaussienne centrée en xi.
On construit une loi sur les paires d’individus (yi,yj) dans l’espace en dimension réduite :
24
DOTA
L.J.P Van der Maaten, G.E. Hinton
Visualizing High-Dimensional Data Using t-SNE
J. of Machine Learning Research 9, 2579-2605, (2008)
Réduction de dimension t-SNE
- Les coordonnées des points yi dans le plan en 2 dimensions sont estimées en minimisant la
divergence de Kullback-Leibler KL entre les deux distributions p et q, afin de préserver les
similitudes entre les individus dans l’espace 2D.
Analyse
de
sensibilité
Confirme Variable la plus influente : longueur étage BB puis hauteur empennages – emplacement
empennages - flèche bord de fuite légèrement influente
=> Permet une analyse très synthétique – Pb : pas de reconstruction possible des 100 sorties
25
DOTA
• Problématique
• Modélisation des incertitudes
• Cas 20 MHz : Réduction de dimension par ACP
Métamodèles
Analyse de sensibilité
• Cas 400 MHz : Réduction de dimension non linéaire
Métamodèles
Analyse de sensibilité
• Perspectives
26
DOTA
Bilan et perspectives
Réduction de dimension par ACP très efficace cas simple – 20 MHz
Intérêt réduction de dimension par Autoencoders pour cas plus complexe – 400 MHz
Metamodèle => Analyse de sensibilité
=> dispersion SER par Quasi Monte Carlo
Perspectives
Deep Autoencoders
Adapter au mieux le type de métamodèle en fonction de la méthode de réduction de
dimension retenue
Apprentissage conjoint des différentes composantes issues réduction de dimension
Optimisation => dimensionnement systèmes
Problème inverse pour l’identification
27
DOTA
Merci de votre attention
DOTA
Téléchargement