Métamodèles en grande dimension : Application au calcul de la signature d'engins JSO Modèles de substitution et Optimisation sous incertitudes 13/11/2014 S. Lefebvre - DOTA MPSO [email protected] DOTA Plan de l’exposé • Problématique • Modélisation des incertitudes • Cas 20 MHz : Réduction de dimension par ACP Métamodèles Analyse de sensibilité • Cas 400 MHz : Réduction de dimension non linéaire Métamodèles Analyse de sensibilité • Perspectives 2 DOTA Signatures d’engins : contexte et enjeux Propagation incertitudes dispersion de S => Valeur + IC Quantification - Modélisation incertitudes ! Variables d’entrée Code de calcul ( x,d ) COUTEUX Code = boîte noire Incertaines Optimisation Variables d’intérêt : vectorielles Spectrales, spatiales, temporelles S = P ( x,d ) Fixes (composition des ergols, paramètres modèles, géométrie, nature des matériaux…) Améliorer précision de modules certains Analyse de sensibilité Identification des variables Précision nécessaire sur données, priorité d’acquisition 3 DOTA les plus influentes sur S ! Signatures d’engins : contexte et enjeux Propagation incertitudes dispersion de S => Valeur + IC Quantification - Modélisation incertitudes Optimisation Variables d’intérêt : vectorielles Variables d’entrée METAMODELE ( x,d ) Estimation très rapide signatures IR et radar Incertaines Spectrales, spatiales, temporelles S = P ( x,d ) Fixes Améliorer précision de modules certains Analyse de sensibilité Identification des variables Précision nécessaire sur données, priorité d’acquisition 4 DOTA les plus influentes sur S Contexte : Signature radar de corps de fusée sonde Chaîne de calcul PRECISE (Plateforme de Recherche pour l’Évaluation de la Cinématique et des Signatures d’Engins) dév. par ONERA => dimensionnement des systèmes d’alerte, de surveillance ou de détection multicapteurs Focus sur la Signature radar (SER) de corps Code Maxwell3D (ONERA DEMR) – formulation EFIE (Electric Field Integral Equation) => SER monostatiques sous hypothèse d’onde plane Incertitudes sur données entrée : CAO engin + conditions de présentation mal connus 5 DOTA • Problématique • Modélisation des incertitudes • Cas 20 MHz : Réduction de dimension par ACP Métamodèles Analyse de sensibilité • Cas 400 MHz : Réduction de dimension non linéaire Métamodèles Analyse de sensibilité • Perspectives 6 DOTA Scénario d’intérêt Paramètres fixes : • On s’intéresse à la fusée-sonde Black Brant IX. • Les paramètres de tir sont fixés : date et instant tir donnés, pt tir connu • L’observation est faite par un radar mono-statique à 20 MHz ou 400 MHz • La masse de charge utile est connue + certaines dimensions Paramètres incertains : 11 variables CAO – lois uniformes en millimètres sauf les flèches, en degrés Nb de CAO limité (vérification cohérence nécessaire) = > plan space filling (LHS optimisés / discrépance )de 110 simulations + 1 simulation de référence 7 DOTA Scénario d’intérêt θ site 19 valeurs de 0 à 90° par pas de 5 ° pour 20 MHz focus vue avant 10 valeurs de 45 à 90° pour 400 MHz φ gisement 19 valeurs de 0 à 90 ° par pas de 5 ° pour 20 MHz focus vue avant 10 valeurs de 0 à 45° pour 400 MHz On analyse 10log10 |polarisation φφ| : 361 sorties à 20 MHz et 100 à 400 MHz ⇒ 8 Réduction de dimension sur les sorties DOTA • Problématique • Modélisation des incertitudes • Cas 20 MHz : Réduction de dimension par ACP Métamodèles Analyse de sensibilité • Cas 400 MHz : Réduction de dimension non linéaire Métamodèles Analyse de sensibilité • Perspectives 9 DOTA Réduction dimension sorties SER corps – 20 MHz On a 19 x 19 = 361 sorties à analyser Variations importantes suivant conditions de présentation : entre – 12 et 8 dB 1er test : Réduction de dimension linéaire : Analyse en Composantes Principales (ACP) But ACP : explorer liaisons entre variables – ressemblances entre individus Principe : extraction axes indépendants qui expliquent le plus de variance : composantes principales (PC) méthode linéaire – PC = combinaisons linéaires base d'origine diagonalisation de la matrice de variance-covariance Utilité : réduction dimension en conservant n premiers axes débruitage : axes non conservés = « bruit » 3 composantes expliquent plus de 99.5 % de la variance – on passe de 361 à 3 dimensions 10 DOTA Métamodèle SER corps – 20 MHz Ensuite on estime un métamodèle par composante Le modèle permet de prédire les sorties avec un coefficient de détermination R2 > 0.95 Sur ce type de métamodèle calcul analytique des indices de sensibilité 11 DOTA Analyse de sensibilité : Analyse de variance fonctionnelle Hyp : facteurs Xi indépendants E (f2(X)) < ∞ f ( X ) = f 0 + ∑ fi ( X ) + ∑ d Décomposition unique (Hoeffding 1948) : d i i =1 ∫ avec [0,1) ∫ ( ( ij ) ) f i1 ,...,i j xi1 ,..., x j dxik = 0 1 ≤ k ≤ j i fu ( x ) f v ( x ) dx = 0 u ≠ v, u ⊆ {1,..., d } , v ⊆ {1,..., d } [0,1)d ⇒ Décomposition de la variance d ( avec Di = var f i ( X i ) SI = Sti = DI Var ( f ( X ) ) ∑ I ⊂{1,..., d } i∈I SI = 1 − ) d Var ( f ( X ) ) = ∑ Di + ∑ i =1 12 ∑ j = 2 1≤i1 <...<i j ≤ d fi1 ...i j X i1 ,..., X ( et Dij = var f ij ( X i , X j )) ∑ j = 2 1≤i1 <...<i j ≤ d Di1 ...i j … décrit la part de variance de Y expliquée par interactions des facteurs d’indices dans I D−i décrit la contribution totale d’un facteur Xi (ttes interactions avec autres facteurs) Var ( f ( X ) ) DOTA Analyse de sensibilité SER corps – 20 MHz 90 Indices de sensibilité (%) 80 70 SI1 60 SItot1 74.5 % 50 SI2 20 % 40 SItot2 30 SI3 20 SItot3 2% 10 es ia m et re .e ng Pr in of on de ur . fe nt e La rg eu r. f en te D pe nn ag .d e. ne z en t. e m it e Em pl ac em R ay on rd . fu gi ve ch e. bo Fl e Lo ng ue u r.o qu e e rd .a t ta nt ur Fl e ch e. bo s e. em pl a na ge or d C r.e m pe n au te u H Lo ng ue u r.e ta g e. BB 0 |φφ| (dB) Variables les plus influentes : longueur étage BB - hauteur des empennages - corde à l'emplanture Egalement influentes : flèche bord d'attaque - longueur de l'ogive – diamètre engin rayon de nez - flèche bord de fuite 3 variables négligeables : largeur et profondeur de fente – emplacement empennages 13 DOTA Dispersion SER corps – 20 MHz Dispersion : 50000 calculs QMC avec modèle linéaire avec interactions 10log10|φφ| Plage variation < 8dB sauf gisement de 45°, 50°ou 55°et site de 85°ou 90° => Influence conditions présentation >> influence incertitude CAO pour ce scénario 14 DOTA • Problématique • Modélisation des incertitudes • Cas 20 MHz : Réduction de dimension par ACP Métamodèles Analyse de sensibilité • Cas 400 MHz : Réduction de dimension non linéaire Métamodèles Analyse de sensibilité • Perspectives 15 DOTA Réduction dimension sorties SER corps – 400 MHz Variations importantes suivant conditions de présentation : entre – 12 et 12 dB Test réduction dimension par ACP : on passe de 100 à 40 environ : pas suffisant => Réduction de dimension non linéaire Rq : appliquer une transformation non linéaire sur les sorties du code de SER de corps peut modifier l'ordre d'influence des variables lors de l'analyse de sensibilité + la technique de réduction de dimension doit permettre : - de calculer facilement les coordonnées d'un nouveau point (au sens sortie vectorielle, de dimension 100 ou 361) dans l'espace de dimension réduite - de pouvoir reconstruire toutes les sorties d'origine à partir des composantes issues de la réduction de dimension. Très peu de méthodes de réduction de dimension non linéaires satisfont ces deux conditions Test de deux méthodes : - Kernel ACP (drtoolbox Matlab) : pas de bons résultats - Autoencoders (NLPCA Matlab) : réseau de neurone MLP 3 couches cachées et 1 couche de sortie Kramer 1991, DeMers et Cottrell 1993, Hinton et Salakhutdinov 2006 16 DOTA Réseaux de neurones Autoencoders K neurones linéaires 2ème couche – K = dimension réduite Couches cachées nc neurones fonction sigmoïde th 100 Neurones de sortie fonction linéaire Kramer 1991 17 DOTA Réduction de dimension - Métamodèles ACP 20 composantes kernelACP 15 composantes Autoencoder 7 composantes Autoencoder 15 composantes Médiane Erreur de reconstruction sur 10log10|polarisation φφ| (dB) 0.4 0.27 0.14 0.07 Médiane des écarts de reconstruction Leave 11 out ⇒ Autoencoder avec 7 composantes Ensuite on estime un métamodèle par composante - Pas de bons résultats en prédiction avec Perceptron Multi Couches - Utilisation métamodèle de type Kriging => indices de Sobol + Validation avec sélection variable en norme L1 sur modèle de type splines ACOSSO Rq : avantage de ce type de métamodèle : on peut prendre en compte variables qualitatives 18 DOTA Processus gaussiens ( On suppose que le code est une réalisation d’un processus gaussien Y ( x ) Y ( x) = µ + Z ( x) Tendance constante ) x∈Dtel que E ( Z ( x )) = 0 2 Cov ( Z ( x ) , Z ( x + h ) ) = σ R ( h | θ ) + ν I Partie aléatoire, variations à petite échelle σ2 : amplitude R(.|θ) : régularité ici Matern 5/2 • Apprentissage sous R avec DiceKriging • Modèle quasi interpolant car faible effet de pépite ν estimé • Modèle probabiliste : on a une distribution au point de prédiction et non une simple valeur => construction adaptative à partir de 50 points de base, en ajoutant points qui maximisent MSE Test en prédiction : 100 tirages de 50 points de base, puis ajout adaptatif de 50 points dans chaque cas et estimation R2 en prédiction sur les 11 points non utilisés pour l’apprentissage => Toutes les bases de départ ne donnent pas de bons résultats, mais Q75% des R2 > 0.75, sauf pour composantes 1 et 3 (0.55 et 0.58) – médiane des R2 > 0.65 sauf composantes 1, 3 et 4 - max > 0.85 => Résultats Analyse de sensibilité à conforter avec ACOSSO pour composantes 1 et 3 19 DOTA Analyse de sensibilité SER corps – 400 MHz Variable la plus influente : longueur étage BB – idem cas 20 MHz Egalement influentes : hauteur empennages – idem cas 20 MHz flèche bord d'attaque – corde emplanture – idem cas 20 MHZ + longueur de l'ogive 3 variables négligeables : profondeur de fente – diamètre engin – rayon de nez 20 DOTA ACOSSO => résultats similaires Analyse de sensibilité SER corps – 400 MHz ACOSSO => résultats similaires Variable la plus influente : longueur étage BB Egalement influentes : hauteur empennages – emplacement empennages - flèche bord d'attaque – corde emplanture - longueur de l'ogive - flèche bord de fuite – largeur de fente 3 variables négligeables : profondeur de fente – diamètre engin – rayon de nez 21 DOTA Analyse de sensibilité SER corps – 400 MHz Longueur ogive Rayon de nez Largeur fente Profondeur fente Diamètre engin Longueur étage BB Emplacement empennages Flèche bord attaque Flèche bord fuite Corde emplanture Hauteur empennages Nb fois où variable influente sur 100 sorties 25 5 15 10 8 90 35 22 24 21 72 Comparaison / indices obtenus avec 1 métamodèle de type Kriging pour chacune des 100 sorties 2 variables les plus influentes : longueur étage BB - hauteur empennages confirmées : resp. 90 % cas et 72 % cas Hiérarchie variables également identifiées comme influentes confirmée : emplacement empennages (35 % cas) - flèche bord d'attaque – corde emplanture - longueur de l'ogive flèche bord de fuite (20-25 % des cas) – largeur de fente (15 % cas) 3 variables ~négligeables confirmées : profondeur de fente – diamètre engin – rayon de nez 22 DOTA Dispersion SER corps – 400 MHz Dispersion : 50000 calculs QMC avec métamodèle Kriging pour 7 composantes puis reconstruction 100 sorties avec Autoencoder 10log10|φφ| Plage variation importante, entre 3 et 38 dB => Influence incertitude CAO importante à 400 MHz 23 DOTA Réduction de dimension t-SNE Méthode t-SNE (t Distributed Stochastic Neighbor Embedding) => visualisation en 2D de données en grande dimension Méthode de réduction de dimension non linéaire qui préserve les similitudes entre les individus - Elle se déroule en 2 étapes : On commence par construire une loi de probabilité sur les paires d’individus (xi,xj) dans l’espace d’origine, qui favorise les individus similaires : avec N le nombre d’individus et σi la variance de la Gaussienne. La similitude entre un individu xj et un individu xi correspond à la probabilité conditionnelle pj|i que xi choisisse xj comme voisin, si les voisins étaient choisis proportionnellement à leur densité de probabilité, une Gaussienne centrée en xi. On construit une loi sur les paires d’individus (yi,yj) dans l’espace en dimension réduite : 24 DOTA L.J.P Van der Maaten, G.E. Hinton Visualizing High-Dimensional Data Using t-SNE J. of Machine Learning Research 9, 2579-2605, (2008) Réduction de dimension t-SNE - Les coordonnées des points yi dans le plan en 2 dimensions sont estimées en minimisant la divergence de Kullback-Leibler KL entre les deux distributions p et q, afin de préserver les similitudes entre les individus dans l’espace 2D. Analyse de sensibilité Confirme Variable la plus influente : longueur étage BB puis hauteur empennages – emplacement empennages - flèche bord de fuite légèrement influente => Permet une analyse très synthétique – Pb : pas de reconstruction possible des 100 sorties 25 DOTA • Problématique • Modélisation des incertitudes • Cas 20 MHz : Réduction de dimension par ACP Métamodèles Analyse de sensibilité • Cas 400 MHz : Réduction de dimension non linéaire Métamodèles Analyse de sensibilité • Perspectives 26 DOTA Bilan et perspectives Réduction de dimension par ACP très efficace cas simple – 20 MHz Intérêt réduction de dimension par Autoencoders pour cas plus complexe – 400 MHz Metamodèle => Analyse de sensibilité => dispersion SER par Quasi Monte Carlo Perspectives Deep Autoencoders Adapter au mieux le type de métamodèle en fonction de la méthode de réduction de dimension retenue Apprentissage conjoint des différentes composantes issues réduction de dimension Optimisation => dimensionnement systèmes Problème inverse pour l’identification 27 DOTA Merci de votre attention DOTA