Proposition d’un Projet de Recherche en Laboratoire Titre : Machine Learning appliqué à la détection automatique de signatures dans les données plasmas mesurées par satellite - dans le cadre du projet SciQLOP https:// hephaistos.lpp.polytechnique.fr/redmine/attachments/download/1089/ cdsProject2015_V2.pdf Laboratoire d’accueil : Laboratoire de Physique des Plasmas Résumé : Nous avons maintenant plusieurs décades de données liées au propriétés des plasmas spatiaux, acquises par les multiples missions en orbite terrestre, planétaire et dans solaire. Dans ces données, qui se présentent sous forme de séries temporelles, se trouvent des signatures associées à des phénomènes plasmas que nous étudions. La détection de ces signatures reste néanmoins très compliquée et est limitée aujourd’hui à l’inspection visuelle. Deux raisons principales nous rendent difficile l’automatisation des détections via des méthodes conventionnelles : la grande variabilité des signatures, et la nature ponctuelle de la mesure à la position du satellite dans un environnement 3D et instationnaire. Un projet en cours au laboratoire vise à utiliser des algorithmes d’apprentissage automatique, qui pourraient, apprendre d’un ensemble étiqueté de signatures, et ensuite construire « intelligement » un catalogues d’intervalles de données présentant des signatures similaires. Le travail proposé ici consiste à élaboré un code permettant de détecter automatique ment les signatures associées à un événement en particulier : la traversée de la magnétopause terrestre, frontière entre notre magnétosphère et le milieu interplanétaire. Il faudra se familiariser aux données, déterminer quel algorithme d’apprentissage se prête le mieux à la détection, et quelles sont les « features » à extraires du signal pour obtenir la meilleur performance. Le travail se fera en collaboration étroite avec des chercheurs du laboratoire, un ingénieur chargé du développement de l’application, qui in fine abritera la méthode M m m ag ne t ag né t Ch oc op au se og ai ne Ve nt s d’ ét ra ol ai re ve ag ne t os ph er e La figure de gauche est une représentation 3D d’un modèle de magnétosphère. On y voit trois régions séparées par deux frontières : la magnétosphère, la magnétogaine et le vent solaire, séparés respectivement par la magnétopause et le choc d’étrave. Les satellites Cluster 3 et 4 sont représentés sur la figure sur une partie de leur orbite, qui est ammenée à traverser la magnétopause et le chioc. Sur l’image de droite sont représentées des données en fonction du temps mesurées par l’un des satellites à leur position le long de leur orbite. Une inspection visuelle des données permet d’identifié les régions dans lesquelles le satellite se trouve à l’instant t, cependant une identification automatique reste compliquée. En effet, ces frontières ne sont pas fixes, elles sont sujettes à des oscillations et ondes de surfaces qui, à l’instar d’une sonde placée proche de la surface d’un océan, provoquent des traversées multiples et parfois partielles des satellites d’une région à l’autre. d’apprentissage, et un mathématicien du laboratoire de maths appliquées, expert en machine learning. Mots clés : machine learning, plasmas astrophysiques, analyse de signal, mesure satellite Nature : numérique/theorique/signal Accueil d’un binôme possible : Oui Personnes à contacter : [email protected]