Machine Learning appliquée à la détection automatique de

publicité
Proposition d’un Projet de Recherche en Laboratoire
Titre : Machine Learning appliqué à la détection automatique de signatures dans les données
plasmas mesurées par satellite - dans le cadre du projet SciQLOP https://
hephaistos.lpp.polytechnique.fr/redmine/attachments/download/1089/
cdsProject2015_V2.pdf
Laboratoire d’accueil : Laboratoire de Physique des Plasmas
Résumé : Nous avons maintenant plusieurs décades de données liées au propriétés des
plasmas spatiaux, acquises par les multiples missions en orbite terrestre, planétaire et dans
solaire. Dans ces données, qui se présentent sous forme de séries temporelles, se trouvent des
signatures associées à des phénomènes plasmas que nous étudions. La détection de ces
signatures reste néanmoins très compliquée et est limitée aujourd’hui à l’inspection visuelle.
Deux raisons principales nous rendent difficile l’automatisation des détections via des
méthodes conventionnelles : la grande variabilité des signatures, et la nature ponctuelle de la
mesure à la position du satellite dans un environnement 3D et instationnaire. Un projet en
cours au laboratoire vise à utiliser des algorithmes d’apprentissage automatique, qui
pourraient, apprendre d’un ensemble étiqueté de signatures, et ensuite construire
« intelligement » un catalogues d’intervalles de données présentant des signatures similaires.
Le travail proposé ici consiste à élaboré un code permettant de détecter automatique
ment les signatures associées à un événement en particulier : la traversée de la magnétopause
terrestre, frontière entre notre magnétosphère et le milieu interplanétaire. Il faudra se
familiariser aux données, déterminer quel algorithme d’apprentissage se prête le mieux à la
détection, et quelles sont les « features » à extraires du signal pour obtenir la meilleur
performance. Le travail se fera en collaboration étroite avec des chercheurs du laboratoire,
un ingénieur chargé du
développement de l’application, qui
in fine abritera la méthode
M
m
m
ag
ne
t
ag
né
t
Ch
oc
op
au
se
og
ai
ne
Ve
nt
s
d’
ét
ra
ol
ai
re
ve
ag
ne
t
os
ph
er
e
La figure de gauche est une représentation 3D d’un modèle de magnétosphère. On y voit trois régions séparées par deux frontières : la magnétosphère, la
magnétogaine et le vent solaire, séparés respectivement par la magnétopause et le choc d’étrave. Les satellites Cluster 3 et 4 sont représentés sur la figure
sur une partie de leur orbite, qui est ammenée à traverser la magnétopause et le chioc. Sur l’image de droite sont représentées des données en fonction du
temps mesurées par l’un des satellites à leur position le long de leur orbite. Une inspection visuelle des données permet d’identifié les régions dans lesquelles
le satellite se trouve à l’instant t, cependant une identification automatique reste compliquée. En effet, ces frontières ne sont pas fixes, elles sont sujettes à
des oscillations et ondes de surfaces qui, à l’instar d’une sonde placée proche de la surface d’un océan, provoquent des traversées multiples et parfois
partielles des satellites d’une région à l’autre.
d’apprentissage, et un mathématicien du laboratoire de maths appliquées, expert en machine
learning.
Mots clés : machine learning, plasmas astrophysiques, analyse de signal, mesure satellite
Nature : numérique/theorique/signal
Accueil d’un binôme possible : Oui
Personnes à contacter : [email protected]
Téléchargement