Proposition de stage de DEA Informatique et Systèmes Intelligents

publicité
Proposition de stage Master 2 ou Ingénieur - 2017
Sujet : Construction de descripteurs/prédicteurs à partir de séries temporelles multi-dimensionnelles
(Feature extraction/engineering from multidimensional time series)
De très nombreuses données issues des différentes activités du Groupe EDF sont disponibles sous forme de séries temporelles :
capteurs sur les machines de production d’électricité, capteurs sur les réseaux électriques, compteurs électriques chez les clients,
objets connectés dans la maison et la ville, …
L’utilisation de ces données avec les outils de la data science permet d’optimiser les processus internes de l’entreprise (par
exemple pour la maintenance des équipements) ou bien de développer de nouveaux services à valeur ajoutée (par exemple des
systèmes de recommandation d’économie d’énergie chez les clients). Ces outils permettent d’explorer les données (recherche
d’information, visualisation, analyse exploratoire et apprentissage non supervisé) ou bien de prédire des comportements à partir
des données (analyse prédictive, apprentissage non supervisé). La prise en compte des séries temporelles dans la data science se
heurte au problème de l’adéquation de la représentation de ces séries en lien avec la question posée, en particulier dans le cas
des séries temporelles multi-dimensionnelles (observation de plusieurs capteurs). De très nombreuses approches de
représentation existent : vectorielles, fonctionnelles, shapelets, … comme en témoigne l’abondante littérature sur le sujet.
Dans ce contexte, les principales étapes du stage seront les suivantes :




Réalisation d’une étude bibliographique sur les approches de construction de descripteurs de séries temporelles multidimensionnelles, dans une optique de prédiction
Sélection et proposition d’approches pertinentes pour deux cas d’utilisation dans le domaine de l’énergie : données de
capteurs sur les machines des moyens de production d’électricité (dans une perspective de maintenance prédictive),
données d’usage des appareils dans la maison (dans une perspective de détection d’anomalies)
Programmation des approches retenues (langage R ou Python) et réalisation d’expérimentations sur des données réelles
et synthétiques
Rédaction d’un rapport de stage et éventuellement d’une publication scientifique sur les résultats obtenus
Si le candidat donne satisfaction, une poursuite des travaux en thèse CIFRE sera envisagée.
Références bibliographiques :








“Mining Time Series Data”, C.A.Ratanamahatana, J.Lin, D.Gunopulos, E.Keogh, M.Vlachos, G.Das,
https://cs.gmu.edu/~jessica/BookChapterTSMining.pdf
“A review on time series data mining”, T.Fu, Engineering Applications of Artificial Intelligence 24 (2011), 164-180.
“Feature Extraction Foundations and Applications”, Guyon, I., Gunn, S., Nikravesh, M., Zadeh, L.A. (Eds.), Springer
2006.
“Feature Extraction Method for Multivariate Time Series Classification Using Temporal Patterns”, P.Y.Zhou,
K.C.C.Chan, Conférence PAKDD 2015.
“Feature Extraction over Multiple Representations for Time Series Classification”, D.Gay, R.Guigourès, M.Boullé,
F.Clérot, Workshop NFMCP, ECML-PKDD 2013, également LNAI 8399, pp. 18–34, 2014.
“Multi-Scale Convolutional Neural Networks for Time Series Classification”, Z.Cui, W.Chen, Y.Chen,
https://arxiv.org/abs/1603.06995
“Feature Selection and Classification Techniques for Multivariate Time Series”, B.Chakraborty, Conférence ICICIC
'07, 2007.
“Forecasting Monthly Electric Energy Consumption Using Feature Extraction”, M.Meng, D.Niu, W.Sun, Energies
2011, 4, 1495-1507, 2011.
Profil attendu :
 Master M2 ou spécialisation ingénieur en science des données, statistique, apprentissage
 Programmation en langage R et/ou Python, connaissance des bibliothèques de machine learning (ex. Sci Kit Learn)
Encadrant et lieu du stage :
Georges Hébrail, EDF R&D, Département ICAME : [email protected]
EDF Lab Saclay
7, Bd Gaspard Monge
91120 PALAISEAU
Durée : 5 à 6 mois entre Mars 2017 et Août 2017
Rémunération : entre 1000 et 1300 euros brut mensuels suivant la formation suivie
Téléchargement