Machine Learning : application à la finance Objectifs de l’enseignement : Depuis quelques années, l’informatisation croissante des marchés financiers et le fractionnement des ordres a rendu possible la collecte de données (prix, volumes échangées …) en très grande quantité (plusieurs terabytes par jour). Ces données contiennent une masse importante d’information qui peut désormais être exploitée grâce à des techniques d’apprentissage machine (Machine Learning en anglais). L’idée est de faire de l’analyse exploratoire dans le but d’extraire l’information contenue dans les données. C’est ainsi que nous tenterons dans ce cours d’exploiter les propriétés des méthodes issues du Machine Learning (ou encore, apprentissage statistique) pour réaliser des exercices de classification et de prévision à partir de séries temporelles financières afin de construire un système de trading algorithmique basé essentiellement sur la capacité prédictive de ces modèles. Plan : 1. Introduction à l’apprentissage statistique 1.1. 1.2. 1.3. 1.4. Exemples de cas pratiques et applications financières Introduction à la théorie de l’apprentissage Risque réel versus risque empirique Notion d’arbitrage biais/variance 2. Classification avec les méthodes d’ensembles (ensemble learning) 2.1. Arbre de décision (algorithme C.A.R.T.) 2.1.1. Méthodologie et principes de construction 2.1.2. Inconvénients de cet algorithme élémentaire 2.1.3. Application MATLAB 2.2. Forêts aléatoires d’arbres décisionnels (algorithme Random Forest) 2.2.1. Méthodologie et principes de construction 2.2.2. Etude de la sensibilité aux différents paramètres 2.2.3. Application MATLAB 2.3. Algorithme AdaBoost.M1 et principe du boosting (application MATLAB) 3. Introduction à l’algorithme SVM (Support Vector Machines) pour la classification 4. Construction d’un système de trading Cette dernière partie du cours sera consacré à l’étude de la mise en place d’un système de trading Long/Short exploitant la capacité prédictive des algorithmes précédents (l’accent sera mis sur l’algo Random Forest). Méthodes d’enseignement : - Cours et application sur R/MatLab Pré requis : - Notions d’économétrie non paramétrique. Aisance dans la programmation. Bibliographie : FRIEDMAN J., HASTIE T., and TIBSHIRANI R. [2001], “The Elements of Statistical Learning: Data Mining, Inference and Prediction”, Springer Verlag, 768 pages. KUHN M. and JOHNSON K. [2013], “Applied Predictive Modeling”, Springer Verlag, 620 pages.