Machine Learning : application à la finance

publicité
Machine Learning : application à la finance
Objectifs de l’enseignement :
Depuis quelques années, l’informatisation croissante des marchés financiers et le
fractionnement des ordres a rendu possible la collecte de données (prix, volumes échangées
…) en très grande quantité (plusieurs terabytes par jour). Ces données contiennent une
masse importante d’information qui peut désormais être exploitée grâce à des techniques
d’apprentissage machine (Machine Learning en anglais). L’idée est de faire de l’analyse
exploratoire dans le but d’extraire l’information contenue dans les données.
C’est ainsi que nous tenterons dans ce cours d’exploiter les propriétés des méthodes issues
du Machine Learning (ou encore, apprentissage statistique) pour réaliser des exercices de
classification et de prévision à partir de séries temporelles financières afin de construire un
système de trading algorithmique basé essentiellement sur la capacité prédictive de ces
modèles.
Plan :
1. Introduction à l’apprentissage statistique
1.1.
1.2.
1.3.
1.4.
Exemples de cas pratiques et applications financières
Introduction à la théorie de l’apprentissage
Risque réel versus risque empirique
Notion d’arbitrage biais/variance
2. Classification avec les méthodes d’ensembles (ensemble learning)
2.1. Arbre de décision (algorithme C.A.R.T.)
2.1.1. Méthodologie et principes de construction
2.1.2. Inconvénients de cet algorithme élémentaire
2.1.3. Application MATLAB
2.2. Forêts aléatoires d’arbres décisionnels (algorithme Random Forest)
2.2.1. Méthodologie et principes de construction
2.2.2. Etude de la sensibilité aux différents paramètres
2.2.3. Application MATLAB
2.3. Algorithme AdaBoost.M1 et principe du boosting (application MATLAB)
3. Introduction à l’algorithme SVM (Support Vector Machines) pour la classification
4. Construction d’un système de trading
Cette dernière partie du cours sera consacré à l’étude de la mise en place d’un système de trading
Long/Short exploitant la capacité prédictive des algorithmes précédents (l’accent sera mis sur l’algo
Random Forest).
Méthodes d’enseignement :
-
Cours et application sur R/MatLab
Pré requis :
-
Notions d’économétrie non paramétrique.
Aisance dans la programmation.
Bibliographie :
FRIEDMAN J., HASTIE T., and TIBSHIRANI R. [2001], “The Elements of Statistical Learning:
Data Mining, Inference and Prediction”, Springer Verlag, 768 pages.
KUHN M. and JOHNSON K. [2013], “Applied Predictive Modeling”, Springer Verlag, 620
pages.
Téléchargement
Explore flashcards