Machine Learning : application à la finance
Objectifs de l’enseignement :
Depuis quelques années, l’informatisation croissante des marchés financiers et le
fractionnement des ordres a rendu possible la collecte de données (prix, volumes échangées
…) en très grande quantité (plusieurs terabytes par jour). Ces données contiennent une
masse importante d’information qui peut désormais être exploitée grâce à des techniques
d’apprentissage machine (Machine Learning en anglais). L’idée est de faire de l’analyse
exploratoire dans le but d’extraire l’information contenue dans les données.
C’est ainsi que nous tenterons dans ce cours d’exploiter les propriétés des méthodes issues
du Machine Learning (ou encore, apprentissage statistique) pour réaliser des exercices de
classification et de prévision à partir de séries temporelles financières afin de construire un
système de trading algorithmique basé essentiellement sur la capacité prédictive de ces
modèles.
Plan :
1. Introduction à l’apprentissage statistique
1.1. Exemples de cas pratiques et applications financières
1.2. Introduction à la théorie de l’apprentissage
1.3. Risque réel versus risque empirique
1.4. Notion d’arbitrage biais/variance
2. Classification avec les méthodes d’ensembles (ensemble learning)
2.1. Arbre de décision (algorithme C.A.R.T.)
2.1.1. Méthodologie et principes de construction
2.1.2. Inconvénients de cet algorithme élémentaire
2.1.3. Application MATLAB
2.2. Forêts aléatoires d’arbres décisionnels (algorithme Random Forest)
2.2.1. Méthodologie et principes de construction
2.2.2. Etude de la sensibilité aux différents paramètres
2.2.3. Application MATLAB
2.3. Algorithme AdaBoost.M1 et principe du boosting (application MATLAB)
3. Introduction à l’algorithme SVM (Support Vector Machines) pour la classification
4. Construction d’un système de trading