INDICE
I. INTRODUCTION .......................................................................................................................................... 4
A. PROBLEMATIQUE ................................................................................................................................ 4
B. OBJECTIF GÉNERALE .......................................................................................................................... 4
II. TRAVAUX PRECEDENTS ......................................................................................................................... 5
Thèse de Nicolas CHAMPAIN ..................................................................................................................... 5
A. ANALYSE FACTORIELLE DISCRIMINANTE ................................................................................... 6
B. OBJECTIF DU PROJET .......................................................................................................................... 6
III. TRAVAUX REALISES .............................................................................................................................. 7
A. DATA MINING ....................................................................................................................................... 7
1. Techniques prédictives de data mining: généralités ............................................................................. 7
2. Techniques inductives et transductives ................................................................................................. 7
3. Etapes des méthodes inductives ............................................................................................................ 7
4. Validation du modèle ............................................................................................................................ 8
B. METHODES STATISTIQUES ................................................................................................................ 9
1. ARBRES DE DECISION ................................................................................................................... 10
2. RESEAU DE NEURONES ................................................................................................................ 11
3. ENSEMBLE LEARNING .................................................................................................................. 14
4. CLUSTERING.................................................................................................................................... 16
5. Q-FINDER .......................................................................................................................................... 18
C. METHODE............................................................................................................................................. 20
IV. RESULTATS ............................................................................................................................................ 23
V. DISCUSSION ET CONCLUSIONS .......................................................................................................... 33
VI. ANNEXES ................................................................................................................................................ 36
A. WEKA .................................................................................................................................................... 37
B. ARBRES DE DECISION ....................................................................................................................... 37
C. RÉSEAUX DE NEURONES ................................................................................................................. 38
D. RULEFIT ............................................................................................................................................... 38
VII. REFERENCES ........................................................................................................................................ 42