Sommaire __________________________________________________________________ 2
INTRODUCTION ________________________________________________________________ 3
Première Partie4:Présentation du datamining et du logiciel sodas ________________________ 4
1 - Objectifs généraux du DATAMINING ____________________________________________ 4
1-1 Caractéristiques et ouvertures l’analyse des données symboliques ______________________________ 4
1-2 Avantages des objets symboliques ______________________________________________________ 5
2- Etude de marché des outils Datamining ____________________________________________ 6
2-1 Panorama des outils existant sur le marché (Benchmark) _____________________________________ 6
2-2 Le logiciel SODAS (Symbolic Official Data Analysis System) ________________________________ 7
3- Description sommaire du mode opératoire _________________________________________ 9
3-1 Les principaux onglets de Sodas ________________________________________________________ 9
3-2 Sélection d’une base d’étude __________________________________________________________ 10
3-3 Choix des méthodes à appliquer _______________________________________________________ 10
Partie 2 : ETUDE STATISTIQUE _________________________________________________ 14
II –1 Présentation de l’étude ______________________________________________________ 14
II –1-1 Contexte de l’étude et présentation des données ________________________________________ 14
II –1-2 L’analyse ______________________________________________________________________ 16
1. DB2SO : extraction de données symboliques de la base de données relationnelles _______________ 16
II-2 Présentation des méthodes et résultats __________________________________________ 21
II-2 -1 Méthode View __________________________________________________________________ 21
a- Présentation de la méthode __________________________________________________________ 21
b. Mise en oeuvre de la méthode View ___________________________________________________ 22
II-2 -2 La méthode STAT _______________________________________________________________ 25
a- Présentation de la méthode STAT_____________________________________________________ 25
b. Mise en oeuvre de la méthode STAT __________________________________________________ 26
II-2 -3 La méthode DIV : Divisive Clustering on Symbolic Objects _______________________________ 30
a- Présentation de la méthode DIV ______________________________________________________ 30
b- Mise en oeuvre de la méthode DIV ___________________________________________________ 31
II-2-4 La méthode TREE : Decision Tree ___________________________________________________ 34
a-Présentation de la méthode TREE _____________________________________________________ 34
b-Mise en oeuvre de la méthode TREE __________________________________________________ 34
II-2-5. La méthode PYR : Pyramical Clustering on Symbolic Objects _____________________________ 35
a- Présentation de la méthode PYR ______________________________________________________ 35
b- Mise en oeuvre de la méthode PYR ___________________________________________________ 36
II-2-6 PCA : Principal Component Analysis _________________________________________________ 36
a- Présentation de la méthode PCA ______________________________________________________ 36
b. Mise en oeuvre de la méthode PCA ___________________________________________________ 37
II-2-7 La méthode DISS/MATCH _________________________________________________________ 39
a- Présentation de la méthode _______________________________________________________ 39
b-Mise en oeuvre de la méthode ________________________________________________________ 39
II-2-8 Les méthodes clustering (SCLUST) __________________________________________________ 40
a- Présentation de la méthode _______________________________________________________ 40
b- Mise en œuvre de la méthode ________________________________________________________ 40
II-2-9 La méthode de SYKSOM __________________________________________________________ 42
Conclusion_______________________________________________________________45