
 
Sommaire __________________________________________________________________ 2 
INTRODUCTION ________________________________________________________________ 3 
Première Partie4:Présentation du datamining et du logiciel sodas ________________________ 4 
1 - Objectifs généraux du DATAMINING ____________________________________________ 4 
1-1 Caractéristiques et ouvertures l’analyse des données symboliques ______________________________ 4 
1-2 Avantages des objets symboliques  ______________________________________________________ 5 
2- Etude de marché des outils Datamining ____________________________________________ 6 
2-1 Panorama des outils existant sur le marché (Benchmark) _____________________________________ 6 
2-2 Le logiciel SODAS (Symbolic Official Data Analysis System) ________________________________ 7 
3- Description sommaire du mode opératoire _________________________________________ 9 
3-1 Les principaux onglets de Sodas ________________________________________________________ 9 
3-2 Sélection d’une base d’étude __________________________________________________________ 10 
3-3 Choix des méthodes à appliquer _______________________________________________________ 10 
Partie 2 : ETUDE STATISTIQUE _________________________________________________ 14 
II –1 Présentation de l’étude  ______________________________________________________ 14 
II –1-1 Contexte de l’étude et présentation des données ________________________________________ 14 
II –1-2  L’analyse ______________________________________________________________________ 16 
1. DB2SO : extraction de données symboliques de la base de données relationnelles _______________ 16 
II-2 Présentation des méthodes et résultats __________________________________________ 21 
II-2 -1 Méthode View __________________________________________________________________ 21 
a- Présentation de la méthode __________________________________________________________ 21 
b. Mise en oeuvre de la méthode View ___________________________________________________ 22 
II-2 -2 La méthode STAT _______________________________________________________________ 25 
a- Présentation de la méthode STAT_____________________________________________________ 25 
b. Mise en oeuvre de la méthode STAT __________________________________________________ 26 
II-2 -3 La méthode DIV : Divisive Clustering on Symbolic Objects _______________________________ 30 
a- Présentation de la méthode DIV ______________________________________________________ 30 
b- Mise en oeuvre de la méthode DIV  ___________________________________________________ 31 
II-2-4 La méthode TREE : Decision Tree ___________________________________________________ 34 
a-Présentation de la méthode TREE _____________________________________________________ 34 
b-Mise en oeuvre de la méthode TREE  __________________________________________________ 34 
II-2-5. La méthode PYR : Pyramical Clustering on Symbolic Objects _____________________________ 35 
a- Présentation de la méthode PYR ______________________________________________________ 35 
b- Mise en oeuvre de la méthode PYR ___________________________________________________ 36 
II-2-6 PCA : Principal Component Analysis _________________________________________________ 36 
a- Présentation de la méthode PCA ______________________________________________________ 36 
b. Mise en oeuvre de la méthode PCA ___________________________________________________ 37 
II-2-7 La méthode DISS/MATCH _________________________________________________________ 39 
a- Présentation de la méthode _______________________________________________________ 39 
b-Mise en oeuvre de la méthode ________________________________________________________ 39 
II-2-8 Les méthodes clustering (SCLUST) __________________________________________________ 40 
a- Présentation de la méthode _______________________________________________________ 40 
b- Mise en œuvre de la méthode ________________________________________________________ 40 
II-2-9 La méthode de SYKSOM __________________________________________________________ 42 
     
Conclusion_______________________________________________________________45