SIMAV PrediRec ICHV – Sion
Table des matières
1 Introduction .......................................................................................................................4
1.1 Présentation du mandant...........................................................................................4
1.2 Contexte du projet......................................................................................................4
1.3 But du développement...............................................................................................4
1.4 Description de l’existant.............................................................................................4
2 Description générale des but de PrediRec........................................................................5
2.1 Vue d’ensemble des fonctionnalités ..........................................................................5
2.2 Plan............................................................................................................................6
2.3 Environnement technique..........................................................................................6
3 Présentation des techniques de Data Mining....................................................................7
3.1 Définition....................................................................................................................7
3.2 Méthodologies du Data Mining ..................................................................................7
3.2.1 Définition du problème........................................................................................8
3.2.2 Préparation des données....................................................................................8
3.2.3 Création du modèle ............................................................................................9
3.2.4 Exploration du modèle........................................................................................9
3.2.5 Validation du modèle..........................................................................................9
3.2.6 Déploiement et mise à jour du modèle...............................................................9
3.3 Tâches du Data Mining..............................................................................................9
3.3.1 Classification.....................................................................................................10
3.3.2 Régression........................................................................................................10
3.3.3 Segmentation – Clustering ...............................................................................10
3.3.4 Association .......................................................................................................10
3.3.5 Analyse de séquence .......................................................................................11
3.4 Technique du Data Mining.......................................................................................11
3.4.1 Le raisonnement à base de cas........................................................................11
3.4.2 Les arbres de décision......................................................................................11
3.4.3 Les algorithmes génétiques..............................................................................11
3.4.4 Les réseaux bayésiens.....................................................................................11
3.4.5 Les réseaux de neurones.................................................................................12
4 Présentation de l’outil de Data Mining.............................................................................13
4.1 Principaux logiciels de Data Mining.........................................................................13
4.1.1 SAS® Enterprise Miner.....................................................................................13
4.1.2 SPSS® Clementine ..........................................................................................13
4.1.3 Microsoft® SQL Server Analysis Services........................................................13
4.2 Choix de l’outil de Data Mining ................................................................................13
4.3 Les types de données..............................................................................................13
4.4 Les types de contenu...............................................................................................14
4.5 Les algorithmes inclus dans SSAS..........................................................................15
4.5.1 Microsoft Decision Trees (MDT).......................................................................15
4.5.2 Microsoft Naive Bayes (MNB)...........................................................................18
4.5.3 Clusters Microsoft.............................................................................................20
4.5.4 Microsoft Neural Network (MNN)......................................................................23
4.5.5 Microsoft Time Series (MTS)............................................................................27
4.5.6 Microsoft Sequence Clustering (MSC) .............................................................29
4.5.7 Algorithme Microsoft Association......................................................................31
5 Description détaillée des fonctionnalités de PrediRec....................................................33
5.1.1 Use Case..........................................................................................................33
5.1.2 Description du Use Case : PrediRec – Utilisation Multi Case...........................34
5.1.3 Diagrammes de séquences..............................................................................35
5.1.4 Interfaces utilisateurs........................................................................................36
Giotta Mathieu 2 / 77 Imprimé le 19 décembre 2007
HES-SO Valais, décembre 2007