Table des matières
Introduction Générale ................................................................................................................. 1
Chapitre I : La Fouille de données
1.Introduction ............................................................................................................................. 3
2. Extraction de connaissance à partir de données (ECD) .......................................................... 3
2.1 Le processus ECD ............................................................................................................ 4
3. Fouille de données (Datamining) .......................................................................................... 6
3.1 Fouille de données vs statistiques ..................................................................................... 7
3.2 Fouille de données vs informatique décisionnelle (Business intelligence) ...................... 7
3.3 Classification des méthodes de fouille de données .......................................................... 8
3.4 Qu’est ce qu’une donnée .................................................................................................. 9
3.4.1 Les différentes natures d’attributs .......................................................................... 9
3.4.2 Les différentes natures de valeurs d’attributs ......................................................... 9
3.5 Les tâches de fouille de données .................................................................................... 10
3.5.1 Classification supervisée ....................................................................................... 10
3.5.2 Segmentation (clustering) ..................................................................................... 10
3.5.3 Règles d’Association ............................................................................................. 10
4. Classification supervisée ...................................................................................................... 11
4.1 Validation croisée ........................................................................................................... 13
4.2 Les méthodes de la classification supervisée ................................................................. 14
4.2.1 Classifieur bayésien naïf ........................................................................................ 14
4.2.2 Réseaux de Neurones ............................................................................................. 15
4.2.3 Séparateurs à Vaste Marge (SVM) ........................................................................ 15
4.2.4 Plus Proche Voisin (PPV) ...................................................................................... 16
4.2.5 Bagging .................................................................................................................. 16
4.2.6 Boosting ................................................................................................................. 17
4.2.7 Arbres de Décisions ............................................................................................... 17
5 Conclusion ............................................................................................................................. 20
Chapitre II : La Sélection d'Attributs
1. Introduction .......................................................................................................................... 21
2. Objectifs de la sélection d'attributs ....................................................................................... 21
3. Pertinence d’un attribut ........................................................................................................ 23
4. Redondance d’attributs ......................................................................................................... 24
5. Sélection d’attributs .............................................................................................................. 26
6. Schéma général de la sélection d’attributs ........................................................................... 28
6.1 Génération de sous ensemble ......................................................................................... 28