Mémoire de fin détudes
Pour lobtention du diplôme dIngénieur dEtat en Informatique
Option : Systèmes informatiques
Thème
Application de techniques de data mining pour la classification
automatique des données et la recherche dassociations
Réalisé
par
Encadré par
-
MENOUER Tarek
- DERMOUCHE Mohamed
-
Mlle K. BENATCHBA
- Mer F. DAHAMNI
Promotion : 2009 / 2010
II
dicaces
A mes parents qui mont donle jour.
A toi mare, dont lamour et le soutien à chaque moment de ma vie mont doncourage,
force et mont permis darriver à ce niveau. Mille fois merci pour tous tes sacrifices. Les mots
sont ts faibles pour te laffirmer : tu es et resteras la personne la plus importante pour moi.
A toi mon re qui a guidé mes pas. Merci pour tes conseils, ta psence constante et toute
lattention que tu as toujours portée à mon évolution. Mille fois merci pour ce grand amour
que tu as pour nous, tes enfants, dont je suis heureux et fier de faire partie.
Mohamed.
A mes très chers parents qui ont toujours é pour moi, et qui m'ont donné un magnifique
mole de labeur et de persévérance. J'espère qu'ils trouveront dans ce travail toute ma
reconnaissance et tout mon amour.
Merci maman, Merci papa.
Tarek.
III
Remerciements
Cette œuvre a vu le jour grâce au concours de plusieurs personnes. Je saisis cette occasion
pour exprimer mes sincères remerciements à tous ceux qui, de près comme de loin, ont
contribué à la mise en œuvre de ce moire.
Je remercie mes promoteurs, Mlle BENATCHBA et Mer DAHAMNI, qui ont bien voulu
sacrifier leurs préoccupations en ne ménageant aucun effort pour suivre ce travail.
Je remercie Mlle. BOUSBIA pour lattention et tous les conseils édifiants quelle nous a
prodigués tout au long de ce travail.
Je remercie les membres du jury qui ont bien voulu sanctionner ce travail.
Merci à Mer BERRACHEDI Abdelkrim pour toute laide quil a consentie pour le bon
roulement de ma formation.
Je dis merci à toutes mes fres et sœurs Samia, Amel, Said, Ahmed, Hayet et à tous les
membres de ma famille, notamment ma grand-mère Mama et mon oncle Athmane.
Dans le me ordre d'idées, je remercie tous mes amis et ceux dont les noms ne figurent
pas dans cette page, mais qui ont tous constitué pour moi un soutien certain, je pense
notamment à Soumia, Amine, Tarek et Abdeldjalil.
Mohamed.
En premier lieu, je veux remercier Mlle BENATCHBA qui nous a encadrés durant cette
année, pour ses conseils, son dévouement constant et son entière disponibilité.
Je tiens aussi à remercier Mer DAHAMNI, notre encadreur, pour son aide et ces remarques
précieuses.
Mes vifs remerciements vont à tous les membres du Laboratoire des Méthodes de
Conception des Systèmes (LMCS) pour leur accueil et leur sympathie.
Jexprime ma profonde gratitude à lensemble des enseignants de lESI. En particulier Mer
AIT AOUDIA et tout le personnel de lESI.
Que les membres du jury trouvent ici le témoignage de notre reconnaissance pour avoir bien
voulu juger notre travail.
A mes chers fres et sœurs : Ouassila, Anissa, Merouane, Meriem et Mouni.
Je remercie toutes les personnes qui ont constitué, pour moi, un soutien certain,
spécialement Kenza et notamment Mohamed et Abdeldjalil.
Tarek.
IV
Table des matières
sumé ............................................................................................................................. VIII
Liste des figures .................................................................................................................. X
Liste des tableaux ............................................................................................................. XII
Liste des algorithmes ....................................................................................................... XIII
Introduction rale ...........................................................................................................1
Chapitre I : Concepts et généralités sur le data mining et le processus ECD .................3
1. Introduction .....................................................................................................................4
2. Le processus ECD .........................................................................................................4
2.1. Définition ..................................................................................................................4
2.2. Etapes du processus ECD .......................................................................................4
3. Le data mining .................................................................................................................8
3.1. Définition ..................................................................................................................8
3.2. Principe ....................................................................................................................8
3.3. ches de data mining .............................................................................................8
3.4. Techniques de data mining ......................................................................................9
3.5. Domaines dapplication ..........................................................................................10
3.6. Difficultés de data mining .......................................................................................10
4. Conclusion ....................................................................................................................11
Chapitre II : Etat de lart sur les techniques de data mining............................................12
1. Introduction ...................................................................................................................13
2. La classification automatique non supervisée ................................................................13
2.1. Introduction ............................................................................................................13
2.2. Définition ................................................................................................................14
2.3. Terminologie ..........................................................................................................14
2.4. Les algorithmes de clustering .................................................................................17
2.4.1. Les algorithmes de partitionnement .................................................................17
2.4.1.1. Lalgorithme k-Means ...............................................................................17
2.4.1.2. Lalgorithme k-Medoids ............................................................................19
2.4.1.3. Lalgorithme PAM .....................................................................................20
2.4.1.4. Lalgorithme CLARA .................................................................................20
2.4.1.5. Lalgorithme CLARANS ............................................................................20
V
2.4.2. Les algorithmes hiérarchiques .........................................................................21
2.4.2.1. Lalgorithme BIRCH .................................................................................22
2.4.2.2. Lalgorithme DIANA ..................................................................................22
2.4.3. Les algorithmes basés sur la densité ..............................................................23
2.4.3.1. Lalgorithme DBSCAN ..............................................................................24
2.4.3.2. Lalgorithme OPTICS ...............................................................................25
2.4.4. Autres algorithmes ..........................................................................................25
2.4.4.1. Les algorithmes basés sur la grille ...........................................................25
2.4.4.2. Les algorithmes basés sur les statistiques ...............................................25
2.5. Conclusion .............................................................................................................26
3. La classification automatique supervisée ......................................................................26
3.1. Introduction ............................................................................................................26
3.2. Problématique ........................................................................................................27
3.3. Les algorithmes de classification ............................................................................27
3.3.1. Les arbres de décision ....................................................................................27
3.3.2. Lalgorithme k-NN ...........................................................................................29
3.3.3. Les réseaux de neurones ................................................................................30
3.3.4. Autres méthodes de classification ...................................................................31
3.3.4.1. Les réseaux bayésiens.............................................................................31
3.4. Conclusion .............................................................................................................32
4. Les règles dassociation ................................................................................................32
4.1. Introduction ............................................................................................................32
4.2. Problématique ........................................................................................................33
4.3. Définitions ..............................................................................................................33
4.4. Les algorithmes de recherche dassociations .........................................................34
4.4.1. Lalgorithme Apriori .........................................................................................34
4.4.2. Lalgorithme FP-Growth ..................................................................................35
4.5. Conclusion .............................................................................................................35
5. Conclusion ....................................................................................................................36
Chapitre III : Conception et mise en œuvre ......................................................................37
1. Introduction ...................................................................................................................38
2. Architecture générale de lapplication ............................................................................38
2.1. Module de lecture ...................................................................................................38
2.1.1. Accès aux données .........................................................................................39
2.1.2. Nettoyage des données ..................................................................................39
1 / 118 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !