Application des techniques des métaheuristiques pour l`optimisation

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientif
euqi
UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN Mohamed Boudiaf
Faculté des Sciences
Département d’informatique
Spécialité: Informatique Option: Systèmes, Réseaux et Bases de Données
(SRBDD)
MEMOIRE Présenté par
Alaoui Abdiya
Pour l'obtention du diplôme de Magister en informatique
Thème
Soutenu le ........................... devant la commission d'examen composée de:
Qualité Nom et Prénom Grade Etb d'origine
Présidente Mme Belbachir Hafida Professeur USTO
Rapporteur Mr. Belkadi Khaled M.C.A USTO
Examinateur Mr. Rahal Sid Ahmed M.C.A USTO
Examinatrice Mme Mekki Rachida M.C.A USTO
Année Universitaire: 2011/2012
Application des techniques des métaheuristiques
pour l’optimisation de la tâche de la classification
de la fouille de données
Je souhaite en premier lieu remercier la personne qui m’a encad et aidé
durant ce mémoire Mr le Docteur KHALED BELKADI de m’avoir donné
l’opportunité de faire cette thèse de magister ainsi que pour ses conseils
judicieux qui m’ont permis d’avancer dans mon travail.
Je remercie Mme le professeur Belbachir Hafida notre responsable de la post-
graduation, et qui m’a fait l’honneur de présider ce jury.
Je remercie Mme Mekki Rachida et Mr Rahal Sid Ahmed, qui m’ont fait
l’honneur d’accepter de participer à ce jury
Je remercie tous mes enseignants de la post-graduation Systèmes, Réseaux et
Bases de Données
Bien entendu, je remercie mes parents et toute la famille pour le soutien moral
qu’ils mont apporté tout au long de ce travail.
Je dédie ce modeste travail en premier lieu à :
Mes parents pour tout le soutien et la patience dont ils ont fait preuve.
Mes frères :
Cheikh
Abdelkader
Mustapha
Mes sœurs:
Fadhila
Nadjet
Mes amis (es)
Résumé:
La sélection d’attributs est une étape de prétraitement qui joue un rôle important dans
la fouille de données. Elle permet de représenter un sous ensemble de données à partir d’un
ensemble volumineux de données et d’éliminer les données redondantes, non pertinentes
ou bruitées. Il y a plusieurs avantages de la sélection de sous ensemble d’attributs : Elle
facilite la visualisation des données et fournit une meilleure compréhension. Elle réduit la
complexité de données d’apprentissage qui va conduire à la réduction du temps de
l’algorithme d’apprentissage. Un autre facteur important est la duction de la dimension
du problème, l’amélioration de la performance de la prédiction et la compréhension du
modèle d’apprentissage. Ceci est réalisé en supprimant les attributs non pertinents à partir
de l’ensemble total des attributs en préservant les avantages mentionnés ci-dessus.
Appliquée à la che de la classification supervisée, la sélection dattributs améliore
la précision et la compréhension du classifieur. La recherche d’un sous ensemble
d’attributs est un problème d’optimisation NP-difficile qui peut être résolu par les méta-
heuristiques. Dans ce travail, nous proposons un algorithme de sélection de sous ensemble
d’attributs pertinents à l’aide d’une métaheuristique « Optimisation par colonies de
Fourmis » et des arbres de décisions plus précisément C4.5 pour construire un modèle
d’apprentissage robuste. Les expérimentations sont réalisées sur des bases de données de
l’UCI (University of California, Irvine). Les résultats expérimentaux de notre approche
sont comparés à ceux obtenus par : l’Algorithme Génétique, la Recherche par Dispersion et
C4.5. Les résultats obtenus sont compétitifs.
Mots clés:
Fouille de données (DataMining), Métaheuristiques, Sélection dattributs, Classification
supervisée, Optimisation par colonies de fourmis, Arbres de décisions (C4.5).
Table des matières
Introduction Générale ................................................................................................................. 1
Chapitre I : La Fouille de données
1.Introduction ............................................................................................................................. 3
2. Extraction de connaissance à partir de données (ECD) .......................................................... 3
2.1 Le processus ECD ............................................................................................................ 4
3. Fouille de données (Datamining) .......................................................................................... 6
3.1 Fouille de données vs statistiques ..................................................................................... 7
3.2 Fouille de données vs informatique décisionnelle (Business intelligence) ...................... 7
3.3 Classification des méthodes de fouille de données .......................................................... 8
3.4 Qu’est ce qu’une donnée .................................................................................................. 9
3.4.1 Les différentes natures d’attributs .......................................................................... 9
3.4.2 Les différentes natures de valeurs d’attributs ......................................................... 9
3.5 Les tâches de fouille de données .................................................................................... 10
3.5.1 Classification supervisée ....................................................................................... 10
3.5.2 Segmentation (clustering) ..................................................................................... 10
3.5.3 Règles d’Association ............................................................................................. 10
4. Classification supervisée ...................................................................................................... 11
4.1 Validation croisée ........................................................................................................... 13
4.2 Les méthodes de la classification supervisée ................................................................. 14
4.2.1 Classifieur bayésien naïf ........................................................................................ 14
4.2.2 Réseaux de Neurones ............................................................................................. 15
4.2.3 Séparateurs à Vaste Marge (SVM) ........................................................................ 15
4.2.4 Plus Proche Voisin (PPV) ...................................................................................... 16
4.2.5 Bagging .................................................................................................................. 16
4.2.6 Boosting ................................................................................................................. 17
4.2.7 Arbres de Décisions ............................................................................................... 17
5 Conclusion ............................................................................................................................. 20
Chapitre II : La Sélection d'Attributs
1. Introduction .......................................................................................................................... 21
2. Objectifs de la sélection d'attributs ....................................................................................... 21
3. Pertinence d’un attribut ........................................................................................................ 23
4. Redondance d’attributs ......................................................................................................... 24
5. Sélection d’attributs .............................................................................................................. 26
6. Schéma général de la sélection d’attributs ........................................................................... 28
6.1 Génération de sous ensemble ......................................................................................... 28
1 / 112 100%

Application des techniques des métaheuristiques pour l`optimisation

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !