Application des techniques des métaheuristiques pour l`optimisation

Téléchargement

République Algérienne Démocratique et Populaire



Ministère de l’Enseignement Supérieur et de la Recherche Scientif

euqi

UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN Mohamed Boudiaf

Faculté des Sciences

Département d’informatique

Spécialité: Informatique Option: Systèmes, Réseaux et Bases de Données

(SRBDD)

MEMOIRE Présenté par

Alaoui Abdiya

Pour l'obtention du diplôme de Magister en informatique

Thème

Soutenu le ........................... devant la commission d'examen composée de:

Qualité Nom et Prénom Grade Etb d'origine

Présidente Mme Belbachir Hafida Professeur USTO

Rapporteur Mr. Belkadi Khaled M.C.A USTO

Examinateur Mr. Rahal Sid Ahmed M.C.A USTO

Examinatrice Mme Mekki Rachida M.C.A USTO

Année Universitaire: 2011/2012

Application des techniques des métaheuristiques

pour l’optimisation de la tâche de la classification

de la fouille de données

Je souhaite en premier lieu remercier la personne qui m’a encadré et aidé

durant ce mémoire Mr le Docteur KHALED BELKADI de m’avoir donné

l’opportunité de faire cette thèse de magister ainsi que pour ses conseils

judicieux qui m’ont permis d’avancer dans mon travail.

Je remercie Mme le professeur Belbachir Hafida notre responsable de la post-

graduation, et qui m’a fait l’honneur de présider ce jury.

Je remercie Mme Mekki Rachida et Mr Rahal Sid Ahmed, qui m’ont fait

l’honneur d’accepter de participer à ce jury

Je remercie tous mes enseignants de la post-graduation Systèmes, Réseaux et

Bases de Données

Bien entendu, je remercie mes parents et toute la famille pour le soutien moral

qu’ils m’ont apporté tout au long de ce travail.

Je dédie ce modeste travail en premier lieu à :

Mes parents pour tout le soutien et la patience dont ils ont fait preuve.

Mes frères :

Cheikh

Abdelkader

Mustapha

Mes sœurs:

Fadhila

Nadjet

Mes amis (es)

Résumé:

La sélection d’attributs est une étape de prétraitement qui joue un rôle important dans

la fouille de données. Elle permet de représenter un sous ensemble de données à partir d’un

ensemble volumineux de données et d’éliminer les données redondantes, non pertinentes

ou bruitées. Il y a plusieurs avantages de la sélection de sous ensemble d’attributs : Elle

facilite la visualisation des données et fournit une meilleure compréhension. Elle réduit la

complexité de données d’apprentissage qui va conduire à la réduction du temps de

l’algorithme d’apprentissage. Un autre facteur important est la réduction de la dimension

du problème, l’amélioration de la performance de la prédiction et la compréhension du

modèle d’apprentissage. Ceci est réalisé en supprimant les attributs non pertinents à partir

de l’ensemble total des attributs en préservant les avantages mentionnés ci-dessus.

Appliquée à la tâche de la classification supervisée, la sélection d’attributs améliore

la précision et la compréhension du classifieur. La recherche d’un sous ensemble

d’attributs est un problème d’optimisation NP-difficile qui peut être résolu par les méta-

heuristiques. Dans ce travail, nous proposons un algorithme de sélection de sous ensemble

d’attributs pertinents à l’aide d’une métaheuristique « Optimisation par colonies de

Fourmis » et des arbres de décisions plus précisément C4.5 pour construire un modèle

d’apprentissage robuste. Les expérimentations sont réalisées sur des bases de données de

l’UCI (University of California, Irvine). Les résultats expérimentaux de notre approche

sont comparés à ceux obtenus par : l’Algorithme Génétique, la Recherche par Dispersion et

C4.5. Les résultats obtenus sont compétitifs.

Mots clés:

Fouille de données (DataMining), Métaheuristiques, Sélection d’attributs, Classification

supervisée, Optimisation par colonies de fourmis, Arbres de décisions (C4.5).

Table des matières

Introduction Générale ................................................................................................................. 1

Chapitre I : La Fouille de données

1.Introduction ............................................................................................................................. 3

2. Extraction de connaissance à partir de données (ECD) .......................................................... 3

2.1 Le processus ECD ............................................................................................................ 4

3. Fouille de données (Datamining) .......................................................................................... 6

3.1 Fouille de données vs statistiques ..................................................................................... 7

3.2 Fouille de données vs informatique décisionnelle (Business intelligence) ...................... 7

3.3 Classification des méthodes de fouille de données .......................................................... 8

3.4 Qu’est ce qu’une donnée .................................................................................................. 9

3.4.1 Les différentes natures d’attributs .......................................................................... 9

3.4.2 Les différentes natures de valeurs d’attributs ......................................................... 9

3.5 Les tâches de fouille de données .................................................................................... 10

3.5.1 Classification supervisée ....................................................................................... 10

3.5.2 Segmentation (clustering) ..................................................................................... 10

3.5.3 Règles d’Association ............................................................................................. 10

4. Classification supervisée ...................................................................................................... 11

4.1 Validation croisée ........................................................................................................... 13

4.2 Les méthodes de la classification supervisée ................................................................. 14

4.2.1 Classifieur bayésien naïf ........................................................................................ 14

4.2.2 Réseaux de Neurones ............................................................................................. 15

4.2.3 Séparateurs à Vaste Marge (SVM) ........................................................................ 15

4.2.4 Plus Proche Voisin (PPV) ...................................................................................... 16

4.2.5 Bagging .................................................................................................................. 16

4.2.6 Boosting ................................................................................................................. 17

4.2.7 Arbres de Décisions ............................................................................................... 17

5 Conclusion ............................................................................................................................. 20

Chapitre II : La Sélection d'Attributs

1. Introduction .......................................................................................................................... 21

2. Objectifs de la sélection d'attributs ....................................................................................... 21

3. Pertinence d’un attribut ........................................................................................................ 23

4. Redondance d’attributs ......................................................................................................... 24

5. Sélection d’attributs .............................................................................................................. 26

6. Schéma général de la sélection d’attributs ........................................................................... 28

6.1 Génération de sous ensemble ......................................................................................... 28

100

101

102

103

104

105

106

107

108

109

110

111

112

1 / 112 100%

Documents connexes

la présence de caractères communs et l`évolution

analyse d`images Visite de l`exposition Manifesto - Lycée Saint

Formation Python

Création de schéma On s`intéresse à une base de données de

Préparation Java pour le TP Système Distribué - E

Faire tourner l`algorithme de gauche « à la main » pour A = 15

Attributs de la personne

seance_en_section_de_grands_le_vivant

Fiche d'identification d'un être vivant

Structuration semi-supervisée des données complexes

G8 : exercices de la page 42

to get the file

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Application des techniques des métaheuristiques pour l`optimisation

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Application des techniques des métaheuristiques pour l`optimisation

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib