Thème
Le clustering des données : une nouvelle approche
évolutionnaire quantique
République Algérienne Démocratique et Populaire
Ministère de Lenseignement Supérieur et de
la Recherche Scientifique
Université Mentouri de Constantine
Faculté des Sciences de lIngénieur
Département dInformatique
N° dordre :
Série :
moire
Présenté en vue de lobtention du diplôme de Magistère en Informatique
Option : Information & Computation
Psenté par : Dirigé par :
RAMDANE CHAFIKA Dr. S. MESHOUL
Soutenu le : / / 2006
Devant le jury dexamen composé de :
Dr. K. KHOLLADI Maître de Conférences, Université de Constantine. Président.
Dr. S. CHIKHI Maître de Conférences, Université de Constantine. Examinateur.
Dr. F. BELLALA Maître de Conférences, Université de Constantine. Examinateur.
Dr. S. MESHOUL Maître de Conférences, Université de Constantine. Rapporteur.
Remerciements
J'adresse ma gratitude sinre à mon Dieu, à chaque fois que je fait face à une difficulté, je
prie Dieu de m'aider et il est toujours là me protége et me sauve.
Je voudrais exprimer mes vifs remerciements à mon encadreur Dr Souhem Meshoul pour son
aide, sa patience et son encouragement. Sans oublier Pr Batouche responsable de léquipe
"Vision et Infographie" pour mavoir accueilli dans son équipe et donné les moyens de faire
ce travail dans de très bonnes conditions.
Je remercie tous les membres du jury qui ont accepté d'évaluer mon travail.
Je remercie tout le personnel du laboratoire LIRE, mes collègues et toutes les personnes qui
mont aidé.
Un grand merci à mes parents pour tous ce quils ont fait pour moi, mes sueurs et frères
Wisseme, Saoussene, Asma, Mohamed Tahar, Abdenour et Selma.
Je tiens à remercier toute personne ayant contribué de près ou de loin à la réalisation de ce
travail.
i
Liste des matières
Introduction générale 01
Chapitre 1 : Extraction de connaissances et clustering 06
1.1 Introduction …………………………………………………………………… 06
1.2 Définitions de lextraction de connaissances à partir de données (ECD)…. 08
1.3 Le processus de lECD………………………………………………………….. 08
1.3.1 Compréhension du domaine dapplication………………………………. 10
1.3.2 Création du jeu de données cible………………………………………... 10
1.3.3 Nettoyage et prétraitement des données………………………………. 10
1.3.4 Réduction et transformation des données………………………………... 11
1.3.5 Fouille de données………………………………………………………. 12
1.3.6 Interprétation et évaluation……………………………………………… 12
1.3.7 Intégration de la connaissance…………………………………………… 13
1.4 Fouille de données : taches et techniques………………………………………. 13
1.4.1 Classification…………………………………………………………….. 13
1.4.2 Analyse des associations et de motifs séquentiels……………………... 14
1.4.3 Le résumé de données…………………………………………………….. 15
1.4.4 La détection des déviations………………………………………………… 15
1.4.5 Régression ………………………………………………………………. 16
1.4.6 Clustering……………………………………………………………… 16
1.5 Le clustering pour la fouille de données ……………………………………. 16
1.5.1 Problèmes typiques et caractéristiques désirables………………………... 17
1.5.2 Applications du clustering à la fouille de données……………………….. 19
1.6 Conclusion……………………………………………………………………... 22
Chapitre 2 : Le Clustering des données 23
Introduction…………………………………………………………………… 24
2.2 Quelques concepts nécessaires ……………………………………………….. 25
2.2.1 La matrice de données …………………………………………………….. 25
2.2.2 La matrice de proximité ………………………………………………… 25
2.2.3 Définitions d'un Cluster …………………………………………………. 26
2.2.4 Types et échelles de données……………. …………………… .. 27
2.2.5 Distance et similarité…………………………………………………….. 28
ii
2.3 Techniques principales de Clustering……………………………………… 29
2.3.1 Clustering par partitionnement ………………………………………….. 29
2.3.2 Clustering hiérarchique ………………………………………………….. 31
2.3.3 Clustering basé sur la densité ……………………………………………. 36
2.3.4 Clustering basé sur la grille………………………………………………. 37
2.4 Métaheuristiques pour le Clustering…………………………………………... 38
2.4.1 Clustering par algorithmes évolutionnaires……………………………… 39
2.4.2 Clustering par fourmis artificielles………………………………………. 42
2.4.3 Clustering par essaim de particules………………………………………… 44
2.4.4 Clustering par système immunitaire artificiel……………………………… 45
2.5 Autres types de Clustering…………………………………………………….. 46
2.5.1 Clustering multiobjectif…………………………………………………….. 46
2.5.2 Clustering flou……………………………………………………………. 48
2.6 Techniques de validation de Clustering…………………………………………. 49
2.6.1 Mesures externes………………………………………………………… 49
2.6.2 Mesures internes…………………………………………………………. 51
2.7 Conclusion………………………………………………………………………. 54
Chapitre 3 : Les principes de base de l’informatique quantique 55
3.1. Introduction…………………………………………………………………… 56
3.2 Mécanique quantique…………………………………………………………. 56
3.2.1 Expérience de la polarisation des photons………………………………….. 57
3.2.2 Les quatre postulats de la mécanique quantique……………………………. 61
3.2.3 Espaces d'états de Hilbert, notation de Dirac et produit tensoriel ………… 61
3.3 Informatique quantique……………………………………………………… 62
3.3.1 Bit quantique (qubit)……………………………………………………….. 63
3.3.2 Registre quantique ……………………………………………………….. 64
3.3.3 Les principes de linformatique quantique……………………………….. 65
3.3.4 La mesure quantique……………………………………………………....... 67
3.3.5 Calcul quantique et opération logique quantique…………………………… 68
3.3.6 Portes et circuits quantiques………………………………………………… 68
3.3.7 Les algorithmes quantiques…………………………………………………. 69
3.3.8 Les ordinateurs quantiques : rêve ou réalité………………………………… 70
3.4 Algorithmes inspis du quantique……………………………………………... 71
3.4.1 Principe dalgorithme évolutionnaire quantique……………………………. 72
3.4.2 Représentation quantique des individus ……………………………………. 73
3.4.2 Structure générale dun algorithme quantique évolutionnaire…………… 74
iii
3.4.3 La mesure………………………………………………………………… 74
3.4.4 Interférence et opérateur quantique……………………………………… 75
3.4.5 Migration globale et locale…………………………………………………. 76
Conclusion………………………………………………………………………... 76
Chapitre 4 : Une approche évolutionnaire quantique pour le
Clustering des données
77
4.1 Introduction……………………………………………………………………….. 78
4.2 Formulation du problème…………………………………………………………… 79
4.3 Complexité du problème de clustering……………………………………… 79
4.4 Une approche évolutionnaire quantique pour le Clustering des données QEAC 80
4.4.1 Représentation Quantique dune partition ………………………………….. 80
4.4.2 Principe de lapproche proposée QEAC……………………………………. 81
4.4.3 Fonction objective …………………………………………………………. 83
4.4.4 Létape dinitialisation ………………………………………………… 83
4.4.5 Mesure de la population quantique………………………………………... 84
4.4.6 Létape Réparer………………………………………………………… 84
4.4.7 Létape dinterférence ……………………………………………………… 85
4.5 Une deuxième approche évolutionnaire quantique pour le Clustering des
données QEAC2……………………………………………………………………
86
4.5.2 Principe de lalgorithme QEAC2………………………………………….. 86
4.5.3 Létape dinterférence …………………………………………………….. 88
4.5.4 Etape de régénération…………………………………………………… 88
4.5.5 Migration Global et locale…………………………………………………... 89
4.6 Résultats expérimentaux…………………………………………………………..
89
4.6.1 Evaluation…………………………………………………………………… 89
4.6.2 Jeux de données ………………………………………………………….. 89
4.6.3 Paramètres utilisés……………………………………………………… 93
4.6.4 Résultas………………………………………………………………… 94
4.7 Le rôle de nos algorithmes dans un processus dextraction de connaissance à
partir de données
.......................................................
..................................................
104
4.8 Conclusion et travaux futurs…………………………………………………… 105
Conclusion générale…………………………… 108
Bibliographie…………………………….. 111
Annexe A: Descriptif des jeux de données els pour le clustering………………… 119
A.1 Iris…………………………………………………………………………. 119
A.2 Dermatology………………………………………………………………. 120
1 / 140 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !