3
Sommaire
Introduction
IntroductionIntroduction
Introduction............................................................................................................................... 4
1) Le sujet de stage initial ..................................................................................................... 4
2) Présentation de l’entreprise ............................................................................................. 5
3) Connaissances antérieures .............................................................................................. 6
4) Les moyens mis à disposition .......................................................................................... 7
5) Les retombées potentielles du stage .............................................................................. 7
Partie I) Aspects organisationnels
Partie I) Aspects organisationnelsPartie I) Aspects organisationnels
Partie I) Aspects organisationnels ........................................................................................... 8
1) Découpage du stage ........................................................................................................ 8
2) Respect des délais et critiques du découpage ............................................................. 12
3) Nature et fréquence des points de contrôle ................................................................. 12
4) Gestion des crises .......................................................................................................... 13
Partie II) Clustering basé sur une représentation supervisée
Partie II) Clustering basé sur une représentation superviséePartie II) Clustering basé sur une représentation supervisée
Partie II) Clustering basé sur une représentation supervisée .............................................. 14
1) Notations ......................................................................................................................... 14
2) Les différentes méthodes de clustering basées sur le partitionnement ..................... 15
2.1) K-moyennes .............................................................................................................. 15
2.2) K-médianes ............................................................................................................... 16
2.3) K-modes .................................................................................................................... 18
2.4) K-prototypes ............................................................................................................. 18
2.5) K-médoïdes ............................................................................................................... 19
2.6) Choix d’une méthode de clustering .......................................................................... 23
3) Paramétrage de la méthode de clustering .................................................................... 24
3.1) Choisir la méthode d’initialisation. ............................................................................ 24
3.2) Choisir la valeur de k. ................................................................................................ 36
3.3) Choisir une fonction de distance / une métrique. ..................................................... 36
4) Représentation supervisée des données ...................................................................... 39
4.1) Notre définition d’une représentation supervisée des données ............................... 39
4.2) La représentation brute ............................................................................................. 40
4.3) La représentation issue des connaissances d’une classification par Kxen(K2R) ...... 40
4.4) La représentation issue des connaissances d’une classification par khiops ............ 41
4.5) L’algorithme supervisé utilisé en comparaison ......................................................... 41
5) Analyse de l’influence de la représentation sur la qualité du clustering ..................... 42
5.1) Méthodologie d’évaluation du clustering. ................................................................. 42
5.2) Critères d’évaluation de la qualité du clustering ....................................................... 44
5.3) Les tests mis en place ............................................................................................... 45
5.4) Résultats expérimentaux ........................................................................................... 48
5.5) Discussion sur les résultats ....................................................................................... 53
6) Apport de notre étude sur le clustering utilisant une représentation supervisée. ...... 55
Partie III) Application à une problématique industrielle.
Partie III) Application à une problématique industrielle.Partie III) Application à une problématique industrielle.
Partie III) Application à une problématique industrielle. ...................................................... 56
1) Problème industriel. ........................................................................................................ 56
1.1) Le contexte industriel ................................................................................................ 56
1.2) La solution actuelle .................................................................................................... 57
1.3) Le problème avec la solution actuelle ....................................................................... 61
2) Amélioration du processus de clustering. ..................................................................... 62
2.1) Méthodes envisagées pour résoudre le problème. ................................................... 62
2.2) La démarche d’évaluation. ........................................................................................ 66
2.3) Présentation des résultats obtenus ........................................................................... 67
2.4) Interprétations et critiques des résultats obtenus. .................................................... 69
Partie IV) Premier bilan du stage
Partie IV) Premier bilan du stagePartie IV) Premier bilan du stage
Partie IV) Premier bilan du stage ........................................................................................... 72
1) Intérêt du stage pour l’entreprise .................................................................................. 72
2) Intérêt personnel ............................................................................................................. 72
3) Conclusion ...................................................................................................................... 73
Bibliographie
BibliographieBibliographie
Bibliographie ........................................................................................................................... 74