2
2.5.L’objectif de classification…………………………………………………….18
2.6.Les domaines d’application…………………………………………………....18
2.7.Les termes désignant la classification…………………………………………..19
2.8.Les méthodes de classification…………………………………………………..19
2.8.1. La classification supervisée………………………………………………...20
2.8.1.1.Les k-plus proches voisins………………………………………………. 20
2.8.1.2.Arbre de décision ……………………………………………………….. .20
2.8.1.3.Réseaux neurones………………………………………………………….21
2.8.1.4.Naïves bayes……………………………………………………………....22
2.8.1.5.Les machines à support de vecteurs……………………………………….22
2.8.2. La classification non supervisée…………………………………………….22
2.8.2.1.La classification non hiérarchique…………………………………………23
2.8.2.1.1. K-means………………………………………………………. …23
2.8.2.2.La classification hiérarchique……………………………………………. 24
2.8.2.2.1. La classification hiérarchique ascendante……………………….25
2.8.2.2.2. La classification hiérarchique descendante ……………………..25
2.9.La qualité d’une classification …………………………………………………26
3. Conclusion……………………………………………………………………... 26
Chapitre2 : Classification hiérarchique ascendante……………………………..27
1. Introduction ……………………………………………………………………..28
2. Similarité………………………………………………………………………....28
3. Dissimilarité……………………………………………………………………...28
3.1.La distance …………………………………………………………………….28
3.1.1. Les mesures de distances ……………………………………………….29
3.2.La dissimilarité sur un ensemble E…………………………………………….31
3.2.1. Les critères d’agrégation ……………………………………………….31
4. Le principe de CAH …………………………………………………………....32
4.1.Hiérarchie totale de partie d’un ensemble E……………………………………33
4.2.Hiérarchie de partie indicée…………………………………………………...33
4.3.Algorithme de CAH……………………………………………………………34
4.4.Dendrogramme ………………………………………………………………...35
4.5.Exemple ………………………………………………………………………..35
4.6.Interprétation…………………………………………………………………...40
5. Conclusion……………………………………………………………………….42