La classification par l’analyse
en clusters
Animateur : Philippe Wanlin (Ph. D.)
Co-animatrices : Lara Laflotte et Laura Luiu
Pourquoi classer
Classer = grouper des éléments similaires en ensembles
«primitif» classer les animaux selon leur férocité, les aliments
selon leur comestibilité
Utile aide à parler des choses, à les décrire et à savoir les
reconnaître (nommer c’est déjà classer)
Classer = capacité de conceptualisation basique de l’humain
Classer = fondamental pour la plupart des sciences
Philippe Wanlin (2015) 2
Types de classifications
Polythétique : le classement est basé sur plusieurs caractéristiques
des objets
Monothétique : une seule caractéristique
Philippe Wanlin (2015) 3
Pourquoi classer ?
Organiser un ensemble vaste de données pour le rendre plus
compréhensible et permettre une identification plus aisée de l’information
Si les données peuvent être validement résumées par un nombre restreint
de groupes d’éléments, les étiquettes de groupes peuvent fournir une
description concise de patterns de similarités et différences dans les
données (data mining)
Attention il existe différentes classifications possibles au sein d’un
ensemble de données (tout dépend des critères et objectifs de
classification) – certaines sont plus utiles que d’autres (classer des livres
selon leurs couleurs ou leurs sujets)
Une classification n’est pas comme une théorie scientifique jugée en
fonction de si elle est exacte ou non, mais elle doit être jugée selon son
utilité
Philippe Wanlin (2015) 4
Classification numérique cluster analysis
Créer des classifications objectives et stables
Objectives : les classifications des mêmes éléments avec la même thode produit
le même classement
Stable : la classification reste la même même si on additionne des éléments à classer
ou que l’on ajoute des caractéristiques descriptives
Le but est de proposer un partitionnement des données dans lequel
chaque élément appartient à un seul cluster et que l’ensemble de tous les
clusters contient l’ensemble des éléments de la base de données
Dans certaines circonstances des clusters superposés peuvent être une solution plus
acceptable
Parfois la conclusion d’une analyse en clusters peut être qu’il n’y a pas de sous-
ensembles d’éléments dans la base de données
Philippe Wanlin (2015) 5
1 / 87 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !