La classification par l`analyse en clusters

Téléchargement

La classification par l’analyse

en clusters

Animateur : Philippe Wanlin (Ph. D.)

Co-animatrices : Lara Laflotte et Laura Luiu

Pourquoi classer

•Classer = grouper des éléments similaires en ensembles

•«primitif» classer les animaux selon leur férocité, les aliments

selon leur comestibilité

•Utile aide à parler des choses, à les décrire et à savoir les

reconnaître (nommer c’est déjà classer)

•Classer = capacité de conceptualisation basique de l’humain

•Classer = fondamental pour la plupart des sciences

Philippe Wanlin (2015) 2

Types de classifications

•Polythétique : le classement est basé sur plusieurs caractéristiques

des objets

•Monothétique : une seule caractéristique

Philippe Wanlin (2015) 3

Pourquoi classer ?

•Organiser un ensemble vaste de données pour le rendre plus

compréhensible et permettre une identification plus aisée de l’information

•Si les données peuvent être validement résumées par un nombre restreint

de groupes d’éléments, les étiquettes de groupes peuvent fournir une

description concise de patterns de similarités et différences dans les

données (data mining)

•Attention il existe différentes classifications possibles au sein d’un

ensemble de données (tout dépend des critères et objectifs de

classification) – certaines sont plus utiles que d’autres (classer des livres

selon leurs couleurs ou leurs sujets)

•Une classification n’est pas comme une théorie scientifique jugée en

fonction de si elle est exacte ou non, mais elle doit être jugée selon son

utilité

Philippe Wanlin (2015) 4

Classification numérique –cluster analysis

•Créer des classifications objectives et stables

•Objectives : les classifications des mêmes éléments avec la même méthode produit

le même classement

•Stable : la classification reste la même même si on additionne des éléments à classer

ou que l’on ajoute des caractéristiques descriptives

•Le but est de proposer un partitionnement des données dans lequel

chaque élément appartient à un seul cluster et que l’ensemble de tous les

clusters contient l’ensemble des éléments de la base de données

•Dans certaines circonstances des clusters superposés peuvent être une solution plus

acceptable

•Parfois la conclusion d’une analyse en clusters peut être qu’il n’y a pas de sous-

ensembles d’éléments dans la base de données

Philippe Wanlin (2015) 5

1 / 87 100%

Documents connexes

Clustering : algorithme des K-moyennes

Journée d’étude Le rôle des Clusters dans le secteur de l’industrie pharmaceutique &

Programme de la conférence - Katowice Convention Bureau

Deux clusters bijoux et dinanderie mis en œuvre à

Equilibre des ressources en eau Gestion du bassin

Des clusters pour émerger dans la compétition

Constructing knowledge-based regional advantage

Clustering et recherche d`associations Etat de l`art

Recommandations « Clustering des objectifs sociaux »

Clustering

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

La classification par l`analyse en clusters

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

La classification par l`analyse en clusters

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib