Distribution of this document is subject to France Telecom’s authorization
Tech/Susi/Tsi - 2006
France Télécom R&D
0. Quelques rappels & terminologie 1/4
➨ Terminologie traditionnelle en data mining / apprentissage automatique
Exemples = instances = points = records = objets = lignes des données
Variables = attributs = coordonnées = features = propriétés = colonnes de
données
Classe = label = variable cible = variable à prédire (domaine supervisé)
Classification = classification supervisée = apprentissage supervisé
Exemples de méthodes : arbre de décision C5 ou CART, réseaux
de neurones type perceptron, régression linéaire, régression logistique,
K-plus-proches-voisins, Support Vector Machine...
Clustering = classification non supervisée (= malheureusement parfois
classification en français)
exemples de méthodes : K-Means, Classification Hiérarchique
Ascendante, carte de Kohonen