Apprentissage non supervisé - moodle@insa

Téléchargement

Apprentissage non supervisé

Hélène Milhem

Institut de Mathématiques de Toulouse, INSA Toulouse, France

IUP SID, 2011-2012

H. Milhem (IMT, INSA Toulouse) Apprentissage non supervisé IUP SID 2011-2012 1 / 25

Introduction

Répartir les données en plusieurs classes

Isur la seule base des échantillons d’apprentissage.

IPas de cible !

IRecherche de structures naturelles dans les données.

Optimiser un critère visant à regrouper les individus dans des

classes,

Ichacune le plus homogène possible,

Iet, entre elles, les plus distinctes.

H. Milhem (IMT, INSA Toulouse) Apprentissage non supervisé IUP SID 2011-2012 2 / 25

Introduction

Différentes méthodes :

1Classiﬁcation hiérarchique.

FRegrouper itérativement les individus, en commençant par le bas (les

2 plus proches) et en construisant un dendogramme.

FIl faut calculer à chaque étape, la distance entre un individu et un

groupe et celle entre 2 groupes.

FNombre de classes déterminer a posteriori.

2Classiﬁcation par réallocation dynamique : k-moyennes.

FNombre de classes kﬁxé a priori.

FInitialisation de kcentres de classes par tirages aléatoires.

FAffectation des individus à la classe dont le centre est le plus proche.

FCalcul du barycentre des classes qui deviennent les nouveaux

centres.

FItération du processus.

H. Milhem (IMT, INSA Toulouse) Apprentissage non supervisé IUP SID 2011-2012 3 / 25

Mesures d’éloignement Indice de ressemblance ou similarité

Notons Ω = {1,· · · ,n}l’ensemble des individus.

Similarité = mesure de proximité déﬁnie de Ω×Ωdans R+,

vériﬁant :

Is(i,j) = s(j,i)∀(i,j)∈Ω×Ω: symétrie,

Is(i,i) = S>0,∀i∈Ω: ressemblance d’un individu à lui-même,

Is(i,j)≤S,∀(i,j)∈Ω×Ω: la ressemblance est majorée par S.

Indice de ressemblance normé s∗est déﬁni à partir de spar

s∗(i,j) = 1

Ss(i,j),∀(i,j)∈Ω×Ω.

s∗est une application de Ω×Ωdans [0;1].

H. Milhem (IMT, INSA Toulouse) Apprentissage non supervisé IUP SID 2011-2012 4 / 25

Mesures d’éloignement Indice de dissemblance ou dissimilarité

Une dissimilarité est une application dde Ω×Ωdans R+

vériﬁant :

Id(i,j) = d(j,i),∀(i,j)∈Ω×Ω: symétrie,

Id0i,i) = 0,∀i∈Ω: nullité de la dissemblance d’un individu avec

lui-même.

Si sest un indice de similarité alors

d(i,j) = S−s(i,j),∀(i,j)∈Ω×Ω

est un indice de dissemblance.

Si dest un indice de dissemblance avec D=sup

(i,j)∈ω×Ω

d(i,j), alors

s(i,j) = D−d(i,j)est un indice de ressemblance.

Un indice de dissemblance normé est déﬁni par :

d∗(i,j) = 1

Dd(i,j)∀(i,j)∈Ω×Ω,

avec d∗=1−s∗.

H. Milhem (IMT, INSA Toulouse) Apprentissage non supervisé IUP SID 2011-2012 5 / 25

1 / 25 100%

Documents connexes

Apprentissage statistique – Stratégie du Data

LA POSTE et l`IMT recrute des chargés d`accueil en - ist

Télécharger le CV - Jean

formation expérience compétences implication sportive

ÉLÈVE INGÉNIEUR EN 5ème ANNÉE - Etud.insa

Doctorant en 3èmeannée LAAS

Télécharger son CV - Cercle de l`entreprise

La publicité un fléau

Consultez l`offre

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Apprentissage non supervisé - moodle@insa

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Apprentissage non supervisé - moodle@insa

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib