Formalisation
problème de classification binaire
○ {x1...xN}, vecteurs numériques
○ {y1...yN}, les étiquettes binaires des points d’entrée
but : apprendre un séparateur global des catégories
cadre semi-supervisé : seulement une partie des données sont
étiquetées
forme générique de la fonction de similarité KA
objectif d’optimisation sur et A :
Fonctions de similarité
Résultats théoriques
preuve de robustesse algorithmique de notre approche
permet de borner l’erreur de généralisation avec probabilité 1-
B est une borne de la fonction de coût, dl est la quantité de données,
M est défini par la robustesse et  dépend de la topologie
résultat valable pour toute fonction de similarité k-lipschitz.
Perspectives
adaptation de notre approche aux données structurées
application de la méthode à la gestion d’énergie : données de
consommation électrique fournies par Schneider Electric.
Remerciements: ce projet est soutenu financièrement par la Région
Rhône-Alpes.
ARC 6 : Technologies de l’Information et de la Communication
et Usages Informatiques Innovants
Maria-Irina Nicolae1
Directeurs : Marc Sebban1, Eric Gaussier2
1 Université Jean Monnet, 2 Université Joseph Fourier
Résumé : L'importance des métriques dans l'apprentissage automatique a déterminé récemment une croissance de l'intérêt accordé à l'apprentissage de distances et de
similarités. Néanmoins, le domaine manque de résultats sur les garanties théoriques que l'on peut attendre sur la capacité de généralisation de la métrique apprise ou du
classifieur utilisé. Nous présentons un nouveau cadre pour l'apprentissage semi-supervisé de la métrique et d'un séparateur global, possédant des garanties de
consistance basées sur la robustesse algorithmique pour quelques fonctions de similarité locales concrètes.
Mots-clef : apprentissage semi-supervisé, fonction de similarité, robustesse algorithmique.
Contexte : apprentissage de modèles de prédiction à
partir de données.
Objectif : améliorer la capacité de prédiction.
Méthode : fournir de nouveaux cadres théoriques et des
algorithmes pour l'apprentissage automatique de
métriques.
Dispositifs,
systèmes, calcul et
logiciels
Nouveaux cadres théoriques en apprentissage de métriques
Application à la gestion de l’énergie
POINTS CLES
PROBLEMATIQUE
TRAVAUX ENGAGES / RESULTATS
Les métriques jouent un rôle crucial dans un grand nombre de
méthodes d'apprentissage automatique.
Exemples : distance euclidienne, similarité cosinus.
Limitation : la notion de bonne métrique dépend du problème.
Solution : apprendre la métrique à partir des données.
Processus d’apprentissage :
Apprentissage de métriques
trouver une nouvelle représentation des données
la métrique est généralement paramétrée par une matrice A
Domaines d’application
vision par ordinateur
recherche d’information
● bio-informatique
exemples : comparaison d’objets, recommandation de
musique, vérification d’identité.
Distribution
des données
Apprentissage
de métriques
Apprentissage
automatique Prédiction
Échantillon
Métrique
apprise
Modèle
appris
1 / 1 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !