Formalisation
● problème de classification binaire
○ {x1...xN}, vecteurs numériques
○ {y1...yN}, les étiquettes binaires des points d’entrée
● but : apprendre un séparateur global ⍺ des catégories
● cadre semi-supervisé : seulement une partie des données sont
étiquetées
● forme générique de la fonction de similarité KA
● objectif d’optimisation sur ⍺ et A :
Fonctions de similarité
Résultats théoriques
● preuve de robustesse algorithmique de notre approche
● permet de borner l’erreur de généralisation avec probabilité 1-
où B est une borne de la fonction de coût, dl est la quantité de données,
M est défini par la robustesse et dépend de la topologie
● résultat valable pour toute fonction de similarité k-lipschitz.
Perspectives
● adaptation de notre approche aux données structurées
● application de la méthode à la gestion d’énergie : données de
consommation électrique fournies par Schneider Electric.
Remerciements: ce projet est soutenu financièrement par la Région
Rhône-Alpes.
ARC 6 : Technologies de l’Information et de la Communication
et Usages Informatiques Innovants
Maria-Irina Nicolae1
Directeurs : Marc Sebban1, Eric Gaussier2
1 Université Jean Monnet, 2 Université Joseph Fourier
Résumé : L'importance des métriques dans l'apprentissage automatique a déterminé récemment une croissance de l'intérêt accordé à l'apprentissage de distances et de
similarités. Néanmoins, le domaine manque de résultats sur les garanties théoriques que l'on peut attendre sur la capacité de généralisation de la métrique apprise ou du
classifieur utilisé. Nous présentons un nouveau cadre pour l'apprentissage semi-supervisé de la métrique et d'un séparateur global, possédant des garanties de
consistance basées sur la robustesse algorithmique pour quelques fonctions de similarité locales concrètes.
Mots-clef : apprentissage semi-supervisé, fonction de similarité, robustesse algorithmique.
Contexte : apprentissage de modèles de prédiction à
partir de données.
Objectif : améliorer la capacité de prédiction.
Méthode : fournir de nouveaux cadres théoriques et des
algorithmes pour l'apprentissage automatique de
métriques.
Dispositifs,
systèmes, calcul et
logiciels
Nouveaux cadres théoriques en apprentissage de métriques
Application à la gestion de l’énergie
POINTS CLES
PROBLEMATIQUE
TRAVAUX ENGAGES / RESULTATS
Les métriques jouent un rôle crucial dans un grand nombre de
méthodes d'apprentissage automatique.
Exemples : distance euclidienne, similarité cosinus.
Limitation : la notion de bonne métrique dépend du problème.
Solution : apprendre la métrique à partir des données.
Processus d’apprentissage :
Apprentissage de métriques
● trouver une nouvelle représentation des données
● la métrique est généralement paramétrée par une matrice A
Domaines d’application
● vision par ordinateur
● recherche d’information
● bio-informatique
●exemples : comparaison d’objets, recommandation de
musique, vérification d’identité.
Distribution
des données
Apprentissage
de métriques
Apprentissage
automatique Prédiction
Échantillon
Métrique
apprise
Modèle
appris