Apprentissage automatique dans les

publicité
Apprentissage automatique dans les
graphes signés
Centre de Recherche en Informatique,
Signal et Automatique de Lille
Géraud Le Falher [email protected]
Inria (Magnet Team), Univ. Lille, CNRS UMR 9189 CRIStAL
Contexte de ma thèse
Problèmes et enjeux
I contrat doctoral (CDD) avec l’Inria, qui fait partie
du laboratoire CRIStAL
I encadré par Marc Tommasi et officieusement par
Fabio Vitale et Claudio Gentille
I enseignement à Lille 3 (en licence et master)
I l’Inria collabore avec des entreprises
regrouper les nœuds en tirant partie de l’information
supplémentaire fournie par les liens négatifs
(segmentation d’image)
lien +
2
1
lien −
désaccords
7
3
6
4
Apprentissage automatique
Trouver automatiquement des motifs dans des
données existantes pour prédire certaines propriétés
des données futures. Par exemple :
I traduction automatique
I classification supervisé (cancer ou non)
I régression supervisé (prix d’une maison)
I non supervisé (segmentation de clients)
Graphes (signés)
I Formalisme pour représenter des relations entre
objets (réseau social, achats de produits, interaction
de protéines)
I L’intensité des relations est quantifiée par un poids,
qui peut être négatif (dissimilarité, répulsion)
Problèmes et enjeux
prédire le signe d’un lien (recommandation de
produits)
5
8
Figure – Le clustering optimal de ce graphe signé a un coût de 2.
Méthodes et débouchés
I état de l’art, identification d’avancée algorithmique
et justification mathématique
I simulation informatique (pour tester les méthodes
sur des données réelles)
I soumission d’articles à des conférences ou des
journaux
I projets avec des entreprises, startup ou applications
Compétences
rigueur (écriture et relecture d’articles), autonomie
communication (conférence, enseignement)
gestion de projet
travail d’équipe
capacité à innover, tant dans la définition de
problèmes que dans leur résolution
I techniques (langages de programmation, gestion de
machines)
I
I
I
I
I
Perspectives
?
Figure – Graphe signé bipartite des spectateurs/votes/vidéos de
Youtube
Résoudre des problèmes similaires dans d’autre
paradigmes :
I classifier les nœuds en plus des arrêtes
I retour en continu (Tinder)
I prendre en compte les attributs des nœuds
R
Doctoriales
Mars 2016
Téléchargement