Apprentissage automatique dans les graphes signés Centre de Recherche en Informatique, Signal et Automatique de Lille Géraud Le Falher [email protected] Inria (Magnet Team), Univ. Lille, CNRS UMR 9189 CRIStAL Contexte de ma thèse Problèmes et enjeux I contrat doctoral (CDD) avec l’Inria, qui fait partie du laboratoire CRIStAL I encadré par Marc Tommasi et officieusement par Fabio Vitale et Claudio Gentille I enseignement à Lille 3 (en licence et master) I l’Inria collabore avec des entreprises regrouper les nœuds en tirant partie de l’information supplémentaire fournie par les liens négatifs (segmentation d’image) lien + 2 1 lien − désaccords 7 3 6 4 Apprentissage automatique Trouver automatiquement des motifs dans des données existantes pour prédire certaines propriétés des données futures. Par exemple : I traduction automatique I classification supervisé (cancer ou non) I régression supervisé (prix d’une maison) I non supervisé (segmentation de clients) Graphes (signés) I Formalisme pour représenter des relations entre objets (réseau social, achats de produits, interaction de protéines) I L’intensité des relations est quantifiée par un poids, qui peut être négatif (dissimilarité, répulsion) Problèmes et enjeux prédire le signe d’un lien (recommandation de produits) 5 8 Figure – Le clustering optimal de ce graphe signé a un coût de 2. Méthodes et débouchés I état de l’art, identification d’avancée algorithmique et justification mathématique I simulation informatique (pour tester les méthodes sur des données réelles) I soumission d’articles à des conférences ou des journaux I projets avec des entreprises, startup ou applications Compétences rigueur (écriture et relecture d’articles), autonomie communication (conférence, enseignement) gestion de projet travail d’équipe capacité à innover, tant dans la définition de problèmes que dans leur résolution I techniques (langages de programmation, gestion de machines) I I I I I Perspectives ? Figure – Graphe signé bipartite des spectateurs/votes/vidéos de Youtube Résoudre des problèmes similaires dans d’autre paradigmes : I classifier les nœuds en plus des arrêtes I retour en continu (Tinder) I prendre en compte les attributs des nœuds R Doctoriales Mars 2016