Sujet de stage Master inter équipes Vertigo/MSDMA 2016-2017
Deep Learning et mesure de risque
Mots-clés : Sciences pour l’ingénieur, apprentissage profond, statistiques et mesure de risque
1 Contexte
L’annotation sémantique de données consiste à effectuer des tâches de reconnaissance automatique
sur les contenus, e.g. associer des labels de haut niveau sémantique aux données brutes. Cette probléma-
tique revêt des enjeux cruciaux dans l’ère actuel du big data, puisque les énormes volumes de données
rendent les méthodes d’annotation manuelle totalement caduques : à titre d’exemple, plus d’un milliard
de nouvelles photos sont postées chaque jour par les utilisateurs du réseau social Facebook.
Cette thématique d’annotation sémantique de données a connu un cataclysme récemment avec les
modèles d’apprentissage profond ("Deep Learning"). Le succès du deep learning a été ponctué par des
résultats expérimentaux spectaculaires, avec des performances des modèles d’apprentissage profond sur-
classant largement les descripteurs précédemment état de l’art, manuellement définis en fonction de la
tâche et nécessitant une expertise du domaine. Le succès de l’apprentissage profond a été initié par des
très bonnes performances dans le contexte de la reconnaissance vocale en 2011 [DYDA12], avant d’at-
teindre un succès historique pour la reconnaissance visuelle lors du challenge ImageNet 2012 [KSH12],
avec l’application de réseaux de neurones convolutifs (ConvNets) pour la classification d’images. Le deep
learning a depuis pénétré l’ensemble des champs de la science des données, allant du traitement du lan-
gage naturel (Natural Language Processing, NLP), en passant par l’analyse multi-modale des données
ou encore l’application pour la résolution de problèmes, avec le succès récent au Go utilisant des mo-
dèles d’apprentissage par renforcement. L’apprentissage profond a permis de franchir un pallier en terme
d’apprentissage de représentations intermédiaires, qui se traduit par un renouveau de problématiques
historiques en intelligence artificielle (Artificial Intelligence, AI), comme la réponse aux questions ou la
réponse aux questions visuelles (Question Answering et Visual Question Answering).
2 Enjeux et objectifs
En dépit de leurs performances spectaculaires, la compréhension formelle des modèles d’apprentis-
sage profond est encore limitée et fragile. En particulier, les architectures profondes ne bénéficient pas
naturellement de garantie de robustesse des sorties et de mesure fiable du risque de prédiction.
Un exemple emblématique dans ce contexte de la reconnaissance visuelle est celui des exemples
adversaires, souligné dans [SZS+14] et illustré à la figure 2 : une modification imperceptible d’une image
peut donner lieu à une modification brutale de la prédiction de la classe de sortie.
Ce problème devient critique dans des domaines ou l’obtention d’une mesure d’incertitude et de
risque fiable de la prédiction est critique, car une erreur d’interprétation peut avoir des conséquences très
sensibles, comme le domaine de la santé ou de l’aviation. On peut le cas échéant préférer des modèles
aux performances prédictives inférieures mais dont l’erreur est bornée par une mesure fine d’incertitude.
Ce stage vise à étudier de nouveaux modèles d’apprentissage profond combinant la force du deep
learning pour l’apprentissage de représentations et des modèles statistiques de mesure de risque.
On s’appuiera des travaux récemment menés dans l’équipe MSDMA pour l’estimation de zone de rejet
où le modèle est incertain [HBH16]. Une première étape consistera à prendre en main ce modèle, puis
à l’adapter pour l’apprentissage de réseaux de neurones profonds. En particulier, la méthode proposée
en [HBH16] suppose de disposer de modèles de prédiction existants, et ce stage visera à étendre ces
travaux pour l’apprentissage joint du modèle de décision et de la zone de rejet.
1