NOTE - ENSTA ParisTech

publicité
D i r e c t i o n d e l a R e c h e r c h e Te c h n o l o g i q u e
D é p a r t e m e n t d e s Te c h n o l o g i e s d e s S ys t è m e s I n t e l l i g e n t s
S e r vi c e A r c h i t e c t u r e s e t C o n c e p t i o n
Stage n°1 du Laboratoire Systèmes de Vision Embarqués
Etude et développement
l’apprentissage
d’une
plateforme
logiciel
pour
Les méthodes de reconnaissance d’objet par apprentissage statistique sont de plus en plus
employées en vision artificielle. Elles ont en effet montré des performances tout a fait
intéressantes dans plusieurs domaine (reconnaissance de caractères, détection de visages
ou de piétons…).
Le cœur de ces techniques consiste en l’apprentissage de l’apparence d’un objet particulier
(piéton, voiture, visage, etc..) comparativement au reste du monde.
Cette comparaison nécessite donc un ensemble d’exemples positifs (l’objet à reconnaître) et
négatifs (le reste du monde). Dans la cas de la reconnaissance de piétons en milieux
urbains, cette collecte d’information consiste à encadrer toutes les personnes présente dans
les images. Il s’agit d’un travail long et fastidieux mais qui peut être grandement faciliter par
la mise en place d’une interface efficace. Cette interface comprendra par exemple des
techniques de suivi d’objet dans le cas d’un séquence d’images consécutives.
IL est important de noter que la performance générale des méthodes d’apprentissage
s’accroit avec le nombre d’exemple dont dispose l’algorithme. Il est donc impératif de traiter
un nombre d’exemple important (plusieurs dizaines de millier) si l’on veut obtenir un
reconnaissance vraiment fiable et performante. L’inconvénient majeure de l’accroissement
du nombre de données concerne la place mémoire nécessaire à l’algorithme ainsi que le
temps de calcul qui peut devenir prohibitif.
Les performances des algorithme dépendent aussi de la qualité et de la diversité des
exemples présentés.
Ce stage débutera tout d’abord dans la mise en place d’une interface convivial pour
l’acquisition des exemples. Il consistera ensuite en l’étude de la meilleure solution pour la
parallélisassions des algorithmes d’apprentissage sur plusieurs processeurs ou pc afin de
maintenir le temps de calcul dans les limites acceptables. Suivant la réalisation des deux
premiers objectifs, nous nous intéressons aux méthodes permettant un choix pertinent des
exemples d’apprentissages.
L’étudiant devra avoir de solide compétences en programmation C++ (interface graphique,
multithreading) et dans une moindre mesure en vision par ordinateur et machine learning.
Niveau demandé : Master Recherche/Ingénieur (5ème année)
(possibilité de poursuite en thèse)
Durée : 6 mois
Compétences : C++, vision par ordinateur, machine learning
Contact :
Nom
Téléphone
Email
: Yoann Dhome
: 01.69.08.82.98
: [email protected]
Centre Saclay
91191 Gif sur Yvette Cedex
Tél. 01 69 08 65 25 - FAX 01 69 08 83 95 – [email protected]
Commissariat à l'Energie Atomique
Téléchargement