Sujet 8. Transformation de coordonnées dans le système visuel par

Transformation de coordonnées dans le système visuel
par apprentissage supervisé
Dans une tâche de pointage, le sujet doit indiquer la direction d’un objet visible (c.à.d qui se
trouve dans son champ visuel). La position de l’objet est encodée différemment par les aires du
cerveau qui sont impliqués dans cette tâche. Par exemple, les aires visuelles (la rétine ou le
cortex visuel) représentent la position par rapport à l’œil, de sorte que cette position change en
fonction de la direction du regard. Par contre, les aires motrices représentent la position par
rapport au corps.
Imaginez que vous êtes assis(e) devant un grand écran et que votre tête est fixe. On vous
demande de fixer le regard au centre de l’écran. On note la direction du regard, qui change de
-45° (la position des yeux est à l’extrême-gauche) à +45° (la position des yeux est à l’extrême-
droite). Pour la fixation au centre, (Figure 1A).
Ensuite, un objet apparaît sur l’écran (le petit cercle sur la Figure 1). On note la coordonnée
horizontale de l’objet dans le champs visuel, change de -45° (l’extrême gauche du champs
visuel) à +45° (l’extrême droite du champs visuel). Pour l’objet au centre du champs visuel,
(Figure 1A).
Figure 1.
4I702 - MODÈLES MATHÉMATIQUES ET COMPUTATIONNELS EN NEUROSCIENCES
2016/2017
D. SHEYNIKHOVICH, DENIS.SHEYNIKHOVICH@UPMC.FR
PROJET
r
r=0
x
x
x=0°
On vous demande ensuite d’indiquer la direction de l’objet par rapport au corps (qui correspond
aussi à la position par rapport à la tête, car le corps et la tête sont fixes dans cette expérience).
On note cette direction , elle change de -90° à +90° (par exemple, si vous regardez à l’extrême
droite et que l’objet apparaît à l’extrême droite du champs visuel, la direction de l’objet par
rapport à la tête est 45°+45°=90°). Dans le cas présent vous indiquerez la direction (Figure
1A).
Si vous fixez le regard à (20° à gauche du centre), et l’objet apparaît à (20° à
droite par rapport au centre du champs visuel), la position de l’objet dans le cadre de référence
de la tête est toujours (Fig. 1B).
Par contre, si vous regardez à gauche ( ), et l‘objet apparaît à gauche ( ), l’objet se
trouve à la position par rapport à la tête (Fig. 1C).
Cet exemple montre que dans la tâche de pointage, le système nerveux transforme les
coordonnées visuelles de l’objet (représentée par des neurones des aires visuelles telles que la
rétine) en coordonnées motrices (utilisées par exemple par les neurones qui contrôlent la main),
en utilisant l’information de la position actuelle des yeux, de la tête, etc. (encodée par les
neurones des muscles correspondants). Cette capacité est apprise au cours du développement,
lorsqu'on apprend à saisir des objets que l’on voit.
L’objectif de ce projet et de construire un réseau de neurones qui apprend à transformer les
coordonnées en utilisant le concept d’apprentissage supervisé. Le modèle est inspiré par les
activités neuronales observées expérimentalement dans le cortex pariétal du singe [1].
Modèle neuronal de transformation de coordonnées
On considère un réseau de neurones composé de trois populations de neurones :
neurones d’entrée (plus un neurone biais), neurones cachés (plus un neurone biais), et
neurones de sortie.
La population de neurones d’entrée est composée de trois sous-populations :!
1. neurones représentent la position de l’objet ( ) de manière suivante :
chacun des neurones a une position préférée , . Si l’objet apparaît à une
position , l’activité du ème neurone est : . Les positions préférées sont
distribuées uniformément entre -45° et +45°, . Cette sous-population encode la
position d’un objet visible par une distribution gaussienne centrée sur la position de l’objet et
ayant la largeur .!
2. neurones représentent la direction du regard de manière suivante : chacun de ces
neurones a une position préférée ( ). Lorsque la direction du regard est , l’activité
du ème neurone de cette population est égale à . Ces neurones augment leurs
activités quand l’œil tourne de gauche à droite.
3. neurones codent aussi pour la direction du regard : chacun des neurones a une
position préférée ( ). Lorsque la direction du regard est , l’activité du ème
neurone de cette population est égale à . Ces neurones diminuent leurs
activités quand l’œil tourne de gauche à droite.
y
y=0
r=20
x=20
y=0
r=20
x=20
y=x+r=40
D=60
H=20
K=90
N1=40
x
45 x45
ai
45 ai45
x
i
r
i
obj =e
(xai)2
2
σ
2
ai
σ
=10°
σ
N2=10
bi
0bi1
r
i
r
i
+=bi(45 +r)
90
N3=10
ci
0ci1
r
i
r
i
=ci(45 r)
90
Le vecteur d’entrée est donc composé de activités neuronales , ,
et , plus une entrée biais.
Les neurones d’entrée projettent vers les neurones cachés. L’activité du ème neurone caché
, avec (le biais) et la fonction sigmoïde.
Les neurones cachés projettent vers les neurones de sortie. L’activité d’un neurone de sortie est
avec (le biais).
Apprentissage par l’algorithme de rétropropagation. Pendant l’apprentissage, on présente un
objet en position choisie aléatoirement entre -45° et +45°. On “fixe les yeux” en position
choisie aléatoirement entre -45° et +45°. On forme le vecteur d’entrée et on calcule la sortie du
réseau selon les formules ci-dessus.
Afin d’entraîner le réseau à transformer les coordonnées il faut un “signal cible” qui encode la
vraie position de l’objet dans le cadre de référence du corps. On forme ce signal de manière
similaire au signal d’entrée : chaque neurone de sortie a une position préférée
( ). La vraie position de l’objet est représentée comme suit :
.
Les positions préférées sont distribuées uniformément entre -90° et +90°. L’erreur est
calculée comme suit :
Cette erreur est utilisée afin de modifier les poids synaptiques selon l’algorithme de
rétropropagation.
Simulation et analyse du modèle
1. Écrire un programme pour entraîner le réseau de neurones décrit si-dessus par l’algorithme
de rétropropagation.
2. Représenter graphiquement les courbes d’accord (tuning curves) pour les neurones d’entrée
( , et ).
3. Représenter graphiquement l’activité de la population de neurones de sortie après
l’apprentissage pour quelques positions de l’objet et quelques directions du regard
différentes.
4. Afin d’estimer la performance du réseau, calculer l’erreur d’estimation avec la procédure
suivante : générer 100 positions différentes et 100 directions du regard différentes; pour
chaque pair calculer la vraie position de l’objet par rapport au corps, et l’estimation
de cette position par le réseau (utiliser la méthode du vecteur de population pour
calculer cette estimation); calculer ensuite l’erreur de l’estimation . Pour
visualiser la performance du réseau, montrer l’histogramme de cette erreur, calculer l’erreur
moyenne et l’écart-type de l’erreur.
5. Analyse des activités de neurones cachés. Choisissez 4 parmi les 20 neurones cachés. Pour
chacun de ses neurones, représenter sur le même graphique ces courbes d’accord , i.e.
!
x
D=N1+N2+N3
r
i
obj
{ }
r
i
+
{ }
r
i
{ }
j
zj=g wji
(1) xi
i=0
D
x0=1
g(a)=1
1+ea
yk=wkj
(2)zj
j=0
H
z0=1
x
r
dk
90 dk90
y=x+r
yk
cible =e
(x+rdk)2
2
σ
dk
δ
k
δ
k=ykyk
cible
r
i
obj
r
i
+
r
i
x
r
(x,r)
yvrai
yesti
e=yvrai yestimé
zj(x)
l’activité en fonction de position du stimulus, pour plusieurs positions du regard (une courbe
différente pour chaque valeur de ). Est-ce que votre modèle reproduit le phénomène de
“champ de gain” (gain field) observé expérimentalement chez les singes ? !
Littérature recommandée (disponible sur la page web du cours) :
1. Zipser, D., & Andersen, R. A. (1988). A back-propagation programmed network that simulates response properties
of a subset of posterior parietal neurons. Nature, 331, 679–684.
2. Bishop, D (1995) Neural networks for pattern recognition. Clarendon press, Oxford. Chapter 4. The multi-layer
perceptron.
r
r
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !