Les mouvements oculaires - Unité de Recherche en Sciences

publicité
La poursuite et la stratégie visuelle permettentelles une efficacité comportementale ?
Les mouvements oculaires : enregistrement,
modélisation et applications.
Laurent Sparrow
http://ureca.recherche.univ-lille3.fr/sparrow/
UES-R-4b Contrôle Moteur 2013-2014
Introduction
1- présentation des MO et aspects techniques
2- MO et lecture
3- MO et perception visuelle
4- MO et action
5- Langage et motricité
6- Apprentissage en réalité augmentée
Zone où l’acuité visuelle est au maximum
Le champ visuel correspond à l’espace que l’œil peut percevoir lorsqu’il est immobile : il a
l’avantage d’être large, mais malheureusement, seule une infime partie de cet espace,
située au centre, permet une vision précise.
Par conséquent, pour explorer son environnement, l’œil doit se déplacer…
A première vue, cette organisation, pourrait être considérée comme désavantageuse car
elle restreint notre capacité à percevoir les stimuli visuels complexes à la seule vision
fovéale…
…mais la majeure partie des informations présente dans le champ visuel est bien
souvent inutile pour l'accomplissement des comportements dans lesquels l'individu est
engagé !
Le développement d'une fovéa si sophistiquée + la capacité à déplacer de façon rapide
et précise les yeux = une évolution phylogénétique essentielle permettant au primate de
sélectionner l'information visuelle pertinente parmi le flux sensoriel ascendant.
Pour explorer une image complexe comme celle-ci, l’œil procède grâce à une
série de bonds très rapides appelés saccades oculaires.
Ces déplacements rapides sont suivis de périodes de fixations (l’oeil est
immobile) permettant l’analyse.
Au final on alimente les traitements cognitifs avec uniquement les informations utiles.
• l'étude de ces mouvements oculaires permet alors de repérer les informations qui
ont été sélectionnées parmi d'autres
• par déduction, de comprendre les mécanismes impliqués dans la vision.
 Analyse des processus mis en jeux dans la lecture, l’exploration
d’images, de films…
 Hypothèses plus complexes : motricité = PPDC entre différents types
de langages (oral, écrit, gestuel). Plus généralement : interface entre
processus moteurs (bas niveaux) et sémantiques (haut niveau)
MAIS aussi :
 utilisation des MO comme mécanisme de contrôle du comportement :
 perception augmentée (apprentissages)
 compression flux vidéo
 interfaces pilotées par le regard
D’abord, un peu de technique…
Motricité oculaire
3 paires de muscles antagonistes
Vertical
Horizontal
Torsion
Mouvements
• convergence
• saccade
• torsion
• poursuite
• nystagmus
• dérive et microsaccades
• nystagmus
physiologique
Convergence
Saccades
Mouvements très rapides (20 à 40ms) permettant de positionner la fovéa sur le mot à
lire.
L’amplitude de ces saccades est variable (en moyenne 10 caractères).
Déroulement des saccades
Le reflet cornéen : les zones à considérer :
L’œil réfléchi la lumière,
dans la même direction…
Si on ne se trouve pas dans la même direction, que les réflexions
alors la pupille paraît sombre.
Sinon, la pupille paraît plus claire…
C’est ce phénomène que l’on observe parfois sur les photos prises avec
un flash…
Reconnaissance des formes : vidéo oculographie
Combinaison des 2 systèmes : reflet cornéen + vidéo oculographie
ASL avec compensation des mouvements de la tête
Dispositif d’enregistrement des mouvements oculaire (EYELINK 1000)
Ecran de présentation
Une caméra infra-rouge
filme les yeux du
spectateur.
La position du regard est
calculée grâce à des
algorithmes de
reconnaissance des
formes.
Participant
Caméra
Ecran de contrôle
L’enregistrement des mouvements oculaires : un exemple concret
The eyes moves = saccade
in red = original data
The eyes are stable = fixation
time
these data cannot be used in this form : it is necessary to distinguish between
saccades and fixations. Why ?
when the eyes move the retinal image is not stable (it is as if you take a picture
while moving). So, visual processing is partially suppressed during a saccade.
our perception of the world is limited to discrete moments between saccades
when our eyes are stationary that we call "fixation"
It’s very important to detect these fixations
which is critical when analyzing data is how fixations are detected :
in red = original data
blue line = detected fixation
Error: this
fixation
was not
detected
error: this
fixation is too
long
Ok !
Transformation des parcours oculaires en carte de fixation :
Chaque carré = fixation
Taille du carré = durée de la
fixation
Période de prise d’information
LECTURE
Mais en lecture, le déplacement des yeux est beaucoup plus régulier :
 petites saccades horizontales de la gauche vers la droite
 les durées de fixations ne sont pas les mêmes
 grandes saccades de retours de ligne
A noter :
 le mot « était » est fixé 2 fois
 le mot « fille » n’est pas fixé
DPF = premier passage
durée de regard (gaze duration) = la somme de la première fixation + la suivante
Si le lecteur quitte le mot puis y revient plus tard = régression
Comment expliquer la variabilité des durées de fixation ?
Point de fixation
On pourrait supposer que la meilleur stratégie de positionnement de l’œil, celle
qui permettrait de n’utiliser que la vision fovéale, serait la meilleure en lecture … ?
40
35
% of saccade
30
25
20
15
10
5
0
0-10
15-45
60-100
position in word
Le lecteur ne regarde pas le milieu du mot
La vitesse de lecture diminue d’1/3 si
on limite le champ de vision à la seule
vision fovéale
Comment rendre compte des effets des facteurs suivants sur les durées de fixations :
 La fréquence des mots
 La prédictibilité
 L’amorçage parafovéal
 La latence saccadique
Une réponse : le modèle EZ-Reader
Reichle, E.D., Pollatsek, A., Fisher, D.L., & Rayner, K. (1998). Toward a model of eye
movement control in reading. Psychological Review, 105(1), 125-157.
EZ Reader : 3 étapes pour l’identification des mots :
1. Analyse visuelle précoce (V), pré-attentive
2. 2 étapes lexicales (étapes attentives)
1. L1 : « familiarity check » : permet la programmation d’une saccade vers le
mot n+1
2. L2 : « completion of lexical access » : déplacement de l’attention vers le mot
n+1
• L1 = une estimation selon laquelle le mot a des chances raisonnables d’être identifié,
donc on peut engager le processus de déroulement d’une saccade (il y a peu de chances
de devoir faire une régression)
• L2 = le mot est identifié. Passons au mot suivant (déplacement du spot attentionnel)
V : analyse visuelle précoce
L1 : test de la familiarité
L2 : accès lexical
étape 2 : analyse en vision parafovéale
réalisation de la saccade :
Latence saccadique :
Entre 100-150 ms
Relation mouvement
oculaires- attention
Le modèle EZ-Reader en résumé :
Le modèle prédit correctement l’effet de la fréquence :
370
Mean Fixation Duration (ms)
350
330
FFDs obs
310
FFDs pred
290
SFDs obs
270
SFDs pred
GDs obs
250
GDs pred
230
210
190
1
2
3
Frequency Class
4
5
De même pour les probabilités de fixation :
0,8
Mean Fixation Probabilities
0,7
0,6
PrSingle obs
PrSingle pred
0,5
PrRefix obs
0,4
PrRefix pred
0,3
PrSkip obs
PrSkip pred
0,2
0,1
0
1
2
3
Frequency Class
4
5
Perception
Analyse
visuelle
précoce
Rétine
(bas niveau)
Onde N150
mémoire
Fréquence, contrainte
Accès lexical
Fixation oculaire : 250 ms
Effet de la fréquence sur les fixations
N400 (incongruité sémantique)
Décision lexicale : 500 ms
Sémantique
Compréhension
L1 : test de
la
familiarité
V : analyse visuelle précoce
L1 : test de la familiarité
L2 : accès lexical
(haut niveau)
Catégorisation : 1000 ms
Accès
lexical
Application du modèle :
 2 populations particulières ayant des difficultés en lecture
 dyslexiques
 sourds
Analyse
visuelle
précoce
Premières fixations (DPF)
L1 : test de
la
familiarité
Refixations (DR)
Accès
lexical
régressions
sémantique
Durées de fixation :
DPF
DR
FT
dpf ->dr (ms)
en %
dr -> ft( ms)
en %
S
363
434
633
N
244
298
335
D
252
531
658
71
20
270
74
54
22
91
37
279
111
406
161
• Chez le sujet sourd, on constate une augmentation des durées de fixation de la
DPF vers les DR très proche de ce qu’on observe chez le sujet « normal »
• On observe pas le même type de « blocage » lexical que celui observé chez les
dyslexiques
PERCEPTION VISUELLE
"Christ Addressing a Kneeling Woman" . Paolo Veronese (about 1546).
Scaled to 1024 x 734 pixels.
Les mouvements oculaires de 131 personnes regardant cette image ont été
enregistré.
Somme des fixations oculaires enregistrées pour les 131 participants.
Les pics correspondent aux zones les plus regardées.
Les trace s oculaires sont ensuite transformées en zones contrastées (contour plot)
Enfin, les « cartes de fixations » sont superposées à l’image d’origine.
Cela nous permet d’évaluer les zones les plus regardées par la population.
Eye movements of large populations. David S. Wooding. Behavior Research
Methods, Instruments, & Computers, 2002, 34 (4), 518-528.
Confronté à des images complexes, notre système visuel est capable
d’interpréter avec précision ces informations.
Des mécanismes et des stratégies d’exploration
particuliers sont nécessaires.
Même si la quantité d’informations a traiter est indénombrable, notre système visuel
est capable d’appréhender et d’interpréter avec précision l’ensemble de ces
informations visuelles  sélection par les mouvements oculaires
Quels mécanismes et quelles stratégies ?
La rétine
L’attention
cerveau
La cognition
La rétine et les voies nerveuses
Résultat : simplification de la complexité de l’environnement
L’attention et le traitement de l’information
• sélection des informations nécessaires à l’accomplissement d’une tâche (top down :
vers le bas) : chercher quelque chose, connaissance « a priori »
 reconnaître un lieu sur une carte, un personnage sur une photo…
• sélection des informations selon leur saillance (bottom up: vers le haut) pas de
connaissances « a priori »
 traitement automatique très rapide inconscient, réalisé en fonction des
caractéristiques de l’environnement qui attirent le regard
Importance de la motricité oculaire
Le système visuel est capable de reconnaitre certaines
caractéristiques fondamentales de l’environnement :
Orientation
intensité
contraste des couleurs
intensité
couleur
orientation
carte de salience
Les zones d’intérêts prédites par le modèle représentent environ 16% de
la surface totale de l’image.
A noter :
- Le texte est considéré comme un objet graphique comme les autres
- La phrase « une véritable palette de saveurs » n’appartient pas à une
zone d’intérêt
tps sur zone
3,78
15,50
2,76
5,46
out
0,70
8,62
0,00
0,00
total
4,48
24,12
2,76
5,46
84,38
64,26
100,00
100,00
% sur zone
En moyenne, 87% des durées de fixation concernent une zone d’intérêt
nb fix sur zone
16,00
50,00
9,00
19,00
out
4,00
26,00
0,00
0,00
total
20,00
76,00
9,00
19,00
% sur zone
80,00
65,79
100,00
100,00
En moyenne, 86% des fixations concernent une zone d’intérêt
Utilisation du modèle pour prédire les zones saillantes dans un film :
Mesure de dispersion : Cœfficient de gini
Nij = Nb points dans la
céllule (i,j)
N = Nb total de
cellules
Pij
Pij = Nij / N
Gini = ΣiΣj Pij²
63
Evolution de la dispersion (FormuleGourmet02)
64
La conception des images n’est pas adaptée à la lecture :
Aucun rappel du texte
Ni de la marque
Pourquoi ? Comment améliorer …
Positionnement du regard lorsque le texte apparait
Texte stable…
Mais forte zone saillante…
Le texte n’a pas été lu…
Le film 3 semble mieux construit :
Positionnement du
regard lorsque le texte
commence à apparaitre
Mais une zone saillante apparait
sur le texte, attirant le regard et
donc favorisant ainsi la lecture.
MO et action
Dans plusieurs sports (football, cricket, tennis) les principales actions des joueurs
consistent à attraper, intercepter, retourner ou donner à un autre joueur une balle
se déplaçant à grande vitesse.
Pour accomplir ces actions correctement, il faut être à la bonne place, au bon
moment. Cela nécessite donc de disposer :
d’une perception « efficace »
d’une motricité précise
En pratique : la contribution de la perception visuelle est aussi importante que les
capacités motrices.
On ne peut pas modifier les organes sensoriels (rétine par exemple)
Mais on peut avoir des comportements plus ou moins adaptés à l’environnement…
Et surtout, rôle de l’attention !
Comparaison de sportifs « experts » et « novices »
L’angoisse du gardien de but avant le penalty s’observe dans son regard !
On propose à des gardiens « experts » (L2 PSV Heindoven) et à des novices des clips
vidéo dans lesquels un joueur professionnel tire un penalty.
Les participants doivent stopper la balle à l’aide d’un « joystick ».
On présente des clips vidéo dans lesquels on voit :
- le joueur prendre son élan
- tirer dans le ballon
- début de l’envol de la balle
Le participant doit diriger un joystick dans la direction où il pense que le ballon va
entrer dans le but.
Visual search, anticipation and expertise in soccer goalkeepers, Journal of Sports Sciences, 2002, 20, 279-287. Saverlsbergh et al.
Le dispositif utilisé
Les gardiens experts ont une meilleure
performance.
Les experts utilisent une stratégie visuelle
moins exhaustive que les non experts (moins
de fixations mais plus longues) :
•moins de fixations (2.9 vs 4.0)
•mais plus longues (585 vs 430 ms)
•ils regardent moins de zones (2.6 vs 3.1).
Le mouvement est initié plus tardivement chez
le gardien expert (300 ms avant le tir).
Le tir se produit pendant l’intervalle 0-500
L’expert regarde surtout la balle avant d’initier son mouvement +
La jambe qui ne frappe pas
Mais : zones « non classées »
• Les zones les plus regardées par les experts sont surtout la balle, la jambe qui ne
frappe pas.
• Mais les 2 groupes montrent une tendance à regarder des zones « non classifiées ».
=> Il est possible que les zones spécifiques (jambe qui frappe, celle qui ne frappe pas,
balle) soient moins importantes que les mouvements qui se réalisent dans ces zones.
=> Par conséquent, disposer son regard dans une zone intermédiaire (non classifiée)
permet de profiter de la vision parafovéale, plus sensible aux mouvements.
Chez les experts : bons joueurs/moins bons joueurs (enfants de 11 -12 ans)
Différences concernant les comportements d’exploration visuelle entre ces
2 groupes.
Dans une expérience où les joueurs doivent intercepter une passe (football),
- les « bons joueurs » regardent systématiquement la balle ;
- les « moins bons joueurs » regardent plus fréquemment le
joueur qui reçoit la balle et aussi les hanches du joueur qui
possède la balle.
Une simulation de ce que peut produire les MO sur la perception visuelle
La scène d’origine
Chaque frame a été déplacée en fonction de la position du regard de l’observateur
humain
La zone fovéale a été calculée et est présentée de façon précise (la zone parafovéale est
floutée)
La vision de ce film est dérangeante, alors qu’en réalité, les déplacements oculaires
ne sont pas gênants.
« L’œil tranquille » ou le « quiet eye »
Vickers (1996) : basketteurs professionnels. Lancer francs
Vickers, J. N. (1997). Control of visual attention during the basketball free throw. The American Journal of
Sports Medicine, 24, 93–97.
moins bons tireurs : déplacent leur regard peu après l'initiation du mouvement et
fixent la cible pendant l'exécution du mouvement
très bons tireurs : prennent plus de temps pour la préparation du mouvement,
réalisent moins de saccades pendant la préparation et le début de l'action.
Surtout :
- La dernière fixation avant le mouvement est plus longue.
- On observe un comportement d'évitement : clignements plus nombreux et
moins de fixations sur les zones d'intérêts (ballon, panier, main...).
Effet sur la dernière fixation : préparation du mouvement.
La direction, la force, et la vélocité sont programmés + coordination bras
Probabilité plus forte de préparer de façon optimale le mouvement
Inhibition visuelle : permet de supprimer tous les stimuli distracteurs liés au
mouvement (mains et ballon se trouvent devant les yeux au moment du tir).
Les experts ont mis en place une stratégie adaptée et contrôlent leur attention
visuelle.
Quiet eye period :
A- fixation plus longue juste avant l'initiation du mouvement (dernière fixation) :
cette augmentation concernant la durée de la dernière fixation est corrélée
avec la précision du tir lointain
pendant cette période, les paramètres finaux du mouvement sont ajustés
B- inhibition de la perception visuelle :
pendant la phase d’exécution
la précision est moins bonne si le sportif laisse ses yeux fixés sur la cible
les moins bons tireurs regardent la cible au début du mouvement
L’inhibition visuelle pourrait être spécifique au sport considéré.
Billard
Mais pas d’effet sur les clignements
Journal of Motor Behavior, 2002, Vol. 34, No. 2, 197–207
Changement de la taille de la pupille (%)
30
25
20
15
10
5
0
-5
-10
Paysage
Nu féminin
Nu
masculin
Mère et
son bébé
Bébé
Marqueur de l’attention
Homme
Femme
Téléchargement