Analyse par aires d`intérêt

publicité
Chapitre 5 : Oculométrie
I.
Introduction
Définition
Technique permettant d’enregistrer en temps réel les mouvements des yeux au moyen d’un détecteur
optique ou d’une caméra vidéo couplé à un système informatique qui échantillonne régulièrement la position
spatiale de l’œil.
Il existe différents types de mouvement des yeux :
- Stabiliser le regard : réflexe vestibulo-oculaire (maintenir les images stables sur la fovéa lors de
mouvements de la tête) et opto-cinétique (maintenir les images stables sur la fovéa lorsqu’il y a
déplacement de l’environnement) + fixation visuelle (maintenir l’image d’un objet stable sur la fovéa).
- Déplacement du regard : poursuite (maintenir l’image stable sur la fovéa tout en suivant une cible en
mouvement), saccade (apporte l’image de l’objet sur la fovéa) et la vergence (ajuste la position des
yeux en fonction de la distance de l’objet en profondeur).
Poursuite oculaire : capacité de suivre des yeux une cible en mouvement sans que l’image de l’objet ne s’écarte
de la fovéa. Mouvement lisse et continu. Se développe durant les premiers mois de la vie, en lien avec la
maturation du système visuel. Indicateur de l’intégrité du système nerveux et visuel. Dégradation avec l’âge,
le manque d’attention, la médication… Et c’est l’un des symptômes dans plusieurs pathologies : troubles de
la poursuite dans l’autisme, dyspraxie, paralysie cérébrale…
Saccade oculaire : déplacement rapide et bref (20-50 ms) des yeux entre deux positions du champ visuel.
Mouvement le plus rapide et sans doute le plus fréquent. Premier mouvement de capture chez l’enfant.
Modification de certains paramètres avec l’âge, la médication, dans certaines pathologies (schizophrénie,
troubles bipolaires, hyperactivité, dépression…).
Intérêts
Pourquoi enregistrer les mouvements des yeux ?
- Mouvement fondamental pour l’exploration visuelle : l’acuité visuelle est précise en fovéa, mais la
fovéa est une région relativement petite et c’est pourquoi les yeux doivent sans cesse se déplacer.
Perception d’un monde visuel stable et homogène grâce aux saccades.
-
Clé d’accès pour comprendre des processus cognitifs sous-jacents (indicateur online) : l’organisation
spatiale et temporelle des déplacements du regard qui accompagnent le traitement du matériel visuel
exploré renseigne sur l’orientation de l’attention et les informations sélectionnées pour la perception
et l’action. Et ce, dans tous types de tâche : lecture, photo d’un visage, l’art, transports…
-
Richesse du comportement oculomoteur : gamme étendue (réflexes à volontaires), réseaux cérébraux
connus et distincts (pariétal – saccades réactives et frontal – saccades volontaires).
En résumé, méthode non invasive, indolore et objective ; comportement observable plus ou moins facilement
dans des populations variées (bébé à la personne âgée), dans des tâches variées (motrices, perceptives,
cognitives, sociales, émotionnelles…), indépendamment du langage (ex. des enfants) ; outil diagnostic pour
certaines pathologies.
Intérêts en recherche fondamentale, clinique et appliquée.
Inconvénients
-
II.
Technique pouvant être lourde à mettre en place, nécessite en effet des connaissances en
programmation et/ou une aide technique.
Mortalité expérimentale car pour des aspects pratiques et techniques il est possible de perdre des
sujets (myopes, yeux noirs…).
Validité écologique : plus ou moins importante selon l’oculomètre utilisé.
Coût économique plus ou moins important selon l’oculomètre utilisé.
Les techniques
Historique
Louis-Emile Javal (1879) : observation directe des yeux. Premier à avoir montré que l’œil bougeait en
effectuant des sauts (les saccades) et des pauses (les fixations) en situation de lecture.
Edmund Burke Huey (1897) : premier appareil de mesure mécanique (lentille posée sur l’œil, trouée et cette
lentille était rattaché à un mécanisme). Il confirme la saccade durant la lecture.
Raymond Dodge (1900) : photochronographe (rayon lumineux sur la cornée et il photographie la réflexion de
ce rayon).
Alfred Yarbus (1967) : photokymographe (système plus précis). Premier à montrer que les trajets
oculomoteurs dépendent de la tâche demandée au sujet pour un même stimulus.
Techniques actuelles
Technique électro-oculographique (EOG) : électrodes disposées autour de l’œil et on mesure les différences
de potentiels électriques induits par la rotation oculaire. La résolution temporelle est correcte (40 Hz et donc
on échantillonne la position de l’œil tous les 25 ms) et la résolution spatiale est faible (saccades en lecture est
d’un quart de degré ce qui est faible). Bien de le coupler à la MEG.
Technique galvanométrique (70-80) : lentille de contact équipée d’une bobine d’induction. Le principe étant
de repérer dans un champ magnétique les variations de potentiels électriques induits par le mouvement de
la lentille. Très précise temporellement (1000 Hz soit position de l’œil prise toutes les ms) et spatialement (<
0,01°). Mais c’est une technique très contraignante et invasive (ophtalmo doit être présent durant la
passation).
Technique du reflet cornéen :
- Par capteur optique : reflet d’une lumière infrarouge envoyée sur la cornée et analyse de la variation
d’intensité lumineuse. Grande précision temporelle et spatiale, intérêt c’est son coût même s’il
manque les logiciels adaptés et légèrement contraignant.
- Par capteur vidéo : reflet d’une lumière infrarouge envoyée sur la cornée et analyse du centre
pupillaire. La direction du regard est déterminée par la position relative du centre de la pupille par
rapport au reflet cornéen. Algorithmes de traitement de l’image. Les résolution temporelle et spatiale
dépendent du système. Système plus ou moins contraignants (sous forme de casque mais ils sont
généralement lourds) et plus ou moins coûteux.
Comment choisir ?
Idéalement, le système avec les meilleures résolutions temporelle et spatiale ! Dans les faits… meilleur rapport
qualité/prix. A fixer selon :
- Les objets de l’étude (quelles précisions temporelle et spatiale réellement nécessaires).
- La population étudiée.
- L’aide technique dont on dispose.
- Le budget.
III.
Les mesures oculaires
Le signal brut dans un premier temps. Sur une saccade on observe la période de fixation précédente puis celle
suivante. On observe en VD :
- Mesures temporelles (en ms) : la latence de la saccade (temps de fixation précédente) et le temps de
la saccade.
- Mesures spatiales (en °) : position de départ, d’arrivée et la trajectoire.
 Amplitude de la saccade : position d’arrivée - position de départ.
- Mesures liées à la vitesse : vitesse moyenne (°/s), pic de vitesse (°/s) et accélération/décélération (°/s2).
Sur une séquence de saccades :
- Nombre de fixations, positions et durée des fixations sur les différents objets visuels.
- Fixation unique vs plusieurs fixations (saccades progressives ou refixations/ saccades régressives ou
régressions) vs pas de fixation.
Cela permet de quantifier la prise d’information pour inférer les processus cognitifs sous-jacents. Repère les
zones les plus fréquemment explorées, les durées de traitement, les difficultés rencontrées et les éventuelles
réinspections.
Le flot de données peut vite devenir ininterprétable. Donc bien définir avant l’expérimentation :
- Les VDs à analyser.
- Le délai d’enregistrement et/ou d’analyse.
- La/les méthode(s) d’analyse :
o Analyse saccades/fixations.
o Analyse par aires d’intérêt.
o Analyse par carte de chaleur.
o Analyse du scanpath.
Analyse par aires d’intérêt (AOI)
Segmentation spatiale du stimulus en régions « intéressantes » pré-définies.
- Nombre et durées des fixations dans ces régions.
- Saccades de transition entre les régions.
Attention : à concevoir en fonction des hypothèses ; à insérer dans le programme (à chaque image ses AOI,
définir les régions intéressantes pour chaque image) ; ne pas superposer des AOI et la taille minimale des AOI
dépend de la précision de votre système.
Très utilisée pour les études marketing, l’analyse des visages…
Analyse par carte de chaleur (heat or attention map)
Représentation a posteriori de la distribution spatiale des fixations. L’avantage c’est que c’est simple, rapide
et intuitif.
Attention : il n’est question que de la distribution spatiale des données et rien d’autre (et on ne sait pas
pourquoi ces régions en particulier) ; nécessite un grand nombre de données (ensemble des essais pour un
sujet, voire ensemble des sujets) ; pas d’informations sur la séquence temporelle des saccades ; pas de
méthode pour une comparaison statistique entre conditions (car on fait des moyennes, donc c’est une
technique à ne pas utiliser seule, peut servir comme prétest pour définir les aires d’intérêt).
Analyse du scanpath
Séquence ordonnée des fixations et des saccades nécessaires à la récupération de l’information recherchée.
- Longueur et durée du scanpath.
- Aire convexe de Hull.
- Densité spatiale.
IV.
Quelques exemples d’applications
Recherche fondamentale
On peut accéder aux différentes saccades (express, réactives, volontaires). Présentation d’un stimulus (point
de fixation initial) qui disparaît, puis apparition de la cible. Le sujet doit faire une saccade pour aller regarder
la cible.
- Gap 0 : saccades réactives (la cible apparaît tout de suite après la croix de fixation). Réseau occipitopariétal est impliqué. Latence de 180 ms.
-
Overlap 600 : saccades volontaires. On utilise les mêmes stimuli mais cette fois ils se chevauchent.
Tant que la croix de fixation initiale ne disparaît pas le sujet ne doit pas faire sa saccade (inhibition de
la saccade réflexe). Latence de 250 ms. Réseau frontal.
-
Gap X (ex. 200) : intervalle vide entre la croix de fixation et la cible. Saccades express car l’attention se
lève lorsque la croix de fixation disparaît (désengagement de l’attention). Latence de 150 ms. Voie qui
reste dans le cortex occipital.
Cas des anti-saccades (paradigme comme test de l’inhibition) : faire une saccade à la position opposée à la
cible. Inhiber la saccade réflexe, puis retourner le vecteur moteur.
Cas des saccades mémorisées : la cible disparaît et le sujet doit faire une saccade après un délai plus ou moins
long.
Paradigmes utilisés pour examiner le développement des réseaux cérébraux. Ex. d’une étude qui utilisait le
paradigme Gap 0. Les auteurs ont testé des jeunes enfants (5 ans) jusqu’à des personnes âgés (80 ans) et ils
mesuraient la latence de la saccade. La saccade réactive est plus lente pour les enfants (400 ms), puis palier à
l’âge adulte (après 15 ans) et à nouveau la saccade réactive devient plus lente chez les personnes âgées.
Autre étude avec l’utilisation d’anti-saccades et ils mesuraient le pourcentage d’erreurs : plus d’erreurs chez
les enfants puisque manque de maturation du système frontal. De même pour les personnes âgées car les
capacités d’inhibition régressent avec l’âge.
Cas de la lecture : enregistrement des mouvements de yeux pendant la lecture chez des enfants (6 ans et
plus) par rapport aux adultes. Ils ont mesuré les durées de fixation moyennes sur les mots, le nombre de
fixation moyen sur 100 mots, la fréquence des régressions. Par rapport aux adultes l’enfant met plus de temps
à lire, il fait davantage de fixation (plus longue également) et de régressions.
Selon la difficulté du texte le nombre de fixations est plus important et le temps de lecture également.
Analyse des scanpath pour un lecteur sain par rapport à un lecteur dyslexique : pas les mêmes patterns. Durée
de fixation beaucoup plus élevée pour les dyslexiques et amplitudes de saccades plus faibles et davantage de
régressions. Car empan perceptif plus petit chez les dyslexiques. L’empan perceptif correspond à une certaine
fenêtre dans laquelle on perçoit les lettres et un empan d’identification qui correspond au nombre de lettre
que l’on peut traiter. Les lecteurs de gauche à droite ont un empan perceptif plus important à droit par rapport
à l’empan d’identification (vice versa pour les lecteurs de droite à gauche).
Masquage des autres mots, on laisse découvert le mot que le sujet regarde. Cette fenêtre peut être plus ou
moins grande. Si elle est trop petite le nombre de régressions est plus important.
Masquage mobile lorsqu’on masque ce qui est en fovéa.
Transformation des mots lorsque l’œil vient à lui.
Etude où on utilise ce masquage mobile sauf que les autres mots sont floutés. Manipulation de la taille de la
fenêtre où le texte est visible, manipulation de la symétrie. Les sujets étaient des lecteurs de gauche à droite
ou droite à gauche. Ils mesuraient le temps de lecture.
Pour les lecteurs de gauche à droite, le temps de lecture est plus faible lorsque la taille de la fenêtre est faible.
Mais dès lors qu’il y a de l’information à droite le temps de lecture est identique à une phrase normale.
Pour les lecteurs de droite à gauche pour que les temps de lecture soient comparables à ceux normaux il faut
être dans les conditions où la fenêtre de visibilité est plus importante à gauche qu’à droite.
Cas des visages : présentation d’un visage et le sujet doit faire une anti-saccade. Les visages étaient présentés
normalement ou de manière inversée. Les anti-saccades se font moins facilement lorsque les visages étaient
présentés à l’endroit, car ce sont des stimuli attractifs et il est plus difficile d’empêcher une saccade.
Présentation des personnes, émotion de la posture et émotion du visage congruentes ou non. Les sujets
doivent dire quelle émotion est exprimée. On mesure le pourcentage de réponse correcte (émotion
cohérente avec celle exprimée par le visage ou le corps). Lorsqu’il y a incongruence les sujets regardent
davantage le visage (joie et colère notamment), c’est également le cas pour les conditions congruentes même
si c’est moins marqué.
Recherche clinique
Autisme
Bébés de 6 mois (aucun trouble autistique dans leur famille, ou alors qui ont un frère ou une sœur autiste).
Présentation de visages de femme (condition statique avec une émotion neutre, une condition affective avec
une émotion positive et une condition speech avec récitation d’une histoire). Pourcentage de fixation vers les
yeux/nez/bouche.
A l’âge de 3 ans ils ont repris les données et ont classé les sujets (autistes, atypiques, typiques avec risque,
typiques sans risque). Pour les enfants autistes : ils regardent moins la scène que les autres, dans la condition
speech ils regardent beaucoup moins les traits internes que les autres, et ils regardent beaucoup plus les
autres zones du visage (ex. cheveux).
Autre étude : saccade vers une cible (visage qui regarde ou pas). Les autistes en partent très vite (fuite du
contact social).
TDAH
Enfants devaient faire une pro-saccade et une poursuite. Au niveau des pro-saccades les latences sont
augmentées (300 ms contre 190 ms).
Schizophrénie
Rééducation pour ne pas fuir le contact visuel. Au fil des sessions le patient regarde de plus en plus le visage
de la thérapeute. Le schizophrène a pris conscience qu’il évitait le contact.
Recherche appliquée
Assistance au handicap
Ex. : Hawking.
Sécurité et transport
Contrôleurs aériens, conducteurs pour éviter l’endormissement.
Ergonomie des sites web/marketing…
V.
Mettre en place une expérimentation
Les étapes : conception, passation, traitement
-
-
Conception :
o Préparer les stimuli.
o Connaître la taille des images, la distance œil/écran, la résolution pour calculer la position des
stimuli sur écran en pixel et convertir en °.
o Si aire d’intérêt, choisir la taille adéquate.
o Penser à la luminance des stimuli, au réglage de l’écran, à la luminance de la pièce.
o Toujours débuter un essai par un point de fixation central.
o Adapter le protocole à la population : ex. le premier défi pour étudier la saccade chez le jeune
enfant… la procédure expérimentale !
 Adulte : stimulus sans sens, instruction verbale suffit, nombre d’essai peut être
important, la tête peut être maintenue.
 Le bébé… impossible. Le bébé est tenu par la mère, stimuli qui bougent, font du bruit
etc…
Acquisition :
-
o Réglage plus ou moins complexe selon le système.
o Calibration initiale : sur combien de points, vérification tous x essais ? Définit la qualité de la
mesure.
Analyse :
o Données brutes d’acquisition, time code/pos Y et X ?
o Extraction de certaines VD.
Conseils
-
-
Limiter la durée de l’expérience, 90 minutes maximum avec des pauses (adapter selon la population).
Prévoir plus de participants que nécessaire : perte de sujets liés à problèmes techniques, problèmes
visuels, fatigue, maladie, substance ou à problèmes de calibration (clignements trop fréquents, iris
trop sombre, taille pupille, paupières tombantes, cils du haut pointant vers le bas, yeux plus ou moins
enfoncés, lunettes à monture sombre et/ou verres sales, rayés, mascara…).
Mettre le participant à l’aise.
Matériel intimidant, vérifier la position.
Téléchargement