La constance en vision - Mark Wexler

publicité
La constance en vision
Définition de la constance
La constance de luminance
La constance spatiale lors des mouvements oculaires
Constance de taille
Constance de forme (statique)
Constance de forme (dynamique)
• Je m’appelle Mark Wexler
• Vous trouverez ce cours sur mon site :
http://wexler.free.fr/
• Si vous avez des questions, n’hésitez pas
à me contacter à :
[email protected]
Définition de la constance
• Au lieu de percevoir les données sensorielles
directement …
S=P
• … les interpréter comme combinaison, parfois
complexe, d’une partie variable (v) et une
partie invariable (i) …
S = f(v, i)
• … et percevoir la partie invariable
S = f(v, i = P)
La constance de luminance
• Soyons simples, restons en N&B !
• Problème physique : comment quantifier
si une surface est sombre ou claire ?
brightness
lightness
Luminosité = Illumination × Reflectivité
Le flux d’énergie lumineuse qui atteint l’œil
Conditions ambiantes
Une vraie propriété
invariante d’une
surface
Exemples de constance
• Le ‘noir’ et le ‘blanc’
d’une page imprimée
semblent avoir presque
les mêmes luminosités à
l’intérieur et à
l’extérieur
– Rblanc ≈ 10 Rencre
– Iextérieur ≈ 100 Iintérieur
– Lnoir ext. ≈ 10 Lblanc int. !
• Une seule surface noire
matte dans un spot très
lumineux paraît blanche
(l’effet de Gelb)
– Mais elle paraît gris foncé
à côté d’une surface
blanche
• L’illusion de contraste
simultané (décrite par
Chevreul au XIXème)
Contraste simultané dynamique
A. G. Shapiro et al. (2004). Induced
contrast asynchronies. Journal of Vision
Mécanisme : Adaptation ?
• L’adaptation
– de la pupille
– des récepteurs rétiniens
au niveau ambiant de l’illumination
• Problèmes :
– trop lent (dizaines de secondes)
– incapable de rendre compte des
phénomènes complexes qu’on verra tout à
l’heure
Mécanisme : Théorie d’Helmholtz
• L’inférence perceptive (c. 1860)
– Idée : déduire R de L = I × R
– Détermine d’abord I, l’illumination ambiante
– Ensuite calcule R = L/I
• Problème : il n’y a pas d’évidence qu’on connaisse, consciemment
ou inconsciemment, I
– Et même quand on le connaît, ça ne semble pas avoir un effet majeur
sur la perception de la luminance (Rutherford & Brainard, 2002)
• Comment pourrait-elle expliquer le contraste simultané ?
Prédiction
Si I paraît la même,
et R paraît la même,
alors L devrait être
pareille
Non !
Mécanismes « bas niveau »
• Hering (c. 1860) : Pas de calcul « haut niveau »
helmholzien, mais un calcul « bottom-up » qui
comparerait directement les luminances dans
l’image
• Wallach (1948) : Ce qu’on perçoit sont les
ratios des luminances
– Marche très bien pour des stimulus très simples
tels que le contraste simultané
– Des problèmes avec les stimulus plus complexes
• Gilchrist (1995) : L’hypothèse d’ancrage – le
gris le plus clair (« l’ancre » de l’image) est
perçu comme blanc
Mécanisme : Champs récepteur
centre-périphérie
• Mach (c. 1890) :
L’application d’un filtre
centre-périphérie
(« chapeau méxicain »,
opérateur de Laplace,
deuxième dérivée,
détecteur de bords,
inhibition latérale)
expliquerait le contraste
simultané et d’autres
illusions de luminance
(bandes de Mach, etc.)
• Il existe des capteurs
(sur la rétine et dans le
LGN) avec de tels
champs récepteur
Bandes de Mach,
version de Vasarely
Illusion de
CraikO’BrienCornsweet
Modèle : Retinex
(Land & McCann, 1971)
• Etant donné
L=I×R
où seul L est connue, et que I(x) peut
varier en fonction de la position dans
l’image, le problème de savoir R est
sous-déterminé ou mal posé
• Si seulement I(x) ne variait pas, on
pourrait connaître les réflectivités
relatives (Wallach), et avec des
hypothèses supplémentaires les
réflectivités absolues (l’ancrage de
Gilchrist)
• Idée :
– détecter d’abord les bords
– aux bords, seule la réflectivité varie
– à l’intérieur des régions, seule
l’illumination varie
• Application aux « mondrians »
• Les mondrians sont compliqués,
mais le monde l’est encore plus…
Le 3D : La carte de Mach
normale
inversée
A essayer à la maison !
La carte de Mach :
Reets colorés
normale
inversée
Bloj, Kersten & Hurlbert (1999) Perception of threedimensional shape influences colour perception through
mutual illumination
Le 3D : Bords de réflectivité vs.
bords d’illumination
• Gilchrist (1977, 1988) : les bords de
luminance ne sont pas
nécessairement des bords de
réflectivité – ils peuvent être, par
ex., des ‘intersections’ des
différents plans 3D illuminés
différemment
• Expérience (1977)
– Des changements rétiniens minimaux
qui mènent à des changements
perceptifs 3D majeurs
– Ca change la perception de la
luminosité
D’autres exemples 3D
• Knill & Kersten
(1991)
• La marche
impossible (Adelson)
Les jonctions
• Face aux complexités des effets du 3D sur la
perception de la luminance, une approche à la façon
d’Hering, bottom-up, avec des règles complexes sur les
jonctions – surtout en vision par ordinateur (e.g.,
Sinha & Adelson, 1993)
• Une généralisation de l’approche de Wallach
L’illusion de White
Hering vs. Helmholtz : Le retour
• Explications bottom-up vs. topdown : exemple de l’illusion de
White
• Contraste simultané… eh non !
• Explication bottom-up : la force
des jonctions T (Todorovic, 1997 ;
Zaidi et al., 1997)
• Explication top-down : des plans
de profondeur différente
• L’illusion « criss-cross »,
similaire mais avec des jonctions
ψ (Adelson)
– vue comme plusieurs plans (dont
un transparent), ou bien comme
une image plate
– l’illusion a la même force pour
tout le monde
– pas besoin d’abord passer par
une phase 3D ?
occluder
(different
illumination)
same
illumination
Quel rôle pour les bords ?
• On ne peut pas
toujours compter
sur des bords nets
• Exemple : les
ombres floues
(Adelson)
La constance spatiale lors des
mouvements oculaires
• Lorsque nos yeux tournent dans leurs orbites,
le monde ne semble pas se déplacer
(d’habitude)
– On ne voit
• ni de mouvement
• ni de changement de position (pas la même chose!)
• Pourtant, l’image rétinienne subit une
rotation qui peut être violente
– 3 fois/sec
– Jusqu’au 500°/sec de vitesse (150 km/h à 5 m!)
• Le même flux rétinien sans mouvement
oculaire donne lieu (souvent) à des perceptions
de rotation ou déplacement du monde visuel
Distorsions visuelles
autour des saccades
• Suppression de la perception du
mouvement (Bridgeman, 1975)
• Mislocalisation des points
(Matin, 1965)
– Tâche : localiser des points
lumineux qui apparaissent juste
avant ou après une saccade
– Résultats
• avant la saccade (mais pendant
sa préparation) : erreurs dans le
sens de la saccade
• après la saccade : erreurs dans
le sens contraire
– Explication
• Position perçue = position
rétinienne + position de l’œil
• L’estimation de la position de
l’œil est mise au jour pendant
les saccades
• Cette mise au jour est plus lente
que la saccade
Honda, H. (1991). The timecourses of
visual mislocalization and of extra-retinal
eye position signals at the time of vertical
saccades. Vis. Res. 31, 1915–1921.
Données neurophysiologiques
• Des champs
récepteurs : une carte
rétinotopique
• Lors d’une saccade, le
contenu d’un champ
récepteur change
brusquement
• Certains neurones
anticipent ce
changement en
déplaçant leur champ
récepteur pendant la
préparation d’une
saccade
J.-R. Duhamel, C. Colby, M.E. Goldberg. “The
updating of the representation of visual space in
parietal cortex by intended eye movements”.
Science, 255, 90-92 (1992).
Informations disponibles
• Informations rétiniennes
• Informations extra-rétiniennes
– informations afférentes (proprioception)
(Les yeux se déplacent, et nous sentons ce
déplacement)
– informations efférentes (commande motrice)
(C’est notre cerveau qui commande ce
déplacement, donc nous savons en avance
comment les yeux se déplaceront)
Informations rétiniennes
• ‘Hypothèse’ ou heuristique de base : dans chaque
scène visuelle il y a un arrière-plan qui est
stationnaire ; les objets au premier plan (qui sont plus
petits que l’arrière-plan) peuvent se déplacer, mais
pas l’arrière-plan
• Lorsque l’arrière-plan se déplace (i.e., presque toute
l’image), c’est interprété comme (le résultat d’) un
mouvement oculaire. Lorsque l’image d’un petit objet
au premier plan se déplace, c’est interprété comme
étant dû au déplacement de l’objet.
• Exemple : la vection (phénomène de gare)
L’illusion de Duncker (c. 1920)
James J. Gibson et l’école
« écologique »
« The visual world has the property of being stable…. By
stability is meant the fact that it does not seem to move
when one turns his eyes or himself around…. The
perceptual experience of the stable, unbounded visual
world comes from the information in the ambient array
that is sampled by a mobile retina. The reasons the
world does not seem to move when the eye moves,
therefore, is not as complicated as it has seemed to be.
Why should it move? The movement of the eye and its
retina is registered instead; the retina is
proprioceptive. »
(The senses considered as perceptual systems, p. 256,
1966)
Flux optique
• Gibson (The senses considered as perceptual
systems, 1966)
Mais…
• La démonstration de pression sur
l’œil démontre que ce n’est pas tout,
car une pression momentanée
produit une rotation de la scène
entière, qui est perçue comme telle
– et non pas comme un mouvement
propre
• Patients neurologiques (e.g., T.
Haarmeier et al. (1997), « False
perception of motion in a patient
who cannot compensate for eye
movements », Nature, 389, 849-852)
qui compensent pas pour leurs
mouvements oculaires, et qui voient
le monde tourner dans le sens
inverse
« Si l’œil M est détourné par force de l’objet N, et
disposé comme s’il devait regarder vers q, l’âme
jugera que l’œil est tourné vers R. Et parce qu’en
cette situation les rayons de l’objet N entreront
dans l’œil, tout de même que feraient ceux du
point S, si l’œil était véritablement tourné vers R :
elle croira que cet objet N est au point S, et qu’il
est autre que celui qui est regardé par l’autre
œil. »
(Descartes, Traité de l’homme, 1644)
Informations extra-rétiniennes
Les signaux proprioceptifs
• Sherrington (1898) a démontré que les
muscles oculaires produisent des
signaux proprioceptifs en fonction de
leur étirement. Ceci pourrait fournir un
mécanisme pour annuler le flux optique
dû aux mouvements oculaires, pour qu’il
ne soit pas perçu comme mouvement
d’objet.
• Modèle de Sherrington
Gauthier, Nommay & Vercher
(1990)
• Gauthier, Nommay
& Vercher (1990)
– Déviation externe de
l’œil non-voyant
– Erreurs
systématiques
d’estimation de
position dans la
direction de la
déviation
– Prédites par la
théorie de feedback,
pas par la théorie de
l
d
t i
Mais…
• Encore la pression sur l’œil : on a les signaux
proprioceptifs, mais on voit tout de même du
mouvement.
– Ni les signaux proprioceptifs – ni la rotation du champ visuel
entier – ne peuvent pas annuler l’impression du mouvement
d’objet.
• Problème théorique : les signaux proprioceptifs sont
trop lents par rapport aux signaux visuels.
• Lorsqu’on tire l’œil anaesthésié par des forceps, on n’a
pas accès aux informations du mouvement (Brindley
& Merton, 1960)
Informations extra-rétiniennes
Les (re-)efférences
• Théorie de Helmholtz et Mach : une
copie du signal efférent est soustraite
(avec délai) du signal rétinien du flux
optique.
Expérience critique
• S’il y a commande motrice, mais les yeux ne
bougent pas :
– La théorie rétinienne (Gibson) prédirait qu’on ne
verrait pas du mouvement dans la scène, car il n’y
a pas de mouvement sur la rétine
– Le théorie afférente (Sherrington) prédirait qu’on
ne verrait rien non plus, car il n’y ni mouvement
sur la rétine, ni signaux proprioceptifs du
mouvement oculaire
– La théorie efférente (Helmholtz, Mach) qu’on
verrait du mouvement dans le sens inverse de la
commande motrice, qui est soustraite du flux
rétinienne nul
Et le résultat est…
• On voit du mouvement dans le sens inverse de
la commande motrice !
• Première version : au 19ème siècle, Ernst
Mach se met de l’argile dans les yeux…
– mais ils peuvent encore bouger un peu, donc il y a
encore des signaux proprioceptifs
• Versions plus récentes : paralysie
pharmacologique
– Kornmüller (1931) : novocaïne
– Hammond et al. (1956) : tubocurarine
Mais…
• Ça ne marche pas avec la paralysie totale
– Curare : (J.K. Stevens et al. (1976), « Paralysis of
the awake human: Visual perceptions », Vision
Research, 16, 93-98)
• Ça ne marche qu’avec un point lumineux dans
le noir !
– L. Matin et al. [(1982) « Oculoparalytic illusion:
Visual-field dependent spatial mislocalizations by
humans partially paralyzed with curare ». Science,
216, 198-201] ont trouvé qu’avec un arrière-plan
visuel, la cible ne se déplace pas
Conclusion
• Pour distinguer le mouvement propre du
mouvement d’objet, une copie de la commande
motrice efférente est soustraite du flux
optique
• Mais cette information extra-rétinienne est
beaucoup plus bruitée que le signal rétinien
• En présence d’un arrière-plan visuel, les
informations extra-rétiniennes sont (parfois)
calibrées par les données rétiniennes
Cas de manque
de constance spatiale
• Il y a très peu de mémoire transsaccadique.
•J. Jonides, D.E. Irwin, S. Yantis
(1982). « Integrating visual
information from successive
fixations. » Science, 215, 192-194.
•Irwin, Yantis & Jonides (1983).
« Failure to integrate information
from successive fixations. »
Science, 222, 188.
• Mais il y a quelque travaux qui
soutiennent l’existence d’une
telle mémoire (Hayhoe et el.,
1991 ; Melcher, 2001 ; Melcher &
Morrone, 2003)
La poursuite lisse
ACT
• Un autre type de
mouvement oculaire
• Sémi-volontaire
• Moins de compensation
que pour les saccades
– Moins de constance
spatiale
10
8
6
4
2
0
-2
-4
-6
-8
12
10
8
position (cm)
– Nécessite une cible en
mouvement approprié
PASS
12
6
4
2
0
-2
-4
-6
-8
12
10
8
6
4
2
0
-2
-4
-6
-8
-10
0
1
2
3
4
5
6
7
8
9
10
0
t (sec)
1
2
3
4
5
6
7
8
9
10
Stabilité du monde pendant la
poursuite
• L’illusion de Filehne
– Pendant la poursuite lisse, n arrière-plan
stationnaire semblent se déplacer dans le sens
contraire
• L’illusion d’Aubert et Fleischl
– Un objet poursuivi (et donc presque stabilisé sur la
rétine) semble se déplacer plus lentement qu’un se
déplaçant sur la rétine avec la même vitesse
Stimulus de Johansson
Stimulus de Johansson
• Deux objets se déplaçant
horizontalement et
verticalement, par ex.:
– p1 = (sin t, 0)
– p2 = (0, cos t)
• Fixation d’un point immobile
– on perçoit les trajectoires
horizontale et verticale
• Poursuite de l’un des deux
objets
– l’autre objet semble suivre une
trajectoire intermédiaire entre
une droite (contance parfaite) et
un cercle (absence de constance)
Li et al. (2002)
• La perception des
formes 2D pendant la
poursuite
• Très peu de
compensation
– La forme perçue est la
forme sur la rétine :
absence totale de
compensation pour le
mouvement oculaire
et donc de constance
Un énorme bug
dans le système visuel
• L’effet auto-cinétique
– Un seul point immobile vu dans le noir complet
semble subir des grands mouvements après
quelques minutes
– Décrit par Humboldt, un astronome du XVIIIème
– Voir J. Levy (1972) pour une revue de théories
• Probablement dû au manque de la
compensation pour des petits mouvements
oculaires involontaire
Constance de taille
• On ne voit pas directement la taille (t) d’un objet, ni sa
distance (d) de nous, mais son angle rétinien, qui est
la combinaison :
a ≈ atan(t/d)
• On perçoit les objets de formes similaires et tailles
rétiniennes différentes comme ayant la même taille et
des profondeurs 3D différentes
– dans le domaine temporel
– dans le domaine spatial
• Le troisième dimension comme une ‘variable cachée’
qui garantirait une constance de taille
Constance temporelle de taille
• Un objet qui change de
taille semble garder sa
taille fixe et changer de
distance
• L’effet est plus fort si on
enlève des indices 3D qui
sont en conflit
• Si la taille semble aussi
changer, c’est une sousconstance
Constance spatiale de taille
• Les objets ne sont pas
obligés d’être identiques
Merci à Stuart Anstis
• Le contexte n’est pas
indispensable – mais ça
aide
Constance spatiale de taille
• Ce qui arrive
lorsque la taille
dans l’image est
constante
Panne de constance de taille,
ou : les effets du contexte
• Chambre d’Ames
• Constance de taille
en conflit avec la
constance de forme
Constance de forme (statique)
• On ne voit pas
directement les formes
3D, mais seulement leurs
projections 2D
• Lorsque les objets se
déplacent d’une façon
rigide (rotations,
translations), leurs
images projetées
subissent des
déformations
• On ne perçoit pas ces
déformations, mais
plutôt les formes 3D
rigides sous-jacentes
• Comment ça pourrait
marcher ?
Merci à Stuart Anstis
La perspective linéaire
Exemple complexe
• A cause de la projection,
les lignes réellement
parallèles ne le sont pas
dans l’image
• La vision chercherait des
plans, compatibles avec la
projections, où les lignes
seront parallèles
La perspective linéaire
Exemples simples
• Pas besoin de
droites parallèles,
parfois des droites
perpendiculaires
suffisent
– hypothèse de
perpendicularité
– hypothèse
d’equidistance
• Marche même sans
lignes droites
« On ne voit pas l’image 2D »
• Thouless a montré
que lorsqu’on essaie
de reproduire l’image
rétinienne, on fait
des erreurs
systématiques
– « regression vers
l’objet réel »
• Apprendre à dessiner
(d’une façon réaliste)
consiste en partie à
corriger ces erreurs
R.H. Thouless (1931).
Phenomenal regression to the
real object, I. British Journal of
Psychology, 21, 339-359.
« On ne voit pas l’image 2D »
• Les deux surfaces ont
des formes 3D (inférées)
très différentes, mais
des formes 2D
identiques !
• Cette identité n’est pas
disponible à la vision
consciente
• Le système visuel est
plus qu’un détecteur de
formes rétiniennes
R.N. Shepard. L’Œil qui
Pense. Seuil.
Les indices de texture
• Gradients de
– densité
– taille
– forme (ratio
longueur-largeur)
des ‘texels’
• Combinaison de
constance de taille
et de forme
Cutting & Millard (1984)
Le problème de correspondance
• A chaque image 2D
correspond un
nombre infini de
formes 3D
• Les hypothèses
inconscientes qui
assurent la
constance de forme
comme une solution
au problème de
correspondance
« La chaise d’Ames »
Les trompes l’œil
La perspective peut nous tromper !
Œuvre de
Georges
Rousse
Constance de forme (dynamique)
• Au lieu des
déformations 2D,
on perçoit des
formes rigides 3D
• Exemples de
Gunnar Johansson
G. Johansson (1975)
L’hypothèse de rigidité
• Hypothèse :
rigidité
(translation +
rotation)
• Rigidité globale ou
locale
• Rogers & Graham
(1979) : indice pur
Perceptions non-rigides
• L’effet stéréocinétique (Musatti)
• Le carré de Johansson
Le mouvement biologique
• Johansson (1973) : très
peu d’information donne
lieu à une perception très
forte de forme et de
mouvement ‘biologiques’
• Details : activité, sexe,
même identité d’acteur
• Filtre spécialisé ?
– résistant au bruit
– différences à l'endroit/à
l'invers
Téléchargement