Analyse et Synthèse d'Images James L. Crowley DESS Génie Informatique 1999/00 Séance 1 : Plan de la Séance : 2 janvier 2000 Représentation et Formation d'Images La perception visuelle humaine.......................... 2 La Rétine Humaine ..............................................................2 L'Horopteur........................................................................4 Version et Vergence ............................................................5 Représentation des Images ............................... 6 Acquisition et Affichage.......................................................6 Format Binaire (Bit Map et Pix Map)...................................7 La trame entrelaçait.............................................................8 Représentation en mémoire des images ..................................9 Surfaces virtuelle, lucarne et fenêtre.................................... 10 Modèle Mathématique de la Formation d'Image.....11 Les Repères ...................................................................... 11 Transformation rétine->image............................................ 12 Organisation des Séances Cours: 8 Séances TDA: 8 TDAs. Représentation et Formation d'Images Séance 1 La perception visuelle humaine Fovéa αmin = 1 minute Cornéa L'œil Humain est une sphère pilotable en θ, ϕ, et ψ. L'image est détectée par les récepteurs dans la fovéa. À une distance de 30 cm, 1 min d'arc est environ 0.0075 cm (0.003 inchs) Ça correspond à un point ("dot") d'une imprimante à 300 ppp. (dots per inch). La perception visuelle est une fonction logarithmique du contraste. Si I o est le contraste minimal perceptible, le contraste apparent est I1 L = log(I ). o L'acuité minimum de l'œil humain est environ 1 minute d'arc. Ça dépend du contraste. La Rétine Humaine Nerf Optique Fovéa (cônes) Fovéa Cornéa Périphéríe (bâtonnets) Spectre de la lumière visible pour l'homme : Le système humain est composé de bâtonnets et de cônes. Les bâtonnets sont responsables de la perception achromatique et des lumières atténuées. Ils sont formés d'une pigmentation, la rhodopsine, sensible à tout le spectre, avec une sensibilité maximale de 510 nm (vert). 1-2 Représentation et Formation d'Images Séance 1 Ils sont dans la périphérie de la rétine, et donnent une perception de plus faible résolution. Les cônes sont responsables de notre vision chromatique. Ils sont concentrés dans une zone appelée la fovéa. Il y a trois sortes de cônes, distingués par leurs pigments : cyanolabe α (445 nm), chlorolabe β (535 nm), et erythrolabe γ (570 nm) 1 Reponse Relative β γ 0.5 α λ 300 400 500 600 700 800 nm La transformation entre stimuli de cônes et perception de couleur est un phénomène de la perception humaine qui n'est pas encore bien modélisée. 1-3 Représentation et Formation d'Images Séance 1 L'Horopteur ∆ = +σ Point de Fixation ∆ =0 ∆ =–σ B CD Horopteur : B C D Le locus des points dans la scène pour lesquels la disparité est (proche de) zéro. L'Horopteur est une sorte de Filtre. Il limite l'information traitée. Il est déplacé tres rapidement par le système visuel. Horopteur Géométrique : F Fixation Point P Interest point 2µ Primary Line of Sight Corresponding Visual Rays αl Left Retina ηr ηl αr Right Retina Fixation Center Surface de disparité null: ηl = ηr 1-4 Représentation et Formation d'Images Le cercle Vief - Muller : Séance 1 Z 2η η η αr αl x Version et Vergence Z Z 2η ∆αl ∆αl ∆αr αc x ∆αr αc X Version: ∆α l = ∆α r Vergence ∆α L ≠ ∆α R Version : déplacer le point de fixation sur l'horopteur avec ∆α l = ∆α r Vergence : déplacer l'horopteur par ∆α L ≠ ∆α R Le système de commande neurale de la fixation est colliculus supérieure. Il est géré les stimulations dans un espace "version-vergence". Il fusion les stimulus venant des centres de motricité, réaction et délibération. 1-5 Représentation et Formation d'Images Séance 1 Représentation des Images Acquisition et Affichage Modèle de la Caméra Géométrie Physique Y j • X Z Axe Optique • i F Objective Rétine Modèle Mathématique: Projection Centrale Les coordonnées de l'image sont main gauche. Y i P = (X , Ys , Z s) s s Pc = (X c, Y c , Z c) F X • • Z Image Objective Axe Optique Pi = (i, j) => (x r, y r, 0) j Affichage d'une image Image Ecran 1-6 Représentation et Formation d'Images Séance 1 Format Binaire (Bit Map et Pix Map) Pixel = Picture Element. Une image est un tableau de pixels: O 0 NCols-1 0 NRows-1 Question : Est-ce que les pixels sont "carrés"? Réponse : non. (Ça dépend de l'affichage). Le nombre de pixels de l'image dépend de la matérielle. Silicon Graphics : 768 colonnes x 576 lignes VGA : 640 x 480 1-7 Représentation et Formation d'Images Séance 1 La trame entrelaçait A fin de minimiser les effets d'affichage, les images sont souvent affichées (et acquises) en trame entrelaçait. Lignes "paires". • •• 0 2 4 NRows-2 Lignes "impaires". • •• 1 3 5 NRows-1 Ceci peut avoir les effets néfastes pour la perception du mouvement. 1-8 Représentation et Formation d'Images Séance 1 Représentation en mémoire des images En mémoire, l'image est un tableau 1-D 0 1 2 ••• NRows-1 ptr Le vecteur est créé par unsigned char *image; image = (unsigned char *) malloc(nRows * nCols * sizeof(char)); L'adresse d'un pixel à colonne i, ligne j est : ptr = (pixel *) sizeof(pixel) * (j . nCols + i); Deux façons d'accéder au pixel à colonne i, ligne j. for(j=0; j < nRows; j++) for(i=0; i < nCols; i++) image[ptr++] = getPixel(i, j, image2, nCols, nRows); Il est fréquent de définir une procédure d'accès "getPixel". Par exemple : unsigned char getpixel( int i; int j; unsigned char *image; int nCols; int nRows; ) { int ptr; ptr = j * nCols + i; if (ptr > nCols * nRows) return (Err); else return( image[ptr]); } 1-9 Représentation et Formation d'Images Séance 1 Surfaces virtuelle, lucarne et fenêtre Hello Hello Lucarne Surface Virtuelle Display Logique Le travail est fait dans une image "Surface virtuelle". Une lucarne de cette surface est affichée sur l'écran. Termes Macinstosh : Grafport Surface Virtuelle GrafDevice - Display Logique ClipRect Lucarne Termes X Windows Drawable Display - Surface d'Affichage (Virtuelle ou Window) Display Logique 1-10 Représentation et Formation d'Images Séance 1 Modèle Mathématique de la Formation d'Image Modèle de la Caméra Géométrie Physique Y j • X Z Axe Optique • i F Objective Rétine Modèle Mathématique: Projection Centrale Les coordonnées de l'image sont main gauche. Y i P = (X , Y , Z s) s s s P = (X c, Yc , Z ) c c F X • • Z Image Objective Axe Optique Pi = (i, j) => (x r, y r, 0) j Les Repères Coordonnées de la Scène : s Point Scène : P = (xs, y s, z s) Coordonnées de la Caméra : c Point Caméra : P = (xc, y c, z c ) r Point Rétine : P = (xr , y r ) Coordonnées de l'Image : i Point Image : P = (i, j) 1-11 Représentation et Formation d'Images Séance 1 Une image, rendu par une numériseur, est un tableau de pixels: O NCols-1 0 0 NRows-1 Transformation rétine->image Échantillonnage et Numérisation : E t Les Paramètre Intrinsèque de la Caméra : F : Distance Focale Ci, C j: Centre Optique de l'Image (en pixels) Di, D j : Taille Physique d'un Pixel dans la Rétine (pixel/mm) xr = i – Ci Di yr = – j – Cj Dj i = xr Di (mm . pixel/mm) + Ci (pixel) j = –yr Dj (mm . pixel/mm) + Cj (pixel) 1-12 Représentation et Formation d'Images Transformation entre repère de l'image et repère de la rétine : i P= i rC Séance 1 r P i D i 0 C i xr j = 0 –D j C j yr 1 0 0 1 1 ou bien: w iP = i rC w RP wi D i 0 C i wxr wj = 0 –D j C j wyr w 0 0 1 w Qu’est-ce que “w” ? 1-13