Utilisation des distances tangentes pour la compensation de

Téléchargement

Utilisation des distances tangentes pour la compensation de mouvement

J. Fabrizio1S. Dubuisson1

1Laboratoire d’Informatique de Paris 6 (UMR CNRS 7606)

Universit´

e Pierre et Marie Curie-Paris6

104 avenue du Pr´

esident Kennedy, 75015 Paris

{Jonathan.Fabrizio,Severine.Dubuisson}@lip6.fr

R´

esum´

Dans cet article, nous pr´

esentons un algorithme de

compensation de mouvement qui repose sur l’utilisation

des distances tangentes. Contrairement aux algorithmes

de Block-Matching classiques, qui pr´

edisent uniquement

l’´

evolution de la position spatiale de blocs image, notre

algorithme pr´

edit aussi l’´

evolution des pixels au cours du

temps `

a l’int´

erieur mˆ

eme de ces blocs. De ce fait, l’er-

reur de pr´

ediction diminue fortement. Int´

egr´

e dans une

chaˆ

ıne de compression compl`

ete, notre algorithme pour-

rait en am´

eliorer le taux de compression et la qualit´

e de re-

construction. Le nombre d’images de r´

ef´

erence n´

ecessaires

a l’encodage d’une s´

equence peut aussi ˆ

etre diminu´

e par

l’utilisation de notre algorithme.

Mots clefs

Distance tangente, Compensation de mouvement, Codage,

Compression.

1 Introduction

La n´

ecessit´

e d’accroˆ

ıtre la r´

esolution ou la qualit´

e des

s´

equences vid´

eo nous oblige `

a am´

eliorer les m´

ethodes de

compression. Dans une s´

equence vid´

eo, deux images suc-

cessives sont suppos´

ees ˆ

etre relativement similaires. Les

seuls changements observ´

es sont dus aux mouvements des

objets et/ou de la cam´

era. Le principe de base de la com-

pression vid´

eo est de pr´

edire une nouvelle image `

a partir

d’une autre, et de ne coder que les erreurs de pr´

edictions.

En effet, ces erreurs ont des ´

energies plus petites que les

valeurs originales des pixels : leur codage n´

ecessite donc

moins de bits puisque l’entropie est plus faible. Il existe

deux types de pr´

edictions : la pr´

ediction temporelle et la

pr´

ediction spatiale.

Pour la pr´

ediction temporelle, ou inter-images, consid´

erant

un pixel courant, on fait l’hypoth`

ese que ses voisins

dans les images ant´

erieures et post´

erieures lui sont si-

milaires. L’estimation de mouvement est largement uti-

lis´

ee pour l’´

elimination de la redondance temporelle entre

les images d’une s´

equence vid´

eo [1]. On peut ainsi faire

de la pr´

ediction par compensation de mouvement : (i)

de mani`

ere unidirectionnelle (pr´

ediction avant ou arri`

ere),

sans prise en compte des probl`

emes d’occultation, ou (ii)

de mani`

ere bidirectionnelle, en utilisant `

a la fois les in-

formations ant´

erieures et post´

erieures dans la s´

equence.

La plupart des standards de compression vid´

eo, tels que

MPEG [2], utilisent des m´

ethodes dites de Block-Matching.

Le principe est de r´

ealiser une partition de l’image en

blocs et de rechercher la position optimale de ces blocs

dans une autre image, selon un crit`

ere de maximisation de

corr´

elation. De nombreux algorithmes de Block-Matching

existent. On peut trouver de bonnes synth`

eses dans les ar-

ticles [3, 4, 5] ainsi qu’une ´

etude empirique comparative

dans [6].

La pr´

ediction spatiale vise `

a consid´

erer les pixels adjacents

a l’int´

erieur des images (ou intra-images) : pris dans l’ordre

lexicographique du tampon image, ces pixels sont sup-

pos´

es similaires. En consid´

erant les pixels pr´

ec´

edemment

parcourus (donc cod´

es), dans un certain voisinage, l’en-

codeur peut pr´

edire la valeur du pixel courant. Les prin-

cipales probl´

ematiques pos´

ees sont le choix du voisinage

et des coefﬁcients pond´

erateurs `

a affecter aux valeurs des

pixels de ce voisinage. En g´

en´

eral, cette pr´

ediction spatiale

s’adapte au contenu (fronti`

eres, r´

egions, etc.). Il existe de

nombreux pr´

edicteurs spatiaux, parmi lesquels on peut ci-

ter le pr´

edicteur adaptatif m´

edian (MAP) [7] sur lequel est

bas´

e par exemple l’algorithme LOCO-I [8].

Dans cet article nous proposons une approche originale de

compensation de mouvement. Cette approche repose sur

un nouvel algorithme d’estimation de mouvement, bas´

e sur

les distantes tangentes [9]. Dans la section 2, nous ferons

un rappel sur les distances tangentes puis, dans la section 3

nous pr´

esenterons l’algorithme de compensation de mou-

vement. Nous donnerons ensuite des r´

esultats qualitatifs et

comparatifs en section 4, avant de conclure en section 5.

2 La distance tangente

La distance tangente est un outil math´

ematique qui permet

de comparer deux motifs (ou blocs) en tenant compte de

petites transformations (rotations, translations, etc.). Intro-

duite au d´

ebut des ann´

ees 90 par Simard et al. [10], elle

a´

et´

e combin´

ee avec diff´

erents classiﬁeurs pour la recon-

naissance de caract`

eres [11, 12, 13], la d´

etection et recon-

naissance de visages [14] ainsi que la reconnaissance de la

parole [15]. Elle est encore peu utilis´

ee.

La distance d’un motif P`

a un autre motif P′est calcul´

ee en

mesurant la distance entre les espaces param´

etriques pas-

sant par Pet P′respectivement. Ces espaces mod´

elisent

localement l’ensemble des formes engendr´

ees par les trans-

formations possibles entre les deux motifs (ﬁgure 1.B). Ils

sont obtenus en lin´

earisant chaque transformation c’est-`

dire en ajoutant au mod`

ele global les vecteurs tangents `

ces transformations, pond´

er´

es par un coefﬁcient. Chaque

vecteur tangent d´

erive, en un point, l’ensemble des formes

engendr´

ees par une transformation.

Soit Imle bloc obtenu apr`

es avoir appliqu´

e une composi-

tion de transformations au bloc I. Il est possible d’appro-

cher lin´

eairement Imen utilisant une expansion de Taylor :

Im=I+λ1~v1+λ2~v2+... +λn~vn(1)

u~viest le vecteur tangent `

a la i`

eme transformation et

λicorrespond `

a l’apport de la i`

eme transformation. Dans

notre cas, nous cherchons la transformation entre les blocs

Iet Im: chaque vecteur tangent ~vid´

erive les variabi-

lit´

es locales engendr´

ees par une transformation ´

el´

ementaire

(translation, rotation, changement d’´

echelle, etc.). L’es-

pace form´

e par ces vecteurs, ou espace tangent, donne une

repr´

esentation de tous les blocs, engendr´

es par la compo-

sition des transformations appliqu´

ees `

aI. La ﬁgure 1.A

donne une repr´

esentation des vecteurs tangents correspon-

dant `

a diff´

erentes transformations ´

el´

ementaires.

Si l’on souhaite comparer deux blocs I1et I2, on ne calcu-

lera donc pas simplement leur distance d(I1, I2), mais on

cherchera plutˆ

ot `

a minimiser celle entre les deux espaces

tangents (ﬁgure 1.B) :

d(I1+λ1,1~v1,1+...+λ1,n ~v1,n, I2+λ2,1~v2,1+...+λ2,n ~v2,n)

(2)

udest la distance euclidienne des niveaux de gris pixel `

pixel. Dans cette expression, les blocs I1et I2sont connus.

Les vecteurs tangents ~vi,j correspondent `

a la d´

eriv´

ee en

Iide la j`

eme transformation et λi,j est l’apport de la j`

eme

transformation au i`

eme bloc. Les vecteurs tangents peuvent

etre calcul´

es de la fac¸ons suivante :

It=I+λt~vt⇒~vt=I−It

λt

(3)

(le bloc Itpouvant ˆ

etre g´

en´

er´

e de mani`

ere synth´

etique).

Cette minimisation peut se faire num´

eriquement, mais

on trouve ´

egalement une solution analytique dans [11].

Le r´

esultat nous fournit donc, non seulement la distance

minimale entre les deux blocs (en tenant compte des

transformations `

a appliquer `

aI1pour aller vers I2et

r´

eciproquement), mais aussi les valeurs des λi,j indiquant

l’apport de chaque vecteur tangent, ce qui permet d’estimer

la transformation r´

eelle entre les deux blocs.

3 La compensation de mouvement

L’algorithme pr´

esent´

e ici repose sur l’utilisation de la dis-

tance tangente pour faire de la pr´

ediction par compensa-

(A)

(B)

Figure 1 – (A). Vecteurs tangents `

a l’image d’origine (`

a gauche), avec,

de gauche `

a droite : rotation, translation horizontale et verticale, facteur

d’´

echelle horizontal et vertical. (B). Comparaison des motifs Pet P′. La

distance euclidienne est repr´

esent´

ee par le segment [de]et la distance

tangente par le segment [dt]. Les transformations possibles de Pet P′

sont repr´

esent´

ees par les courbes de l’espace C1et C2respectivement.

Ces courbes sont respectivement lin´

earis´

ees en Pet P′pour donner T1et

T2: leurs vecteurs directeurs sont les vecteurs tangents, et leur distance

correspond `

a la distance tangente.

tion de mouvement. Notre but est, pour un bloc donn´

de connaˆ

ıtre son d´

eplacement, c’est `

a dire, de trouver le

bloc le plus ressemblant dans l’image d’arriv´

ee, mais aussi

de d´

eterminer les transformations `

a l’int´

erieur de ce bloc.

Chaque bloc I2de l’image d’arriv´

ee est compar´

e avec des

blocs I1spatialement proches dans l’image de d´

epart. Pour

cela, on minimise l’´

equation suivante :

d(I1+λ1,1~v1,1+... +λ1,n ~v1,n, I2)(4)

Au moment de l’encodage (algorithme 1), I1et I2sont

connus, les vecteurs ~v1,i sont calcul´

es `

a l’aide de I1

(´

equation 3). La minimisation de l’´

equation 4 nous per-

met de d´

eterminer le bloc I1le plus similaire au bloc

I2et les λ1,i qui donnent une estimation de la trans-

formation `

a appliquer au bloc I1pour le mettre en cor-

respondance avec le bloc I2. Bien que I2soit connu au

moment de l’encodage, ce n’est pas le cas au moment

du d´

ecodage. Il faut donc utiliser l’´

equation 4 plutˆ

ot que

l’´

equation 2 car il n’est pas possible de calculer les ~v2,i `

la d´

ecompression. Par ailleurs, l’encodage n´

ecessite la mi-

nimisation de l’´

equation 4. Cette minimisation se r´

esume

a une inversion matricielle (pseudo-inverse), op´

eration qui

ne pr´

esente aucune difﬁcult´

e et permet un encodage rapide.

Au moment du d´

ecodage (algorithme 2), l’image pr´

edite

est obtenue `

a partir de chaque bloc I1de l’image de d´

epart,

auxquels on a appliqu´

e les vecteurs de d´

eplacement et

la transformation estim´

es lors de l’encodage. Pour cela,

connaissant le bloc, on calcule les vecteurs tangents ~v1,i

puis, `

a l’aide des valeurs λassoci´

ees, on calcule un bloc I′

tel que :

I′

1=I1+λ1,1~v1,1+... +λ1,n ~v1,n (5)

L’algorithme est assez ﬂexible car il est possible d’inclure

dans le mod`

ele diff´

erentes transformations (voire d’adap-

ter les transformations mod´

elis´

ees `

a l’image). Ces trans-

formations peuvent ˆ

etre g´

eom´

etriques (rotations, transla-

tions...) ou physiques (modiﬁcations d’illumination). Le

Algorithme 1 Encodage

{calcul de la pr´

ediction}

pour tout bloc bde l’image d’arriv´

ee faire

pour tout bloc b′proche dans l’image de d´

epart faire

Calcul des vecteurs tangents ~v du bloc b′

Minimisation de d(b′+λv, b)

si le score de minimisation est plus faible que les pr´

ec´

edents alors

b′

min ⇐b′

ﬁnsi

ﬁn pour

Calcul du d´

eplacement entre le bloc bet le bloc b′

min

Sauvegarde des vecteurs de d´

eplacement et des λqui minimisent

d(b′

min +λv, b)

ﬁn pour

{calcul de l’erreur de pr´

ediction}

Encodage de l’erreur de pr´

ediction

Algorithme 2 D´

ecodage

{g´

en´

eration de la pr´

ediction}

pour tout bloc bde l’image d’arriv´

ee faire

D´

eterminer le bloc b′

min dans l’image de d´

epart (selon les vecteurs de

d´

eplacement estim´

es et sauvegard´

es `

a l’encodage)

Calculer les vecteurs tangents ~v au bloc b′

min

G´

en´

erer un bloc b′′

min en utilisant les λcalcul´

es et sauvegard´

es `

a l’en-

codage : b′′

min ⇐b′

min +λv

Le bloc b′′

min est la pr´

ediction du bloc b

ﬁn pour

{erreur de pr´

ediction}

D´

ecodage de l’erreur de pr´

ediction et correction de la pr´

ediction

d´

ecodage se r´

esume `

a l’´

evaluation de l’´

equation 5 : il est

donc ex´

ecutable en temps r´

eel.

Dans la section qui suit, nous donnons des r´

esultats qua-

litatifs de pr´

ediction par compensation de mouvement ob-

tenus avec notre m´

ethode. Nous les comparons avec ceux

obtenus par simple Block-Matching.

4 R´

esultats

Puisque l’on estime une transformation `

a la fois spatiale et

temporelle entre les blocs de deux images, n´

ecessairement,

l’erreur de pr´

ediction, compar´

ee `

a un celle d’un Block-

Matching classique, diminue. Par cons´

equent, le taux de

compression est am´

elior´

e. En revanche, la m´

ethode im-

pose, pour pouvoir d´

ecoder l’image pr´

edite, de connaˆ

ıtre

les valeurs des λ. Cela n´

ecessite donc leur enregistrement,

au mˆ

eme titre que celui des vecteurs de d´

eplacement des

blocs. La question est de savoir si l’am´

elioration apport´

par notre m´

ethode, `

a savoir une diminution de l’erreur de

pr´

ediction, n’est pas p´

enalis´

ee par l’ajout d’informations

n´

ecessaires que repr´

esentent les λ, et donc l’augmentation

de la taille n´

ecessaire au codage.

Pour r´

epondre `

a cette question nous pr´

edisons, `

a partir

d’une image d’une s´

equence, l’image suivante et compa-

rons les r´

esultats obtenus avec ceux du Block-Matching. Le

premier test porte sur les images (A) et (B) de la ﬁgure 2.

Le mouvement r´

ealis´

e entre ces images est un zoom, difﬁ-

cile `

a pr´

edire du fait de la disparition d’objets.

Les images, en niveaux de gris et cod´

ees sur 1 octet, sont de

taille 512 ×480 (soit 245760 octets). Pour la comparaison,

nous consid´

erons des blocs de taille 8×8et une fenˆ

etre

de recherche de taille 23 ×23. Concernant notre algo-

rithme, nous mod´

elisons trois transformations : l’´

etirement

horizontal, l’´

etirement vertical et un changement d’illumi-

nation. Davantage de transformations pourraient ˆ

etre en-

visageables, mais elles impliquent une augmentation de

la quantit´

e d’informations `

a sauvegarder. Les valeurs des

diff´

erents λsont arrondis `

a10−1pour faciliter leur enco-

dage. ´

Etudions la diff´

erence entre les images g´

en´

er´

ees et

l’image ﬁnale (erreur de pr´

ediction). Les pr´

edictions obte-

nues par les diff´

erentes m´

ethodes sont visibles `

a la ﬁgure 4.

Les diff´

erences entre l’image d’arriv´

ee et l’image d´

epart

(sans) - (A), l’image pr´

edite par Block-Matching (bm) - (B)

et l’image pr´

edite par les distances tangentes (dt) - (C), sont

pr´

esent´

ees par les histogrammes de la ﬁgure 3. Cette ﬁ-

gure montre que notre m´

ethode induit une faible amplitude

des valeurs de l’erreur (valeurs proches de 0) ainsi qu’une

forte redondance statistique. Ce double avantage r´

eduit for-

tement la quantit´

e d’informations `

a coder. Pour appuyer

notre propos, quelques ´

el´

ements statistiques concernant ces

histogrammes sont ´

egalement visibles dans le tableau 1.

range nb de valeurs moyenne variance nb de z´

ero

sans [−254,188] 404 0.04 22.97 7866

bm [−199,90] 250 −0.64 12,05 21689

dt [−88,70] 125 0 3,75 67292

Tableau 1 – Comparaison des histogrammes des erreurs de pr´

ediction

(ﬁgure 3) obtenues par les diff´

erentes techniques.

EQM PSNR entropie taille th´

eorique (bits)

sans 527.7 20.9 6.15 1511213

bm 145.5 26.5 5.21 1281287

dt 14.1 36.6 3.33 818557

(A)

EQM PSNR entropie taille th´

eorique (bits)

sans 4919.5 11.2 8.0 1966139

bm 3094 13.2 7.5 1847711

dt 189.5 25.3 5.1 1243822

(B)

Tableau 2 – Comparaison des pr´

edictions obtenues sans estimation

de mouvement (sans), avec estimation par Block-Matching (bm) et avec

notre approche (dt), (A) si les deux images consid´

er´

ees sont cons´

ecutives

dans la s´

equence, (B) si 12 images s´

eparent les deux images.

Le tableau 2.(A) montre clairement l’am´

elioration apport´

par notre algorithme : diminution de l’erreur de pr´

ediction

et de son entropie. La taille th´

eorique n´

ecessaire pour coder

l’erreur de pr´

ediction est de 102319 octets auxquels il faut

ajouter 3valeurs par bloc de 64 pixels (pour les λ) soit envi-

ron 11520 octets, et ainsi un total de 113839 contre 160160

octets pour le Block-Matching. Ce calcul est th´

eorique et

bas´

e sur l’entropie. Incluse dans une chaˆ

ıne compl`

ete et uti-

lisant des m´

ethodes d’encodage plus pouss´

ees (DCT, trans-

form´

ee en ondelette,...) notre m´

ethode donnerait des taux

plus importants (erreur de pr´

ediction plus faible, longues

suites de z´

eros, etc.).

Pour bien prendre conscience de l’apport de notre

m´

ethode et surtout de sa robustesse, nous avons effectu´

(A) (B)

(C)

Figure 2 – S´

equence de travail (zoom)[16]. (A) : Image 0. (B) : Image

1. (C) : Image 12 (le zoom de la cam´

era a compl`

etement fait disparaˆ

ıtre

une grande partie de l’image, dont le tonneau `

a gauche).

cette comparaison dans une situation plus critique en pas-

sant 12 images entre l’image originale (ﬁgure 2.A) et

l’image `

a pr´

edire (ﬁgure 2.C - le tonneau de gauche

disparaˆ

ıt). Les images pr´

edites par les deux approches

sont visibles sur la ﬁgure 5. Qualitativement, le Block-

Matching est compl`

etement mis en d´

efaut (le tonneau de-

vrait disparaˆ

ıtre, et beaucoup d’artefacts sont visibles dans

l’image pr´

edite) en revanche notre algorithme parvient en-

core `

a fournir une estimation correcte de l’image d’arriv´

ee,

comme les donn´

ees du tableau 2.B le prouvent quantitati-

vement. Malgr´

e la diff´

erence importante entre l’image de

d´

epart et d’arriv´

ee, notre m´

ethode est parvenue `

a fournir

une bonne pr´

ediction.

Ce test montre que notre algorithme permet des

pr´

edictions `

a partir d’images tr`

es diff´

erentes. Nous avons

enﬁn test´

e un encodage d’images successives pour mon-

trer que notre algorithme n’a pas besoin de beaucoup

d’images de r´

ef´

erences pour la compression de s´

equences

vid´

eo, ce qui implique une diminution du taux de com-

pression. Chaque nouvelle image est pr´

edite uniquement

a partir de la pr´

ediction de l’image pr´

ec´

edente (c’est `

dire sans correction de l’erreur de pr´

ediction). La ﬁgure 6

montre l’´

evolution du PSNR des pr´

edictions. Malgr´

e une

baisse progressive de ce PSNR (pr´

evisible), il est toujours

au-dessus de 30, mˆ

eme apr`

es 15 pr´

edictions successives.

L’image est donc correctement caract´

eris´

ee par les vec-

teurs de d´

eplacement et par leurs valeurs λassoci´

ees. Il

n’est alors pas forcement n´

ecessaire d’encoder l’erreur de

pr´

ediction (selon la qualit´

e d´

esir´

ee) et le nombre d’images

de r´

ef´

erence n´

ecessaires diminue, impliquant un gain de

place signiﬁcatif.

5 Conclusion

Nous avons pr´

esent´

e un algorithme permettant d’am´

eliorer

l’´

etape de compensation de mouvement d’une chaˆ

ıne de

10000

20000

30000

40000

50000

60000

-200 -100 0 100 200

’empty’

(A)

10000

20000

30000

40000

50000

60000

-200 -100 0 100 200

’bm’

(B)

10000

20000

30000

40000

50000

60000

-200 -100 0 100 200

’dt3’

(C)

Figure 3 – Histogrammes de la diff´

erence entre l’image d’arriv´

ee et

(A) : l’image initiale, (B) : l’image pr´

edite par Block-Matching et (C) :

l’image pr´

edite par notre approche.

compression de s´

equences vid´

eo. Cet algorithme repose

sur l’utilisation des distances tangentes. Contrairement aux

m´

ethodes de Block-Matching classiques, celui-ci a l’avan-

tage de pr´

edire l’´

evolution temporelle des blocs de l’image,

ainsi que l’´

evolution des pixels au sein de ces blocs.

Les diff´

erents r´

esultats montrent l’efﬁcacit´

e de cet algo-

rithme, qui permet d’obtenir une faible erreur de pr´

ediction

et donc d’am´

eliorer le taux de compression et la qualit´

de l’image reconstruite, et ce mˆ

eme en situation difﬁcile.

Nous avons ´

egalement montr´

e que l’on peut diminuer le

nombre d’images de r´

ef´

erence au sein d’une s´

equence, le

taux de compression en ´

etant d’autant meilleur.

Une r´

eﬂexion est `

a conduire sur le choix des transforma-

tions `

a mod´

eliser. Il serait int´

eressant d’adapter les transfor-

mations `

a chaque bloc aﬁn d’obtenir la meilleur pr´

ediction.

Il est aussi envisageable, en mod´

elisant les translations

(en Xet Y), d’obtenir une estimation subpixelique du

d´

eplacement du bloc sans sur´

echantillonner l’image.

L’´

etude pr´

esent´

ee ici est volontairement ind´

ependante

d’une chaˆ

ıne de compression sp´

eciﬁque et peut ˆ

etre

adapt´

ee `

a de nombreux encodeurs. Toutefois nos re-

cherches vont maintenant s’orienter sur la sp´

eciﬁcation

d’une chaˆ

ıne qui tire au maximum proﬁt des avantages de

notre m´

ethode.

R´

ef´

erences

[1] B. Furht, B. Furht, et J. Greenberg. Motion estimation al-

gorithms for video compression. Kluwer Academic Publi-

shers, 1996.

[2] L.M. Lopes Texeira et A.P. Alves. Block matching al-

gorithms in mpeg video coding. Dans 13th International

(A)

(B)

Figure 4 – Pr´

ediction de l’image de la ﬁgure 2.B `

a partir de l’image de

la ﬁgure 2.A. (A) Par Block-Matching, l’image est bonne mais des arte-

facts apparaissent (notamment en haut du tonneau et autour du paravent).

(B). Par notre algorithme, la qualit´

e de l’image est excellente.

Conference on Pattern Recognition (ICPR’96), pages 934–

939, 1996.

[3] A. Gyaourova, C. Kamath, et S.-C. Cheung. Block matching

for object tracking. Rapport technique, Novembre 2003.

[4] E. Chan et S. Panchanathan. Review of block matching

based motion estimation algorithms for video compression.

Dans Canadian Conference on Electrical and Computer En-

gineering, pages 151–154, 1993.

[5] J.-B. Xu, L.-M. Po, et C.-K. Cheung. Adaptive motion tra-

cking block matching algorithms for video coding. IEEE

Transactions on Circuits and Systems for Video Technology,

9(7) :1025–1029, 1999.

[6] N.S. Love et C. Kamath. An empirical study of block mat-

ching techniques for detection of moving objects. Rapport

technique, Avril 2006.

[7] S. Martucci. Reversible compression of hdtv images using

median adaptive prediction and arithmetic coding. Dans

Proc. IEEE International Symposium on Circuits and Sys-

tems, pages 1310–1313, 1990.

[8] M. Weinberger, G. Seroussi, et G. Sapiro. Loco-i : a low

complexity, context-based, lossless image compression al-

gorithm. Dans Proc. Data Compression Conference, pages

140–149, 1996.

[9] J. Fabrizio et S. Dubuisson. Motion estimation using tangent

distance. Dans International Conference of Image Proces-

sing (ICIP’07), 2007.

[10] P. Simard, B. Victorri, Y. LeCun, et J. Denker. Tangent

prop : a formalism for specifying selected invariances in

adaptive networks. Dans Advances in Neural Information

Processing Systems 4 (NIPS*91), Denver, CO, 1992.

[11] P. Simard, Y. LeCun, J. Denker, et B. Victorri. Transforma-

tion invariance in pattern recognition, tangent distance and

tangent propagation. Dans Neural Networks : Tricks of the

trade, 1998.

(A)

(B)

Figure 5 – Pr´

ediction de l’image de la ﬁgure 2.C `

a partir de l’image de

la ﬁgure 2.A. (A). Par Block-Matching, l’image est inutilisable. (B). Par

notre algorithme, la qualit´

e de l’image est encore acceptable (le tonneau

a bien disparu).

0 2 4 6 8 10 12 14

’psnrdt.txt’

Figure 6 – ´

Evolution du PSNR des pr´

edictions successives dans

une s´

equence obtenues par notre algorithme. Malgr´

e un baisse

progressive, il reste au dessus de 30 apr`

es 15 images. L’intervalle

entre deux images de r´

ef´

erence peut donc ˆ

etre augment´

[12] H. Schwenk et M. Milgram. Constraint tangent distance

for on-line character recognition. Dans International Confe-

rence on Pattern Recognition, pages 515–519, 1996.

[13] H. Schwenk. Am´

elioration de classiﬁeurs neuronaux par

incorporation de connaissances explicites : Applications `

la reconnaissance de caract`

eres manuscrits. Th`

ese de doc-

torat, Universit´

e Pierre et Marie Curie - Paris VI, 1996.

[14] R. Mariani. A face location and recognition system based

on tangent distance. Dans Multimodal interface for human-

machine communication, pages 3–31, River Edge, NJ, USA,

2002. World Scientiﬁc Publishing Co., Inc.

[15] W. Macherey, D. Keysers, J. Dahmen, et H. Ney. Im-

proving automatic speech recognition using tangent dis-

tance. Dans Eurospeech 2001, 7th European Conference on

Speech Communication and Technology, volume III, pages

1825–1828, Aalborg, Denmark, 2001.

[16] Carnegie Mellon Image Database. http ://www.cs.cmu.edu/.

1 / 5 100%

Utilisation des distances tangentes pour la compensation de

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Utilisation des distances tangentes pour la compensation de

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib