
naissance de visages [14] ainsi que la reconnaissance de la
parole [15]. Elle est encore peu utilis´
ee.
La distance d’un motif P`
a un autre motif P′est calcul´
ee en
mesurant la distance entre les espaces param´
etriques pas-
sant par Pet P′respectivement. Ces espaces mod´
elisent
localement l’ensemble des formes engendr´
ees par les trans-
formations possibles entre les deux motifs (figure 1.B). Ils
sont obtenus en lin´
earisant chaque transformation c’est-`
a-
dire en ajoutant au mod`
ele global les vecteurs tangents `
a
ces transformations, pond´
er´
es par un coefficient. Chaque
vecteur tangent d´
erive, en un point, l’ensemble des formes
engendr´
ees par une transformation.
Soit Imle bloc obtenu apr`
es avoir appliqu´
e une composi-
tion de transformations au bloc I. Il est possible d’appro-
cher lin´
eairement Imen utilisant une expansion de Taylor :
Im=I+λ1~v1+λ2~v2+... +λn~vn(1)
o`
u~viest le vecteur tangent `
a la i`
eme transformation et
λicorrespond `
a l’apport de la i`
eme transformation. Dans
notre cas, nous cherchons la transformation entre les blocs
Iet Im: chaque vecteur tangent ~vid´
erive les variabi-
lit´
es locales engendr´
ees par une transformation ´
el´
ementaire
(translation, rotation, changement d’´
echelle, etc.). L’es-
pace form´
e par ces vecteurs, ou espace tangent, donne une
repr´
esentation de tous les blocs, engendr´
es par la compo-
sition des transformations appliqu´
ees `
aI. La figure 1.A
donne une repr´
esentation des vecteurs tangents correspon-
dant `
a diff´
erentes transformations ´
el´
ementaires.
Si l’on souhaite comparer deux blocs I1et I2, on ne calcu-
lera donc pas simplement leur distance d(I1, I2), mais on
cherchera plutˆ
ot `
a minimiser celle entre les deux espaces
tangents (figure 1.B) :
d(I1+λ1,1~v1,1+...+λ1,n ~v1,n, I2+λ2,1~v2,1+...+λ2,n ~v2,n)
(2)
o`
udest la distance euclidienne des niveaux de gris pixel `
a
pixel. Dans cette expression, les blocs I1et I2sont connus.
Les vecteurs tangents ~vi,j correspondent `
a la d´
eriv´
ee en
Iide la j`
eme transformation et λi,j est l’apport de la j`
eme
transformation au i`
eme bloc. Les vecteurs tangents peuvent
ˆ
etre calcul´
es de la fac¸ons suivante :
It=I+λt~vt⇒~vt=I−It
λt
(3)
(le bloc Itpouvant ˆ
etre g´
en´
er´
e de mani`
ere synth´
etique).
Cette minimisation peut se faire num´
eriquement, mais
on trouve ´
egalement une solution analytique dans [11].
Le r´
esultat nous fournit donc, non seulement la distance
minimale entre les deux blocs (en tenant compte des
transformations `
a appliquer `
aI1pour aller vers I2et
r´
eciproquement), mais aussi les valeurs des λi,j indiquant
l’apport de chaque vecteur tangent, ce qui permet d’estimer
la transformation r´
eelle entre les deux blocs.
3 La compensation de mouvement
L’algorithme pr´
esent´
e ici repose sur l’utilisation de la dis-
tance tangente pour faire de la pr´
ediction par compensa-
(A)
(B)
Figure 1 – (A). Vecteurs tangents `
a l’image d’origine (`
a gauche), avec,
de gauche `
a droite : rotation, translation horizontale et verticale, facteur
d’´
echelle horizontal et vertical. (B). Comparaison des motifs Pet P′. La
distance euclidienne est repr´
esent´
ee par le segment [de]et la distance
tangente par le segment [dt]. Les transformations possibles de Pet P′
sont repr´
esent´
ees par les courbes de l’espace C1et C2respectivement.
Ces courbes sont respectivement lin´
earis´
ees en Pet P′pour donner T1et
T2: leurs vecteurs directeurs sont les vecteurs tangents, et leur distance
correspond `
a la distance tangente.
tion de mouvement. Notre but est, pour un bloc donn´
e,
de connaˆ
ıtre son d´
eplacement, c’est `
a dire, de trouver le
bloc le plus ressemblant dans l’image d’arriv´
ee, mais aussi
de d´
eterminer les transformations `
a l’int´
erieur de ce bloc.
Chaque bloc I2de l’image d’arriv´
ee est compar´
e avec des
blocs I1spatialement proches dans l’image de d´
epart. Pour
cela, on minimise l’´
equation suivante :
d(I1+λ1,1~v1,1+... +λ1,n ~v1,n, I2)(4)
Au moment de l’encodage (algorithme 1), I1et I2sont
connus, les vecteurs ~v1,i sont calcul´
es `
a l’aide de I1
(´
equation 3). La minimisation de l’´
equation 4 nous per-
met de d´
eterminer le bloc I1le plus similaire au bloc
I2et les λ1,i qui donnent une estimation de la trans-
formation `
a appliquer au bloc I1pour le mettre en cor-
respondance avec le bloc I2. Bien que I2soit connu au
moment de l’encodage, ce n’est pas le cas au moment
du d´
ecodage. Il faut donc utiliser l’´
equation 4 plutˆ
ot que
l’´
equation 2 car il n’est pas possible de calculer les ~v2,i `
a
la d´
ecompression. Par ailleurs, l’encodage n´
ecessite la mi-
nimisation de l’´
equation 4. Cette minimisation se r´
esume
`
a une inversion matricielle (pseudo-inverse), op´
eration qui
ne pr´
esente aucune difficult´
e et permet un encodage rapide.
Au moment du d´
ecodage (algorithme 2), l’image pr´
edite
est obtenue `
a partir de chaque bloc I1de l’image de d´
epart,
auxquels on a appliqu´
e les vecteurs de d´
eplacement et
la transformation estim´
es lors de l’encodage. Pour cela,
connaissant le bloc, on calcule les vecteurs tangents ~v1,i
puis, `
a l’aide des valeurs λassoci´
ees, on calcule un bloc I′
1
tel que :
I′
1=I1+λ1,1~v1,1+... +λ1,n ~v1,n (5)
L’algorithme est assez flexible car il est possible d’inclure
dans le mod`
ele diff´
erentes transformations (voire d’adap-
ter les transformations mod´
elis´
ees `
a l’image). Ces trans-
formations peuvent ˆ
etre g´
eom´
etriques (rotations, transla-
tions...) ou physiques (modifications d’illumination). Le