Distances de similarité d`images basées sur les arbres

Téléchargement

Distances de similarité d’images basées sur

les arbres quaternaires1

Marta Rukoz*—Maude Manouvrier** —Geneviève Jomier**

* Universidad Central de Venezuela, CCPD, Escuela de Computación,

Av. Los Ilustres, Apt. 47002, Los Chaguaramos, 1041 Caracas, Venezuela

[email protected].ve

** Université Paris Dauphine, LAMSADE

Place du Mal De Lattre de Tassigny, 75775 Paris Cedex 16, France

{manouvrier,jomier}@lamsade.dauphine.fr

RÉSUMÉ. Cet article présente une déﬁnition générale de distance de similarité, appelée , entre

images représentées par des arbres quaternaires. L’arbre quaternaire est une structure hiérar-

chique qui, lorsqu’elle est utilisée pour la recherche d’images par le contenu, permet de tenir

compte de la localisation spatiale des caractéristiques d’image (couleur, texture, etc.). En fonc-

tion de la pondération des nœuds d’arbre quaternaire et de la distance choisie entre ces nœuds,

lors du calcul de , plusieurs distances entre arbres quaternaires ou plusieurs distances de

similarité visuelle entre images peuvent être déﬁnies. Certaines mesures de similarité déﬁnies

dans des articles scientiﬁques apparaissent comme des cas particuliers de la distance . De

nouvelles distances entre images peuvent également être déﬁnies à partir de la distance .

ABSTRACT. This article presents -distance, a generalization of image similarity distances de-

ﬁned on images represented with a quadtree. A quadtree is a recursive partitioning structure

which can be used to handle positional information of image features in content-based image

retrieval. Using different weights on quadtree nodes and different distances between nodes,

distances between quadtrees or surface similarity between images can be computed based on

the general deﬁnition of . We show how existing quadtree-based image distances appear to

be particular cases of the -distance. Moreover, new distances between images can be deﬁned

based on the -distance deﬁnition.

MOTS-CLÉS : Base de données d’images, distance entre arbres quaternaires, similarité visuelle

d’images, similarité de régions d’images, recherche d’images par le contenu.

KEYWORDS: Image database, distance between quadtrees, similarity of image surfaces, similarity

of image regions, image retrieval

. Ce travail a été réalisé dans le cadre d’une coopération internationale CNRS - CONICIT

(accords 8680 et 10058).

18èmes Journées Bases de Données Avancées – 21-25 Oct./2002. BDA’2002, pages 1 à 20

2 18èmes Journées Bases de Données Avancées – 21-25 Oct./2002. BDA’2002

1. Introduction

Dans les systèmes de recherche d’images par le contenu (en anglais Content-

Based Image Retrieval ou CBIR) [ASL 99, BAC 96, CHA 00, FLI 95, ORI 01], le

résultat d’une recherche est un ensemble d’images similaires à une image requête

plutôt qu’un ensemble d’images répondant exactement aux critères de la recherche

[TAN 01]. La recherche d’image par le contenu est basée sur la similarité des ca-

ractéristiques visuelles des images telles que la couleur [LU 94, SMI 02, STE 02],

la texture [MAN 02a, PUZ 99, SMI 94] ou la forme [CHA 00, KIM 02]. La fonc-

tion de distance utilisée pour évaluer la similarité entre images dépend des critères

de la recherche mais également de la représentation des caractéristiques de l’image

[LI 02, LU 99]. L’idée principale est généralement d’associer à chaque image un vec-

teur multi-dimensionnel représentant les caractéristiques de l’image, et de mesurer la

similarité des images en utilisant une fonction de distance entre les vecteurs [CAS 02,

KAK 00]. L’image requête est également représentée par un vecteur de caractéris-

tiques et le résultat de la requête retourne toutes les images dont le vecteur a été

mis en correspondance avec celui de l’image requête [ALB 00]. La requête devient

par conséquent une requête d’intervalle (en anglais range query) de la forme "Re-

trouvez les images pour lesquelles la distance entre leur vecteur de caractéristiques

et le vecteur de caractéristiques de l’image requête appartient à un certain inter-

valle." ou une requête de voisinage (en anglais nearest neighbour query) de la forme

"Trouver les plus proches vecteurs du vecteur de caractéristiques de l’image re-

quête avec un seuil de tolérance donné.", dans un espace vectoriel multi-dimensionnel

[CHE 98b, KAT 97] ou dans un espace métrique [CIA 97, TRA 02].

A chaque image correspond un ensemble d’attributsappelé index ou signature d’image

[NAS 97]. Plusieurs systèmes de recherche d’images, tel que QBIC [FLI 95], caracté-

risent les images par une signature globale (ex. l’histogramme des couleurs de l’image

entière) [RUI 99]. Cependant, pour beaucoup d’applications, la caractérisation globale

des images n’offre pas toujours de résultats satisfaisants. Dans le domaine médical,

par exemple, des caractérisations locales (de régions d’images) sont nécessaires car

le nombre pixels représentant une pathologie est faible par rapport au nombre total

de pixels de l’image et des caractéristiques globales ne permettent pas de différencier

sufﬁsamment les images de la base [SHY 98]. De plus, les caractéristiques globales

ne tiennent pas compte de la localisation des pixels et des régions d’intérêt. Pour re-

médier à cette limite et tenir compte de la localisation des caractéristiques dans le

calcul de la similarité des images, plusieurs approches [ALB 00, AHM 97, GUP 97,

LU 94, LIN 01, MAL 99] utilisent une structure spatiale, l’arbre quaternaire (en an-

glais quadtree) [SAM 84]. Une telle structure permet de stocker les caractéristiques

des différentes régions d’image et de ﬁltrer les images en augmentant au fur et à

mesure le niveau de détails : chaque image est tout d’abord comparée globalement

avec l’image requête, puis si leur similarité globale est inférieure à un certain seuil,

les sous-régions d’images homologues sont comparées, ainsi de suite jusqu’aux ré-

gions de taille minimale. Cette technique d’indexation peut être utilisée pour com-

parer les images globalement [LU 94], mais peut également permettre de faire des

M. Rukoz, M. Manouvrier et G. Jomier 3

requêtes sur les régions d’images telles que "Retrouvez toutes les images de la base

ayant la région nord-ouest et la région sud-est similaires à celles de l’image requête."

[LIN 01, MAL 99].

Dans cet article, nous proposons une déﬁnition générale de distance entre arbres qua-

ternaires, appelée distance . Cette distance est une combinaison linéaire de dis-

tances entre nœuds d’arbres quaternaires. En fonction des différents poids associés

aux nœuds et de la distance choisie entre les nœuds, plusieurs familles de distances

peuvent être déﬁnies à partir de la distance . Plus précisément, nous déﬁnissons

deux familles de distances basées sur la structure des arbres quaternaires, appelées -

distance ( pour ) et -distance ( pour quadrant), et une famille de distances

de similarité visuelle entre images, appelée -distance ( pour visuel). Les deux pre-

mières familles de distances comparent les arbres quaternaires représentant les images.

La dernière famille compare visuellement les images en utilisant leur représentation

en arbre quaternaire. L’intérêt de la distance est que sa déﬁnition est générale, ce

qui signiﬁe que : (1) certaines distances proposées dans le domaine de la recherche

d’images [AHM 97, GUP 97, LU 94, LIN 01, MAL 99] apparaissent comme des cas

particuliers de la distance et (2) il est possible de déﬁnir de nouvelles distances à

partir de la distance .

L’organisation de cet article est la suivante. La section 2 rappelle les grands prin-

cipes de l’arbre quaternaire. La section 3 présente la distance . La section 4 déﬁnit

plusieurs familles de distances dérivées de la distance . Finalement, la section 5

compare les distances proposées dans cet article avec les mesures déjà existantes et

conclut.

00 01

02 030 031

032

0332 0333

0331

0330

00 01

02 030

032 033

0310

0311

0313

0312

Image 1

Image 5

Image 2

Image 6

Image 3

Image 7

Image 4

Image 8

Figure 1. Un exemple de bases de données d’images.

4 18èmes Journées Bases de Données Avancées – 21-25 Oct./2002. BDA’2002

2. Concepts de base de l’arbre quaternaire

00 01 02

033

031

030

0330 0331 0332 0333

032

Identification des noeuds d’arbre quaternaire

00 01 02

031

030 032

0330 0331 0332 0333

033

Arbre quaternaire de l’image 2

00 01 02

031

030

0330 0331 0332 0333

033

032

Arbre quaternaire de l’image 1

00 01 02

031

030 032 033

Arbre quaternaire de l’image 4

00 01 02

031

030 032 033

Arbre quaternaire de l’image 3

Figure 2. Les arbres quaternaires des quatre premières images de la ﬁgure1.

L’arbre quaternaire est une structure hiérarchique construite par divisions récur-

sives de l’espace en quatre quadrants disjoints [SAM 84]. Cette structure est très uti-

lisée pour représenter les images, c’est-à-dire pour stocker les images elles-mêmes

[MAN 02b] ou pourstocker et indexerles caractéristiques des images [LU 94,LIN 01,

MAL 99]. En particulier, l’arbre quaternaire permet de tenir compte, lors de la re-

cherche d’images similaires, de la localisation spatiale des caractéristiques d’images,

telles que la couleur [ALB 00], le contour [CHA 00] ou de la localisation des objets

d’intérêt [AHM 97].

Pour être représentée par un arbre quaternaire, une image est récursivement décompo-

sée en quatre quadrants disjoints de même taille, en fonction d’un critère de découpage

(ex. homogénéité de la couleur) de telle sorte que chaque nœud de l’arbre quaternaire

représente un quadrant dans l’image. Le nœud racine de l’arbre représente l’image en-

tière. Si une image n’est pas homogène par rapport au critère de découpage, le nœud

racine de l’arbre quaternaire représentant l’image a quatre nœuds ﬁls représentant les

quatre premiers quadrants de l’image. Un nœud est feuille si le quadrant correspon-

dant dans l’image est homogène par rapport au critère de découpage, sinon le nœud

est interne.

Il existe plusieurs fonctions permettant d’associer un identiﬁcateur à un nœud d’arbre

quaternaire [SAM 84]. Ces fonctions permettent de retrouver facilement, à partir de

l’identiﬁcateur de l’image et du nœud d’arbre quaternaire, le quadrant associé dans

l’image. Dans cet article, nous utilisons un ordre en Z, en suivant les directions Nors-

M. Rukoz, M. Manouvrier et G. Jomier 5

Ouest, Nord-Est, Sud-Ouest et Sud-Est et en leur associant respectivement les iden-

tiﬁcateurs , , et . Pour commencer (voir à gauche des ﬁgures 1 and 2), l’entier

identiﬁe l’image entière et le nœud racine de l’arbre quaternaire. Les entiers à ,

précédés de , identiﬁent les quatre premiers quadrants de l’image et les quatre nœuds

d’arbre quaternaire associés. De manière récursive, les nœuds ﬁls d’un nœud identiﬁé

par sont identiﬁés par avec un entier prenant sa valeur dans . Deux nœuds

de même identiﬁcateur dans deux arbres quaternaires différents sont nommés nœuds

homologues.

La ﬁgure 2 présente un exemple de quatre arbres quaternaires représentant les quatre

premières images de la ﬁgure 1. Aﬁn de faciliter la compréhension du lecteur, nous

avons utilisé un exemple simple où le critère de découpage est l’homogénéité de la

couleur pour des images en noir et blanc.

Les nœuds internes d’un arbre quaternaire peuvent contenir de l’information comme

par exemple l’histogramme de couleurs ou la signature de la région correspondante, le

nombre de points d’intérêt dans la région associée ou encore une information sur leurs

nœuds ﬁls. Dans la ﬁgure 2, les nœuds internes contiennent la proportion de nœuds

noirs dans le sous-arbre (voir les valeurs soulignées dans la ﬁgure 2). Dans l’approche

de [AHM 97], les images sont caractérisées par des points d’intérêt. Le critère de dé-

coupage des images est, dans ce cas, que chaque nœud feuille de l’arbre quaternaire

corresponde à un quadrant d’image contenant au plus un point d’intérêt. Les nœuds

internes contiennent alors la somme des points d’intérêt situés dans le sous-arbre dont

ils sont racines.

Certaines approches [GUP 97, LU 94, LIN 01, MAL 99] indexent les images par des

arbres quaternaires dont le nombre de niveaux est ﬁxe (généralement inférieur à 3).

Chaque image est, dans ce cas, représentée par un arbre quaternaire complet équili-

bré. Chaque nœud (interne ou feuille) de l’arbre quaternaire contient de l’information

sur la région correspondante dans l’image, comme par exemple l’histogramme des

caractéristiques visuelles de la région (couleur, texture, forme ou une combinaison

des ces caractéristiques). Une telle structure, appelée histogrammes multi-niveaux (en

anglais multi-level histograms), permet de ﬁltrer les images au fur et à mesure de la

recherche. La ﬁgure 3 donne un exemple d’histogrammes de couleurs multi-niveaux,

chaque nœud de l’arbre quaternaire contenant l’histogramme de couleurs de la région

correspondante dans l’image.

3. Distances basées sur les arbres quaternaires

3.1. Distances entre nœuds d’arbre quaternaires

A chaque nœud d’arbre quaternaire correspond un quadrant dans l’image asso-

ciée. Un nœud d’arbre quaternaire peut contenir n’importe quelle information sur la

région correspondante : un histogramme de couleurs, un vecteur de caractéristiques,

1 / 20 100%

Documents connexes

TP numéro 4

Les secteurs tertiaire et quaternaire

c) Lois électriques

Courant électrique : Cours de physique appliquée STI Electronique

Fiche descriptive

Algorithmique : TD 6

Les circuits électriques 1- Définitions

Quel lien y a-t-il entre les nœuds marins et l`action des virus ?

Distance internet et géométrie

TD N°1 Loi des mailles

ELCINQ_02 Loi des noeuds en termes de potentiels en continu

résumé

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Distances de similarité d`images basées sur les arbres

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Distances de similarité d`images basées sur les arbres

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib