Telechargé par rahmanimine

Taxonomie des techniques de visualisation de données

Chapitre 1
Taxonomie des techniques de visualisation de données
1. Introduction
Dans le cas de la fouille de données, l'être humain ne cherche plus à comprendre un environnement
global, mais plutôt à comprendre une partie de cet environnement. A cet effet, il est à la recherche
de structures, de caractéristiques, de motifs, de tendances, d'anomalies ou, de manière plus
générale, de la présence ou de l'absence de relations dans les données.
Depuis plus d'un demi-siècle, cette analyse manuelle des données, effectuée dans le but d'en extraire
des connaissances, n'est plus réalisable à la main. En effet, du fait de la multiplication des paramètres
pris en compte et de la multiplication des mesures effectuées, la quantité d'information à traiter a
rendu obligatoire l'utilisation de méthodes pour les analyser.
Le traitement purement automatique de ces informations afin d'en extraire des connaissances se
nomme la « fouille de données » ou data mining. Bien que permettant une automatisation de
l'analyse, la fouille de données n'est pas la solution parfaite au problème de la compréhension des
données. En effet, très souvent, les algorithmes de fouilles de données, aussi sophistiqués qu'ils
soient, ne parviennent pas à extraire la totalité des informations pertinentes. Pour résoudre ce
problème, une solution viable consiste à présenter graphiquement les données de manière à
permettre à la fois de guider, par l'interaction, une extraction de connaissances (automatique ou
manuelle) et de permettre la transmission des connaissances à l'expert en l'aidant à construire sa
carte mentale des données. Ainsi, on parlera de fouille visuelle de données ou de visual data mining.
Le rôle de la visualisation dans la fouille visuelle de données peut se résumer en plusieurs points
principaux. Elle permet d'afficher une grande quantité de données, fournissant de ce fait une vue
d'ensemble des données. Elle permet automatiquement, ou par interaction, de résumer et annoter
des données La visualisation permet également de détecter des sous-ensembles de données où il est
intéressant d'appliquer tel ou tel outil de fouille de données ou de fouille visuelle de données de
manière plus précise.
D'un autre côté, l'expert cherchant à analyser les données peut ne pas savoir ce qu'il cherche. Dans
ce cas, le choix d'un algorithme de fouille de données est difficile à faire. La visualisation trouve alors
son intérêt grâce à l'interaction, permettant à l'utilisateur d'établir une carte mentale des données et
de rechercher des structures. L'interaction de l'utilisateur avec la visualisation tient un rôle très
important. L'interaction permet, entre autres, la navigation dans les données (vue sous différents
angles), l'interrogation des données (réduction de l'affichage ou de caractéristiques d'affichage à une
portion de l'espace) et l'association de données entre elles (marquages, simplification, réduction, ... ).
2. Historique ( Voir la présentation : 1-Histoire.pdf )
La visualisation d'information permet de faciliter l'abstraction des informations dans les données.
3. Définitions et structure générale d'un système de visualisation d'information
3.1
Définitions
Une visualisation, c'est l'ensemble des moyens graphiques autres que ceux textuels ou ceux verbaux
utilisés dans le but de communiquer des informations.
L'interaction regroupe l'ensemble des moyens mis à disposition de l'utilisateur et l'ensemble des
actions de l'utilisateur permettant d'ajuster une visualisation de manière interactive.
Un attribut graphique est un aspect élémentaire d'une visualisation contrôlable par l'utilisateur
définissant les caractéristiques de la représentation (position, taille, couleur, forme, orientation,
vitesse, texture, transparence, ...).
La mise en correspondance ou mapping est l'opération qui consiste à définir la façon dont les
attributs des données sont associés aux attributs graphiques.
La normalisation des données est l'opération qui consiste à ré-échelonner les valeurs prises par les
différents attributs des données dans un intervalle donné. Il est possible de définir principalement
trois types de normalisation:
a)- la normalisation locale : chaque dimension est ramenée dans l'intervalle [0,1] ou [—1,1]. Ce type
de normalisation confère un poids égal à chacune des dimensions ;
b)- la normalisation globale : toutes les dimensions sont ré-échelonnées dans l'intervalle [m, M] en
désignant par m le minimum (respectivement M le maximum) des valeurs sur toutes les dimensions.
Ce type de normalisation donne un poids plus important à la dimension qui a la plus grande valeur ;
c)- la normalisation pondérée : seules les dimensions qui ont un sens équivalent sont normalisées
simultanément.
3.2
Structure générale d'un système de visualisation d'information
Le processus de visualisation d'information est un processus en cinq étapes interagissant entre elles :
Les deux premières étapes sont l'acquisition et la
préparation des informations. Après l'acquisition des
données ayant pour origines des expérimentations, des
observations, voire des expérimentations numériques ou
des simulations, il est nécessaire de transformer ces
données dans une forme compréhensible par la
méthode de visualisation. Pendant la transformation, les
données peuvent être filtrées, lissées, enrichies et/ou
normalisées, afin d'améliorer la visualisation;
La troisième étape du processus consiste en la définition
de la mise en correspondance entre les données et les
éléments de la visualisation ;
Figure 1 : Processus de visualisation
d’information
L'étape suivante consiste à traduire les données et la mise en correspondance en une représentation
permettant l'analyse;
La dernière étape est l'analyse de l'utilisateur. Cette étape est cruciale, car c'est à ce moment que
l'on permet à l'utilisateur d'ajuster les différents paramètres du processus de visualisation, afin de lui
permettre d'explorer les données.
4. Les principaux systèmes de classification en visualisation de l’information
Les principaux systèmes de classification en visualisation de l’information ont été construits autour
de trois axes : le type des données, les traitements et les tâches.
4.1 Le type des données (Taxonomie de Shneiderman)
La littérature sur la visualisation de l’information fait souvent référence aux travaux de Bertin
sur l’étude de la sémiologie graphique qui suggèrent que la forme de la représentation utilisée
dépend du type des données à afficher. Selon Bertin, les données peuvent se représenter sous deux
formes, soit en fonction de leur valeur, soit en fonction de leur structure. Les valeurs sont associées
aux attributs (numériques, thématiques, etc.) inhérents à un problème. La structure comprend les
relations (liens, contraintes) qui caractérisent les données comme un tout. A chacune de ces formes
(et pour un type de données particulier) doit être associée une représentation graphique différente.
Par exemple, un histogramme peut représenter des valeurs d’attributs, alors qu’un diagramme
d’arbre représente les relations structurelles à l’intérieur d’un ensemble de données.
A partir des observations de Bertin, plusieurs taxonomies ont été construites en fonction du
type des données à représenter. Parmi celles-ci, une des plus connues est celle de Shneiderman qui
résume les principes de base de la conception visuelle par ce que l’auteur appelle ‘Visual Information
Seeking Mantra : overview first, zoom and filter, then details-on-demand’. Elle est définie comme
une taxonomie de « tâche par type de données » : en plus des sept types de données décrits dans le
tableau 1 ci-dessous, cette taxonomie prend en compte un ensemble de tâches que la représentation
doit s’efforcer de faciliter.
Types de données
1D
2D
3D
Temporelles
Multidimensionnelles
Hiérarchiques
Relationnelles
Description
Données organisées de manière linéaire ou séquentielle : documents
textuels, lignes de code d’un programme, listes alphabétiques, etc.
Données dont la localisation ou la géométrie dans le plan est primordiale :
plans, cartes géographiques, mise en page de journaux, etc.
Données qui accordent une prédominance à la localisation ou la géométrie
dans l’espace : chimie, architecture, mécanique, etc.
Données qui ont une existence dans le temps : gestion de projet, suivi
médical, etc.
Données dont le caractère spatial n’est pas dominant et qui possèdent un
nombre d’attributs n : données statistiques, contenu de bases de données,
etc.
Données organisées de manière à ce que chaque entité possède un lien
unique vers une entité parent (à l’exception de la racine) : système de
fichiers, GUI, etc.
Données qui forment un graphe dont la structure n’est pas arborescente :
hyperdocuments, réseaux télécoms, etc.
Tableau 1 : Types de données dans la taxonomie de Shneiderman.
Tâches
Donner une vue d’ensemble
Zoomer
Filtrer
Description
Obtenir une vue globale sur la collection entière.
Zoomer sur une entité jugée intéressante.
Eliminer de la vue les données non pertinentes à un moment
donné.
Sélectionner une entité ou un groupe et en visualiser les détails
Détailler à la demande
si besoin.
Visualiser les relations entre les éléments.
Associer
Tracer un historique afin de supporter l’annulation d’une ou
Fournir l’historique
plusieurs commandes, le retour arrière, le play-back, etc.
Permettre la sauvegarde de sous-collections et de paramètres
Extraire
de requêtes.
Tableau 2 : Tâches dans la taxonomie de Shneiderman.
4.2 Les traitements (Taxonomie de Leung)
Un autre type d’approche pour classifier les systèmes de visualisation repose sur l’analyse
des différents traitements proposés par ces systèmes. Un exemple possible concerne l’analyse des
interactions en entrée, la classification s’effectuant en fonction de leur nature (sélection par
manipulation directe ou indirecte), de leur niveau (singleton, groupe ou intégralité des objets ou des
attributs) et de leur conséquence en terme de transformation graphique, de présentation et
d’organisation. Plusieurs approches orientées traitements ont été proposées. Parmi celles-ci, la
taxonomie de Leung classe les systèmes de visualisation en fonction des techniques utilisées pour
faire évoluer la représentation au cours de l’exploration.
Leung classe les systèmes de visualisation en deux catégories en fonction des techniques
utilisées pour accéder à l’information. La première catégorie regroupe l’ensemble des techniques qui
permettent de déformer la représentation, la seconde regroupe les techniques non déformantes. La
principale caractéristique des techniques de déformation consiste à permettre aux utilisateurs
d’examiner en détail une région particulière de la représentation tout en gardant une vision globale
de l’espace, ceci afin de faciliter la navigation. Leung affine cette classification en différenciant les
données de nature graphique (i.e. qui possèdent des relations spatiales implicites), des données non
graphiques, ces dernières pouvant toutefois être représentées sous une forme graphique abstraite
dans de nombreux cas. Les cartes et les plans sont de bons exemples de données graphiques, alors
qu’un graphe hypertexte correspond à une donnée non graphique.
La méthode utilisée pour transformer la représentation semble être un critère de classification bien
adapté à l’exploration hyper-documentaire. Par exemple, l’utilisateur peut visualiser une
représentation globale pour comprendre l’organisation des documents, puis passer à une vue locale
montrant le détail de certains documents afin de trouver celui qui l’intéresse le plus. Le passage du
global au local peut être réalisé de plusieurs manières, notamment au moyen d’une déformation de
l’affichage ou d’un zoom.
4.3 Les tâches (Taxonomie de Bruley)
L’usage des données conditionne souvent la représentation de ces données. Cependant, peu
de taxonomies existantes se basent sur l’analyse des tâches que les systèmes de visualisation
permettent d’effectuer. La taxonomie de Shneiderman, décrite à la section 4.1, repose en partie sur
la définition d’un ensemble de tâches de bas niveaux (zoomer, filtrer, associer, extraire, etc.). Cette
étude masque toutefois l’importance des tâches de haut niveau (trouver, comprendre, organiser,
retrouver) dans le processus de conception d’un système de visualisation. Selon Bruley, la manière
de représenter des données dépend fortement des tâches que l’utilisateur souhaite effectuer sur ces
données. Il introduit donc la notion de point de vue, un même ensemble de données pouvant être
représenté par différents points de vues.
Sur la base des travaux de Shneiderman, Bruley définit donc une taxonomie induite par le
point de vue sur les données, plutôt que par leur type. Il met en avant la manière de représenter
l’organisation des données plutôt que leur organisation réelle. Bruley propose deux nouvelles
catégories (le point de vue spatial et le point de vue non structuré), afin de séparer les données de
type 1D, 2D, 3D et nD qui ont une géométrie, de celles qui n’en ont pas. Cette séparation est
d’ailleurs à rapprocher de celle proposée par Leung sur les données graphiques et non graphiques.
Bruley déduit de son étude une démarche à suivre pour la conception de représentations graphiques
qui est basée sur quatre éléments :
 l’espace des informations qui contient les données à représenter,
 le (ou les) point(s) de vue qui résulte(nt) de l’analyse de cet espace et de la nature de la
tâche à réaliser,
 l’espace géométrique de représentation qui fixe la position des objets graphiques,
 l’espace géométrique de construction qui est la sous-partie de l’espace de représentation
réellement affichée.
Figure 2 : Taxonomie de Leung
5. Visualisation d’information, visualisation de connaissance et visualisation scientifique
Définition : La visualisation est l’utilisation de représentations visuelles interactives et informatisées
de données pour amplifier la cognition.
La visualisation a donc pour objectif de représenter graphiquement des données pour permettre aux
utilisateurs de mieux raisonner. Il est possible de remarquer l’héritage des IHM avec le caractère
nécessairement informatisé de la visualisation.
Définition : La visualisation d’informations est l'utilisation de représentations visuelles interactives
et informatisées de données abstraites pour amplifier la cognition.
Il est donc facile de comprendre que les données abstraites n’ont pas de représentation graphique
intrinsèque. C’est pourquoi, la principale problématique de la visualisation d’informations est de
déterminer quelles représentations choisir pour véhiculer quel message.
La visualisation d’informations est l’utilisation de représentations visuelles de données abstraites pour
amplifier la cognition.
Définition : La visualisation scientifique est un outil qui permet de manipuler un grand nombre de
données scientifiques afin de permettre de « voir » des phénomènes issus de ces données.
La visualisation scientifique est donc basée sur des données physiques (la terre, des molécules, le
corps humain) déjà localisées dans un espace.
Définition : Le concept de visualisation de connaissances est limité aux aspects d’externalisation de
la connaissance d’un individu pour lui-même en utilisant un tracé libre.
L’expression de visualisation de connaissances est utilisée pour désigner tout procédé permettant de
présenter une structure de connaissances ou encore, comme moyen pour évaluer soi-même des
connaissances et aider à la compréhension et à la navigation. Les cartes conceptuelles sont
généralement utilisées pour organiser des idées, concevoir et communiquer une structure complexe
et résoudre des problèmes.
La visualisation d’informations porte sur des données abstraites portant sur des objets et les
relations entre ces objets, alors que la visualisation de connaissances porte sur des données
abstraites qui représentent des connaissances.
La visualisation de connaissances est l’utilisation de représentations visuelles de connaissances à des
fins de création et de partage.
6. Les différentes techniques de visualisation (voir slides d’introduction)
a)- La visualisation linéaire : Les gros tableaux, les murs fuyants
b)- La visualisation hiérarchique : Listes indentées, diagrammes, approche surfacique (treemap, slice,
cubes d’information, beamtrees, cushion treemaps, visualisation botanique), approche hyperbolique,
approche conique, approche landscape.
c)- La visualisation des réseaux : Réseaux sociaux.
d)- La visualisation multidimentionnelle : les nuages de points ou scatter plot, diagrammes
d’Inselberg ou coordonnées parallèles.
e)-la visualisation vectorielle (websom, VxInsight)
f)- La visualisation iconique.
g)- Graph drawing
Chapitre 2
Les techniques d’interaction
1. Introduction
Avant le développement de l'interface graphique par les laboratoires de Xerox dans les années 70,
l'interface de l’ordinateur était un curseur clignotant sur un écran noir nécessitant l'entrée de
commandes et de paramètres que seuls les experts pouvaient utiliser. Ces chercheurs ont donc
imaginé une interface pouvant être compréhensible par tous et qui donna naissance au paradigme
WIMP (Windows, Icônes, Menus, Pointeur) rendu disponible au grand public en 1984 par Apple
Macintosh. La révolution qu’a constitué l’avènement de ces interfaces tenait essentiellement à
l'introduction de métaphores visuelles, telles celles du bureau avec les dossiers, les documents, la
poubelle, les menus, etc., qui ont permis à l’utilisateur de se construire une carte cognitive du
système.
C'est l'interaction, qui rend possible l'exploitation réelle des vues d'ensembles une fois produite. En
effet, l'être humain est particulièrement habile à extraire des informations d'un environnement qu'il
contrôle directement et activement par rapport à un environnement qu'il ne peut qu'observer de
manière passive. La perception est indissociable de l'action : il faut agir pour percevoir et il faut
percevoir pour agir. On parle de couplage (ou boucle) action-perception. La visualisation interactive
requiert des temps de réponse interactifs (de l'ordre du 1/10ème de seconde) afin d'exploiter le
couplage action/perception. Dès que l'on traite des données de grande taille, cette contrainte exige
l'utilisation d'algorithmes particulièrement efficaces. Pour les besoins de l'interaction, il est parfois
préférable de dégrader la qualité de l'affichage au profit de la vitesse de réaction, quitte à raffiner
l'affichage lorsque l'interaction s'arrête ou marque une pause. Ainsi, au couplage action-perception
de l'utilisateur correspond un fort couplage affichage-interaction du système de visualisation.
Un certain nombre de techniques classiques d'interaction peuvent être utilisées pour la visualisation
d'information, comme par exemple les barres de défilement pour naviguer le contenu d'une fenêtre,
ou les boîtes de dialogues pour spécifier des paramètres de visualisation. Cependant, les meilleurs
résultats sont obtenus en couplant plus fortement l'interaction avec la technique de visualisation.
Trois catégories de techniques d'interaction peuvent être mises en œuvre avec un grand nombre de
techniques de visualisation :
Le filtrage dynamique : Le filtrage dynamique est particulièrement utile pour interagir avec des vues
globales, car l'information présente dans ces vues n'est pas définitivement pertinente pour un
utilisateur. En effet, s'il est intéressant pour un utilisateur de voir dans un premier temps l'ensemble
des informations qu'il explore pour mieux l'appréhender, il sera intéressant par la suite que
l'utilisateur puisse recentrer son exploration, en réduisant son espace de recherche. On distingue les
requetés dynamiques et la technique fisheye.
Une autre façon de concilier détails et vue globale est de permettre à l'utilisateur de zoomer
facilement : un zoom avant révèle les détails tandis qu'un zoom arrière révèle le contexte. Le zoom
est une transformation géométrique à part entière et peut être plus ou moins complexe.
2. Les techniques de distorsion
L’arrivée de systèmes contenant une quantité énorme d’informations et dont l’affichage se trouve
restreint par la taille limitée des écrans d’ordinateurs, a incité plusieurs chercheurs à orienter leurs
recherches vers des techniques de présentation basées essentiellement sur la déformation de
l’espace d’information (distorsion, zoom). Il existe deux types de données, graphiques et non
graphiques, qui sont alors affichées dans des espaces distincts d’informations de grandes tailles. Dans
les deux cas, la vue peut être déformée (le détail est affiché avec le contexte) ou non déformée (le
détail y est représenté avec peu ou sans contexte) (Figure 1).
2.1 Interfaces multi-vues
L’écran est souvent partagé en deux ou plusieurs fenêtres, permettant d’avoir une vue globale
et une vue plus localisée sur la région qui accroche l’attention du lecteur La vue globale est
dépourvue de détails mais elle permet au sujet de localiser sa région dans l’espace
d’informations et relativement aux autres régions, elle est souvent représentée par un
rectangle ou un point qui se déplace sur la fenêtre de la vue d’ensemble (Figure 2). Les
inconvénients de cette méthode est qu’elle divise l’espace, qui est déjà petit, sur un écran
d’ordinateur et elle divise également l’attention de l’utilisateur entre la vue globale et la vue
détaillée. Enfin, elle oblige l’utilisateur à intégrer mentalement la vue détaillée dans la vue
d’ensemble alors que le raccordement entre les deux images n’est pas nécessairement évident.
2.2 Les interfaces focus + contexte
La vision humaine permet simultanément une vue globale de l’environnement et une vue
détaillée de l’objet sur lequel porte l’attention du sujet lui permettant ainsi d’appréhender et
de comprendre l’information qui lui est fournie. Lorsqu’on navigue dans un espace
d’informations contenant énormément de données, il est souvent nécessaire d’avoir une vue
globale, c’est-à-dire une synthèse de ces informations permettant de se recadrer dans le
contexte de navigation et qui permet également de faire le lien d’un détail à un autre. Le
lecteur a besoin de situer la région sur laquelle porte son attention par rapport à la région
globale et/ou par rapport aux autres régions. Souvent, l’affichage d’une grande quantité
d’informations sur un écran d’ordinateur est accompagné d’une réduction des détails pour
pouvoir afficher la région globale à l’échelle de l’ordinateur, mais l’accessibilité à cette région
globale se fait souvent au détriment de la lisibilité (polices ou graphiques trop petits). Les
interfaces focus + contexte sont des interfaces qui justement permettent l’affichage de la vue
globale et de la vue locale à la fois ; le focus étant le point (ou la région) sur lequel est
concentré le lecteur et le contexte étant la vue globale. Les deux ne sont pas affichés à la
même échelle : tout en maintenant le contexte disponible, le focus est agrandi (distorsion ou
zoom) par rapport aux autres régions. L’arrivée de ces interfaces a fait disparaître la
discontinuité spatiale qui existait dans les interfaces multi-vues en apportant une nouvelle
présentation des structures composant l’interface différente de la présentation initiale. Ainsi,
par cette technique, les chercheurs essaient de se rapprocher de la vision humaine qui permet
une vue globale et précise à la fois. Parmi ces techniques, on peut citer perspective wall,
affichage fisheye, affichage bifocale, documents lens ainsi que les interfaces zoomables.
En dehors des interfaces zoomables, les autres techniques sont toutes des méthodes de
distorsion qui généralement sont définies comme des techniques qui changent (déforment) le
rapport spatial entre les objets. Elles créent de cette façon une région d'intérêt qui permet à
l'utilisateur d'examiner un point local (le focus), tout en présentant en même temps une vue
holistique de l'espace pour fournir un contexte global afin de faciliter la navigation. Les
différences essentielles existantes entre ces techniques de distorsion sont les méthodes
d’application des fonctions de transformation et d’agrandissement.
Une vue déformée est créée en appliquant à l’image initiale une fonction mathématique
appelée la fonction de transformation (Figure 3). Cette dernière définit la manière dont
l’image originale est transformée en une vue déformée et ces caractéristiques déterminent à
quelle classe (catégorie de classification) appartient la technique de déformation en question.
Quant à la fonction d’agrandissement, qui est la dérivée de la fonction de transformation, elle
permet de fournir un profil des facteurs d’agrandissement / de réduction liés à la zone entière
de l'image originale (Figure 3).
Toutes les distorsions liées aux interfaces focus+contexte sont également décrites par DOI
(Degree of Interest), une notion qui permet de donner, à partir d’un élément, une valeur qui
indique le niveau d’intérêt de cet élément. C’est une fonction qui change avec le temps
puisque le focus y est souvent déplacé. Elle permet de comprendre comment l’espace est
réparti entre les différents éléments. La principale motivation de développement de ces
interfaces est la possibilité d’afficher une grande quantité d’information sur un espace réduit,
c’est-à-dire l’espace de l’écran d’ordinateur.
Il y a également d’autres aspects qui déterminent le type de technique utilisé. Le premier de
ces aspects se rapporte à la région du focus ; est-elle statique ou dynamique ? Même si toutes
les techniques présentées dans ce chapitre ont une région dynamique du focus (souvent
préférable), il pourrait y avoir des techniques qui opteraient pour une région statique. Le
deuxième aspect concerne la fonction d’agrandissement qui peut être continue ou discontinue.
Une fonction d’agrandissement discontinue fournit une image cassée, la transition n’est pas
lisse mais présente l’avantage d’être simple et plus intuitive (affichage bifocal, mur fuyant). A
l’inverse, un agrandissement continu présente une transition lisse entre la région focale et la
région contexte (affichage polyfocal, vues fisheye). Enfin le dernier aspect concerne
l’application possible à une ou deux dimensions. Nous présenterons d’abord les techniques
simples, c’est-à-dire celles qui ont opté pour une fonction d’agrandissement discontinue et
nous terminerons par les techniques à fonction d’agrandissement continue.
2.2.1 Affichage bifocal
L’affichage bifocal est une technique permettant d’afficher le détail et le contexte en même
temps. Destinée à l’affichage de grands ensembles de données hiérarchisées. C’est
probablement la technique la plus intuitive et la plus facile à mettre en application. La
fonction de transformation est linéaire dans la région du focus et des régions alentours
(facteurs d’agrandissement constants) comme le montre la Figure 4, la déformation est
évidemment discontinue mais la technique fournit une focalisation dynamique naturelle.
La transformation bifocale a été développé pour une dimension mais Leung repris le concept
en 1989 et l’appliqua en deux dimensions pour une utilisation interactive du métro londonien.
Dans le cas d’un affichage bifocal bidimensionnel, 9 régions sont formées. La région centrale,
qui représente le focus, fournit une vue détaillée d’une partie de l’espace d’information et
aucun facteur de réduction n’y est appliqué. Le rapport optique des 8 régions restantes est
réduit par une valeur constante selon les axes x et y. On remarque que les régions des coins
sont réduites dans les deux dimensions (Figure 5). Ainsi avec un affichage interactif, la
région du focus et les 8 régions environnantes se décalent lorsque l’utilisateur déplace sa
souris sur la région désirée.
2.2.2 Perspective wall
Le mur fuyant est une technique développée par Mackinlay et collaborateurs qui permet de
représenter les informations graphiquement avec une vue déformée du détail et du contexte
sous forme d’un mur en perspective (Figure 6). L’interface affiche le détail au milieu d’une
surface 2D avec vues en perspective sur les deux côtés permettant d’afficher le contexte de
visualisation. L'échelle des objets est proportionnelle à leur éloignement sur le mur : les
documents sur le panneau faisant face au lecteur sont directement lisibles alors que les
documents éloignés sont de plus en plus petits, comme dans le monde réel. Cette méthode est
efficace pour des données de type linéaire et elle semble spécialement idéale pour l’affichage
des informations temporelles car elle permet au lecteur d’être concentré sur la période
temporelle de son choix tout en affichant les périodes adjacentes. Le changement du focus
d’attention se fait par le déplacement des coins et la transition entre les vues se fait
progressivement, c’est-à-dire que l’utilisateur voit le passage d’une vue de face à une vue en
perspective.
Cette méthode est une extension conceptuelle des affichages bifocaux car le même principe de
transformation et d’agrandissement y est appliqué (Figure 7). La distinction principale
concerne les régions en alentours du focus ; le facteur de réduction se fait à un taux croissant
et non constant comme dans le cas de l’affichage bifocal. L’ajout d’une vue en perspective
réduit la charge cognitive de l’utilisateur en comparaison de l’affichage plat de la technique
bifocale (Figure 8). Cependant, l’espace des coins est perdu ce qui est contraire à l’un des
objectifs des techniques de déformation qui postulent que l’utilisation de la zone de
visualisation doit être maximisée. Cette imperfection particulière a donné naissance à une
autre technique appelée document lens et qui est développée dans les sections suivantes.
2.2.3 Document lens
Le document lens fut inventé afin de pallier les problèmes de perte d’espace dans les coins
engendrés par le mur fuyant. En reprenant le principe de Perspective wall, une vue en
perspective est créée dans les deux dimensions et le document lens est ainsi obtenu. A
l’inverse du perspective wall, où l’espace est gaspillé, tout l’espace est exploité dans le cas du
document lens. Un document texte global visible sur tout l’écran, mais impossible à lire, sera
transformé avec le document lens en une pyramide vue de haut et dont le sommet est coupé.
Ce dernier, représenté par un rectangle ou un carré, correspond au focus et donc fournit des
détails aux lecteurs. Le texte présent sur les côtés de la pyramide devient de moins en moins
visible au fur et à mesure que l’on s’éloigne du sommet. En déplaçant la souris, le sujet
déplace la fenêtre focus qui est rectangulaire (ou carrée) en ayant la possibilité de changer
(par touches clavier) sa hauteur et sa largeur. L’inconvénient est le risque d’agrandir la fenêtre
focus au point de perdre le contexte, c’est-à-dire la transformation d’une pyramide en un cube
dont les côtés sont invisibles vus d’en haut. Certes, le lecteur aura plus de détails sur la région
qui l’intéresse, car la fenêtre focus aura quasiment la taille de l’écran, mais au détriment d’une
vue globale ou partielle du contexte.
La loupe, qui est utilisée pour agrandir les caractères permettant ainsi une lecture aisée, a
inspiré le développement de document lens. La seule différence réside dans la forme de
présentation. En effet, l’image fournie par la loupe est circulaire et procure un agrandissement
de type conique (Figure 10) qui engendre une perte du contexte (ce dernier est caché) alors
qu’avec le document lens, la lentille a une forme rectangulaire et il n’y aucune perte du
contexte (sauf si on agrandit le focus).
2.2.4 Affichage polyfocal
L'affichage polyfocal a été proposé pour la présentation de données statistiques sur des
schémas cartographiques. L'affichage polyfocal est représenté par une fonction de
transformation hyperbolique (ou polynôme) plus complexe comme le montre la Figure 11.
Cette fonction est continue et peut avoir de multiples crêtes. Elle est habituellement décrite
par deux paramètres : l’un contrôle la valeur au centre de la région focale et l'autre décrit le
taux de changement du facteur d’agrandissement en prenant en considération la distance à
partir du point focal.
L'application de cette technique se fait dans une ou deux dimensions avec une ou plusieurs
focales, ce qui donne naissance à des affichages polyfocaux multifocaux où plusieurs points
focaux sont disponibles comme le montre la Figure 12. Dans ce cas, les mêmes paramètres
sont appliqués à chaque focale avec un facteur d’agrandissement qui peut être différent d’une
crête à l’autre.
2.2.5 Stratégie Fisheye
En photographie, l’objectif fish-eye est un objectif spécial : il a une distance focale très courte
et un angle de champ très grand, jusqu'à 180° dans la diagonale, voire dans toute l'image.
Contrairement aux objectifs classiques, il donne des images déformées : toutes les lignes
droites qui ne passent pas par le centre sont courbées (Figure 13). Les régions proches sont
vues avec beaucoup plus de détails et les régions environnantes sont vues successivement
avec moins de détails.
Dans le domaine de la visualisation d’informations, cette technique fut initialement
développée pour la représentation des arbres. Le même principe que celui de la photographie
est repris, le focus étant montré avec plus de détails alors que le contexte est vu
progressivement avec moins de détails. L’objectif étant de trouver un équilibre entre le
contexte global et le détail local comme le montre cette caricature de Steinberg datant de 1976
publié dans le New Yorker. C’est une vue à vol d’oiseau de la ville, allant de la 9 ème avenue au
continent asiatique. On y voit, en premier plan les rues de Manhattan, l’espace devient de plus
en plus condensé et le reste du pays est représenté par les principaux repères (Chicago,
Californie, etc.) qui disparaissent avec la distance (Figure 14).
Pour Furnas, les questionnements suscités par la nature de cette caricature (la vue à vol
d’oiseau) peuvent mener à des questionnements similaires si une visualisation différente de la
visualisation classique est disponible sur une interface d’ordinateur. L’utilisateur a besoin du
détail pour interagir localement sur les composants de l’interface mais il aura besoin
également d’une vue globale pour lui rappeler que d’autres structures sont présentes en dehors
du focus pour situer le focus par rapport à ces éléments et enfin pour lui permettre de mieux
appréhender le focus grâce à l’information globale existante. Tout doit se faire dans un souci
d’équilibre entre la vue détaillée et la vue globale qui sera fixé par le DOI (Degree Of
Interest) qui assigne à chaque point une valeur exprimant le degré d’intérêt de ce point
lorsqu’il est vu par l’utilisateur. L’idée ici est que l’utilisateur, en interagissant avec le
système, ne va pas être intéressé par le système entier à tout instant. La stratégie avec la
fonction DOI est de déterminer les points d’intérêts de l’utilisateur qui seront montrés dans le
détail et les éléments non utilisés du système qui seront présents mais représentés avec moins
de détails. Afficher l’information sur un écran de taille n, revient à afficher les n points les
plus intéressants définis par la fonction DOI. Elle comporte deux composantes : l’importance
à priori pour le point x (API(x)) et la distance entre x et y (D(x, y)), y étant le focus.
DOIfisheye (x ⎜= y) = API(x) - D(x, y)
(2.1)
DOIfisheye (x ⎜= y) est le degré d’intérêt de l’utilisateur à un point x en sachant que le focus est
en y. On remarque ainsi, selon la formule, que l’intérêt augmente avec l’importance et
diminue avec la distance. Plus le point x est loin de celui où se porte l’attention de l’utilisateur
(y), plus son degré d’intérêt diminue. La composante Importance détermine le degré
d’utilisation d’un objet par rapport à un autre ; c’est une composante statique. Par contre, la
composante Distance est une composante dynamique car le focus de l’utilisateur change
constamment.
Comme pour l’affichage polyfocal, la vue fisheye est basée sur une fonction de
transformation continue (Figure 15). Cependant, la vue fisheye peut déformer les frontières
parce qu'elle est appliquée radialement plutôt que dans les directions de x et y (Figure 16).
Comme le montre la Figure 17, les frontières de la représentation sont déformées ce qui
engendre un aspect peu naturel une fois mis en application sur un écran rectangulaire. Pour
surmonter ce problème, plusieurs transformations furent proposées afin de pouvoir adapter le
résultat à l’écran. Certaines de ces transformations optent pour un re-mappage du résultat à
un espace rectangulaire alors que d'autres préfèrent appliquer la fonction de transformation
indépendamment, sur chacune des dimensions et combinent les résultats en utilisant un
rapport cartésien.
Applications fisheye
Un exemple de la stratégie fisheye de Furnas est le menu de fisheye qui applique les
techniques graphiques de visualisation fisheye aux menus linéaires. Cette technique permet
une recherche efficace lors de l’utilisation de très longs menus. En fonction du DOI des
utilisateurs, la taille des menus change progressivement afin de fournir un point d'intérêt
autour du curseur de la souris. Cette stratégie permet de présenter le menu en entier à
l'utilisateur sans devoir employer une hiérarchie, ou faire défiler le menu qui conduit souvent
à une perte du focus et de l’attention de l’utilisateur (Figure 18).
D’autres applications fisheyes sont les interfaces dites à espace élastique. Ce sont des
interfaces où l’utilisateur peut étirer et déformer l’espace de représentation et revenir à la
forme originale s’il le souhaite. Plusieurs techniques basées sur ce principe furent
développées, les plus connues sont celles de Sarkar et ses collaborateurs qui furent les
premiers à appliquer la technique fisheye aux coordonnées spatiales 2D et Carpendale qui
appliquèrent la fonction d’agrandissement à la troisième dimension (Figure 19).
Ces dernières interfaces sont plus connues sous le nom d’interfaces pliables et donnèrent
naissance à une nouvelle génération d’interface qui permet à l’utilisateur de déplacer une
lentille du style document lens sur l’écran permettant ainsi de déformer ou d’agrandir une
partie de l’image. En plus de la région focale et de la région contexte, s’ajoute une région
d’épaulement qui permet d’avoir une vue intermédiaire entre les deux (Figure 20).
En fonction des lentilles choisies la région focale peut être carrée ou circulaire avec une
région d’épaulement qui peut être symétrique ou asymétrique (Figure 21).
2.2.6 Table Lens
Table lens est une des meilleures manières de représenter de grandes quantités d’informations
sous forme tabulaire (Figure 22). Conçue dans la continuité des interfaces de types fisheye,
elle permet de présenter les données sous forme de tableau dont l’échelle peut être modifiée
sur un ou deux axes. L’interface fournit une vue contexte + focus afin de pouvoir accéder
facilement aux données. Au niveau contexte, seuls les intitulés du tableau sont visibles, les
cellules étant codées soit par des couleurs lorsqu’il s’agit de données nominales, soit par des
barres de différentes longueurs s’il s’agit d’intervalles. En modifiant l’échelle d’affichage, les
contenus des cellules peuvent changer de représentation.
Les principaux outils d’interaction sont le zoom, l’ajustement et le glissement. Le zoom
permet de modifier la taille (échelle) de la région du focus sans changer le nombre de cellules;
l’ajustement permet de modifier le nombre de cellules sans modifier l’échelle du focus; enfin
le glissement permet de déplacer la région du focus pour afficher d’autres cellules.