Chapitre 1 Taxonomie des techniques de visualisation de données 1. Introduction Dans le cas de la fouille de données, l'être humain ne cherche plus à comprendre un environnement global, mais plutôt à comprendre une partie de cet environnement. A cet effet, il est à la recherche de structures, de caractéristiques, de motifs, de tendances, d'anomalies ou, de manière plus générale, de la présence ou de l'absence de relations dans les données. Depuis plus d'un demi-siècle, cette analyse manuelle des données, effectuée dans le but d'en extraire des connaissances, n'est plus réalisable à la main. En effet, du fait de la multiplication des paramètres pris en compte et de la multiplication des mesures effectuées, la quantité d'information à traiter a rendu obligatoire l'utilisation de méthodes pour les analyser. Le traitement purement automatique de ces informations afin d'en extraire des connaissances se nomme la « fouille de données » ou data mining. Bien que permettant une automatisation de l'analyse, la fouille de données n'est pas la solution parfaite au problème de la compréhension des données. En effet, très souvent, les algorithmes de fouilles de données, aussi sophistiqués qu'ils soient, ne parviennent pas à extraire la totalité des informations pertinentes. Pour résoudre ce problème, une solution viable consiste à présenter graphiquement les données de manière à permettre à la fois de guider, par l'interaction, une extraction de connaissances (automatique ou manuelle) et de permettre la transmission des connaissances à l'expert en l'aidant à construire sa carte mentale des données. Ainsi, on parlera de fouille visuelle de données ou de visual data mining. Le rôle de la visualisation dans la fouille visuelle de données peut se résumer en plusieurs points principaux. Elle permet d'afficher une grande quantité de données, fournissant de ce fait une vue d'ensemble des données. Elle permet automatiquement, ou par interaction, de résumer et annoter des données La visualisation permet également de détecter des sous-ensembles de données où il est intéressant d'appliquer tel ou tel outil de fouille de données ou de fouille visuelle de données de manière plus précise. D'un autre côté, l'expert cherchant à analyser les données peut ne pas savoir ce qu'il cherche. Dans ce cas, le choix d'un algorithme de fouille de données est difficile à faire. La visualisation trouve alors son intérêt grâce à l'interaction, permettant à l'utilisateur d'établir une carte mentale des données et de rechercher des structures. L'interaction de l'utilisateur avec la visualisation tient un rôle très important. L'interaction permet, entre autres, la navigation dans les données (vue sous différents angles), l'interrogation des données (réduction de l'affichage ou de caractéristiques d'affichage à une portion de l'espace) et l'association de données entre elles (marquages, simplification, réduction, ... ). 2. Historique ( Voir la présentation : 1-Histoire.pdf ) La visualisation d'information permet de faciliter l'abstraction des informations dans les données. 3. Définitions et structure générale d'un système de visualisation d'information 3.1 Définitions Une visualisation, c'est l'ensemble des moyens graphiques autres que ceux textuels ou ceux verbaux utilisés dans le but de communiquer des informations. L'interaction regroupe l'ensemble des moyens mis à disposition de l'utilisateur et l'ensemble des actions de l'utilisateur permettant d'ajuster une visualisation de manière interactive. Un attribut graphique est un aspect élémentaire d'une visualisation contrôlable par l'utilisateur définissant les caractéristiques de la représentation (position, taille, couleur, forme, orientation, vitesse, texture, transparence, ...). La mise en correspondance ou mapping est l'opération qui consiste à définir la façon dont les attributs des données sont associés aux attributs graphiques. La normalisation des données est l'opération qui consiste à ré-échelonner les valeurs prises par les différents attributs des données dans un intervalle donné. Il est possible de définir principalement trois types de normalisation: a)- la normalisation locale : chaque dimension est ramenée dans l'intervalle [0,1] ou [—1,1]. Ce type de normalisation confère un poids égal à chacune des dimensions ; b)- la normalisation globale : toutes les dimensions sont ré-échelonnées dans l'intervalle [m, M] en désignant par m le minimum (respectivement M le maximum) des valeurs sur toutes les dimensions. Ce type de normalisation donne un poids plus important à la dimension qui a la plus grande valeur ; c)- la normalisation pondérée : seules les dimensions qui ont un sens équivalent sont normalisées simultanément. 3.2 Structure générale d'un système de visualisation d'information Le processus de visualisation d'information est un processus en cinq étapes interagissant entre elles : Les deux premières étapes sont l'acquisition et la préparation des informations. Après l'acquisition des données ayant pour origines des expérimentations, des observations, voire des expérimentations numériques ou des simulations, il est nécessaire de transformer ces données dans une forme compréhensible par la méthode de visualisation. Pendant la transformation, les données peuvent être filtrées, lissées, enrichies et/ou normalisées, afin d'améliorer la visualisation; La troisième étape du processus consiste en la définition de la mise en correspondance entre les données et les éléments de la visualisation ; Figure 1 : Processus de visualisation d’information L'étape suivante consiste à traduire les données et la mise en correspondance en une représentation permettant l'analyse; La dernière étape est l'analyse de l'utilisateur. Cette étape est cruciale, car c'est à ce moment que l'on permet à l'utilisateur d'ajuster les différents paramètres du processus de visualisation, afin de lui permettre d'explorer les données. 4. Les principaux systèmes de classification en visualisation de l’information Les principaux systèmes de classification en visualisation de l’information ont été construits autour de trois axes : le type des données, les traitements et les tâches. 4.1 Le type des données (Taxonomie de Shneiderman) La littérature sur la visualisation de l’information fait souvent référence aux travaux de Bertin sur l’étude de la sémiologie graphique qui suggèrent que la forme de la représentation utilisée dépend du type des données à afficher. Selon Bertin, les données peuvent se représenter sous deux formes, soit en fonction de leur valeur, soit en fonction de leur structure. Les valeurs sont associées aux attributs (numériques, thématiques, etc.) inhérents à un problème. La structure comprend les relations (liens, contraintes) qui caractérisent les données comme un tout. A chacune de ces formes (et pour un type de données particulier) doit être associée une représentation graphique différente. Par exemple, un histogramme peut représenter des valeurs d’attributs, alors qu’un diagramme d’arbre représente les relations structurelles à l’intérieur d’un ensemble de données. A partir des observations de Bertin, plusieurs taxonomies ont été construites en fonction du type des données à représenter. Parmi celles-ci, une des plus connues est celle de Shneiderman qui résume les principes de base de la conception visuelle par ce que l’auteur appelle ‘Visual Information Seeking Mantra : overview first, zoom and filter, then details-on-demand’. Elle est définie comme une taxonomie de « tâche par type de données » : en plus des sept types de données décrits dans le tableau 1 ci-dessous, cette taxonomie prend en compte un ensemble de tâches que la représentation doit s’efforcer de faciliter. Types de données 1D 2D 3D Temporelles Multidimensionnelles Hiérarchiques Relationnelles Description Données organisées de manière linéaire ou séquentielle : documents textuels, lignes de code d’un programme, listes alphabétiques, etc. Données dont la localisation ou la géométrie dans le plan est primordiale : plans, cartes géographiques, mise en page de journaux, etc. Données qui accordent une prédominance à la localisation ou la géométrie dans l’espace : chimie, architecture, mécanique, etc. Données qui ont une existence dans le temps : gestion de projet, suivi médical, etc. Données dont le caractère spatial n’est pas dominant et qui possèdent un nombre d’attributs n : données statistiques, contenu de bases de données, etc. Données organisées de manière à ce que chaque entité possède un lien unique vers une entité parent (à l’exception de la racine) : système de fichiers, GUI, etc. Données qui forment un graphe dont la structure n’est pas arborescente : hyperdocuments, réseaux télécoms, etc. Tableau 1 : Types de données dans la taxonomie de Shneiderman. Tâches Donner une vue d’ensemble Zoomer Filtrer Description Obtenir une vue globale sur la collection entière. Zoomer sur une entité jugée intéressante. Eliminer de la vue les données non pertinentes à un moment donné. Sélectionner une entité ou un groupe et en visualiser les détails Détailler à la demande si besoin. Visualiser les relations entre les éléments. Associer Tracer un historique afin de supporter l’annulation d’une ou Fournir l’historique plusieurs commandes, le retour arrière, le play-back, etc. Permettre la sauvegarde de sous-collections et de paramètres Extraire de requêtes. Tableau 2 : Tâches dans la taxonomie de Shneiderman. 4.2 Les traitements (Taxonomie de Leung) Un autre type d’approche pour classifier les systèmes de visualisation repose sur l’analyse des différents traitements proposés par ces systèmes. Un exemple possible concerne l’analyse des interactions en entrée, la classification s’effectuant en fonction de leur nature (sélection par manipulation directe ou indirecte), de leur niveau (singleton, groupe ou intégralité des objets ou des attributs) et de leur conséquence en terme de transformation graphique, de présentation et d’organisation. Plusieurs approches orientées traitements ont été proposées. Parmi celles-ci, la taxonomie de Leung classe les systèmes de visualisation en fonction des techniques utilisées pour faire évoluer la représentation au cours de l’exploration. Leung classe les systèmes de visualisation en deux catégories en fonction des techniques utilisées pour accéder à l’information. La première catégorie regroupe l’ensemble des techniques qui permettent de déformer la représentation, la seconde regroupe les techniques non déformantes. La principale caractéristique des techniques de déformation consiste à permettre aux utilisateurs d’examiner en détail une région particulière de la représentation tout en gardant une vision globale de l’espace, ceci afin de faciliter la navigation. Leung affine cette classification en différenciant les données de nature graphique (i.e. qui possèdent des relations spatiales implicites), des données non graphiques, ces dernières pouvant toutefois être représentées sous une forme graphique abstraite dans de nombreux cas. Les cartes et les plans sont de bons exemples de données graphiques, alors qu’un graphe hypertexte correspond à une donnée non graphique. La méthode utilisée pour transformer la représentation semble être un critère de classification bien adapté à l’exploration hyper-documentaire. Par exemple, l’utilisateur peut visualiser une représentation globale pour comprendre l’organisation des documents, puis passer à une vue locale montrant le détail de certains documents afin de trouver celui qui l’intéresse le plus. Le passage du global au local peut être réalisé de plusieurs manières, notamment au moyen d’une déformation de l’affichage ou d’un zoom. 4.3 Les tâches (Taxonomie de Bruley) L’usage des données conditionne souvent la représentation de ces données. Cependant, peu de taxonomies existantes se basent sur l’analyse des tâches que les systèmes de visualisation permettent d’effectuer. La taxonomie de Shneiderman, décrite à la section 4.1, repose en partie sur la définition d’un ensemble de tâches de bas niveaux (zoomer, filtrer, associer, extraire, etc.). Cette étude masque toutefois l’importance des tâches de haut niveau (trouver, comprendre, organiser, retrouver) dans le processus de conception d’un système de visualisation. Selon Bruley, la manière de représenter des données dépend fortement des tâches que l’utilisateur souhaite effectuer sur ces données. Il introduit donc la notion de point de vue, un même ensemble de données pouvant être représenté par différents points de vues. Sur la base des travaux de Shneiderman, Bruley définit donc une taxonomie induite par le point de vue sur les données, plutôt que par leur type. Il met en avant la manière de représenter l’organisation des données plutôt que leur organisation réelle. Bruley propose deux nouvelles catégories (le point de vue spatial et le point de vue non structuré), afin de séparer les données de type 1D, 2D, 3D et nD qui ont une géométrie, de celles qui n’en ont pas. Cette séparation est d’ailleurs à rapprocher de celle proposée par Leung sur les données graphiques et non graphiques. Bruley déduit de son étude une démarche à suivre pour la conception de représentations graphiques qui est basée sur quatre éléments : l’espace des informations qui contient les données à représenter, le (ou les) point(s) de vue qui résulte(nt) de l’analyse de cet espace et de la nature de la tâche à réaliser, l’espace géométrique de représentation qui fixe la position des objets graphiques, l’espace géométrique de construction qui est la sous-partie de l’espace de représentation réellement affichée. Figure 2 : Taxonomie de Leung 5. Visualisation d’information, visualisation de connaissance et visualisation scientifique Définition : La visualisation est l’utilisation de représentations visuelles interactives et informatisées de données pour amplifier la cognition. La visualisation a donc pour objectif de représenter graphiquement des données pour permettre aux utilisateurs de mieux raisonner. Il est possible de remarquer l’héritage des IHM avec le caractère nécessairement informatisé de la visualisation. Définition : La visualisation d’informations est l'utilisation de représentations visuelles interactives et informatisées de données abstraites pour amplifier la cognition. Il est donc facile de comprendre que les données abstraites n’ont pas de représentation graphique intrinsèque. C’est pourquoi, la principale problématique de la visualisation d’informations est de déterminer quelles représentations choisir pour véhiculer quel message. La visualisation d’informations est l’utilisation de représentations visuelles de données abstraites pour amplifier la cognition. Définition : La visualisation scientifique est un outil qui permet de manipuler un grand nombre de données scientifiques afin de permettre de « voir » des phénomènes issus de ces données. La visualisation scientifique est donc basée sur des données physiques (la terre, des molécules, le corps humain) déjà localisées dans un espace. Définition : Le concept de visualisation de connaissances est limité aux aspects d’externalisation de la connaissance d’un individu pour lui-même en utilisant un tracé libre. L’expression de visualisation de connaissances est utilisée pour désigner tout procédé permettant de présenter une structure de connaissances ou encore, comme moyen pour évaluer soi-même des connaissances et aider à la compréhension et à la navigation. Les cartes conceptuelles sont généralement utilisées pour organiser des idées, concevoir et communiquer une structure complexe et résoudre des problèmes. La visualisation d’informations porte sur des données abstraites portant sur des objets et les relations entre ces objets, alors que la visualisation de connaissances porte sur des données abstraites qui représentent des connaissances. La visualisation de connaissances est l’utilisation de représentations visuelles de connaissances à des fins de création et de partage. 6. Les différentes techniques de visualisation (voir slides d’introduction) a)- La visualisation linéaire : Les gros tableaux, les murs fuyants b)- La visualisation hiérarchique : Listes indentées, diagrammes, approche surfacique (treemap, slice, cubes d’information, beamtrees, cushion treemaps, visualisation botanique), approche hyperbolique, approche conique, approche landscape. c)- La visualisation des réseaux : Réseaux sociaux. d)- La visualisation multidimentionnelle : les nuages de points ou scatter plot, diagrammes d’Inselberg ou coordonnées parallèles. e)-la visualisation vectorielle (websom, VxInsight) f)- La visualisation iconique. g)- Graph drawing Chapitre 2 Les techniques d’interaction 1. Introduction Avant le développement de l'interface graphique par les laboratoires de Xerox dans les années 70, l'interface de l’ordinateur était un curseur clignotant sur un écran noir nécessitant l'entrée de commandes et de paramètres que seuls les experts pouvaient utiliser. Ces chercheurs ont donc imaginé une interface pouvant être compréhensible par tous et qui donna naissance au paradigme WIMP (Windows, Icônes, Menus, Pointeur) rendu disponible au grand public en 1984 par Apple Macintosh. La révolution qu’a constitué l’avènement de ces interfaces tenait essentiellement à l'introduction de métaphores visuelles, telles celles du bureau avec les dossiers, les documents, la poubelle, les menus, etc., qui ont permis à l’utilisateur de se construire une carte cognitive du système. C'est l'interaction, qui rend possible l'exploitation réelle des vues d'ensembles une fois produite. En effet, l'être humain est particulièrement habile à extraire des informations d'un environnement qu'il contrôle directement et activement par rapport à un environnement qu'il ne peut qu'observer de manière passive. La perception est indissociable de l'action : il faut agir pour percevoir et il faut percevoir pour agir. On parle de couplage (ou boucle) action-perception. La visualisation interactive requiert des temps de réponse interactifs (de l'ordre du 1/10ème de seconde) afin d'exploiter le couplage action/perception. Dès que l'on traite des données de grande taille, cette contrainte exige l'utilisation d'algorithmes particulièrement efficaces. Pour les besoins de l'interaction, il est parfois préférable de dégrader la qualité de l'affichage au profit de la vitesse de réaction, quitte à raffiner l'affichage lorsque l'interaction s'arrête ou marque une pause. Ainsi, au couplage action-perception de l'utilisateur correspond un fort couplage affichage-interaction du système de visualisation. Un certain nombre de techniques classiques d'interaction peuvent être utilisées pour la visualisation d'information, comme par exemple les barres de défilement pour naviguer le contenu d'une fenêtre, ou les boîtes de dialogues pour spécifier des paramètres de visualisation. Cependant, les meilleurs résultats sont obtenus en couplant plus fortement l'interaction avec la technique de visualisation. Trois catégories de techniques d'interaction peuvent être mises en œuvre avec un grand nombre de techniques de visualisation : Le filtrage dynamique : Le filtrage dynamique est particulièrement utile pour interagir avec des vues globales, car l'information présente dans ces vues n'est pas définitivement pertinente pour un utilisateur. En effet, s'il est intéressant pour un utilisateur de voir dans un premier temps l'ensemble des informations qu'il explore pour mieux l'appréhender, il sera intéressant par la suite que l'utilisateur puisse recentrer son exploration, en réduisant son espace de recherche. On distingue les requetés dynamiques et la technique fisheye. Une autre façon de concilier détails et vue globale est de permettre à l'utilisateur de zoomer facilement : un zoom avant révèle les détails tandis qu'un zoom arrière révèle le contexte. Le zoom est une transformation géométrique à part entière et peut être plus ou moins complexe. 2. Les techniques de distorsion L’arrivée de systèmes contenant une quantité énorme d’informations et dont l’affichage se trouve restreint par la taille limitée des écrans d’ordinateurs, a incité plusieurs chercheurs à orienter leurs recherches vers des techniques de présentation basées essentiellement sur la déformation de l’espace d’information (distorsion, zoom). Il existe deux types de données, graphiques et non graphiques, qui sont alors affichées dans des espaces distincts d’informations de grandes tailles. Dans les deux cas, la vue peut être déformée (le détail est affiché avec le contexte) ou non déformée (le détail y est représenté avec peu ou sans contexte) (Figure 1). 2.1 Interfaces multi-vues L’écran est souvent partagé en deux ou plusieurs fenêtres, permettant d’avoir une vue globale et une vue plus localisée sur la région qui accroche l’attention du lecteur La vue globale est dépourvue de détails mais elle permet au sujet de localiser sa région dans l’espace d’informations et relativement aux autres régions, elle est souvent représentée par un rectangle ou un point qui se déplace sur la fenêtre de la vue d’ensemble (Figure 2). Les inconvénients de cette méthode est qu’elle divise l’espace, qui est déjà petit, sur un écran d’ordinateur et elle divise également l’attention de l’utilisateur entre la vue globale et la vue détaillée. Enfin, elle oblige l’utilisateur à intégrer mentalement la vue détaillée dans la vue d’ensemble alors que le raccordement entre les deux images n’est pas nécessairement évident. 2.2 Les interfaces focus + contexte La vision humaine permet simultanément une vue globale de l’environnement et une vue détaillée de l’objet sur lequel porte l’attention du sujet lui permettant ainsi d’appréhender et de comprendre l’information qui lui est fournie. Lorsqu’on navigue dans un espace d’informations contenant énormément de données, il est souvent nécessaire d’avoir une vue globale, c’est-à-dire une synthèse de ces informations permettant de se recadrer dans le contexte de navigation et qui permet également de faire le lien d’un détail à un autre. Le lecteur a besoin de situer la région sur laquelle porte son attention par rapport à la région globale et/ou par rapport aux autres régions. Souvent, l’affichage d’une grande quantité d’informations sur un écran d’ordinateur est accompagné d’une réduction des détails pour pouvoir afficher la région globale à l’échelle de l’ordinateur, mais l’accessibilité à cette région globale se fait souvent au détriment de la lisibilité (polices ou graphiques trop petits). Les interfaces focus + contexte sont des interfaces qui justement permettent l’affichage de la vue globale et de la vue locale à la fois ; le focus étant le point (ou la région) sur lequel est concentré le lecteur et le contexte étant la vue globale. Les deux ne sont pas affichés à la même échelle : tout en maintenant le contexte disponible, le focus est agrandi (distorsion ou zoom) par rapport aux autres régions. L’arrivée de ces interfaces a fait disparaître la discontinuité spatiale qui existait dans les interfaces multi-vues en apportant une nouvelle présentation des structures composant l’interface différente de la présentation initiale. Ainsi, par cette technique, les chercheurs essaient de se rapprocher de la vision humaine qui permet une vue globale et précise à la fois. Parmi ces techniques, on peut citer perspective wall, affichage fisheye, affichage bifocale, documents lens ainsi que les interfaces zoomables. En dehors des interfaces zoomables, les autres techniques sont toutes des méthodes de distorsion qui généralement sont définies comme des techniques qui changent (déforment) le rapport spatial entre les objets. Elles créent de cette façon une région d'intérêt qui permet à l'utilisateur d'examiner un point local (le focus), tout en présentant en même temps une vue holistique de l'espace pour fournir un contexte global afin de faciliter la navigation. Les différences essentielles existantes entre ces techniques de distorsion sont les méthodes d’application des fonctions de transformation et d’agrandissement. Une vue déformée est créée en appliquant à l’image initiale une fonction mathématique appelée la fonction de transformation (Figure 3). Cette dernière définit la manière dont l’image originale est transformée en une vue déformée et ces caractéristiques déterminent à quelle classe (catégorie de classification) appartient la technique de déformation en question. Quant à la fonction d’agrandissement, qui est la dérivée de la fonction de transformation, elle permet de fournir un profil des facteurs d’agrandissement / de réduction liés à la zone entière de l'image originale (Figure 3). Toutes les distorsions liées aux interfaces focus+contexte sont également décrites par DOI (Degree of Interest), une notion qui permet de donner, à partir d’un élément, une valeur qui indique le niveau d’intérêt de cet élément. C’est une fonction qui change avec le temps puisque le focus y est souvent déplacé. Elle permet de comprendre comment l’espace est réparti entre les différents éléments. La principale motivation de développement de ces interfaces est la possibilité d’afficher une grande quantité d’information sur un espace réduit, c’est-à-dire l’espace de l’écran d’ordinateur. Il y a également d’autres aspects qui déterminent le type de technique utilisé. Le premier de ces aspects se rapporte à la région du focus ; est-elle statique ou dynamique ? Même si toutes les techniques présentées dans ce chapitre ont une région dynamique du focus (souvent préférable), il pourrait y avoir des techniques qui opteraient pour une région statique. Le deuxième aspect concerne la fonction d’agrandissement qui peut être continue ou discontinue. Une fonction d’agrandissement discontinue fournit une image cassée, la transition n’est pas lisse mais présente l’avantage d’être simple et plus intuitive (affichage bifocal, mur fuyant). A l’inverse, un agrandissement continu présente une transition lisse entre la région focale et la région contexte (affichage polyfocal, vues fisheye). Enfin le dernier aspect concerne l’application possible à une ou deux dimensions. Nous présenterons d’abord les techniques simples, c’est-à-dire celles qui ont opté pour une fonction d’agrandissement discontinue et nous terminerons par les techniques à fonction d’agrandissement continue. 2.2.1 Affichage bifocal L’affichage bifocal est une technique permettant d’afficher le détail et le contexte en même temps. Destinée à l’affichage de grands ensembles de données hiérarchisées. C’est probablement la technique la plus intuitive et la plus facile à mettre en application. La fonction de transformation est linéaire dans la région du focus et des régions alentours (facteurs d’agrandissement constants) comme le montre la Figure 4, la déformation est évidemment discontinue mais la technique fournit une focalisation dynamique naturelle. La transformation bifocale a été développé pour une dimension mais Leung repris le concept en 1989 et l’appliqua en deux dimensions pour une utilisation interactive du métro londonien. Dans le cas d’un affichage bifocal bidimensionnel, 9 régions sont formées. La région centrale, qui représente le focus, fournit une vue détaillée d’une partie de l’espace d’information et aucun facteur de réduction n’y est appliqué. Le rapport optique des 8 régions restantes est réduit par une valeur constante selon les axes x et y. On remarque que les régions des coins sont réduites dans les deux dimensions (Figure 5). Ainsi avec un affichage interactif, la région du focus et les 8 régions environnantes se décalent lorsque l’utilisateur déplace sa souris sur la région désirée. 2.2.2 Perspective wall Le mur fuyant est une technique développée par Mackinlay et collaborateurs qui permet de représenter les informations graphiquement avec une vue déformée du détail et du contexte sous forme d’un mur en perspective (Figure 6). L’interface affiche le détail au milieu d’une surface 2D avec vues en perspective sur les deux côtés permettant d’afficher le contexte de visualisation. L'échelle des objets est proportionnelle à leur éloignement sur le mur : les documents sur le panneau faisant face au lecteur sont directement lisibles alors que les documents éloignés sont de plus en plus petits, comme dans le monde réel. Cette méthode est efficace pour des données de type linéaire et elle semble spécialement idéale pour l’affichage des informations temporelles car elle permet au lecteur d’être concentré sur la période temporelle de son choix tout en affichant les périodes adjacentes. Le changement du focus d’attention se fait par le déplacement des coins et la transition entre les vues se fait progressivement, c’est-à-dire que l’utilisateur voit le passage d’une vue de face à une vue en perspective. Cette méthode est une extension conceptuelle des affichages bifocaux car le même principe de transformation et d’agrandissement y est appliqué (Figure 7). La distinction principale concerne les régions en alentours du focus ; le facteur de réduction se fait à un taux croissant et non constant comme dans le cas de l’affichage bifocal. L’ajout d’une vue en perspective réduit la charge cognitive de l’utilisateur en comparaison de l’affichage plat de la technique bifocale (Figure 8). Cependant, l’espace des coins est perdu ce qui est contraire à l’un des objectifs des techniques de déformation qui postulent que l’utilisation de la zone de visualisation doit être maximisée. Cette imperfection particulière a donné naissance à une autre technique appelée document lens et qui est développée dans les sections suivantes. 2.2.3 Document lens Le document lens fut inventé afin de pallier les problèmes de perte d’espace dans les coins engendrés par le mur fuyant. En reprenant le principe de Perspective wall, une vue en perspective est créée dans les deux dimensions et le document lens est ainsi obtenu. A l’inverse du perspective wall, où l’espace est gaspillé, tout l’espace est exploité dans le cas du document lens. Un document texte global visible sur tout l’écran, mais impossible à lire, sera transformé avec le document lens en une pyramide vue de haut et dont le sommet est coupé. Ce dernier, représenté par un rectangle ou un carré, correspond au focus et donc fournit des détails aux lecteurs. Le texte présent sur les côtés de la pyramide devient de moins en moins visible au fur et à mesure que l’on s’éloigne du sommet. En déplaçant la souris, le sujet déplace la fenêtre focus qui est rectangulaire (ou carrée) en ayant la possibilité de changer (par touches clavier) sa hauteur et sa largeur. L’inconvénient est le risque d’agrandir la fenêtre focus au point de perdre le contexte, c’est-à-dire la transformation d’une pyramide en un cube dont les côtés sont invisibles vus d’en haut. Certes, le lecteur aura plus de détails sur la région qui l’intéresse, car la fenêtre focus aura quasiment la taille de l’écran, mais au détriment d’une vue globale ou partielle du contexte. La loupe, qui est utilisée pour agrandir les caractères permettant ainsi une lecture aisée, a inspiré le développement de document lens. La seule différence réside dans la forme de présentation. En effet, l’image fournie par la loupe est circulaire et procure un agrandissement de type conique (Figure 10) qui engendre une perte du contexte (ce dernier est caché) alors qu’avec le document lens, la lentille a une forme rectangulaire et il n’y aucune perte du contexte (sauf si on agrandit le focus). 2.2.4 Affichage polyfocal L'affichage polyfocal a été proposé pour la présentation de données statistiques sur des schémas cartographiques. L'affichage polyfocal est représenté par une fonction de transformation hyperbolique (ou polynôme) plus complexe comme le montre la Figure 11. Cette fonction est continue et peut avoir de multiples crêtes. Elle est habituellement décrite par deux paramètres : l’un contrôle la valeur au centre de la région focale et l'autre décrit le taux de changement du facteur d’agrandissement en prenant en considération la distance à partir du point focal. L'application de cette technique se fait dans une ou deux dimensions avec une ou plusieurs focales, ce qui donne naissance à des affichages polyfocaux multifocaux où plusieurs points focaux sont disponibles comme le montre la Figure 12. Dans ce cas, les mêmes paramètres sont appliqués à chaque focale avec un facteur d’agrandissement qui peut être différent d’une crête à l’autre. 2.2.5 Stratégie Fisheye En photographie, l’objectif fish-eye est un objectif spécial : il a une distance focale très courte et un angle de champ très grand, jusqu'à 180° dans la diagonale, voire dans toute l'image. Contrairement aux objectifs classiques, il donne des images déformées : toutes les lignes droites qui ne passent pas par le centre sont courbées (Figure 13). Les régions proches sont vues avec beaucoup plus de détails et les régions environnantes sont vues successivement avec moins de détails. Dans le domaine de la visualisation d’informations, cette technique fut initialement développée pour la représentation des arbres. Le même principe que celui de la photographie est repris, le focus étant montré avec plus de détails alors que le contexte est vu progressivement avec moins de détails. L’objectif étant de trouver un équilibre entre le contexte global et le détail local comme le montre cette caricature de Steinberg datant de 1976 publié dans le New Yorker. C’est une vue à vol d’oiseau de la ville, allant de la 9 ème avenue au continent asiatique. On y voit, en premier plan les rues de Manhattan, l’espace devient de plus en plus condensé et le reste du pays est représenté par les principaux repères (Chicago, Californie, etc.) qui disparaissent avec la distance (Figure 14). Pour Furnas, les questionnements suscités par la nature de cette caricature (la vue à vol d’oiseau) peuvent mener à des questionnements similaires si une visualisation différente de la visualisation classique est disponible sur une interface d’ordinateur. L’utilisateur a besoin du détail pour interagir localement sur les composants de l’interface mais il aura besoin également d’une vue globale pour lui rappeler que d’autres structures sont présentes en dehors du focus pour situer le focus par rapport à ces éléments et enfin pour lui permettre de mieux appréhender le focus grâce à l’information globale existante. Tout doit se faire dans un souci d’équilibre entre la vue détaillée et la vue globale qui sera fixé par le DOI (Degree Of Interest) qui assigne à chaque point une valeur exprimant le degré d’intérêt de ce point lorsqu’il est vu par l’utilisateur. L’idée ici est que l’utilisateur, en interagissant avec le système, ne va pas être intéressé par le système entier à tout instant. La stratégie avec la fonction DOI est de déterminer les points d’intérêts de l’utilisateur qui seront montrés dans le détail et les éléments non utilisés du système qui seront présents mais représentés avec moins de détails. Afficher l’information sur un écran de taille n, revient à afficher les n points les plus intéressants définis par la fonction DOI. Elle comporte deux composantes : l’importance à priori pour le point x (API(x)) et la distance entre x et y (D(x, y)), y étant le focus. DOIfisheye (x ⎜= y) = API(x) - D(x, y) (2.1) DOIfisheye (x ⎜= y) est le degré d’intérêt de l’utilisateur à un point x en sachant que le focus est en y. On remarque ainsi, selon la formule, que l’intérêt augmente avec l’importance et diminue avec la distance. Plus le point x est loin de celui où se porte l’attention de l’utilisateur (y), plus son degré d’intérêt diminue. La composante Importance détermine le degré d’utilisation d’un objet par rapport à un autre ; c’est une composante statique. Par contre, la composante Distance est une composante dynamique car le focus de l’utilisateur change constamment. Comme pour l’affichage polyfocal, la vue fisheye est basée sur une fonction de transformation continue (Figure 15). Cependant, la vue fisheye peut déformer les frontières parce qu'elle est appliquée radialement plutôt que dans les directions de x et y (Figure 16). Comme le montre la Figure 17, les frontières de la représentation sont déformées ce qui engendre un aspect peu naturel une fois mis en application sur un écran rectangulaire. Pour surmonter ce problème, plusieurs transformations furent proposées afin de pouvoir adapter le résultat à l’écran. Certaines de ces transformations optent pour un re-mappage du résultat à un espace rectangulaire alors que d'autres préfèrent appliquer la fonction de transformation indépendamment, sur chacune des dimensions et combinent les résultats en utilisant un rapport cartésien. Applications fisheye Un exemple de la stratégie fisheye de Furnas est le menu de fisheye qui applique les techniques graphiques de visualisation fisheye aux menus linéaires. Cette technique permet une recherche efficace lors de l’utilisation de très longs menus. En fonction du DOI des utilisateurs, la taille des menus change progressivement afin de fournir un point d'intérêt autour du curseur de la souris. Cette stratégie permet de présenter le menu en entier à l'utilisateur sans devoir employer une hiérarchie, ou faire défiler le menu qui conduit souvent à une perte du focus et de l’attention de l’utilisateur (Figure 18). D’autres applications fisheyes sont les interfaces dites à espace élastique. Ce sont des interfaces où l’utilisateur peut étirer et déformer l’espace de représentation et revenir à la forme originale s’il le souhaite. Plusieurs techniques basées sur ce principe furent développées, les plus connues sont celles de Sarkar et ses collaborateurs qui furent les premiers à appliquer la technique fisheye aux coordonnées spatiales 2D et Carpendale qui appliquèrent la fonction d’agrandissement à la troisième dimension (Figure 19). Ces dernières interfaces sont plus connues sous le nom d’interfaces pliables et donnèrent naissance à une nouvelle génération d’interface qui permet à l’utilisateur de déplacer une lentille du style document lens sur l’écran permettant ainsi de déformer ou d’agrandir une partie de l’image. En plus de la région focale et de la région contexte, s’ajoute une région d’épaulement qui permet d’avoir une vue intermédiaire entre les deux (Figure 20). En fonction des lentilles choisies la région focale peut être carrée ou circulaire avec une région d’épaulement qui peut être symétrique ou asymétrique (Figure 21). 2.2.6 Table Lens Table lens est une des meilleures manières de représenter de grandes quantités d’informations sous forme tabulaire (Figure 22). Conçue dans la continuité des interfaces de types fisheye, elle permet de présenter les données sous forme de tableau dont l’échelle peut être modifiée sur un ou deux axes. L’interface fournit une vue contexte + focus afin de pouvoir accéder facilement aux données. Au niveau contexte, seuls les intitulés du tableau sont visibles, les cellules étant codées soit par des couleurs lorsqu’il s’agit de données nominales, soit par des barres de différentes longueurs s’il s’agit d’intervalles. En modifiant l’échelle d’affichage, les contenus des cellules peuvent changer de représentation. Les principaux outils d’interaction sont le zoom, l’ajustement et le glissement. Le zoom permet de modifier la taille (échelle) de la région du focus sans changer le nombre de cellules; l’ajustement permet de modifier le nombre de cellules sans modifier l’échelle du focus; enfin le glissement permet de déplacer la région du focus pour afficher d’autres cellules.