4
1. Introduction
La personnalisation et la qualité de l’information constituent un enjeu majeur pour l’industrie
informatique. Que ce soit dans le contexte des systèmes d’information d’entreprise, du commerce
électronique, de l’accès au savoir et aux connaissances ou même des loisirs, la pertinence de
l’information délivrée, son intelligibilité et son adaptation aux usages et préférences des clients
constituent des facteurs clés du succès ou du rejet de ces systèmes. La production massive de
nouvelles ressources, conjuguée à la nature fortement hétérogène, multiforme et multilingue de
l’information constituent des verrous autant technologiques que sémantiques que les systèmes
d’accès et de filtrage actuels doivent lever pour produire une information pertinente et de qualité. La
personnalisation a pour objectif, d’une part, de faciliter l’expression du besoin utilisateur et de
rechercher des informations sur un sujet en écartant l’information non-pertinente et donc réduire
considérablement l’espace de recherche et, d’autre part, de rendre cette information sélectionnée
intelligible à l’usager et exploitable. La pertinence de l’information n’est cependant pas une mesure
objective, généralisable à tous les utilisateurs. Elle se définit par un ensemble de critères et de
préférences personnalisables spécifiques à chaque utilisateur ou communauté d’utilisateurs.
Ils existent plusieurs approches de classification des préférences. Selon le type de données
utilisées pour la comparaison de deux éléments on distingue des préférences intrinsèques et
extrinsèques. Les préférences intrinsèques portent uniquement sur les valeurs des attributs d’un
élément tandis que les préférences extrinsèques prennent en compte des facteurs extérieurs
comme l’origine d’un élément. Une autre manière de classer les approches de personnalisation est
basée sur la manière de comparer deux éléments. On retrouve ici l’approche qualitative où la
préférence est spécifiée directement par des relations binaires de préférence et l’approche
quantitative où les préférences sont exprimées indirectement par le biais de fonctions qui
attribuent un nombre à chaque élément et la pertinence d’un élément dépend du nombre attribué.
L’approche qualitative est plus générale que l’approche quantitative car elle peut définir les relations
de préférences sur des fonctions numériques si elles sont données explicitement, tandis que toutes
les relations de préférences ne peuvent pas être capturées par des fonctions numériques.
Du point de vue recherche, la personnalisation de l’information a été abordée principalement
dans la communauté Recherche d’Information (RI) et la communauté Bases de Données (BD).
Bien que très proches dans leur objectif final (accès efficace à l’information), les deux domaines de
recherche se distinguent généralement par la nature de l’information traitée (documents textuels
pour la RI et tableaux structurés pour les BDs) et le mode d’accès à cette information (accès par
mots-clés plus ou moins complexes et pas à pas pour la RI, accès par expressions logiques et de
façon globale pour les BDs). L’aspect interactif des requêtes RI a permis la prise en compte du
retour de l’utilisateur (feedback) et l’affinage progressif de la recherche. L’aspect ensembliste des