de rappeler la d´efinition des bases de donn´ees impr´ecises
et incertaines et d’expliquer le choix des bases de donn´ees
cr´edibilistes et l’inf´erence des requˆetes cr´edibilistes. En effet,
dans cette section, nous pr´esentons le principe de top-k et ses
avantages ce qui nous m`ene `a la section 3 o`u nous d´ecrivons
le processus adapt´e pour mod´eliser les attributs cr´edibilistes
en utilisant la fonction de score avant de l’illustrer et finale-
ment conclure.
2. LES BASES DE DONNÉES IMPRÉCISES
ET INCERTAINES
Les informations existantes dans les bases de donn´ees peu-
vent ˆetre `a la fois incertaines (admettent une composante
al´eatoire), impr´ecises (pas assez focalis´ees) ou incompl`etes
(ayant un point de vue partiel).
Ainsi dans une base de donn´ees impr´ecise et incertaine, cer-
taines valeurs d’attribut sont mal connues et repr´esent´ees
par des ensembles disjonctifs pond´er´es [6], c’est-`a-dire par
des probabilit´es, des possibilit´es ou des fonctions de masses
selon le cadre th´eorique choisi pour mod´eliser les imperfec-
tions. Au del`a de la diff´erenciation des types de bases de
donn´ees, un aspect important concerne la mod´elisation de
telles bases de donn´ees est mis en ´evidence.
Pour aborder ce probl`eme, des bases de donn´ees cr´edibilistes
ont ´et´e propos´ees par [1, 23]. La th´eorie des fonctions de
croyance [25, 26, 24] est class´ee parmi les approches les plus
capables de repr´esenter, g´erer les donn´ees incertaines et im-
pr´ecises mais aussi de mod´eliser l’ignorance.
En premier lieu, la th´eorie des fonctions de croyance permet
de repr´esenter les donn´ees impr´ecises, incertaines et gradu-
elles que d’autres approches savent g´erer. Elle offre en effet
un cadre formel solide pour le traitement de l’incertitude
(notion prise dans son acception la plus large).
D’autre part, la th´eorie des fonctions de croyance supporte
le m´ecanisme de mise en conformit´e des n-uplets vis-`a-vis
des connaissances de domaine. En effet, ces connaissances
de domaine, d´efinies par une collection de mondes possibles,
d´elivrent un vocabulaire contrˆol´e qui sert `a d´ecrire les re-
quˆetes dans un langage proche de celui de l’utilisateur. En-
fin, la base de donn´ees cr´edibiliste offre une interface sym-
bolique pour mod´eliser des donn´ees cr´edibilistes avec des
fonctions de masses.
Pour interroger une telle base de donn´ees, nous d´efinissons
des requˆetes, dites cr´edibilistes. Ces requˆetes cr´edibilistes
correspondent `a des requˆetes impr´ecises pour lesquelles
l’utilisateur lui-mˆeme a des doutes (incertitude). Par ex-
emple, lors d’une recherche sur le web, l’utilisateur ne sait
pas toujours quels mots cl´es il doit saisir pour r´epondre `a
un besoin/concept qu’il ne sait lui mˆeme pas d´efinir. Les
requˆetes cr´edibilistes sont consid´er´ees comme ´etant des re-
quˆetes complexes (c’est-`a-dire des requˆetes de haut niveau).
2.1 Utilité des requêtes Top-K
Nous nous int´eressons aux requˆetes Top-k pour les adapter
avec une base de donn´ees cr´edibiliste. ce type de requˆetes
pr´esentent deux avantages principaux :
•Premi`erement, Les requˆetes Top-k offrent la possibilit´e
aux utilisateurs de qualifier les r´esultats d’une requˆete
grˆace `a une fonction de score. Elles permettent aux
utilisateurs de qualifier les r´esultats de leurs requˆetes
par rapport aux donn´ees existantes dans les bases de
donn´ees ceci en fonction de leurs pr´ef´erences person-
nelles. Ce type de requˆetes permettra donc aux utilisa-
teurs des applications sur le web de pouvoir rechercher
des donn´ees en fonction de leurs pr´ef´erences person-
nelles au lieu d’une simple recherche par identifiant ou
par une cl´e (exact match) qui ne pourra pas leur per-
mettre d’´evaluer la qualit´e d’une r´eponse par rapport
`a une autre.
•Deuxi`emement, elles ´evitent de submerger les utilisa-
teurs avec un grand nombre de r´eponses. Les requˆetes
fournies par l’utilisateur permettent de trier les r´esul-
tats par rapport `a ses propores pr´ef´erences.
Les requˆetes Top-k permettent ´egalement `a l’utilisateur
de limiter le nombre de r´esultats que le syst`eme doit lui
retourner. Les r´esultats retourn´es `a l’utilisateur sont
les meilleurs par rapport `a une fonction de score.
2.2 Base de données probabiliste
Une base de donn´ees probabiliste contient des attributs dont
les valeurs sont mal connues et repr´esent´ees par des distri-
butions de probabilit´e. Une telle base de donn´ees peut ˆetre
interpr´et´ee comme un ensemble de tuples contenant des at-
tributs probablement r´ealisables dans le monde r´eel. Ce type
de base de donn´ees est appropri´e pour capturer l’incertitude
mais il est incapable de mod´eliser l’ignorance totale tant
qu’il ne tient pas compte du cas de l’ensemble vide [14, 17,
19, 20].
Table 1: Probabilistic Database
Patient Age Maladie
Robert [20,25] anemia
Celina 41 0.7 flu, 0.3 cancer
Steve 0.5 cholera, 0.5 anemia
L’exemple suivant en tableau 1 permet d’expliquer que l’attribut
maladie peut ˆetre pr´esent comme une distribution de prob-
abilit´e avec des valeurs incertaines (0.7 flu, 0.3 cancer).
2.3 Base de données possibiliste
Une base de donn´ees possibiliste contient des attributs dont
les valeurs sont mal connues et repr´esent´ees par des dis-
tributions de possibilit´e. L’incertitude d’un ´ev´enement, au
contraire des probabilit´es, est donc caract´eris´ee par deux
valeurs : sa possibilit´e et sa n´ecessit´e. Une telle base de don-
n´ees peut ˆetre interpr´et´ee comme un ensemble de bases de
donn´ees usuelles (encore appel´ees mondes), chacune d’entre
elles ´etant plus au moins possible [10]. Ce type de base
de donn´ees a cependant des limitations de mod´elisation et
de repr´esentation des donn´ees incertaines. La structure des
bases de donn´ees usuelles rend indispensable la pr´esentation
de toutes les possibilit´es d’un attribut en g´en´erant les dif-
f´erents mondes possibles en se basant sur les axiomes des
deux mesures (la necessit´e N, et la possibilit´e Π), ceci en-
gendre des difficult´es au niveau du processus d’interrogation
et du calcul des scores.