Modéliser un critère par un réseau bayésien : V

publicité
Modéliser un critère par un réseau
bayésien : V-structure et observations
probabilistes fixes
Véronique Delcroix 1 , Ali Ben Mrad 2
1. LAMIH UMR 8201,
UVHC Valenciennes, France
[email protected]
2. CES
université de Sfax, Tinisie
[email protected]
Cet article propose un système à base de réseaux bayésiens pour fournir des recommandations dans le cadre des problèmes récurrents d’aide à la décision multicritères. Chaque
critère de choix est modélisé par une V-structure dans le graphe du RB. Les auteurs mettent
en évidence l’intérêt de découper le RB et d’utiliser des observations probabilistes fixes afin de
produire le raisonnement attendu.
RÉSUMÉ.
This paper proposes a system composed of Bayesian networks in order to provide
recommendations in recurrent multicriteria decision problems. Each criterion is modeled by
a V-structure in the graph of the BN. The authors highlight the interest of cutting the BN and
using fixed probabilistic evidence to produce the waited reasoning
ABSTRACT.
MOTS-CLÉS : observation
probabiliste, réseau bayésien, observation de vraisemblance, aide à la
décision multicritères
KEYWORDS: probabilistic
evidence, bayesian network, likelihood evidence, soft evidence,MCDA
c 2016 Lavoisier
DOI:10.3166/RIA.-.1-18 Revue d’intelligence artificielle – no -/2016, 1-18
2
RIA. Volume - – no -/2016
1. Introduction
La modélisation d’un critère est utile dans les problèmes de décision où un ou plusieurs critères de choix doivent être pris en compte. Chaque critère oriente la décision
suivant une direction. Dans cet article; nous considérons un critère comme une qualité
positive que l’on cherche systématiquement à optimiser. Par exemple, lors du choix
d’une voiture, le critère associé au prix est l’adéquation entre le prix de la voiture et
le montant disponible, et cette adéquation doit toujours être la meilleure possible. Un
critère peut aussi être associé à un risque ou un niveau de gravité.
Nous considérons ici les problèmes de décision récurrents et multicritères . La
spécificité de ces problèmes est qu’ils concernent tout type de décideurs (Monsieur
"tout le monde"). Nous considérons une étape très amont du processus de décision
qui vise à aider le décideur à cibler un ensemble d’alternatives potentielles à l’aide
d’un système de recommandations sur les caractéristiques les plus pertinentes des
alternatives en fonction de son cas de décision. Ce système de recommandation basé
sur des réseaux bayésiens est présenté dans (Delcroix et al., 2013).
Dans cet article, nous proposons de modéliser chacun des critères de choix à l’aide
de trois noeuds formant une V-structure dans un réseau bayésien. Cette structure peut
être utilisée pour évaluer une alternative sur un critère dans un cas de décision spécifique, mais aussi pour fournir des recommandations adaptées au cas considéré en vue
de satisfaire le critère.
Nous expliquons pourquoi l’utilisation de ce type de réseau bayésien en vue de
fournir des recommandations sur les alternatives nécessite quelques précautions. En
effet, il est nécessaire de limiter la propagation vers les noeuds susceptibles de faire
l’objet de recommandation. Pour cela, nous proposons d’utiliser des observations probabilistes afin de fixer les distributions de probabilités des variables non observées qui
ne doivent pas faire l’objet d’une recommandation. Ce type d’observation est spécifié
par une distribution locale de probabilités sur une variable qui reflète la croyance sur
cette variable après propagation de l’information dans le réseau. Le fait d’imposer une
distribution de probabilités fixe revient à modifier temporairement le modèle, puisque
les a priori sur les variables concernées par les observations probabilistes fixes sont
temporairement remplacés. D’un coté, ce type d’observations soulève des critiques
dans la communauté des modèles graphiques probabilistes car il ne s’agit pas d’un
événement e que l’on peut propager en calculant P (. | e); d’un autre coté, il existe
une réelle demande pour ce type d’observations (Bloemeke, 1998 ; Valtorta et al.,
2002 ; Baldwin, Tomaso, 2003 ; Arsene et al., 2015).
Dans la partie suivante, nous introduisons les problèmes récurrents d’aide à la décision multicritères, et nous expliquons leur spécificité. Puis dans la partie 3, nous présentons la modélisation d’un critère à l’aide d’une V-structure et son utilisation pour
évaluer et pour recommander. Nous expliquons et illustrons les problèmes rencontrés
pour fournir des recommandations sur les alternatives en utilisant le RB de façon classique. La partie 4 concerne la solution proposée avec des observations probabilistes
fixes et les résultats obtenus sur un exemple jouet d’aide à la décision multicritère.
Modèle d’un critère dans un RB
3
2. Problème récurrent d’aide à la décision multi-critères
2.1. Présentation
Un problème de décision récurrent est un problème de décision qui est répété
plusieurs fois dans des contextes différents et avec différents acteurs, mais toujours
avec le même type d’alternatives et les mêmes critères de choix. Les problèmes de
décision récurrents sont caractérisés par le fait qu’ils concernent tout type de décideur.
En effet, chaque occurrence de la décision implique un ensemble d’acteurs différents
avec leur contraintes propres, et dans un contexte spécifique. L’importance de chaque
critère et l’évaluation d’une alternative en fonction d’un critère donné dépendent de
chaque cas de décision. Ces problèmes sont aussi caractérisés par l’absence possible
d’un expert, capable d’évaluer une alternative sur un critère ainsi que l’importance des
critères qui dépend de chaque cas de décision, ce qui rend plus utile encore d’apporter
de l’aide au décideur(s). Nous considérons les problèmes multi-attributs dans lesquels
les alternatives sont caractérisées par un ensemble d’attributs fixes.
F IGURE 1. Exemples de paramètres intervenant dans le choix d’un véhicule
La figure 1 montre quelques uns des paramètres qui entrent en jeu lorsqu’une personne choisit une voiture. Les réseaux bayésiens sont bien adaptés pour la modélisation des problèmes récurrents de décision car ils permettent de représenter et de
raisonner avec l’incertitude et d’apporter au décideur une information et des recommandations adaptées à son cas.
2.2. Spécificité des problèmes récurrents d’aide à la décision multicritère
Les problèmes et les méthodes d’aide à la décision multicritère (ADMC) représentent un champs de recherche déjà bien étudié. Nous expliquons ci-dessous pourquoi ces méthodes ne sont pas adaptées aux problèmes récurrents d’ADMC que nous
abordons, de même que d’autres outils d’aide à la décision comme les diagrammes
d’influences.
Un premier élément à considérer concerne le décideur. Dans les problèmes de décision récurrents, le décideur est parfois "ignorant" et n’est pas toujours accompagné
4
RIA. Volume - – no -/2016
d’un spécialiste. De ce fait, il ne peut être sollicité de façon importante et systématique sur des questions qui requièrent de l’expertise. Au contraire, les méthodes multicritères reposent sur l’idée d’utiliser les préférences du décideur pour différencier les
solutions et l’aider dans le processus de décision. Dans notre approche, le décideur
n’est sollicité que pour fournir des informations sur les éléments concernant son cas
de décision et qui peuvent entrer en jeu dans la décision : ses caractéristiques, ses
contraintes, ses besoins, le contexte, etc.; en revanche il n’a pas à donner ses préférences en termes de comparaison d’alternatives relativement à des critères, ce qui peut
demander une certaine expertise. Dans notre exemple très simplifié sur le choix d’une
voiture, tous les acheteurs ne sont pas capables de classer deux voitures données en
termes de satisfaction relativement à l’accélération, ou sur d’autres critères comme par
exemple ceux qui impactent sur le type de carburant.
Deuxièmement, la plupart des méthodes d’ADMC supposent que l’on dispose a
priori d’une liste de solutions potentielles de taille "raisonnable". Notre proposition se
situe plus en amont dans le processus de choix et ne nécessite pas que le décideur ait
dès le départ une liste d’alternatives. Au contraire, les recommandations sur les caractéristiques des alternatives fournies par notre approche peuvent constituer un point de
départ pour établir une telle liste d’alternatives. Concrètement dans notre exemple, une
personne désireuse de choisir une voiture pourrait dans un premier temps obtenir des
recommandations sur les caractéristiques d’un véhicule adapté à ses besoins grâce à
notre proposition; puis tirer parti de ces recommandations pour établir une liste de véhicules pertinents pour son cas; et enfin, exploiter une méthode d’ADMC pour classer
ces véhicules, ou sélectionner le ou les meilleurs.
D’autres modèles graphiques probabilistes, dont les diagrammes d’influence sont
dédiés à l’aide à la décision. Ces modèles permettent de traiter des problèmes de décision séquentiels, dans lesquels chaque décision comporte un nombre limité d’alternatives. Dans les problèmes de décision récurrents que nous traitons, la liste des
alternatives n’est pas connue a priori. Dans notre exemple sur le problème récurrent
de l’aide au choix d’une voiture, un noeud de décision d’un diagramme d’influence
pourrait comporter une liste de voitures réelles, dont toutes les caractéristiques seraient
connues (options, etc). S’il s’agit d’une liste commune à tous les cas de décision, sa
taille est immense; et si elle est spécifique à chaque cas de décision, c’est un travail
préalable qui est demandé au décideur, or notre proposition vise au contraire à aider à
obtenir une telle liste restreinte et spécifique.
Une autre approche pourrait considérer le choix des valeurs des caractéristiques
des alternatives comme autant d’étapes dans la décision. Cependant, les diagrammes
d’influence imposent de déterminer un ordre fixe sur les décisions, ce qui n’est pas pertinent pour le choix des caractéristiques des alternatives (par exemple le type de voiture, puis la marque, etc.). La comparaison des réseaux bayésiens et des diagrammes
d’influence pour les problèmes récurrents d’ADMC a été discutée dans (Sedki, Delcroix, 2012).
En résumé, notre approche se situe à une phase très amont du processus de décision
pour des problèmes d’ADMC récurrents, en vue de fournir des recommandations sur
Modèle d’un critère dans un RB
5
les caractéristiques des alternatives qui soient adaptés à la spécificité de chaque cas de
décision. Cet ensemble de recommandations peut ensuite être utilisé pour sélectionner
un sous-ensemble d’alternatives de taille raisonnable qui constitue le point de départ
de l’étape suivante du processus de décision.
3. Principe du réseau bayésien pour les problèmes récurrents d’aide à la
décision multicritères : structure du graphe et utilisation
L’idée d’utiliser une V-structure pour modéliser un critère dans un réseau bayésien
(RB) n’est pas nouvelle (Fenton, Neil, 2001 ; Leicester et al., 2013), mais elle n’est
pas clairement formalisée.
3.1. Modélisation d’un critère de décision par une V-structure dans un RB
Le principe de la V-structure pour représenter un critère est représenté sur la figure 2 : un noeud sans enfants représente l’indice de satisfaction du critère. Il peut
aussi représenter un degré d’adéquation entre une contrainte liée au cas de décision
et une caractéristique (directe ou dérivée) de l’alternative. Cet indice est une valeur
entre 0 et 1 où 1 représente une satisfaction maximale du critère. Pour des raisons de
facilité, nous représentons cet indice dans pyAgrum par une variable “quasi continue”,
c’est à dire une variable entière variant dans un intervalle. Nous avons choisi l’intervalle [1,10] car il faut faire un compromis entre précision et taille du modèle. De ce
fait, les variables satAcceleration et adeqPrix de notre exemple représentent l’indice
de satisfaction multiplié par 10.
Le degré de satisfaction d’un critère dépend d’une part des caractéristiques de l’alternative, et d’autre part de l’importance de ce critère ou de contraintes spécifiques à
chaque cas de décision. Ces facteurs sont représentés par les deux noeuds parents de
la V-structure. Le parent représenté à gauche concerne le cas de décision et nous l’appellerons parfois le parent gauche. Ces deux noeuds parents peuvent être des indices,
comme ci-dessous pour le critère accélération, ou l’importance et l’indice sont des
valeurs dans [0,10], ou bien des grandeurs de même unité, comme le prix du véhicule
et le montant disponible.
F IGURE 2. V-structure pour modéliser un critère dans le graphe du réseau bayésien
6
RIA. Volume - – no -/2016
F IGURE 3. Exemple jouet : RB modélisant les critères d’adéquation du prix et de
satisfaction en terme d’accélération lors du choix d’un véhicule
La figure 3 illustre la modélisation de deux critères dans le problème du choix
d’une voiture: d’une part l’adéquation entre le prix de la voiture et le montant disponible pour l’acheteur, d’autre part, la satisfaction en termes d’accélération de la voiture. Ce RB jouet est utilisé pour illustrer cet article mais il est entièrement imaginé,
et ne reflète pas des données réelles.
A ce stade, notons une remarque importante sur le vocabulaire : il est fréquent
de confondre les caractéristiques des alternatives et les critères. Par exemple, on dit
parfois que le prix est un critère de choix. Dans cet article, nous distinguons clairement ces deux notions : d’un coté le prix, qui est une caractéristique d’une voiture; de
l’autre le critère de choix associé au prix, qui représente le niveau d’adéquation entre
le montant disponible pour l’acheteur et le prix du véhicule. Un même prix est plus
ou moins satisfaisant selon l’acheteur, et il est faux de dire que le prix le plus bas est
toujours le plus satisfaisant. Ainsi, lors d’une décision, l’objectif est de satisfaire au
mieux chacun des critères. Cela se traduit dans la V-structure par le fait que le niveau
d’adéquation (ou de satisfaction) d’un critère doit être le plus élevé possible, même
pour un critère peu important.
Voici la présentation rapide des 6 noeuds qui constituent les deux V-structures des
deux critères:
Critère associé au prix : le montant disponible pour acheter une voiture dépend de
l’age et du niveau de vie de l’acheteur; le prix du véhicule dépend du rapport
poids/puissance (en kg/cv); l’adéquation en termes de prix est maximale lorsque
le prix du véhicule et le montant disponible sont égaux, et nulle si la valeur
absolue de la différence entre le prix de la voiture et le montant disponible
dépasse les deux tiers du montant disponible. Ce noeud n’est pas déterministe.
Critère associé à l’accélération de la voiture : l’importance que le véhicule ait une
forte accélération dépend uniquement du sexe de l’acheteur; l’indice d’accélé-
Modèle d’un critère dans un RB
7
ration dépend uniquement (et de façon déterministe) du rapport poids/puissance
du véhicule; la satisfaction en termes d’accélération dépend de l’importance du
critère (imp) pour l’acheteur et de son évaluation pour une alternative (g). Nous
définissons la satisfaction (sat), par sat = g imp , où les trois variables sat, g et
imp sont des indices entre 0 et 1. Cette définition donne une satisfaction maximale lorsque l’importance du critère est nulle (dans certains cas, l’accélération
n’est pas un critère de choix); à l’inverse, le niveau de safisfaction est égal à l’indice d’évaluation du critère lorsque l’importance est maximale (égale à 1). Dans
notre exemple, nous utilisons des variables entières dans [0,10] qui représentent
dix fois l’indice.
Cet exemple a été implémenté avec la bibliothèque pyAgrum 1 ; l’ensemble des
tests a été réalisé via les notebook de pythonXY 2
3.2. Première utilisation du RB : évaluation des critères
Il s’agit d’évaluer une alternative (ou un sous-ensemble d’alternatives) sur un critère, pour un cas de décision (ou un type d’acheteur). Voici les entrées/sorties du réseau
bayésien pour évaluer chacun des critères :
Entrées (observation) : le cas de décision et l’alternative, chacun étant décrits par un
sous-ensemble de caractéristiques observées.
Sorties (variable cible) : le degré de satisfaction ou d’adéquation du critère.
Dans la suite de cet article, nous considérons deux acheteurs potentiels pour nos
tests :
Lucas : jeune homme de 20 ans, d’un faible niveau de vie (trait plein).
Lili : dame de 60 ans, au niveau de vie moyen (trait pointillé).
Nous considérons aussi trois sous-ensembles de voitures, définis suivant une seule
caractéristique : le rapport entre le poids de la voiture en kg et sa puissance en cv.
Ce rapport poids/puissance est un indicateur direct de la capacité d’accélération d’une
voiture : un rapport faible indique une excellente reprise (par exemple un rapport de 4
kg/ch pour la porshe 911 GT3) alors qu’un rapport plus élevé indique une accélération
moins rapide (par exemple un rapport de 40 kg/ch pour la 2cv). Ce rapport est aussi
fortement lié au prix du véhicule (globalement, plus le rapport poids/puissance est
petit, plus la voiture est chère).
La figure 4 montre l’évaluation du critère lié à l’accélération pour trois type de véhicules et nos deux personnes. Les courbes de gauche montre l’évaluation du niveau
d’importance de l’accélération pour deux personnages à partir des observations sur les
variables âge, sexe et niveau de vie. Ce critère est (probablement) important ou très
1. https://forge.lip6.fr/projects/pyagrum
2. avec l’aide de Pierre-Henri Wuillemin, que nous remercions chaleureusement!
8
RIA. Volume - – no -/2016
F IGURE 4. Evaluation de trois types de véhicules pour deux personnes sur le critère
de l’accélération. Cas 1 : observations directes sur le décideur (âge, sexe, niveau de
vie)
F IGURE 5. Evaluation de trois types de véhicules pour deux personnes sur le critère
de l’accélération. Cas 2 : observation supplémentaire sur l’importance de
l’accélération (obs. de vraisemblance)
important pour Lucas, alors qu’il l’est (probablement) moins pour Lili. Les courbes
de droite représentent les distributions de probabilités a posteriori de l’indice d’accélération et du niveau de satisfaction en termes d’accélération pour six configurations
possibles (3 voitures et 2 personnes).
Globalement, le niveau de satisfaction est plus élevé pour Lili, puisque ce critère
est moins important pour elle. La voiture avec le rapport poids/puissance = 4 procure
un niveau de satisfaction excellent quel que soit l’acheteur.
La figure 5 montre l’évaluation du critère lié à l’accélération avec les observations
utilisées pour la figure 4 et des observations supplémentaires sur le montant disponible
pour l’achat de la voiture et l’importance du critère accélération. Pour cette dernière,
on utilise ici une observation de vraissemblance. Rappelons que cette variable est un
indice entre 0 et 10; pour Lucas par exemple, l’observation est décrite par le vecteur
Modèle d’un critère dans un RB
9
[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1] qui traduit le fait que l’importance du critère accélération
est "importante ou très importante".
Du fait qu’il y a moins d’incertitude sur le niveau d’importance, on constate sur
les courbes de droite que l’évaluation du niveau de satisfaction est aussi plus précis.
F IGURE 6. Evaluation en termes de prix pour trois types de véhicules et deux
personnes. Cas 1 : obsrvations directes sur la personne (âge, sexe, niveau de vie)
Les figures 6 et 7 montrent l’évaluation du critère associé au prix pour trois type
de voiture et deux personnes. Dans le premier cas (figure 7), les observations portent
sur l’age, le sexe et le niveau de vie pour les acheteur, et sur le rapport poids/puissance
pour les voitures. Dans le second cas (figure 6), les observations sont identiques, avec
en plus une précision sur le montant disponible.
Dans les deux figures, les courbes en haut à gauche et à droite indiquent respectivement les distributions de probabilités sur le montant disponible et le prix des voitures;
et les courbes du bas montrent les distributions de probabilités a posteriori du niveau
d’adéquation du prix pour nos deux personnes, Lucas et Lili, pour chaque type de
voiture considéré.
Pour Lucas, une voiture avec un rapport poids/puissance = 12 a plus de chance
d’être satisfaisant en termes de prix qu’une voiture de rapport 8; et une voiture avec
un rapport poids puissance de 4 n’a aucune chance d’être satisfaisante en termes de
prix pour ce jeune homme. En revanche, pour Lili, c’est une voiture avec un rapport
poids puissance de 8 qui offre le plus de chances d’une bonne satisfaction en termes
de prix, devant les voitures avec un rapport de 12. Par ailleurs, certaines des voitures
avec un rapport poids/puissance = 4 peuvent offrir une satisfaction moyenne en termes
de prix pour Lili.
10
RIA. Volume - – no -/2016
F IGURE 7. Evaluation en termes de prix pour trois types de véhicules et deux
personnes. Cas 2 : observation supplémentaire sur le montant disponible
3.3. Seconde utilisation : la recommandation
Le contexte est celui d’une personne donnée (connue) qui souhaite choisir une
voiture de façon à satisfaire un ensemble de critères (ici deux). L’objectif est de fournir
à cette personne des recommandations ciblées sur les caractéristiques d’une voiture
qui lui permettra le plus probablement de satisfaire tous les critères.
L’idée est de se projeter dans une situation idéale, où la personne serait effectivement satisfaite sur tous les critères et de voir, grâce à l’inférence, quelles sont les
caractéristiques de cette voiture qui "expliquent" cette satisfaction. Dans cet objectif,
on propage dans le RB une satisfaction maximale sur les deux criteres de choix, ainsi
que les observations sur la personne, et on regarde les probabilités a posteriori sur les
caractéristiques de la voiture.
Voici les entrées/sorties du réseau bayésien pour obtenir des recommandations afin
de satisfaire un critère :
Entrées (observation) : le cas de décision décrit par un sous-ensemble de caractéristiques observées et un niveau de satisfaction élevé des critères.
Sorties (variable cible) : caractéristiques d’une alternative.
Cependant, nous allons voir ci-dessous que ce mécanisme ne suffit pas pour effectivement produire des recommandations pertinentes sur les alternatives.
Modèle d’un critère dans un RB
11
F IGURE 8. Distributions de probabilité a posteriori sur deux caractéristiques du
véhicule après propagation d’un niveau de satisfaction élevé des deux critères et des
observations sur l’acheteur. En haut : les observations sur le décideur sont l’age, le
sexe et le niveau de vie. En bas : deux observations supplémentaires sur le montant
disponible et l’importance de l’accélération.
3.4. Le problème des recommandations avec des observations incomplètes
Considérons l’exemple de la figure 8 pour illustrer le fait qu’il ne suffit pas de
propager une exigence de satisfaction sur les critères et les observations sur l’acheteur
pour obtenir des recommandations pertinentes sur un véhicule en vue de l’acheter.
Dans l’exemple de la figure 8, on propage les observations directes sur l’acheteur
(age, sexe et niveau de vie) et un niveau de satisfaction maximal pour les deux critères (adeqPrix = 10 et satAcceleration = 10). Ces observations forment le premier cas
(partie haute du graphe). Dans le second cas (partie basse du graphe), on ajoute deux
observations supplémentaires sur le montant disponible et l’importance du critère accélération, c’est à dire sur le parent direct de chaque critère coté décideur.
Observons les probabilités a posteriori sur les caractéristiques de la voiture : la
distribution de probabilité a posteriori est très différente dans les deux configurations
(en haut et en bas). Pourquoi cette explication est-elle si différente avec et sans observation sur le parent direct du critère coté décideur (montant disponible et importance
de l’accélération) ? Alors que les observations ajoutées sur le montant disponible et
l’importance du critère accélération ne font que préciser des variables qui dépendent
des observations directes de l’acheteur.
Dans les deux cas, le résultat de l’inférence correspond à l’explication la plus probable d’une situation où une personne connue est très satisfaite par un type de voiture
sur les deux critères du prix et de l’accélération. Mais cette explication ne correspond
pas au raisonnement souhaité, qui vise à donner des recommandations sur le véhicule,
sans remettre en cause les caractéristiques non observées de l’acheteur.
12
RIA. Volume - – no -/2016
Le raisonnement souhaité est une sorte de projection dans laquelle :
– on a un ensemble d’observations concernant un cas de décision : le décideur (et
son contexte, environnement, ...)
– on a un niveau élevé de satisfaction des critères
– on s’interdit de modifier les variables concernant la personne, son environnement, contexte etc.
– on cherche quelles valeurs des caractéristiques de l’alternative expliquent le
mieux ce bon degré de satisfaction.
Ce modèle de raisonnement ne peut être obtenu par un RB tel que celui ci-dessus
avec des observations classiques (ou des observations de vraisemblance). En effet,
dans ce cas, nous avons vu que l’inférence conduit à faire des "recommandations" sur
les caractéristiques non observées de la personne, ce qui n’est pas le but.
4. Solution proposée : utiliser des observations probabilistes
La première intuition consiste à découper le RB au niveau des noeuds des critères
et à procéder comme suit: (1) évaluer les parents directs de chaque critère coté décideur (2) ne conserver qu’une seule valeur (la plus probable), au lieu de conserver la
distribution de probabilité obtenue (3) propager l’exigence de satisfaction des critères
avec les valeurs obtenues dans le reste du RB.
Lors de l’étape (2), il faut noter qu’on ne peut pas utiliser une observation de vraisemblance pour les noeuds d’importance des critères car elle serait ensuite modifiée
par la propagation de la satisfaction max du critère, ce qui n’est pas le but puisque la
recommandation ne doit porter que sur les alternatives, et non sur le décideur (ou le
cas de décision).
Afin d’éviter la perte d’information qui consiste à ne retenir qu’une seule valeur,
nous proposons d’utiliser des observations probabilistes fixes qui permettent de maintenir fixes un ensemble de distributions de probabilités locales lors de la propagation.
4.1. Les observations probabilistes
La question des observations incertaines dans les RBs a déjà été abordé souvent dans la littérature, et on identifie deux ou trois types d’observations incertaines
(Dubois et al., 1998 ; Valtorta et al., 2002 ; Vomlel, 2004 ; Chan, Darwiche, 2005 ;
Benferhat, Tabia, 2012). Cependant, le sujet n’est pas consensuel comme en témoigne
la diversité du vocabulaire, et le fait que nombre de logiciels et bibliothèques sur les
RB ne proposent qu’un seul type d’observations incertaines (Mrad et al., 2015). Les
observations incertaines les plus connues sont les observations de vraisemblance (likelihood evidence, ou virtual evidence) introduites par Pearl. Ces dernières sont propagées en modifiant temporairement le graphe du RB par l’ajout d’un noeud qui représente l’observation faite. L’observation est spécifiée par sa vraisemblance en fonction
du noeud parent.
Modèle d’un critère dans un RB
13
Nous utilisons un autre type d’observation incertaine, identifié dès 1998 (Dubois
et al., 1998 ; Bloemeke, 1998), et que nous appelons observations probabilistes (nommées soft evidence par Valtorta et ses co-auteurs).
Une observation probabiliste sur une variable X dans un réseau bayésien est spécifiée par une distribution locale de probabilités R(X) qui définit l’état des croyances
sur la variable X après que cette information ait été propagée. Une observation probabiliste est fixe lorsque la distribution de probabilités R(X) ne peut pas être modifiée
par la propagation d’autres observations. Elle est dite non fixe dans le cas contraire.
La différence entre les observations probabilistes fixes et non fixes apparait lorsqu’on propage successivement plusieurs observations probabilistes.
La propagation d’une seule observation probabiliste R(X) sur une variable X se
fait facilement en convertissant l’observation en un rapport de vraisemblance L(X) =
R(X)/P (X) où P (X) est la distribution de probabilité a priori de X, puis en propageant L(X) comme une observation de vraisemblance par la méthode de l’observation
virtuelle de Pearl. cette méthode ne peut être utilisée pour propager plusieurs observations probabilistes fixes car alors elles ne restent pas fixes (Chan, Darwiche, 2005).
Plusieurs algorithmes ont été proposés pour propager un ensemble d’observations
probabilistes dans un RB(Peng et al., 2010 ; 2012 ; Mrad, 2015 ; Mrad et al., 2015).
Nous avons implémenté l’algorithme BN-IPFP1 (Pan et al., 2006) qui permet
de propager dans un réseau bayésien un ensemble d’observations probabilistes non
contradictoires 3 4 . Cet algorithme propage à tour de rôle chaque observations en la
convertissant en observations de vraisemblance, et ce jusqu’à obtenir une distribution
qui satisfasse toutes les observations probabilistes demandées.
On peut noter que les observations classiques sont des cas particuliers d’observations probabilistes, alors que les observations de vraisemblance ne le sont pas.
4.2. Recommandations à l’aide d’observations probabilistes
L’objectif est de fournir des recommandations sur les caractéristiques des alternatives afin de satisfaire au mieux un ensemble de critères pour un cas de décision
donné par un ensemble d’observations. Pour cela, on fixe la satisfaction des critères
dans un intervalle élevé (par exemple entre 7 et 10), et on empêche que la propagation
de ces exigences ne modifie les variables non observées du cas de décision. Cela est
3. Notons X l’ensemble des variables d’un RB (G, P ), X l’ensemble des variables associées aux noeuds
du RB et R(Y1 ), . . . , R(Yr ) un ensemble d’observations probabilistes avec {Y1 , . . . , Yr } ⊂ X; on dit
que ces observations probabilistes sont cohérentes, ou non contradictoires (consistent en anglais) s’il existe
une distribution de probabilités Q(X) dont les probabilités marginales sur Yi coïncident avec R(Yi ), c’est
à dire Q(Yi ) = R(Yi ) pour i = 1, . . . , r (Peng et al., 2010, p. 543).
4. si de plus, chaque distribution locale R(Yi ) domine P (Yi ) (P (Yi ) << R(Yi )), alors l’algorithme BNIPFP1 converge (Peng et al., 2010, p. 543). Par définition, P (Y ) << R(Y ) si {y | P (y) > 0} ⊂ {y |
R(y) > 0}.
14
RIA. Volume - – no -/2016
assuré en propageant une observation probabiliste pour le parent gauche (coté cas de
décision) de chaque critère. Ainsi, dans notre exemple, on impose que la distribution
de probabilités du montant disponible et celle de l’importance du critère accélération
restent fixes lorsqu’on propage l’exigence de satisfaction des deux critères.
F IGURE 9. Distributions de probabilités du montant disponible et de l’importance du
critère accélération que l’on veut garder fixe lors de la propagation de l’exigence de
satisfaction des critères en vue de fournir des recommandations sur le véhicule
La figure 9 montre les distributions des observations probabilistes sur les parents
directs des deux critères. Ces distributions ont été obtenues en propageant les observations (âge, sexe et niveau de vie). Cette méthode permet aussi de pallier les cas où
on ne dispose pas de toutes les caractéristiques directes du cas de décision, ce qui est
fréquent.
F IGURE 10. Comparaison du montant disponible et de l’importance du critère
accélération a priori et après propagation de la satisfaction des critères et des
observations directes sur le décideur (âge, sexe, niveau de vie).
La figure 10 correspond à la propagation d’une satisfaction élevée pour les deux
critères pour deux personnes connue (age, sex, niveau de vie) avec des observations
classiques (on ne fixe aucune distribution de probabilité). Le montant disponible et
l’importance du critère accélération sont fortement modifié par rapport à leur valeur a
priori (traits gris).
Modèle d’un critère dans un RB
15
Considérons par exemple les courbes en traits plein sur la partie gauche de la figure : la courbe en gris représente l’estimation du montant disponible pour Lucas
(jeune homme de 20 ans avec un faible niveau de vie); la propagation d’une satisfaction maximale des deux critères pour cette personne conduit à une explication bien
naturelle : le montant disponible de Lucas est en fait plus élevé et l’importance du
critère accélération est plus faible que celle estimée a priori.
C’est pour éviter cela que les distributions de probabilité de ces deux variables
doivent être maintenues fixes en les définissant comme des observations probabilistes
fixes.
F IGURE 11. Recommandations sur les caractéristiques d’un véhicule en maintenant
fixe le montant disponible et l’importance de l’accélération (traits noirs) et
comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 1 : le
niveau de satisfaction des critères est 10 (sur 10)
F IGURE 12. Recommandations sur les caractéristiques d’un véhicule en maintenant
fixe le montant disponible et l’importance de l’accélération (traits noirs) et
comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 2 : le
niveau de satisfaction des critères est entre 7 et 10 (sur 10)
Les figures 11 et 12 montrent les recommandations sur le rapport poids/puissance
et sur le prix pour nos deux personnages en utilisant des observations probabilistes
16
RIA. Volume - – no -/2016
fixes pour le montant disponible et l’importance du critère accélération lors de la propagation d’une satisfaction élevée pour les deux critères. Dans la figure 11, l’exigence de satisfaction est traduite par la valeur maximale 10 pour chacun des critères.
Dans la figure 12, l’exigence de satisfaction est traduite par une observation probabiliste donnée par le vecteur [0, 0, 0, 0, 0, 0, 0, 0.5, 0.5, 1, 1] (avant normalisation), ce
qui traduit une satisfaction bonne ou très bonne. Ce second test figure 12 conduit à
une recommandation plus réaliste. Les recommandations pour Lucas (traits plein et
noir) donnent une fourchette de prix précis (8000 à 9000 euros, mais éventuellement
plus) et un rapport poids/puissance entre 4 et 9, en excluant toute voiture avec un
rapport poids/puissance supérieur à 10. Il est clair que Lucas n’a que peu de choix,
car ses exigences sont contradictoires. Ces deux seuls critères réduisent considérablement l’ensemble des voitures possibles. Les recommandations pour Lili (trait pointillés et noirs) donne une large fourchette de prix, autour de 20 K euros et un rapport
poids/puissancce de préférence entre 6 et 8. Les recommandations pour Lili sont beaucoup plus larges, et laissent la place à l’ajout de nombreux autres critères pour affiner
son choix ! Les courbes en gris correspondent au résultat de l’inférence avec des observations classiques et ne constituent pas des recommandations!
5. Conclusion et perspectives
Dans cet article, nous avons utilisé un exemple jouet pour illustrer la modélisation
d’un problème récurrent d’aide à la décision multicritère à l’aide d’un réseau bayésien.
Nous avons expliqué comment modéliser chaque critère de choix à l’aide de trois
noeuds : (1) le parent gauche représente la synthèse des facteurs du cas de décision
impliqués dans ce critère, (2) le parent droit représente l’évaluation d’une alternative
pour ce critère, et (3) le noeud fils de la V-structure représente le niveau de satisfaction
du critère ou degré d’adéquation dans le cas d’une contrainte.
Nous avons illustré comment ce modèle permet d’évaluer chacun des critères dans
un cas donné. Enfin, nous avons expliqué et illustré le fait que l’inférence avec des
observations classiques ne permet pas de produire des recommandations sur les alternatives pertinentes pour un cas de décision donné. En effet, la propagation d’une
exigence de satisfaction des critères fourni une explication qui inclut les noeuds non
observés du coté du cas de décision, alors que la recommandation ne doit concerner
que les caractéristiques des alternatives.
Nous avons proposé une solution à l’aide d’observations probabilistes fixes qui interdit la modification des distributions de probabilités des variables ainsi "observées".
La définition d’observation probabilistes fixes sur les parents gauche de chaque critère
permet de cibler la propagation vers le parent droit (coté alternative). Notons qu’il est
nécessaire de définir des observations probabilistes fixes sur les parents directs de
chaque critère, coté décideur, et non pas seulement sur les variables non observées.
En effet, l’ensemble des noeuds non observés est susceptible d’être impacté par la
propagation de la satisfaction des critères, modifiant ainsi l’impact sur les variables
pour lesquelles on attend la recommandation.
Modèle d’un critère dans un RB
17
A l’avenir, de nombreuses questions concernant les observations probabilistes et
le systèmes de recommandations restent à creuser. En particulier, les observations
probabilistes fixes sont parfois qualifiées de "non bayésiennes", dans la mesure où le
modèle de base est remis en cause. Nous espérons que cet article aide à convaincre
de la pertinence et de l’interet de cette technique! Il faut cependant rendre plus claires
les hypothèses qui sont remises en cause par l’utilisation d’observations probabilistes
fixes.
Une étude plus complète sur les observations probabilistes reste à mener, en particulier sur les algorithmes de propagation de ces observations (convergence, complexité, observations contradictoires, mais aussi sur la d-séparation, sur la cohabitation
de différents types d’observations incertaines, etc.).
A court terme, une perspective directe de cet article concerne la question du découpage du réseau en plusieurs entités. Le modèle distribué correspondant a été proposé (Bloemeke, 1998) sous le terme d’"Agent Encapsulated Bayesian Network". Le
modèle que nous proposons pour l’aide à la décision multicritères contient plusieurs
entités naturelles : le décideur, le contexte, les alternatives, et les modules (ou agents)
au centre correspondant aux critères. Ce modèle distribué doit maintenant être implémenté, testé et comparé à d’autres.
Remerciements
Nous remercions pour ce travail les auteurs de la bibliothèque pyAgrum, et en particulier Pierre-Henri Wuillemin, pour son aide toujours rapide et efficace concernant
le développement.
Bibliographie
Arsene O., Dumitrache I., Mihu I. (2015). Expert system for medicine diagnosis using software
agents. Expert Syst. Appl., vol. 42, no 4, p. 1825–1834.
Baldwin J. F., Tomaso E. D. (2003). Inference and learning in fuzzy bayesian networks. In The
12th IEEE international conference on fuzzy systems, FUZZ-IEEE 2003, st. louis, missouri,
usa, 25-28 may 2003, p. 630–635.
Benferhat S., Tabia K. (2012). Inference in possibilistic network classifiers under uncertain
observations. Annals of Mathematics and Artificial Intelligence, vol. 64, no 2-3, p. 269309.
Bloemeke M. (1998). Agent encapsulated Bayesian networks. Ph.d. thesis, Department of
Computer Science, University of South Carolina.
Chan H., Darwiche A. (2005). On the revision of probabilistic beliefs using uncertain evidence.
Artificial Intelligence, vol. 163, no 1, p. 67-90.
Delcroix V., Sedki K., Lepoutre F. X. (2013). A Bayesian network for recurrent multi-criteria
and multi-attribute decision problems: Choosing a manual wheelchair. Expert Systems with
Applications, vol. 40, no 7, p. 2541-2551.
Dubois D., Moral S., Prade H. (1998). Belief change rules in ordinal and numerical uncertainty
theories. In D. Gabbay, P. Smets (Eds.), Belief change, (d. dubois, h. prade, eds.), vol. 3
18
RIA. Volume - – no -/2016
of the handbook of defeasible reasoning and uncertainty management systems, p. 311-392.
Dordrecht, Kluwer Academic Publishers.
Fenton N., Neil M. (2001). Making decisions: Bayesian nets and mcda. Knowledge-Based
Systems, vol. 14, no 7, p. 307–325.
Leicester P. A., Goodier C. I., Rowley P. (2013). Using a Bayesian network to evaluate the
social, economic and environmental impacts of community renewable energy. In Clean
technology for smart cities and buildings (cisbat).
Mrad A. B. (2015). Observations probabilistes dans les réseaux bayésiens. Ph.d. thesis,
LAMIH, Université de Valenciennes et du hainaut-cambresis, France.
Mrad A. B., Delcroix V., Piechowiak S., Leicester P., Abid M. (2015). An explication of
uncertain evidence in bayesian networks: likelihood evidence and probabilistic evidence uncertain evidence in bayesian networks. Appl. Intell., vol. 43, no 4, p. 802–824.
Pan R., Peng Y., Ding Z. (2006). Belief update in Bayesian networks using uncertain evidence.
In Ictai, p. 441-444.
Peng Y., Ding Z., Zhang S., Pan R. (2012). Bayesian network revision with probabilistic
constraints. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems,
vol. 20, no 3, p. 317-337.
Peng Y., Zhang S., Pan R. (2010). Bayesian network reasoning with uncertain evidences.
International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 18,
no 5, p. 539–564.
Sedki K., Delcroix V. (2012). A model based on influence diagrams for multi-criteria decisionmaking. International Journal on Artificial Intelligence Tools, vol. 21, no 4.
Valtorta M., Kim Y.-G., Vomlel J. (2002). Soft evidential update for probabilistic multiagent
systems. International Journal of Approximate Reasoning, vol. 29, no 1, p. 71-106.
Vomlel J. (2004). Probabilistic reasoning with uncertain evidence. Neural Network World,
International Journal on Neural and Mass-Parallel Computing and Information Systems,
vol. 14, no 5, p. 453–465.
Téléchargement