Modéliser un critère par un réseau bayésien : V-structure et observations probabilistes fixes Véronique Delcroix 1 , Ali Ben Mrad 2 1. LAMIH UMR 8201, UVHC Valenciennes, France [email protected] 2. CES université de Sfax, Tinisie [email protected] Cet article propose un système à base de réseaux bayésiens pour fournir des recommandations dans le cadre des problèmes récurrents d’aide à la décision multicritères. Chaque critère de choix est modélisé par une V-structure dans le graphe du RB. Les auteurs mettent en évidence l’intérêt de découper le RB et d’utiliser des observations probabilistes fixes afin de produire le raisonnement attendu. RÉSUMÉ. This paper proposes a system composed of Bayesian networks in order to provide recommendations in recurrent multicriteria decision problems. Each criterion is modeled by a V-structure in the graph of the BN. The authors highlight the interest of cutting the BN and using fixed probabilistic evidence to produce the waited reasoning ABSTRACT. MOTS-CLÉS : observation probabiliste, réseau bayésien, observation de vraisemblance, aide à la décision multicritères KEYWORDS: probabilistic evidence, bayesian network, likelihood evidence, soft evidence,MCDA c 2016 Lavoisier DOI:10.3166/RIA.-.1-18 Revue d’intelligence artificielle – no -/2016, 1-18 2 RIA. Volume - – no -/2016 1. Introduction La modélisation d’un critère est utile dans les problèmes de décision où un ou plusieurs critères de choix doivent être pris en compte. Chaque critère oriente la décision suivant une direction. Dans cet article; nous considérons un critère comme une qualité positive que l’on cherche systématiquement à optimiser. Par exemple, lors du choix d’une voiture, le critère associé au prix est l’adéquation entre le prix de la voiture et le montant disponible, et cette adéquation doit toujours être la meilleure possible. Un critère peut aussi être associé à un risque ou un niveau de gravité. Nous considérons ici les problèmes de décision récurrents et multicritères . La spécificité de ces problèmes est qu’ils concernent tout type de décideurs (Monsieur "tout le monde"). Nous considérons une étape très amont du processus de décision qui vise à aider le décideur à cibler un ensemble d’alternatives potentielles à l’aide d’un système de recommandations sur les caractéristiques les plus pertinentes des alternatives en fonction de son cas de décision. Ce système de recommandation basé sur des réseaux bayésiens est présenté dans (Delcroix et al., 2013). Dans cet article, nous proposons de modéliser chacun des critères de choix à l’aide de trois noeuds formant une V-structure dans un réseau bayésien. Cette structure peut être utilisée pour évaluer une alternative sur un critère dans un cas de décision spécifique, mais aussi pour fournir des recommandations adaptées au cas considéré en vue de satisfaire le critère. Nous expliquons pourquoi l’utilisation de ce type de réseau bayésien en vue de fournir des recommandations sur les alternatives nécessite quelques précautions. En effet, il est nécessaire de limiter la propagation vers les noeuds susceptibles de faire l’objet de recommandation. Pour cela, nous proposons d’utiliser des observations probabilistes afin de fixer les distributions de probabilités des variables non observées qui ne doivent pas faire l’objet d’une recommandation. Ce type d’observation est spécifié par une distribution locale de probabilités sur une variable qui reflète la croyance sur cette variable après propagation de l’information dans le réseau. Le fait d’imposer une distribution de probabilités fixe revient à modifier temporairement le modèle, puisque les a priori sur les variables concernées par les observations probabilistes fixes sont temporairement remplacés. D’un coté, ce type d’observations soulève des critiques dans la communauté des modèles graphiques probabilistes car il ne s’agit pas d’un événement e que l’on peut propager en calculant P (. | e); d’un autre coté, il existe une réelle demande pour ce type d’observations (Bloemeke, 1998 ; Valtorta et al., 2002 ; Baldwin, Tomaso, 2003 ; Arsene et al., 2015). Dans la partie suivante, nous introduisons les problèmes récurrents d’aide à la décision multicritères, et nous expliquons leur spécificité. Puis dans la partie 3, nous présentons la modélisation d’un critère à l’aide d’une V-structure et son utilisation pour évaluer et pour recommander. Nous expliquons et illustrons les problèmes rencontrés pour fournir des recommandations sur les alternatives en utilisant le RB de façon classique. La partie 4 concerne la solution proposée avec des observations probabilistes fixes et les résultats obtenus sur un exemple jouet d’aide à la décision multicritère. Modèle d’un critère dans un RB 3 2. Problème récurrent d’aide à la décision multi-critères 2.1. Présentation Un problème de décision récurrent est un problème de décision qui est répété plusieurs fois dans des contextes différents et avec différents acteurs, mais toujours avec le même type d’alternatives et les mêmes critères de choix. Les problèmes de décision récurrents sont caractérisés par le fait qu’ils concernent tout type de décideur. En effet, chaque occurrence de la décision implique un ensemble d’acteurs différents avec leur contraintes propres, et dans un contexte spécifique. L’importance de chaque critère et l’évaluation d’une alternative en fonction d’un critère donné dépendent de chaque cas de décision. Ces problèmes sont aussi caractérisés par l’absence possible d’un expert, capable d’évaluer une alternative sur un critère ainsi que l’importance des critères qui dépend de chaque cas de décision, ce qui rend plus utile encore d’apporter de l’aide au décideur(s). Nous considérons les problèmes multi-attributs dans lesquels les alternatives sont caractérisées par un ensemble d’attributs fixes. F IGURE 1. Exemples de paramètres intervenant dans le choix d’un véhicule La figure 1 montre quelques uns des paramètres qui entrent en jeu lorsqu’une personne choisit une voiture. Les réseaux bayésiens sont bien adaptés pour la modélisation des problèmes récurrents de décision car ils permettent de représenter et de raisonner avec l’incertitude et d’apporter au décideur une information et des recommandations adaptées à son cas. 2.2. Spécificité des problèmes récurrents d’aide à la décision multicritère Les problèmes et les méthodes d’aide à la décision multicritère (ADMC) représentent un champs de recherche déjà bien étudié. Nous expliquons ci-dessous pourquoi ces méthodes ne sont pas adaptées aux problèmes récurrents d’ADMC que nous abordons, de même que d’autres outils d’aide à la décision comme les diagrammes d’influences. Un premier élément à considérer concerne le décideur. Dans les problèmes de décision récurrents, le décideur est parfois "ignorant" et n’est pas toujours accompagné 4 RIA. Volume - – no -/2016 d’un spécialiste. De ce fait, il ne peut être sollicité de façon importante et systématique sur des questions qui requièrent de l’expertise. Au contraire, les méthodes multicritères reposent sur l’idée d’utiliser les préférences du décideur pour différencier les solutions et l’aider dans le processus de décision. Dans notre approche, le décideur n’est sollicité que pour fournir des informations sur les éléments concernant son cas de décision et qui peuvent entrer en jeu dans la décision : ses caractéristiques, ses contraintes, ses besoins, le contexte, etc.; en revanche il n’a pas à donner ses préférences en termes de comparaison d’alternatives relativement à des critères, ce qui peut demander une certaine expertise. Dans notre exemple très simplifié sur le choix d’une voiture, tous les acheteurs ne sont pas capables de classer deux voitures données en termes de satisfaction relativement à l’accélération, ou sur d’autres critères comme par exemple ceux qui impactent sur le type de carburant. Deuxièmement, la plupart des méthodes d’ADMC supposent que l’on dispose a priori d’une liste de solutions potentielles de taille "raisonnable". Notre proposition se situe plus en amont dans le processus de choix et ne nécessite pas que le décideur ait dès le départ une liste d’alternatives. Au contraire, les recommandations sur les caractéristiques des alternatives fournies par notre approche peuvent constituer un point de départ pour établir une telle liste d’alternatives. Concrètement dans notre exemple, une personne désireuse de choisir une voiture pourrait dans un premier temps obtenir des recommandations sur les caractéristiques d’un véhicule adapté à ses besoins grâce à notre proposition; puis tirer parti de ces recommandations pour établir une liste de véhicules pertinents pour son cas; et enfin, exploiter une méthode d’ADMC pour classer ces véhicules, ou sélectionner le ou les meilleurs. D’autres modèles graphiques probabilistes, dont les diagrammes d’influence sont dédiés à l’aide à la décision. Ces modèles permettent de traiter des problèmes de décision séquentiels, dans lesquels chaque décision comporte un nombre limité d’alternatives. Dans les problèmes de décision récurrents que nous traitons, la liste des alternatives n’est pas connue a priori. Dans notre exemple sur le problème récurrent de l’aide au choix d’une voiture, un noeud de décision d’un diagramme d’influence pourrait comporter une liste de voitures réelles, dont toutes les caractéristiques seraient connues (options, etc). S’il s’agit d’une liste commune à tous les cas de décision, sa taille est immense; et si elle est spécifique à chaque cas de décision, c’est un travail préalable qui est demandé au décideur, or notre proposition vise au contraire à aider à obtenir une telle liste restreinte et spécifique. Une autre approche pourrait considérer le choix des valeurs des caractéristiques des alternatives comme autant d’étapes dans la décision. Cependant, les diagrammes d’influence imposent de déterminer un ordre fixe sur les décisions, ce qui n’est pas pertinent pour le choix des caractéristiques des alternatives (par exemple le type de voiture, puis la marque, etc.). La comparaison des réseaux bayésiens et des diagrammes d’influence pour les problèmes récurrents d’ADMC a été discutée dans (Sedki, Delcroix, 2012). En résumé, notre approche se situe à une phase très amont du processus de décision pour des problèmes d’ADMC récurrents, en vue de fournir des recommandations sur Modèle d’un critère dans un RB 5 les caractéristiques des alternatives qui soient adaptés à la spécificité de chaque cas de décision. Cet ensemble de recommandations peut ensuite être utilisé pour sélectionner un sous-ensemble d’alternatives de taille raisonnable qui constitue le point de départ de l’étape suivante du processus de décision. 3. Principe du réseau bayésien pour les problèmes récurrents d’aide à la décision multicritères : structure du graphe et utilisation L’idée d’utiliser une V-structure pour modéliser un critère dans un réseau bayésien (RB) n’est pas nouvelle (Fenton, Neil, 2001 ; Leicester et al., 2013), mais elle n’est pas clairement formalisée. 3.1. Modélisation d’un critère de décision par une V-structure dans un RB Le principe de la V-structure pour représenter un critère est représenté sur la figure 2 : un noeud sans enfants représente l’indice de satisfaction du critère. Il peut aussi représenter un degré d’adéquation entre une contrainte liée au cas de décision et une caractéristique (directe ou dérivée) de l’alternative. Cet indice est une valeur entre 0 et 1 où 1 représente une satisfaction maximale du critère. Pour des raisons de facilité, nous représentons cet indice dans pyAgrum par une variable “quasi continue”, c’est à dire une variable entière variant dans un intervalle. Nous avons choisi l’intervalle [1,10] car il faut faire un compromis entre précision et taille du modèle. De ce fait, les variables satAcceleration et adeqPrix de notre exemple représentent l’indice de satisfaction multiplié par 10. Le degré de satisfaction d’un critère dépend d’une part des caractéristiques de l’alternative, et d’autre part de l’importance de ce critère ou de contraintes spécifiques à chaque cas de décision. Ces facteurs sont représentés par les deux noeuds parents de la V-structure. Le parent représenté à gauche concerne le cas de décision et nous l’appellerons parfois le parent gauche. Ces deux noeuds parents peuvent être des indices, comme ci-dessous pour le critère accélération, ou l’importance et l’indice sont des valeurs dans [0,10], ou bien des grandeurs de même unité, comme le prix du véhicule et le montant disponible. F IGURE 2. V-structure pour modéliser un critère dans le graphe du réseau bayésien 6 RIA. Volume - – no -/2016 F IGURE 3. Exemple jouet : RB modélisant les critères d’adéquation du prix et de satisfaction en terme d’accélération lors du choix d’un véhicule La figure 3 illustre la modélisation de deux critères dans le problème du choix d’une voiture: d’une part l’adéquation entre le prix de la voiture et le montant disponible pour l’acheteur, d’autre part, la satisfaction en termes d’accélération de la voiture. Ce RB jouet est utilisé pour illustrer cet article mais il est entièrement imaginé, et ne reflète pas des données réelles. A ce stade, notons une remarque importante sur le vocabulaire : il est fréquent de confondre les caractéristiques des alternatives et les critères. Par exemple, on dit parfois que le prix est un critère de choix. Dans cet article, nous distinguons clairement ces deux notions : d’un coté le prix, qui est une caractéristique d’une voiture; de l’autre le critère de choix associé au prix, qui représente le niveau d’adéquation entre le montant disponible pour l’acheteur et le prix du véhicule. Un même prix est plus ou moins satisfaisant selon l’acheteur, et il est faux de dire que le prix le plus bas est toujours le plus satisfaisant. Ainsi, lors d’une décision, l’objectif est de satisfaire au mieux chacun des critères. Cela se traduit dans la V-structure par le fait que le niveau d’adéquation (ou de satisfaction) d’un critère doit être le plus élevé possible, même pour un critère peu important. Voici la présentation rapide des 6 noeuds qui constituent les deux V-structures des deux critères: Critère associé au prix : le montant disponible pour acheter une voiture dépend de l’age et du niveau de vie de l’acheteur; le prix du véhicule dépend du rapport poids/puissance (en kg/cv); l’adéquation en termes de prix est maximale lorsque le prix du véhicule et le montant disponible sont égaux, et nulle si la valeur absolue de la différence entre le prix de la voiture et le montant disponible dépasse les deux tiers du montant disponible. Ce noeud n’est pas déterministe. Critère associé à l’accélération de la voiture : l’importance que le véhicule ait une forte accélération dépend uniquement du sexe de l’acheteur; l’indice d’accélé- Modèle d’un critère dans un RB 7 ration dépend uniquement (et de façon déterministe) du rapport poids/puissance du véhicule; la satisfaction en termes d’accélération dépend de l’importance du critère (imp) pour l’acheteur et de son évaluation pour une alternative (g). Nous définissons la satisfaction (sat), par sat = g imp , où les trois variables sat, g et imp sont des indices entre 0 et 1. Cette définition donne une satisfaction maximale lorsque l’importance du critère est nulle (dans certains cas, l’accélération n’est pas un critère de choix); à l’inverse, le niveau de safisfaction est égal à l’indice d’évaluation du critère lorsque l’importance est maximale (égale à 1). Dans notre exemple, nous utilisons des variables entières dans [0,10] qui représentent dix fois l’indice. Cet exemple a été implémenté avec la bibliothèque pyAgrum 1 ; l’ensemble des tests a été réalisé via les notebook de pythonXY 2 3.2. Première utilisation du RB : évaluation des critères Il s’agit d’évaluer une alternative (ou un sous-ensemble d’alternatives) sur un critère, pour un cas de décision (ou un type d’acheteur). Voici les entrées/sorties du réseau bayésien pour évaluer chacun des critères : Entrées (observation) : le cas de décision et l’alternative, chacun étant décrits par un sous-ensemble de caractéristiques observées. Sorties (variable cible) : le degré de satisfaction ou d’adéquation du critère. Dans la suite de cet article, nous considérons deux acheteurs potentiels pour nos tests : Lucas : jeune homme de 20 ans, d’un faible niveau de vie (trait plein). Lili : dame de 60 ans, au niveau de vie moyen (trait pointillé). Nous considérons aussi trois sous-ensembles de voitures, définis suivant une seule caractéristique : le rapport entre le poids de la voiture en kg et sa puissance en cv. Ce rapport poids/puissance est un indicateur direct de la capacité d’accélération d’une voiture : un rapport faible indique une excellente reprise (par exemple un rapport de 4 kg/ch pour la porshe 911 GT3) alors qu’un rapport plus élevé indique une accélération moins rapide (par exemple un rapport de 40 kg/ch pour la 2cv). Ce rapport est aussi fortement lié au prix du véhicule (globalement, plus le rapport poids/puissance est petit, plus la voiture est chère). La figure 4 montre l’évaluation du critère lié à l’accélération pour trois type de véhicules et nos deux personnes. Les courbes de gauche montre l’évaluation du niveau d’importance de l’accélération pour deux personnages à partir des observations sur les variables âge, sexe et niveau de vie. Ce critère est (probablement) important ou très 1. https://forge.lip6.fr/projects/pyagrum 2. avec l’aide de Pierre-Henri Wuillemin, que nous remercions chaleureusement! 8 RIA. Volume - – no -/2016 F IGURE 4. Evaluation de trois types de véhicules pour deux personnes sur le critère de l’accélération. Cas 1 : observations directes sur le décideur (âge, sexe, niveau de vie) F IGURE 5. Evaluation de trois types de véhicules pour deux personnes sur le critère de l’accélération. Cas 2 : observation supplémentaire sur l’importance de l’accélération (obs. de vraisemblance) important pour Lucas, alors qu’il l’est (probablement) moins pour Lili. Les courbes de droite représentent les distributions de probabilités a posteriori de l’indice d’accélération et du niveau de satisfaction en termes d’accélération pour six configurations possibles (3 voitures et 2 personnes). Globalement, le niveau de satisfaction est plus élevé pour Lili, puisque ce critère est moins important pour elle. La voiture avec le rapport poids/puissance = 4 procure un niveau de satisfaction excellent quel que soit l’acheteur. La figure 5 montre l’évaluation du critère lié à l’accélération avec les observations utilisées pour la figure 4 et des observations supplémentaires sur le montant disponible pour l’achat de la voiture et l’importance du critère accélération. Pour cette dernière, on utilise ici une observation de vraissemblance. Rappelons que cette variable est un indice entre 0 et 10; pour Lucas par exemple, l’observation est décrite par le vecteur Modèle d’un critère dans un RB 9 [0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1] qui traduit le fait que l’importance du critère accélération est "importante ou très importante". Du fait qu’il y a moins d’incertitude sur le niveau d’importance, on constate sur les courbes de droite que l’évaluation du niveau de satisfaction est aussi plus précis. F IGURE 6. Evaluation en termes de prix pour trois types de véhicules et deux personnes. Cas 1 : obsrvations directes sur la personne (âge, sexe, niveau de vie) Les figures 6 et 7 montrent l’évaluation du critère associé au prix pour trois type de voiture et deux personnes. Dans le premier cas (figure 7), les observations portent sur l’age, le sexe et le niveau de vie pour les acheteur, et sur le rapport poids/puissance pour les voitures. Dans le second cas (figure 6), les observations sont identiques, avec en plus une précision sur le montant disponible. Dans les deux figures, les courbes en haut à gauche et à droite indiquent respectivement les distributions de probabilités sur le montant disponible et le prix des voitures; et les courbes du bas montrent les distributions de probabilités a posteriori du niveau d’adéquation du prix pour nos deux personnes, Lucas et Lili, pour chaque type de voiture considéré. Pour Lucas, une voiture avec un rapport poids/puissance = 12 a plus de chance d’être satisfaisant en termes de prix qu’une voiture de rapport 8; et une voiture avec un rapport poids puissance de 4 n’a aucune chance d’être satisfaisante en termes de prix pour ce jeune homme. En revanche, pour Lili, c’est une voiture avec un rapport poids puissance de 8 qui offre le plus de chances d’une bonne satisfaction en termes de prix, devant les voitures avec un rapport de 12. Par ailleurs, certaines des voitures avec un rapport poids/puissance = 4 peuvent offrir une satisfaction moyenne en termes de prix pour Lili. 10 RIA. Volume - – no -/2016 F IGURE 7. Evaluation en termes de prix pour trois types de véhicules et deux personnes. Cas 2 : observation supplémentaire sur le montant disponible 3.3. Seconde utilisation : la recommandation Le contexte est celui d’une personne donnée (connue) qui souhaite choisir une voiture de façon à satisfaire un ensemble de critères (ici deux). L’objectif est de fournir à cette personne des recommandations ciblées sur les caractéristiques d’une voiture qui lui permettra le plus probablement de satisfaire tous les critères. L’idée est de se projeter dans une situation idéale, où la personne serait effectivement satisfaite sur tous les critères et de voir, grâce à l’inférence, quelles sont les caractéristiques de cette voiture qui "expliquent" cette satisfaction. Dans cet objectif, on propage dans le RB une satisfaction maximale sur les deux criteres de choix, ainsi que les observations sur la personne, et on regarde les probabilités a posteriori sur les caractéristiques de la voiture. Voici les entrées/sorties du réseau bayésien pour obtenir des recommandations afin de satisfaire un critère : Entrées (observation) : le cas de décision décrit par un sous-ensemble de caractéristiques observées et un niveau de satisfaction élevé des critères. Sorties (variable cible) : caractéristiques d’une alternative. Cependant, nous allons voir ci-dessous que ce mécanisme ne suffit pas pour effectivement produire des recommandations pertinentes sur les alternatives. Modèle d’un critère dans un RB 11 F IGURE 8. Distributions de probabilité a posteriori sur deux caractéristiques du véhicule après propagation d’un niveau de satisfaction élevé des deux critères et des observations sur l’acheteur. En haut : les observations sur le décideur sont l’age, le sexe et le niveau de vie. En bas : deux observations supplémentaires sur le montant disponible et l’importance de l’accélération. 3.4. Le problème des recommandations avec des observations incomplètes Considérons l’exemple de la figure 8 pour illustrer le fait qu’il ne suffit pas de propager une exigence de satisfaction sur les critères et les observations sur l’acheteur pour obtenir des recommandations pertinentes sur un véhicule en vue de l’acheter. Dans l’exemple de la figure 8, on propage les observations directes sur l’acheteur (age, sexe et niveau de vie) et un niveau de satisfaction maximal pour les deux critères (adeqPrix = 10 et satAcceleration = 10). Ces observations forment le premier cas (partie haute du graphe). Dans le second cas (partie basse du graphe), on ajoute deux observations supplémentaires sur le montant disponible et l’importance du critère accélération, c’est à dire sur le parent direct de chaque critère coté décideur. Observons les probabilités a posteriori sur les caractéristiques de la voiture : la distribution de probabilité a posteriori est très différente dans les deux configurations (en haut et en bas). Pourquoi cette explication est-elle si différente avec et sans observation sur le parent direct du critère coté décideur (montant disponible et importance de l’accélération) ? Alors que les observations ajoutées sur le montant disponible et l’importance du critère accélération ne font que préciser des variables qui dépendent des observations directes de l’acheteur. Dans les deux cas, le résultat de l’inférence correspond à l’explication la plus probable d’une situation où une personne connue est très satisfaite par un type de voiture sur les deux critères du prix et de l’accélération. Mais cette explication ne correspond pas au raisonnement souhaité, qui vise à donner des recommandations sur le véhicule, sans remettre en cause les caractéristiques non observées de l’acheteur. 12 RIA. Volume - – no -/2016 Le raisonnement souhaité est une sorte de projection dans laquelle : – on a un ensemble d’observations concernant un cas de décision : le décideur (et son contexte, environnement, ...) – on a un niveau élevé de satisfaction des critères – on s’interdit de modifier les variables concernant la personne, son environnement, contexte etc. – on cherche quelles valeurs des caractéristiques de l’alternative expliquent le mieux ce bon degré de satisfaction. Ce modèle de raisonnement ne peut être obtenu par un RB tel que celui ci-dessus avec des observations classiques (ou des observations de vraisemblance). En effet, dans ce cas, nous avons vu que l’inférence conduit à faire des "recommandations" sur les caractéristiques non observées de la personne, ce qui n’est pas le but. 4. Solution proposée : utiliser des observations probabilistes La première intuition consiste à découper le RB au niveau des noeuds des critères et à procéder comme suit: (1) évaluer les parents directs de chaque critère coté décideur (2) ne conserver qu’une seule valeur (la plus probable), au lieu de conserver la distribution de probabilité obtenue (3) propager l’exigence de satisfaction des critères avec les valeurs obtenues dans le reste du RB. Lors de l’étape (2), il faut noter qu’on ne peut pas utiliser une observation de vraisemblance pour les noeuds d’importance des critères car elle serait ensuite modifiée par la propagation de la satisfaction max du critère, ce qui n’est pas le but puisque la recommandation ne doit porter que sur les alternatives, et non sur le décideur (ou le cas de décision). Afin d’éviter la perte d’information qui consiste à ne retenir qu’une seule valeur, nous proposons d’utiliser des observations probabilistes fixes qui permettent de maintenir fixes un ensemble de distributions de probabilités locales lors de la propagation. 4.1. Les observations probabilistes La question des observations incertaines dans les RBs a déjà été abordé souvent dans la littérature, et on identifie deux ou trois types d’observations incertaines (Dubois et al., 1998 ; Valtorta et al., 2002 ; Vomlel, 2004 ; Chan, Darwiche, 2005 ; Benferhat, Tabia, 2012). Cependant, le sujet n’est pas consensuel comme en témoigne la diversité du vocabulaire, et le fait que nombre de logiciels et bibliothèques sur les RB ne proposent qu’un seul type d’observations incertaines (Mrad et al., 2015). Les observations incertaines les plus connues sont les observations de vraisemblance (likelihood evidence, ou virtual evidence) introduites par Pearl. Ces dernières sont propagées en modifiant temporairement le graphe du RB par l’ajout d’un noeud qui représente l’observation faite. L’observation est spécifiée par sa vraisemblance en fonction du noeud parent. Modèle d’un critère dans un RB 13 Nous utilisons un autre type d’observation incertaine, identifié dès 1998 (Dubois et al., 1998 ; Bloemeke, 1998), et que nous appelons observations probabilistes (nommées soft evidence par Valtorta et ses co-auteurs). Une observation probabiliste sur une variable X dans un réseau bayésien est spécifiée par une distribution locale de probabilités R(X) qui définit l’état des croyances sur la variable X après que cette information ait été propagée. Une observation probabiliste est fixe lorsque la distribution de probabilités R(X) ne peut pas être modifiée par la propagation d’autres observations. Elle est dite non fixe dans le cas contraire. La différence entre les observations probabilistes fixes et non fixes apparait lorsqu’on propage successivement plusieurs observations probabilistes. La propagation d’une seule observation probabiliste R(X) sur une variable X se fait facilement en convertissant l’observation en un rapport de vraisemblance L(X) = R(X)/P (X) où P (X) est la distribution de probabilité a priori de X, puis en propageant L(X) comme une observation de vraisemblance par la méthode de l’observation virtuelle de Pearl. cette méthode ne peut être utilisée pour propager plusieurs observations probabilistes fixes car alors elles ne restent pas fixes (Chan, Darwiche, 2005). Plusieurs algorithmes ont été proposés pour propager un ensemble d’observations probabilistes dans un RB(Peng et al., 2010 ; 2012 ; Mrad, 2015 ; Mrad et al., 2015). Nous avons implémenté l’algorithme BN-IPFP1 (Pan et al., 2006) qui permet de propager dans un réseau bayésien un ensemble d’observations probabilistes non contradictoires 3 4 . Cet algorithme propage à tour de rôle chaque observations en la convertissant en observations de vraisemblance, et ce jusqu’à obtenir une distribution qui satisfasse toutes les observations probabilistes demandées. On peut noter que les observations classiques sont des cas particuliers d’observations probabilistes, alors que les observations de vraisemblance ne le sont pas. 4.2. Recommandations à l’aide d’observations probabilistes L’objectif est de fournir des recommandations sur les caractéristiques des alternatives afin de satisfaire au mieux un ensemble de critères pour un cas de décision donné par un ensemble d’observations. Pour cela, on fixe la satisfaction des critères dans un intervalle élevé (par exemple entre 7 et 10), et on empêche que la propagation de ces exigences ne modifie les variables non observées du cas de décision. Cela est 3. Notons X l’ensemble des variables d’un RB (G, P ), X l’ensemble des variables associées aux noeuds du RB et R(Y1 ), . . . , R(Yr ) un ensemble d’observations probabilistes avec {Y1 , . . . , Yr } ⊂ X; on dit que ces observations probabilistes sont cohérentes, ou non contradictoires (consistent en anglais) s’il existe une distribution de probabilités Q(X) dont les probabilités marginales sur Yi coïncident avec R(Yi ), c’est à dire Q(Yi ) = R(Yi ) pour i = 1, . . . , r (Peng et al., 2010, p. 543). 4. si de plus, chaque distribution locale R(Yi ) domine P (Yi ) (P (Yi ) << R(Yi )), alors l’algorithme BNIPFP1 converge (Peng et al., 2010, p. 543). Par définition, P (Y ) << R(Y ) si {y | P (y) > 0} ⊂ {y | R(y) > 0}. 14 RIA. Volume - – no -/2016 assuré en propageant une observation probabiliste pour le parent gauche (coté cas de décision) de chaque critère. Ainsi, dans notre exemple, on impose que la distribution de probabilités du montant disponible et celle de l’importance du critère accélération restent fixes lorsqu’on propage l’exigence de satisfaction des deux critères. F IGURE 9. Distributions de probabilités du montant disponible et de l’importance du critère accélération que l’on veut garder fixe lors de la propagation de l’exigence de satisfaction des critères en vue de fournir des recommandations sur le véhicule La figure 9 montre les distributions des observations probabilistes sur les parents directs des deux critères. Ces distributions ont été obtenues en propageant les observations (âge, sexe et niveau de vie). Cette méthode permet aussi de pallier les cas où on ne dispose pas de toutes les caractéristiques directes du cas de décision, ce qui est fréquent. F IGURE 10. Comparaison du montant disponible et de l’importance du critère accélération a priori et après propagation de la satisfaction des critères et des observations directes sur le décideur (âge, sexe, niveau de vie). La figure 10 correspond à la propagation d’une satisfaction élevée pour les deux critères pour deux personnes connue (age, sex, niveau de vie) avec des observations classiques (on ne fixe aucune distribution de probabilité). Le montant disponible et l’importance du critère accélération sont fortement modifié par rapport à leur valeur a priori (traits gris). Modèle d’un critère dans un RB 15 Considérons par exemple les courbes en traits plein sur la partie gauche de la figure : la courbe en gris représente l’estimation du montant disponible pour Lucas (jeune homme de 20 ans avec un faible niveau de vie); la propagation d’une satisfaction maximale des deux critères pour cette personne conduit à une explication bien naturelle : le montant disponible de Lucas est en fait plus élevé et l’importance du critère accélération est plus faible que celle estimée a priori. C’est pour éviter cela que les distributions de probabilité de ces deux variables doivent être maintenues fixes en les définissant comme des observations probabilistes fixes. F IGURE 11. Recommandations sur les caractéristiques d’un véhicule en maintenant fixe le montant disponible et l’importance de l’accélération (traits noirs) et comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 1 : le niveau de satisfaction des critères est 10 (sur 10) F IGURE 12. Recommandations sur les caractéristiques d’un véhicule en maintenant fixe le montant disponible et l’importance de l’accélération (traits noirs) et comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 2 : le niveau de satisfaction des critères est entre 7 et 10 (sur 10) Les figures 11 et 12 montrent les recommandations sur le rapport poids/puissance et sur le prix pour nos deux personnages en utilisant des observations probabilistes 16 RIA. Volume - – no -/2016 fixes pour le montant disponible et l’importance du critère accélération lors de la propagation d’une satisfaction élevée pour les deux critères. Dans la figure 11, l’exigence de satisfaction est traduite par la valeur maximale 10 pour chacun des critères. Dans la figure 12, l’exigence de satisfaction est traduite par une observation probabiliste donnée par le vecteur [0, 0, 0, 0, 0, 0, 0, 0.5, 0.5, 1, 1] (avant normalisation), ce qui traduit une satisfaction bonne ou très bonne. Ce second test figure 12 conduit à une recommandation plus réaliste. Les recommandations pour Lucas (traits plein et noir) donnent une fourchette de prix précis (8000 à 9000 euros, mais éventuellement plus) et un rapport poids/puissance entre 4 et 9, en excluant toute voiture avec un rapport poids/puissance supérieur à 10. Il est clair que Lucas n’a que peu de choix, car ses exigences sont contradictoires. Ces deux seuls critères réduisent considérablement l’ensemble des voitures possibles. Les recommandations pour Lili (trait pointillés et noirs) donne une large fourchette de prix, autour de 20 K euros et un rapport poids/puissancce de préférence entre 6 et 8. Les recommandations pour Lili sont beaucoup plus larges, et laissent la place à l’ajout de nombreux autres critères pour affiner son choix ! Les courbes en gris correspondent au résultat de l’inférence avec des observations classiques et ne constituent pas des recommandations! 5. Conclusion et perspectives Dans cet article, nous avons utilisé un exemple jouet pour illustrer la modélisation d’un problème récurrent d’aide à la décision multicritère à l’aide d’un réseau bayésien. Nous avons expliqué comment modéliser chaque critère de choix à l’aide de trois noeuds : (1) le parent gauche représente la synthèse des facteurs du cas de décision impliqués dans ce critère, (2) le parent droit représente l’évaluation d’une alternative pour ce critère, et (3) le noeud fils de la V-structure représente le niveau de satisfaction du critère ou degré d’adéquation dans le cas d’une contrainte. Nous avons illustré comment ce modèle permet d’évaluer chacun des critères dans un cas donné. Enfin, nous avons expliqué et illustré le fait que l’inférence avec des observations classiques ne permet pas de produire des recommandations sur les alternatives pertinentes pour un cas de décision donné. En effet, la propagation d’une exigence de satisfaction des critères fourni une explication qui inclut les noeuds non observés du coté du cas de décision, alors que la recommandation ne doit concerner que les caractéristiques des alternatives. Nous avons proposé une solution à l’aide d’observations probabilistes fixes qui interdit la modification des distributions de probabilités des variables ainsi "observées". La définition d’observation probabilistes fixes sur les parents gauche de chaque critère permet de cibler la propagation vers le parent droit (coté alternative). Notons qu’il est nécessaire de définir des observations probabilistes fixes sur les parents directs de chaque critère, coté décideur, et non pas seulement sur les variables non observées. En effet, l’ensemble des noeuds non observés est susceptible d’être impacté par la propagation de la satisfaction des critères, modifiant ainsi l’impact sur les variables pour lesquelles on attend la recommandation. Modèle d’un critère dans un RB 17 A l’avenir, de nombreuses questions concernant les observations probabilistes et le systèmes de recommandations restent à creuser. En particulier, les observations probabilistes fixes sont parfois qualifiées de "non bayésiennes", dans la mesure où le modèle de base est remis en cause. Nous espérons que cet article aide à convaincre de la pertinence et de l’interet de cette technique! Il faut cependant rendre plus claires les hypothèses qui sont remises en cause par l’utilisation d’observations probabilistes fixes. Une étude plus complète sur les observations probabilistes reste à mener, en particulier sur les algorithmes de propagation de ces observations (convergence, complexité, observations contradictoires, mais aussi sur la d-séparation, sur la cohabitation de différents types d’observations incertaines, etc.). A court terme, une perspective directe de cet article concerne la question du découpage du réseau en plusieurs entités. Le modèle distribué correspondant a été proposé (Bloemeke, 1998) sous le terme d’"Agent Encapsulated Bayesian Network". Le modèle que nous proposons pour l’aide à la décision multicritères contient plusieurs entités naturelles : le décideur, le contexte, les alternatives, et les modules (ou agents) au centre correspondant aux critères. Ce modèle distribué doit maintenant être implémenté, testé et comparé à d’autres. Remerciements Nous remercions pour ce travail les auteurs de la bibliothèque pyAgrum, et en particulier Pierre-Henri Wuillemin, pour son aide toujours rapide et efficace concernant le développement. Bibliographie Arsene O., Dumitrache I., Mihu I. (2015). Expert system for medicine diagnosis using software agents. Expert Syst. Appl., vol. 42, no 4, p. 1825–1834. Baldwin J. F., Tomaso E. D. (2003). Inference and learning in fuzzy bayesian networks. In The 12th IEEE international conference on fuzzy systems, FUZZ-IEEE 2003, st. louis, missouri, usa, 25-28 may 2003, p. 630–635. Benferhat S., Tabia K. (2012). Inference in possibilistic network classifiers under uncertain observations. Annals of Mathematics and Artificial Intelligence, vol. 64, no 2-3, p. 269309. Bloemeke M. (1998). Agent encapsulated Bayesian networks. Ph.d. thesis, Department of Computer Science, University of South Carolina. Chan H., Darwiche A. (2005). On the revision of probabilistic beliefs using uncertain evidence. Artificial Intelligence, vol. 163, no 1, p. 67-90. Delcroix V., Sedki K., Lepoutre F. X. (2013). A Bayesian network for recurrent multi-criteria and multi-attribute decision problems: Choosing a manual wheelchair. Expert Systems with Applications, vol. 40, no 7, p. 2541-2551. Dubois D., Moral S., Prade H. (1998). Belief change rules in ordinal and numerical uncertainty theories. In D. Gabbay, P. Smets (Eds.), Belief change, (d. dubois, h. prade, eds.), vol. 3 18 RIA. Volume - – no -/2016 of the handbook of defeasible reasoning and uncertainty management systems, p. 311-392. Dordrecht, Kluwer Academic Publishers. Fenton N., Neil M. (2001). Making decisions: Bayesian nets and mcda. Knowledge-Based Systems, vol. 14, no 7, p. 307–325. Leicester P. A., Goodier C. I., Rowley P. (2013). Using a Bayesian network to evaluate the social, economic and environmental impacts of community renewable energy. In Clean technology for smart cities and buildings (cisbat). Mrad A. B. (2015). Observations probabilistes dans les réseaux bayésiens. Ph.d. thesis, LAMIH, Université de Valenciennes et du hainaut-cambresis, France. Mrad A. B., Delcroix V., Piechowiak S., Leicester P., Abid M. (2015). An explication of uncertain evidence in bayesian networks: likelihood evidence and probabilistic evidence uncertain evidence in bayesian networks. Appl. Intell., vol. 43, no 4, p. 802–824. Pan R., Peng Y., Ding Z. (2006). Belief update in Bayesian networks using uncertain evidence. In Ictai, p. 441-444. Peng Y., Ding Z., Zhang S., Pan R. (2012). Bayesian network revision with probabilistic constraints. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 20, no 3, p. 317-337. Peng Y., Zhang S., Pan R. (2010). Bayesian network reasoning with uncertain evidences. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 18, no 5, p. 539–564. Sedki K., Delcroix V. (2012). A model based on influence diagrams for multi-criteria decisionmaking. International Journal on Artificial Intelligence Tools, vol. 21, no 4. Valtorta M., Kim Y.-G., Vomlel J. (2002). Soft evidential update for probabilistic multiagent systems. International Journal of Approximate Reasoning, vol. 29, no 1, p. 71-106. Vomlel J. (2004). Probabilistic reasoning with uncertain evidence. Neural Network World, International Journal on Neural and Mass-Parallel Computing and Information Systems, vol. 14, no 5, p. 453–465.