Système d'Information Décisionnel et Datawarehouse Système d'Information Décisionnel et Datawarehouse Introduction Avec l'apparition et le développement de phénomènes économiques comme la mondialisation les entreprises évoluent dans un environnement difficile à appréhender. Il en résulte que la prise de décision stratégique ou politique est de plus en plus complexe (augmentation du nombre de paramètres à prendre en compte) et, en même temps, doit intervenir très rapidement pour ne pas laisser le temps aux concurrents de prendre de l'avance. Les nouvelles technologies de l'information permettent de concevoir des systèmes d'information particulièrement performants et novateurs. Avec l'apparition des entrepôts de données (datawarehouse) et des requêteurs tous les utilisateurs peuvent désormais accéder à l'information stratégique. Ceci permet à l'entreprise d'être plus réactive mais pose aussi sans cesse de nouveaux problèmes (problèmes de confidentialité, de compétences pour l'analyse, etc.) Comment, dans l'entreprise, s'organise la prise de décision ? Nous répondrons à cette question en organisant notre réflexion en quatre temps. D'abord nous commencerons par affiner et préciser la problématique en délimitant le champ de la réflexion. Ensuite, nous examinerons les concepts du Datawarehouse et des EIS/SIAD. Pour terminer nous illustrerons nos propos par l'exemple de logiciels proposant des solutions plus ou moins complètes. 1 Problématique générale 1.1 Le système d'information Les entreprises sont désormais confrontées à des problèmes complexes comme la mondialisation ou le passage à l'euro. Ainsi, il ne s'agit plus de découvrir et de se lancer sur de nouveaux marchés. Encore faut-il bien connaître l'environnement dans lequel l'entreprise va évoluer. Pour cela, il faut obtenir des informations de nature technique, juridique, fiscale, politique ou commerciale. L'organisation doit alors être capable d'exploiter efficacement de grandes quantités d'information. -1- Système d'Information Décisionnel et Datawarehouse Figure : La mondialisation des échanges Le système d'information de l'entreprise utilise et produit des informations différentes mais pourtant toujours liées entre elles. Par exemple, les contrôleurs de gestion génèrent des informations à partir des données de vente et de production. Ils traitent ensuite ces données pour aider au pilotage de l'entreprise. Figure : Les différentes données de l'entreprise La qualité et l'exhaustivité des informations sont primordiales pour la direction générale. En effet, à ce niveau, les décideurs sont confrontés à des réalités très complexes ou de nombreux phénomènes se trouvent liés entre eux. Chaque couche du système ci-dessus produit ses propres indicateurs et prend des décisions. Cependant, plus on se trouve haut -2- Système d'Information Décisionnel et Datawarehouse dans la pyramide plus les informations extérieures à l'entreprise vont rentrer en compte et prendre de l'importance. Figure : La prise de décision L'architecture fonctionnelle que nous venons de décrire doit être accompagnée par le système d'information de l'entreprise. Il doit donc être fiable et adaptable, ce qui évidemment est très difficile à obtenir. 1.2 Le décisionnel Le système d'information décisionnel est un ensemble de données organisées de façon spécifique, facilement accessible et appropriées à la prise de décision ou encore une représentation intelligente de ces données au travers d'outils spécialisés. La finalité d'un système décisionnel est le pilotage de l'entreprise. -3- Système d'Information Décisionnel et Datawarehouse Figure : Le décisionnel Les systèmes décisionnels sont dédiés au management de l'entreprise pour l'aider au pilotage de l'activité, et indirectement opérationnels car n'offrant que rarement le moyen d'appliquer les décisions. Ils constituent une synthèse d'informations opérationnelles, internes ou externes, choisies pour leur pertinence et leur transversalité fonctionnelles, et sont basés sur des structures particulières de stockage volumineux (datawarehouse, bases OLAP). Le principal intérêt d'un système décisionnel est d'offrir au décideur une vision transversale de l'entreprise intégrant toutes ses dimensions. Source : La construction du datawarehouse, du datamart au dataweb; Jean-François Goglin; Nouvelles Technologies Informatiques; Ed. HERMES. 1.3 Le décisionnel au sein du système d'information On peut parler de décisionnel lorsque les données de production sont valorisées en informations. Cette valorisation est effective dès que l'on sort du monde de la production. 2 Le Datawarehouse Le Datawarehouse est dorénavant, non seulement une réalité au sein des grandes entreprises, mais aussi un marché pour un nombre croissant d'acteurs : intégrateurs, éditeurs de SGBD ou d'outils spécialisés. Disposer d'une offre dans le domaine décisionnel devient une condition sine qua non pour les acteurs du monde informatique, notamment avec la montée en puissance de l'informatique stratégique, enjeu d'actualité. Car, les sociétés les mieux positionnées sur ce marché bénéficient d'une image forte dans le domaine des applications critiques de l'entreprise. Au couple infocentre-EIS des années 1980 succède une offre décisionnelle qui s'adapte aux nouvelles règles du jeu de l'informatique d'entreprise, et qui en révèle les profondes mutations : système départemental -4- Système d'Information Décisionnel et Datawarehouse intégré dans l'architecture globale du système d'information, outil d'interrogation aisément pris en main par les utilisateurs, baisse des prix... 2.1 Présentation et objectif Le datawarehouse est un entrepôt de données. Il s'agit d'un stockage intermédiaire des données issues des applications de production, dans lesquelles les utilisateurs finaux puisent avec des outils de restitution et d'analyse. Voici une définition énoncée par Bill Inmon. «Un datawarehouse est une collection de données thématiques, intégrées, non volatiles et historisées pour la prise de décisions». Orientées sujet Le datawarehouse est organisé autour des sujets majeurs et des métiers de l'entreprise. Les données sont organisées par thème. L'intérêt de cette organisation réside dans le fait qu'il devient possible de réaliser des analyses sur des sujets transversaux aux structures fonctionnelles et organisationnelles de l'entreprise. Cette orientation permet également de faire des analyses par itération, sujet après sujet. L'intégration dans une structure unique est indispensable pour éviter aux données concernées par plusieurs sujet d'être dupliqué. Cependant dans la pratique il existe également des datamarts. Le datawarehouse est fragmenté en plusieurs bases qui supportent l'orientation sujet. Données intégrées Un datawarehouse est un projet d'entreprise. Il concerne les différents services et métiers de l'entreprise. Avant d'être intégrées dans le datawarehouse, les données doivent êtres mises en forme et unifiées afin d'avoir un état cohérent. L'intégration nécessite une forte normalisation, une bonne gestion des référentiels et de la cohérence, une parfaite maîtrise de la sémantique et des règles de gestion s'appliquant aux données manipulées. C'est ainsi que l'on pourra donner une bonne vision de l'entreprise via l'utilisation d'indicateurs. Données historisées L'historisation est nécessaire pour suivre dans le temps l'évolution des différentes valeurs des indicateurs à analyser. Ainsi, un référentiel temps doit être associé aux données afin de permettre l'identification dans la durée de valeurs précises. Données non volatiles -5- Système d'Information Décisionnel et Datawarehouse Afin de conserver la traçabilité des informations et des décisions prises, les informations stockées au sein du datawarehouse ne peuvent pas être supprimées. Une requête lancée à différentes dates sur les mêmes données doit toujours retourner les mêmes résultats. Une donnée introduite dans le datawarehouse ne pourra donc plus être supprimée ni même modifiée. Dans le cas présent les données ne sont pas volatiles. Figure : Schéma de principe d'un datawarehouse (source Jean-François Goglin) Le datawarehouse est donc une sorte de point focal stockant en un point unique toute l'information utile provenant des systèmes de production et des sources externes. Avant d'être intégré dans le datawarehouse l'information doit être extraite des bases propriétaires et «nettoyée». Ensuite, elle doit être mise en forme de manière à devenir compréhensible par l'utilisateur final. 2.2 La structure du datawarehouse -6- Système d'Information Décisionnel et Datawarehouse Figure : La structure du datawarehouse (source EDS-Prométhéus) Un datawarehouse peut se structurer en quatre classes de données, organisées selon un axe historique et un axe de synthèse. Les données détaillées Elles reflètent les événements les plus récents. Les intégrations régulières des données issues des systèmes de production vont habituellement être réalisées à ce niveau. Les données agrégées Elles correspondent à des éléments d’analyse représentatifs des besoins utilisateurs. Elles constituent déjà un résultat d’analyse et une synthèse de l’information contenue dans le système décisionnel, et doivent être facilement accessibles et compréhensibles. Les métadonnées Très souvent les données à fédérer dans le datawarehouse proviennent de sources très hétérogènes. Cela rend indispensable la présence d'un dictionnaire unique qui sait gérer l'ensemble des fonctions du datawarehouse. Cette cohérence du dictionnaire est décrite au sein des métadonnées du dictionnaire du datawarehouse. Les métadonnées constituent l'ensemble des données qui décrivent des règles ou process attachés à d'autres données. Ces dernières constituent la finalité du système d'information. -7- Système d'Information Décisionnel et Datawarehouse Les données historisés Chaque nouvelle insertion de données provenant du système de production ne détruit pas les anciennes valeurs, mais créée une nouvelle occurrence de la donnée. 3 Les éléments du système d'information décisionnel 3.1 Système d'alimentation / ETL 3.2.1 Principes et objectifs Le système d'alimentation à pour but de transformer les données primaires (par exemple issues des systèmes de production) en informations stockées dans le Datawarehouse. Pour cela il est nécessaire de réaliser les fonctions suivantes : Recherche Contrôle - Chargement et de qualité identification (épuration des et données validation) Extraction Transport Figure : Le système d'alimentation La phase d'identification et d'épuration des données consiste à définir et identifier la donnée la plus pertinente en fonction de sa source. La phase de transformation regroupe les opérations de mise au format nécessaires des données, de calcul des données secondaires et de fusion ou d'éclatement des informations composites. Enfin la phase de chargement à pour rôle de stocker les informations de manière correcte dans les tables de faits du datawarehouse. -8- Système d'Information Décisionnel et Datawarehouse 3.3 Système de diffusion et de présentation 3.3.1 Principes et objectifs C'est l'élément le plus important pour l'utilisateur car il correspond à la partie visible du système. Quelles que soient les solutions retenues, elles doivent être simples à utiliser et être compatibles avec les outils bureautiques existants. Désormais les applications doivent être multimédias et communicantes. Il est relativement facile de fournir des photographies ou des dessins techniques des produits de l'entreprise. La restitution peut donc intervenir avec des modalités différentes. Avant d'examiner les EIS / SIAD nous allons brièvement nous intéresser aux requêteurs. 3.3.2 Reqêteurs Un requêteur permet à l'utilisateur final d'accéder aux données de l'entreprise de manière autonome, dans un langage proche de celui de son métier. Ces outils peuvent nécessiter la connaissance de la structure de la base que l'on interroge. Différentes générations d'outils se sont succédées sur le marché. Si au départ ils étaient de simples outils d'interrogation graphique, ils tendent désormais à s'orienter vers les métiers des utilisateurs pour permettre une utilisation plus intuitive. Les premières solutions nécessitaient la connaissance de la structure le la base de données et même parfois du langage SQL. Aujourd'hui ces éléments sont de plus en plus transparent pour l'utilisateur final. La facilité d'utilisation des outils s'est accrue ainsi que leurs coûts de mise en place et de maintenance. 3.3.3 EIS (Executive Information System) et SIAD (Système Interactif d'Aide à la Décision) Un EIS (Executive Information System) est un outil de visualisation et de navigation dans les données permettant de constituer des tableaux de bord. Il est constitué d'outils qui permettent aux différents niveaux de management d'accéder aux informations essentielles de leur organisation, de les analyser et de les présenter de façon élaborée. Ces outils sont dotés d'une interface graphique très conviviale et très esthétique. L'utilisateur final ne peut visualiser que les informations initialement prévues par le concepteur du tableau de bord. Il ne permet pas de poser une question qui n'a pas été prévu dès le départ. Un SIAD (Système Interactif d'Aide à la Décision) est un outil d'analyse et de modélisation des données de l'entreprise qui permet de créer des représentations multidimensionnelles de l'information. -9- Système d'Information Décisionnel et Datawarehouse Source : La construction du datawarehouse, du datamart au dataweb; Jean-François Goglin; Nouvelles Technologies Informatiques; Ed. HERMES. Ces deux familles d'outils sont généralement orientées métiers et bénéficient de fonctions de représentation avancées. Ils intègrent une couche spécifique qui permet de masquer le modèle physique de construction de la base de données. Ceci permet à l'utilisateur de retrouver des notions qu'il connaît et sait manipuler. Figure : Représentation métier 4 Le marché du décisionnel En 1997, les dépenses françaises dans le domaine de l'aide à la décision ont augmenté de 41,2 %. Largement supérieure à celle de la dépense informatique, cette progression illustre, selon le cabinet PAC, la maturité croissante des entreprises hexagonales dans ce secteur. Elle succède à leurs hésitations des années quatre-vingt, alors qu'étaient disponibles des offres d'infocentres et d'EIS. La vague devrait se poursuivre puisque Philippe Audrain, directeur des marchés logiciels et services du cabinet, estime que «la dépense totale atteindra 7 milliards de francs en 2001, contre 2,4 milliards en 1997». Selon ce consultant, ce réveil a de multiples raisons : accroissement du volume d'informations à traiter pour piloter les activités de l'entreprise, disponibilité de technologies adaptées pour l'exploration (datamining), l'interrogation (requêteurs), l'alimentation et l'extraction (middleware, etc.) et solutions puissantes pour le stockage des données (moteurs OLAP, cubes). Sans oublier l'explosion du Web, qui démocratise l'accès aux applications décisionnelles et rend possible la connexion simultanée de milliers de postes clients légers. Selon PAC, 10 % des requêtes sur les datawarehouses et autres datamarts s'effectueront en - 10 - Système d'Information Décisionnel et Datawarehouse 2002 par Internet. Pour l'heure, c'est aux infrastructures que vont les investissements des entreprises. Ces dernières ont consacré plus de la moitié de leurs dépenses au service (1,4 milliards de francs, + 40 % en 1997). Le reste est allé aux progiciels (625 millions de francs) avec une concentration sur les outils (alimentation, extraction, moteurs) devant les progiciels systèmes (250 millions environ) et les progiciels applicatifs (125 millions). Ce dernier segment devrait connaître la progression la plus intéressante, avec une croissance annuelle moyenne de 48 % selon PAC. De quoi remettre en cause le classement des éditeurs, et les premières places de spécialistes comme BusinessObjects ou Cognos Conclusion Le datawarehouse permet au décideur de travailler dans un environnement informationnel, référencé, homogène et historisé. Cette technique l’affranchit des problèmes liés à l’hétérogénéité des systèmes informatiques et à l’hétérogénéité des différentes définitions de données issues de l’historique de l’organisation. Les applications décisionnelles permettent ensuite d’extraire du datawarehouse, une connaissance partielle de l’activité de l'entreprise selon les axes qui préoccupent le décideur à un instant donné. Les années à venir vont très certainement apporter de nombreuses modifications à ce schéma. Internet notamment vient changer la donne. Un concept va fusionner le datawarehouse et le Web : il s'agit du dataweb. Le dataweb contient l'idée d'un accès à une base de données universelle quelle que soit la plate-forme d'hébergement, sa localisation ou le format de données. Il devient aujourd'hui essentiel d'avoir accès aux données internes à l'entreprise, mais aussi aux données externes provenant par exemple de l'Internet. Le dataweb sera accessible à partir d'une application disponible sur toutes les machines, comme un navigateur Internet. L'objectif est ici d'augmenter la qualité des décisions en augmentant la qualité de l'information à la base. De plus l'accès au dataweb sera possible à partir de n'importe où dans le monde. A partir d'un ordinateur portable l'utilisateur pourra travailler comme il le fait dans son bureau. - 11 -