Système d`Information Décisionnel et Datawarehouse

publicité
Système d'Information Décisionnel et Datawarehouse
Système d'Information Décisionnel et Datawarehouse
Introduction
Avec l'apparition et le développement de phénomènes économiques comme la
mondialisation les entreprises évoluent dans un environnement difficile à appréhender. Il en
résulte que la prise de décision stratégique ou politique est de plus en plus complexe
(augmentation du nombre de paramètres à prendre en compte) et, en même temps, doit
intervenir très rapidement pour ne pas laisser le temps aux concurrents de prendre de
l'avance.
Les nouvelles technologies de l'information permettent de concevoir des systèmes
d'information particulièrement performants et novateurs. Avec l'apparition des entrepôts de
données (datawarehouse) et des requêteurs tous les utilisateurs peuvent désormais accéder
à l'information stratégique. Ceci permet à l'entreprise d'être plus réactive mais pose aussi
sans cesse de nouveaux problèmes (problèmes de confidentialité, de compétences pour
l'analyse, etc.)
Comment, dans l'entreprise, s'organise la prise de décision ? Nous répondrons à cette
question en organisant notre réflexion en quatre temps. D'abord nous commencerons par
affiner et préciser la problématique en délimitant le champ de la réflexion. Ensuite, nous
examinerons les concepts du Datawarehouse et des EIS/SIAD. Pour terminer nous
illustrerons nos propos par l'exemple de logiciels proposant des solutions plus ou moins
complètes.
1 Problématique générale
1.1 Le système d'information
Les entreprises sont désormais confrontées à des problèmes complexes comme la
mondialisation ou le passage à l'euro. Ainsi, il ne s'agit plus de découvrir et de se lancer sur
de nouveaux marchés. Encore faut-il bien connaître l'environnement dans lequel l'entreprise
va évoluer. Pour cela, il faut obtenir des informations de nature technique, juridique, fiscale,
politique ou commerciale. L'organisation doit alors être capable d'exploiter efficacement de
grandes quantités d'information.
-1-
Système d'Information Décisionnel et Datawarehouse
Figure : La mondialisation des échanges
Le système d'information de l'entreprise utilise et produit des informations différentes mais
pourtant toujours liées entre elles. Par exemple, les contrôleurs de gestion génèrent des
informations à partir des données de vente et de production. Ils traitent ensuite ces données
pour aider au pilotage de l'entreprise.
Figure : Les différentes données de l'entreprise
La qualité et l'exhaustivité des informations sont primordiales pour la direction générale. En
effet, à ce niveau, les décideurs sont confrontés à des réalités très complexes ou de
nombreux phénomènes se trouvent liés entre eux. Chaque couche du système ci-dessus
produit ses propres indicateurs et prend des décisions. Cependant, plus on se trouve haut
-2-
Système d'Information Décisionnel et Datawarehouse
dans la pyramide plus les informations extérieures à l'entreprise vont rentrer en compte et
prendre de l'importance.
Figure : La prise de décision
L'architecture fonctionnelle que nous venons de décrire doit être accompagnée par le
système d'information de l'entreprise. Il doit donc être fiable et adaptable, ce qui évidemment
est très difficile à obtenir.
1.2 Le décisionnel
Le système d'information décisionnel est un ensemble de données organisées de façon
spécifique, facilement accessible et appropriées à la prise de décision ou encore une
représentation intelligente de ces données au travers d'outils spécialisés. La finalité d'un
système décisionnel est le pilotage de l'entreprise.
-3-
Système d'Information Décisionnel et Datawarehouse
Figure : Le décisionnel
Les systèmes décisionnels sont dédiés au management de l'entreprise pour l'aider au
pilotage de l'activité, et indirectement opérationnels car n'offrant que rarement le moyen
d'appliquer les décisions. Ils constituent une synthèse d'informations opérationnelles,
internes ou externes, choisies pour leur pertinence et leur transversalité fonctionnelles, et
sont basés sur des structures particulières de stockage volumineux (datawarehouse, bases
OLAP). Le principal intérêt d'un système décisionnel est d'offrir au décideur une vision
transversale de l'entreprise intégrant toutes ses dimensions.
Source : La construction du datawarehouse, du datamart au dataweb; Jean-François Goglin;
Nouvelles Technologies Informatiques; Ed. HERMES.
1.3 Le décisionnel au sein du système d'information
On peut parler de décisionnel lorsque les données de production sont valorisées en
informations. Cette valorisation est effective dès que l'on sort du monde de la production.
2 Le Datawarehouse
Le Datawarehouse est dorénavant, non seulement une réalité au sein des grandes
entreprises, mais aussi un marché pour un nombre croissant d'acteurs : intégrateurs,
éditeurs de SGBD ou d'outils spécialisés. Disposer d'une offre dans le domaine décisionnel
devient une condition sine qua non pour les acteurs du monde informatique, notamment
avec la montée en puissance de l'informatique stratégique, enjeu d'actualité. Car, les
sociétés les mieux positionnées sur ce marché bénéficient d'une image forte dans le
domaine des applications critiques de l'entreprise. Au couple infocentre-EIS des années
1980 succède une offre décisionnelle qui s'adapte aux nouvelles règles du jeu de
l'informatique d'entreprise, et qui en révèle les profondes mutations : système départemental
-4-
Système d'Information Décisionnel et Datawarehouse
intégré dans l'architecture globale du système d'information, outil d'interrogation aisément
pris en main par les utilisateurs, baisse des prix...
2.1 Présentation et objectif
Le datawarehouse est un entrepôt de données. Il s'agit d'un stockage intermédiaire des
données issues des applications de production, dans lesquelles les utilisateurs finaux
puisent avec des outils de restitution et d'analyse.
Voici une définition énoncée par Bill Inmon.
«Un datawarehouse est une collection de données thématiques, intégrées, non volatiles et
historisées pour la prise de décisions».
Orientées sujet
Le datawarehouse est organisé autour des sujets majeurs et des métiers de l'entreprise. Les
données sont organisées par thème. L'intérêt de cette organisation réside dans le fait qu'il
devient possible de réaliser des analyses sur des sujets transversaux aux structures
fonctionnelles et organisationnelles de l'entreprise. Cette orientation permet également de
faire des analyses par itération, sujet après sujet.
L'intégration dans une structure unique est indispensable pour éviter aux données
concernées par plusieurs sujet d'être dupliqué. Cependant dans la pratique il existe
également des datamarts. Le datawarehouse est fragmenté en plusieurs bases qui
supportent l'orientation sujet.
Données intégrées
Un datawarehouse est un projet d'entreprise. Il concerne les différents services et métiers de
l'entreprise. Avant d'être intégrées dans le datawarehouse, les données doivent êtres mises
en forme et unifiées afin d'avoir un état cohérent. L'intégration nécessite une forte
normalisation, une bonne gestion des référentiels et de la cohérence, une parfaite maîtrise
de la sémantique et des règles de gestion s'appliquant aux données manipulées. C'est ainsi
que l'on pourra donner une bonne vision de l'entreprise via l'utilisation d'indicateurs.
Données historisées
L'historisation est nécessaire pour suivre dans le temps l'évolution des différentes valeurs
des indicateurs à analyser. Ainsi, un référentiel temps doit être associé aux données afin de
permettre l'identification dans la durée de valeurs précises.
Données non volatiles
-5-
Système d'Information Décisionnel et Datawarehouse
Afin de conserver la traçabilité des informations et des décisions prises, les informations
stockées au sein du datawarehouse ne peuvent pas être supprimées. Une requête lancée à
différentes dates sur les mêmes données doit toujours retourner les mêmes résultats. Une
donnée introduite dans le datawarehouse ne pourra donc plus être supprimée ni même
modifiée. Dans le cas présent les données ne sont pas volatiles.
Figure : Schéma de principe d'un datawarehouse (source Jean-François Goglin)
Le datawarehouse est donc une sorte de point focal stockant en un point unique toute
l'information utile provenant des systèmes de production et des sources externes. Avant
d'être intégré dans le datawarehouse l'information doit être extraite des bases propriétaires
et «nettoyée». Ensuite, elle doit être mise en forme de manière à devenir compréhensible
par l'utilisateur final.
2.2 La structure du datawarehouse
-6-
Système d'Information Décisionnel et Datawarehouse
Figure : La structure du datawarehouse (source EDS-Prométhéus)
Un datawarehouse peut se structurer en quatre classes de données, organisées selon un
axe historique et un axe de synthèse.
Les données détaillées
Elles reflètent les événements les plus récents. Les intégrations régulières des données
issues des systèmes de production vont habituellement être réalisées à ce niveau.
Les données agrégées
Elles correspondent à des éléments d’analyse représentatifs des besoins utilisateurs. Elles
constituent déjà un résultat d’analyse et une synthèse de l’information contenue dans le
système décisionnel, et doivent être facilement accessibles et compréhensibles.
Les métadonnées
Très souvent les données à fédérer dans le datawarehouse proviennent de sources très
hétérogènes. Cela rend indispensable la présence d'un dictionnaire unique qui sait gérer
l'ensemble des fonctions du datawarehouse. Cette cohérence du dictionnaire est décrite au
sein des métadonnées du dictionnaire du datawarehouse.
Les métadonnées constituent l'ensemble des données qui décrivent des règles ou process
attachés à d'autres données. Ces dernières constituent la finalité du système d'information.
-7-
Système d'Information Décisionnel et Datawarehouse
Les données historisés
Chaque nouvelle insertion de données provenant du système de production ne détruit pas
les anciennes valeurs, mais créée une nouvelle occurrence de la donnée.
3 Les éléments du système d'information décisionnel
3.1 Système d'alimentation / ETL
3.2.1 Principes et objectifs
Le système d'alimentation à pour but de transformer les données primaires (par exemple
issues des systèmes de production) en informations stockées dans le Datawarehouse. Pour
cela il est nécessaire de réaliser les fonctions suivantes :
Recherche
Contrôle
- Chargement
et
de
qualité
identification
(épuration
des
et
données
validation)
Extraction
Transport
Figure : Le système d'alimentation
La phase d'identification et d'épuration des données consiste à définir et identifier la donnée
la plus pertinente en fonction de sa source.
La phase de transformation regroupe les opérations de mise au format nécessaires des
données, de calcul des données secondaires et de fusion ou d'éclatement des informations
composites.
Enfin la phase de chargement à pour rôle de stocker les informations de manière correcte
dans les tables de faits du datawarehouse.
-8-
Système d'Information Décisionnel et Datawarehouse
3.3 Système de diffusion et de présentation
3.3.1 Principes et objectifs
C'est l'élément le plus important pour l'utilisateur car il correspond à la partie visible du
système. Quelles que soient les solutions retenues, elles doivent être simples à utiliser et
être compatibles avec les outils bureautiques existants. Désormais les applications doivent
être multimédias et communicantes. Il est relativement facile de fournir des photographies ou
des dessins techniques des produits de l'entreprise.
La restitution peut donc intervenir avec des modalités différentes. Avant d'examiner les EIS /
SIAD nous allons brièvement nous intéresser aux requêteurs.
3.3.2 Reqêteurs
Un requêteur permet à l'utilisateur final d'accéder aux données de l'entreprise de manière
autonome, dans un langage proche de celui de son métier. Ces outils peuvent nécessiter la
connaissance de la structure de la base que l'on interroge.
Différentes générations d'outils se sont succédées sur le marché. Si au départ ils étaient de
simples outils d'interrogation graphique, ils tendent désormais à s'orienter vers les métiers
des utilisateurs pour permettre une utilisation plus intuitive. Les premières solutions
nécessitaient la connaissance de la structure le la base de données et même parfois du
langage SQL. Aujourd'hui ces éléments sont de plus en plus transparent pour l'utilisateur
final. La facilité d'utilisation des outils s'est accrue ainsi que leurs coûts de mise en place et
de maintenance.
3.3.3 EIS (Executive Information System) et SIAD (Système
Interactif d'Aide à la Décision)
Un EIS (Executive Information System) est un outil de visualisation et de navigation dans les
données permettant de constituer des tableaux de bord. Il est constitué d'outils qui
permettent aux différents niveaux de management d'accéder aux informations essentielles
de leur organisation, de les analyser et de les présenter de façon élaborée. Ces outils sont
dotés d'une interface graphique très conviviale et très esthétique.
L'utilisateur final ne peut visualiser que les informations initialement prévues par le
concepteur du tableau de bord. Il ne permet pas de poser une question qui n'a pas été prévu
dès le départ.
Un SIAD (Système Interactif d'Aide à la Décision) est un outil d'analyse et de modélisation
des données de l'entreprise qui permet de créer des représentations multidimensionnelles de
l'information.
-9-
Système d'Information Décisionnel et Datawarehouse
Source : La construction du datawarehouse, du datamart au dataweb; Jean-François Goglin;
Nouvelles Technologies Informatiques; Ed. HERMES.
Ces deux familles d'outils sont généralement orientées métiers et bénéficient de fonctions de
représentation avancées. Ils intègrent une couche spécifique qui permet de masquer le
modèle physique de construction de la base de données. Ceci permet à l'utilisateur de
retrouver des notions qu'il connaît et sait manipuler.
Figure : Représentation métier
4 Le marché du décisionnel
En 1997, les dépenses françaises dans le domaine de l'aide à la décision ont augmenté de
41,2 %. Largement supérieure à celle de la dépense informatique, cette progression illustre,
selon le cabinet PAC, la maturité croissante des entreprises hexagonales dans ce secteur.
Elle succède à leurs hésitations des années quatre-vingt, alors qu'étaient disponibles des
offres d'infocentres et d'EIS. La vague devrait se poursuivre puisque Philippe Audrain,
directeur des marchés logiciels et services du cabinet, estime que «la dépense totale
atteindra 7 milliards de francs en 2001, contre 2,4 milliards en 1997».
Selon ce consultant, ce réveil a de multiples raisons : accroissement du volume
d'informations à traiter pour piloter les activités de l'entreprise, disponibilité de technologies
adaptées pour l'exploration (datamining), l'interrogation (requêteurs), l'alimentation et
l'extraction (middleware, etc.) et solutions puissantes pour le stockage des données (moteurs
OLAP, cubes). Sans oublier l'explosion du Web, qui démocratise l'accès aux applications
décisionnelles et rend possible la connexion simultanée de milliers de postes clients légers.
Selon PAC, 10 % des requêtes sur les datawarehouses et autres datamarts s'effectueront en
- 10 -
Système d'Information Décisionnel et Datawarehouse
2002 par Internet. Pour l'heure, c'est aux infrastructures que vont les investissements des
entreprises. Ces dernières ont consacré plus de la moitié de leurs dépenses au service (1,4
milliards de francs, + 40 % en 1997). Le reste est allé aux progiciels (625 millions de francs)
avec une concentration sur les outils (alimentation, extraction, moteurs) devant les progiciels
systèmes (250 millions environ) et les progiciels applicatifs (125 millions). Ce dernier
segment devrait connaître la progression la plus intéressante, avec une croissance annuelle
moyenne de 48 % selon PAC. De quoi remettre en cause le classement des éditeurs, et les
premières places de spécialistes comme BusinessObjects ou Cognos
Conclusion
Le datawarehouse permet au décideur de travailler dans un environnement informationnel,
référencé, homogène et historisé. Cette technique l’affranchit des problèmes liés à
l’hétérogénéité des systèmes informatiques et à l’hétérogénéité des différentes définitions de
données issues de l’historique de l’organisation.
Les applications décisionnelles permettent ensuite d’extraire du datawarehouse, une
connaissance partielle de l’activité de l'entreprise selon les axes qui préoccupent le décideur
à un instant donné.
Les années à venir vont très certainement apporter de nombreuses modifications à ce
schéma. Internet notamment vient changer la donne. Un concept va fusionner le
datawarehouse et le Web : il s'agit du dataweb.
Le dataweb contient l'idée d'un accès à une base de données universelle quelle que soit la
plate-forme d'hébergement, sa localisation ou le format de données. Il devient aujourd'hui
essentiel d'avoir accès aux données internes à l'entreprise, mais aussi aux données
externes provenant par exemple de l'Internet. Le dataweb sera accessible à partir d'une
application disponible sur toutes les machines, comme un navigateur Internet. L'objectif est
ici d'augmenter la qualité des décisions en augmentant la qualité de l'information à la base.
De plus l'accès au dataweb sera possible à partir de n'importe où dans le monde. A partir
d'un ordinateur portable l'utilisateur pourra travailler comme il le fait dans son bureau.
- 11 -
Téléchargement