Système d'Information Décisionnel et Datawarehouse
- 5 -
intégré dans l'architecture globale du système d'information, outil d'interrogation aisément
pris en main par les utilisateurs, baisse des prix...
2.1 Présentation et objectif
Le datawarehouse est un entrepôt de données. Il s'agit d'un stockage intermédiaire des
données issues des applications de production, dans lesquelles les utilisateurs finaux
puisent avec des outils de restitution et d'analyse.
Voici une définition énoncée par Bill Inmon.
«Un datawarehouse est une collection de données thématiques, intégrées, non volatiles et
historisées pour la prise de décisions».
Orientées sujet
Le datawarehouse est organisé autour des sujets majeurs et des métiers de l'entreprise. Les
données sont organisées par thème. L'intérêt de cette organisation réside dans le fait qu'il
devient possible de réaliser des analyses sur des sujets transversaux aux structures
fonctionnelles et organisationnelles de l'entreprise. Cette orientation permet également de
faire des analyses par itération, sujet après sujet.
L'intégration dans une structure unique est indispensable pour éviter aux données
concernées par plusieurs sujet d'être dupliqué. Cependant dans la pratique il existe
également des datamarts. Le datawarehouse est fragmenté en plusieurs bases qui
supportent l'orientation sujet.
Données intégrées
Un datawarehouse est un projet d'entreprise. Il concerne les différents services et métiers de
l'entreprise. Avant d'être intégrées dans le datawarehouse, les données doivent êtres mises
en forme et unifiées afin d'avoir un état cohérent. L'intégration nécessite une forte
normalisation, une bonne gestion des référentiels et de la cohérence, une parfaite maîtrise
de la sémantique et des règles de gestion s'appliquant aux données manipulées. C'est ainsi
que l'on pourra donner une bonne vision de l'entreprise via l'utilisation d'indicateurs.
Données historisées
L'historisation est nécessaire pour suivre dans le temps l'évolution des différentes valeurs
des indicateurs à analyser. Ainsi, un référentiel temps doit être associé aux données afin de
permettre l'identification dans la durée de valeurs précises.
Données non volatiles