Qualité et datawarehouse La qualité de données a été définie comme fraction d'exécution au-dessus de l'expectative, ou comme la perte a donné à la société du temps un produit est embarqué [BBBB95]. Nous croyons, bien que, que la meilleure définition est celui trouvé dedans [TaBa98, Orr98, WaSG94] : la qualité de données est définie en tant que « forme physique pour l'usage ». La nature de cette définition implique directement que le concept de la qualité de données est relatif. Par exemple, sémantique de données (l'interprétation d'information) est différent pour chaque utilisateur distinct. Comme [Orr98] mentionne « le problème de la qualité de données est fondamentalement entrelacé dans la façon dont les utilisateurs de [...] emploient réellement les données dans système ", puisque les utilisateurs sont réellement les juges finals de la qualité des données produites pour elles : si personne n'emploie réellement les données, alors personne fera jamais attention pour améliorer sa qualité. Comme système d'information d'aide à la décision, un entrepôt de données doit fournir la qualité à niveau élevé des données et qualité de service. La concordance, la fraîcheur, l'exactitude, l'accessibilité, la disponibilité et l'exécution sont parmi les dispositifs de qualité requis par les utilisateurs de l'entrepôt de données. Toujours, un trop grand nombre des dépositaires sont impliqués dans le cycle de vie de l'entrepôt de données ; tous semblent avoir leur qualité conditions. Comme déjà mentionné, le décideur utilise habituellement un outil de question d'OLAP pour obtenir réponses intéressant à lui. Un décideur est habituellement concerné par la qualité des données stockées, leur opportunité et la facilité de les questionner par les outils d'OLAP. L'entrepôt de données L'administrateur a besoin des équipements tels que le reportage d'erreur, l'accessibilité de méta-données et la connaissance du opportunité des données, afin de détecter des changements et des raisons de eux, ou des problèmes dans stocké l'information. Le concepteur d'entrepôt de données doit mesurer la qualité des schémas des données entreposez l'environnement (existant et nouvellement produit) et la qualité des méta-données aussi bien. En outre, il a besoin des normes d'évaluation de logiciel pour examiner les progiciels qu'il considère achat. Les programmeurs des composants d'entrepôt de données peuvent faire la bonne utilisation du logiciel normes d'exécution afin d'accomplir et évaluer leur travail. Métadonnées rapportant le bidon facilitez également leur travail, puisqu'elles peuvent éviter des erreurs liées à l'information de schéma. Basé sur ceci analyse, nous pouvons sans risque arguer du fait que les différents rôles impliquent une collection différente d'aspects de qualité, qui devrait être idéalement traité d'une manière cohérente et signicative. Du précédent elle suit que, d'une part, la qualité des données est de nature fortement subjective et devrait idéalement être traité différemment pour chaque utilisateur. En même temps, les buts de qualité de l'impliqué les dépositaires sont fortement divers en nature. Ils ne peuvent ni être évalués ni réalisés directement mais exigez la mesure, la prévision, et les techniques de conception complexes, souvent sous forme d'interactif processus. D'une part, les raisons des insuffisances de données, de la non-disponibilité ou des problèmes de reachability soyez certainement objectif, et dépendez la plupart du temps de la définition et de l'exécution de système d'information. En outre, la prévision de la qualité de données pour chaque utilisateur doit être basée sur des facteurs de qualité objectifs cela sont calculés et comparés aux utilisateurs des espérances. La question qui se pose, puis, est comment à organisez la conception, l'administration et l'évolution de l'entrepôt de données de telle manière que tous le différent, et parfois l'opposition, des conditions de qualité des utilisateurs peuvent être simultanément satisfait. Comme nombre d'utilisateurs et complexité des données les systèmes d'entrepôt ne permettent pas à atteignez la qualité totale pour chaque utilisateur, une autre question est comment donner la priorité à ces conditions satisfaites-les en ce qui concerne leur importance. Ce problème est typiquement illustré par l'examen médical la conception des données entreposent où le problème est de trouver un ensemble de vues matérialisées qui optimisent le temps de réponse de demandes d'utilisateur et les données globales entreposent le coût d'entretien en même temps.