Qualité et datawarehouse

publicité
Qualité et datawarehouse
La qualité de données a été définie comme fraction d'exécution au-dessus de l'expectative, ou
comme la perte a donné à la société du temps un produit est embarqué [BBBB95]. Nous
croyons, bien que, que la meilleure définition est celui trouvé dedans [TaBa98, Orr98,
WaSG94] : la qualité de données est définie en tant que « forme physique pour l'usage ». La
nature de cette définition implique directement que le concept de la qualité de données est
relatif. Par exemple, sémantique de données (l'interprétation d'information) est différent pour
chaque utilisateur distinct. Comme [Orr98] mentionne « le problème de la qualité de données
est fondamentalement entrelacé dans la façon dont les utilisateurs de [...] emploient réellement
les données dans système ", puisque les utilisateurs sont réellement les juges finals de la
qualité des données produites pour elles : si personne n'emploie réellement les données, alors
personne fera jamais attention pour améliorer sa qualité. Comme système d'information d'aide
à la décision, un entrepôt de données doit fournir la qualité à niveau élevé des données et
qualité de service. La concordance, la fraîcheur, l'exactitude, l'accessibilité, la disponibilité et
l'exécution sont parmi les dispositifs de qualité requis par les utilisateurs de l'entrepôt de
données. Toujours, un trop grand nombre des dépositaires sont impliqués dans le cycle de vie
de l'entrepôt de données ; tous semblent avoir leur qualité conditions. Comme déjà mentionné,
le décideur utilise habituellement un outil de question d'OLAP pour obtenir réponses
intéressant à lui. Un décideur est habituellement concerné par la qualité des données stockées,
leur opportunité et la facilité de les questionner par les outils d'OLAP. L'entrepôt de données
L'administrateur a besoin des équipements tels que le reportage d'erreur, l'accessibilité de
méta-données et la connaissance du opportunité des données, afin de détecter des
changements et des raisons de eux, ou des problèmes dans stocké l'information. Le concepteur
d'entrepôt de données doit mesurer la qualité des schémas des données entreposez
l'environnement (existant et nouvellement produit) et la qualité des méta-données aussi bien.
En outre, il a besoin des normes d'évaluation de logiciel pour examiner les progiciels qu'il
considère achat. Les programmeurs des composants d'entrepôt de données peuvent faire la
bonne utilisation du logiciel normes d'exécution afin d'accomplir et évaluer leur travail. Métadonnées rapportant le bidon facilitez également leur travail, puisqu'elles peuvent éviter des
erreurs liées à l'information de schéma. Basé sur ceci analyse, nous pouvons sans risque
arguer du fait que les différents rôles impliquent une collection différente d'aspects de qualité,
qui devrait être idéalement traité d'une manière cohérente et signicative. Du précédent elle suit
que, d'une part, la qualité des données est de nature fortement subjective et devrait idéalement
être traité différemment pour chaque utilisateur. En même temps, les buts de qualité de
l'impliqué les dépositaires sont fortement divers en nature. Ils ne peuvent ni être évalués ni
réalisés directement mais exigez la mesure, la prévision, et les techniques de conception
complexes, souvent sous forme d'interactif processus. D'une part, les raisons des insuffisances
de données, de la non-disponibilité ou des problèmes de reachability soyez certainement
objectif, et dépendez la plupart du temps de la définition et de l'exécution de système
d'information. En outre, la prévision de la qualité de données pour chaque utilisateur doit être
basée sur des facteurs de qualité objectifs cela sont calculés et comparés aux utilisateurs des
espérances. La question qui se pose, puis, est comment à organisez la conception,
l'administration et l'évolution de l'entrepôt de données de telle manière que tous le différent, et
parfois l'opposition, des conditions de qualité des utilisateurs peuvent être simultanément
satisfait. Comme nombre d'utilisateurs et complexité des données les systèmes d'entrepôt ne
permettent pas à atteignez la qualité totale pour chaque utilisateur, une autre question est
comment donner la priorité à ces conditions satisfaites-les en ce qui concerne leur importance.
Ce problème est typiquement illustré par l'examen médical la conception des données
entreposent où le problème est de trouver un ensemble de vues matérialisées qui optimisent le
temps de réponse de demandes d'utilisateur et les données globales entreposent le coût
d'entretien en même temps.
Téléchargement