CES/SEM.38/19
page 4
contraintes demeurent, en particulier en matière de gestion de l’ensemble
des données d’une base. Le développement et l’optimisation des SGBDs d’une
part et le développement de méthodes de conception des applications
informatiques ou de normalisation des schémas des bases de données, d’autre
part, ont fait en pratique se multiplier les SGBDs, en les axant sur la mise
à jour des données (création, mise à jour et destruction d’enregistrements
individuels éventuellement liés entre eux).
11. L’objectif secondaire n’a par contre pas été atteint en pratique, non
pas que les outils fassent défaut, mais que la gestion individuelle de chaque
application et de chaque base de données a occasionné un foisonnement des
tables relationnelles, difficilement utilisables par des non-connaisseurs
de la base. De plus les différentes bases de données sont incompatibles a
priori par manque de vision d’ensemble dans la conception initiale des
différents projets et leur étalement dans le temps.
12. Les concepts d’entrepôts de données visent principalement à
spécialiser un certain nombre de méthodes et d’outils autour de l’utilisation
en lecture des données. Selon la plus ou moins grande rigueur avec laquelle
le terme est employé, il peut dénoter:
un ensemble de gisement de données dans des formats variés (des fichiers
plats aux bases de données) accessibles en lecture ou écriture; ceci a le
mérite de la généralité, mais ne permet pas de décider de l’existence ou
non d’un entrepôt de données
un ensemble de gisement de données accessibles en lecture seule, qui est
au mieux une constatation a posteriori d’un certain existant en matière
de mise à disposition de données
une ou plusieurs bases de données structurées de façon spécifique pour
permettre les accès en lecture; c’est l’acception la plus courante, et
celle qui sera utilisée dans cet article
une ou plusieurs bases de données structurées en étoile, utilisant ou non
un outil spécifique (base de données relationnelle ou tableau
multidimensionnel), ce cas étant couvert également par le cas précédent.
13. Une préoccupation connexe est le référentiel de l’entreprise, qui peut
lui aussi avoir des spécificités dans un institut de statistique, mais qui
ne sera pas abordé ici. Il est tout à fait possible de faire un parallèle
entre les objectifs d’un référentiel unique de l’entreprise et d’un entrepôt
de données unique, sans minimiser l’écart entre un concept et sa mise en
oeuvre statistique et informatique.
14. Une illustration vaut mieux que de longs discours. En présentant une
évolution successive de la gestion de données d’une enquête simple, on verra
rapidement les différences entre les trois techniques de gestion de fichiers,
de gestion de bases de données et de structuration pour un entrepôt de
données.
IV. EXEMPLE DE DONNEES SUR LA SANTE
15. Supposons donc une enquête annuelle qui renvoie des données
épidémiologiques. Les schémas suivants sont volontairement beaucoup plus
simples que la réalité. Le schéma des fichiers sera par exemple celui-ci.