(ii) tester l’interaction entre les applications et leurs bases de données et (iii ) tester
toutes les phases du cycle de vie de la conception de base de données.
La littérature en rapport avec les activités de tests de la troisième catégorie tente de
répondre à la question suivante : comment sont-ils testés ?
Deux méthodes de test existent pour répondre à cette question : La simulation et
l’expérimentation matérielle. Pour la simulation, les chercheurs utilisent principalement
des modèles de coûts mathématiques et des méthodes formelles avec des paramètres
d’entrée qui sont liés à plusieurs composantes des bases de données telles que le schéma,
la plateforme, les requêtes, les SGBD, les structures d’optimisation (par exemple index),
etc. (van der Veen et al., 2012). L’expérimentation matérielle est la méthode la plus
privilégiée pour les grandes entreprises telles que GAFA (Google, Apple, Facebook et
Amazon) qui possèdent des ensembles de données et plateformes avancées. Comme cité
dans (Haftmann et al., 2007), Microsoft consacre 50% de ses coûts de développement
sur les tests. Un autre exemple, le cycle de sortie des produits SAP fait 18 mois dont
six mois sont utilisés uniquement pour exécuter des tests. La question que nous nous
posons dans cette thèse est la suivante : comment exploiter les données de tests et les
rendre plus accessibles et surtout plus transparentes ? L’activité de tests représentant
un coût important (argent et énergie), nous proposons dans ce papier un référentiel de
test qui joue le rôle d’un entrepôt de données contenant toutes les activités des tests :
les ensembles de données, les métriques utilisées, la plateforme, la charge de travail,
les algorithmes, etc. Ce référentiel permet ainsi de stocker tout l’environnement des
tests et de simuler des résultats des tests exprimés par l’utilisateur.
4. Actions réalisées
Nous avons conçu un référentiel de test DW_TESTS dont le but est de stocker tout
l’environnement des tests avec les résultats obtenus (temps de réponses des requêtes,
énergie consommée, etc.). Le but est de prédire des résultats de tests en utilisant des
environnements exprimés par l’utilisateur ou par des experts. La conception d’un
entrepôt de données nécessite l’identification de ses dimensions. Dans notre contexte,
ces dimensions comprennent : Dim_Platform,Dim_Deployment,Dim_DBMS,Dim_OS,
Dim_Dataset,Dim_Query,Dim_AccessMethods,Dim_Algorithms,Dim_Hypothesis,
Dim_Metrics et deux dimensions d’information : Dim_Laboratory and Dim_Time. La
table de faits couvre différentes mesures utilisées par les concepteurs telles que le coût
CPU, le coût IO et le coût de l’énergie. Notre entrepôt peut facilement être modélisé en
utilisant un schéma en étoile, comme le montre la figure 1.
5. Actions futures
Actuellement, nous sommes en train de développer une suite décisionnelle conte-
nant notre entrepôt de tests, sur lequel des opérations de type OLAP et reporting
sont définies. Cette suite pourrait compléter l’outil BD-engines (cf. Contexte). Sur
3