DG-ADAJ: Une plateforme de Calcul Java pour Grille d’ordinateur Richard Olejnik1, Bernard Toursel, Université des Sciences et Technologies de Lille Laboratoire d’Informatique Fondamentale de Lille (LIFL UMR CNRS 8022) {olejnik,toursel}@lifl.fr Durant ces deux dernières décennies, la disponibilité des moyens de traitement a augmentée exponentiellement. Cette évolution a été accompagnée par une amélioration constante de ces ressources et par une augmentation sans précédent de la complexité des calculs. L’évolution rapide des réseaux de stations de travail ont donné naissance à une nouvelle alternative d’architecture pour le traitement parallèle et rends possible une réponse à de nouveaux paradigmes de programmation et de nouveaux concepts système. Le calcul sur des Grilles de stations de travail (Desktop GRID) qui exploite les ressources inutilisées dans les environnements Intranet, peut en effet fournir une formidable puissance de calcul pouvant être utilisée pour résoudre beaucoup de problèmes complexes. C’est dans ce contexte, que nous proposons un système 100 % Java, bâti autour des environnements et de la technologie des objets pour les applications hétérogènes. De telles applications ont pour principales caractéristiques d’être irrégulières et imprévisibles. Afin de leur permettre une exécution efficace, nous proposons DG-ADAJ (Desktop GRID – Adaptative Distributed Application in Java), une plateforme middleware dont les mécanismes assurent une adaptation automatique des éléments de l’application, en réponse aux évolutions des calculs et aux modifications dans la disponibilité des ressources. Nous contrôlons la granularité des traitements et de la distribution de l’application sur la plateforme d’exécution. Le programmeur n’a donc pas à se soucier de la gestion de cette distribution. DG-ADAJ fournit un environnement de programmation distribuée pour les applications Java et un environnement d’exécution qui optimise le placement dynamique des objets de l’application sur la grille. Cette distribution est basée sur des mécanismes d’observation de l’activité des objets et des relations entre objets. DG-ADAJ fournit également la possibilité de bâtir une application parallèle et distribuée à partir des composants de contrôle. Nous utilisons à cet effet le modèle de composants CCA (Common Component Architecture) et avons développé un environnement spécial (framework) qui permet d’exploiter les mécanismes de DG-ADAJ [3]. Initialement, DG-ADAJ a été étudié pour fonctionner sur des groupes d’ordinateurs (clusters) et nous travaillons actuellement pour y intégrer un nouveau système de gestion de l’information qui est basé sur une technologie agent, de manière à ce qu’il puisse passer l’échelle. Nous menons également des recherches pour permettre l’optimisation du placement initial des objets [2] et nous portons actuellement DG-ADAJ sur la Grille GRID 5000. D’autres expérimentations sont par ailleurs, en cours actuellement, sous la forme du projet DisDaMin (DIStributed DAta MINing) et servent à l’évaluation de la plateforme DG-ADAJ. DisDaMin revisite les tâches de fouille de données (data mining) et propose de nouveaux algorithmes exploitables sur grille avec dans un premier temps, une méthode intelligente de fragmentation des données par clustering, puis dans un deuxième temps des traitements collaboratifs asynchrones respectant les spécificités du traitement d'exécution sur grilles [4]. [1] R. Olejnik, B. Toursel, M. Tudruj, E. Laskowski and I. Alshabani. DG-ADAJ, an environment for Desktop Grid applications, to appear in Future Generation Computer Systems, Springer Verlag [2] R. Olejnik, B. Toursel, M. Tudruj, E. Laskowski and I. Alshabani. Optimized Java computing as an application for Desktop Grid. Proc. of the 4th Cracow Grid Workshop 2004, Krakow Poland, December 12-15, 2004, pp301-308 [3] I. Alshabani, R. Olejnik and B. Toursel. Parallel Tools for a Distributed Component Framework. 1st International Conference on Information and Communication Technologies (ICTTA04), Damascus, Syria, April 2004 [4] V. Fiolet and B. Toursel, Intelligent Database distribution on a Grid using clustering, in Lectures Notes, Computer Sciences Proc of AWIC 2005, Springer Verlag, June 2005