Ordonnancement d’applications intensives embarquées sur GPUs ADDA CHAHRAZED [email protected] Encadreur: Mr A.E.BENYAMINA Co-Encadreur: Mr L.Loukil et Mr P.BOULET 1 Plan 1. Introduction 2. Travaux connexes 3. Conclusion 2 INTRODUCTION 3 1. Introduction Problématique: GILR PI PR Algorithme d’ordonnancement ? Algorithme d’ordonnancement ? CPU GPU GPGPU (Architecture Hétérogène) 4 1. Introduction Mes Présentations: : 5 exposés Voir le lien: AASGaspard 5 Travaux connexes 6 [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012 système hétérogène tels que (GPU+ FAPGA+CPU) Satisfaction de deux critères (Max tps de performance, Min consommation d’énergie) ) Ordonnancement basée(liste de priorité de taches) 7 [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012 Ordonnancement fonction basée sur le temps d’exécution et consommation d’énergie sous forme un mode de programmation linéaire 8 [2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012 Calcul intensif sur GPUs Satisfaction de critère (minimiser le temps d’exécution) Ordonnancement basée(priorité de dépendance) Ordonnancement fonction basée sur DCounter. 9 [3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. 2012 Calcul intensif sur GPUs Satisfaction de critère (minimiser le temps d’exécution) Ordonnancement basée(priorité de dépendance) et LDF (Latest Deadline First )) 10 [4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. 2013 système hétérogène tels que (GPUs+CPUs) Satisfaction de deux critères (minimiser le temps de réponse ) ) Traitement d’un seul image (détection de coins et contour) Ordonnancement basée sur (CUDA et OpenGl) Traitement de plusieurs images (détection de coins et contour) Ordonnancement basée sur (StarUP) 11 [5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010 Calcul intensif sur GPUs Satisfaction de critère (Max tps de performance, Min consommation d’énergie) ) Ordonnancement basée(Algorithmes évolutionnaires) ) 12 [6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. 2012 Calcul intensif sur GPUs Satisfaction de critère (Max tps de performance) Ordonnancement basée(Algorithmes génétique) 13 2. Travaux connexes Articles plateforme s [Qiang et al 2012] Critère d’optimisatio n Langage de Remarque programm ation CPUs-GPUs- Programmation FPGAs linéaire Maximiser efficacité énergétique du système , Max tps performance C++ [Tzeng et al 2012 ] GPUs Statique(résolution de dépendance) minimiser le temps d’exécution - [Membart h et al 2012] GPUs Dynamique (en fonction des priorités et LDF (Latest Deadline First )) minimiser le temps de réponse CUDA, opencl 1.Ordonnandement par CUDA 2.Odonancement effectué par minimiser le temps de réponse 1.CUDA+O penGL 2.StarUP [Mahmoud CPUs-GPUs i et al 2013] Algorithme d’ordonnancement Traitement 1.Pour une seul image 14 2. Pour 2. Travaux connexes Articles plateforme s [Qiang et al 2011] [Thomas et al 2012] Algorithme d’ordonnancement Critère d’optimisatio n Langage de Remarque programm ation CPUs-GPUs- Statique Algorithmes évolutionnaires Max tps Performance, Min consom D’énergie OpenCL CPUs-GPUs- Statique Algorithmes génétiques Max tps Performance OpenMP 15 Conclusion 16 3. Conclusion Proposition: Partie1: Commence par un graphe à un seul niveau GILR PI PR Algorithme d’ordonnancement Algorithme d’ordonnancement Statique Statique évolutionnaires (PSO et dijkstra ) GP GPU Travail de Mr Aroui (Branch & Bound) GPGPU (Architecture Hétérogène) 17 Référence bibliographique [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. School of Electronic Information Engineering, Tianjin University, 300072 Tianjin, China 2 Department of Computing, Imperial College London, SW7 2AZ London, UK. 2012 [2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012 [3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. Hardware/Software Co-Design, Department of Computer Science, University of Erlangen-Nuremberg, Germany. Siemens Healthcare Sector, H IM AX, Forchheim, Germany. 2012 18 Référence bibliographique [4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. Université de Mons, Faculté Polytechnique. Service d’informatique 20, Place du Parc 7000 Mons, Belgique.2013 [5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010 [6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. Center for Applied Scientific Computing, Lawrence Livermore National Laboratory, Livermore, CA 94551 USA. 2012 19