Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 1
Aspects théoriques et algorithmiques du
calcul réparti
Le placement
Patrick CIARLET
Enseignant-Chercheur UMA
Françoise LAMOUR
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 2
Références (1/2)
A shortest tree algorithm for optimal assignments across space and time in a
distributed processor system. S. H. Bokhari. IEEE Transactions on Software
Engineering, 1981, Vol. SE-7, n° 6.
Mapping graphs onto a partially reconfigurable architecture. P. Chrétienne et F.
Lamour. Proceedings of the 2 nd European Conference on Distributed Memory
Computing, 1991, pages 73-79.
On the mapping problem. S. H. Bokhari. IEEE Transactions on Computers,
1981, Vol. C-30.
Processor scheduling for linearly connected parallel processors. C. E. McDowell
et W.F. Appelbe. IEEE Transactions on Computers, 1986, Vol. C-35.
Et plus si affinités…
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 3
Références (2/2)
Fiber-to-objet assignment heuristics. F. Sourd et P. Chrétienne. European
Journal of Operational Research, 1999, Vol. 117, pages 1-14.
A measure of similarity between graph vertices: applications to synomym
extraction and web searching. V. D. Blondel, A. Gajardo, M. Heymans, P.
Senellart et P. Van Dooren. SIAM Review, 2004, Vol. 46, n° 4, pages 647-666.
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 4
Plan du cours
Contexte
Réseau d’interconnexion
Problématique
Approche quantitative
Approche qualitative
Permutation de la matrice d’adjacence
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 5
Contexte
Le problème de placement est le problème d’affectation des tâches
d’un programme parallèle sur les nœuds/processeurs d’une machine
parallèle à mémoire distribuée.
Une machine parallèle est constituée de :
nœuds/processeurs (ressources de calcul et de stockage) ;
réseau d’interconnexion.
Une machine à mémoire distribuée est :
une machine chaque processeur possède une mémoire locale qui ne
peut pas être directement accédée par les autres processeurs. Les
processeurs échangent des données via le réseau d’interconnexion.
Le problème de placement ne se pose pas pour une machine
monoprocesseur ou une machine/unité à mémoire partagée, telle que
les multi-cœurs ou les processeurs de cartes graphiques (GPU).
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 6
Réseau d’interconnexion (1/7)
Le réseau d’interconnexion relie entre eux les nœuds/processeurs
(ressources de calcul + mémoire) d’une machine parallèle.
Il faut p x (p -1) liens pour relier complètement entre eux les p
nœuds/processeurs d’une machine.
Réseau complet de 8 nœuds/processeurs
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 7
Réseau d’interconnexion (2/7)
La plupart des réseaux d’interconnexion sont incomplets, c’est-à-
dire qu’ils possèdent moins de p x (p -1) liens pour relier p processeurs.
Les messages qui échangés entre deux processeurs non directement
reliés entre eux doivent transiter par des processeurs intermédiaires.
Ces processeurs sont appelés des nœuds/processeurs de routage.
Le nombre de liens à franchir pour aller du processeur émetteur au
processeur récepteur représente la distance entre ces 2 processeurs.
La distance maximale entre deux processeurs représente le diamètre
du réseau.
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 8
Réseau d’interconnexion (3/7)
La ligne de processeurs :
Dans une ligne de processeurs de dimension p, chaque processeur est
connecté à 2 voisins immédiats à l’exception des extrémités.
L’anneau :
Dans un anneau de dimension p, tout processeur i est connecté aux
processeurs i +1 et i -1 modulo p.
Anneau de 4 processeurs
Ligne de 4 processeurs
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 9
Réseau d’interconnexion (4/7)
La grille :
Dans une grille de dimension d, chaque processeur (à l’exception de ceux
à la périphérie) est connecté à 2d voisins immédiats.
Grille 2d 4x4
Placement
A1-1 2012/2013
Aspects théoriques et algorithmiques du calcul réparti 10
Réseau d’interconnexion (5/7)
La grille torique :
Dans une grille torique de dimension d chaque processeur est connecté
à 2d voisins immédiats.
Tore 2d 4x4
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !