2.4 Extensibilit´e
On consid`ere deux mod`eles de performances, qui ´evaluent l’interaction entre taille du probl`eme,
temps d’ex´ecution et parall´elisme.
- M´emoire constante (MC) : l’encombrement m´emoire par processeur est fix´ee. RMC est le rapport
entre le temps d’ex´ecution du probl`eme trait´e sur pprocesseurs et le temps d’ex´ecution du probl`eme
initial sur 1 processeur.
- Temps de r´eponse constant (TC) : le temps d’ex´ecution est fixe. RTC est le rapport entre
l’encombrement m´emoire total du probl`eme trait´e sur pprocesseurs et l’encombrement m´emoire du
probl`eme initial sur 1 processeur.
Produit de matrices
Un algorithme s´equentiel de param`etre caract´eristique neffectue n3calculs sur n2donn´ees (exemple
produit de matrices). On suppose l’algorithme parfaitement parall´elisable.
1. Sur 1 processeur, on peut traiter un probl`eme de param`etre 8 en temps 1. Quel probl`eme peut-
on traiter sur 4 processeurs en MC ? Quel est le temps d’ex´ecution parall`ele ? Quel probl`eme
peut-on traiter sur 4 processeurs en TC ? Quel est l’encombrement m´emoire total ? parall`ele ?
2. Calculer le param`etre caract´eristique de l’algorithme parall´elis´e sur une machine `a pprocesseurs
(not´e n(p)) dans le mod`ele MC et dans le mod`ele TC.
3. Calculer RMC et RTC.
Tree-codes
La complexit´e s´equentielle de l’algorithme de Barnes-Hut est O(∆t−1θ−2Nlog N). Lorsque cet
algorithme est appliqu´e `a la simulation de l’´evolution des galaxies, il pr´esente trois facteurs d’er-
reurs : la r´esolution spatiale contribue pour 1/√N; la r´esolution temporelle contribue pour ∆t2et
l’approximation pour θ2. On suppose les erreurs ind´ependantes, i.e.
E=a1
√N+b∆t2+cθ2.
1. On multiplie Npar k. Par quel facteur faut-il multiplier les autres param`etres pour obtenir une
´evolution coh´erente de l’erreur ? Calculer alors la nouvelle complexit´e s´equentielle.
2. On suppose l’application compl`etement parall´elisable. Comparer la r´esolution spatiale obtenue
par un scaling naif (on ne tient pas compte de l’influence de ∆tet θsur l’erreur) et par un
scaling coh´erent, dans le mod`ele TC.
3. En imposant un temps de r´eponse constant ´egal `a celui de la configuration 1M, 1 processeur,
comparer le nombre de processeurs n´ecessaires pour multiplier la r´esolution spatiale par 16 en
scaling na¨ıf et en scaling coh´erent.