Architecture matérielle –2
Constitution d’un multi-processeur : les cœurs
Un cœur (core /stream processor) a son propre jeu de registres
Un multiprocesseur = 32 cœurs + 48 Ko de mémoire partagée rapide
(aussi rapide que les registres — accès en 4 cycles)
Ils accèdent tous à la mémoire globale de la carte (2 Go — accès en 400
cycles)
Les 32 cœurs d’un multiprocesseur sont en SIMD (Single Instruction,
Multiple Data) : même instruction "en même temps", potentiellement sur
des données différentes
Cas des structures conditionnelles : tous les cœurs ne doivent pas
forcément faire la même chose ⇒certains cœurs seront oisifs (idle) et on
parle de divergence (= perte d’efficacité)
Denis Robilliard Introduction à la programmation // sur GPUs en CUDA et Python Séminaire LISIC 19/05/2011 5 / 24