Accélération
SIMD d’un calcul
matriciel :
comparaison de trois
plateformes
Matthijs Douze
IRIT/ENSEEIHT
1/14
Plan
— Principe
— Utilisation
— Expérimentations
2/14
Extension de l’architecture
fetch/decode
ALU
exec
FPU
vector
cache
bus
mémoire
Principe 3/14
Registres vectoriels
128 bits
16 octets
8 * 16 bits
(signé/non-signé)
4 * 32 bits
(entier/flottant)
2 * 64 bits
0
127
0
7
0
15
0
31
0
63
Principe 4/14
Opérations vectorielles
e/s mémoire
ordonnancement
logiques
arithmétiques
comparaisons, min/max
Principe 5/14
+
+
+
+
1 / 14 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !