Architecture des microprocesseurs (GIF-3000) Département de génie électrique et de génie informatique Automne 2016 Exercices formatifs Principes fondamentaux d’architecture 1. Fabrication de circuits imprimés Calculez le taux d’acceptation des dés (dice yield) pour les processeurs du tableau suivant. Supposez un facteur de complexité de fabrication de N = 14,5 et un taux d’acceptation des plaquettes de 1. Puce Taille du dé (mm2 ) Taux de défectuosité (par cm2 ) A B C 387 2×143 263 0,030 0,035 0,037 2. Fiabilité (a) Soit un système de stockage de données formé de trois disques durs (montés en RAID 5). La fiabilité individuelle de chacun des disques durs est de 850 000 heures (temps moyen avant une panne, MTTF). Supposons que le système soit robuste à une panne d’un disque dur, et que le temps moyen pour réparer la panne (MTTR) soit de 30 heures. Cependant, si un deuxième disque dur tombe en panne pendant la réparation, le système tombe dans un état invalide et des données sont perdues. Calculez le taux de panne du système relativement la perte de données (temps moyen avant de tomber dans un état invalide), en supposant que les pannes sont indépendantes. (b) Supposons que le temps de traitement pour une requête d’accès aux données sur les disques durs avec le système présenté en (a) soit parallélisable à 65 %, le 35 % du temps restant étant pour des opérations ne pouvant être faites que séquentiellement. Calculez le gain en performance offert par l’ajout d’un quatrième disque dur au système, relativement à l’utilisation du système avec trois disques. 3. Performances Vous devez choisir entre trois systèmes. Le tableau de la page suivante rapporte les performances sur un benchmark de mémoire et sur un benchmark de traitement pour chaque système. Vous savez que pour votre application, 35 % des traitements sont consacrés aux accès mémoire et le reste aux calculs. (a) Calculez la performance pondérée des benchmarks de chaque système. (b) Quel gain obtiendriez-vous en passant du système A au système B pour une application intensive en calculs ? (c) Avec quel ratio d’accès mémoire / traitements est-ce que la performance du système C seraitelle égale à la performance du système B ? 1 Description # de cœurs Fréquence d’horloge (GHz) Performance de la mémoire Performance en traitement (Dhrystone) Système A Système B Système C 1 2 2 3,0 2,4 2,8 3 290 2 539 2 890 20 183 34 502 36 082 4. Loi d’Amdahl Votre compagnie vient d’acheter un nouveau processeur à quatre cœurs et vous avez été chargé d’optimiser votre logiciel pour ce processeur. Vous allez rouler deux applications sur ce processeur, mais les besoins en ressources sont différents. La première application requiert 60 % des ressources et la seconde seulement 40 %. (a) En supposant que la première application est parallélisable à 80 %, quel gain pourriez-vous obtenir si cette application était exécutée seule sur le système ? (b) En supposant que la seconde application est elle parallélisable à 90 %, quel gain pourriez-vous obtenir si cette application était exécutée seule sur le système ? (c) En supposant que la première application est parallélisable à 80 %, quel gain global du système pourriez-vous obtenir si cette application était parallélisée, mais pas la seconde application ? (d) Quel gain global pourriez-vous obtenir si les deux applications étaient parallélisées, étant donné l’information dans les parties (a) et (b) ? 5. CPI Les mesures suivantes ont été prises pour un processeur donné : — Fréquences d’opérations à virgule flottante (VF) : 55 % — CPI moyen pour les opérations à VF : 3,0 — CPI moyen pour les autres opérations : 1,4 — Fréquence de calcul de la racine carrée : 5 % — CPI du calcul de la racine carrée : 18 Vous devez choisir entre deux designs alternatifs, le premier permettant de réduire le CPI du calcul de la racine carrée à 10 et l’autre permettant de réduire le CPI moyen de toutes les opérations à VF à 2,0. Comparez ces deux alternatives en utilisant l’équation de la performance des processeurs. 2 Solutions 1. — Puce A : 0,2034 — Puce B : 0,2507 — Puce C : 0,2602 2. (a) 0,244 FIT (b) 1,11 3. (a) Système A : 14 270, Système B : 23 315, Système C : 24 465 (b) 1,71 (c) Aucun ratio ne permet de rendre les deux systèmes égaux. 4. (a) 2,5 (b) 3,08 (c) 1,56 (d) 2,70 5. La meilleure alternative est celle réduisant le CPI moyen des opérations à virgule flottante. 12/09/2016 (révision : 19/09/2016) CG 3