Architectures avancées : Introduction Daniel Etiemble [email protected] Les grandes classes de système Caractéristique Ordinateur de bureau Serveur Enfoui/embarqué Prix du microprocesseur 100 à 1000 € 200 à 2000 € par processeur 0,20 à 200 € par processeur Microprocesseurs vendus en 2000 150 millions 4 millions 300 millions (en ne comptant que les 32 et 64 bits) Critères Prixperformance Performance graphique Débit, disponibilité, extensibilité Prix, puissance dissipée, performance pour l’application M1 Informatique 2004-2005 Architectures avancées D. Etiemble 2 1 Ventes des microprocesseurs (fin du siècle dernier ☺) • Processeurs enfouis/embarqués – – – – 4 bits : 2 milliards 8 bits : 4,7 milliards 16 bits : 700 millions 32 bits : 400 millions • DSP (traitement du signal) – 600 millions • Généralistes classiques – 150 millions M1 Informatique 2004-2005 Architectures avancées D. Etiemble 3 Les applications • • • • • • • • Usage général Calcul Scientifique GRAPHIQUE Traitement du signal JAVA BD WEB Enfoui et embarqué M1 Informatique 2004-2005 Architectures avancées D. Etiemble 4 2 Gammes de processeurs • Haut de gamme • Contraintes – Processeurs des PC et serveurs – – – – – • Spécialisé – Haut de gamme des générations précédentes Ex : MIPS « enfouis » Prix Performance Encombrement Consommation Temps réel • temps d’exécution déterministe ou non • Spécialisé embarqué – Faible consommation – Temps réel M1 Informatique 2004-2005 Architectures avancées D. Etiemble 5 Performance : Microprocesseur Texécution = NI * CPI * Tc = NI IPC * F Temps de cycle Nombre de cycles/Instruction 10000 1000 CPU 100 Microarchitecture (IPC) F(MHz) 10 M1 Informatique 2004-2005 Technologie 96 20 00 92 88 84 80 1 Architectures avancées D. Etiemble 6 3 DES EXPONENTIELLES MICROPROCESSEURS 2x/1,5an CPU Performance après 1987 Performance avant 1986 Fréquence d'horloge (MOS) Evolution/an 0% M1 Informatique 2004-2005 10% 20% 30% 40% 50% 60% Architectures avancées D. Etiemble 7 DES EXPONENTIELLES MEMOIRES 2x/1,5an 0,5/10 ans Bande pas s ante Latence Quantité/Prix Capacité 0% Evolution/an M1 Informatique 2004-2005 20% DISK Architectures avancées D. Etiemble 40% 60% DRAM 8 4 Moore’s Law Transistors Per Die 108 256M 106 16M 4M 1M 256K 105 i486™ 64K 4K 16K 104 1K 80286 Pentium® Pentium® III Pentium® II Pentium® Pro i386™ 8086 103 102 64M Memory Microprocessor 107 4004 8080 101 100 ’70 ’73 ’76 ’79 ’82 ’85 ’88 ’91 ’94 '97 2000 Source: Intel M1 Informatique 2004-2005 Architectures avancées D. Etiemble 9 LES DIFFERENTIELS 10000 1000 CPU 100 Mémoire 10 2000 98 96 94 92 90 88 86 84 82 80 1 Complexité croissante de la hiérarchie mémoire : L1, L2, L3, MP M1 Informatique 2004-2005 Architectures avancées D. Etiemble 10 5 Power Density 1000 Nuclear Nuclear Reactor Reactor 2 Watts/cm 100 Rocket Nozzle Pentium® 4 Hot plate 10 Pentium® III Pentium® II Pentium® Pro Pentium® i386 i486 1 1.5µ 1µ 0.7µ 0.5µ 0.35µ 0.25µ 0.18µ 0.13µ 0.1µ 0.07µ * “New Microarchitecture Challenges in the Coming Generations of CMOS Process Technologies” – Fred Pollack, Intel Corp. Micro32 conference key note - 1999. M1 Informatique 2004-2005 Architectures avancées D. Etiemble 11 Evolution de la puissance (à taille de puce constante) 250 Watts 200 Active Pwr 75 Power Density 150 50 100 25 50 0 Power Density (W/cm2) 100 Lkg Pwr ~15mm die 1.5X freq increase each generation 0 0.25µ M1 Informatique 2004-2005 0.18µ 0.13µ 0.1µ Architectures avancées D. Etiemble Limiters: Limiters: 1. 1. Power Powerdissipation, dissipation, 2. Power delivery, 2. Power delivery, and and 3. 3. Power Powerdensity density 12 6 Durée de vie de la batterie (PDA) 1990 (concept) 1996 2002 MessagePad Palm/PocketPC Size Tablet Coat pocket Shirt Pocket Weight 4-6 lbs Under 1 lb < 1/4 lb Cost <$4000 < $1000 < $500 Days Weeks Battery Life 3-4 hrs M1 Informatique 2004-2005 Architectures avancées D. Etiemble 13 Plan du cours • Jeux d’instructions – – • Impact performance Impact taille du code Pipelines – – Simple, superpipeline et superscalaire : impact sur la performance Impact des branchements • • • • Instructions SIMD Hiérarchie mémoire – Caches et impact sur la performance • • – Monoprocesseur Cohérence des caches dans les multiprocesseurs Alternatives aux caches • • • • Prédicteurs Alternative : instructions conditionnelles et prédicats (ARM, IA-64) Processeurs vectoriels Mémoire scratch-pad DSP et microcontrôleurs Graphique – – Cartes graphiques Processeurs graphiques et processeurs multimédia M1 Informatique 2004-2005 Architectures avancées D. Etiemble 14 7