Architectures avancées : Introduction Daniel Etiemble [email protected] Les ordinateurs : de 1946 à aujourd’hui • ENIAC (1946) – – – – 19000 tubes 30 tonnes surface de 72 m2 consomme 140 kilowatts. Horloge : 100 KHz. – ≈ 330 multiplications/s • Mon portable (2006) – Intel Duo Processor 2GHz – 1 Go DRAM, 100 Go disque – 1, 9 kg M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 2 1 « Systèmes informatiques » M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 3 Systèmes embarqués ou enfouis • “Ordinateurs” camouflés Sony Playstation 2 Casio Camera Watch Nokia 7110 Browser Phone Philips TiVo Recorder Philips DVD player M2R Nouveaux Systèmes Informatique 2010-2011 Prof. Stephen A. Edwards of Columbia University Tronc commun architecture D. Etiemble 2 Les grandes classes de système Caractéristique Ordinateur de bureau Serveur Enfoui/embarqué Prix du microprocesseur 100 à 1000 € 200 à 2000 € par processeur 0,20 à 200 € par processeur Microprocesseurs vendus en 2000 150 millions 4 millions 300 millions (en ne comptant que les 32 et 64 bits) Critères Prixperformance Performance graphique Débit, disponibilité, extensibilité Prix, puissance dissipée, performance pour l’application M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 5 Ventes des microprocesseurs (fin du siècle dernier ☺) • Processeurs enfouis/embarqués – – – – 4 bits : 2 milliards 8 bits : 4,7 milliards 16 bits : 700 millions 32 bits : 400 millions • DSP (traitement du signal) – 600 millions • Généralistes classiques – 150 millions M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 6 3 Gammes de processeurs • Haut de gamme • Contraintes – Processeurs des PC et serveurs • Spécialisé – Haut de gamme des générations précédentes Ex : MIPS « enfouis » – – – – – Prix Performance Encombrement Consommation Temps réel • temps d’exécution déterministe ou non • Spécialisé embarqué – Faible consommation – Temps réel M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 7 Les applications • • • • • • • • Usage général Calcul Scientifique GRAPHIQUE Traitement du signal JAVA Bases de données WEB Enfoui et embarqué M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 8 4 “Roadmap” des applications enfouies M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 9 “Roadmap” du traitement enfoui x 40 Source ITRS Design ITWG July 2003 Process Technology (nm) Operation voltage (V) Clock frequency (MHz) Application (MAX performance required) Application (Others) 130 1,2 150 90 65 45 32 1 0,8 0,6 0,5 300 450 600 900 Real Time Video Codec Real Time Interpretation Still Image Processing MPEG4/CIF Web Browser TV phone (1:1) TV phone (>3:1) Voice recognition (input) Voice recognition (operation) Electric mailer Scheduler Authentification (Crypto engine) Processing Performance (GOPS) 0,3 2 14 77 461 Parallelism factor 1 4 4 4 4 Communication speed (Kbps) 64 384 2304 13824 82944 Energy Efficiency (MOPS/mW) 3 20 140 770 4160 Peak Power Concumption (mW) 100 100 100 100 100 Stand-by Power Concumption (mW) 2 2 2 2 2 Battery Capacity (Wh/kg) 120 200 400 22 0,4 1200 2458 4 497664 24580 100 2 Performance Efficacité énergétique (MOPS/mW) Puissance dissipée Capacité batterie M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 10 5 Exemple : industrie automobile Hétérogénéité M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble Sources : C. Balle – Renault 11 Les moteurs de l’évolution • Les contraintes économiques – Lois économiques – Volumes de vente PCs MARCHE GRAND PUBLIC Consoles de jeux PDA Stations M2R Nouveaux Systèmes Informatique 2010-2011 Intel, Microsoft Sony, 3Com, Sun Tronc commun architecture D. Etiemble 12 6 Le modèle économique Intel Nouveau modèle plus performant tous les x années Performance relative 40 30 20 10 0 0 1 Années 2 3 4 5 6 Disponible M2R Nouveaux Systèmes Informatique 2010-2011 7 8 9 10 Besoins Tronc commun architecture D. Etiemble 13 Un autre modèle économique Performance supérieure aux besoins de « masse » Performance relative 40 30 20 10 0 0 1 2 Années 3 4 5 Disponible 6 7 8 9 10 Besoins Recherche des “killer applications” applications” M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 14 7 Killer Application M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 15 Performance : Microprocesseur Texécution = NI * CPI * Tc = NI IPC * F Temps de cycle Nombre de cycles/Instruction 10000 1000 CPU 100 Microarchitecture (IPC) F(MHz) 10 M2R Nouveaux Systèmes Informatique 2010-2011 96 20 00 92 88 84 80 1 Tronc commun architecture D. Etiemble Technologie 16 8 DES EXPONENTIELLES MICROPROCESSEURS 2x/1,5an CPU Performance après 1987 Performance avant 1986 Fréquence d'horloge (MOS) 0% Evolution/an M2R Nouveaux Systèmes Informatique 2010-2011 10% 20% 30% 40% 50% 60% Tronc commun architecture D. Etiemble 17 DES EXPONENTIELLES MEMOIRES 2x/1,5an 0,5/10 ans Bande passante Latence Quantité/Prix Capacité 0% Evolution/an M2R Nouveaux Systèmes Informatique 2010-2011 20% DISK Tronc commun architecture D. Etiemble 40% 60% DRAM 18 9 La loi de Moore Transistors par puce 108 256M Mémoire Microprocesseur 107 106 256K i486™ i486™ 64K 4K 16K 1K 80286 Pentium® Pentium® III Pentium® II Pentium® Pro i386™ i386™ 8086 103 102 4M 1M 105 104 16M 64M 4004 8080 101 100 ’70 ’73 ’76 ’79 ’82 ’85 ’88 ’91 ’94 '97 2000 Source: Intel M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 19 Processeurs Intel : nombre de transistors l’année d’introduction 1000000000 Itanium2 P4 Nb de transistors 100000000 10000000 1000000 i486 100000 i286 10000 1000 PIIPIII Pentium Itanium2 Itanium i386 8086 4004 8080 100 10 1 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 20 10 LES DIFFERENTIELS 10000 1000 CPU 100 Mémoire 10 2000 98 96 94 92 90 88 86 84 82 80 1 Complexité croissante de la hiérarchie mémoire : L1, L2, L3, MP M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 21 La densité de puissance 1000 Nuclear Nuclear Reactor Reactor 2 Watts/cm 100 Rocket Nozzle Pentium® Pentium® 4 Hot plate 10 Pentium® Pentium® III Pentium® Pentium® II Pentium® Pentium® Pro Pentium® Pentium® i386 i486 1 1.5µ 1µ 0.7µ 0.5µ 0.35µ 0.25µ 0.18µ 0.13µ 0.1µ 0.07µ * “New Microarchitecture Challenges in the Coming Generations of CMOS CMOS Process Technologies” Technologies” – Fred Pollack, Intel Corp. Micro32 conference key note - 1999. M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 22 11 Multiprocesseurs et puissance (d’après F. Anceau) M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 23 Le grand virage… • Evolution des processeurs pour PC (Intel, AMD) – De l’augmentation de la fréquence d’horloge… – Au parallélisme • Hyperthread • Multi-cœurs M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 24 12 Processeurs Intel et AMD : Multithread et Multiprocesseurs Processeur logique 1 Etat archit. (registres) Processeur logique 2 Processeur physique 1 Etat archit. (registres) Etat archit. (registres) Unités fonctionnelles Unités fonctionnelles Caches Caches Mémoire principale M2R Nouveaux Systèmes Informatique 2010-2011 Processeur physique 2 Etat archit. (registres) Unités fonctionnelles Caches Mémoire principale Tronc commun architecture D. Etiemble 25 Puissance et énergie Energie • “Capacité à faire quelque chose d’utile” • Important pour – Durée de vie des piles et batteries – Facture d’électricité • Mesurée au cours du temps • Proportionnelle à la somme des capacités et au carré de la tension (CV2) M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 26 13 Les batteries Batteries au lithium : 1992 : 90 Wh/kg, 2000 : 140 à 160 Wh/kg . 2007 : de 190 à 200 Wh/kg. Source : CEA M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 27 Puissance et énergie Puissance • Travail effectué par unité de temps • – Mesuré en Watts P = αCV2f (α : activité, C: capacités, V: tension, f : fréquence) • “Mesurée” à sa valeur maximale • Plus de puissance Plus de courant – Ne peut dépasser les contraintes de puissance maximale disponible • Plus de puissance Température plus élevée – Ne peut dépasser les contraintes thermiques M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 28 14 Evolution de la puissance (à taille de puce constante) 250 100 Watts 200 150 Puissance utile 75 Puissance/cm2 50 100 25 50 0 Puissance (W/cm2) Puissance fuite ~ puce 15mm Fréquence X 1.5 chaque génération 0 0.25µ 0.18µ 0.13µ M2R Nouveaux Systèmes Informatique 2010-2011 0.1µ Limites: Limites: 1. 1.Puissance Puissance dissipée, dissipée, 2. Alimentation, 2. Alimentation, et et 3. 3. Densité Densité de de puissance puissance Tronc commun architecture D. Etiemble 29 Le spectre d’implémentation Microprocesseur Matériel Reconfigurable ASIC – ASIC • Haute performance – dédié à l’application • Non modifiable – Processeur • Programmable • Non dédié à l’application – Matériel reconfigurable • Bon compromis M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 30 15 M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 31 Espace d’implémentation M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 32 16 Un grand défi : la réduction de l’énergie consommée et de la puissance dissipée • Effort à tous les niveaux – – – – – Niveau technologique Niveau circuit/logique Niveau architectural Niveau algorithmique Niveau système M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 33 Systèmes multiprocesseurs sur puce (MPSoC) Méthodologies de conception DSP MMU External Memory IP CORE D$ Engine I$ CONTROL BUS IP Platform IP IP . . CONTROL BUS . Middleware / OS Niveau d’abstraction considéré IP MEMORY BUS Application IP Conception à base de plateformes RISC CORE D$ Engine I$ SW HW RTL RTL TA SW Mers de processeurs Portes Blocs matériels + logiciel Transistors Mer de portes Mer de transistors Dessins de masques Années 70’s 80’s M2R Nouveaux Systèmes Informatique 2010-2011 Années 90 (début) Tronc commun architecture D. Etiemble Années 90 (fin) 2005+ 34 17 Les écarts de productivité • Évolution comparée du temps de conception d’un circuit et du nombre de portes disponibles Écart de productivité de conception 10,000 100,000 1,000 10,000 100 Transistors par 10 puce 1 (en millions) 0.1 Capacité des circuits intégrés Ecart 10 1 productivité 0.01 1000 100 Productivité (K)Transistors par Homme-Mois. 0.1 0.001 M2R Nouveaux Systèmes Informatique 2010-2011 2009 2007 2005 2001 2003 1999 1997 1993 1995 1989 1991 1985 1987 1981 1983 0.01 Tronc commun architecture D. Etiemble 35 Où va l’effort de conception ? Logiciel Matériel Source : IBS 2002 M2R Nouveaux Systèmes Informatique 2010-2011 Tronc commun architecture D. Etiemble 36 18 Les technologies du futur • • • • Les interconnexions devenant prédominante, jouer sur la fréquence d’horloge n’est plus efficace La puissance de fuite devient plus importante que la puissance active La dispersion des composants augmentent (problèmes de conception, de rendement) La conception traditionnelle “pire cas” devient trop pessimiste. 2.2 Performances relatives de l’inverseur (sortance 4) 2.0 1.8 fast process T=-40degC 1.6 1.4 1.2 typ process T=25degC 1.0 slow process T=125degC 0.8 Performance degradation!!! 0.6 0.19 0.17 CMOS18 M2R Nouveaux Systèmes Informatique 2010-2011 0.15 0.13 0.11 CMOS090 0.09 0.07 0.05 CMOS065 CMOS12 Tronc commun architecture D. Etiemble 37 19