Logiciels & systèmes Professionnels de l’embarqué Découvrez le système d’information le plus complet, 100% utile à votre métier ! Une newsletter quotidienne Votre fil d’actualité gratuit Une newsletter hebdo Tous les jeudis, des infos exclusives à forte valeur ajoutée Un magazine 100% numérique, trimestriel, pour une information fouillée, analysée et développée Un site Internet Plus de 1 500 articles par an exclusivement dédiés à l’embarqué Abonnez-vous •Pub 148x210.indd 1 www.lembarque.com 20/03/13 12:52 Cartes et modules Application Alliance performance/efficacité énergétique chez les derniers processeurs Core d’Intel Intel vient de lancer la 4e génération des processeurs Intel Core, les « Haswell ». Avec à la clé des améliorations importantes au niveau de la vectorisation, des calculs en virgule flottante et des performances graphiques. Mais avec une consommation qui demeure un peu plus élevée que ses devanciers, sans pour autant sacrifier l’efficacité énergétique. Une caractéristique à prendre en compte pour les cartes et modules à base d’Haswell, comme l’explique ici Congatec. Auteur Laurent Hennequin, Ingénieur d’application, responsable produit Embarqué chez Tokhatec. A vec l’arrivée de la 4e génération des processeurs de sa série Core, Intel est resté fidèle à son modèle « tick-tock » d’introduction de processeurs. Une approche liée aux annonces successives faites par le géant américain pour introduire ses CPU, l’une portant sur la mise en œuvre d’une technologie de gravure, c’est le « tick », puis l’autre amenant une nouvelle architecture sur le marché, un an plus tard, c’est le « tock ». L’introduction récente des processeurs Haswell est donc un « tock », car il porte sur le développement et l’optimisation d’une architecture, en particulier au niveau du microcode, alors que la technologie de gravure utilisée, le 22 nm, est la même que la génération précédente, celle des Ivy Bridge. La prochaine génération verra donc les processeurs Haswell fabriqués en technologie 14 nm, ce sera un « tick ». A long terme, un des traits marquants de cette nouvelle architecture est qu’elle va apporter des gains d’efficacité, pouvant aller jusqu’à 10 %. Toutefois, il faudra un certain temps avant que le firmware, les compilateurs, les systèmes d’exploitation et les applications puissent utiliser tous les avantages de cette nouvelle génération de processeurs. En fait, sur ce sujet de la consommation, avec les Haswell, on peut parler d’une évolution plus que d’une révolution, contrairement à l’introduction de son prédécesseur qui a conduit à une réduction significative de la dissipation énergétique grâce à la technologie de fabrication mise en œuvre (le 22 nm). Dans les systèmes embarqués, ces gains d’efficacité énergétique sont principalement utilisés pour augmenter les performances. C’est particulièrement évident si l’on regarde la partie graphique des Core de 4e génération qui procure des performances nettement plus importantes que ses devancières mais avec une consommation électrique légèrement plus élevée, au moins à pleine charge. Si bien que, grâce à des unités de régulation de tension nouvellement intégrées, l’enveloppe thermique des Haswell (le TDP, Thermal Design Power) spécifiée par Intel Tokhatec, un spécialiste français des systèmes à base de Computer On Module n Capable de fournir modules, porteuses et systèmes mais aussi le support associé, la société française Tokhatec propose une offre de produits et services adaptée aux contraintes techniques et économiques du marché de l’embarqué, son domaine d’intervention. Depuis sa création, Tokhatec, partenaire privilégié du fabricant allemand de cartes et modules Congatec, s’est développée en mettant l’accent sur la maîtrise technique de ses équipes. Ainsi, ses clients intègrent les dernières technologies de l’embarqué dans leurs propres solutions pour les rendre évolutives, en adéquation avec les besoins de leurs marchés. Via cette stratégie de services tournée vers les grands comptes, Tokhatec déploie en priorité des solutions à base de Computer On Module dans des projets stratégiques initiés par de grands groupes industriels français. augmente légèrement, au moins pour la première série de processeurs quatre cœurs embarqués qui fournit un TDP de 47 W pour le Core i7-4700EQ, à comparer aux 45 W pour ses prédécesseurs. La fréquence d’horloge maximale du système – via la fonction Turbo Boost des cœurs et du graphique – est à peu près la même que pour les modèles précédents, tandis que la fréquence d'horloge de base – sans la fonction Turbo Boost – est un peu plus faible. Des performances très élevées… Etant donné que ces valeurs de TDP sont des moyennes pondérées et non des valeurs maximales, l’augmentation de la consommation d’énergie est susceptible d’être encore plus significative lors du fonctionnement à puissance maximale. Une constatation qui exige des concepts d’évacuation de la chaleur dissipée plus sophistiqués que par le passé, comme par exemple la solution de refroidissement à caloduc brevetée de l’allemand Congatec (dont les solutions sont mise en œuvre en France par Tokhatec). Une approche qui permet, d’une part, de garantir que la performance de pointe peut effectivement être utilisée et, d’autre part, d’empêcher le circuit de protection d’abaisser les performances du processeur en raison d’une surchauffe (fonction dite de « downclocking »). D’autant plus que, sur ces architectures, Intel a réduit la température de surface maximale admissible de 105 à 100 degrés Celsius. L’EMBARQUÉ / N°2 / 35 Application Cartes et modules Un module COM Express très communicant n Le module COM Express conga- TS87 de Congatec est actuellement équipé avec le chipset QM87 Express d’Intel. Le module offre jusqu'à 16 Go de mémoire (1 600 MT/s fast LV 1,35 V double canal en mémoire DDR3). L'unité graphique intégrée est nettement plus puissante que dans les modèles précédents. Elle supporte les normes Flexible Display Interface (FDI), DirectX 11.1, OpenGL 4 et OpenCL 1.2, et le décodage matériel flexible avec décodage en parallèle de plusieurs vidéos Full HD haute résolution. Des résolutions de 4K x 2K allant jusqu'à 3 840 x 2 160 pixels avec le DisplayPort, et 4 096 x 2 304 avec la sortie HDMI sont aussi supportées nativement. Il est également possible de connecter La nouveauté la plus intéressante des processeurs Core de 4e génération est sans doute l’introduction de l’unité vectorielle AVX2, qui remplace l’AVX (Advanced Vector Extensions), lui-même successeur du SSE (Streaming SIMD Extensions). AVX a déjà été utilisé à la place du SSE dans la dernière génération des processeurs Intel pour améliorer les performances des calculs en virgule flottante via l’extension du jeux d’instructions vectorielles, porté de 128 à 256 bits, et via la fourniture de tampons plus puissants, en particulier un tampon de réordonnancement plus grand. Au sein des architectures Haswell, Intel a décidé d’aller plus loin en augmentant la taille des tampons, en ajoutant une ALU supplémentaire (Arithmetic Logic Unit, Unité arithmétique et logique) pour les entiers et en intégrant une deuxième unité de branchement à l’unité d’exécution. Au-delà, ces processeurs sont dotés d’un jeu d’instructions étendu avec un FMA (Fused Multiple Add) et un TSX (Transactional Synchronization Extension). jusqu'à trois interfaces d’affichage indépendant via le DVI ainsi que le LVDS et le VGA. Un support USB 3.0 natif garantit une transmission rapide des données avec un faible niveau de consommation. Huit ports USB sont prévus, dont quatre peuvent soutenir la norme SuperSpeed USB 3.0. Sept lignes PCI Express 2.0, un PCI Express 3.0 x16 graphique Le module COM Express conga-TS87 de Congatec est une carte COM Express Type 6 architecturée autour de la 4e génération des processeurs Core i7 d’Intel. ● Résultat, une instruction vectorielle unitaire atteint deux fois la puissance de calcul des modèles précédents, une évolution très visible lorsque l’on aborde des grands calculs en virgule fixes et flottantes. Pas tout à fait nouveau, mais plus que jamais d’actualité pour les applications courantes en raison des contraintes de sécurité qui pèsent de plus en plus sur les systèmes embarqués actuels, très connectés vers l’extérieur, est le bloc de cryptogra- Schéma de la carte conga-TS87 pour cartes graphiques externes, quatre ports SATA jusqu'à 6 Gbit/s supportant la fonction RAID, et une interface Ethernet Gigabit forment la partie communication. Contrôle du ventilateur, bus LPC pour une intégration facile des interfaces E/SE « Legacy » et « Intel High Definition Audio » complètent l'ensemble des fonctionnalités. phie qu’Intel a intégré au niveau matériel. L’AES-NI (Advanced Encryption Standard New Instruction), c’est son nom, assure le déchargement de paquets de calculs spécifiques intensifs et le cryptage des routines de l’algorithme cryptographique AES (Advanced Encryption Standard). Une approche qui permet un chiffrement de très haute performance sans surcharger les cœurs du processeur. D’autres améliorations sont à noter, notamment celles liées à la gestion d'énergie – un point clé pour de nombreux concepteurs de systèmes embarqués, car c’est le seul moyen de maîtriser une valeur de consommation basse tout en augmentant les performances. Enfin, notons que l’unité graphique intégrée prend en charge les dernières versions des spécifications DirectX (11.1), OpenGL (4.0) et OpenCL (1.2) avec une résolution native 4K x 2K (jusqu’à 3 840 x 2160 pixels avec le DisplayPort et 4 096 x 2 304 pixels avec le HDMI). Par ailleurs, un nouveau codec multi-format fait son apparition, avec la prise en charge du SVC (Scalable Video Coding) en plus des MPEG-1, -2, -4, AVC, et VC1. Des caractéristiques surdimensionnées pour l’embarqué ? Ces performances de pointe peuvent paraître à première vue peu intéressantes pour l’embarqué. Pourtant à y regarder de près, chacune des ces évolutions correspond à une tendance forte des systèmes embarqués. Par exemple, avec l’arrivée des services de type cloud, le chiffrement est une fonction de plus en plus importante pour les systèmes embarqués intelligents et connectés. Ainsi le « Full Disk and Endpoint Encryption » est devenu un standard pour 36 / L’EMBARQUÉ / N°2 Cartes et modules Application tous les systèmes mobiles contenant des données sensibles. Et il est tout simplement indispensable pour les SSD (Solid State Disks) au sein desquels il est virtuellement impossible d’effacer complètement les données, contrairement aux disques durs. Télémaintenance, stockage des données dans le cloud ou communication avec d’autres systèmes et/ou des partenaires externes… Dans tous ces cas de figure, ne pas crypter les données est une négligence très grave, voire inconcevable. Dans d’autres applications comme la compression des données ou la sauvegarde, la cryptographie est carrément l’élément clé qui garantit l’intégrité d’une base de données. La technologie AES-NI qui remplit cette fonction est déjà supportée par la plupart des systèmes d’exploitation et de nombreuses applications. Qu’Intel l’intègre au niveau matériel au sein des processeurs Haswell fait que désormais les petits systèmes embarqués pourront bénéficier d’une cryptographie puissante et sécurisée, sans sacrifier les performances lors de l’application. C’est une évolution très importante. Parallèlement, Intel a joué très clairement sur l’augmentation des performances pures, avec notamment l’extension des jeux d’instructions et de l’unité de calcul vectoriel, dont les prouesses ont plus que doublé par rapport aux générations antérieures. Ici, les applications embarquées qui bénéficient de ces caractéristiques sont les systèmes de calcul intensif, utilisés en simulation et en traitement d’images, dans des équipements de tomographie, des radars ou des systèmes d’inspection optique. Alternativement ou en complément, les unités intégrées de processeurs graphiques peuvent désormais être utilisées via le langage OpenCL, et le support 4K x 2K avec le nouveau codeur variable ouvre la voie aux applications embarquées multimédias ou de jeux. Côté technologie de fabrication, on l’a vu, les Haswell continuent de s’appuyer sur le 22 nm pour l’économiseur d’énergie mis en place avec la 3e génération. Les contrôleurs graphiques GT2 intégrés des processeurs embarqués actuels sont cependant équipés d'unités d'exécution supplémentaires (16 à l’heure dissipation thermique rapide sont essentiels. Un objectif toutefois difficile à réaliser sans la mise en œuvre de technologies complexes comme les caloducs et les grandes surfaces de refroidissement. Première implémentation sur carte COM ● On voit ici une carte porteuse de développement, intégrant la carte COM Express Type 6 conga-TS87. ● On voit ici les différents composants de la solution du système de refroidissement breveté par Congatec. actuelle, 20 prévues plus tard). Le chipset embarqué standard se compose donc de deux éléments comme avant. Les nouvelles fonctionnalités portent surtout sur des régulateurs de tension intégrés, dont l’objectif est de réduire le coût du processeur et de dégager de l’espace pour de futures évolutions. Avec comme contrepartie, une dissipation de puissance accrue, compensée cependant, au moins partiellement, par une meilleure efficacité. Ainsi, avec un TDP de 47 W spécifié, le modèle haut de gamme Core i7-4700EQ atteint clairement des niveaux critiques pour les systèmes embarqués sans ventilateur. Un système de refroidissement haute performance est donc devenu presque indispensable pour cette génération de processeur. En raison justement du régulateur de tension interne qui impose une réduction des niveaux de températures maximales autorisées et la limitation des points chauds associés. Si bien qu’en sus d’un refroidissement efficace, un diffuseur thermique de chaleur et une Le module au standard COM Express Type 6 conga-TS87 de Congatec cherche à tirer pleinement parti du contrôleur graphique intégré avec des interfaces numériques étendues d'affichage, des bandes passantes élevées avec les liens USB 3.0, PCI 3.0 et PCI Express. Ce module architecturé autour du Core i7-4700EQ à quatre cœurs, doté de 6 Mo de mémoire cache L2, peut être alimenté par les quatre cœurs cadencés à 2,4 GHz avec une enveloppe thermique de 47 W. En mode « turbo boost », la fréquence d’horloge atteint 3,4 GHz et, si le processeur commence à être en surchauffe, le mode « downclocked » est activé. Il est clair avec ce type de fonctionnement qu’une solution de refroidissement efficace avec une dissipation rapide de la chaleur peut augmenter de façon significative la performance globale. Or, dans les systèmes embarqués compacts, il n’y a pas de moyen simple de dissiper un TDP de 47 W. La solution proposée par Congatec (brevet en instance de validation) porte sur un concep de refroidissement modulaire. Les coupleurs thermiques indépendants, chacun équipé de leur propre caloduc, dissipent la chaleur du CPU et du chipset loin des composants vers un bloc dissipateur thermique spécifique. De là, la chaleur est ensuite évacuée directement dans l’air ambiant à des niveaux inférieurs d’une puissance d’environ 37 W et dans des conditions normales de refroidissement au moyen d’un dissipateur de chaleur intégré. Pour les plus grands TDP et dans la gamme de températures étendue, le dissipateur thermique peut être monté directement sur un boîtier métallique ou sur un dispositif approprié. n L’EMBARQUÉ / N°2 / 37