INTEL® Code Modernization Workshop 2016 Paris – 12 Octobre 2016 Conférence et atelier pour développeurs hautes-performances sur Intel® Xeon™ et Intel® Xeon Phi™ 12 octobre 2016 Salon Etoile Wagram, 16 avenue de Wagram, 75008 Paris Information et enregistrement: http://www.inteldevconference.fr AGENDA 08:30 09:00 Enregistrement et petit-déjeuner 09:00 09:15 BIENVENUE & INTRODUCTION 09:15 09:45 Présentations en français TOUT SUR LES NOUVEAUTÉS HARDWARE INTEL® XEON™ & XEON PHI™ Laurent Duhem, Intel Software Vous en saurez plus sur les derniers progrès des architectures, les avancées techniques et caractéristiques de la dernière génération et des futurs processeurs Intel, en particulier Intel® Xeon ™ et Intel® Xeon Phi ™ (connu sous le nom de Knights Landing, KNL). INTEL® PARALLEL STUDIO XE EDITION 2017 – LES NOUVEAUTÉS Ralph de Wargny, Intel Software 09:45 10:15 10:15 10:30 Quelles sont les nouveautés de la nouvelle version des outils Intel Parallel Studio XE2017: des performances des applications plus rapides pour Python, le « Machine Learning » sur l'architecture Intel®. Comment évaluer rapidement les performances des applications en utilisant des fonctionnalités de snapshot. Evolutivité pour les plates-formes de nouvelle génération, y compris le dernier processeur Intel® Xeon Phi ™ et bien sûr créer un code plus rapide avec les compilateurs C ++, C, et Fortran grâce aux normes des modèles de programmation parallèles: OpenMP, MPI et TBB. Pause café VECTORISATION & NOUVELLES APPROCHES DU PARALLELISME CORE (SIMD) Asma Farjallah, Intel 10:30 11:15 La vectorisation est essentielle pour atteindre le plein potentiel de performance des processeurs modernes. L'outil de vectorisation de Intel® Advisor priorise les boucles pour la vectorisation, vous donne des données d'optimisation critiques comme les dépendances de données, nombre de cycles, les modes d'accès à la mémoire et il aide maintenant à optimiser pour les nouveaux jeux d'instructions (AVX512) même sans accès au matériel le plus récent. LE PYTHON HAUTE-PERFORMANCES Ralph de Wargny, Intel Software 11:15 12:00 12:30 14:00 Cette conférence présentera la distribution Intel® récemment publié pour Python qui offre une accélération de haute performance pour le calcul scientifique, l’analyse des données et le « Machine Learning ». Découvrez comment NumPy / SciPy peut désormais exploiter tout le potentiel de performance de l'architecture du processeur parallèle en reliant les bibliothèques de performance comme Intel® MKL (Math Kernel Library), Intel® MPI (Message de Passing Interface), Intel® TBB (Threading Building Blocks) et Intel® DAAL (Data Analytics Library Acceleration). Cocktail Déjeuner TUNER LES APPLICATIONS HPC AVEC LA NOUVELLE VERSION DE INTEL VTUNE AMPLIFIER Asma Farjallah, Intel 14:00 14:45 Nous explorerons les capacités spéciales de VTune Amplifier XE nouvel version de l’outil de profilage pour HPC, mettant en évidence de nouvelles fonctionnalités et des cas d'utilisation à la fois pour Xeon et Xeon PHI (KNL) comme l'analyse "Access Memory" qui aide à traquer les différentes questions liées à la mémoire, l’analyse de caractérisation de Performance HPC qui fournit des métriques d'efficacité comme la mémoire liée, l'utilisation FPU et hybride MPI + l’ analyse OpenMP. PREPARER ET OPTIMISER LE CODE POUR KNL AVANT D’AVOIR ACCES AU MATÉRIEL 14:45 15:30 15:30 15:45 Laurent Duhem, Intel Software Dans cette session, nous allons montrer comment se préparer pour la dernière génération de l'architecture Intel avant d'avoir accès au matériel réel. Nous donnerons des exemples concrets de la façon de se préparer pour les Xeon Phi Knights Intel® ™ Landing pour vous assurer que votre code est «KNL Ready». Pause café ETUDE DE CAS: MACHINE LEARNING ET K-MEANS CLUSTERING François Fayard, Inside Loop 15:45 16:30 L’algorithme de k-means clustering est une méthode de partitionnement des données, populaire en machine learning. Nous l’utiliserons ici afin de réduire le nombre de couleurs utilisées dans une image tout en conservant les couleurs les plus significatives. Partant d’une implémentation naïve de cet algorithme, nous chercherons à la vectoriser puis à la paralléliser sur Xeon et Xeon-Phi Knights Landing. L’optimisation permettra de faire une démonstration en live des outils Intel d’optimisation : VTune et Advisor. ETUDE DE CAS: DECOMPOSITION LU SUR DE PETITES MATRICES François Fayard, Inside Loop La décomposition LU est une des nombreuses méthodes pour la résolution d’un système linéaire. Dans cette étude de cas, nous chercherons à optimiser la vectorisation et les accès mémoire pour la décomposition LU de matrices de taille inférieure à 128x128. Notre optimisation se fera à la fois sur processeur Intel Xeon et Xeon Phi Knights Landing. Nous y parlerons de peel/remainder loop, d’alignement de données et de loop tiling. Nous comparerons enfin les performances de notre implémentation avec celle disponible dans la bibliothèque MKL. 16:30 17:15 17:15 17:30 Questions / Réponses 17:30 18:00 Networking Copyright © 2016 Intel Corporation. All rights reserved. Intel and the Intel logo are trademarks of Intel Corporation in the U.S. and/or other countries. *Other names and brands may be claimed as the property of others. Version 5.0-fr – 24.09.2016