INTEL® Code Modernization Workshop 2016
Paris – 12 Octobre 2016
Conférence et atelier pour développeurs hautes-performances sur Intel® Xeon™ et Intel® Xeon Phi™
12 octobre 2016 Salon Etoile Wagram, 16 avenue de Wagram, 75008 Paris
Information et enregistrement: http://www.inteldevconference.fr Présentations en français
A G E N D A
08:30 09:00 Enregistrement et petit-déjeuner
09:00 09:15 BIENVENUE & INTRODUCTION
09:15 09:45 TOUT SUR LES NOUVEAUTÉS HARDWARE INTEL® XEON™ & XEON PHI™
Laurent Duhem, Intel Software
Vous en saurez plus sur les derniers progrès des architectures, les avancées techniques et caractéristiques de la dernière génération
et des futurs processeurs Intel, en particulier Intel® Xeon ™ et Intel® Xeon Phi ™ (connu sous le nom de Knights Landing, KNL).
09:45 10:15
NTEL® PARALLEL STUDIO XE EDITION
Ralph de Wargny, Intel Software
Quelles sont les nouveautés de la nouvelle version des outils Intel Parallel Studio XE2017: des performances des applications plus
rapides pour Python, le « Machine Learning » sur l'architecture Intel®. Comment évaluer rapidement les performances des
applications en utilisant des fonctionnalités de snapshot. Evolutivité pour les plates-formes de nouvelle génération, y compris le
dernier processeur Intel® Xeon Phi ™ et bien sûr créer un code plus rapide avec les compilateurs C ++, C, et Fortran grâce aux normes
des modèles de programmation parallèles: OpenMP, MPI et TBB.
10:15 10:30 Pause café
10:30 11:15
VECTORISATION & NOUVELLES APPROCHES DU PARALLELISME CORE (SIMD)
Asma Farjallah, Intel
La vectorisation est essentielle pour atteindre le plein potentiel de performance des processeurs modernes. L'outil de vectorisation
de Intel® Advisor priorise les boucles pour la vectorisation, vous donne des données d'optimisation critiques comme les
dépendances de données, nombre de cycles, les modes d'accès à la mémoire et il aide maintenant à optimiser pour les nouveaux
jeux d'instructions (AVX512) même sans accès au matériel le plus récent.
11:15 12:00
LE PYTHON HAUTE-PERFORMANCES
Ralph de Wargny, Intel Software
Cette conférence présentera la distribution Intel® récemment publié pour Python qui offre une accélération de haute performance
pour le calcul scientifique, l’analyse des données et le « Machine Learning ». Découvrez comment NumPy / SciPy peut désormais
exploiter tout le potentiel de performance de l'architecture du processeur parallèle en reliant les bibliothèques de performance
comme Intel® MKL (Math Kernel Library), Intel® MPI (Message de Passing Interface), Intel® TBB (Threading Building Blocks) et Intel®
DAAL (Data Analytics Library Acceleration).
12:30 14:00 Cocktail Déjeuner
14:00 14:45
TUNER LES APPLICATIONS HPC AVEC LA NOUVELLE VERSION DE INTEL VTUNE AMPLIFIER
Asma Farjallah, Intel
Nous explorerons les capacités spéciales de VTune Amplifier XE nouvel version de l’outil de profilage pour HPC, mettant en
évidence de nouvelles fonctionnalités et des cas d'utilisation à la fois pour Xeon et Xeon PHI (KNL) comme l'analyse "Access
Memory" qui aide à traquer les différentes questions liées à la mémoire, l’analyse de caractérisation de Performance HPC qui fournit
des métriques d'efficacité comme la mémoire liée, l'utilisation FPU et hybride MPI + l’ analyse OpenMP.
14:45 15:30
PREPARER ET OPTIMISER LE CODE POUR KNL AVANT D’AVOIR ACCES AU MATÉRIEL
Laurent Duhem, Intel Software
Dans cette session, nous allons montrer comment se préparer pour la dernière génération de l'architecture Intel avant d'avoir accès
au matériel réel. Nous donnerons des exemples concrets de la façon de se préparer pour les Xeon Phi Knights Intel® ™ Landing pour
vous assurer que votre code est «KNL Ready».
15:45 16:30
ETUDE DE CAS: MACHINE LEARNING ET K-MEANS CLUSTERING
François Fayard, Inside Loop
L’algorithme de k-means clustering est une méthode de partitionnement des données, populaire en machine learning. Nous
l’utiliserons ici afin de réduire le nombre de couleurs utilisées dans une image tout en conservant les couleurs les plus significatives.
Partant d’une implémentation naïve de cet algorithme, nous chercherons à la vectoriser puis à la paralléliser sur Xeon et Xeon-Phi
Knights Landing. L’optimisation permettra de faire une démonstration en live des outils Intel d’optimisation : VTune et Advisor.
16:30 17:15
François Fayard, Inside Loop
La décomposition LU est une des nombreuses méthodes pour la résolution d’un système linéaire. Dans cette étude de cas, nous
chercherons à optimiser la vectorisation et les accès mémoire pour la décomposition LU de matrices de taille inférieure à 128x128.
Notre optimisation se fera à la fois sur processeur Intel Xeon et Xeon Phi Knights Landing. Nous y parlerons de peel/remainder loop,
d’alignement de données et de loop tiling. Nous comparerons enfin les performances de notre implémentation avec celle
disponible dans la bibliothèque MKL.
17:15 17:30 Questions / Réponses
17:30 18:00 Networking
Copyright © 2016 Intel Corporation. All rights reserved. Intel and the Intel logo are trademarks of Intel Corporation in the U.S. and/or other countries. Version 5.0-fr – 24.09.2016
*Other names and brands may be claimed as the property of others.