L`importance de l`architecture

publicité
Systèmes Power;
Une innovation pour mettre en œuvre les données
L’importance de l'architecture
Bureau de projet concurrentiel IBM
Démontrer la valeur de la technologie IBM
Copies : http://www.ibm.com/systems/cpo/powersystems/downloads.html
© 2014 IBM Corporation
Bureau de projet concurrentiel
L'architecture Power est conçue avec un objectif
POWER8 est conçu pour les charges de travail importantes :
Analytique
Java
Données
volumineuses
POWER8
OLTP
ERP
Nuage
Mobile
Médias
sociaux
Intel est conçu pour de multiples marchés :
téléphones intelligents, ultrabooks, ordinateur de bureau, serveurs
2
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
POWER8 – Chef de file technologique fortement amélioré prêt pour
des charges de travail plus importantes
Une conception intentionnelle équilibrée qui offre
un nouveau record de performance
Plus de noyaux
Plus de fils
12 noyaux de processeurs par interface de connexion (50 %
plus qu'auparavant) qui offrent une performance par noyau
2 fois supérieure
SMT8 – 8 fils dynamiques par noyau, prenant
dynamiquement en charge les modes SMT1, 2, 4, et 8 à
l'aide d'une machine virtuelle
Qu'est-ce que cela implique?
Performance d'évolutivité verticale améliorée et un débit
plus élevé par noyau de serveur d'évolutivité horizontale
Qu'est-ce que cela implique?
Vous choisissez – Déployez une machine virtuelle en mode
optimal SMT selon les besoins de l'application
Plus de cache
Plus de bande passante
3X plus de cache de processeur que POWER7 – ainsi que
128 Mo de nouvelle cache sans processeur
3,5X plus de mémoire et 2,8X fois plus de bande passante
d'E-S que POWER7
Qu'est-ce que cela implique?
Les applications exigeantes en mémoire performeront de
façon favorable puisque la latence de mémoire est réduite
Qu'est-ce que cela implique?
Les applications gourmandes en données (comme
Mégadonnées et analytique) réagiront deux fois plus
rapidement et feront une mise à l'échelle de façon plus
efficace.
3
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
POWER8 – De nouvelles innovations qui augmentent la performance
L'innovation qui ouvre les portes vers de nouveaux modèles informatiques
CAPI
Mémoire transactionnelle
Technologie CAPI (Coherent Accelerator Processor
Interface) qui permet aux dispositifs PCIe de participer aux
opérations à la vitesse de la mémoire sans aucun risque
Qu'est-ce que cela implique?
Bénéficie de la performance de l'application par ordre de grandeur
(10X – 100X) grâce à la technologie de carte PCI
Amélioration de la mise à l'échelle
Structure Symmetric Multi-Processing (SMP) avec un
maximum de 2 tronçons, même sur les plus gros serveurs.
Qu'est-ce que cela implique?
L'ajout de plus de processeurs au système aurait pour effet
une performance de mise à l'échelle linéaire.
4
Technologie du grand système d'IBM accélérant les
écritures de la mémoire en réduisant la contention de
verrouillage
Qu'est-ce que cela implique?
Améliore la performance en permettant plus de parallélisme
pour les applications
Surcadencer dynamique
Un nouveau contrôleur de processeur s'exécute en temps réel
pour répondre aux variations des charges de travail en ajustant la
fréquence et le voltage par noyau.
Qu'est-ce que cela implique?
Gestion automatique pour ajuster la vitesse du processeur de
façon dynamique pour améliorer la performance tout en
assurant l'intégrité du RAS. Réponse aux modifications des
charges de travail accélérée jusqu'à 100 comparativement à
POWER7+
02 L'importance de l'architecture
×
© IBM Corporation 2014
Bureau de projet concurrentiel
L'architecture est importante lors de la conception d'un
microprocesseur pour les charges de travail émergentes importantes
Il n'est pas question du nombre de transistors, mais de ce que vous faites
avec ceux-ci pour gérer les charges de travail importantes
POWER8 comparativement à Ivy Bridge EX
POWER7 à POWER8
1,2 milliard
Transistors
567 mm
45 nm à
22 nm
4,2 milliards
Transistors
650 mm 2
Westmere EX à Ivy Bridge EX
2,6 milliards
Transistors
513 mm
5
32 nm à
22 nm
4,3 milliards
Transistors
541 mm 2
- 96 fils/interfaces de connexion
comparativement à 30
- 4x plus de bande passante de mémoire
- 3x plus de mémoire cache intégrée
-Latence de cache réduite de 50 %
-Mémoire transactionnelle
- 5x plus de bande passante d'E-S
- 15 niveaux de métallisation comparativement
à9
- eDRAM comparativement à SRAM
Technologie unique à POWER8
- Technologie CAPI
- Cache L4
- Surcadençage dynamique
- Amélioration de la mise à l'échelle
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Le processeur POWER8 est conçu dans cette optique ce
qui permet d'offrir une performance supérieure1
Sandy Bridge
EP
Ivy Bridge EP
Ivy Bridge EX
Haswell EP
E5-26xx v2
E7-88xx v2
E5-26xx v3
Systèmes
POWER 7+
1,7-3,7
1,9-3,4
1,6-3,5
3,1-4,4 GHz
3,04,35 GHz
1,2*
1, 2*
1, 2*
1, 2*
1, 2, 4
1, 2, 4, 8
16
24
30
36
32
96
Cache L1 maximum
32 Ko
32 Ko*
32 Ko*
64 Ko
32 Ko
64 Ko
Cache L2 maximum
256 Ko
256 Ko
256 Ko
256 Ko
256 Ko
512 Ko
Cache L3 maximum
20 Mo
30 Mo
37,5 Mo
45 Mo
80 Mo
96 M0
Cache L4 maximum
0
0
0
0
0
128 Mo
Bande passante de
mémoire
31,4-51,2 Gb/s
42,6-59,7 Gb/s
68-85**
Gb/s
51-68
Gb/s
100 –
180 Gb/sec
230 –
410 Gb/sec
E5-x6xx
Fréquences
d'horloge (GHz)
Options SMT
Fils maximum par
interface de
connexion
1,8-3,6
POWER8
1 = Les fonctions de micro-architecture ci-dessus contribuent à la performance supérieure des systèmes POWER8 comparativement aux systèmes Ivy Bridge
* Intel nomme cette technologie Hyper-Threading (avec HT et sans HT)
*32 Ko s'exécutant en « mode Non-RAS » 16 Ko assurent un meilleur RAS
**85 Go s'exécutant en « mode Non-RAS » et les erreurs dispositifs doubles NE sont PAS pris en charge
6
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
La performance par noyau d'Intel n'augmente pas
à travers les générations précédentes
Ivy Bridge EP
2,7 GHz
Ivy Bridge EX
2,8 GHz
Haswell EP
2,3 GHz
24 noyaux
30 noyaux
36 noyaux
Le nombre indiqué est le meilleur de chaque catégorie
(interfaces de connexion et nombre de noyaux)
RPE2** les nombres parviennent des six entrées des
tests de performance suivants :
**Détails RPE2 de Gartner :
http://www.gartner.com/technology/research/RPE2-methodology-details.jsp
SAP SD à deux niveaux, TPC-C, TPC-H,
SPECjbb2006 et deux composants SPEC CPU2006
Les données de ce tableau parviennent du RPE2 de l'outil de profil concurrentiel de Gartner, Inc. © 2014 Gartner, Inc. et (ou) de ses compagnies affiliées. Tous droits réservés.
7
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Power + logiciels IBM + stockage IBM sont optimisés afin de
travailler de la meilleure façon ensemble
La pile entière est conçue dans cette optique
Systèmes
Power d'IBM
+
Technologie de
processeur de pointe
Stockage
IBM
IBM
Middleware
+
Optimisé pour
Power
Technologie de
stockage
optimisée
Meilleure
performance
Temps de
rentabilisation
1
rapide
Coût réduit
1
1
1= Selon des études internes effectuées par IBM sur des serveurs POWER8 et Ivy Bridge sélectionnés
IBM Middleware est modifié pour
tirer profit des segmentations de processus de Power
8
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
DÉMONSTRATION : Le SMT de POWER8 SMT offre une
plus grande performance par noyau que Ivy Bridge d'Intel
Débit par noyau
SMT8
SMT4
SMT2
2,2x – 2,5x
SMT1
Ivy Bridge EP d'Intel (Hyper-Threading – Maximum)
Durée en secondes
Cette étude est une étude interne d'IBM conçu pour reproduire l'usage de la charge de travail typique d'un client IBM dans le marché. Elle comprend un POWER8 S824 avec 24 noyaux, 3,52 GHz, AIX 7.1 TL3 SP3,
WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1 comparativement à Ivy Bridge EP 24 noyaux, 2,7 GHz, RHEL 6.5, WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1. Les résultats ont été obtenus dans des conditions de laboratoire et non
pas dans un environnement client actuel. Les études internes d'IBM sur les charges de travail ne constituent pas des tests de performance d'utilisation et elles ne sont pas basées sur aucun test de performance
standard. À ce titre, l'utilisation des clients, les différences des piles déployées et les autres variations des systèmes ou les conditions d'essai peuvent engendrer des résultats différents et peuvent varier en fonction
de la configuration actuelle, de l'utilisation, des demandes spécifiques et des autres variables de l'environnement de production.
9
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
POWER8 offre PLUS DE DEUX FOIS de débit
comparativement à Ivy Bridge à un coût 48 % inférieur
Application Web
Power S824
AIX
WAS
WAS
AIX
AIX
…
WAS
WAS
AIX
AIX
8 machines virtuelles
3,13 $
PowerVM
DB2
2S/24 noyaux POWER8 (3,52 GHz)
Charge de travail des services bancaires en ligne v3.6
186 080
Interaction des
utilisateurs en
secondes
par IU par s
WebSphere sur une plateforme
Base de données sans plateforme
Les deux serveurs configurés pour
atteindre le débit maximum
2,2x
Plus rapide
48 %
Coût
inférieur par
IU par s
Cette étude est une étude interne d'IBM conçu pour reproduire l'usage de la charge de travail typique d'un client IBM dans le marché. Elle comprend un POWER8 S824 avec 24 noyaux, 3,52 GHz, AIX 7.1 TL3 SP3, WAS 8.5.5.2, DB2 9.7, JDK 7.0 FP1
comparativement à Ivy Bridge EP 24 noyaux, 2,7 GHz, RHEL 6.5, WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1. Les résultats ont été obtenus dans des conditions de laboratoire et non pas dans un environnement client actuel. Les études internes d'IBM sur les
charges de travail ne constituent pas des tests de performance d'utilisation et elles ne sont pas basées sur aucun test de performance standard. À ce titre, l'utilisation des clients, les différences des piles déployées et les autres variations des systèmes
ou les conditions d'essai peuvent engendrer des résultats différents et peuvent varier en fonction de la configuration actuelle, de l'utilisation, des demandes spécifiques et des autres variables de l'environnement de production. Les prix, le cas échéant,
sont basés sur la liste des prix publiée des États-Unis pour IBM et les concurrents et le coût total d'acquisition comprend les prix de matériaux et de logiciels de la liste et 3 ans de service et d'assistance qui sont ensuite divisés par le nombre de
transactions pour obtenir la somme par interaction utilisateur par seconde.
10
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Combien de machines virtuelles pouvez-vous faire
fonctionner sur un seul serveur? Ça dépend……
1. Taille de la charge de travail
3. Variabilité de la charge de travail
Variabilité élevée
Performance
Interactions
par seconde
Charge de travail
Petite
importante
2. Taille du serveur
16 noyaux
24 noyaux
48 noyaux
Densité de la
charge de travail
Variabilité faible
Fréquence de l'occurrence
…
4. Gestion de charges de travail
Charges de travail mixtes
Hyperviseur
Priorité basse
Priorité élevée
Nombre de noyaux
11
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
POWER8 entasse jusqu'à 2,9x plus de machines virtuelles
qu'Intel pour le même nombre de noyaux
Cette étude est une étude interne d'IBM conçu pour reproduire l'usage de la charge de travail typique d'un client IBM dans le marché. Elle comprend un POWER8 S824 avec 24 noyaux, 3,52 GHz, AIX 7.1 TL3 SP3, WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1
comparativement à Ivy Bridge EP 24 noyaux, 2,7 GHz, RHEL 6.5, WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1 et un hyperviseur concurrentiel. Les résultats ont été obtenus dans des conditions de laboratoire et non pas dans un environnement client actuel. Les
études internes d'IBM sur les charges de travail ne constituent pas des tests de performance d'utilisation et elles ne sont pas basées sur aucun test de performance standard. À ce titre, l'utilisation des clients, les différences des piles déployées et les autres
variations des systèmes ou les conditions d'essai peuvent engendrer des résultats différents et peuvent varier en fonction de la configuration actuelle, de l'utilisation, des demandes spécifiques et des autres variables de l'environnement de production.
12
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
POWER8 avec PowerVM prend en charge 2,9x plus de charges de travail
importantes qu'Ivy Bridge avec un hyperviseur concurrentiel
Application Web
Power S824
AIX
WAS
WAS
AIX
AIX
…
WAS
WAS
AIX
AIX
32 machines
virtuelles
PowerVM
32 charges de
travail
17 767 $ par charge
de travail
DB2
2S/24 noyaux POWER8 (3,52 GHz)
WebSphere sur une plateforme, base de donnnées sans
plateforme pour les deux tests
Charges de travail des services bancaires en
ligne pour chaque exécution
1960 interactions utilisateurs par
s
2,9x
Plus de
charges de
travail
61 %
Coût
inférieur
par
charge de travail
Cette étude est une étude interne d'IBM conçu pour reproduire l'usage de la charge de travail typique d'un client IBM dans le marché. Elle comprend un POWER8 S824 avec 24 noyaux, 3,52 GHz, AIX 7.1 TL3 SP3,
WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1 comparativement à Ivy Bridge EP 24 noyaux, 2,7 GHz, RHEL 6.5, WAS 8.5.5.1, DB2 9.7, JDK 7.0 FP1 et un hyperviseur concurrentiel. Les résultats ont été obtenus dans des
conditions de laboratoire et non pas dans un environnement client actuel. Les études internes d'IBM sur les charges de travail ne constituent pas des tests de performance d'utilisation et elles ne sont pas basées sur
aucun test de performance standard. À ce titre, l'utilisation des clients, les différences des piles déployées et les autres variations des systèmes ou les conditions d'essai peuvent engendrer des résultats différents et
peuvent varier en fonction de la configuration actuelle, de l'utilisation, des demandes spécifiques et des autres variables de l'environnement de production. Les prix, le cas échéant, sont basés sur la liste des prix
publiée des États-Unis pour IBM et les concurrents et le coût total d'acquisition comprend les prix de matériaux et de logiciels de la liste et 3 ans de service et d'assistance qui sont ensuite divisés par le nombre de
transactions pour obtenir la somme par interaction utilisateur par seconde.
13
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Qu'en est-il de la disponibilité?
J'ai eu des temps d'arrêt avec certains
de mes serveurs Intel.
Qu'est-ce que POWER peut faire pour
moi dans ce cas?
14
Chef de la
technologie
typique
POWER possède également un
RAS conçu dans cette optique.
IBM
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Rapport 2014 – Le rapport des clients pour la fiabilité de Power
Reliability surpasse Intel (pour la cinquième année consécutive)
ITIC 2014 serveur global, sondage sur la fiabilité des serveurs
- 550 entreprises globales à travers le monde de mars 2014 à avril 2014
« IBM Power et le système d'exploitation AIX étaient premiers ou deuxièmes dans
toutes les catégories relatives à la fiabilité incluant la virtualisation et la sécurité »
Remarque : Lorsque Power / AIX occupaient la 2e place, c'était parce que System z occupait la 1re place
Exemple : Système de serveur planifié Enterprise
Indisponibilité en heures / mois
5,4 minutes/mois
Une disponibilité
au moins 2X
supérieure à celle
des systèmes Intel
10,8 minutes/mois
Source : http://itic-corp.com/
26,4 minutes/mois
45,60 minutes/mois
15
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Power RAS concerne plus que seulement le processeur
IBM développe, teste, intègre la pile entière de RAS
►
Tiroir E-S / unité de gestion de mémoire
►
Processeurs et toutes les puces du CEC
►
Hyperviseur (PowerVM) et VIOS
►
Pilote, adaptateurs de carte PCI
►
Système d'exploitation (AIX, IBM i, Linux)
►
Intergiciels et logiciels de mise en grappe
Power Stack - RAS intégré
Processeur RAS d'Intel
IBM Middleware
Qu'est-ce
qu'il
manque?
PowerHA
AIX, IBM i, Linux
PowerVM
Micrologiciel
Mémoire
16
POWER
CPU
Pilote
RAS
LPAR / charges de travail
Micrologiciel
E-S
Tiroir
Mémoire
02 L'importance de l'architecture
x86
CPU
© 2014 IBM Corporation
Bureau de projet concurrentiel
Le processeur de service POWER avec correction des données de première
panne est conçu pour détecter et gérer les erreurs matérielles et les erreurs
dans les micrologiciels
Méthodologie Intel – « Écrivez vos
propres procédures de récupération »
Méthodologie POWER –
« Le matériel s'occupe du matériel »
(avant que le problème n'atteigne l'application)
Procédures de
récupération
écrites
pour le logiciel
Détail de l'erreur
disponible pour
une réparation
potentielle
Processeur de Facultatif
service
Erreur
connectée
Processeur Non
de service Facultatif
Erreur
Détectée
Erreurs matérielles
Remarque : Il y a quelques situations d'erreur de mémoire
qui s'autocorrigeront avec Ivy Bridge au niveau HW
17
02 L'importance de l'architecture
Erreur
Corrigée
Erreur et
correction
connectée
Erreurs matérielles
© 2014 IBM Corporation
Bureau de projet concurrentiel
Tous les systèmes Power continuent d'avoir un RAS chef
de file - comparativement à la dernière version d'Intel
Fonction RAS
POWER7/7+
POWER8
Intel
(PowerVM)
Ivy Bridge EX
Oui
Oui
Oui
Oui
Oui
Non
First Failure Data Capture (saisie des données de première panne)
Oui
Oui
Non
Les clés USB assurent une séparation sécuritaire du matériel de la
mémoire
Oui
Oui
Non
Processor Instruction Retry (relance des instructions de processeur)
Oui
Oui
Non
Alternate Processor Recovery (reprise d'autres processeurs)
Oui
Oui
Non
Dynamic Processor Deallocation (libération dynamique de processeur)
Oui
Oui
Non (1)
Dynamic Processor Sparing (substitution dynamique de processeurs)
Oui
Oui
Non (1)
Oui
Oui
Oui
Oui (2)
Oui (2)
Oui (4)
Applications/partitions
Déplacer les partitions de charges de travail en cours d'exécution vers un
autre serveur
Priorité de disponibilité des partitions
Système
Processeur
Mémoire
Chipkill - Capacités de mémoire redondantes
Chipkill - Survit à des défaillances doubles de la mémoire avec x8 DRAMS
E-S
VIOS - Reprise dynamique de l'adaptateur
Oui
Non
Oui
1 = Capacité intégrée pas prise en charge
3 = CoD pris en charge sur les serveurs Enterprise (par les interfaces de connexion 1 et 2)
2 = Chipkill sur les systèmes avec substitution DRAM
4 = Dégradation de la performance et seulement x4 DRAM
18
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Les NOUVELLES fonctions RAS de POWER8
peuvent aider l'historique de disponibilité
L'augmentation du RAS de POWER RAS pour chaque génération constitue un mandat
1. La capacité augmentée du serveur POWER8 améliore la fiabilité du serveur
- Plus de charge de travail par interface de connexion
2. La méthodologie de récupération de la mémoire POWER7+ Enterprise ajoutée à
POWER8
- Le sous-système de mémoire possède la tolérance de POWER7 ECC et DRAM et
est amélioré grâce au soutien de deux mots de 128 bits
- Soutien amélioré de correction des erreurs de la mémoire pour la nouvelle cache L4
3. Contrôleur avec puce qui est à l'intérieur du processeur POWER8
- Gestion de l'alimentation et surveillance thermale qui améliorent
les défaillances prévisibles
- Améliore la capacité de « Surcadençage » sans renoncer au RAS
4. Le contrôleur PCIe intégré au processeur élimine le contrôleur Hub E-S externe
(Amélioration de la performance et du RAS)
5. PCIe enfichable à chaud pour la fonctionnalité
19
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Les serveurs Enterprise POWER offrent des fonctions d'évolutivité
verticale prouvées pour les besoins des entreprises
Évolutivité verticale (770, 780, 795, E870, E880)
Évolutivité
intérieure
Optimisation d'Enterprise
- Évolutivité et consolidation les plus élevées
- Virtualisation et utilisation extrêmes
- Sécurité et fonctions RAS les plus élevées
Capacité à la demande
Enterprise Pools
Innovation ouverte
Évolutivité horizontale
20
2
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Les serveurs POWER8 Enterprise (E870 & E880) –
Progrès majeurs pour une évolutivité verticale extrême
Mélange de Power 795 et Power 780/770
Architecturale : Similaire à Power 795
Emballage :
Similaire à Power 780/770
Un à deux nœuds (E870)
Un à quatre nœuds (E880)
Armoire de 19 po
Mémoire augmentée
jusqu'à 16 To (E880) ou 4 To (E870)
Mémoire plus rapide - 1600 MHz
Jusqu'à 85,3 GB par noyau
Fentes PCIe Gén. 3
21
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Les systèmes POWER8 Enterprise possèdent des
caractéristiques inspirées du grand système
E880
E870
•
•
•
•
•
•
Processeurs POWER8
(4,02 – 4,19 GHz)
•
1 ou 2 nœuds par système
32 noyaux par nœud = 64 noyaux maximum •
40 noyaux par nœud = 80 noyaux maximum •
Jusqu'à 4 To de mémoire
•
Évolutivité du système accrue
Performance par noyau accrue
Jusqu'à 20 machines virtuelles par noyau
Enterprise RAS amélioré
22
Processeurs POWER8
(4,35 GHz - +GHz)
1 ou 4 nœuds par système
32 noyaux par nœud = 128 noyaux maximum
48 noyaux par nœud = 192 noyaux maximum
(répartition des tâches)
Jusqu'à 16 To de mémoire
Efficacité énergétique améliorée
Capacité à la demande élastique
Ressources partagées dans Power Enterprise
Pool
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Power E870 comparativement à la concurrence à l'égard des rendements SAP
et du test de performance de la distribution à deux niveaux
Près de 1 000 utilisateurs par noyau avec POWER8 basé E870
1200
Résultats des tests de performance de l'application standard de SAP SD, 2 niveaux :
Test de performance des utilisateurs SD par noyau
SAP enhancement package 5 pour SAP ERP 6.0
1000
Source : http//www.sap.com//benchmark
996
Test de
performance
des utilisateurs
SD par noyau
883
800
2,17X
plus d'utilisateurs
3,18X
600
plus d'utilisateurs
400
458
443
424
365
200
0
313
IBM
E870
POWER8
8p/80c/640t
IBM
S824
POWER8
4p/24c/192t
Dell
PowerEdge R730
E5-2699 v3
Oracle
M5-32
M5
Dell
PowerEdge R920
E7-4890 v2
2p/36c/72t
32p/192c/1536t
4p/60c/120t
Oracle
M6-32
M6
32p/384c/3072t
Oracle
T5-8
T5
8p/128c/1024t
(1) Système IBM Power Enterprise E870 selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 8 processeurs / 80 noyaux / 640 fils, POWER8; 4,19 GHz, mémoire de 2048 Go, 79 750 tests de performance d'utilisateurs SD utilisant AIX® 7.1 et DB2® 10.5, Certification no : 2014034 Résultat valide à partir du 3 octobre 2014. Source : http://www.sap.com/benchmark.
(2) Système IBM Power S824 selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 4 processeurs / 24 noyaux / 96 fils, POWER8; 3,52 GHz, mémoire de 512 Go, 21 212 tests de performance d'utilisateurs SD utilisant AIX® 7.1 et DB2® 10.5,
Certification no 2014016. Source : http://www.sap.com/benchmark Tous les résultats sont valides à partir du 3 octobre 2014
(3) Dell PowerEdge R730 selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 2 processeurs / 36 noyaux / 72 fils, Processeur Xeon d'Intel 2699v3; 2,30 GHz, mémoire de 256 Go, 16 500 tests de performance d'utilisateurs utilisant RHEL 7 et SAP ASE 16. Certification no 2014033. Source : http://www.sap.com/benchmark.
(4) Serveur SPARC M5-32 d'Oracle selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 32 processeurs / 192 noyaux / 1536 fils, SPARC M5; 3,60 GHz, mémoire de 4 096 Go, 85 050 tests de performance d'utilisateurs utilisant Solaris® 11 et Oracle 11g; Certification no 20013009. Source : http://www.sap.com/benchmark.
(5) Dell PowerEdge R920 selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 4 processeurs / 60 noyaux / 120 fils, Processeur Xeon d'Intel 4890 v2; 2,80 GHz, mémoire de 1024 Go, 25 451 tests de performance d'utilisateurs SD utilisant un serveur SUSE Linux Enterprise 11 et SAP ASE 16. Certification no 2014011. Source : http://www.sap.com/benchmark.
(6) Serveur SPARC M6-32 d'Oracle selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 32 processeurs / 384 noyaux / 3072 fils, SPARC M6; 3,60 GHz, mémoire de 16 To, 140 000 tests de performance d'utilisateurs SD utilisant Solaris® 11 et Oracle 11g; Certification no 20014008. Source : http://www.sap.com/benchmark.
(7) Serveur SPARC T5-8 d'Oracle selon le test de performance de l'application SAP SD standard à deux niveaux exécutant le enhancement package 5 pour l'application SAP ERP 6.0; 8 processeurs / 128 noyaux / 1024 fils, SPARC T5; 3,60 GHz, mémoire de 2 048 Go, 40 000 tests de performance d'utilisateurs SD utilisant Solaris® 11 et Oracle 11g; Certification no 2013008. Source : http://www.sap.com/benchmark.
SAP et tous les logos SAP sont des marques de commerce ou des marques de commerce déposées de SAP AG en Allemagne et dans plusieurs autres pays. Tous les autres noms de produits et de services mentionnés sont des marques de commerce de leur entreprise respective.
23
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
E870 offre la performance de code Java1 la plus rapide de
l'industrie
1,98x la performance par noyau du meilleur noyau de serveur de Xeon x86 E7 d'Intel
• 1,55x plus de performance par noyau que les
offres E5-2699 v3 d'Intel (Haswell-EP)
• 1,98x plus de performance par noyau que les
offres E7-4890 v2 d'Intel
(code nom : Ivy Bridge-EX)
• 2,29x plus de performance par noyau que les
offres de T5 d’Oracle
1
24
9000
8000
m a x-jO P S p e r C o re
Les noyaux de processeurs POWER8
sont les plus rapides de l'industrie
pour le code Java
7000
8210
6000
5000
5297
4000
4142
3000
3578
2000
1000
0
IBM
E870
POWER8
80c/640t
HP
DL 380p
E5-2699 v3
36c/72t
Cisco
UCS C460 M4
E7-4890 v2
60c/120t
Oracle
T5-2
T5
32c/256t
Comparaison des performances selon les résultats SPECjbb 2013 depuis le 1er octobre 2014 http://www.spec.org/jbb2013/results/ . Tous les résultats des tests de
performance IBM seront soumis à spec.org le 6 octobre 2014.
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Serveurs POWER8 Enterprise – Première
plateforme de virtualisation au monde
• 2,60x plus de machines virtuelles par
noyau
73 % plus de machines virtuelles2 prises en charge par
seulement 40 noyaux POWER8 comparativement à
60 noyaux E7-4890 v2 (code nom : Ivy Bridge-EX)
• 2,70x le débit par noyau
80 % plus de débit du système3 avec seulement
40 noyaux POWER8 comparativement à 60 noyaux
E7-4890 v2 (code nom : Ivy Bridge-EX)
8
HP DL580p (E5-4890 v2 60c/2.8GHz)
7.6
Power E870 (POWER8/40c/4.19GHz)
6
5.2
4
3.9
2.9
2
2.1
0.4 1.1
0
1.5
0.8
1.9
800
400
200
150
100
Throughput per VM (Tx/sec/VM)
1000
T h ro u g h p u t p e r C o re
(T x /s e c )
Les systèmes Power8 E870 offrent la
meilleure plateforme de virtualisation de
l'industrie
N u m b e r o f V M s /C o re
Chaque noyau POWER8 prend en charge plus de 2,6x le nombre de machines
virtuelles1 que le meilleur noyau de serveur de la catégorie de Xeon x86 E7 d'Intel
800
HP DL580p (E5-4890 v2 60c/2.8GHz)
Power E870 (POWER8/40c/4.19GHz)
770
600
400
200
285
0
250
Number of VM's
1
Performance selon les tests effectués à l'interne par IBM des tests de performance de TPoX. TPoX est un test de performance libre développé par IBM en collaboration avec Intel et d'autres. Il est disponible sur le site :
http://tpox.sourceforge.net/tpoxresults.htm. Cette étude a utilisé TPoX version 2.1, accédant à une version 10.1 de la base de données principale DB2 d'IBM.
2
Plus de 70 % plus de machines virtuelles sur POWER8 Enterprise E870 (40c/4.19 GHz POWER8) comparativement à HP DL580p (60c/2.7 GHz E7-4890 v2) à un débit équivalent par machine virtuelle avec VMware
vSphere 5.5 Upd1 à un débit équivalent par machine virtuelle
3
Jusqu'à 80 % plus de débit sur POWER8 Enterprise E870 (40c/4.19 GHz POWER8) comparativement à HP DL580p (60c/2.7 GHz E7-4890 v2) avec un nombre équivalent de machines virtuelles avec VMware vSphere 5.5
02 L'importance de l'architecture
© IBM Corporation 2014
25 Upd1 à un débit équivalent par machine virtuelle
Bureau de projet concurrentiel
Les serveurs POWER Enterprise sont conçus pour les
données et les charges de travail critiques
Informatique d'entreprise éprouvée pour les
environnements les plus exigeants
1. Grande capacité de traitement (64 – 256 noyaux)
2. Évolutivité verticale et intérieure pour consolider et réduire les
coûts
3. Qualités des services les plus élevées (RAS, sécurité)
4. Niveaux les plus élevés de densité de charge de travail avec
PowerVM
5. Enterprise prêt pour le nuage
770
E880
E870
795
780
6. Installation intégrée pour Linux (IFL)
7. Capacité à la demande
8. Enterprise Pools
26
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
De plus grands serveurs avec plus de ressources constituent des
plateformes de virtualisation d'une efficacité accrue
Une virtualisation hautement efficace est la base pour les nuages d'entreprise
La plupart des charges de travail expérimentent une variation dans la demande
Lorsque vous consolidez des charges de travail avec une variation sur un
serveur virtuel, la variation de la somme est inférieure (multiplexage statistique)
Le plus de charges de travail que vous pouvez consolider, plus la variation de la
somme est petite (présumant que l'hyperviseur est suffisamment puissant pour
consolider)
Charges de travail 1 et 2 atteignant leur point
culminant conjointement
Points culminants+ vallées s'additionnent les
uns aux autres
Ce cas est rare
27
Charges de travail 1 et 2 atteignant leur point
culminant à
des moments différents
Points culminants+ vallées s'annulent mutuellement
Ce cas est plus probable
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Exemple de multiplexage statistique : Le plus de charges de travail
que vous pouvez consolider, plus la variation de la somme est petite
Une charge de travail dans un LPAR
Utilisation du serveur = 17 %
Capacité
du serveur
requise
Écart de 6x entre les points
culminants et la moyenne
Demande
moyenne
16 charges de travail dans 16 LPAR
Par conséquent, les plus gros serveurs
avec la capacité d'exécuter plus de
charges de travail peuvent être entraînés
à une moyenne plus élevée des niveaux
d'utilisation sans contrevenir à l'entente
de niveau de service, réduisant ainsi le
coût par charge de travail
144 charges de travail dans 144 LPAR
Utilisation du serveur = 70 %
Utilisation du serveur = 44 %
Écart de 2,25x entre les
points culminants et
la moyenne
28
Capacité
du serveur
requise
Écart de 1,42x entre les points
culminants et la moyenne
Demande
moyenne
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Les serveurs Power Enterprise peuvent atteindre l'efficacité des charges
de travail importantes qui génèrent d'importantes économies
POWER 780+
1 serveur Power 780+
Ce genre d'efficacité devient
critique pour les environnements
de nuage privé!
74 000 $ par charge
de travail
177 machines virtuelles
128 noyaux
Tiroir ESD 30 Ultra SSD
Coût 7X inférieur
par charge de
travail
177
Charges de
travail
Charge de travail CPU
intensive pour la vérification
de courtage
511 transactions par seconde
Cette étude est une étude interne d'IBM conçu pour reproduire l'usage de la charge de travail typique d'un client IBM dans le marché. Les résultats ont été obtenus dans des conditions de laboratoire et non pas
dans un environnement client actuel. Les études internes d'IBM sur les charges de travail ne constituent pas des tests de performance d'utilisation et elles ne sont pas basées sur aucun test de performance
standard. À ce titre, l'utilisation des clients, les différences des piles déployées et les autres variations des systèmes ou les conditions d'essai peuvent engendrer des résultats différents et peuvent varier en
fonction de la configuration actuelle, de l'utilisation, des demandes spécifiques et des autres variables de l'environnement de production.
29
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Offres de la capacité à la demande des systèmes Power Enterprise
Payer en fonction de votre croissance
Croissance sans interruption
U tiliz a tio n
Remarque : Nouveau E870 et E880 maintenant pris en charge!
120
100
80
60
40
20
0
Permanent
Pour les clients qui prévoient une
croissance
J F M A M J J A S O N D J F M A M J J A S O N D
Disponibilité améliorée
– Substitution dynamique de processeurs
Temporaire
Paiement flexible
– Capacité à la demande élastique
Pour les clients avec une augmentation
prévisible de l'utilisation
(Allumée/éteinte)
Assurance contre une croissance imprévue
U tiliz a tio n
Essayez-le avant de l'acheter
– Essai de la capacité à la demande
100
Service public :Augmentations brèves
imprévisibles
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
30
02 L'importance de l'architecture
© IBM Corporation 2014
Bureau de projet concurrentiel
Power Enterprise Pools avec capacité à la demande mobile et
élastique assure la flexibilité et l'efficacité économique
Aucun serveur Intel n'offre cette qualité de service
Infrastructure sur plusieurs systèmes offrant un environnement TI
hautement disponible et flexible
E880
E870
Les clients achètent la capacité requise et attribuent et rééquilibrent
le processeur virtuel et les ressources mémoire
Processeur et mémoire élastiques allumés/éteints permettent aux
clients de répondre aux fluctuations périodiques de la demande
795
770
780
Live Partition Mobility permet aux clients de migrer des charges de
travail en exécution entre les systèmes pour permettre une
disponibilité continuelle
31
02 L'importance de l'architecture
© 2014 IBM Corporation
Bureau de projet concurrentiel
Sommaire - POWER offre une architecture
conçue pour mettre en œuvre les données
Questions relatives à l'architecture : (Évolutivité horizontale ou verticale)
-Offre le meilleur Prix/performance et la densité de charge de travail la plus élevée
-Assure la plus haute disponibilité (RAS) et sécurité
-Qualités des services d'Enterprise avec la capacité à la demande et Enterprise Pools
Performance SMT supérieure comparativement à Intel : 2,0-2,4x à un coût de 47 à 61 % inférieur
Densité de charge de travail supérieure comparativement à Intel : 3x pour un coût inférieur de 61 %
Les serveurs Enterprise Power favorisent l'efficacité de la densité des charges de travail importantes dans un
environnement virtuel à un coût grandement inférieur par charge de travail
La conception FFDC de Power RAS lui procure 2x plus de disponibilité qu'Intel
Capacité à la demande – Offre une croissance sans interruption et une disponibilité améliorée
Enterprise Pools – Infrastructure sur plusieurs systèmes qui procure le plus haut niveau de flexibilité pour gérer le
processeur, la mémoire et les charges de travail de façon dynamique pour assurer la plus haute disponibilité
FFDC = First Failure Data Correction (correction des données de première panne)
32
02 L'importance de l'architecture
© 2014 IBM Corporation
Téléchargement