• 検索結果がありません。

2014年春 Power Systems テクニカル・セミナー POWER8超解説

N/A
N/A
Protected

Academic year: 2021

シェア "2014年春 Power Systems テクニカル・セミナー POWER8超解説"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

Power Systems の優位性

POWER8とXeonの比較

(2)

POWER7/7+

45/32 nm

POWER8

22 nm

3.0 ~ 4.4 GHz

1 チップ 8 コア

eDRAM L3 キャッシュ

エネルギー効率の向上

SMT 4

VSM & VSX

ストレージ保護キーの

拡張

POWER6/6+

65/65 nm

3.5 ~ 5.0 GHz

デュアル・コア

SMT2

十進浮動小数点演算

インストラクション・リトライ

ストレージ保護キー

POWER5/5+

130/90 nm

1.5 ~ 2.2 GHz

デュアル・コア

Simultaneous

Multi-Threading (SMT)

Micro Partitioning

1 チップ 12 コア

SMT 8

FPGA サポート

トランザクショナル・メモリー

PCIe アクセラレーション

POWER9

ビッグデータ/クラウド時代の ITインフラに向けた

テクノロジー開発

Extreme Analytics

Optimization

Extreme Big Data

Optimization

On-chip accelerators

2,400億円

の投資

2014.04

Power Systems S モデルの発表

2014.10

Power Systems E モデルの発表

2015.05

Power System E850 の発表

Power System E880 の拡張

(3)

POWER8 による更なる最適化の実現

• プロセッサー・チップ

– ダイ・サイズ 649 mm2

– チップあたり 12 コア搭載

– 22nm SOI (Silicon-On-Insulator), eDRAM

• コア性能の向上

–コアあたり8スレッド (SMT8)

– 同時 Dispatch / Issue 数の向上

– 実行ユニット数の向上

– コアに暗号化アクセラレーターを搭載

• キャッシュ容量の増加

– 1次 (L1) データキャッシュ容量 64KB

– 2次 (L2) キャッシュ容量 512KB

– 3次 (L3) キャッシュ容量 96MB

• メモリーのレイテンシーおよび帯域向上

– 230 GB/s のメモリーバンド幅

– コントローラーあたり最大16MB x4 の

バッファーキャッシュ (L4)

• I/O サブシステムの性能向上

– PCIe 3.0コントローラーを内蔵

(4)

Power Systemsの優位性

性能向上

による

高いコストパフォーマンス

I/O レイテンシー性能向上

による

高速データ処理

(5)

• スレッド処理能力向上

– SMT1 での比較でも POWER7 から性能向上

– キャッシュ増加によるレイテンシー向上

• 並列処理能力向上

– SMT8 により SMT1 の 2倍以上のスループット

向上を実現

– 同時 Dispatch / Issue 数向上

– 実行ユニット追加

– Transactional Memory

性能向上

による

高いコストストパフォーマンス

0

0.5

1

1.5

2

2.5

3

3.5

4

P7

SMT1

P8

SMT1

P8

SMT2

P8

SMT4

P8

SMT8

x1.5

x2

Systems performance reports

(6)

システム負荷の変化に迅速に応える PowerVM の柔軟性

 細かい粒度でプロセッサー資源を自動再割り当て

– 最小 0.05コア、0.01 単位

– 運用担当者が操作しなくてもミリ秒単位で対応

『システムを稼動させながら、

リソースの最適配置

常に

自動実行

してくれることを高く評価』(お客様 談)

システムA

教育

ステージング

4コア

4コア

4コア

1コア

4コア

1コア

2コア

4コア

8台

24コア

分散(非統合)環境

1台

8コア

Power Systems による

仮想化統合

システムB

システムC

システムD

システムE

システムF

・ システム資源の最適化

・ SWライセンスの最適化

(7)

© 2015 IBM Corporation

7

基幹・統合 基盤における急激なシステム負荷増に

柔軟に対応する仮想化

■ 100分の1コア単位のリソースの自動再配置により x86仮

想化では難しい急激なユーザー数の増加にも対応

• 最小 0.05 コア、0.01 単位

• 運用担当者が操作しなくてもミリ秒単位で対応

未起動

POWER

コア

POWER

コア

共有プロセッサー・プール B

共有プロセッサー・プール A

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

POWER

コア

未起動

POWER

コア

LPAR2

LPAR1

LPAR3

LPAR4

LPAR5

LPAR6 LPAR7 LPAR8 Capacity on Demand

未起動の資源

Micro-Partitioning による自動割当て変更

Dynamic LPAR による手動割当て変更

CoD プロセッサーの起動(恒久/一時的)

(8)

Intel’s performance per core has remained “flat”

Sandy

Bridge EP

2.9 GHz

16

Cores

Ivy

Bridge EP

2.7 GHz

24

Cores

Ivy

Bridge EX

2.8 GHz

30

Cores

Haswell EP

2.3 GHz

36

Cores

RPE2

**

per

Core

The number shown is best in each category (sockets and number of cores)

**Gartner RPE2 Details:

http://www.gartner.com/technology/research/RPE2-methodology-details.jsp

RPE2** numbers are derived from the following six benchmark

inputs:

SAP SD Two-Tier, TPC-C, TPC-H, SPECjbb2006 and two

SPEC CPU2006 components

The data on this chart is derived from RPE2 from Gartner, Inc’s Competitive Profile tool. © 2014 Gartner, Inc. and/or its

Xeon E5-2690

Octo Core 2.9GHz

Xeon E5-2697v2

12-Core 2.7GHz

Xeon E7-4890v2

15-Core 2.8GHz

Xeon E5-2699v3

18-Core 2.3GHz

Haswell EX

2.5 GHz

36

Cores

Xeon E7-8890v3

18-Core 2.5GHz

Just

announced

05/05/15

(9)

© 2015 IBM Corporation

9

POWER8 per Core Performance is Increasing!

P

OW

E

R

7

P

OW

E

R

7+

P

OW

E

R

8

RPE2

**

per c

ore

730

3.55 GHz

16 cores

2 sockets

730+

4.20 GHz

16 cores

2 sockets

S824

3.52 GHz

24 cores

2 sockets

**Gartner RPE2 Details:

http://www.gartner.com/technology/research/RPE2-methodology-details.jsp

RPE2** numbers are derived from the

following six benchmark inputs:

SAP SD Two-Tier, TPC-C, TPC-H,

SPECjbb2006 and two SPEC CPU2006

components

The data on this chart is derived from RPE2 from Gartner, Inc.'s Competitive Profile tool. © 2014 Gartner, Inc. and/or its

affiliates. All rights reserved.

(10)

Certification # 2014033 Date: 09/10/2014

Dell PowerEdge R730 36 Cores & 72 threads

E5-2699 v3 at 2.3 Ghz,

256 GB Memory Users: 16,500 SAPS: 90,120 Redhat Ent. Linux 7

SAP ASE 16 Certification # 2014018

Date: 05/05/2014 Cisco UCS B260 M4 30 Cores & 60 threads E7-4890 v2 at 2.80 GHz 512 GB Memory Users: 12,280, SAPS: 67,020 Windows Server 2012 SQL Server 2012 Certification # 2014017 Date: 05/05/2014 Dell PowerEdge R720 24 Cores & 48 Threads E5-2697 v2 at 2.70 GHz 256 GB Memory Users: 10,253, SAPS: 55,970 RHEL 6.5 SAP ASE 16 Certification # 2013039 Date: 12/10/2013 Cisco UCS C420 M3 32 Cores & 64 Threads E5-4650 at 2.70 GHz 256 GB Memory Users: 13,010, SAPS: 71,170 Windows Server 2012 SQL Server 2012 Certification # 2015012 Date: 05/05/2015 Dell PowerEdge R930 72 Cores & 144 threads E7-8890 v3 at 2.5 GHz, 1 TB Memory

Users: 31,000, SAPS: 170,030 Redhat Ent. Linux 7.1 SAP ASE 16

Certification # 2014034 Date: 10/3/2014 IBM Power E870 80 Cores & 640 Threads POWER8 at 4.19 GHz 2 TB Memory Users: 79,750, SAPS: 436,100 AIX 7.1 DB2 10.5

2.3

x

SAP S&D Benchmark Demonstrates POWER8 Core

Performance Leadership

(11)

• プロセッサー性能を余すところなく発揮

– プロセッサーの性能向上のポイント

CPU 内部の処理だけでなく、メモリー、I/O 性能の向上が重要

• レイテンシー向上への取り組み

– キャッシュ増加、メモリー・バッファー、PCI gen3 ネイティブサポート

– 近年の搭載メモリーの大容量化に対応

I/O レイテンシー性能向上

による

高速データ処理

CPU

1 ns

L2

10 ns

/

100 ns

I/O

1000 ns

I/O

/

10000000 ns (10 ms)

1 s = 1000 ms

1 ms = 1000 μs

1 μs = 1000ns

IBM FlashSystem

100 μs

(12)

POWER8のメモリ構成

– 230 GB/s のメモリーバンド幅を実現

POWER8 SCM

(ソケット)

Memory

Buffer

DRAM

Chips

16MB

16MB

16MB

16MB

16MB

16MB

16MB

16MB

128GB

128GB

128GB

128GB

128GB

128GB

128GB

128GB

28.8 GB/s

230 GB/s

(13)

POWER8 のキャッシュ / バンド幅を大幅に強化

13

Sandy

Bridge EP

E5-x6xx

Ivy Bridge

EP

E5-26xx v2

Ivy Bridge

EX

E7-88xx v2

Haswell EP

E5-26xx v3

Haswell EX

E7-88xx v3

POWER 7+

Systems

POWER8

Clock rates

(GHz)

1.8–3.6

1.7-3.7

1.9-3.4

1.6-3.5

2.5-3.6

3.1–4.4

GHz

3.0-4.35

GHz

SMT options

1,2*

1, 2*

1, 2*

1, 2*

1, 2*

1, 2, 4

1, 2, 4, 8

Max Threads /

sock

16

24

30

36

36

32

96

Max L1 Cache

32KB

32KB**

32KB**

64 KB

64 KB

32KB

64KB

Max L2 Cache

256 KB

256 KB

256 KB

256KB

256KB

256 KB

512 KB

Max L3 Cache

20 MB

30 MB

37.5 MB

45 MB

45 MB

80 MB

96 MB

Max L4 Cache

0

0

0

0

0

0

128 MB

Memory

Bandwidth

31.4-51.2

GB/s

42.6-59.7

GB/s

68-85***

GB/s

51-68

GB/s

??

GB/s****

100 – 180

GB/sec

230 - 410

GB/sec

* Intel calls this Hyper-Threading Technology

** 32KB running in “Non-RAS mode”, Only 16KB with ECC Error correction

*** 85GB running in “Non-RAS mode” = dual-device error NOT supported

**** Haswell EX Memory bandwidth range has not been published

(14)

メモリー・バッファー・チップ

Memory

Buffer

DRAM

Chips

DDR Interfaces

Scheduler &

Management

16MB

Memory

Cache

POWER8

Link

RAS

9.6 GB/s

RAS

(15)

統合された PCIe Gen3 インターフェース

POWER7

I/O

Bridge

GX

Bus

PCIe G2

PCI 機器

PCIe G3

PCI

機器

PCIe Gen 3 のネイティブサポート

プロセッサーとの直接結合

プロプライエタリな GX/Bridge の後継

低レイテンシー

Gen3 x16 バンド幅 (32 GB/秒)

CAPI Protocol トランスポート・レイヤー

PCIe 経由のプロセッサーと機器との密接接続

PCIe でのプロトコルのカプセル化

POWER8

CAPIテクノロジーについては以下を参照ください

https://www.youtube.com/watch?v=UjmsK4DewmQ

(16)

高い信頼性とセキュリティー

Power Systems が提供する高いセキュリティー環境

 仮想化環境 PowerVM の脆弱性の報告はゼロ

出典: National Vulnerability Database

http://web.nvd.nist.gov/view/vuln/search

0

脆弱性に関する報告件数

20

40

60

80

100

120

600

VMware

Xen

KVM Oracle VM Hyper-V Sun

LDoms

PowerVM

640

620

140

632

143

49

24

3

3

0

・仮想化によるクラウド基盤として最適

・基幹システムにも最適

・運用コストの低減

(17)

Live Partition Mobility が可能にする

サービス稼動中のハードウェア保守

サーバー A

サーバー B

LPAR 1

LPAR 2

LPAR 3

LPAR 1

LPAR 2

LPAR 3

保守

LPAR 4

VIOS

VIOS

OS / アプリケーションが

稼動中の論理区画を 異

なる筐体に移動可能

(例) : お客様システムに

おいて、サービス提供中

に筐体への物理メモリー

の追加作業を実施

ハードウェア保守に伴なうサービス停止の回避

複数サーバーにまたがった負荷分散

新しい筐体への移行の容易性

POWER6 プロセッサー搭載モデルから POWER7/POWER7+/POWER8 モデルへの移行も可能

(18)

基幹・統合 / クラウド基盤の稼働率を向上する信頼性

Power Systems では、システムを停止することなく物理アダプターの交換作業が可能

(*1)

大規模システムで発生するハードウェア障害のうち約25%

(*2)

がPCI アダプターに起因

Power Systems

I/O

コントローラー

PCIアダプター

電源を切ることなく無停止で

交換(ホットスワップ)が可能

*1: 一部のモデルを除きます。

参照

関連したドキュメント

磁束密度はおおよそ±0.5Tで変化し,この時,正負  

ニホンジカはいつ活動しているのでしょう? 2014 〜 2015

システムの許容範囲を超えた気海象 許容範囲内外の判定システム システムの不具合による自動運航の継続不可 システムの予備の搭載 船陸間通信の信頼性低下

話者の発表態度 がプレゼンテー ションの内容を 説得的にしてお り、聴衆の反応 を見ながら自信 をもって伝えて

わかりやすい解説により、今言われているデジタル化の変革と

 工学の目的は社会における課題の解決で す。現代社会の課題は複雑化し、柔軟、再構

2012 年度時点では、我が国は年間約 13.6 億トンの天然資源を消費しているが、その

2012 年度時点では、我が国は年間約 13.6 億トンの天然資源を消費しているが、その