• 検索結果がありません。

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft PowerPoint PCクラスタワークショップin京都.ppt"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

PCクラスタワークショップin京都(2010年2月19日)

PCクラスタシステムへの

富士通の取り組み

富士通株式会社

株式会社富士通研究所

久門 耕一

今年度はCPUとしてメモリバンド幅がNehalem,

QDR-IB(片方向4GB/s)などPCクラスタにとって期待できる多く

のコモディティコンポーネントが出現

これら魅力ある素材を使ったシステムとして、2つのシス

テムをご紹介

理化学研究所様RICC

(Riken Integrated Cluster of Cluster)

特徴:

Nehalem1000+100(w/GPU)ノードクラスタ

上位スイッチのバンド幅を1/5に絞り、コスト圧縮

スケジューラによりバンド幅有効利用のジョブ割付

日本原子力研究開発機構 様 新スパコンシステム

特徴:

ブレードサーバBX900と内蔵QDR-InfiniBandによるPCクラスタ

2009年度に富士通が提供する(した)大規模クラスタ

2009年度に富士通が提供する(した)大規模クラスタ

合計1156ノード

1/5FBB IB

1024

ノード

超並列

100

ノード

多目的

32

ノード

多目的 Ethernet

(2)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

2

PCクラスタワークショップin京都(2010年2月19日)

理化学研究所様 新スパコンシステム

理化学研究所様 新スパコンシステム

利用者

ターミナル/Web

管理者

システム管理

利用状況確認

多目的PCクラスタ

(100ノード 800コア

w/ GPU)

PRIMERGY RX200S5

ネットワーク機器等

アーカイブ装置

(4PB)

PRIMERGY RX200S5 1000ノード (8000コア)

Ethernet系

ネットワーク

Ethernet

Ethernet

ネットワーク

ネットワーク

計算系ネットワーク

計算系ネットワーク

磁気ディスク装置

(550TB)

多目的PCクラスタ

[MDGRAPE-3接続用]

(32ノード 256コア

)

超並列PCクラスタ

(96.0TFLOPS 12TBメモリ)

大容量メモリ計算機

(239GFLOPS 512GBメモリ)

SPARC Enterprise M9000

ETERNUS2000

フロントエンド・システム

2009年8月から稼働開始 Riken Integrated Cluster of Cluster (RICC)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

3

PCクラスタワークショップin京都(2010年2月19日)

LAN

ETERNUS DX80 (36台)

磁気テープライブラリ装置

ETERNUS LT270(2台)

共用メモリ型演算サーバ

SPARC Enterprise M9000

SPARC Enterprise M9000

大規模並列演算部

PRIMERGY BX900

PRIMERGY BX900

2,157

2,157

ノード

ノード

次世代コード開発部

FX1 320

FX1 320

ノード

ノード

1PB

1.9TFLOPS

384GBメモリ

25TB

ギガビットイーサネットスイッチ

InfiniBandスイッチ

I/Oノード

SPARC Enterprise

M9000(2台)

磁気ディスク装置[物理容量:

1.2PB

]

12TFLOPS

4.6TBメモリ

200TFLOPS

200TFLOPS

50TB

50TB

メモリ

メモリ

2010年3月稼動予定

磁気ディスク装置

ETERNUS4000 M600

ETERNUS4000 M600

日本原子力研究開発機構 様 新スパコンシステム概要

日本原子力研究開発機構 様 新スパコンシステム概要

119+1シャーシ

122.4TF以上なら国内最速システムになる?(=効率62%以上なら)

(3)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

4

PCクラスタワークショップin京都(2010年2月19日)

2009年度大規模スパコン商談

2009年度大規模スパコン商談

合計7500ノード

530TFlopw

ミッドレンジを重視するため

PCクラスタビジネス推進室を設置

(2009.12.21)

ミッドレンジを重視するため

PCクラスタビジネス推進室を設置

(2009.12.21)

ハイエンド市場においては、

当社は国内トップの実績

~数千ノード

~100ノード程度

~30ノード程度

~8ノード程度

ハイエンド市場

ミッドレンジ

市場

民間企業でのCAE利用を中心に

ミッドレンジ市場が高成長

・ PCクラスタのエキスパートによる専任組織化

・ ハイエンド市場で培った高度なノウハウを裾野へ拡大

・ おすすめモデルによる簡単導入

・ OSSなどを活用した新たなサービス提供

・ FTS(富士通テクノロジーソリューション)との連携によるグローバル展開

ミッドレンジ市場に本格参入

(4)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

6

PCクラスタワークショップin京都(2010年2月19日)

PRIMERGY BX900

10Uに18ノード搭載可能 大規模クラスタや、部門間サーバ

集約などに最適なブレードサーバ

業界最高クラスの実装効率と設置性

18ブレード(2CPU/ブレード) /10Uシャーシ

高効率部品の採用による低電力設計

新静音ファンの開発による高い静粛性を実現

最先端のHPC向け仕様

Intel Xeon5500シリーズ(Nehalem)を2ソケット搭載

InfiniBand™ QDR(4GB/s)をメザニンカードで搭載

10Gbシリアル通信可能な高品質バックプレーンで接続

内蔵36ポートSWにより外部18ポート出力。数シャーシ

までの小中規模クラスタを外部SWレスで構築可能

高信頼設計

ECCメモリ (SDDC対応)、

RAIDディスク、冗長電源、

リモート管理機能等

ブレードサーバ PRIMERGY BX900

ブレードサーバ PRIMERGY BX900

BX920 S1

サーバブレード

SX940 S1

ストレージブレード

SDDC (Single Device Data Correction)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

7

PCクラスタワークショップin京都(2010年2月19日)

理研システム新システムの性能(LINPACK)

理研システム新システムの性能(LINPACK)

2009年6月 40位

1032ノード(8256コア)

87.890TF(90.83%)

国内PCクラスタ一位(発表時)

富士通研開発のDGEMMを用い、事業部がHPLをチューニング

2009年11月 47位 1131ノード (9048コア)

97.940TFlops(92.36%)

Nehalemの

ターボモード

を使い単体性能向上

Nehalemのターボモードとは、

CPUに熱的余裕があるときに、コアクロック周波数を

自動で上げ

性能を向上させるNehalem CPUの機能

どのぐらいよくなる?

性能は増加するが、

電力も増加

どのぐらい増える?

(5)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

8

PCクラスタワークショップin京都(2010年2月19日)

周波数と性能電力の関係(姫野)BMT

周波数と性能電力の関係(姫野)BMT

ターボモード時の実効周波数は不明

性能から見て、1ステップ分(3.06GHz相当)向上

電力は性能向上以上に増加、その理由は?

Nehalemの低消費電力性は、アイドル時のクロック停止とパワーゲーティング

(C6ステート)による (逆に言うとC6に入らないと電力はあまり減らない)

0

50

100

150

200

250

300

350

400

450

1.60 1.73 1.86 2.00 2.13 2.26 2.40 2.53 2.66 2.80 2.93 Turbo

CPU Freq (GHz)

Wa

tt

0

2

4

6

8

10

12

14

GF

L

O

P

S

姫野BMT

性能

実行時

消費電力

クロック固定の

アイドル時

消費電力

335

11.56

Disabled

Himeno

Enabled

12.25

389

(+16.1%)

(+6.0%)

増分

(+6.1%)

(+2.5%)

増分

381

88.70

Enabled

359

86.57

Disabled

Linpack

Power (W)

GFLOPS

TurboBoost

Idle

CPU周波数とコア電圧

0 200 400 600 800 1000 1200 Idle 1.57 1.73 1.86 2 2.13 2.26 2.39 2.53 2.66 2.79 2.93 Turbo CPU Frequency [GHz] CPU 0  Vo lt ag e [m V ]

GPU搭載PCクラスタの課題

GPU搭載PCクラスタの課題

CPUだけ利用するPCクラスタでのクラスタ間データ転送

メインメモリ→(CPU)→NIC ⇒ NIC→(CPU)→メインメモリ

GPUを使うPCクラスタでのクラスタ間データ転送

GPUメモリ→(GPU) → (CPU) →メインメモリ→ (CPU) → NIC ⇒

NIC→(CPU)→メインメモリ→(CPU) →(GPU)→ GPUメモリ

GPUクラスタでは、GPU演算性能は高い、が、レイテンシは長い、

計算時間 ≪ 通信時間

⇒Embarrassingly Parallelでないと、並列効果が出にくい

通信と計算のオーバラップによる通信時間隠蔽も限界

CPU

GPU

NIC

NIC

CPU

GPU

メイン

メモリ

GPU

メモリ

メイン

メモリ

GPU

メモリ

(6)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

10

PCクラスタワークショップin京都(2010年2月19日)

GPU himenoBMT on RICC

GPU himenoBMT on RICC

himenoBMTのように、通信が多いプログラムでも、

大きな問題(XXL)を解けば性能は出る

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

11

PCクラスタワークショップin京都(2010年2月19日)

理研新システム(RICC)ジョブ実行率状況

理研新システム(RICC)ジョブ実行率状況

0

100

200

300

400

500

600

700

800

900

1000

10

/1

-0

10

/3

-0

10

/5

-0

10

/7

-0

10

/9

-0

10

/1

1-

0

10

/1

3-

0

10

/1

5-

0

10

/1

7-

0

10

/1

9-

0

10

/2

1-

0

10

/2

3-

0

10

/2

7-

21

10

/2

9-

21

10

/3

1-

23

11

/2

-2

3

11

/4

-2

3

11

/6

-2

3

11

/8

-2

3

11

/1

0-

23

11

/1

2-

23

node512

node256

node64

node16

node4

node1

socket

core

新システム(RICC)は2010/10/1に正式運用移行

全クラスタのノードを

メタジョブスケジューラ

で統一管理

ユーザ間フェアシェア、連成実行、順序実行、リソース指定(メモリ量、GPU,その他)

従来のメタジョブスケジューラを

マルチコア用に改良

コア、ソケット、ノード単位と局所性を保ちながら、

空間+時間軸上で割付

、高効率に実行

特定rankだけメモリ量を増大させる割り当ても可能

超大規模並列ジョブ(2000コア以上)実行前の稼働率低下防止が今後の課題

バックフィルできるジョブが十分には見つからない

正式運用移行期間

(7)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

12

PCクラスタワークショップin京都(2010年2月19日)

理研新システム(RICC)ジョブ実行率状況

理研新システム(RICC)ジョブ実行率状況

0

100

200

300

400

500

600

700

800

900

1000

10

/2

7-

5

10

/2

9-

5

10

/3

1-

7

11

/2

-7

node512

node256

node64

node16

node4

node1

socket

core

新システム(RICC)は2010/10/1に正式運用移行

全クラスタのノードを

メタジョブスケジューラ

で統一管理

ユーザ間フェアシェア、連成実行、順序実行、リソース指定(メモリ量、GPU,その他)

従来のメタジョブスケジューラを

マルチコア用に改良

コア、ソケット、ノード単位と局所性を保ちながら、

空間+時間軸上で割付

、高効率に実行

特定rankだけメモリ量を増大させる割り当ても可能

超大規模並列ジョブ(2000コア以上)実行前の稼働率低下防止が今後の課題

バックフィルできるジョブが十分には見つからない

おわりに

おわりに

今後、HPC計算は学術的計算、技術計算だけでなく、社

会のあらゆる活動を支える基盤技術になると考えていま

富士通は、BX900のようなコモディティであるシステム素

材をベースに、コンパクトで高性能なHPCシステムの提

供を行っていきます

また、高性能演算ルーチンの開発、新たなGPUの利用技

術の開発、構築運用管理の簡素化と高効率化を図る管

理システムの提供を行ってゆきたいと思います

(8)

All Rights Reserved, Copyright © FUJITSU LIMITED 2009

14

参照

関連したドキュメント

3 Numerical simulation for the mteraction analysis between fluid and

Our work provides insight into how cluster sizes and number of subtrees in a cluster are impacted by the value of α, the maximum degree d in the tree, the relationship between c and

Mochizuki, Topics Surrounding the Combinatorial Anabelian Geometry of Hyperbolic Curves III: Tripods and Tempered Fundamental Groups, RIMS Preprint 1763 (November 2012).

In this realization, the indecomposable objects of the cluster category correspond to certain homotopy classes of paths between two vertices.. Keywords Cluster category ·

In this paper we develop an elementary formula for a family of elements {˜ x[a]} a∈ Z n of the upper cluster algebra for any fixed initial seed Σ.. This family of elements

The layout produced by the VDCB algorithm is more evenly distributed according to the CP model, and is more similar to the original layout according to the similarity measures

Kambe, Acoustic signals associated with vor- page texline reconnection in oblique collision of two vortex rings.. Matsuno, Interaction of an algebraic soliton with uneven bottom

・大都市に近接する立地特性から、高い県外就業者の割合。(県内2 県内2 県内2/ 県内2 / / /3、県外 3、県外 3、県外 3、県外1/3 1/3