• 検索結果がありません。

09中西

N/A
N/A
Protected

Academic year: 2021

シェア "09中西"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

2nd PCCC Symposium NEC

拡がる適用領域

 PCクラスタの現状と今後について

NECソリューションズ

第一コンピュータソフトウエア事業部

2nd PCCC Symposium NEC

1.Linux並列クラスタの状況

  

(1) なぜクラスタか

   (2) ユーザの利用分野

2.充実するアプリケーション

(1) アプリケーション分野の拡大

(2) システム運用ソフトウエアの強化

3.グリッドコンピューティングへ

4.今後の課題

(2)

2nd PCCC Symposium NEC

なぜ並列Linuxクラスタか

「超大型分野から広がるLinuxクラスタ」

       (日経システムプロバイダ 2002.11.22)

何よりもその安さ(価格性能比のよさ)

が特徴

    米国LLNL国立研究所 Linuxクラスタ(Intel Xeon 2300個)

    は米国ASCI Whiteの1/7の価格(ピーク性能は同じ)

小規模クラスタから大規模クラスタまでの拡張性に優れる

    中小企業から研究室まで市場拡大の潜在力

単なる安さだけでなく絶対性能、安全性、信頼性、可用性に優れる

    適用領域の拡大

    研究機関の他、バイオ/製薬、石油化学、航空宇宙のほか

    自動車産業での衝突解析シミュレーションや素材テストなど 

・ HPCクラスタコンピューティング市場予測 (IDC)

    2002年 5億800万ドル

    2005年 23億ドル

    (2004年までにHPCクラスタ市場の80%がLinux)   

2nd PCCC Symposium NEC

なぜ並列Linuxクラスタか

本年度から来年度の最大の傾向は大規模計算機、

計算システムの発表とその予算化

ASCI Purple (ASCI 最終システム)

 100TFlops 

Blue Gene/L         1PFlops (2005)

米国最大の計算システムTeraGRIDを構築 (2002予算 $53M)

     IA64/Linuxクラスタ (13.6TFlops)

大規模シミュレーション(

環境、生命科学、物理など)

 での現実的なシミュレーション(実効数十 TFlops で数時間)が現実感

 → 予算獲得のしやすさ

HPCプラットフォームは中期レンジで2極化か

 -1つは上記にある巨大計算システム。(グリッドの名の下に欧米で構築進む)

   

(3)

2nd PCCC Symposium NEC

PCクラスタ

高性能コンピューティング技術

バイオ

地球環境

流体解析

衝突解析

構造解析

熱解析

応用分野

フロップス値F(計算速度)

1ギガF

1テラF

1ペタF

10ギガF

100ギガF

10テラF

100テラF

スカラ

サーバ

スーパー

コンピュータ

地球

シミュレータ

(文部科学省)

クラスタ並列処理

スカラーSMP

ベクトル処理高速化

高並列コンピューティング

高性能1チップベクトル処理

超並列コンピューティング

1ギガF(Giga Flops)=10

9

Floating Point Operations per Sec.(10億演算/秒)

Networked HPC

with Broadband NW

Grid Computing

2nd PCCC Symposium NEC

TOP500 List for November 2002

(GFlops)

Rank Manufacturer Computer Rmax(GFlops) Installation Site Country Year Processors Rpeak Nmax Nhalf

1 NEC Earth-Simulator 35860 Earth Simulator Center Japan 2002 5120 40960 1075200 266240 2 Hewlett-PackardASCI Q - AlphaServerSC ES45/1.25GHz 7727 Los Alamos National Laboratory USA 2002 4096 10240 590000 126100 3 Hewlett-PackardASCI Q - AlphaServerSC ES45/1.25GHz 7727 Los Alamos National Laboratory USA 2002 4096 10240 590000 126100

5 Linux Network MCR Linux Cluster

Xeon 2.4GHz - 5694 Lawrence Livermore National Laboratory USA 2002 2304 11060 450000 90000 6 Hewlett-PackardAlphaServer SC

ES45/1GHz 4463 Pittsburgh Supercomputing Center USA 2001 3016 6032 280000 85000 7 Hewlett-PackardAlphaServer SCES45/1GHz 3980 Commissariat a l'Energie Atomique(CEA) France 2001 2560 5120 360000 85000 8 HPTi

Aspen Systems, Dual Xeon 2.2GHz -Myrinet2000

3337 Forecast Systems Laboratory - NOAA USA 2002 1536 6758 28000 75000

68 Self-made Presto III Athlon

1.6GHz 760.2 GSIC Center, Tokyo Institute of Technology Japan 2002 496 1587

86 NEC Magi Cluster PIII 933

MHz 654

CBRC - Tsukuba Advanced Computing

Center - TACC/AIST Japan 2001 1040 970 217600 29000

90 Self-made SCore IIIe/PIII 933MHz 618.3 Real World Computing (RWCP)/TsukubaResearch Center Japan 2001 1024 955 146000 23000

195 Self-ma de Xenia /IBM I ntellistaton Xeon 2.4GH z Myrinet 323.4

I ntelligent I nformation C enter, Doshisha

U niv ers ity Japan 2002 128 614.4 86000 14600 341 Self-ma de Pentium 4 C lus ter

2.4/2.0GHz - Giga net 219 H onda Res ea rch and D ev elopment Compa ny Japan 2002 140 588 90011 31000 352 NEC Titech Grid Cluster

-PII I 1.4GHz 212.7 GSIC Center, Toky o Institute of Technolog y Japan 2002 256 358.4

製品名、社名などは各社の登録商標または商標です。 出典 TOP500.Org http://www.top500.org/   ・   ・   ・   ・   ・   ・   ・   ・

SuperComputer Top500 ランキング

(4)

2nd PCCC Symposium NEC

0

10

20

30

40

50

60

70

80

90

100

'97.6

'98.6

'99.6

'00.6

'01.6

'02.6

Top500 のクラスタシステム数

最近のクラスタシステム推移

 エントリー数が急増

 最上位の性能も急上昇

 Rmax占有率も着実にアップ

最近のクラスタシステム推移

最近のクラスタシステム推移

 エントリー数が急増

 エントリー数が急増

 最上位の性能も急上昇

 最上位の性能も急上昇

 Rmax

Rmax占有率も着実にアップ

占有率も着実にアップ

クラスタシステム最上位の性能

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

'97.6

'97.1

'98.6

'98.11

'99.6

'99.11

'00.6

'00.11

'01.6

'01.11

'02.6

'02.11

クラスタシステムのRmax占有率

0

5

10

15

20

25

30

'97.6

'97.11

'98.6

'98.11

'99.6

'99.11

'00.6

'00.11

'01.6

'01.11

'02.6

'02.11

2002

2002

11

11

7727

7727

GFlops

GFlops

2002

2002

11

11

26.6 %

26.6 %

2002

2002

11

11

93

93

システム

システム

SuperComputer Top500 ランキング

2nd PCCC Symposium NEC

 ユーザの利用分野(統計)∼ 利用分野の多様化

サイエンス&リサーチ

  計算科学

  グリッドコンピューティング

  航空宇宙

機械・電気設計

  構造解析

  衝突解析

  回路設計

バイオ・化学

  相同性検索

  遺伝子構造解読

  生体分子設計支援

研究開発、バイオが主たる適用分野であったが

民需領域(

構造解析シミュレーション)へ急激に拡大

環境

(5)

2nd PCCC Symposium NEC

充実するLinux並列クラスタソリューション

   アプリケーションの適用拡大

分散メモリ型大規模並列構造

解析システム

陽解法汎用非線形構造・

流体

解析プログラム

有限要素法による衝撃・構造

解析プログラム

有限要素法による衝撃・構造

解析プログラム

蛋白質の分子動力学

シミュレーション

局所的に高い類似性を

有するものを検索

備考

完了

(SCore版あり)

完了

完了

完了

完了

(SCore版あり)

完了

(SCore版あり)

移植状況

構造解析

衝突解析

構造解析

衝突解析

構造解析

衝突解析

構造解析

分子動力学

相同性検索

機能

機械設計

機械設計

機械設計

機械設計

バイオ

バイオ

分野

ADVENTURE

Cluster

RADDIOS

PAM-CRASH

LS-DYNA

AMBER

BLAST

AP名

2nd PCCC Symposium NEC

  アプリケーションの適用拡大 (続き)

少ないメモリで高速な計算

解適合格子により最小限

のセル数で高精度の計算

結果

流体解析プログラム

有限体積法非構造メッシュ

備考

完了

(SCore版あり)

完了

完了

(SCore版あり)

完了

移植状況

熱流体解析

熱流体解析

熱流体解析

熱流体解析

機能

機械設計

機械設計

機械設計

機械設計

分野

SCRYU

FLUENT

VECTIS

STAR-CD

AP名

(6)

2nd PCCC Symposium NEC

LS-DYNA Benchmark [numi]

19688

12039

7351

10124

10790

18531

20471

34909

7460

21000

35225

11194

0

5000

10000

15000

20000

25000

30000

35000

4x1

4x2

8x1

8x2

16x1

16x2

Express5800 120Rc-1(Xeon 2.4GHz)

Time(sec)

SCore(Myrinet)

GM(Myrinet)

2nd PCCC Symposium NEC

PAM crash  (Xeon 2.4GHz)

77950

97910

0

20000

40000

60000

80000

100000

SCore Gb

LAM/MPI Gb

Xeon (2.4GHz) 16x2CPU

Elapsed Time

(7)

2nd PCCC Symposium NEC

STAR-CD (Xeon 2.4GHz)

2576.85

2632.07

2838.83

0

500

1000

1500

2000

2500

3000

SCore myrinet

SCore Gb

MPICH Gb

Express5800 Xeon (2.4GHz) 16x1CPU

Elapsed Time

2nd PCCC Symposium NEC

STAR-CD (P3 Myrinet(SCore))

111028.2

29104.14

21158.2

15206.86

11861.788365.766932.83

5047.33

0

20000

40000

60000

80000

100000

120000

Performance Ratio to

1CPU

1CPU 4x1

4x2

8x1

8x2

16x1 16x2 32x1

Express5800 P3 (1GHz)

(8)

2nd PCCC Symposium NEC

7:07:44

2:02:07

1:10:57

0:00

2:00

4:00

6:00

8:00

Time(hour:minute)

1cpu

4cpu

8cpu

Express5800 ISS2 (Xeon 2.2GHz)

VECTIS  Myrinet (SCore)

2nd PCCC Symposium NEC

BLAST query1 (1entry,164letters)

Myrinet(SCore)

63.4

25.1

13.9

9.3

7.4

0

20

40

60

80

Time(sec)

2CPU

4CPU

8CPU

16CPU

32CPU

(9)

2nd PCCC Symposium NEC

AMBER7 [gb_mb]

Myrinet (SCore)

150

76

39

21

11

6

4

0

30

60

90

120

150

Time(sec)

1CPU

2CPU

4CPU

8CPU

16CPU

32CPU

64CPU

Express5800 120Ra-1(PentiumⅢ 1GHz)

2nd PCCC Symposium NEC

MPI Ping pong Throughput

MPI/EXP

(MPI/SXベース)

(10)

2nd PCCC Symposium NEC

MPI Ping pong Latency

MPI/EXP

(MPI/SXベース)

2nd PCCC Symposium NEC

菊池プレス工業様:自動車専門部品

  (車体プレス部品、厚物精密部品)

薄型Expressサーバ×32台(32CPU)、Fast Ethernet

板成形専用解析CAEソフトウェア:JSTAMP-Works

JSTAMP-Works

LS-DYNAベースの非線形動的構造解析シミュレーション

従来システムと比べ

5倍の高速化を達成

データ容量86メガバイトの部品データ計算を

従来30時間のところ 6時間で終了)

厚肉鋼板のプレス成形

鋼板を上下の金型により成形する

シミュレーション.

加工時において鋼板の温度は最大で

50℃程度変化するため、温度変化を

考慮した場合としない場合とでは、

成形荷重が大きく変化。

このようなシミュレーションにより

成形荷重を精度よく予測.

厚肉鋼板のプレス成形

厚肉鋼板のプレス成形

鋼板を上下の金型により成形する

鋼板を上下の金型により成形する

シミュレーション

シミュレーション

.

.

加工時において鋼板の温度は最大で

加工時において鋼板の温度は最大で

50

50

℃程度変化するため、温度変化を

℃程度変化するため、温度変化を

考慮した場合としない場合とでは、

考慮した場合としない場合とでは、

成形荷重が大きく変化。

成形荷重が大きく変化。

このようなシミュレーションにより

このようなシミュレーションにより

成形荷重を精度よく予測

成形荷重を精度よく予測

.

.

(11)

2nd PCCC Symposium NEC

LS-DYNA  

(解析モデル:NUMI99)

適用分野の拡大 

構造解析、衝突解析、計算流体力学(

CFD)等

UNIX 並列計算機

との比較(単位:時間)

100Ethernetでは16∼24cpuで

通信のボトルネックが顕著

測定結果A∼ Dは ‘00 LS-DYNAユーザー会

論文集より ( MPPDYNA Ver.940.2a 使 用)

ケース1,2 ( MPPDYNA Ver.960 使用)

0

10

20

30

40

50

60

0

8

16

24

32

40

48

56

64

CPU 数

性能向上比

Myrinet2000 で

40.7倍(61CPU)

Fast Ethernet

Myrinet

オフセット衝突解析

CPU数    A

D ケース1ケース2

4

19.31

16.78

17.5

22.22

8

10.34

9.31

12.25

12

6.57

7.22

16

5.57

6.6

6.97

6.7

20

5.78

24

6.85

32

3.02

3.99

3.05

3.45

61

2.18

64

2.27

2nd PCCC Symposium NEC

アプリケーション事例

分散メモリ型並列コンピュータ(Linux並列クラスタ)上で

いまだかつてない大規模構造問題を高速で解くことに成功

(応用例)

 自動車エンジン騒音の低減のため,大規模モデルを使用した

 エンジン振動・騒音の高精度の予測

 ADVENTURECluster 

Linux並列クラスタでの有効性実証

長時間の連続運転によるハードウェア,OS,並列環境の安定性を達成

 本解析では32CPUを32ノード分散型 (共有メモリ未使用) を用いた。

 本マシンは,電源,熱,インタコネクトのパフォーマンスなど,

 ハードウェアの諸問題に配慮してある,本格的実用PCクラスタであることを実証

(12)

2nd PCCC Symposium NEC

次世代汎用構造解析システム

   

比較的廉価なLinuxクラスター+フリー通信ライブラリー(MPI)に

加えて、高精度並列FEMソフトにより、

   真のパーソナルな高度並列処理技術の提供が可能

堅牢な 

Express5800/ Parallel PC-Cluster

+

SX/HPC技術をベースとした

エンジニアリングサポート

堅牢な 

Express5800/ Parallel PC-Cluster

+

SX/HPC技術をベースとした

エンジニアリングサポート

  さらなる大規模解析システムでの要求要件

・ 3次元丸ごと詳細解析機能(

10の7乗−10の8乗自由度以上)

・数百∼数千、数万ノードの超並列環境で高い並列処理性能

・多様な並列分散環境への移植性の容易さ

・単一現象の解析ばかりでなく、構造−流体などの各種連成解析や、

 設計解析を並列分散環境で自由自在に行えること

      (ADVENTUREプロジェクト資料より)

さらなる大規模解析システムでの要求要件

・ 3次元丸ごと詳細解析機能(

10の7乗−10の8乗自由度以上)

・数百∼数千、数万ノードの超並列環境で高い並列処理性能

・多様な並列分散環境への移植性の容易さ

・単一現象の解析ばかりでなく、構造−流体などの各種連成解析や、

 設計解析を並列分散環境で自由自在に行えること

      

(ADVENTUREプロジェクト資料より)

GUI

(user)

#0

#1

#2

#nn

#0

#1

#2

#xx

GUI (Admin)

multi-node job

遠隔ユーザ

LSF

LSF

LSF

LSF

a

a

b

CUI

a

b

c

WS

a

Single Point

of Entry

Job投入

login

WS/Linux

#0

#1

#2

#nnn

H C E

PC-Cluster System

IA64-Cluster System

SX System

HCE

d

d

SCore Cluster Software

HyperClusterEngine

d

SCore job

統一された

システム運用管理

HCE

HCE

c

d

d

c

LSF

LSF

LSF

LSF

 HPC統合システム運用 

SCoreの高速クラスタ機能を損なわずLSFのジョ

ブスケジューリングを適用しセンタ運用を

可能とする

(13)

2nd PCCC Symposium NEC

NECのテクニカルグリッドソリューション

Broad Band Network

HPC

プラットフォーム

Linux

SUPER-UX

Server

Storage

OS

ローカル

スケジューラ

NQSII

ERS

CONDOR

SGE

カスタマイゼーション, チューニング, 教育

標準サポート (install&maintenance)

グリッドソフトウエア (Globus, Middleware )

SCore

LSF

・・・・

HPC グリッド

ソリューション

HyperClusterEngine

21世紀の

グランドチャレンジ

バイオ

ナノテク

地球環境

高エネルギー

物理

グリッドコンピューティング

  テクニカルグリッドの実用化へ向けて

  HPC技術+グリッド技術によるトータルソリューションを提供

2nd PCCC Symposium NEC

今後の課題

大規模計算サーバ及び

ストレージサーバとしての基盤

超高速ネットワーク

次世代Myrinet, InfiniBand, QuadricsII

10GbE, Broadband network

• Peta-scale ストレージシステム

高速並列 I/O (

リモートファイルシステムを

アクセスするための並列

I/Oインターフェース)

並列ファイルシステム、ソフトウエア RAID

・ グローバルファイルシステム

   

計算サーバからの高速ファイルアクセス

高信頼性の向上

高精度な予防保守

•ハードウェア障害の統計情報を採取

障害の自動復旧

•検出時、自動的に被障装置の

 再初期化、再組み込みを試行

障害装置の切り離し

•システムを停止させることなく被障装置

 のみを切り離すことにより、障害の

 波及を防止

障害計算ノードの切り離し

•特定のノードをクラスタから切り離し、

切り離したノードの保守を行う。

クラスタを停止させることなく切り離した

ノードをクラスタに組み込む。

ファイルサーバの切り替え

•NFS,GFSサーバの自動切換え

システム/ ユーザ 管理

アカウンティング , 資源の使用制限

• 動的資源監視及び管理

•バッチジョブシステムとの連携

(14)

参照

関連したドキュメント

本節では本研究で実際にスレッドのトレースを行うた めに用いた Linux ftrace 及び ftrace を利用する Android Systrace について説明する.. 2.1

ポートフォリオ最適化問題の改良代理制約法による対話型解法 仲川 勇二 関西大学 * 伊佐田 百合子 関西学院大学 井垣 伸子

I Samuel Fiorini, Serge Massar, Sebastian Pokutta, Hans Raj Tiwary, Ronald de Wolf: Exponential Lower Bounds for Polytopes in Combinatorial Optimization. Gerards: Compact systems for

0.1uF のポリプロピレン・コンデンサと 10uF を並列に配置した 100M

本装置は OS のブート方法として、Secure Boot をサポートしています。 Secure Boot とは、UEFI Boot

[r]

( 内部抵抗0Ωの 理想信号源

(1982)第 14 項に定められていた優越的地位の濫用は第 2 条第 9 項第 5