最新PCクラスタにおけるAcuSolve 性能評価と富士通HPCのご紹介
2015年7月7日
株式会社富士通システムズ・イースト 解析ソリューション部
山浦 和也
2015 Japan Altair テクノロジーカンファレンス
Agenda
1.
会社紹介 および 富士通のHPCへの取り組み・富士通のHPCサーバの歴史
・HPCサーバ製品ラインナップ
2.
富士通PCクラスタによるAcuSolve性能評価・性能評価の概要(測定環境、テストモデル)
・測定結果
・性能評価のまとめ
3.
富士通のHPC向けソリューションのご紹介・PCクラスタソリューション
・TCクラウド
SCRYU/Tetra V11, STREAM V11
の並列性能
会社紹介 および 富士通のHPCへの取り組み
会社紹介
2011年6月、アルテアエンジニアリング株式会社と代理店契約
(HyperWorks、PBS Professional)
会社名 株式会社富士通システムズ・イースト
本社 東京都港区港南1-2-70 品川シーズンテラス 代表者 代表取締役社長 石川 享
設立
2012年4月1日
資本金
5億円(富士通100%出資)
売上高
1,339億円(2015年3月期)
従業員
4,950人(2015年4月現在)
事業内容
システム企画・コンサルティング システム構築サービス
業種・業務別パッケージ開発 アウトソーシングサービス
富士通のHPCサーバの歴史
30年以上にわたりHPCのトップベンダーとしてビジネスを展開
~1980 1985 1990
(注)「京」について :理化学研究所と富士通が共同で開発. 「京」は理化学研究所の登録商標です。
1995 2000 2005 2010
将来ベクトル
F230-75APU
VPシリーズ
スカラ
VPP500
VPP5000
世界最速のベクトルプロセッサ 提供(1999年)
AP1000
AP3000 VPP300/700
PRIMEPOWER HPC2500
SPARC Enterprise
エクサスケール スーパーコンピュータ
PRIMEQUEST
世界最高のスケーラビリティ を実現(2003年)
日本発のベクトル型スーパーコンピュータ提供
(1977年)
FX1
世界最高の実行効率を達成 (2008年11月,TOP500)
PCクラスタ型で日本一の性能を実現
(2004年6月,TOP500)
PRIMERGY RX200
クラスタノードHX600 クラスタノード
PRIMERGY BX900
クラスタノードX86クラスタ
クラスタ
PRIMEHPC FX100
NWT
ⒸJAXA
スーパーコンピュータ 「京」(注)
富士通のHPCサーバ製品ラインナップ
Scale Out Scale Up
大規模SMP(注)型演算サーバUNIXサーバ SPARC M10
マルチコアプロセッサ「SPARC64™ X」4CPUを1 筐体~16筐体までを増設可能(最大:1,024 コア,64TBメモリ)
最大64TBの大容量メモリを搭載可能
PRIMEHPC FX100
スーパーコンピュータ
34(32+2)コア SPARC64™ Xifx プロセッサ採用
最大100PFLOPS以上の 大規模計算環境を実現
基幹IAサーバ
PRIMEQUEST
最大8個のXeonを搭載
最大1TBの大容量メモリ
デスクトップPC
ESPRIMO
PCクラスタ
PCサーバ PRIMERGY
ラックサーバ 最大2個のXeonを搭載 する業界標準サーバ
(1U/2U)
18ブレード/10Uと8ブレード/6Uの Xeonブレードを搭載可能な高密 度大規模ブレードサーバ
マルチノードサーバ ブレードサーバ
ハイエンド
PCワークステーション
CELSIUS R シリーズ
サーバ機に搭載するXeonを 最大2個搭載可能
GPUコンピューティングカードを 搭載可能
データセンターに最適な高集積・省 電力設計とHPCを実現する高性 能アーキテクチャーを兼ね備えた高 密度マルチノードサーバ
4GPU/コプロセッサー搭載サーバ
低価格・低消費電力で CPU以上の性能を実現 するGPU/コプロセッサーを 高密度搭載可能なHPC 専用モデル
SCRYU/Tetra V11, STREAM V11
の並列性能
富士通PCクラスタによるAcuSolve性能評価
富士通から見たAcuSolveの強み 特長1 ロバスト性
有限要素法、収束の安定性、ゆがんだ要素にも対応
特長2 スピード
特長3 コストパフォーマンス
高い並列化性能、独自の直接解法による収束の速さ
HyperWorksユニットで動作、柔軟な並列実行
AcuSolve性能評価の概要
目的 :富士通の最新PCクラスタ環境において、流体解析ソルバ AcuSolveの性能を測定し、並列化性能を評価する
場所 :富士通トラステッド・クラウド・スクエア 検証ルーム (浜松町 世界貿易センタービル)
期間 :2015年5月
ソフト :AcuSolve V13.0 PBS Pro V13.0 SimBINDER V1
ハード :次ページにて紹介
評価値 :CPU/Elapse時間 (3回平均)
Fujitsu Trusted Cloud Square
検証マシン スペック情報
計算ノード(8台)
機種名
PRIMERGY CX2550M1 / RX2540M1
CPU Xeon E5-2667 v3(3.20GHz/8コア/20MB) ×2
メモリ128GB(16GB 2,133 Registered DIMM×8)
ドライブHDD:1TB×2(2.5インチ,BC-SATA, RAID1) OS Red Hat Enterprise Linux 6.5
コンパイラー
InfiniBand FDR
BIOS設定 Turbo Boost
:ONHyper Threading
:OFFファイルサーバ
機種名
PRIMERGY RX350 S7
CPU Xeon E5-2690 (2.90GHz/8コア/20MB) ×2
メモリ64GB(8GB 1,600 Registered DIMM×8)
ドライブHDD:1TB×2(3.5インチ,SATA, RAID1) OS Red Hat Enterprise Linux 6.5
BIOS設定 Turbo Boost
:ONHyper Threading
:OFFPRIMERGY RX350 S7
PRIMERGY CX2550M1
検証マシン ネットワーク構成
富士通トラステッド・クラウド・スクエア 検証マシン環境
計算用ネットワーク
(InfiniBand)
管理用ネットワーク(1 Gigabit Ethernet)
・ ・
・
スイッチ スイッチ
計算ノード
PRIMERGY CX2550 M1 ×8
基幹ネットワーク管理ノード兼ファイルサーバ
PRIMERGY RX350 S7
作業用PCCase1 Case2 Case3
業 種 電子機器 自動車 攪拌槽
デ モ ル
概 要
・電子機器の熱流体解析
・基板3枚、電子部品100点以上
・発熱、自然対流、輻射を考慮
・自動車の空力解析
・大規模な解析空間に多数の メッシュを生成
・風速80Km/h
・多成分の移流拡散
・別流体が8.5kg/sで流入
・インペラーが100prmで回転 要 素
数
902万 7,140万 1,082万
観 点 現実的なモデル 大規模データ 複雑な解析条件
性能測定に使用したテストモデル
SCRYU/Tetra V11, STREAM V11
の並列性能
測定結果
測定結果 Case1(約902万要素)
Core
実行時間【sec】 スケールCPU Elapse CPU Elapse
16 4496.7 4575.4 1.00 1.00 32 2119.5 2162.3 1.85 1.78 64 1020.6 1048.3 3.85 3.57
128 550.5 606.1 8.17 7.55
測定結果 Case2(約7,140万要素)
Core
実行時間【sec】 スケールCPU Elapse CPU Elapse
16 32200.1 32660.3 1.00 1.00
32 16843.8 17078.4 1.92 1.91
64 7929.0 8062.0 4.08 4.05
128 4126.4 4216.8 7.80 7.75
測定結果 Case3(約1,082万要素)
Core
実行時間【sec】 スケールCPU Elapse CPU Elapse
16 11072.4 11152.9 1.00 1.00
32 5833.7 5878.4 2.25 2.19
64 2901.7 2924.2 4.52 4.40
128 1292.0 1336.0 8.57 8.35
性能評価のまとめ
全てのテストデータに対して、良好な並列スケーラビリティを示し、
「コア数8倍」 に対して 「速度7.88倍」 の性能が確認できた。
(Elapse時間、平均値)
富士通の最新PCクラスタ環境において、3件のテストデータを用い、
16から128並列での速度性能を評価した。
富士通のPCクラスタ
製品・サービスのご紹介
富士通PCクラスタソリューションのご紹介
PCサーバ PRIMERGY (プライマジー) シリーズ
PCクラスタに最適なインテル Xeon E5-2600 v3 製品ファミリー搭載 2WAYサーバラインナップ
PRIMERGY BX900S2
ラックマウントサーバ マルチノードサーバ ブレードサーバPRIMERGY BX400S1 18ノード/10U高密度実装
からラック不要のフロアスタンド 構成まで対応可能PRIMERGY CX400M1 2Uの省スペースに最大で 4ノード高密度搭載可能
4ノード/2U筐体
高密度実装(CX2550 M1)
GPGPU/Xeon Phi
×2枚内蔵可能
(CX2570 M1)
PRIMERGY RX2530M1 1U筐体ながら最大容量16TB
搭載可能なラックマウントサーバ拡張性に優れた2U ラックマウントサーバ
PRIMERGY RX2540M1
ご参考)最新CPUの性能
(開発名称 Haswell-EP)従来モデルとの性能比較 (浮動小数点演算スループット性能)
SPECfp_rate_base2006、最新モデルのレートは2014年8月時点の暫定値
193 266
495
677
0 200 400 600 800
RX300 S5 RX300 S6 RX300 S7 RX300 S8 RX2540 M1
単位 : レート
E5-2697 v2 (12コア/2.7GHz)
× 2CPU E5-2690
(8コア/2.9GHz)
× 2CPU X5690
(6コア/3.46GHz)
× 2CPU X5570
(4コア/2.93GHz)
× 2CPU
E5-2697 v3 (14コア/2.6GHz)
× 2CPU
E5-2699 v3 (18コア/2.3GHz)
× 2CPU CPU開発コード
Nehalem-EP (2009年4月~)
CPU開発コード Sandy Bridge-EP
(2012年3月~) CPU開発コード
Westmere-EP (2010年4月~)
CPU開発コード Ivy Bridge-EP (2013年9月~)
CPU開発コード Haswell-EP (2014年9月~)
本情報は予告なく変更することがあります。
521
0 200 400 600 800 1000
CX250 S2 RX2540 M1 1079
単位 : GFLOPS
E5-2697v2 (12コア/2.7GHz)
× 2CPU AVX対応
E5-2697v3 (14コア/2.6GHz)
× 2CPU AVX 2対応 演算性能(DGEMM)
RX2540 M1はAVX 2向けコンパイル済み
0 50 100
CX250 S2 RX2540 M1 単位 : GB/s
E5-2697v2 (12コア/2.7GHz)
× 2CPU AVX対応
E5-2697v3 (14コア/2.6GHz)
× 2CPU AVX 2対応 メモリスループット性能
(STREAM TRIAD)
99.1
119.3
メモリアクセス性能の向上
メモリ動作クロック周波数が前世代の1866MHzか ら2133MHzに上がり、スループット性能が向上。
実効性能が高いDual Rankメモリをラインナップ。
「インテル ® AVX 2」 命令セットに対応
「インテル
® AVX 2」の「FMA (Fused Multiply-Add) 」
機能により、演算性能がさらに向上。(アプリケーションにより、効果は異なります。)
CPUコア数が前世代モデルの1.5倍
「インテル
® Xeon ® E5-2600 v2 製品ファミリー」
搭載の前世代モデルと比較して、1CPUあたりの 最大コア数が 12 から 18 に増加。
富士通ブース内のパンフレット:最新CPU 「Xeon®
E5-2600 v3」 搭載PCクラスタシステムより
PCクラスタ Quick Start Suite
PCクラスタ Quick Start Suite
導入検討から運用まで、PCクラスタ Quick Start Suiteで
お客様のシステム構成から運用まで、トータルに支援し、フェーズごと に最適な製品・サービスを提供するソリューションです。
システム
構成検討 システム
運用検討 システム
構築 システム
運用
ハードウェア
OS
ミドルウェアジョブ運用 ファイル共有 システム監視
インストール
設定 お引き渡し 解析業務 トラブル対応 モニタリング
おすすめ構成
PCクラスタシステムテンプレート
スタートアップサービス 運用支援サービス
SupportDesk
(
業界最高水準の国内2時間オンサイト修理
お客様満足度の向上を目指し、高品質なサービスの提供に取り組んでいます。
サポートセンターと全国のサービス拠点のとのスムーズな連携により、業界最高水準 の2時間以内
(*1)
オンサイト修理を実現しています。また、お客様がサービスエンジ ニアの対応状況や保守部品の到着時間などをお客様専用ホームページで確認す ることも可能(*2)
です。富士通のPCクラスタ
製品・サービスのご紹介
富士通のHPCクラウドサービス
HPCクラウドサービス TCクラウド
HPC用途に特化したクラウドサービス
富士通が長年培ってきたスパコンの技術をクラウドで利用できますお客様環境 プレポストもクラウドで可能
WEB GUIを提供
STREAM
SCRYU/Tetra LS-DYNA SCIGRESS Poynting
安心サポート
ヘルプデスクサービス
日額従量ライセンス
多彩なアプリケーション
HPC Portal
高速リモートデスクトップ
高性能プラットフォーム
25社61アプリ
流体解析 構造解析 電磁界解析 音響解析 計算化学 最適化設計
HPCクラウドサービス TCクラウド
特長1 高性能
HPC分野に特化した高性能な計算環境を提供
特長2 高いオンデマンド性
従量課金制で大規模な計算環境を必要なときに必要な分だけ利用可能
特長3 高い利便性
クラウド利用のメリットを最大限に引き出す各種ツール・サービスを提供
特長4 高信頼のデータセンター
富士通の堅牢な国内データセンターによるクラウドのサービスをご提供
HyperWorks製品が高性能な計算環境上で利用可能
富士通が培ったHPC技術をネットワーク経由で利用可能
【特長1】高性能
CAE業務に適した高性能なPCクラスタ環境の利用が可能
物理ノードを専有利用可能
高性能なIntel Xeonプロセッサ(20CPUコア/1ノード)
高並列計算に適した高速インターコネクト(InfiniBand FDR)
高速で大量にデータ処理が可能なファイルシステム
スーパーコンピュータ「京」のファイルシステム開発ノウハウを基に、オープンソースソフトウェア「Lustre(ラスター)」をベースにPCクラスタシステム向けに機能強化
ファイルシステム側でのボトルネックが発生しないよう、高速で大量にデータ処理が可能導入前
I/O時間 CPU時間 I/O時間
導入後
I/O CPU時間 I/O時間
約 12 時間
約 6 時間(▲50%)
システム全体処理時間の 3/4をI/Oが占める場合
I/O処理性能が3倍になれば、
システムトータルの処理時間が1/2に!
1/3 1/3 変化なし
導入効果 一般的な解析・シミュレーションへの 「FEFS」 適用例
高速並列分散ファイルシステムFEFS(Fujitsu
Exabyte File System)
【特長2】高いオンデマンド性
計算リソースを
「必要なときに」「必要な分だけ」「迅速に」調達可能
計算サーバを月/日/時間単位の従量課金制で1ノードから利用可能
手頃な金額で利用可能 300円(1ノード/1時間)~
短いリードタイムで大規模な解析環境を確保可能
TCクラウドの利用による計算環境の増強
10ノード 5ノード
20ノード
30ノード
年間の需要変動
計算需要(ノード数)
ピーク時は
TCクラウドを利用
不足分は
TCクラウドを利用
需要に応じた増設により高い稼働率を維持 無駄な投資を抑えたスモールスタートが可能 緊急の需要に対しても即時利用可能
一時的なマシンパワーの増強により 研究開発スピードを加速化
【特長3】高い利便性
Webブラウザから容易かつ共通の操作性でHPCシス
テムを利用可能なポータルシステム
HPCシステム固有のスキル(Linuxコマンド、ジョブスケ
ジューラ等のスキル)がなくとも、ファイル操作やジョブ操 作を簡単に実行可能。
誰でも簡単に同じ操作で解析が実行でき、解析作業 の平準化が可能WebベースのGUIで簡単操作
リモートデスクトップサービス HPC Portal
プレポスト環境も利用可能
富士通独自の仮想デスクトップ高速化技術を搭載し た、リモートデスクトップサービス
大容量の解析結果データを手元にダウンロードせず、即時解析結果の表示が可能
高画質・高性能なプレポスト環境をクラウド上で利用
可能 複数個所での画面共有による解析評価検討が可能お客様環境(複数個所での画面共有)
Internt
設計部門 解析部門
自家用発電装置 空冷式空調機
手のひら静脈認証装置
【特長4】高信頼のデータセンター
富士通の堅牢な国内データセンターによるクラウドサービス
セキュリティー、災害等に対する設備・運用面の対策を実施
各種認証を取得
設備 対策 実施内容
電源 停電 無停電電源装置(UPS)、自家用発電装置 冗長並行商用同期運転方式
空調
空調 空冷式空調機
漏水 空調機械室/配管を計算機室と分離
フロア内防水堤・排水設備、床防水対策加工、床・配管に漏水センサー設置 温度・湿度 温度・湿度センサーの設置
災害対策
地震 ラック免震・落下防止枠付き専用ラックへの機器収納
火災 自動火災報知器設備、防排煙制御設備、窒素ガス消火設備、
超高感度煙センサー設置、耐火壁パーティション採用 雷 避雷機器設備の設置
防犯対策
侵入防止 手のひら静脈認証、専用カード入退室管理、セキュリティゲート 防犯監視
ITVによる24時間監視およびHDDへの記録、保存
防犯管理 セキュリティドアの監視と遠隔操作、退室実績の記録保存
ISO27001規格取得
認定:ISOISO9001規格取得
ISO14001規格取得 ISO20000規格取得
LGWAN-ASP認定
認定:LASDEC プライバシーマーク認証取得 認定:JIPDECTCクラウド -解析アプリケーションサービス-
解析プラットフォームと組み合わせてご利用いただけるアプリケーション
アルテアエンジニアリング様のアプリケーションソフトウェア
熱流体解析(CFD)ソルバー
AcuSolve
アルテアエンジニアリング様と協力してTCクラウド上で動作検証済み
非線形・衝撃解析ソルバー
RADIOSS
モデリング&ビジュアライゼーション
HyperMesh
構造解析ソルバー・最適化
OptiStruct
複合領域設計スタディ・最適化
HyperStudy
高精度・高速なオートメッシャー
SimLab
全25社、61種のアプリケーションを使用可能
TCクラウド -解析ヘルプデスク-
解析における問題解決支援サービス例
豊富なソリューション提供実績をもつ専門家の力を結集
プラットフォームから解析アプリケーションの業務適用までのトータルサポート
精密機械、建設、鉄鋼、電気・電子、自動車など多彩な業種で蓄積したノウハウ
アプリケーションベンダー、コンサルティング会社など、パートナー様とのアライアンスで、多くの解析の専門家の力を活用
導入支援 教育支援 運用支援 受託解析
アプリベンダーのソフトや内製ソフトを利用したい 問題切分けで困っている、運用構成への助言が欲しい
アプリケーションの利用技術を習得したい 解析業務をアウトソーシングしたい