• 検索結果がありません。

ポストペタスケール計算機上での密行列向け固有値ソルバーの性能の展望

N/A
N/A
Protected

Academic year: 2021

シェア "ポストペタスケール計算機上での密行列向け固有値ソルバーの性能の展望"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)HPCS2015 2015/5/19. 2015年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2015. ポストペタスケール計算機上での密行列向け固有値ソルバーの性能の展望 深谷 猛 1,2,4 , 山本 有作 3,4 , 今村 俊幸 1,4 1. 理化学研究所 計算科学研究機構,2 北海道大学,3 電気通信大学, 4 JST CREST e-mail : [email protected]. 1 はじめに:新しい固有値ソルバーの開発. 1-step scheme (ScaLAPACK). 2-step scheme (ELPA, DPLASMA). new 1-step scheme (EigenExa). 実対称行列の固有値計算は,様々な科学技術 real symmetric banded eigenpairs of B eigenpairs of A 計算において必要となる,基本的な行列計算 A B の一種である.幅広く利用されている ScaLAPACK の固有値計算ルーチンは,よく知られた, 行列の三重対角化に基づく手法(図 1 の緑色) T である.しかし,三重対角化のステップは,メ tridiagonal eigenpairs of T モリバンド幅に律速される上に通信も頻繁に必 図 1. 様々な固有値計算の手法. 要となり,高性能化が難しい.そこで,アルゴ 五重対角化 リズム自体を見直し,ペタ・ポストペタスケー 逆変換 (演算) ルシステムにより適した新たなソルバー開発が 分割統治法 (その他) 五重対角化 試みられている. (bcast) その代表例として,ELPA[1] や DPLASMA[2, 分割統治法 (pdgemm2) 3] が挙げられる.この二つのプロジェクトでは, 新たに二段階の三重対角化(図 1 の青色)を採用 分割統治法 五重対角化 (pdgemm1) (allreduce) することで,前述のボトルネックの解消を図っ 図 2. Oakleaf-FX ( 4800 ノード)を用いた EigenExa によ ている.しかし,求める固有ベクトルの数が多 る 23 万次元の行列の固有値計算時間の内訳. い場合,逆変換が二段階となる部分が無視でき ず,問題となることが指摘されている. されている FX100 等のスペックに基づいて,次 一方,本ポスターの第三著者を中心に開発 のシステムにおける EigenExa の性能の見積も されている EigenExa[4] と呼ばれる固有値ソル りを行う.具体的には,京コンピュータや FX10 バーでは,帯行列(現状では五重対角行列)の に対する,演算,メモリバンド幅,ネットワー 固有値と固有ベクトルを直接計算する手法(図 クのレイテンシ,ネットワークのバンド幅の性 1 の赤色)を新たに採用している.この手法で 能向上率から,固有値計算の各部分の実行時間 は,前述の逆変換のコストの問題を回避するこ を予測する.これにより,開発中の EigenExa とができる.ただし,帯行列の固有値計算のコ (やそこで新たに採用した手法)がポストペタ ストが増加するというトレードオフがある. スケールのシステムにおいて,どの程度有望で あるかを議論する. 2 現状とポストペタスケールへの展望 我々はこれまでに京コンピュータや FX10 を 用いて,開発中の EigenExa の性能を詳しく評 価してきた [5, 6].その一例として,東京大学 の Oakleaf-FX の 4800 ノードを使用して,23 万 次元の行列の固有値計算を行った場合の実行時 間の内訳を図 2 に示す.図が示すように,主要 コストは五重対角化と分割統治法による五重対 角行列の固有値計算で,前者は通信時間が,後 者は行列積が対部分を占めている. 本ポスターでは,図 2 のような,これまでに 我々が得ている詳細な測定結果や基本的な通信・ 演算カーネルのベンチマーク結果と,既に公表. ⓒ 2015 Information Processing Society of Japan. 参考文献 [1] ELPA, http://elpa.rzg.mpg.de/ [2] DPLASMA, http://icl.cs.utk.edu/ dplasma/index.html [3] PaRSEC, http://icl.utk.edu/ projectsdev/parsec/index.html [4] EigenExa, http://www.aics.riken.jp/ labs/lpnctrt/EigenExa.html [5] 深谷 猛, 今村 俊幸, FX10 4800 ノードを用いた密 行列向け固有値ソルバ EigenExa の性能評価, 東 京大学情報基盤センター スーパーコンピューティ ングニュース, Vol. 16, No. 3 (2014), pp. 20-27. [6] T. Fukaya and T. Imamura, Performance evaluation of the EigenExa eigensolver on the Oakleaf-FX supercomputing system, ACSI2015 (2015).. 83.

(2)

参照

関連したドキュメント

定可能性は大前提とした上で、どの程度の時間で、どの程度のメモリを用いれば計

この条約において領有権が不明確 になってしまったのは、北海道の北

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

上であることの確認書 1式 必須 ○ 中小企業等の所有が二分の一以上であることを確認 する様式です。. 所有等割合計算書

現状では、3次元CAD等を利用して機器配置設計・配 管設計を行い、床面のコンクリート打設時期までにファ

ヘッジ手段のキャッシュ・フロー変動の累計を半期

企業会計審議会による「固定資産の減損に係る会計基準」の対象となる。減損の兆 候が認められる場合は、

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計