• 検索結果がありません。

分散並列計算機における密行列ベクトル積の通信隠蔽実装の評価

N/A
N/A
Protected

Academic year: 2021

シェア "分散並列計算機における密行列ベクトル積の通信隠蔽実装の評価"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)HPCS2016 2016/6/6. 2016年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2016. 分散並列計算機における密行列ベクトル積の通信隠蔽実装の評価 川村 卓人,深谷 猛,岩下 武史 北海道大学 e-mail : tactics [email protected]. 1. はじめに. 行列ベクトル積は計算科学分野の多様な数値 シミュレーションのプログラムにおいて頻繁に 用いられる計算カーネルのひとつである.最近, H 行列 [1] と呼ばれる,密行列の一部を低ラン ク行列で表現することで記憶容量と演算量を削 減する行列近似手法が注目を集めており,H 行 列ベクトル積の計算を分散環境向けに並列化す る需要が生じている.近年の分散環境では,通 信コストが演算コストに対して相対的に大きく なっており,通信コストの削減が重要視されて いる.そこで,H 行列ベクトル積の分散並列化 における通信コストの削減を最終的な研究目的 と位置づけ,その一次的研究として,密行列ベ クトル積の分散並列化における通信コストの削 減について検証する.. 2. 通信隠蔽を用いた密行列ベクトル積の 分散並列化. 本研究では,分散並列環境において図 1 の ように分散された行列とベクトルに関する行列 ベクトル積の計算を考える.アプリケーション プログラムにおける一般的な実装では,最初に MPI Allgather を用いてベクトルデータを通信 し,各プロセスがベクトル x 全体を保持した状 態にした後で,独立に Ai x = y i の計算を行う. それに対して,図 2 に示すように,行列ベク トル積の計算を複数のステージに分割し,演算 と通信のオーバーラップを可能にすることで, 通信を隠蔽する実装を考える.具体的には,図 2 の場合,Process 1 は最初のステージでは A11 x1 の計算を行いながら,x1 のデータを Process 2 に送り,同時に Process 4 から x4 のデータを受 け取る.すると,次のステージで A14 x4 の計 算が可能となる.この実装では,理想的には, 全ての通信を演算で隠蔽することが可能(1 ス テージの演算コストが通信コストよりも大きい 場合)であり,行列ベクトル積の分散並列化に おける通信コストの削減が期待できる.. ⓒ 2016 Information Processing Society of Japan. Process 1 Process 2. Process. 図 1. 行列とベクトルデータの分散の様子. Process 1 Process 2 Process 3 Process 4. 図 2. 行列ベクトル積のステージ化と通信隠蔽の様子.. 1.6 1.4 1.2 1.0 0.8 0.6 0. 10000. 20000. 30000. ⾜ิ䝃䜲䝈 図 3. 通信隠蔽による高速化率:(従来手法の実行時間)/(通 信隠蔽を施した手法の実行時間),京都大学の GB8000 で 4 プロセスを使用.. 3 性能評価 図 3 は京都大学の GB8000 でプロセス数を 4 とした場合の結果(通信隠蔽による高速化率) であり,通信隠蔽が有効であることが確認でき る.ただし,通信隠蔽により実行時間が遅く なった事例や,MPI の実装に由来すると思われ る複雑な挙動も確認された(詳細はポスターで 報告).今後,H 行列ベクトル積の分散並列実 装を行うに当たり,今回の検証で得られた知見 をもとに,より詳細な調査や検討が必要である.. 参考文献 [1] W. Hackbusch, A Sparse Matrix Arithmetic Based on H-matrices. Part I: Introduction to H-matrices, Computing, Vol. 62, pp. 89–108 (2009).. 52.

(2)

参照

関連したドキュメント

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

チューリング機械の原論文 [14]

 当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文

このアプリケーションノートは、降圧スイッチングレギュレータ IC 回路に必要なインダクタの選択と値の計算について説明し

鉄道駅の適切な場所において、列車に設けられる車いすスペース(車いす使用者の

越欠損金額を合併法人の所得の金額の計算上︑損金の額に算入

この場合,波浪変形計算モデルと流れ場計算モデルの2つを用いて,図 2-38

(注)