• 検索結果がありません。

H行列ベクトル積のスレッド並列化手法に関する性能評価

N/A
N/A
Protected

Academic year: 2021

シェア "H行列ベクトル積のスレッド並列化手法に関する性能評価"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)HPCS2017 2017/6/5. 2017年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2017. H 行列ベクトル積のスレッド並列化手法に関する性能評価 川村 卓人 1 , 深谷 猛 2 , 岩下 武史 2 , 伊田 明弘 3 1. 北海道大学 大学院情報科学研究科, 2 北海道大学 情報基盤センター, 3 東京大学 情報基盤センター e-mail : [email protected]. 近年,H 行列法(階層型行列法)[1] が活発 に研究されている.例えば,境界要素解析の高 速化のために H 行列を用いる事例が報告され ているが,この場合,H 行列を係数とする連立 一次方程式を反復法で解くことになる.本研究 では,その過程で必要となる,H 行列とベクト ルの積(H 行列ベクトル積)の計算に着目し, 最近のマルチコア CPU 環境におけるスレッド 並列化手法について検討する.. 2 H 行列の概要 本研究では,分散 H 行列ライブラリ HACApK [2] において生成された H 行列を扱う.本ライ ブラリで生成された H 行列はブロック(以降, 葉行列)に分割された構造を有しており,各葉 行列は,フルランクの密行列,または低ランク の行列(2 個の長方行列の積で表現)となって いる.なお,H 行列が有用となる応用では,大 半の葉行列が低ランク行列となっており,行列 の次元に対して,データサイズや関連する演算 量が相対的に小さくなる.. 3 H 行列ベクトル積のスレッド並列化手法 H 行列 A とベクトル x の積 y = Ax を考え る.H 行列の構造から,この計算は,A の各葉 行列に関して x の対応する部分との積を計算 し,その結果を y の該当部分に加える,という 形で処理できる.ここで,各葉行列と x(の一 部)との積は独立して計算が可能である.その ため,葉行列をスレッドに分配し,それぞれの スレッドで独立して y の断片を計算し,最後に y に関して縮約処理を行うことで,H 行列ベク トル積をスレッド並列化することができる.実 際,HACApK や文献 [3] でも,このアプロー チで H 行列ベクトル積をスレッド並列化して いる. 上述の手法でスレッド並列化をした場合,各 葉行列ごとの演算量が異なるため,スレッド間 の負荷の不均一を抑えることが重要になる.こ の点に対して,HACApK では,最初に演算量. ⓒ 2017 Information Processing Society of Japan. dŚƌĞĂĚϬ dŚƌĞĂĚϭ dŚƌĞĂĚϮ dŚƌĞĂĚϯ. 1 はじめに. dŚƌĞĂĚϬ dŚƌĞĂĚϭ dŚƌĞĂĚϮ dŚƌĞĂĚϯ. 図 1. 低ランク葉行列のスレッド分割手法(4 スレッド時). を見積もり,それがスレッド間で出来るだけ均 一になるように葉行列の分配を行っている.一 方,文献 [3] では,最初に,演算量がある閾値以 上となる葉行列を全スレッドで処理し,その後, 残りの葉行列に関して動的負荷分散(OpenMP の dynamic)を用いてスレッドに分配して処理 をする方法を提案している. どちらの手法についても,スレッド数を変化 させた場合の性能等が十分に調査されていると は言えず,特に最新のマルチコア・メニーコアプ ロセッサ上の実装については検討の余地が残っ ている.例えば,図 1 のような低ランク葉行列 のスレッド分割手法は,棟形らの方法と比べて スレッドの同期回数を削減することができるた め,一考の余地がある.そこで,本研究では, スレッド並列化手法についてより詳細な性能評 価・検討を行う.なお,性能評価結果について は,ポスター発表当日に報告する.. 参考文献 [1] W. Hackbusch: A Sparse Matrix Arithmetic Based on H-matrices. Part I: Introduction to H-matrices, Computing, Vol. 62, No. 2, pp. 89–108 (2009). [2] A. Ida et al.: Parallel Hierarchical Matrices with Adaptive Cross Approximation on Symmetric Multiprocessing Clusters, Journal of Information Processing, Vol. 22, No. 4, pp. 642–650 (2014). [3] 棟形克己 他: 動的負荷分散による階層型 行列計算の並列化, 情報処理学会研究報 告, Vol. 2015-HPC-148, NO. 5, pp. 1–15 (2015).. 5.

(2)

参照

関連したドキュメント

I 1ユ11I上 涙/1/2/3 111 】'12 122 1も2 昭L略 333 En E21 E31 E]2 E22 E32 E13 E23 E33

図一1 に示す ような,縦 お よび横 補剛材 で補 剛 された 板要素か らなる断面部材 の全 体剛性 行列 お よび安定係数 行列は局所 座標 系で求 め られた横補 剛材

究機関で関係者の予想を遙かに上回るスピー ドで各大学で評価が行われ,それなりの成果

血は約60cmの落差により貯血槽に吸引される.数

本節では本研究で実際にスレッドのトレースを行うた めに用いた Linux ftrace 及び ftrace を利用する Android Systrace について説明する.. 2.1

累積誤差の無い上限と 下限を設ける あいまいな変化点を除 外し、要求される平面 部分で管理を行う 出来形計測の評価範

核種分析等によりデータの蓄積を行うが、 HP5-1

1) 特に力を入れている 2) 十分である 3) 課題が残されている. ] 1) 行っている <選択肢> 2) 行っていない