• 検索結果がありません。

複数の格納形式を利用した疎行列ベクトル積の高速化に関する検討

N/A
N/A
Protected

Academic year: 2021

シェア "複数の格納形式を利用した疎行列ベクトル積の高速化に関する検討"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)2017年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2017. HPCS2017 2017/6/5. 複数の格納形式を利用した疎行列ベクトル積の高速化に関する検討 石田 幸輝1, 三浦 瑛絵1, 深谷 猛2, 岩下 武史2, 中島 浩3 1 北海道大学 工学部, 2 北海道大学 情報基盤センター, 3 京都大学 学術情報メディアセンター e-mail: [email protected]. 1 はじめに 疎行列ベクトル積は,多くのシミュレーショ ンにおいて用いられる重要な計算核の一つで あり,その高速化に関して大きな需要がある. 本稿では,対象とする行列から特定の疎構造を 自動的に抽出し,その構造を活用した格納形式 を部分的に適用することにより疎行列ベクト ル積の高速化を行う.. 2 提案手法 代表的な疎行列の格納形式として,CRS 形式 がある.CRS 形式は,特定の疎構造を仮定せず, 図 1. 提案手法による疎行列ベクトル積の速度向上 疎行列一般に適用可能であるが,非ゼロ要素の の閾値による変化 位置情報を配列に格納するため,疎行列ベクト に用いる閾値αの設定は重要となる. ル積の実装において,乗算ベクトルの各要素へ の参照が位置情報の配列を経由する間接参照 3 数値実験の概要 となる.間接参照は直接参照と比べて一般に低 提案手法の効果を検証するために,京都大学 性能であり,その他にも効率的な SIMD 化実装 学術情報メディアセンターの CRAY CS400 の妨げになる等,性能上の問題を引き起こす要 2820XT(Intel Xeon Broadwell)1 ノードを用 因となる. いて数値実験を行った.プログラムは C 言語で 一方,偏微分方程式を 7 点差分公式で離散化 作成し,OpenMP によるスレッド並列化を行って した際に得られる行列のように,限られた斜め いる. のラインのみに非ゼロ要素が存在する疎行列 フロリダ大学提供の疎行列データベースか が実応用上に多く見られる.このような場合, ら取得した 3 種類の疎行列に関して,閾値α 各ライン上の非ゼロ要素を連続的に格納する を 6.0 から 9.5 まで変化させて,提案手法に Diagonal 形式[1]と呼ばれる形式を利用するこ よる速度向上(CRS 形式のみの場合の実行時間 とができる.本形式による疎行列ベクトル積の を提案手法の実行時間で割った値)を評価し 実装では,間接参照を回避し,乗算ベクトルの た.数値実験結果を図 1 に示す.図 1 から分 各要素への参照が連続となる利点がある. かるように,αに関わらず,tmt_unsym では有 そこで,入力された疎行列が(部分的にでも) 効,FullChip では逆効果となっている.一 Diagonal 形式を適用できる構造を有している 方,cant に関しては,αによって速度向上が 場合,その構造を活用することで疎行列ベクト 大きく変化した.以上の結果から,提案手法 ル積を高速化することを行う[2].提案する手 により疎行列ベクトル積を高速化できる事例 法では,与えられた行列の各斜めのラインにお があることが確認できた.今後,タイリング ける非ゼロ要素の割合を算出し,それが一定の 手法の適用やチューニングより,更なるプロ 閾値α以上である場合にはその斜めのライン グラムの高性能化を図っていく予定である. 上の非ゼロ要素は Diagonal 形式で格納し,残 参考文献 りの非ゼロ要素は CRS 形式で格納することを行 [1] Y. Saad: Iterative Methods for Sparse う.これにより,Diagonal 形式で格納された部 Linear Systems, SIAM, 2003. 分の演算において計算時間が削減されること [2] 三浦瑛絵 他: ステンシル構造を利用した が期待される.ただし,Diagonal 形式では,斜 疎行列ベクトル積の高速化に関する検討, めのライン上のゼロ要素も非ゼロ要素として 日本応用数理学会 若手の会 第 2 回学生 扱うため,ゼロ要素部分の演算がオーバーヘッ 研究発表, 東京, 2017 年 3 月 5 日. ドとなる.従って,Diagonal 形式の適用を判別. ⓒ 2017 Information Processing Society of Japan. 4.

(2)

参照

関連したドキュメント

私たちの行動には 5W1H

CIとDIは共通の指標を採用しており、採用系列数は先行指数 11、一致指数 10、遅行指数9 の 30 系列である(2017

担い手に農地を集積するための土地利用調整に関する話し合いや農家の意

層の項目 MaaS 提供にあたっての目的 データ連携を行う上でのルール MaaS に関連するプレイヤー ビジネスとしての MaaS MaaS

食品 品循 循環 環資 資源 源の の再 再生 生利 利用 用等 等の の促 促進 進に に関 関す する る法 法律 律施 施行 行令 令( (抜 抜す

海に携わる事業者の高齢化と一般家庭の核家族化の進行により、子育て世代との

それに対して現行民法では︑要素の錯誤が発生した場合には錯誤による無効を承認している︒ここでいう要素の錯

核種分析等によりデータの蓄積を行うが、 HP5-1