• 検索結果がありません。

結言

ドキュメント内 に関する研究 (ページ 108-111)

慮した疎行列格納方式は提案されていないことを示した.

4章では,既存手法では考慮されていない疎行列内の非ゼロ要素のパターン性を考慮し たPattern Compression (PatComp)法を提案した.PatCompは変換処理に多くの計算が 必要となることから,時間ステップ毎に亀裂や破壊によるFEMモデルの格子形状が変化 がなく,疎行列の形が変わらない問題を対象とした手法である.実際の数値シミュレー ションで使用された疎行列を用いた予備実験において,疎行列内の非ゼロ要素の並び方に はパターン性があることを明らかにした.多くの疎行列では,各行の非ゼロ要素の要素の 並びはごくわずかなパターンで表すことが可能であることが判明した.そこでPatComp 法では疎行列内のパターンを格納し,複数の行がそのパターンを読み出すことでSpMV を実行する.複数の行が同じパターンであるとき,格納する必要があるパターンは1つで あることから,大幅なメモリ使用量の削減が可能である.

5.3節ではPatComp法の目的が達成されているか確認するためメモリ使用量,SpMV

演算時間,GMRES演算時間,疎行列からの変換時間を評価した.メモリ使用量の評価で は,PatCompを用いることで,CSRに比べ最大31.1%のメモリ使用量の削減を達成した.

15個中4個の疎行列において30%以上,12個の疎行列において25%以上のメモリ使用量 を削減しており,PatCompの有効性を示した.またSpMV演算時間も既存の疎行列格納 方式CSRと遜色ない結果であることを確認した.しかしながら疎行列からPatCompへ の変換時間は多くの時間を要し,GMRESのボトルネックとなることを確認した.そのた め数値シミュレーション中に1回しか変換を要しない問題には適しているが,時間ステッ プごとに変換が必要となるた問題には適していない.

5.3章において,PatCompの欠点である変換時間の高速化を図るため,Row Block

Pack-ing(RBP)法を提案した.RBP法はメモリ使用量を削減しながらも,高速に変換を行える

手法を目的としている.高速な変換を行えるようにすることで,解析対象に亀裂や破損が 発生し,疎行列の形状も時間ステップごとに変化する問題に対してもメモリ使用量の削 減が行えるようになる.RBP法はFDMやFEMで生成される疎行列内の非ゼロ要素の連 続性に着目した疎行列圧縮手法である.RBP法は連続する非ゼロ要素のうち,先頭と末 尾の要素の列番号のみを格納することで,列番号格納に必要となるメモリ領域を削減す

る.PatCompと異なり,テーブルを用意する必要がなく,非ゼロ要素の列番号を順に確

認して行き,連続している場合のみ先頭と末尾の列番号を格納するため,非ゼロ要素数に 対して線形の計算量となる.CSRとELLに対するRBP法の適用フローを示し,その後 RBP-CSR,RBP-ELLを用いたSpMVカーネルを示した.RBP法を用いることで,低速 なGlobal Memoryへのアクセス回数を削減することが可能である.

5.6節ではRBP法の目的が達成されているか評価実験を行った.まずメモリ使用量の評 価実験では,RBP法を用いることでCSRのメモリ使用量を最大27.9%,ELLとELL-Rの メモリ使用量を最大28.0%削減することに成功した.SpMV演算時間の評価では,既存の 疎行列格納方式を用いたSpMVとRBP法を用いたSpMVの演算性能がほぼ同等であるこ とを示した.RBP-CSRはCSRに比べ平均1.82倍,RBP-ELLはELLに比べ平均1.57倍,

RBP-ELL-RはELL-Rと比べ平均1.14倍であった.GMRESを用いた評価実験では,各疎

行列格納方式への変換時間を含めたGMRES演算時間を評価した.その結果,RBP法を 適用する時間を含めてもRBP-CSRで平均3.1%,RBP-ELLで平均10.4%,RBP-ELL-R で平均1.4%,既存の格納方式を用いたGMRES演算時間より短縮した.この結果から,

提案したRBP法は既存の疎行列格納方式の演算性能はそのままに,メモリ使用量を大幅 に削減可能であることを示した.また変換も高速であることから,変換時間がGMRESの ボトルネックとならないことを確認した.PatCompの変換時間とRBP-CSRへの変換時 間を比較すると10倍以上RBP-CSRへの変換の方が高速であった.よってRBPの目的で あった変換時間の短縮が達成されたことを確認した.

本研究で提案したPatComp法,RBP法を活用し,数値シミュレーションで使用するメ モリ使用量を削減することで,さらに大規模かつ高精度な数値シミュレーションを同じ環 境で行うことが可能となる.医療分野ではさらに大規模かつ高精度な数値シミュレーショ ンがオンサイト環境で可能になり,検診精度の向上,検診時間の短縮など患者にとって,

様々な利益がある.またオンサイト環境だけでなく大規模な演算環境においてもメモリ使 用量の削減は有効である.地震発生時など緊急の場合に大規模なシミュレーションを行う

際,RBP法やPatComp法を用いることで,解析可能な範囲を広げるができ,被害抑制に

貢献することが予測される.

6.2 今後の展望

本研究はメモリ使用量の削減が第一目的であったため,RBP法,PatComp法のGPU に対する最適化は行わなかった.しかしRBP法,PatComp法のSpMVカーネルを最適 化することでさらに演算性能向上が期待できる.そのためRBP法,PatComp法のメモリ 使用量をそのままにSpMVの演算性能を高める手法についても今後研究に取り組みたい と考えている.

また本研究では,疎行列と密ベクトルの積(SpMV)を対象として疎行列格納方式を提 案,評価を行った.しかし疎行列を使用する処理は,疎行列と疎行列,疎行列と疎ベクト ルとの積など他にも多く存在する.そのため今後提案した疎行列格納方式がこれらの処理 に適用した際にどの程度有効なのか評価を行う.そしてそれぞれの疎行列を使用する処理 に適した疎行列の格納方式となるようRBP法,PatComp法を改良する.

ドキュメント内 に関する研究 (ページ 108-111)