• 検索結果がありません。

ボリュームレンダリングを高速化するためのin-place回転によるキャッシュヒット率の向上

N/A
N/A
Protected

Academic year: 2021

シェア "ボリュームレンダリングを高速化するためのin-place回転によるキャッシュヒット率の向上"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 77 回全国大会. 1J-07. ボリュームレンダリングを高速化するための in-place 回転による キャッシュヒット率の向上 御前 雄嗣†. 伊野 文彦‡. 萩原 兼一‡. 大阪大学基礎工学部† 大阪大学大学院情報科学研究科‡. 1. はじめに ボリュームレンダリング(VR)は 3 次元デー タを可視化する技術である.この技術は医用 CT 像や流体シミュレーションの分析を視覚的に支 援する. VR はメモリ集中型の応用であり,参照したデ ータの再利用が局所的である.したがって,テ クスチャキャッシュ(TC)のヒット率向上によ る高速化が試みられている.Sugimoto ら[1]は, 視点の位置に応じてスレッドブロック(TB)[2] の形状を適切に選択することにより,TC ヒット 率を向上した.ただし,特定の視点において, 参照ストライドが大きくなり,TC ヒット率を向 上できなかった. そこで,本論文では,TC ヒット率向上による VR の高速化を目的として,視点の位置に応じて ボリュームデータを in-place 回転する手法を提 案する.ここで,in-place 処理とは,作業用メ モリ領域の大きさが O(1)で済む処理を指す.メ モリ参照のストライド幅が大きくなる視点に対 しては,レンダリングの直前にボリュームデー タを動的に in-place 回転することにより,スト ライド幅を削減し,TC ヒット率の向上を図る. 2 提案手法 Sugimoto らの手法では,スクリーンに対して 最も平行な面が yz 平面であるときに(図 1 左),. TC ヒット率が低下してしまう.この場合,スト ライド幅に関して有利な x 軸がスクリーンと平 行になるよう,提案手法はボリュームデータを 動的に回転させる.具体的には(図 1 右),y 軸 を中心にボリュームデータを 90 度回転させ,yz 平面への参照を xy 平面への参照に置換する.さ らに,Sugimoto らの手法,すなわち TB 形状の適 切な選択を併用する. 回転前および回転後のデータをビデオメモリ に保持しておけば,これらの使い分けにより提 案手法を実現できる.しかし,ボリュームデー タの 2 倍のビデオメモリ容量が必要である.そ こで,我々は in-place 処理を目指す. 2.1 in-place 回転 図 2 に,xz 平面を 90 度回転させるときの様子 を示す.図中において,T1~T4 の各々は t×t 個 のボクセルを含むタイルを表す.回転後に T1 は T2 の位置へ移動する.同様に,T2,T3 および T4 について移動先を考えれば,T1~T4 の移動は巡 回置換で表せる. 提案手法は,in-place 回転を実現するために, この巡回置換を 1 つの TB(サイズ t×t)に担当さ せる.つまり,TB は 4 回の移動を反復し,各々 はタイルの退避および上書きを処理する.例え ば,T1 の移動は以下のように実現する.. 図 1 回転による参照ストライド幅の削減 Increasing Cache Hit Rate by In-Place Rotation for Fast Volume Rendering † Yuji MISAKI ‡ Fumihiko INO ‡ Kenichi HAGIHARA † School of Engineering Science, Osaka University ‡Graduate School of Information Science and Technology, Osaka University. 1-43. 図 2 タイル T1 の in-place 移動と T2 の退避. Copyright 2015 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 77 回全国大会. 1. T2 をレジスタに退避する(図 2 の①) 2. レジスタに退避済の T1 を回転し,共有メ モリに書き込む(図 2 の②) 3. 共有メモリ上の回転済データを T2 に上書 きする(図 2 の③) 2.において書き込み先を共有メモリにする理由 は,メモリコアレッシングを実現して実行効率 を高めるためである.共有メモリに起因して 2. の前後には同期が必要となる. 表 1 実験環境 OS CPU 主記憶容量 GPU ビデオメモリ容量 CUDA バージョン データサイズ スクリーンサイズ. Windows 7 Professional 64-bit Intel Core i7-3770K 3.5GHz 16GB NVIDIA GeForce GTX 680 2GB 6.5 10243 ボクセル 10242 ピクセル. 図 3 TC ヒット率 3. 評価実験 提案手法を評価するために,TC ヒット率およ びフレームレートを計測した.具体的には,y 軸 を中心として視点を 1 度刻みで回転させた.比 較対象として,CUDA に付随しているサンプルコ ード volumeRender[3]および先行研究[1]を用意 した.表 1 に実験環境を示す. 図 3 および図 4 に,視点ごとの TC ヒット率お よびフレームレートを示す.あらかじめボリュ ームを回転する提案手法では,本来 yz 平面を参 照していた部分(図 3 の 45~135 度および 225~ 315 度)の TC ヒット率が xy 平面参照時(図 3 の 135~225 度)の TC ヒット率に置き換わり,TC ヒ ット率が向上している.また,TC ヒット率の向 上にともない,フレームレートが最大で 3.7 倍. 1-44. 図 4 フレームレート 向上した(図 4:90 度および 270 度). 図 4 から,in-place 回転時の 45 度,135 度, 225 度および 315 度において,フレームレートが 13fps まで低下している.性能低下の原因は,回 転時のオーバヘッドにある.in-place 回転時の メモリ読み書きスループットは 43GB/s であり, GPU のピークメモリバンド幅 192GB/s に対し,実 行効率が 22%に留まる.実行効率が低い原因はス レッド間の同期にある.実際に,誤りを承知し たうえで同期処理を除いた場合,実行効率は 61% に向上した. 4 まとめ 本論文では,TC ヒット率向上による VR の高速 化を目的として,視点の位置に応じてボリュー ムデータを in-place 回転する手法を提案した. 結果として,フレームレートを最大 3.7 倍まで 向上できた. 今後の課題として,in-place 回転時における メモリ読み書きスループットの向上が挙げられ る. 謝辞 本研究は科研費 24560458 の補助による. 参考文献 [1] Yuki Sugimoto, Fumihiko Ino, and Kenic hi Hagihara, ``Improving Cache Locality fo r GPU-based Volume Rendering,” Parallel Com puting, Vol.40, No.5/6, pp.59-69, May. 2014. [2] NVIDIA Corporation, ``CUDA C Programmin g Guide Version 6.5,'' http://docs.nvidia.c om/cuda/pdf/CUDA_C_Programming_Guide.pdf, A ug. 2014. [3] NVIDIA Corporation, ``CUDA Code Samples, '' http://developer.nvidia.com/cuda-code-sa mples/, Aug. 2014.. Copyright 2015 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

このうち糸球体上皮細胞は高度に分化した終末 分化細胞であり,糸球体基底膜を外側から覆い かぶさるように存在する.

c加振振動数を変化させた実験 地震動の振動数の変化が,ろ過水濁度上昇に与え る影響を明らかにするため,入力加速度 150gal,継 続時間

以上の結果について、キーワード全体の関連 を図に示したのが図8および図9である。図8

現時点で最新の USB 3.0/USB 3.1 Gen 1 仕様では、Super-Speed、Hi-Speed、および Full-Speed の 3 つの速度モードが定義されてい ます。新しい SuperSpeed

週に 1 回、1 時間程度の使用頻度の場合、2 年に一度を目安に点検をお勧め

このため、都は2021年度に「都政とICTをつなぎ、課題解決を 図る人材」として新たに ICT職

ポンプの回転方向が逆である 回転部分が片当たりしている 回転部分に異物がかみ込んでいる

向上を図ることが出来ました。看護職員養成奨学金制度の利用者は、26 年度 2 名、27 年度 2 名、28 年 度は