ボリュームレンダリングを高速化するためのin-place回転によるキャッシュヒット率の向上
2
0
0
全文
(2) 情報処理学会第 77 回全国大会. 1. T2 をレジスタに退避する(図 2 の①) 2. レジスタに退避済の T1 を回転し,共有メ モリに書き込む(図 2 の②) 3. 共有メモリ上の回転済データを T2 に上書 きする(図 2 の③) 2.において書き込み先を共有メモリにする理由 は,メモリコアレッシングを実現して実行効率 を高めるためである.共有メモリに起因して 2. の前後には同期が必要となる. 表 1 実験環境 OS CPU 主記憶容量 GPU ビデオメモリ容量 CUDA バージョン データサイズ スクリーンサイズ. Windows 7 Professional 64-bit Intel Core i7-3770K 3.5GHz 16GB NVIDIA GeForce GTX 680 2GB 6.5 10243 ボクセル 10242 ピクセル. 図 3 TC ヒット率 3. 評価実験 提案手法を評価するために,TC ヒット率およ びフレームレートを計測した.具体的には,y 軸 を中心として視点を 1 度刻みで回転させた.比 較対象として,CUDA に付随しているサンプルコ ード volumeRender[3]および先行研究[1]を用意 した.表 1 に実験環境を示す. 図 3 および図 4 に,視点ごとの TC ヒット率お よびフレームレートを示す.あらかじめボリュ ームを回転する提案手法では,本来 yz 平面を参 照していた部分(図 3 の 45~135 度および 225~ 315 度)の TC ヒット率が xy 平面参照時(図 3 の 135~225 度)の TC ヒット率に置き換わり,TC ヒ ット率が向上している.また,TC ヒット率の向 上にともない,フレームレートが最大で 3.7 倍. 1-44. 図 4 フレームレート 向上した(図 4:90 度および 270 度). 図 4 から,in-place 回転時の 45 度,135 度, 225 度および 315 度において,フレームレートが 13fps まで低下している.性能低下の原因は,回 転時のオーバヘッドにある.in-place 回転時の メモリ読み書きスループットは 43GB/s であり, GPU のピークメモリバンド幅 192GB/s に対し,実 行効率が 22%に留まる.実行効率が低い原因はス レッド間の同期にある.実際に,誤りを承知し たうえで同期処理を除いた場合,実行効率は 61% に向上した. 4 まとめ 本論文では,TC ヒット率向上による VR の高速 化を目的として,視点の位置に応じてボリュー ムデータを in-place 回転する手法を提案した. 結果として,フレームレートを最大 3.7 倍まで 向上できた. 今後の課題として,in-place 回転時における メモリ読み書きスループットの向上が挙げられ る. 謝辞 本研究は科研費 24560458 の補助による. 参考文献 [1] Yuki Sugimoto, Fumihiko Ino, and Kenic hi Hagihara, ``Improving Cache Locality fo r GPU-based Volume Rendering,” Parallel Com puting, Vol.40, No.5/6, pp.59-69, May. 2014. [2] NVIDIA Corporation, ``CUDA C Programmin g Guide Version 6.5,'' http://docs.nvidia.c om/cuda/pdf/CUDA_C_Programming_Guide.pdf, A ug. 2014. [3] NVIDIA Corporation, ``CUDA Code Samples, '' http://developer.nvidia.com/cuda-code-sa mples/, Aug. 2014.. Copyright 2015 Information Processing Society of Japan. All Rights Reserved..
(3)
関連したドキュメント
このうち糸球体上皮細胞は高度に分化した終末 分化細胞であり,糸球体基底膜を外側から覆い かぶさるように存在する.
c加振振動数を変化させた実験 地震動の振動数の変化が,ろ過水濁度上昇に与え る影響を明らかにするため,入力加速度 150gal,継 続時間
以上の結果について、キーワード全体の関連 を図に示したのが図8および図9である。図8
現時点で最新の USB 3.0/USB 3.1 Gen 1 仕様では、Super-Speed、Hi-Speed、および Full-Speed の 3 つの速度モードが定義されてい ます。新しい SuperSpeed
週に 1 回、1 時間程度の使用頻度の場合、2 年に一度を目安に点検をお勧め
このため、都は2021年度に「都政とICTをつなぎ、課題解決を 図る人材」として新たに ICT職
ポンプの回転方向が逆である 回転部分が片当たりしている 回転部分に異物がかみ込んでいる
向上を図ることが出来ました。看護職員養成奨学金制度の利用者は、26 年度 2 名、27 年度 2 名、28 年 度は