• 検索結果がありません。

実装評価

ドキュメント内 untitled (ページ 47-50)

第 5 章 主軸優先木構造合成 37

5.3 実装評価

1 5 1 1 5 1

1 1 2

1 5 6 1 2 2 6

2 1 5 6

4 4 8 3 1 2 2 6

図5.4: 視線ベクトル(-1,1,1)の場合の合 成処理(Ttreediag)

1 1,5 2,6

1,5 2,6 3,7 4,8 1,5

図5.5: 視線ベクトル(0,0,1)の場合の合 成処理Ttreepara)

表5.2: 理論的通信量の比較

Tseq Tbsc Ttreediag Ttreepara 8台 1.75N2 1.75N2 0.87N2N2 64台 3.94N2 1.97N2 1.18N2 1.06N2 512台 7.98N2 2.00N2 1.38N2 1.03N2

Ttreeは視点位置によらず,何れの場合もTseqより小さいので,最終画像を得 るまでの通信時間の短縮が図ることが可能であることが分かる.また,表5.2で はTtreediagTtreeparaは,表示スケールが異なるが,表示スケールを同じに した場合は,常にTtreeparaが最も小さい値となる.Ttreediag の理論式5.4は,

合成ステップは静的に決定した場合であり,合成ステップの最適化を行うこと で,より一層の通信コストの削減が可能であると考えられる.ただし,Ttreepara

の値以下になることはない.主軸優先合成アルゴリズムを採用する効果は,サ ブノード台数が少ない場合は逐次合成,BSCと比較すると43% の通信データ 量の削減が可能であり,また,サブノード台数が増加すると,逐次合成と比較 しておよそ80% ,BSCと比較して50% の通信データ量の削減が可能となる.

5.3.1 実験環境

ノードおよびネットワークの構成は3.2.1項と同じである.スクリーンサイズ は1024×1024と設定し,使用したボリュームデータはTree(図3.4-(c))を用い た.描画測定方法は,主軸がY軸となるようにオブジェクトを回転させる.主 軸優先合成では,各Slaveは分割されたサブボリュームデータを描画し,視線 情報により静的に決定される順序に従って,2分木による画像合成を行う.合成 結果を転送する画像サイズは2枚のBounding Box(図5.6)とする.測定方法は

第3.2.2項の実験環境におけるBSCの測定方法と同じとする.

Screen

+ =

Compose

Composed Image Screen

Sub Image2 Bounding Box Screen

Sub Image1 Bounding Box

Bounding Box

図5.6: バウンディングボックス

5.3.2 主軸優先合成の効果

ネットワークX系統を用いた主軸優先合成の各処理時間の測定結果を表5.3 に示す.ただし,比較対象として,逐次合成とBSCの各処理時間の評価を併記 する.

表5.3: 主軸優先合成の各処理時間の測定結果   主軸優先 逐次 BSC

Trender[ms] 12.6 12.6 12.6

Tread[ms] 0.7 0.6 0.6 Tcomp[ms] 26.7 - 56.4 Tcomm[ms] 42.3 - 123.5 Tcollect[ms] 33.9 293.5 35.9 Tdraw[ms] 28.5 59.0 37.7

また,測定結果より求められる総描画時間を表5.4に示す.

BSCと主軸優先合成の比較

表5.4: 総描画時間の比較

主軸優先 逐次 BSC Ttotal[ms] 144.7 365.7 266.7 描画速度[fps] 6.91 2.73 3.74

合成時間,通信時間ともに53%の短縮が可能となった.理論的には,表5.2 の通信量は合成データ量と等しく,理論的な合成時間,通信時間は50%程 度の短縮が可能である.合成時間は,理論値とほぼ等しい時間の短縮率で あった.要因として,視線ベクトルを(0,0,1)に設定したことが挙げられる が,理論的な通信時間はネットワークの競合を考慮していない.しかし,実 際は,ネットワークの競合が生じる.つまり,主軸優先合成の場合,同一 スイッチ内通信は最初の4ステップで行われる.残りの2ステップは,ス イッチを跨いだ通信が行われるが,通信を行うノード数は4ノード,2ノー ドである.BSCの場合,主軸優先合成と同様,同一スイッチ内通信は最初 の4ステップで行われる.また,残りの2ステップも,スイッチを跨いだ通 信が行われるが,通信を行うノード数は全64ノードであり,各スイッチに おいて16ノードの送信要求に対する逐次処理が行われる.このため,通信 遅延が生じている.それぞれのスイッチを跨ぐ通信の送信データサイズは,

主軸優先合成の場合はスクリーンサイズの約1/4,1/2と大きいが,BSCの 場合は,スクリーンサイズの1/32,1/64と小さい.これらトータルの通信 遅延時間を考慮すると,主軸優先合成の方が遅延はほぼ同じであったと言 える.

逐次合成と主軸優先合成の比較

主軸優先合成の通信時間は逐次合成のおよそ1/4となった.理論的な通信 量の比較から,主軸優先合成の通信時間は,逐次合成のおよそ1/4である.

やはり,逐次合成の場合,全サブノードがMasterに一斉にサブボリューム レンダリング結果の送信を行うため,ネットワークの競合が各スイッチ内 において頻繁に発生している.一方,主軸優先合成では,BSCとの比較で 述べたとおり,第5,6ステップにおいてネットワークの競合が生じるが,そ の影響は逐次合成と比較すると軽微であるといえる.

以上の比較より,通信コストにおける理論的な考察は正しかったといえる.

ドキュメント内 untitled (ページ 47-50)

関連したドキュメント