実装評価

第 5 章主軸優先木構造合成 37

5.3 実装評価

1 5 1 1 5 1

1 1 2

1 5 6 1 2 2 6

2 1 5 6

4 4 8 3 1 2 2 6

図5.4: 視線ベクトル(-1,1,1)の場合の合成処理(T_tree₋_diag)

1 1,5 2,6

1,5 2,6 3,7 4,8 1,5

図5.5: 視線ベクトル(0,0,1)の場合の合成処理Ttree−para)

表5.2: 理論的通信量の比較

T_seq T_bsc T_tree₋_diag T_tree₋_para 8台 1.75N² 1.75N² 0.87N² N² 64台 3.94N² 1.97N² 1.18N² 1.06N² 512台 7.98N² 2.00N² 1.38N² 1.03N²

T_treeは視点位置によらず，何れの場合もT_seqより小さいので，最終画像を得るまでの通信時間の短縮が図ることが可能であることが分かる．また，表5.2ではT_tree₋_diag と T_tree₋_paraは，表示スケールが異なるが，表示スケールを同じにした場合は，常にT_tree₋_paraが最も小さい値となる．Ttree−diag の理論式5.4は，

合成ステップは静的に決定した場合であり，合成ステップの最適化を行うことで，より一層の通信コストの削減が可能であると考えられる．ただし，Ttree−para

の値以下になることはない．主軸優先合成アルゴリズムを採用する効果は，サブノード台数が少ない場合は逐次合成，BSCと比較すると43% の通信データ量の削減が可能であり，また，サブノード台数が増加すると，逐次合成と比較しておよそ80% ，BSCと比較して50% の通信データ量の削減が可能となる．

5.3.1 実験環境

ノードおよびネットワークの構成は3.2.1項と同じである．スクリーンサイズは1024×1024と設定し，使用したボリュームデータはTree(図3.4-(c))を用いた．描画測定方法は，主軸がY軸となるようにオブジェクトを回転させる．主軸優先合成では，各Slaveは分割されたサブボリュームデータを描画し，視線情報により静的に決定される順序に従って，2分木による画像合成を行う．合成結果を転送する画像サイズは2枚のBounding Box(図5.6)とする．測定方法は

第3.2.2項の実験環境におけるBSCの測定方法と同じとする．

Screen

+ =

Compose

Composed Image Screen

Sub Image2 Bounding Box Screen

Sub Image1 Bounding Box

Bounding Box

図5.6: バウンディングボックス

5.3.2 主軸優先合成の効果

ネットワークX系統を用いた主軸優先合成の各処理時間の測定結果を表5.3 に示す．ただし，比較対象として，逐次合成とBSCの各処理時間の評価を併記する．

表5.3: 主軸優先合成の各処理時間の測定結果主軸優先逐次 BSC

T_render[ms] 12.6 12.6 12.6

T_read[ms] 0.7 0.6 0.6 T_comp[ms] 26.7 - 56.4 T_comm[ms] 42.3 - 123.5 T_collect[ms] 33.9 293.5 35.9 T_draw[ms] 28.5 59.0 37.7

また，測定結果より求められる総描画時間を表5.4に示す．

• BSCと主軸優先合成の比較

表5.4: 総描画時間の比較

主軸優先逐次 BSC T_total[ms] 144.7 365.7 266.7 描画速度[fps] 6.91 2.73 3.74

合成時間，通信時間ともに53%の短縮が可能となった．理論的には，表5.2 の通信量は合成データ量と等しく，理論的な合成時間，通信時間は50%程度の短縮が可能である．合成時間は，理論値とほぼ等しい時間の短縮率であった．要因として，視線ベクトルを(0,0,1)に設定したことが挙げられるが，理論的な通信時間はネットワークの競合を考慮していない．しかし，実際は，ネットワークの競合が生じる．つまり，主軸優先合成の場合，同一スイッチ内通信は最初の4ステップで行われる．残りの2ステップは，スイッチを跨いだ通信が行われるが，通信を行うノード数は4ノード，2ノードである．BSCの場合，主軸優先合成と同様，同一スイッチ内通信は最初の4ステップで行われる．また，残りの2ステップも，スイッチを跨いだ通信が行われるが，通信を行うノード数は全64ノードであり，各スイッチにおいて16ノードの送信要求に対する逐次処理が行われる．このため，通信遅延が生じている．それぞれのスイッチを跨ぐ通信の送信データサイズは，

主軸優先合成の場合はスクリーンサイズの約1/4,1/2と大きいが，BSCの場合は，スクリーンサイズの1/32,1/64と小さい．これらトータルの通信遅延時間を考慮すると，主軸優先合成の方が遅延はほぼ同じであったと言える．

• 逐次合成と主軸優先合成の比較

主軸優先合成の通信時間は逐次合成のおよそ1/4となった．理論的な通信量の比較から，主軸優先合成の通信時間は，逐次合成のおよそ1/4である．

やはり，逐次合成の場合，全サブノードがMasterに一斉にサブボリュームレンダリング結果の送信を行うため，ネットワークの競合が各スイッチ内において頻繁に発生している．一方，主軸優先合成では，BSCとの比較で述べたとおり，第5,6ステップにおいてネットワークの競合が生じるが，その影響は逐次合成と比較すると軽微であるといえる．

以上の比較より，通信コストにおける理論的な考察は正しかったといえる．

ドキュメント内 untitled (ページ 47-50)

第 5 章 主軸優先木構造合成 37

5.3 実装評価

+ =

第 5 章主軸優先木構造合成 37