Preempt
6.6 四方向通信による性能評価
6.6.1
通信方法
各PEの周囲四方向のPEに対する通信を行ない、その通信性能を評価する。通信元の
PE番号を(a3
;a
2 )(a
1
;a
0
)と表現し、各PEの通信先は、以下のルールに従うものとする。
dest
u
= 8
<
: ((a
3
+1)mo d4;a
2 )(0;a
0
) ;for a
1
=3
(a
3
;a
2 )(a
1 +1;a
0
) ;for others
(6:6)
dest
d
= 8
<
: ((a
3
01)mo d4;a
2 )(3;a
0
) ;fora
1
=0
(a
3
;a
2 )(a
1 01;a
0
) ;forothers
(6:7)
dest
l
= 8
<
: (a
3
;(a
2
01)mod4)(a
1
;3) ;for a
0
=0
(a
3
;a
2 )(a
1
;a
0
01) ;forothers
(6:8)
dest
l
= 8
<
: (a
3
;(a
2
+1)mod4)(a
1
;0) ;for a
0
=3
(a
3
;a
2 )(a
1
;a
0
+1) ;for others
(6:9)
ここで、destu、destd、destl、destrはそれぞれ、上方向、下方向、左方向、右方向の転 送先を表わしている。
この定義に従うと、基本モジュール内では、それぞれに隣接したPEとの通信となる。
また、基本モジュール間の通信は、図6.14のようになる。
通信は、各PEについて「送信」→「受信」→「送信」→「受信」→・・・という手順に 従って行われる。送信は、上下左右の四つすべてに対して行なわれ、各PEが隣の四つの
PEからパケットを受信し終えた後に次の送信を行う。したがって、「上方向へ送信」「下 方向へ送信」「左方向へ送信」「右方向へ送信」「四つのパケットを受信」の動作をもって
1ステップとし、1ステップの動作がすべてを終えた後に次のステップに進むことになる。
実験は、上で示したステップを複数回実行し、パケットの平均転送時間および実行終了 までの時間で評価した。なお、転送するパケットのパケット長は64フリットとした。
BM
図6.14: 四方向通信のBM間通信
6.6.2
通信時間および実行時間
四方向通信の平均通信時間および実行時間を図6.15、6.16に示す。この場合もやはり
6.5.2 および6.5.3で示したFFTの実験と同じ傾向を示している。階層型結合網用占有法
が占有法に比べて良い結果を示さない理由は、通信時間の悪化と、十分に通信時間のばら つきを抑えることができていないことが原因と思われる。
330 340 350 360 370 380
5 10 15 20 25
transfer time(cycles)
number of steps Round Robin
Preempt Hierarchical Preempt
図6.15: 四方向通信の平均通信時間
1 2 3 4 5
5 10 15 20 25
execution time(cycles)
number of steps Round Robin
Preempt Hierarchical Preempt 10 4
図 6.16: 四方向通信の実行時間
その結果占有法は、メッシュの場合よりも大きな性能の向上が得られたが、階層型結合網 用占有法は性能に変化はなかった。そのため階層型結合網用占有法の転送時間分布を測定 した所、占有法とほとんど変わらないという結果になった。
FFTや四方向通信に関しても性能評価を行った。その結果、占有法では実行時間が改 善されたが、階層型結合網用占有法ではかえって平均通信時間の悪化を招くため、FFT や四方向通信に関しても良い結果が得られないことが分かった。階層型結合網用占有法に 関しては、今後は平均通信時間のばらつきを抑えられる方法を検討する必要があると思わ れる。