第 4 章 計算機実験結果 43
4.5 提案手法の評価
提案手法はバッファ資源制約B = 1920とし,バッファ長最適化のみを行った場 合と仮想チャネル数を含む最適化を行った場合の2パターンで実験を行った.な お,ここではブロック回数の検出には重要度による分類は行わず,ブロックの発 生回数を数えているだけである.提案手法によって得られた構成と各チャネルを 均一なバッファ構成とした場合の平均パケット遅延時間の比較を表4.1に示す.表 中の均一なバッファ構成の平均パケット遅延時間は図4.1,4.2,4.3の実験で得ら れた結果であり,同量のバッファ資源を用いたバッファ構成の中で最も小さい平 均パケット遅延時間を用いている.
パケット発生率 0.0008[packets/cycle/node]のUniform Traffic を入力とした場 合(Uniform(0.008))について述べる.バッファ資源1920 を用いて全チャネルを 均一なバッファ構成とした場合の平均パケット遅延時間が179.7[cycles]であるの に対して,同量のバッファ資源を用いて提案手法によるバッファ長最適化を行っ た場合が188.2[cycles],仮想チャネル数の最適化も行った場合が185.3[cycles]とな り,均一な構成より劣るという結果となった.これはUniform Trafficでは均一な 構成がバッファ構成の最適解となるためである.提案手法ではブロック回数の検 出が生成する入力パターンに依存するため,誤差が生じたと考えられる.
Hotspot Trafficを入力とした場合について述べる.パケット発生率
0.0063[pack-ets/cycle/node]で10%のホットスポットを設けた場合(Hotspot–1(0.0063)), 0.00475[pack-ets/cycle/node]で20%のホットスポットを設けた場合(Hotspot–2(0.00475))共に,
同量のバッファ資源を用いた均一な構成より平均パケット遅延時間が小さい.ま た,提案手法の特徴である仮想チャネル数の最適化をバッファ長最適化と併せて行 うことによって,よりパフォーマンスは向上することが分かる.さらにHotspot–2 の場合においては,提案手法で用いたバッファ資源の倍に相当するバッファを用い た均一な構成(B=3840)よりも平均パケット遅延時間が小さくなる.これはネッ トワーク上のトラフィックの局所性が高まることにより,提案手法によるバッファ 構成最適化の効果がより高まったためと考えられる.この場合,提案手法を用い ることで半分のバッファ資源で均一な構成と同等のパフォーマンスが得られるこ とになり,提案手法は有効であると言える.なお,バッファ構成最適化手法の実
行時間はいずれの場合も4時間から5時間の間となった.
表 4.1: 平均パケット遅延時間の比較.
入力パターン 均一な構成 均一な構成 バッファ長最適化 バッファ長・仮想チャネル数
(B=1920) (B=3840) (B=1920) 最適化(B=1920)
Uniform(0.008) 179.7 123.0 188.2 185.3
Hotspot–1(0.0063) 202.0 120.9 148.1 130.4
Hotspot–2(0.00475) 172.2 113.6 126.1 110.3
次に,仮想チャネルの追加で回避できるブロックを,有効性によって分類して 検出した場合について述べる.この分類は3.3.2項で述べたように以下の2パター ンで行う.
1. 他のバッファにフリットが入っている場合(図3.2(a))
2. 他のバッファにフリットが入っていない場合(図3.2(b))
実験は表4.1で示したHotspot–2(0.00475)の入力パターンを用い,バッファ資源
制約B = 1920として,以下の2種類のブロック発生回数検出方法に従って行う.
• 2.のブロック発生回数B2numのみを検出する場合:
ブロック発生回数=B2num
• 1.のブロック発生回数B1numに,重みとして2を与えた2.のブロック発生 回数B2numを加える場合:
ブロック発生回数=B1num+B2num×2
これらの実験結果とブロックの分類を行わない場合(ブロック発生回数=B1num+ B2num)の比較を表4.2に示す.ブロックの分類を行わない方が平均パケット遅延 時間は小さくなるという結果となった.これはブロックを分類することで,特定 のチャネルにバッファの割り当てが集中してしまったためと考えられる.そして これは,シミュレーションによるブロックの発生回数の検出が,生成される入力 パターンに強く依存することが原因である.一度ブロック状態に陥った場合,ネッ トワークが混雑している状況ではその状態はしばらくの間継続する傾向にある.
現状のシミュレータではそのブロック状態を1サイクルごとに検出しており,ブ
ロックの分類をすることによって一部のチャネルのブロック発生回数が極端に大 きくなってしまったのである.これはブロックを検出するタイミングの問題であ り,今後の課題である.
表 4.2: ブロックの分類による比較.
入力パターン B1num+B2num B2num B1num+B2num×2
Hotspot–2(0.00475) 110.3 133.8 118.4