• 検索結果がありません。

ハードウェアコストの評価

MINDIC

6.4 ハードウェアコストの評価

6.4.1 ディレクトリ管理に必要なメモリ量の評価

ここでは,それぞれのエントリ数の場合にEvictionプロトコルでTDに必要とするメモ リ量を検討する.フルマップ方式を用いた場合とMINDICEvictionプロトコルを用い た場合に,ディレクトリ管理に必要なメモリ量はそれぞれ次のようになる.

フルマップ方式を用いた場合

フルマップ方式では,mをスイッチのステージ数,nをスイッチサイズ(スイッチのMM からPUへの経路の出力数)とすると,1ラインあたりPm (sharedmem×nk)のメモリ量が

6 MINDICの評価 6.4. ハードウェアコストの評価

way

Tag Bitmap V

LRU

Tag Bitmap V

Tag Bitmap V

Tag Bitmap V

Tag Bitmap V

Tag Bitmap V

Tag Bitmap V

Tag Bitmap V

LRU LRU LRU

Temporary Directory

entry way

図6.29:テンポラリディレクトリのハードウェア構造

必要となる.そのため,全体として必要なメモリ量DIRFULLMAPは,次式で求められる.

DIRFULLMAP= Xm

k=1

(sharedmem

linesize ×nksharedmem linesize [bit]

MINDICのEvictionプロトコルを用いた場合

MINDICEvictionプロトコルを用いた場合,TDの構造は図6.29に示したようにビッ トマップ以外に,タグやLRUの制御ビットを保持する必要がある.また,各スイッチが 同じメモリ量のTDを備えているので,1スイッチあたりに必要なメモリ量にスイッチの 数を掛けることで,全体として必要なメモリ量DIRMINDICが,次式のように求められる.

DIRMINDIC=(lru+(v+tag+td)×way)× entry

way ×switch[bit]

tag=log2sharedmemlog2linesizelog2entry way [bit]

sharedmem Memory Moduleの総メモリ量

linesize キャッシュラインサイズ

switch スイッチの総数

m スイッチのステージ数 n スイッチサイズ tag TDのタグのビット幅

td TDのビット幅

v TDの有効/無効を表すビット(1bit)

way TDの連想度

entry TDのエントリ数

6 MINDICの評価 6.4. ハードウェアコストの評価 16PU16MM,共有メモリサイズ256MByte,キャッシュラインサイズ128Byteとし,8 つのスイッチから構成されるMINDICEvictionプロトコルにおける連想度毎のディレ クトリ管理に必要な全メモリ量を算出した値を表6.7に示した.また,比較のためにフル マップ方式で必要な全メモリ量をFULL MAPとして示した.

MINDICで必要なメモリ量はスイッチ内に設けられるTDのメモリ量のみであり,5120KByte ものメモリ量が必要なフルマップ方式と比較して大幅に削減されていることがわかる.

表6.7:ディレクトリ管理に必要なメモリ量

1way 2way 4way

MINDIC (512entry) 8.5KByte 9.25KByte 10.5KByte MINDIC (1024entry) 16KByte 17.5KByte 20KByte MINDIC (2048entry) 30KByte 33KByte 38KByte

FULL MAP 5120KByte

6.4.2 スイッチのハードウェア規模の評価

MINDICのスイッチをVerilog-HDLで記述し,SYNOPSYS社の論理合成ツールDesign compilerを用いてCMOSエンベデッドアレイASIC 0.18µmライブラリを利用して論理合 成を行い,動作速度とハードウェア量の評価を行った.

共有メモリサイズ256MByte,キャッシュラインサイズ32Byte,各スイッチ内のTDのエ ントリ数2048TDの連想度24で,TDに使用するメモリを除いたスイッチの論理合成 結果は表6.8となった. MINDICは,FULL MAP方式と比較して,6.328.13倍のゲート 数を必要とするものの,CMOSエンベデッドアレイASIC 0.18µmにおいては,最大7.3M ゲートの集積が可能であり,全体の0.600.77%程度であるから,十分実装可能なハード ウェア量であるといえる.なお,TDの連想度4にすると連想度2に比べて28.62%ゲート 数が増加することがわかる.

表6.8: 論理合成結果

スイッチ構成 Gate数 最大動作周波数 MINDIC(TD:2way, 2048エントリ) 43546 250MHz MINDIC(TD:4way, 2048エントリ) 56013 250MHz

FULL MAP 6893 400MHz

また,MINDICのスイッチはFULL MAPのスイッチと比較すると複雑な構造であるた

め,最大動作周波数は低くなり,FULL MAPの方が1.6 倍高速に要求パケットを転送す ることができる.しかし,表6.5で示したFULL MAPの読み出し要求(Cache miss)のア クセスレイテンシ80clockのうち,要求パケットに関するレイテンシは12clockにすぎず,

メモリからのデータ読み出しやPUへのデータ転送に関するレイテンシの影響が大きいた め,動作周波数を考慮した,FULL MAPの読み出し要求(Cache miss)のアクセスレイテ

6 MINDICの評価 6.4. ハードウェアコストの評価

ンシは,MINDIC0.94倍にすぎない.更に,図6.26に示したキャッシュヒット率が非

常に高い状況での動作を考えれば,複雑な構造によるMINDICの動作周波数の低下は,実 行時間への影響は非常に小さいものといえる.このことより,MINDICのスイッチは,十 分高速な動作周波数を実現しているといえる.