修士論文概要書

(1)

修士論文概要書

提出

2012 年 2 月学籍番号

5110B093–2

CD

専門分野情報理工学専攻研究指導情報システム設計

氏名

出口健介

指導

教員

戸川望

^印

研究題目

Fat treeを用いたバスマトリクス方式の

ネットワークプロセッサに関する研究

1 _序論

近年，ネットワーク上を流れるトラフィック量は増加の一途を辿っており，ネットワーク機器のパケット処理の更なる高速化が要求されている．ネットワークプロセッサはパケット処理に特化した処理ユニットを複数搭載し，高速にパケット処理が可能となる．

[1]のネットワークプロセッサ(NP)の各処理ユニットは共有バス方式で接続されているため，バス競合が頻繁に発生している．フルバスマトリクス方式のNP は共有バス方式のNPよりバス競合を低減することができるが，各処理ユニットごとにデコーダを搭載し面積が大きくなってしまう．本論文では、Fat treeを用いたバスマトリクス方式のNPを提案する．提案手法のNPを用いることで，フルバスマトリクス方式のNP よりも面積を削減させ，共有バス方式のNPよりもバス競合を低減させることを論理合成及びソフトウェアシミュレーションを用いて評価する．

2 ネットワークプロセッサ

本章では，ネットワークプロセッサの特徴，用途，

IPv4パケットにおけるパケット処理，本研究でセキュリティアプリケーションとして対象とするIPsec-VPN を説明し，既存製品例としてIXP2400を紹介する．

3 バスアービタ

バスアービタは次にどの処理ユニットがバスを使用するかを決定するユニットである．代表的なバスアービタとして共有バス方式とバスマトリクス方式がある．

3.1

共有バス方式

共有バス方式はある処理ユニットがバスを使用している場合，他の処理ユニットはバスが解放されるまでバスを使用することができない．本論文ではバス競合を「処理ユニットがメモリにアクセスすることができず，処理ユニットが待ち状態となること」と定義する．

3.2

バスマトリクス方式

バスマトリクス方式は複数の処理ユニットが同時にバスアクセスを要求した場合に，バス競合を低減することが期待でき，フルバスマトリクス方式とパーシャルバスマトリクス方式がある[3]．フルバスマトリクス方式は各処理ユニットとメモリがそれぞれバスで接続されている．バス競合を低減できるが，各処理ユニットごとに1つのデコーダが接続，バス線も増えて面積が大きくなってしまう．パーシャルバスマトリクス方式はデコーダまたはアービタの面積を減らし，一部を共有バス方式で接続した方式である．フルバスマトリクス方式よりも面積を削減することができる．

入力処理 MPP i = 3[個]

出力処理 MPP e = 3[個]

Dynamic 処理MPP d = 8[個]

制御プロセッサ

AES専用 HW a = 5[個]

' ( )

* 送受信 . / )

* SHA専用

HW s = 5[個]

SPM-1

SPM-2

SPM-3 PM-1

Fattree

4 用 5 6 7 8 9

* :

; 8 方式

>

7 8

?

@ A B PM-2

図1: Fat treeを用いたバスマトリクス方式のネットワークプロセッサアーキテクチャ．

4 Fat tree を用いたネットワークプロセッサの設計

本章では，本研究室で構築されているセキュリティを考慮した動的再構成可能なNPを紹介し，Fat treeを用いたバスマトリクス方式のバスアービタを提案する．

4.1

ネットワークプロセッサアーキテクチャ

提案するNP(図1)として，パケット処理を実行する 3個の入力処理MPP(Micro Packet Processor)，3個の出力処理MPP，5個のAES専用HW，5個のSHA 専用HW，8個のDynamic処理MPPを持つものを想定する．このうち，Dynamic処理MPPはネットワークの負荷状況に応じて，入力処理，出力処理，セキュリティ処理が実行可能である．

共有バス方式のNPとフルバスマトリクス方式のNP のバスアービタはBUFユニットとSPユニットの2つ搭載している．BUFユニットはパケットメモリ(PM)， SPユニットはスクラッチパッドメモリ(SPM)のバス調停を行う．共有バス方式のNPはPM，SPMが1個ずつある．あるクロックサイクルの間に1つの処理ユニットがPM，1つの処理ユニットがSPMへアクセス可能である．バスマトリクス方式のNPは，PMが2 個，SPMが3個ある．あるクロックサイクルの間に2 つの処理ユニットが，3つの処理ユニットがSPMへアクセス可能である．

4.2 Fat tree

を用いたバスアービタ

フルバスマトリクス方式を用いたNPは共有バス方式のNPよりもバス競合を低減することができるが，面積が大幅に大きくなってしまう．そこで，パーシャルバスマトリクス方式を用いることでフルバスマトリクス方式のバスアービタよりも面積削減を目指す．さらに，Fat tree構造を用いることでフルバスマトリクス方式と同程度のバス競合を維持させる．

(2)

I Ar

I A A A A A S S S S S E E E D D D D D

I D D D

S D

S P

S S S S S

D D

Ar

Ar Ar Ar

S S P

図2: 提案するFat treeを用いたバスマトリクス方式のバスアービタ．

表1: 各バスアービタの論理合成結果．

バスアービタ面積[µm²] 遅延[ns]

共有バス方式 7754.54 0.81 フルバスマトリクス方式 24291.69 0.85

提案手法 10180.22 0.86

Fat treeは相互接続通信方式として用いられており，

競合しやすい接続箇所を多重化することで処理ユニットのアクセス競合を削減させることが期待できる[2]．処理ユニットはレベル0に接続され，Fat tree内にあるスイッチを辿ることで目的ユニットにアクセスすることができる．

提案するFat treeを用いたバスマトリクス方式のバスアービタアーキテクチャを図2に示す．4つの処理ユニットごとにスイッチと3つのデコーダ，各メモリのバス調停を行う5つのアービタを搭載する．各スイッチからデコーダへのバスはFat tree構造を用いて2重化されており，あるクロックサイクルの間に最大2つの処理ユニットがスイッチを介してデコーダにアクセスすることができる．

提案手法のバスアービタはフルバスマトリクス方式のバスアービタよりも6個のスイッチが増えるが，デコーダを21個，バスを93本削減することができる．

5 実験と評価

本章では，Fat treeを用いたバスマトリクス方式のバスアービタがフルバスマトリクス方式のバスアービタより面積削減し、Fat treeを用いたバスマトリクス方式のNPが共有バス方式のNPよりバス競合が低減することを論理合成およびソフトウェアシミュレーションを行い確認する．

5.1

論理合成

Verilog-HDLに各バスアービタを実装し，面積比較する．セルライブラリにはSTARC(CMOS 90nm)の設計ルールを用いた．

論理合成結果を表1に示す．共有バス方式のバスアービタとフルバスマトリクス方式のバスアービタはBUF ユニットとSPユニットを搭載しているため，2つの面積を合計したものを示している．提案手法のバスアービタは，フルバスマトリクス方式のバスアービタより

も面積を58.1%削減することが確認できた．

5.2

タイムドリブン型シミュレーション

各バスアービタを用いてNPのバス競合を測定するために，C言語でタイムドリブン型シミュレーションプログラムを構築した．

8143

1729 1763

1486

755 756

0 2000 4000 6000 8000 10000 12000

共有バス方式フルバスマトリクス方式提案手法

クロックサイクル数クロックサイクル数クロックサイクル数クロックサイクル数

PMにアクセスできず処理ユニットがメモリ待ちとなった回数の合計値 SPMにアクセスできず処理ユニットがメモリ待ちとなった回数の合計値

図3: 各NPのバス競合の測定値．

図3に各処理ユニットがメモリにアクセスすることができず待ち状態となったバス競合の測定値を示す．提案手法のNPはフルバスマトリクス方式のNPよりバス競合が1.41%増加したが，共有バス方式のNPよりもバス競合を74.2%削減することが確認できた．PM のみに着目すると，提案手法のNPは共有バス方式の NPよりもバス競合を73.8%削減，SPMのみに着目すると，提案手法のNPは共有バス方式のNPよりもバス競合を49.1%削減できた．

6 結論

本稿では，Fat treeを用いたバスマトリクス方式の NPを提案した．Fat treeを用いたバスマトリクス方式のバスアービタはフルバスマトリクス方式のバスアービタよりも面積を58.1%削減できた．Fat treeを用いたバスマトリクス方式のNPは共有バス方式のNPよりもバス競合を74.2%削減することが確認できた．

今後の課題はセキュリティの強化である．認証アルゴリズムとしてHMAC-SHA1-96を用いることにより，

より強固なセキュリティ通信を実現するNPを構築することが望ましいと考えられる．

参考文献

[1] 阿部拓野, “セキュリティ処理向け動的適応可能なネットワークプロセッサの設計とそのアーキテクチャ最適化手法,” 2008年度早稲田大学戸川研究室修士論文, Feb, 2009.

[2] Z. Ding, R. R. Hoare, A. K. Jones, and R. Mel- hem “Level wise scheduling algorithm for fat tree interconnection networks” in ACM/IEEE con- ference on Supercomputing SC’06 Proceedings of the 2006, pp.96–104, 2006.

[3] S. Pasricha, Y. Park, F. J. Kurdahi, and N. Dutt

“A framework for power performance tradeoﬀs in bus-matrix-based on-chip communication archi- tecture synthesis” inIEEE Transactions on Very Large Scale Integration (VLSI) Systems, pp.209–

221, Feb, 2010.

本論文に関する発表業績

国内学会（査読なし）

1. 出口健介，柳澤政生，戸川望，“共有バス方式とバスマトリクス方式を用いたネットワークプロセッサのバス競合の性能比較評価,”電子情報通信学会大会講演論文集(G0508A), p.87, Sep.2011.

修 士 論 文 概 要 書