• 検索結果がありません。

データ駆動型プロセッサの FPGA 実装におけるフロアプラン最適化の検討

N/A
N/A
Protected

Academic year: 2021

シェア "データ駆動型プロセッサの FPGA 実装におけるフロアプラン最適化の検討"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

令和元年度 学士学位論文梗概 高知工科大学 情報学群

データ駆動型プロセッサの FPGA 実装におけるフロアプラン最適化の検討

1200290

井上 聡 【 コンピュータ構成学研究室 】

1

はじめに

近年,IoTエッジ機器の高機能化・高性能化が益々 望まれつつある.この実現にあたり,複数ストリーム データの多重処理性能が高いデータ駆動型プロセッサ

DDP(Data Driven Processor)[1]

を,回路構成を改変可 能な

FPGA(Field Programmable Gate Array)

上に実 装することが有望である.

一方,現行の

FPGA

回路設計ツールは同期回路専用 であり,

DDP

をセルフタイム型パイプライン

STP(Self- Timed Pipeline)

により実装する際,回路の最適化を充 分に行えない.そのため,先行研究

[2]

では,回路ブロッ ク単位での配置・配線を手動で最適化する手法が提案さ れている.

本研究は,先行研究の最適化手法の中で,各

region

を巧妙に配置

(フロアプラン)

して

DDP

全体の面積を 削減できる自動化アルゴリズムを提案し,その効果を評 価した.

2 DDP

の最適化に関する現状と提案

DDP

STP

実装では,隣接ステージ間でハンドシェ イク通信を行うことでパケットの転送制御を行う.各ス

テージ

(region)

での転送時間は,それを構成する回路

の遅延で決まるため,フロアプラン結果に基づく配線 遅延の影響を受ける.先行研究の手法では,DDPの各

region

に必要な回路規模から必要な論理アレイブロック

LAB

数を算出し,隣接ステージが隣接するように手動 で配置されていた.

本研究では,

DDP

region

単位のフロアプランを自 動化することにより,設計者の熟練度に依存せずに,安 定したフロアプランを自動生成することを目指す.

3

フロアプランの最適化手法

提案するフロアプランは,以下の手順で実施する.

1. FPGA

上の配置可能領域に関して,基準座標

(x,y),

領域の幅,メモリ

Block

等専用回路ブロック列の

x

座標を与える.また,設計対象

DDP

の情報と して,各

region

に必要な

LAB

数,メモリ

Block

, DSP Block

数を入力する.

2.

LAB

を計算し,各

region

Width

Hei- ght

を仮決定する.

3.

ステージの隣接関係に従って配置順を決定し,そ の順に各

region

の配置座標

(x,y)

を仮決定する.

4.

region

において,(Width*Height

>LAB

数) 満たす範囲で整数

Width

Height

を微調整.

DD

>h DDZD

DZ'

W<dͺ/E

^d

W^

KWz DDD

ZE, W<dͺKhd

DDD͗DĂƚĐŚŝŶŐDĞŵŽƌLJŽŶƚĞŶƚĚĚƌĞƐƐĂďůĞDĞŵŽƌLJ^d ͗ŽŶƐƚĂŶƚDĞŵŽƌLJ DDZD͗DĂƚĐŚŝŶŐDĞŵŽƌLJ ZĂŵĚŽŵĐĐĞƐƐDĞŵŽƌLJ

>h͗ƌŝƚŚŵĞƚŝĐ>ŽŐŝĐhŶŝƚDD͗ĂƚĂDĞŵŽƌLJW^͗WƌŽŐƌĂŵ^ƚŽƌĂŐĞ

1 DDP

の配置・配線結果

1

提案フロアプランに基づく

DDP

実装結果 提案手法

Quartus

配置領域

(W*H) 23*16 23*19

LAB

使用率

[%] 73.6 61.8

スループット

[packet/sec] * 92.6M 94.6M

Slow

条件

(V

DD

1.2V, 85

C)

での評価

5.

再度各ステージの隣接関係を維持したまま,全面 積が削減されるよう各

region

(x,y)

を調整する.

以上のアルゴリズムを実装した

python

スクリプトで 自動生成したフロアプランを図

1

に示す.

4

評価

提案フロアプランと回路設計ツール

Intel

Quautus

Prime 18.0

の自動配置機能によるフロアプランでそれ

ぞれ

DDP

Intel

MAX10-50

上に実装し,比較評価 した.評価結果を表

1

に示す.この結果から,提案手 法に基づく回路実装は,Quartusよりも面積が約

16%

削減できることが判った.一方,スループットは約

2%

劣化してしまった.今回は,特定の

DDP

構成ならびに

MAX10-50

に依存したアルゴリズムが一部含まれてい

るため,今後,一般化する必要がある.

参考文献

[1] H. Terada, et al., “DDMP’s: Self-Timed Super- Pipelined Data-Driven Multimedia Processors,”

Proc. IEEE, vol. 87, no. 2, pp.282–296, Feb. 1999.

[2] K. Nagano and M. Iwata, “Area-Efficient FPGA

Implementation of Self-Timed Data-Driven Pro-

cessor,” ISFT2019, Aug. 2019.

参照

関連したドキュメント

ま と め 本論文では個々のワークロードに対して最適化され

を変動させるとき,それに伴って変動するが,最適化過    このようにして,最適伝達開数が定まると,薄膜容鼠

修士進捗報告 オーバーレイ・ネットワークにおける 適応型アルゴリズムを用いたデータ 配置最適化手法 M2 ( 3 期目) kuro 親:斉藤さん サブ親:重近さん... オーバーレイ・ネットワークにおける 適応型アルゴリズムを用いたデータ

議 論 ここでは,本研究で提案した DBM 実装の位置づけ について考察する. 本研究では,

2012 年度 修士論文要旨 関数毎指定及びパラメータ型オプションによる コンパイラの最適化オプションセット探索の拡張 関西学院大学大学院理工学研究科

値である.また制約条件は (4) となり,設計変数は膜厚 d j である. 1.0 &lt; d j &lt; 4000.0 (j = 1, ..., n) (4) 4

3. アラインメント最適化