• 検索結果がありません。

本章では,本研究の成果についてまとめ,今後の課題を明らかにする.

7 . 1   研究の成果

ベクトルプロセッサ・アーキテクチャの問題点として,高ベクトル化率の達成,スカラ 処理部の高速化,メモリバンド幅の節減,演算器に対する高データ供給能力の実現,マイ クロプロセッサ化に向くベクトルアーキテクチャの作成などの問題点がある.本研究では これらの問題点に対処するベクトルアーキテクチャの提案を行った.本研究で得られた成 果は,以下の 6点に要約できる.

(1) MSFV型ベクトルアーキテクチャの提案

従来のベクトル演算方式に比べて,より柔軟なベクトル処理およびベクトルースカ ラ協調処理を可能とする MSFV(Multithreaded Streaming / FIFO ctor)アーキテク チャの提案.

a)マルチスレッド処理(凡1:Multithreaded) :ベクトル命令レベルでマルチスレッド 処理を行う.すなわち, 1本のパイプラインは, 1個のベクトル命令の実行に占 有されるのではなく,複数個のベクトル命令に時分割共有される.これにより,

パイプライン使用率を向上させると同時に,一時に実行可能なベクトル命令の数 を増やせる.

b)ストリーミング (S: Streaming ) :スカラ命令およびベクトル命令の双方からベ クトルレジスタ内のベクトルデータにアクセスできる.これにより,スカラ命令 のループでも FIFOレジスタ内のベクトルデータに対する演算が行える.すなわ ち,小さなオーバヘッドでベクトルースカラ協調処理が可能となる.

110 

c) FIFOベクトル・レジスタ (F:F/FO) :ベクトル・レジスタとしてリング FIFO バッフアを用いることにより, 1個のベクトル命令で一時に処理可能なベクトル 長を制限しない.すなわちストリップ・マイニング処理が不要となり,ベクトル 命令再発行に伴うオーバヘッドを取り除くことができる.

d)柔軟なチエイニング機能:チエイニング機能に関して,その方向および対象命令 を柔軟なものとしている マルチスレッド処理および柔軟なチエイニンク'機訟に より,特殊なマクロ演算命令ないし専用ハードウエアを用いることなく,回帰型 演算(総和,内積,最カ最小値検索, 1次回帰等)の効率的なベクトル処理を可 能としている.

(2)柔軟なマク口演算への対処法の提案

総和,内積,最大値探索,回帰演算などを行う DOループは,本来ベクトル化に不 適なデータ依存関係にあるので,通常のベクトル演算用のハードウエアではベクト ル処理できない.そこで,従来のベクトルプロセツサではこれらをマクロ演算として 定義し,特殊な専用ハードウエアを用いてベクトル処理を行っている.これに対して MSFVアーキテクチャでは

MSFVアーキテクチャの特長である柔軟なチェイニン グ能力により,特別なハードウエアを必要とすることなく,特別なハードウエアでの ベクトル処理と同様な性能を達成する.

(3)条件付きベクトル演算への対処法の提案

I

lF文を含む DOループ

J

のベクトル化は困難である.そこで,

I I F

文を含む DO

r

J

に対処するため MSFVアーキテクチャの特徴を利用した,ベクトル分配/併 合方式,ベクトル実行停止の 2つの新しいベクトル化手法をプロトタイプMSFV型 フロセッサに導入し,その有効性を示した.

(4)部分べ クトル化可能なループへの対処法の提案

ループ全体がベクトル化可能でなければ,コンパイル手法の一つである部分ベクト ル化およびMSFVアーキテクチャの特長であるストリーミングを用いたベクトルー スカラ協調処理で対処する.

ループは部分ベクトル化によりベクトル化可能なループとベクトル化不可能なルー プに分割される.この時ベクトル化可能な部分はベ、クトル処理で,ベクトル化不可能 な部分はスカラ処理で、実行される 両者にデータ依存関係がない場合,従来のベク

j

ルプロセッサでは両者は並列処理される,しかしながらp データ依存関係がある場合 並列処理されない このような場合でも

MSFVアーキテクチヤの特長で、あるスト

111 

リーミングを用いることでストリーミングを用いたベクトルースカラ協調処理で並列 処理が可能である.

(5)メモリ・バンド幅を節約手法の提案MSFVアーキテクチャの特長である. FIFOベ クトル・レジスタ,ストリーミング,マルチスレッド処理を用いることで,メモリ・

バンド幅を節減することが可能であることを示した.評価の結果,ほとんどすべての

LFKで SVモデルに対して,半分のメモリ・バンド幅しか提供されていない MS丹 / モデルが SVモデルと同等,もしくはそれ以上の性能を示すことが判った.これは,

マイクロベクトルプロセッサなどの, IIOピン数の制約によりチップ外メモリ・バン ド幅を大幅に節約しなければならない場合,大変有効である.

(6)プロトタイプ MSFV型プロセッサの設計および評価

MSFV型プロセッサにより達成可能な性能を評価するため,MSFV型プロセッサの アーキテクチャをシミュレートするソフトウェア・シミュレータを作成し,評価を行っ た.評価結果から,MSFVアーキテクチャが有する特長である FIFOベクトルレジス タにより最低0.0%‑‑‑最 高24.2%(相乗平均 10.7%),マルチスレッド処理により最低 0.0%‑‑‑最高 333.8%(相乗平均 43.6%),ストリーミングにより最低 29.4%‑‑‑32.9%性 能が向上することがわかった.総合的には,プロトタイプ MSFV型プロセッサは従 来型のベクトル・プロセッサに比べて,最低 16.3%‑‑‑最高 334.9%(相乗平均 59.0%) 性能が良いことが判明した.

7 . 2   今後の課題

以下に今後の課題について述べる.プロトタイプMS丹/型プロセッサの設計および評 価を行った結果,以下の点でまだ,議論の余地があることが判明した.

• FIFOベクトルレジスタの有効性

FIFOベクトル・レジスタは,破壊読出しを行うためデータの再利用性に問題があ る, FIFOベクトルレジスタに格納したデータは 1回しか使用できない.このため,

同じベクトルデータを繰り返し再利用可能なベクトル処理の場合通常のレジスターレ ジスタ演算方式のベクトルプロセッサに比べ必要となるメモリバンド幅が大きくな るという問題がある.さらに, FIFOベクトルレジスタを導入することで最低0.0%‑‑‑ 最高24.2%(相乗平均 10.7%)の性能向上を得たが,この性能向上は大部分ストリップ マイニング時におけるセグメント毎のセットアップ処理(スカラ処理)のオーバヘッ ドを削除した時間であり,ベクトル処理を本質的に高速化していない.したがって,

112 

スカラ・ユニットをスーパースカラ・プロセッサなどに置き換えることで同様の高速 化を達成できる可能性があり,導入のトレードオフを再考する必要がある.

・ベクトル化コンパイラの開発

プロトタイプ MSFV型プロセツサでは, iIF文 を 含 む DOループjに対処するた め,ベクトル分配/併合方式,ベクトル実行停止の2つの新しいベクトル化手法をプ ロトタイプ MSFV型プロセツサに導入し,部分ベクトル化可能なループに対してス トリーミングを利用したベクトルースカラ協調処理を導入した.これらの機能を十分 に実用的なものにするには,プログラムから機械的に新方式を適用できるループを抽 出するためのアルゴリズム,およぴ,そのコードを生成するアルゴリズムを明確にす る必要がある.また,そのアルゴリズムを利用したベクトル化コンパイラを開発する 必要がある.

‑マイクロベクトルプロセッサへの応用

本研究では MSFVアーキテクチャを用いることで小さなメモリバンド幅で従来型 のベクトル・アーキテクチャと同等またはそれ以上の性能を引き出せることがわかっ た.MSFVアーキテクチャにおけるこの性質は,マイクロベクトルプロセツサを実 現する上で問題となる, IIOピンのピンネックから来るメモリバンド幅の制約に対す る解決策と成り得る.しかしながら,マイクロベクトルプロセツサ化に関するアーキ テクチヤの検討事項はメモリ・バンド幅だけではない.例えば配線のコストなどがあ る.0.5μm以下のVLSIにおける微細加工技術では素子の遅延より配線の遅延が支配 的になるといわれている.この傾向はフ。ロセツサの動作周波数を高めるほど顕著にな る.このような条件下では配線領域の小さくするための工夫がプロセツサアーキテク チャに要求される.このようなマイクロベクトルプロセツサ化において問題になる他 の項目に関しでも,今後,問題点の洗い出し対策を検討していく必要がある.

113 

謝辞

本研究の機会を与えて戴いた富田真治教授に心から感謝致します.論文をまとめるに当 たって御指導戴いた安浦寛人教授,雨宮真人教授,日高遠教授,岩間一雄教授に感謝致し ます.研究の初期段階で数々の助言を戴いた末吉敏則助教授ならびに福田晃助教授に成 謝致します 数々の討議の中で、熱心に討議下さった村上和彰講師に感謝致します特に.

本研究を直接御指導して戴いた村上和彰講師には,筆者の発散する考えを適切な助言

J l

よって方向づけて戴き大変感謝致します.

また,本 MSFV型ベクトルプロセツサ・プロジェクトにおいて,筆者と共にプロトタ イプ MSFV型ベクトルプロセツサの設計・開発・評価に従事して戴いた岡崎恵三氏,橋 本隆氏に感謝します.加えて,研究の過程で、数々の助言を戴いた,久我守弘講師,権五 鳳助手,森長一郎氏助手に感謝します.

最後に,日頃から討議に参加し御討論戴く研究室の皆さんに感謝致します.

I 本研究は,上記の方々の御支援なしには,成し遂げられなかったことを記し,ここに謝 意を表します.

115 

関連したドキュメント