章結論

本章では，本研究の成果についてまとめ，今後の課題を明らかにする.

7 . 1 研究の成果

ベクトルプロセッサ・アーキテクチャの問題点として，高ベクトル化率の達成，スカラ処理部の高速化，メモリバンド幅の節減，演算器に対する高データ供給能力の実現，マイクロプロセッサ化に向くベクトルアーキテクチャの作成などの問題点がある.本研究ではこれらの問題点に対処するベクトルアーキテクチャの提案を行った.本研究で得られた成果は，以下の 6点に要約できる.

(1) MSFV型ベクトルアーキテクチャの提案

従来のベクトル演算方式に比べて，より柔軟なベクトル処理およびベクトルースカラ協調処理を可能とする MSFV(Multithreaded Streaming / FIFO ぬctor)アーキテクチャの提案.

a)マルチスレッド処理(凡1:Multithreaded) :ベクトル命令レベルでマルチスレッド処理を行う.すなわち， 1本のパイプラインは， 1個のベクトル命令の実行に占有されるのではなく，複数個のベクトル命令に時分割共有される.これにより，

パイプライン使用率を向上させると同時に，一時に実行可能なベクトル命令の数を増やせる.

b)ストリーミング (S: Streaming ) :スカラ命令およびベクトル命令の双方からベクトルレジスタ内のベクトルデータにアクセスできる.これにより，スカラ命令のループでも FIFOレジスタ内のベクトルデータに対する演算が行える.すなわち，小さなオーバヘッドでベクトルースカラ協調処理が可能となる.

110

c) FIFOベクトル・レジスタ (F:F/FO) :ベクトル・レジスタとしてリング FIFO バッフアを用いることにより， 1個のベクトル命令で一時に処理可能なベクトル長を制限しない.すなわちストリップ・マイニング処理が不要となり，ベクトル命令再発行に伴うオーバヘッドを取り除くことができる.

d)柔軟なチエイニング機能:チエイニング機能に関して，その方向および対象命令を柔軟なものとしているマルチスレッド処理および柔軟なチエイニンク'機訟により，特殊なマクロ演算命令ないし専用ハードウエアを用いることなく，回帰型演算(総和，内積，最カ最小値検索， 1次回帰等)の効率的なベクトル処理を可能としている.

(2)柔軟なマク口演算への対処法の提案

総和，内積，最大値探索，回帰演算などを行う DOループは，本来ベクトル化に不適なデータ依存関係にあるので，通常のベクトル演算用のハードウエアではベクトル処理できない.そこで，従来のベクトルプロセツサではこれらをマクロ演算として定義し，特殊な専用ハードウエアを用いてベクトル処理を行っている.これに対して MSFVアーキテクチャでは

，

MSFVアーキテクチャの特長である柔軟なチェイニング能力により，特別なハードウエアを必要とすることなく，特別なハードウエアでのベクトル処理と同様な性能を達成する.

(3)条件付きベクトル演算への対処法の提案

I

^{lF文を含む} DOループ

J

のベクトル化は困難である.そこで，

I I F

^文を含む DO

r

^プ

^J

^{に対処するため} ^MSFVアーキテクチャの特徴を利用した，ベクトル分配/併合方式，ベクトル実行停止の 2つの新しいベクトル化手法をプロトタイプMSFV型フロセッサに導入し，その有効性を示した.

(4)部分べクトル化可能なループへの対処法の提案

ループ全体がベクトル化可能でなければ，コンパイル手法の一つである部分ベクトル化および，MSFVアーキテクチャの特長であるストリーミングを用いたベクトルースカラ協調処理で対処する.

ループは部分ベクトル化によりベクトル化可能なループとベクトル化不可能なループに分割される.この時ベクトル化可能な部分はベ、クトル処理で，ベクトル化不可能な部分はスカラ処理で、実行される両者にデータ依存関係がない場合，従来のベク

j

ルプロセッサでは両者は並列処理される，しかしながらp データ依存関係がある場合並列処理されないこのような場合でも

，

MSFVアーキテクチヤの特長で、あるスト

111

リーミングを用いることでストリーミングを用いたベクトルースカラ協調処理で並列処理が可能である.

(5)メモリ・バンド幅を節約手法の提案MSFVアーキテクチャの特長である. FIFOベクトル・レジスタ，ストリーミング，マルチスレッド処理を用いることで，メモリ・

バンド幅を節減することが可能であることを示した.評価の結果，ほとんどすべての

LFKで SVモデルに対して，半分のメモリ・バンド幅しか提供されていない MS丹 / モデルが SVモデルと同等，もしくはそれ以上の性能を示すことが判った.これは，

マイクロベクトルプロセッサなどの， IIOピン数の制約によりチップ外メモリ・バンド幅を大幅に節約しなければならない場合，大変有効である.

(6)プロトタイプ MSFV型プロセッサの設計および評価

MSFV型プロセッサにより達成可能な性能を評価するため，MSFV型プロセッサのアーキテクチャをシミュレートするソフトウェア・シミュレータを作成し，評価を行った.評価結果から，MSFVアーキテクチャが有する特長である FIFOベクトルレジスタにより最低0.0%‑‑‑最高24.2%(相乗平均 10.7%)，マルチスレッド処理により最低 0.0%‑‑‑最高 333.8%(相乗平均 43.6%)，ストリーミングにより最低 29.4%‑‑‑32.9%性能が向上することがわかった.総合的には，プロトタイプ MSFV型プロセッサは従来型のベクトル・プロセッサに比べて，最低 16.3%‑‑‑最高 334.9%(相乗平均 59.0%) 性能が良いことが判明した.

7 . 2 今後の課題

以下に今後の課題について述べる.プロトタイプMS丹/型プロセッサの設計および評価を行った結果，以下の点でまだ，議論の余地があることが判明した.

• FIFOベクトルレジスタの有効性

FIFOベクトル・レジスタは，破壊読出しを行うためデータの再利用性に問題がある， FIFOベクトルレジスタに格納したデータは 1回しか使用できない.このため，

同じベクトルデータを繰り返し再利用可能なベクトル処理の場合通常のレジスターレジスタ演算方式のベクトルプロセッサに比べ必要となるメモリバンド幅が大きくなるという問題がある.さらに， FIFOベクトルレジスタを導入することで最低0.0%‑‑‑ 最高24.2%(相乗平均 10.7%)の性能向上を得たが，この性能向上は大部分ストリップマイニング時におけるセグメント毎のセットアップ処理(スカラ処理)のオーバヘッドを削除した時間であり，ベクトル処理を本質的に高速化していない.したがって，

112

スカラ・ユニットをスーパースカラ・プロセッサなどに置き換えることで同様の高速化を達成できる可能性があり，導入のトレードオフを再考する必要がある.

・ベクトル化コンパイラの開発

プロトタイプ MSFV型プロセツサでは， iIF文を含む DOループjに対処するため，ベクトル分配/併合方式，ベクトル実行停止の2つの新しいベクトル化手法をプロトタイプ MSFV型プロセツサに導入し，部分ベクトル化可能なループに対してストリーミングを利用したベクトルースカラ協調処理を導入した.これらの機能を十分に実用的なものにするには，プログラムから機械的に新方式を適用できるループを抽出するためのアルゴリズム，およぴ，そのコードを生成するアルゴリズムを明確にする必要がある.また，そのアルゴリズムを利用したベクトル化コンパイラを開発する必要がある.

‑マイクロベクトルプロセッサへの応用

本研究では MSFVアーキテクチャを用いることで小さなメモリバンド幅で従来型のベクトル・アーキテクチャと同等またはそれ以上の性能を引き出せることがわかった.MSFVアーキテクチャにおけるこの性質は，マイクロベクトルプロセツサを実現する上で問題となる， IIOピンのピンネックから来るメモリバンド幅の制約に対する解決策と成り得る.しかしながら，マイクロベクトルプロセツサ化に関するアーキテクチヤの検討事項はメモリ・バンド幅だけではない.例えば配線のコストなどがある.0.5μm以下のVLSIにおける微細加工技術では素子の遅延より配線の遅延が支配的になるといわれている.この傾向はフ。ロセツサの動作周波数を高めるほど顕著になる.このような条件下では配線領域の小さくするための工夫がプロセツサアーキテクチャに要求される.このようなマイクロベクトルプロセツサ化において問題になる他の項目に関しでも，今後，問題点の洗い出し対策を検討していく必要がある.

113

謝辞

本研究の機会を与えて戴いた富田真治教授に心から感謝致します.論文をまとめるに当たって御指導戴いた安浦寛人教授，雨宮真人教授，日高遠教授，岩間一雄教授に感謝致します.研究の初期段階で数々の助言を戴いた末吉敏則助教授ならびに福田晃助教授に成謝致します数々の討議の中で、熱心に討議下さった村上和彰講師に感謝致します特に.

本研究を直接御指導して戴いた村上和彰講師には，筆者の発散する考えを適切な助言

J l

よって方向づけて戴き大変感謝致します.

また，本 MSFV型ベクトルプロセツサ・プロジェクトにおいて，筆者と共にプロトタイプ MSFV型ベクトルプロセツサの設計・開発・評価に従事して戴いた岡崎恵三氏，橋本隆氏に感謝します.加えて，研究の過程で、数々の助言を戴いた，久我守弘講師，権五鳳助手，森長一郎氏助手に感謝します.

最後に，日頃から討議に参加し御討論戴く研究室の皆さんに感謝致します.

I 本研究は，上記の方々の御支援なしには，成し遂げられなかったことを記し，ここに謝意を表します.

115

ドキュメント内ベクトルプロセッサの構成方式に関する研究 (ページ 34-41)

章 結論

7 . 1 研究の成果

，

I

J

I I F

r

J

j

，

7 . 2 今後の課題

謝辞

J l

^J