• 検索結果がありません。

ESPRIT/ SIM と関連研究との差異

第 5 章 性能評価シミュレータとバイナリ変換技術

5.6. ESPRIT/ SIM と関連研究との差異

ESPRIT/sim とそれに搭載したバイナリ変換アクセラレータは,5.5で挙げた従来研究を

参考にするあるいは技術交流することなく発展してきた.そのため,手法の比較は単純に 行えないが,個々の原理や目的には数多くの共通性がある.本節では,ESPRIT/sim の新 規性を示すため,関連研究との差異を明確にする.

5.6.1. 異種マルチプロセッサシミュレーション

表 17に示すようにもともと異種マルチプロセッサに対応している性能評価シミュレータ

はなく,SimICSを受け継いだVirtutech社などの商用のシミュレータが対応しているのみ

である.マルチプロセッサに対応するにはプロセッサやキャッシュメモリのインスタンス 化が必要となり,異種マルチプロセッサでは C++の仮想関数などの手段を用いた共通イン ターフェイスによる呼出しが必要となる.この対応が同種プロセッサと異種プロセッサの 大きな違いとなる.ISISやSystemC もC++を使っているため仮想関数を使っているが,

ESPRIT/simではprocessor_element,isaという基本クラスの派生したクラスを用いてプ

ロセッサ定義を行ない,proc_*の関数からisa_*の関数を呼び出すなど関数の呼び方に新規 性がある.

5.6.2.同種マルチプロセッサシミュレーション

SimOS,SimICS,Mambo,Shaman,ISIS,ISIS-SimpleScalar はマルチプロセッサ

に対応しているが,他は対応していない.これらの中でバイナリ変換に対応しているのは

SimOSのEmbraのみである.EmbraはレガシISAとホストに制約がある.Embraはコー

ド変換キャッシュを物理アドレス対応で持ち,プロセッサ間で共有をしている.一方,

ESPRIT/simはコード変換キャッシュをプロセッサごとに持ち論理アドレスでアクセスし,

プロセッサ間でコード変換キャッシュの影響がないようにして高速化と簡易実装を図って いる.これも 2 次キャッシュメモリの容量が大きい最近のマイクロプロセッサの特性を活 かした簡易実装であるところに新規性がある.

複数プロセッサのシミュレーションを単一のホスト CPU で行う方法について述べる.

ISISとISIS-SimpleScalarはクロックごとに評価対象を切り替えている.SimICSの切換

え方式は不明である.SimOSとEmbraも不明であるが動作原理とparallel Embraの存在 からマルチスレッドを使用していると推測している.その他はマルチスレッドである.

ESPRIT/simはシミュレーション結果の再現性を重視しており,単一のホストCPU用には

マルチスレッドを用いたマルチプロセッサシミュレーションは行っていないし,将来も行 わない予定である.バイナリ変換動作では一定命令数を使用して,解析用シミュレータで は一定クロック数を使用してシミュレーション評価を切り替えている.この方法の新規性 については不明である.

5.6.3. 複数種レガシーISA

性能解析を目的としたバイナリ変換では,Shadeはレガシー命令セットをSparcとMIPS に,ホストはSparcに限定しており適用対象の範囲が狭い.SimOSはSparcとMIPSに対

応しているようであるがそのほかの ISAについては不明である.ESPRIT/simではバイナ リ変換を行っているがレガシーアーキテクチャに対する制約はなく,M32R,PowerPC と PISA に対応した実装を行っている.バイナリ変換を持たないシミュレータでは,SimICS が複数種に対応している.Mambo は Cell と PowerPC の組合せに限定されている.

SimpleScalar は複数種のレガシーに対応しているが排他的であり,複数レガシーに対応し

たVer.3.0ではVer.2.0に比べて性能劣化している.ESPRIT/simはほかにMIPS32,MIPS64,

SH4,ARM(Thumb命令と割り込みは未実装)などにも対応し,エンディアンの混在も可 能である.このように適用できるレガシーISA に汎用性があり,更にバイナリ変換に対応 しているところに新規性がある.

5.6.4. 複数種ホストISA,異種アーキテクチャ間,異種エンディアン間

ShadeはホストをSparcに限定し対象範囲が狭い.SimOSもSparc以外のホストに関す

る記述の文献が見当たらず同様と思われる.バイナリ変換機能を持たないシミュレータに 限定すると,gccでコンパイルできるものはホスト依存性が小さく一般的に複数のホストに 移植できるといえる.

動的バイナリ変換を行うシミュレータでは,ESPRIT/sim以外は複数種のホストISAに 対応してない.

バイナリ変換を行わないものではSimICSがあるが,アセンブリ言語レベルの実装やgcc の方言など制約ある.SimpleScalarのPISAはgcc以外もサポートしており移植できるホ ストは多いが,WindowsではCygwin環境が必須でありCygwinでも動作できないアプリ ケーションもある.レガシーISAがPowerPCの場合はAIXのホスト,Alphaの場合はOSF のホストが必要など制約が大きい.また,ホストとレガシーのエンディアンが異なると動 作できないという課題がある.

これらに比べて,ESPRIT/sim はレガシーとホストのそれぞれに対して,命令セット,

エンディアン,OSの違いを分離し必要に応じた変換を施して解決している.トランスレー タに 3階層の構造を用い,レガシーモデルの記述にC++のクラスを使用したことによりそ れらの違いの分離を可能にしている.このようにホストの制約がなく†30それを実現してい る機構に新規性があるといえる.

5.6.5.フルシステムシミュレーション

SimOS,SimICS,Mamboはフルシステムシミュレーションに対応しておりアドレス変

換機能を持っている.SimOSはアドレス変換用に全空間を格納する巨大なテーブルを使用 しているためワークロードの大きなシミュレーショでは性能が低下する.SimICSは6種類,

合計24Kbyteと小さいハッシュテーブルを用いて変換をしている.ESPRIT/simはOSの

評価よりも組込みシステムを対象としているため,リード,ライト,実行の 3 種類に限定 してより変換表の切替え処理を簡素化している.SimICSとの大きな違いは,命令のアドレ ス変換がほとんどバイナリ変換用のCCDにより処理されることである.

5.6.6. バイナリ変換の簡易実装

バイナリ変換は,開発に膨大なコストが掛かる.特に市販マイクロプロセッサのユーザ が性能解析のために開発コストを掛けるのは合理的ではない.ESPRIT/sim は最適化レベ ルを限定した簡易実装により,開発コストが安く安定動作が可能なバイナリ変換機能を提 供している.バイナリ変換の手法を詳細に述べた文献は少ないが,Shadeや文献[39]のバイ ナリ変換は,コード変換キャッシュの構造の複雑化のほかに,レガシー命令間に渡った最 適化,ブロック間のチェイン,ブロックの並び替えや分岐の入れ替えを行いアルゴリズム を複雑にして投資効果を悪化させている.ESPRIT/sim は,命令間の最適化は原則的に行 わないことにして簡単なテストプログラムで検証カバレッジを確保をしている.更に

ESPRIT/simは,ブロック間のチェインなども行わずに,唯一ユニプロセッサ向けにCCE

内での分岐最適化に留めている.

5.6.7. 複合型シミュレータ

SimpleScalarは,シミュレーション対象の粒度別にsim-fast,sim-cache,sim-outorder のシミュレータを持っている.それらは,目的別にカスタマイズするために個別のメイン ルーチンを持ち,コンパイル時に不要な変数をコンパイラが除去することを期待した最適 化により高速化を実現している.そのため可読性と拡張性に欠ける.また,マルチプロセッ サに対応できず,同一プログラムモジュールに複数アーキテクチャや複数シミュレータを 統合することができない.またバイナリ変換動作による高速化機能もない.SimpleScalar は,あらかじめ指定した命令数までsim-fastを使いそこでダンプを行い,次にsim-outorder を起動してダンプデータをロードをして続きを実行するという使い方をしている.

SimOSは命令実行をするフロントエンド部と詳細シミュレーションを行うバックエンド

部に別れている.そのため,フロントエンドとバックエンドは疎結合になりバックエンド からフロントエンドへのフィードバックが難しい.

ESPRIT/sim は1つのプログラムモジュールに複数のコンピュータモデルを搭載可能で

あり,ダンプデータを必要としない.また,粒度の異なるシミュレータ間の行き来が自由 である.

5.6.8. C/C++言語実装

SimpleScalarとSimICSは,C言語実装のインタプリタ方式の命令フロントエンド処理

を採用しており,ESPRIT/simの C++と類似している.しかし,C 言語実装はモデルのバ リエーションへの対応に限界がある.

SimCore/Alphaは,シミュレータのモデル記述にC言語の代わりにC++を用いて可読性

向上をねらっている.SimCore/Alpha はデコードの再利用によりオーバヘッド改善をして いるがそれでも命令シミュレーションのCPIが100を超えており,C言語に比べてその処 理速度はかなり遅い.ESPRIT/simもC言語からC++に移植して評価し,間接アクセスと

†30 制約はないといっても,16ビット系のホストや浮動小数命令がないホストは対象としていない.