• 検索結果がありません。

JAIST Repository https://dspace.jaist.ac.jp/

N/A
N/A
Protected

Academic year: 2021

シェア "JAIST Repository https://dspace.jaist.ac.jp/"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

Japan Advanced Institute of Science and Technology

JAIST Repository

https://dspace.jaist.ac.jp/

Title ソフトウェア制御によるキャッシュ参照ウェイ限定手

法の研究

Author(s) 小林, 智弘

Citation

Issue Date 2015‑03

Type Thesis or Dissertation Text version author

URL http://hdl.handle.net/10119/12670 Rights

Description Supervisor: 田中 清史, 情報科学研究科, 修士

(2)

ソフトウェア制御によるキャッシュ参照ウェイ限定手法の研究

小林 智弘(1310025)

北陸先端科学技術大学院大学 情報科学研究科 2015年2月12日

キーワード: 消費電力,ウェイ限定参照,Way-prediction.

1 はじめに

近年のプロセッサでは,データアクセス時のキャッシュヒット率の向上を図るために,

キャッシュメモリのブロック配置方式として,セットアソシアティヴ方式が採用されてい る.従来のセットアソシアティヴ方式ではデータアクセス時間を最小化するために,デー タアクセス時にすべてのウェイのタグとデータ配列が並列に読み込まれ,タグ比較が行 われ,ヒットするウェイが検出される.しかしながら,ヒットするウェイはただひとつで あり,ヒットしないウェイに対するデータ配列の読み込みにおいて,エネルギーを浪費 することが問題となる.この問題に対してウェイを予測限定参照することによって浪費 を削減する手法が存在するが,予測のために大きなハードウェアテーブルと複雑なキャッ シュ構造が必要となる.そこで,本研究では大きなハードウェアテーブルと複雑なキャッ シュ構造を必要とせずにウェイの予測限定参照を行う有効な方法として,TracePC Way predection(TracePC)法とSimple-Counter Way prediction(SC)法を提案する.

2 関連研究

ウェイ限定参照を行う手法としてPredictive Sequential Associative Cache(PSA)[1] が 提案された.PSA はウェイを限定して参照するためにテーブルを用いてウェイ予測を行 う初めての研究であり,セットアソシアティヴ方式のデータ配列の選択を原因としたアク セス時間の増加を改善するために提案されたキャッシュ構造である.従来のセットアソシ アティヴ方式のようにデータアクセス時にすべてのウェイを読み込むのではなく,ウェイ 予測により限定されたウェイのみを参照する方式である.これにより,データ配列の選 択による遅延を抑えることが可能である.PSAのウェイ限定参照を応用した研究として Reactive-Associative Caches(R-A Cache)[2] が提案された.R-A CacheはPSA と同様に セットアソシアティヴ方式のデータ配列の選択を原因としたアクセス時間の増加を改善

Copyright c2015 by Kobayashi Tomohiro

1

(3)

するために提案されたキャッシュ構造である.R-A Cacheは競合するブロックとしないブ ロックを分けてウェイ予測を行うことにより,ウェイ予測の精度を向上させている.そし て,PSAとR-A Cacheを消費電力の削減に用いた研究として文献[3]がある.これはウェ イ予測により選択されたウェイのみを参照する構造を消費電力の削減に応用した研究であ る.また,D-cacheだけでなくI-cacheにもウェイ予測の仕組みを応用することによって,

消費電力の削減に成功している.

3 提案手法

本研究では,ウェイ予測限定参照を行う手法としてTracePC Way prediction(TracePC) 法とSimple-counter Way prediction(SC)法を提案する.TracePC法は事前実行によるメ モリアクセスのトレース情報を用いて参照ウェイを静的に決定する.メモリアクセス命令 のPC値と参照するウェイのトレースを取り,各メモリアクセス命令に対して最も参照さ れたウェイを限定参照するウェイとして決定する.SC法は小さなカウンターを用いて参 照ウェイを動的に決定する.ウェイに対して1つのカウンタを用意し,プログラム実行を フェーズに分けて参照するウェイをカウントし,最も参照数の多いウェイを次のフェーズ で限定参照するウェイとして決定する.

4 評価

シミュレーションにより,提案手法のデータアクセス時の消費電力量を評価する.また,

提案手法とPSA とR-A Cache のキャッシュアクセスのウェイ予測限定参照の予測精度に ついて評価する.評価にはSPEC2000ベンチマークプログラムを用いて,プログラムへ の入力としてはrefを使用する.TracePC法は事前実行が必要となるため,プログラムに 入力としてtrainを用いた事前実行を行う.評価の際のL1データキャッシュは1回目の予 測参照ですべてのウェイのタグ配列と予測されたウェイのデータのみを参照する4 ウェ イセットアソシアティヴ方式である.L2キャッシュのブロック格納方式は従来の4ウェイ セットアソシアティヴ方式である.シミュレーションの結果,比較手法の平均ウェイ予測 精度は,PSAが約69%,R-A Cacheが約96%であり,提案手法であるTracePC法とSC 法はそれぞれ約36%,約43%の予測精度であった.従来のセットアソシアティヴ方式と 比較して,平均で,PSA は約33.5%,R-A Cache は約15.6%,提案手法であるTracePC 法とSC法はそれぞれ約30.0%,約31.1%の消費電力量の削減となり削減効果が示された.

5 まとめ

本研究では大きな追加ハードウェアを用いることなくウェイ予測限定参照を行う手法 として,TracePC Way prediction(TracePC)法とSimple-Counter Way prediction(SC)法

2

(4)

の提案を行った.SPEC2000ベンチマークプログラムを用いて,提案手法のデータアク セス時の消費電力量の評価とウェイ限定参照の予測の精度の評価を行った.評価の結果,

TracePC法の平均予測精度は約36%であるが,プログラムへの入力が変わったとしても

メモリアクセス命令のPC値とヒットするウェイに関連があると推測されるプログラムに おいて,高いウェイ予測精度があり,平均約30%のデータアクセス時の消費電力量の削減 効果を持つことが示された.SC法は極めて小さなハードウェアカウンタのみで約43%の 平均ウェイ予測精度を持ち,ハードウェアコストを抑えたウェイ予測限定参照として有効 であり,平均約31%のデータアクセス時の消費電力量の削減に成功した.

参考文献

[1] B. Calder, D. Grunwald, and J. Emer. Predictive sequen- tial associative cache.

In Proceedings of the Second IEEE Symposium on High-Performance Computer Architec- ture, Feb. 1996.

[2] B.Batson and T. N. Vijaykumar. Reactive associative caches. In proceedings of In- ternational Conference on parallel Architecutures and Compiliation, 2001.

[3] Michael D. Powell, Amit Agarwal, T. N. Vijaykumar, Babak Falsafi and Kaushik Roy, Reducing Set-Associative Cache Energy via Way-Prediction and Selective Direct-Mapping 2001.

[4] SimpleScalar <http://www.simplescalar.com/> (accessed 2015/02/09) [5] SPEC2000 <http://www.spec2000.com/> (accessed 2015/02/09)

3

参照

関連したドキュメント

Causation and effectuation processes: A validation study , Journal of Business Venturing, 26, pp.375-390. [4] McKelvie, Alexander &amp; Chandler, Gaylen &amp; Detienne, Dawn

Previous studies have reported phase separation of phospholipid membranes containing charged lipids by the addition of metal ions and phase separation induced by osmotic application

It is separated into several subsections, including introduction, research and development, open innovation, international R&amp;D management, cross-cultural collaboration,

UBICOMM2008 BEST PAPER AWARD 丹   康 雄 情報科学研究科 教 授 平成20年11月. マルチメディア・仮想環境基礎研究会MVE賞

To investigate the synthesizability, we have performed electronic structure simulations based on density functional theory (DFT) and phonon simulations combined with DFT for the

During the implementation stage, we explored appropriate creative pedagogy in foreign language classrooms We conducted practical lectures using the creative teaching method

講演 1 「多様性の尊重とわたしたちにできること:LGBTQ+と無意識の 偏見」 (北陸先端科学技術大学院大学グローバルコミュニケーションセンター 講師 元山

Come with considering two features of collaboration, unstructured collaboration (information collaboration) and structured collaboration (process collaboration); we