• 検索結果がありません。

岡, 慶太郎

N/A
N/A
Protected

Academic year: 2021

シェア "岡, 慶太郎"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

プロセッサの高性能化を目的としたデータ圧縮に基 づくキャッシュメモリアーキテクチャに関する研究

岡, 慶太郎

http://hdl.handle.net/2324/4060185

出版情報:Kyushu University, 2019, 博士(工学), 課程博士 バージョン:

権利関係:Public access to the fulltext file is restricted for unavoidable reason (2)

(2)

(別紙様式2)

氏 名 :岡 慶太郎

論 文 名 : A Study on Cache Memory Architecture Based on Data Compression for High-Performance Processors (プロセッサの高性能化を目的としたデータ圧縮に基づく キャッシュメモリアーキテクチャに関する研究)

区 分 :甲

論 文 内 容 の 要 旨

現在,計算機サーバやラップトップPC,携帯電話などの様々な電子機器システムにプロセッサ が搭載されている.1970 年代初頭に世界初となるワンチップ・プロセッサが発明されて以来,

その性能は半導体微細化技術の進歩とともに飛躍的に向上してきた.1990年代には動作周波数 の向上や命令レベル並列性の活用により性能を改善し,2000年以降は複数のプロセッサコアを 搭載したマルチコア方式へと進化した.さらに,近年では数千ものコアを搭載しオンチップ超 並列処理を可能にするGPU(Graphics Processing Unit)が実用化され,スーパーコンピュー タに代表される高性能計算機システムのみならず,カーエレクトロニクスなどの様々な組込み システムへとその応用が拡大している.しかしながら,プロセッサ(GPUも含む)性能の改善が そのままコンピュータシステムの性能向上へとつながる訳ではない.その原因として,プロセ ッサ-主記憶間の性能差の拡大(いわゆるメモリウォール問題)の深刻化が挙げられる.主記 憶として用いられるDRAMはプロセッサと比較して低速であるため,主記憶アクセス・レイテン シが増大する.また,半導体パッケージのI/O ピン数は物理的に制限されるため,プロセッサ 性能の向上に伴い十分なメモリバンド幅を確保することがより難しくなる.その結果,主記憶 アクセスが頻発するプログラムではメモリ性能がボトルネックとなり,実効性能が低下すると いった問題が生じる.この問題を解決すべく現代のプロッセッサにはオンチップ・キャッシュ

(以降,キャッシュと略す)が当然のように搭載されているが,依然としてメモリウォール問 題は顕在化しており,その更なる性能向上が求められている.

この課題を解決すべく,本論文では,データ圧縮技術をキャッシュへと適用することでキ ャッシュヒット率を大幅に改善する新しいアーキテクチャを提案し,定量的評価によりその有 効性を示している.本論文の第一の貢献は,汎用プロセッサに搭載されるキャッシュを対象と し,新しいデータ圧縮方式を提案した点にある.全く同じデータ値を有するキャッシュ・ライ ンが複数存在することに着目し,これらが単一のメモリスペースを共有するための機構を搭載 する.理論的には,キャッシュ内の全キャッシュ・ラインが同一値を有する場合,キャッシュ サイズ相当(例えば32 KB)のデータ量をキャッシュ・ラインのサイズ(例えば 32 B)にまで 圧縮可能となる.評価の結果,従来型のキャッシュメモリに対して最大40ポイントの性能向上 を得られることが明らかになった.第二の貢献は,GPUに搭載された最上位層キャッシュに適用 可能なデータ圧縮手法を考案した点にある.汎用プロセッサ向けに提案された既存手法をGPU向 けへと改良し,平均11ポイントの性能向上を達成することを示した.第三の貢献は,第二の貢 献で提案したアーキテクチャの改善を目的に,GPUの実行モデルであるスレッドレベル並列処理

(3)

の特性に着目した新しいキャッシュデータ圧縮方式を提案した点である.GPU向けの複数データ 圧縮方式を選択可能とし,アプリケーションの特性に応じて適切な圧縮方式を選択する.評価 の結果,第二の貢献と比較して最大20ポイントの性能向上を達成することを示した.

本論文は 6 章から構成される.第 1 章は本研究の背景と目的を述べ,第 2 章にて関連研 究を整理することで本研究の位置付けを明確にする.第 3 章では汎用CPU 向けの提案キャッ シュ圧縮について述べる.第 4 章ではGPU向けの圧縮・復元レイテンシ削減手法について論 じ,第 5 章ではGPU向けの圧縮キャッシュを提案する.最後に第6章で論文をまとめるととも に今後の研究の方向性を展望する.

参照

関連したドキュメント

Public health concerns for anti-obesity medicines imported for personal use through the internet: a cross-sectional study.. Mohiuddin Hussain Khan, 1 Tsuyoshi Tanimoto, 2

The reasons associated with feelings of burden were the following 14 items: “Breastfeeding requires care about what mothers can eat and drink”, “Breastfeeding alone does not

「第 3 章 SAS/ACCESS Interface to R/3 のインストール」では、SAS/ACCESS Interface to R/3 のインストールについて順を追って説明します。SAS Data Surveyor for

One reason for the existence of the current work is to produce a tool for resolving this conjecture (as Herglotz’ mean curvature variation formula can be used to give a simple proof

In the second computation, we use a fine equidistant grid within the isotropic borehole region and an optimal grid coarsening in the x direction in the outer, anisotropic,

While conducting an experiment regarding fetal move- ments as a result of Pulsed Wave Doppler (PWD) ultrasound, [8] we encountered the severe artifacts in the acquired image2.

But in fact we can very quickly bound the axial elbows by the simple center-line method and so, in the vanilla algorithm, we will work only with upper bounds on the axial elbows..

Aphid species 2,3 Armyworm Beet Armyworm 1,3 Corn Earworm Diamondback Moth 3 Fall Armyworm 1 Flea Beetle species Grasshopper species Japanese Beetle (Adult) Leafhopper species