4. 新型高速不揮発メモリを活用した階層型主記憶を実現する省電力仮想記憶システム
4.4 フルシステムシミュレーションによる評価
4.4.4 ストレージクラスメモリのアクセス電力が消費電力に及ぼす影響の評価
87
図 4.6. canneal ベンチマークの実行時間の内訳
4.4.4 ストレージクラスメモリのアクセス電力が消費電力に及ぼす影響の評
88
シなどの特性に依らずほぼ一定と考えられる。DRAM_static は、DRAM の静的電力量であり、
DRAM サイズを小さくできればそれに応じて小さくできる。一方で、ストレージクラスメモ リのレイテンシが大きくなりスワップ処理時間が増加しアプリケーションの実行時間が長 くなるとそれに比例して大きくなってしまう。DRAM_dynamic_swap は、スワップ処理に掛か る DRAM の動的消費電力量であり、スワップ処理回数に比例して変化する。なお、DRAM のア クセス電力量は、リードもライトも 10pJ/bit で計算している。SCM_dynamic_swap_xN は、
スワップ処理に掛かるストレージクラスメモリの動的消費電力量であり、スワップ処理回 数に比例して変化する。この値は、各種ストレージクラスメモリに依って大きくことなる ため、3 種類のストレージクラスメモリを想定し、それぞれアクセス電力量が DRAM の 2 倍 (x2)、4 倍(x4)、10 倍 (x10) とする。
各種ストレージクラスメモリのアクセスの消費電力がメモリシステム全体の消費電力に 及ぼす影響について同じ PARSEC ベンチマークを用いて評価した結果を図 4.7~図 4.9 に示 す。なお、canneal については、ストレージクラスメモリを用いても実用的な時間で処理で きないことが分かっているので消費電力の評価から除外している。
図 4.7. アクセス電力が消費電力に及ぼす影響 (facesim)
89
ここでは、スワップデバイスのアクセス電力がメモリシステム全体の消費電力に与える 影響のトレンドカーブを見極めるために、先ほどと同様にアクセスレイテンシを幅広く変 化させる。図の縦軸は消費電力量である。
図の一番左側の縦棒だけは先ほどと同様に特別扱いで、アクセスレイテンシが 0 という わけではなく、十分なサイズの DRAM のみでベンチマークが実行された場合の消費電力を示 しており、スワップ処理によるオーバヘッドがない。即ち、この縦棒と同じ高さで引かれ ている線より下であれば、本方式により省電力化が達成可能であることを示す。
図 4.7 の facesim の場合、4.4.3 の評価結果より、本方式ではストレージクラスメモリの アクセスレイテンシは数μ秒でよいことが分かったのでアクセスレイテンシが 1μ秒で、ま ずはアクセス電力が小さい(x2)ストレージクラスメモリに注目する(図 4.8)。
図 4.8. アクセス電力が小さいストレージクラスを用いた場合の省電力効果 (facesim)
図より、DRAM のみで実行した場合と比較すると、DRAM サイズを小さくした効果として、
DRAM_static が 削 減 さ れ て い る の が 分 か る 。 一 方 で 、 そ の 副 作 用 と し て 増 加 し た SCM_dynamic_swap_DRAMx2 は相対的に小さく、結果として全体で 28%の消費電力量が削減さ
90 れており、本方式の有効性が確認できた。
つぎに、アクセスレイテンシが 1μ秒で、アクセス電力が大きい (x10)ストレージクラス メモリに注目すると、今度は副作用として増加した SCM_dynamic_swap_DRAMx2 は相対的に 大きく、結果として全体での消費電力量は逆に増加してしまった。このように、ストレー ジクラスメモリのアクセス電力は本方式の有効性に大きく影響することが明らかになった。
これは、提案方式は積極的にスワップアウト、つまりライトが発生するため、消費電力の 観点では DRAM に対して数倍程度までの小さい動的電力が要求されることが明らかになり、
例えば、ライトのアクセス電力が 10 倍程度と高い PCM 系などには向かない可能性があるこ とが分かった。アクセス電力が 2 つの中間の (x4)ストレージクラスメモリではまだ消費電 力量は大きく削減できているため、アクセス電力量が DRAM の 4 倍程度までのストレージク ラスメモリが望ましい。
図 4.9. アクセス電力が消費電力に及ぼす影響 (dedup)
図 4.9 の dedup の場合も同様に、アクセスレイテンシが 1μ秒で、アクセス電力が小さい (x2)ストレージクラスメモリに注目すると、 DRAM サイズを小さくした効果として、
91
DRAM_static が大幅に削減されているのが分かる。一方で、その副作用として増加した SCM_dynamic_swap_DRAMx2 は相対的に小さく、結果として全体で 83%の消費電力量が削減さ れており、本方式の有効性が確認できた。アクセス電力が大きい (x10)ストレージクラス メモリでも省電力化はできるものの、省電力効果は小さくなる。このように、消費電力の 観点では DRAM に対して数倍程度までの小さい動的消費電力が要求されることが明らかにな り動的消費電力が低い MRAM 系などや、PCM 系などよりは動的消費電力が低いとされる 2 つ のメモリの中間の ReRAM 系などが向く可能性があることが分かった。
また、facesim の場合の DRAM の比率がストレージクラスメモリの 1/5 程度だったのに対 して、ローカリティが非常に高い dedup は DRAM の割合をそのさらに数割である 1/25 程度 まで小さくしても発生するスワップ回数は facesim と同程度であるため、より積極的なス トレージクラスメモリへの追い出しが可能であったり、canneal のようなランダムアクセス の場合は DRAM サイズを小さくしづらいなど、アプリケーションのアクセスパタンに応じて DRAM サイズを動的に変化させ電源オフすることが重要である。しかし、メモリアクセスパ タンはスワップレートに集約することができるため、スワップレートを監視する既存研究 [127]と組み合わせることで実現できると考えられ、その点については今後の重要な研究課 題である。また、今後サーバシステムにストレージクラスメモリと DRAM を混載させる際に、
どのような割合で混載させるのかは大きな議論になると考えらるが、1/5 というのはその一 つの指標になると考えられる。
データセンターのワークロードは変動するため、動的に DIMM 単位でパワーオフすること が効果的と考えられるが、組込みシステムでも同様に、DRAM のサイズをランクやバンクの 単位で動的にリサイズして省電力化できる可能性もあり、さらに言えば、組込みシステム 上の DRAM サイズを増やさずによりメモリへの要求が高いアプリケーションを省電力に実行 できる可能性もあることを示している。