• 検索結果がありません。

容量仮想化機能を備えるフラッシュドライブを活用した高性能重複排除処理方式

N/A
N/A
Protected

Academic year: 2021

シェア "容量仮想化機能を備えるフラッシュドライブを活用した高性能重複排除処理方式"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 81 回全国大会. 5A-04. 容量仮想化機能を備えるフラッシュドライブを活用した 高性能重複排除処理方式 達見 良介†. 吉原 朋宏†. 杉本 定広†. (株)日立製作所 研究開発グループ†. システムでは,データの更新に対して格納先の 記憶領域を新規に割り当てるログストラクチャ 近年,NAND フラッシュメモリを用いた SSD 方式 [3]を用いる.ログストラクチャ方式では, 等の記憶媒 体の利用が拡大してい る .SSD は 更新後のデータを予め確保された,未使用の連 HDD に比べて高性能である一方,容量当たりの 続した記憶領域に追記形式で格納する.更新前 価格が高い.そのため,これらの記憶媒体を用 いた多くのフラッシュストレージシステムでは, のデータを格納した領域は上書きせず,マッピ 利用可能な容量の増加を目的として,重複排除 更新ライト [1], [2]等の技術が用いられる. E’ 追記 E 一般に,重複排除を行うストレージシステム 無効化 E’ は,データの格納先領域を確保する処理に伴う D E F 記憶領域 ・・・ データコピーが発生し,性能低下の要因となる. :有効 :無効 本研究では,重複排除処理におけるデータコピ 図 3 ログストラクチャ方式 ーの量を削減する領域管理方式を提案する. ングにより無効な記憶領域として管理する(図 2). 2. 重複排除処理における課題 ログストラクチャ方式では,連続した未使用 重複排除では,アドレス空間の複数箇所で繰 の記憶領域を確保することで効率的にデータの り返されるデータの並びを単一の記憶領域に対 格納を行う.一方で,未使用の記憶領域を消費 応させることで,消費する記憶領域を節約する. しきった場合,無効な記憶領域を再利用するた そのため,重複排除を行うストレージシステム めにガベージコレクション(GC)が必要である(図 は,ホストに仮想的な記憶領域である論理ボリ 3).効率的なデータ格納を継続するために,無効 ューム(LV)アドレス空間を提供し,データ格納 な記憶領域が断片化している場合は,有効なデ 先である記憶領域との間のマッピング情報を N 対 ータを異なる記憶領域にコピーすることで,連 1 で管理する(図 1). 続した未使用の記憶領域を確保する必要がある. データのコピーの増加は,LV に対するアクセス LV A A B A C B 性能の低下につながる. アドレス空間. 1.. はじめに. ①有効データコピー 記憶領域. A B. C. :重複データ. 記憶領域 D. 図 2 重複排除処理のデータ管理 格納されるデータに重複が生じた場合,LV の アドレスと記憶領域のマッピングのみを更新す る.この場合,記憶領域に対する新たなデータ の格納は不要である.つまり,データの重複の 有無で格納の要否が変化するため,記憶領域の 割り当てを動的に行う必要がある. そのため,重複排除を行う多くのストレージ Deduplication method utilizing Flash Drives with Data Volume Virtualization † Ryosuke Tatsumi, Tomohiro Yoshihara, Sadahiro Sugimoto, Hitachi, Ltd. Research & Development Group. 1-13. C. B. A. ②連続領域確保. A B C D. 記憶領域 :有効. :無効. :未使用. 図 1 ガベージコレクション処理. 3.. 提案方式. GCによるデータコピーを不要化する領域管理 方式として,更新後のデータを,更新前のデー タと同じ記憶領域に上書きするストレートマッ ピングを提案する.ストレートマッピングでは,. Copyright 2019 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 81 回全国大会. 全てのLVアドレス領域に対し,更新データ格納 先の記憶領域を静的に割り当てる.これにより, データ更新後に,無効な記憶領域は発生せず, GCによって未使用領域を確保する必要がない. しかし,この方式は,全LVアドレス空間と同 じサイズのフラッシュメモリ(FM)の記憶領域が 必要となる.そこで,記憶領域として,仮想的 に,FMの物理記憶領域よりも大きなFM論理記憶 領域を提供する容量仮想化機能を持ったフラッ シュドライブ [4]を使用する.このフラッシュド ライブは,データがライトされたFM論理記憶領 域のみにFM物理記憶領域を割り当てる.そのた め,データがライトされていないFM論理記憶領 域に対応する物理容量は必要としない. 次に,ストレートマッピングを用いた重複排 除処理手順を示す(図 4). LV アドレス空間. A. A. B. ログストラクチャ方式は,有効データ割合の 増加とともに,空き領域を確保するために,GC のデータコピー量が増加する.これは,有効デ ータ割合が大きいときに,ストレージシステム の性能が低下することを意味する. 一方,ストレートマッピング方式では,有効 データ割合が増えても,GC によるデータコピー 量は発生しないため,実装されているフラッシ ュドライブの容量を上限まで消費していても, 性能が低下しない. GCのデータコピー量(ライトデータ量比) 8.0 7.0 6.0 5.0 4.0 3.0 2.0 1.0 0.0. ・・・. 0. ①マッピング 情報作成 FM論理 記憶領域. A. A. B. A A B. 0.6. 0.8. 1. 図 5 GC におけるデータコピー量. ・・・. 5.. ・・・. ③物理容量更新. 図 4 ストレートマッピング 重複データ検出後,以下のステップで重複排 除処理を実施する. ① 重複データを格納する複数のLVアドレス から,1つのFM論理記憶領域を指すマッピ ング情報を作成する. ② 残りの重複データのFM論理記憶領域に対 応するFM物理記憶領域の割り当てを解除 する. ③ フラッシュドライブの割り当て済み物理 容量を更新する. ②で割り当て解除されたFM物理記憶領域は, フラッシュドライブ内のGCによって,再利用さ れる.これにより,重複排除によるデータ削減 が実現できる.提案方式では,ストレージシス テムがデータ格納先の記憶領域を動的に確保す る必要がないため,ストレージシステムにおけ るGCが不要となる.. 4.. 0.4. 有効データ割合. ②割当解除 FM物理 記憶領域. 0.2. 提案方式の評価. まとめ. 本研究では,重複排除処理における領域管理 方式として,ストレートマッピングを提案した. 提案方式は,GC が不要化され,データコピー量 を削減できることを示した.特に,有効データ 量の割合が高いときには,ログストラクチャ方 式に比べて,高性能を達成できる.. 参考文献 [1] I. Chernov, E. Ivashko, A. Rumiantesev, V. Ponomarev , A. Shabaev, “Survey on Deduplication Techniques in Flash-Based Storage,” Proceeding of the 22nd Conference of Fruct Association, 2018. [2] J. Paulo , J. Pereira, “A Survey and Classification of Storage Deduplication Systems,” ACM Computing Surveys, Vol. 47, No. 1, 2014. [3] M. Rosenblum , J. K. Ousterhout, “The Design and Imprementation of a Log-Structured File System,” ACM Transactions on Computer Systems, Vol 10, No. 1, February 1992, Pages 26-52, 1992. [4] 小関, 新井 , 河村, “オールフラッシュアレイ向 け高性能データ圧縮機能の実装方式検討,” 平 成 28 年電気学会全国大会 シンポジウム, 2016.. 提案方式による GC のデータコピー量削減効果 を評価するために,ログストラクチャ方式の GC によるデータコピー量を計算する.図 5 にラン ダムライト中の GC によるデータコピー量を示す.. 1-14. Copyright 2019 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

Dual I/O リードコマンドは、SI/SIO0、SO/SIO1 のピン機能が入出力に切り替わり、アドレス入力 とデータ出力の両方を x2

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の

このうち、放 射化汚 染については 、放射 能レベルの比較的 高い原子炉 領域設備等を対象 に 時間的減衰を考慮す る。機器及び配管の 内面に付着