• 検索結果がありません。

ストレージシステムにおける大容量データ転送時の経路制御方式

N/A
N/A
Protected

Academic year: 2021

シェア "ストレージシステムにおける大容量データ転送時の経路制御方式"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. ストレージシステムにおける大容量データ転送時の 経路制御方式 鈴木貴敦†1. 吉原朋宏†1. 概要: 複数のインタフェースを用いる大規模なストレージシステムにおいて、高いシーケンシャルリード性能実現 に必要な、キャッシュメモリへのデータ転送経路制御方式を検討した。本研究では、複数 DMA のデータ転送経路の 競合により性能低下が発生することを明らかにし、転送先キャッシュメモリに合わせて転送経路を選択し競合を回避 する方式を提案した。プロトタイプにて経路制御方式の実測評価を行い、提案手法の有効性を確認した。. 1. はじめに 1.1 ストレージシステムとは. ホスト コンピュータ. ホスト コンピュータ. ホスト インタフェース. ホスト インタフェース. キャッシュ メモリ. キャッシュ メモリ. 制御部. 制御部. 記憶媒体 インタフェース. 記憶媒体 インタフェース. ストレージシステムとは,多数のホストコンピュータを 接続可能な,大容量・大規模なデータ記憶装置である.ス トレージシステムは,一般に,多数の HDD や SSD 等の記 憶媒体と,それらの記憶媒体とコンピュータの間を取り持 つコントローラから構成される(図 1).記憶媒体は,信頼 性向上のため,Redundant Array of Independent Disk(RAID) [1]構成を取ることが多い. コントローラは,以下の 4 つの要素から構成される.そ れぞれの要素は,信頼性と可用性の向上のため,冗長化さ れている. . ホストコンピュータとの接続インタフェース(以後, ホストインタフェース). . ストレージ コントローラ. 記憶媒体に格納するデータを一時的に保持するキャ ッシュメモリ(以後,キャッシュメモリ). . 記憶媒体との接続インタフェース(以後,記憶媒体イ. . ホストインタフェース,キャッシュメモリ,記憶媒. ンタフェース). 記憶媒体. 記憶媒体. 体インタフェースを制御する制御部(以後,制御部). ストレージ システム. ストレージシステムは,企業の基幹系システムに使われ ることが多く,その場合,高い信頼性と可用性はもちろん. 図 1. ストレージシステム概要. のこと,多数のホストコンピュータを接続することから, 柔軟に性能設計変更が可能なものが求められる. このニーズに対し,ホストインタフェース,キャッシュ メモリ,記憶媒体インタフェース,制御部の各部を分離し, 独立して増減設可能なストレージコントローラアーキテク. 1.2 ストレージシステムへの I/O 種別と本研究の目的 ストレージシステムへの I/O は,ランダムアクセスとシ ーケンシャルアクセスの 2 つに分けることができる. . ランダムアクセス:データの転送長が小さく,ホス. チャがある[2][3].このアーキテクチャでは,例えば記憶媒. トコンピュータがアクセスするアドレスが非連続. 体を増やしたい場合は,記憶媒体インタフェースを増設す. であるアクセスパターンのこと. ると言った,必要に応じたシステム構成を取ることが可能 である.. . シーケンシャルアクセス:データの転送長が大きく, ホストコンピュータがアクセスするアドレスが連 続であるアクセスパターンのこと. こ れ ま で , ス ト レ ー ジ シ ス テ ム に は 主 に Online Transaction Processing (OLTP) 処理の高速化のために,高い †1 (株)日立製作所 研究開発グループ 情報通信イノベーションセンタ Hitachi Ltd., Research & Development Group, Center for Technology Innovation – Information and Telecommunications. ⓒ2015 Information Processing Society of Japan. ランダムアクセス性能が求められていた[4].近年では,ラ. 1.

(2) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. ンダム性能に加えて,Hadoop などのビッグデータ解析処理. ホスト コンピュータ. ホスト コンピュータ. ホスト インタフェース. ホスト インタフェース. キャッシュ メモリA. キャッシュ メモリB. の効率向上のため,大量データを読み込むシーケンシャル リード性能が求められている[5]. ストレージシステムにおいて,高いシーケンシャルリー ド性能を出すためには,データを転送するハードウェアの 帯域と,ハードウェアの帯域を使い切るためのデータの転 送経路制御方式が必要である. 本研究の目的は,ストレージシステムを構成するハード ウェアの持つシーケンシャルリード性能を出し切るための データ転送経路制御の方式を検討することである.. 2. 研究対象 2.1 ハードウェア構成. 制 御 部. DMA A. DMA B. DMA A. DMA B. バッファ メモリA. バッファ メモリB. バッファ メモリA. バッファ メモリB. プロトコル チップA. プロトコル チップB. プロトコル チップA. プロトコル チップB. 以下の図 2 に,本研究で前提とするストレージシステム のハードウェア構成を示す.ストレージシステムは,スト レージコントローラと記憶媒体からなる.ストレージコン トローラは,ホストインタフェース部,記憶媒体インタフ ェース部,制御部,キャッシュメモリ部,及びそれらを互 いに接続するネットワーク部からなり,それぞれ信頼性・ 可用性の向上のため,冗長化されている. 記憶媒体インタフェースは以下の 3 つの要素から構成さ. 記憶媒体 インタフェース. 記憶媒体 A. れる.内部ネットワークを介して,それぞれが相互に接続 されている. . 記憶媒体と通信するためのプロトコルチップ(以後,. 図 2. 記憶媒体 B. ハードウェア構成概要. プロトコルチップ) . 記憶媒体へ転送するデータ,記憶媒体から転送され たデータを一時的に保持するためのバッファメモ リ. . キャッシュメモリとバッファメモリ間のデータ転送 を行う Direct Memory Access (DMA) エンジン. データは,ネットワーク部,および記憶媒体インタフェ ース内部ネットワーク上をあるサイズのパケットに分割さ. (4) プロトコルチップが記憶媒体からバッファメモリへデ ータを転送する. (5) DMA がバッファメモリからキャッシュメモリへデータ を転送する. (6) リード要求を受信したホストインタフェースがキャッ シュメモリからホストコンピュータへデータを転送 し,処理が完了する. れて,シリアルに転送される.また,ネットワーク部の帯. 本研究では,特に記憶媒体インタフェース内の DMA エ. 域は,記憶媒体インタフェース内部ネットワークの帯域よ. ンジンが性能ボトルネックとなる場合に,シーケンシャル. りも大きいものとする.. リード性能を最大限引き出すための,記憶媒体-キャッシュ. また,記憶媒体には,デュアルポートの SAS ドライブを. メモリ間のデータ転送経路制御方式を明らかにする.. 利用する[6]. 2.2 シーケンシャルリード処理概要 シーケンシャルリードでは,以下の流れにそってデータ. 3. 課題 DMA エンジンのデータ転送能力の低下要因となるのは,. をホストまで転送する.. データ転送経路の競合である(図 3).データ転送経路の競. (1) 制御部が、ホストインタフェースを経由してサーバか. 合は,同一記憶媒体インタフェース内の複数 DMA エンジ. らリード要求を受信する. (2) 制御部が,より使用量の少ないキャッシュメモリを選 択する. (3) 制御部が,より低負荷な記憶媒体インタフェースを選 択する.. ⓒ2015 Information Processing Society of Japan. ンが,同じ経路を使用してデータ転送する場合に発生する. データ転送経路の競合が発生すると,DMA エンジンが稼 働時間あたりに転送可能なデータ量が減少するため,シー ケンシャルリード性能が低下する.そのため,DMA エン ジンが使用するデータ転送経路での競合を少なくすること. 2.

(3) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. 競合なし. 競合あり. キャッシュ メモリ. キャッシュ メモリ. キャッシュ メモリ. a. b. a. a. b. b. a. b. a. a. b. b. DMA a 図 3. DMA b. DMA a. データの流れ. キャッシュ メモリ. 制 御 部. DMA b. ホスト インタフェース. ホスト インタフェース. キャッシュ メモリA. キャッシュ メモリB. DMA A. DMA B. DMA A. DMA B. バッファ メモリA. バッファ メモリB. バッファ メモリA. バッファ メモリB. プロトコル チップA. プロトコル チップB. プロトコル チップA. プロトコル チップB. DMA によるデータ転送(競合ありの場合と競合なし. 記憶媒体 A. の場合との比較) が課題である.. 図 4. 記憶媒体 B. キャッシュメモリ-DMA エンジン間経路切替方式 (片側の記憶媒体インタフェース内経路線省略). 4. データ転送経路制御方式 4.1 転送経路制御方式の制約. 4.3 経路制御方式 2:DMA エンジン-バッファメモリ間経 路切替方式. 記憶媒体-キャッシュメモリ間のデータ転送経路制御方. 図 5 に, DMA エンジン-バッファメモリ間経路切替方. 式は,キャッシュメモリの負荷分散や交換・増設に対応す. 式の概要を示す.本方式では,転送先のキャッシュメモリ. るため,記憶媒体から任意のキャッシュメモリへ転送可能. に合わせて, DMA エンジン-バッファメモリ間のデータ転. なものにしなければならない.以後,この制約を守った経. 送経路を選択する方式である.具体的には,記憶媒体-キャ. 路制御方式を 4 つ挙げる.. ッシュメモリ間を以下の流れに沿ってデータを転送する. (1) プロトコルチップが,記憶媒体からバッファメモリ. 4.2 経路制御方式 1:キャッシュメモリ-DMA エンジン間. へデータを転送する.このとき,プロトコルチップは. 経路切替方式. 同一記憶媒体インタフェース内で,同一の ID が割り. 図 4 に,キャッシュメモリ-DMA エンジン間経路切替方. 振られているバッファメモリへ転送する. 式の概要を示す.本方式では,転送先のキャッシュメモリ. (2) DMA エンジンが,バッファメモリからキャッシュメ. に合わせて,DMA エンジンが使用するデータ転送経路を. モリへデータを転送する.このとき,同一記憶媒体イ. 選択する方式である.具体的には,記憶媒体-キャッシュメ. ンタフェース内に関して,データ転送先のキャッシュ. モリ間を以下の流れに沿ってデータを転送する.. メモリと同一の ID が割り振られている DMA エンジ. (1) プロトコルチップが,記憶媒体からバッファメモリ. ンを利用する.. へデータを転送する.このとき,プロトコルチップは 同一記憶媒体インタフェース内で,同一の ID が割り. 4.4 経路制御方式 3:バッファメモリ-プロトコルチップ間. 振られているバッファメモリへ転送する. 経路切替方式. (2) DMA エンジンが,バッファメモリからキャッシュメ. 図 6 に, バッファメモリ-プロトコルチップ間経路切替. モリへデータを転送する.このとき,同一記憶媒体イ. 方式の概要を示す.本方式では,転送先のキャッシュメモ. ンタフェース内に関して,データ転送元のバッファメ. リに合わせて,バッファメモリ-プロトコルチップ間のデー. モリと同一の ID が割り振られている DMA エンジン. タ転送経路を選択する方式である.具体的には,記憶媒体-. を利用する.. キャッシュメモリ間を以下の流れに沿ってデータを転送す. ⓒ2015 Information Processing Society of Japan. 3.

(4) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. データの流れ. 制 御 部. データの流れ. ホスト インタフェース. ホスト インタフェース. ホスト インタフェース. ホスト インタフェース. キャッシュ メモリA. キャッシュ メモリB. キャッシュ メモリA. キャッシュ メモリB. DMA A. DMA B. DMA A. DMA B. バッファ メモリA. バッファ メモリB. バッファ メモリA. プロトコル チップA. プロトコル チップB. プロトコル チップA. 記憶媒体 A 図 5. 制 御 部. DMA A. DMA B. DMA A. DMA B. バッファ メモリB. バッファ メモリA. バッファ メモリB. バッファ メモリA. バッファ メモリB. プロトコル チップB. プロトコル チップA. プロトコル チップB. プロトコル チップA. プロトコル チップB. 記憶媒体 A. 記憶媒体 B. DMA エンジン-バッファメモリ間経路切替方式. (片側の記憶媒体インタフェース内経路線省略) る.. 図 6. 記憶媒体 B. バッファメモリ-プロトコルチップ間経路切替方式 (片側の記憶媒体インタフェース内経路線省略) 割り当てられているバッファメモリへデータを転送. (1) プロトコルチップが,記憶媒体からバッファメモリ. する.. へデータを転送する.このとき,プロトコルチップは. (2) DMA エンジンが,バッファメモリからキャッシュメ. 同一記憶媒体インタフェース内で,転送先のキャッシ. モリへデータを転送する.このとき,同一記憶媒体イ. ュメモリと同一の ID が割り振られているバッファメ. ンタフェース内に関して,データ転送先のキャッシュ. モリへ転送する. メモリと同一の ID が割り振られている DMA エンジ. (2) DMA エンジンが,バッファメモリからキャッシュメ. ンを利用する.. モリへデータを転送する.このとき,同一記憶媒体イ ンタフェース内に関して,データ転送先のキャッシュ メモリと同一の ID が割り振られている DMA エンジ ンを利用する.. 5. 評価 5.1 机上評価 4 章で挙げた 4 つの転送経路制御方式に関して,それぞ. 4.5 経路制御方式 4:記憶媒体インタフェース切替方式 図 7 に, 記憶媒体インタフェース切替方式の概要を示. れの性質について机上で比較評価を行う.経路競合観点で の評価まとめを表 1 に示す.. す.本方式では,信頼性・可用性向上のために冗長化され. キャッシュメモリ-DMA エンジン間経路切替方式,DMA. ている記憶媒体インタフェースに着目し,それぞれを別の. エンジン-バッファメモリ間経路切替方式,バッファメモリ. キャッシュメモリへのデータ転送経路とみなす.具体的に. -プロトコルチップ間経路切替方式では,複数の記憶媒体か. は,記憶媒体-キャッシュメモリ間を以下の流れに沿ってデ. ら同時にデータを転送する場合,それぞれ経路を切り替え. ータを転送する.. る箇所で,経路競合が発生する. 図 8 に,キャッシュメ. (1) プロトコルチップが,記憶媒体からバッファメモリ. モリ-DMA エンジン間経路切替方式での例を示す.. へデータを転送する.このとき,一方の記憶媒体イン. 一方,記憶媒体インタフェース切替方式では,複数の記. タフェースのプロトコルチップは,同一記憶媒体イン. 憶媒体から同時にデータを転送しても,経路競合が発生し. タフェース内で,同一の ID が割り振られているバッ. ない.そのため,シーケンシャルリード性能が最も高くな. ファメモリへデータを転送する.もう一方の記憶媒体. るのは,記憶媒体インタフェース切替方式であると考えら. インタフェースのプロトコルチップは,異なる ID が. れる.. ⓒ2015 Information Processing Society of Japan. 4.

(5) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. 記憶媒体Aからのデータの流れ 記憶媒体Bからのデータの流れ ホスト インタフェース. ホスト インタフェース. キャッシュ メモリA. キャッシュ メモリB. 表 1. 机上評価まとめ(競合なし:○,競合あり:×) 方式 1. 方式 2. 方式 3. 方式 4. DMA エ ン ジ ン-キャッシュ. ×. ○. ○. ○. ○. ×. ○. ○. ○. ○. ×. ○. メモリ間競合 DMA エ ン ジ ン-バッファメ モリ間競合 バッファメモ. 制 御 部. リ-プロトコル. DMA A. DMA B. DMA A. DMA B. バッファ メモリA. バッファ メモリB. バッファ メモリA. バッファ メモリB. チップ間競合. 1.20 1.00. プロトコル チップB. プロトコル チップA. 記憶媒体 A. プロトコル チップB. 記憶媒体 B. 図 7 記憶媒体インタフェース切替方式. シーケンシャルリード性能 (方式1との相対値). 1.00 プロトコル チップA. 1.04. 1.06. 方式3. 方式4. 0.96. 0.80 0.60 0.40. 0.20 0.00 方式1. 記憶媒体Aからの データの流れ 記憶媒体Bからの データの流れ キャッシュ キャッシュ メモリA メモリB. 図 9. 方式2. 各方式の実測結果(※方式 1 からの相対値). 5.2 実測評価 図 2 で示されるハードウェアアーキテクチャを持つス トレージシステム上に,4 章の 4 つの方式を実装し,シー ケンシャルリード性能の測定を行った.結果を図 9 にまと. 競合. DMA A. DMA B. める.机上評価の通り,データ転送経路上で競合が発生し ない記憶媒体インタフェース切替方式を適用した場合に, 最もシーケンシャルリード性能が高くなる結果が得られた.. バッファ メモリA. バッファ メモリB. 5.3 考察 プロトコル チップA. プロトコル チップB. 今回測定を行ったストレージシステムでは,記憶媒体イ ンタフェース内の DMA エンジンがボトルネックであるた め,キャッシュメモリ-DMA エンジン間経路切替方式, DMA エンジン-バッファメモリ間経路切替方式,バッファ. 記憶媒体 A. 図 8. 記憶媒体 B. キャッシュメモリ-DMA エンジン間経路切替方式 における経路競合. メモリ-プロトコルチップ間経路切替方式の中では,DMA エンジンに関係するデータ転送経路上で競合が発生しない バッファメモリ-プロトコルチップ間経路切替方式を適用 した場合に,シーケンシャルリード性能が高くなった.バ ッファメモリ-プロトコルチップ間経路切替方式は,性能ボ トルネックである DMA エンジンが直接使用するデータ転 送経路上では競合が発生しないが,バッファメモリ-プロト. ⓒ2015 Information Processing Society of Japan. 5.

(6) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-ARC-215 No.8 Vol.2015-OS-133 No.8 2015/5/27. コルチップ間のデータ転送経路上で競合が発生するため, 記憶媒体インタフェース切替方式と比較して性能低下が見 られた. キ ャ ッ シ ュ メ モ リ -DMA エ ン ジ ン 間 経 路 切 替 方 式 と DMA エンジン-バッファメモリ間経路切替方式は,いずれ も DMA エンジンに関係するデータ転送経路上で競合が発 生しているが,記憶媒体インタフェース内部のネットワー ク帯域のほうが,キャッシュメモリ-DMA エンジン間のネ ットワーク帯域よりも小さいこと,また,バッファメモリ の帯域が,キャッシュメモリの帯域よりも小さいことが影 響したためであると考えられる.. 6. おわりに 本稿では,ストレージシステムにおいて,ハードウェア のシーケンシャルリード性能を出し切るためのデータ転送 経路制御方式について述べた.4 つの制御方式について, データ転送経路競合の観点から評価を行った.その結果, 記憶媒体インタフェースを切り替える方式が最もシーケン シャルリード性能が高かった. 今後,今回の結果を元に,ストレージシステムのシーケ ンシャルリード性能見積もり手法を検討する.. 参考文献 1) David A. Patterson, Garth Gibson, Randy H. Katz: A case for redundant arrays of inexpensive disks(RAID), Proceedings of the ACM SIGMOD international conference on Management of data, pp.109-116 (1988). 2) Josh Krischer: The Virtual Storage Platform (VSP) from Hitachi Data Systems-Setting New Levels of Excellence, Josh Krischer & Associates GmbH (2010). 3) 高田正法,下薗紀夫,藤本和久,坂下悠貴,藤林昭,細谷睦: スケーラブルストレージシステムにおけるアクセス要求振り分け 方式,電子情報通信学会技術研究報告. CPSY,コンピュータシス テム ,pp.25-30 (2013) 4) 早水悠登,合田和生,中野美由紀,喜連川優:オンライントラ ンザクション処理における高速フラッシュストレージの性能活用 に関する実験的考察,情報処理学会第 74 回全国大会,1N-5 (2012) 5) Apache Hadoop, https://hadoop.apache.org/ 6) エンタープライズ SSD インターフェイスの比較, http://www.seagate.com/files/www-content/product-content/_cross-prod uct/ja/docs/enterprise-interface-comparisons-tp625-1-1203jp.pdf. ⓒ2015 Information Processing Society of Japan. 6.

(7)

図  1  ストレージシステム概要  1.2  ストレージシステムへの I/O 種別と本研究の目的  ストレージシステムへの I/O は,ランダムアクセスとシ ーケンシャルアクセスの 2 つに分けることができる.    ランダムアクセス:データの転送長が小さく,ホス トコンピュータがアクセスするアドレスが非連続 であるアクセスパターンのこと    シーケンシャルアクセス:データの転送長が大きく, ホストコンピュータがアクセスするアドレスが連 続であるアクセスパターンのこと  こ れ ま で , ス ト
図  3  DMA によるデータ転送(競合ありの場合と競合なし の場合との比較)  が課題である.  4.  データ転送経路制御方式  4.1  転送経路制御方式の制約  記憶媒体-キャッシュメモリ間のデータ転送経路制御方 式は,キャッシュメモリの負荷分散や交換・増設に対応す るため,記憶媒体から任意のキャッシュメモリへ転送可能 なものにしなければならない.以後,この制約を守った経 路制御方式を 4 つ挙げる.    4.2  経路制御方式 1:キャッシュメモリ-DMA エンジン間 経路切替方式    図
図  5  DMA エンジン-バッファメモリ間経路切替方式  (片側の記憶媒体インタフェース内経路線省略)  る.  (1)  プロトコルチップが,記憶媒体からバッファメモリ へデータを転送する.このとき,プロトコルチップは 同一記憶媒体インタフェース内で,転送先のキャッシ ュメモリと同一の ID が割り振られているバッファメ モリへ転送する  (2) DMA エンジンが,バッファメモリからキャッシュメ モリへデータを転送する.このとき,同一記憶媒体イ ンタフェース内に関して,データ転送先のキャッシュ メモ
図  7  記憶媒体インタフェース切替方式  図  8  キャッシュメモリ-DMA エンジン間経路切替方式  における経路競合  表  1  机上評価まとめ(競合なし:○,競合あり:×) 方式1 方式2 方式3 方式 4 DMAエ ン ジン-キャッシュメモリ間競合 × ○ ○ ○ DMAエ ン ジン-バッファメモリ間競合 ○ × ○ ○ バッファメモリ-プロトコルチップ間競合 ○ ○ × ○ 図  9  各方式の実測結果(※方式1からの相対値) 5.2 実測評価   図  2 で示されるハードウェアアーキテ

参照

関連したドキュメント

国民の「知る自由」を保障し、

About the optimal control, Saint Jean Paulin & Zoubairi [12] studied the problem of a mixture of two fluids periodically distributed one in the other... Throughout this proof,

2006 Duval-Leroy Millésime Prestige Blanc de Blancs Grand Cru 34,200 デュヴァル=ルロワ ミレジメ・プレスティージュ ブラン・ド・ブラン グラン・クリュ.

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」

Under small data assumption, we prove the existence and uniqueness of the weak solution to the corresponding Navier-Stokes system with pressure boundary condition.. The proof is

(Non periodic and nonzero mean breather solutions of mKdV were already known, see [3, 5].) By periodic breather we refer to the object in Definition 1.1, that is, any solution that

[r]

運転時の異常な過渡変化及び設計基準事故時に必要な操作は,中央制御室にて実施可