• 検索結果がありません。

HPC向け省電力階層ストレージにおける性能スケーラビリティの検証

N/A
N/A
Protected

Academic year: 2021

シェア "HPC向け省電力階層ストレージにおける性能スケーラビリティの検証"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 74 回全国大会. 4A-3. HPC 向け省電力階層ストレージにおける 性能スケーラビリティの検証 赤池. 洋俊†. 藤本. 和久‡. 黒川. 大樹‡. (株)日立製作所 横浜研究所† 1.. はじめに. 近年,IT 機器の消費電力は無視できないほど増加して おり,大きな問題となっている.ストレージシステムは その中でも多くの電力を消費するシステムの一つである. 特にスーパーコンピュータと接続するストレージシステ ムには大量のデータを高速に入出力することを目的とし て高い性能が要求される.そのため,高性能と消費電力 削減を両立するストレージアーキテクチャと,その管理 方式が求められている.. 2.. 健司‡. 三浦. 村岡. 裕明‡. 東北大学電気通信研究所‡ ある.しかし,ジョブ実行の遅延操作により,スーパー コンピュータの CPU がアイドル状態となるため,利用率 が低下してしまう問題があった. 計算機管理サーバ スーパーコンピューター スーパーコンピューター スーパーコンピュータ JOB. JOB JOB JOB. LAN ファイルサーバ群 ファイルサーバ dir1. dir2 ファイルサーバ SAN(Storage Area Network). オンライン ストレージ (OL). 省電力階層ストレージ. この背景の下で,図 1 に示す様に高性能なオンライン ストレージ(以下,OL)と大容量のニアラインストレージ (以下,NL)の階層構成においてアクセス予知(図 1 中(1)) に基づくデータ配置(図 1 中(4))とディスク電源の ON/ OFF 制御(図 1 中(3)(2))を行う低消費電力化方式を提案 した.本方式では,ジョブがキュー内で待機している間 に,ジョブのアクセス先データを NL から高速な OL ディ スクにコピー(データ配置)することで,ジョブはジョブ 実行時に高速な OL 上のデータにアクセスできる.提案方 式を試作機に実装し,実際に消費電力を測定することで 省電力効果を検証した.その結果,階層ストレージにお いて使用頻度に基づくデータ管理とディスクのスピンダ ウン制御を行う従来方式と比較して,提案方式はシステ ム容量 1024TB の場合の試算で性能を維持しながら消費電 力を 50%以上削減する見込みを得た[1]. スーパーコンピュータとストレージの間には,一般的 にファイルサーバが複数設置されており,高速なファイ ルサービスを提供している. OL と NL からなる階層スト レージにファイルサーバを含めた全体を省電力階層スト レージと呼ぶ.試作機に設置のファイルサーバは 2 台で ある.この複数ファイルサーバ間の負荷分散手法として, 我々はジョブスケジューラ連携負荷分散を提案している [2].ジョブスケジューラ連携負荷分散はジョブ情報・ス ケジューラ情報とデータ配置情報に基づきファイルサー バの負荷を算出し(図 2 中(i)),アクセス先データのファ イルサービスを負荷の小さいファイルサーバに移動する (図 2 中(ii)).移動完了までジョブ実行を遅延させ(図 2 中(iii)),移動完了後にジョブは実行開始する(図 2 中 (iv)).結果としてジョブは負荷の小さいファイルサーバ にアクセスする (図 2 中(v)).本手法はジョブスケジュ ーラとの連携でジョブ実行前に予め負荷を分散でき,ジ ョブの単位でファイルサービス性能を向上できる特徴が. Verification of Performance and Scalability of an Energyefficient High Speed Tiered-Storage System with Proactive Migration for HPC Systems † Hirotoshi Akaike, Yokohama Laboratory, Hitachi, Ltd. ‡ Kazuhisa Fujimoto, Hiroki Kurokawa, Kenji Miura, Hiroaki Muraoka, RIEC, Tohoku University. 1-43. 制御プログラム Vol. 1 Vol. 2. ニアライン ストレージ (NL) Vol. 4 電源 OFF. ・ジョブ情報 ・スケジューラ情報 ストレージ管理サーバ. SAN. Vol. 0. ジョブスケジューラ. (4) Vol. 5 Vol. 1 Vol. 2. (3) アクティブ. ・ジョブスケジューラ 連携負荷分散 ・ジョブ実⾏遅延操作 (1) ・アクセス予知 ・データ配置 ・電源制御. Vol. 3 電源 (2) OFF. 図 1 省電力階層ストレージの概要 計算機管理サーバ. JOB 1. スーパーコンピュータ スーパーコンピューター スーパーコンピューター. JOB 2. JOB 3. (v). LAN. ジョブスケジューラ. JOB JOB JOB 3 4 5. (iv). ・ジョブ情報. (iii). ストレージ管理サーバ dir1 FS* 1. dir2 FS  2 FS3. 負荷⾼ ファイルサーバ ノード1. 負荷 分散. dir3 FS  3. (ii) ファイルサーバ ノード2. ファイルサーバ群. 制御プログラム ・ジョブスケジューラ 連携負荷分散 FS* 移動. (i) 負荷 算出. ・ジョブ実⾏遅延操作. * FS : ファイルサービス. ・データ配置情報. ・アクセス予知 ・データ配置 ・電源制御. 図 2 ジョブスケジューラ連携負荷分散の動作. 3.. 負荷分散アルゴリズムの改善. 従来のアルゴリズムを図 3(A)に示す.従来のアルゴリ ズムでは,ジョブ実行開始の直前(時刻 t2)にファイルサ ーバにアクセスしている実行中ジョブの数(時刻 t2 負荷 算出対象)を負荷として計算し,負荷の小さいファイルサ ーバにファイルサービスを移動する負荷分散処理を行っ ていた.処理が完了するまでは,ジョブ実行の遅延操作 によりジョブはキュー内で待機状態となるため,負荷分 散の開始(時刻 t2)から終了(時刻 t3)まで CPU がアイド ル状態となり,利用率の低下が発生する.負荷分散処理 の所要時間は 2 分程度である.表 1 の条件で実験を行っ たところ,利用率の低下は 2%であった.スーパーコンピ ュータの CPU 数が 1024 個の場合,これは 20 個の CPU が アイドルすることに相当し,無視できない大きさである. そこで,利用率低下を防止する新しい負荷分散アルゴ. Copyright 2012 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 74 回全国大会. (A) 従来のアルゴリズム CPU キュー. 17 18 19 #. 16. 利⽤率低下. 時刻 t1. 時刻 t2. 負荷分散終了 ・・・. J. 16. 時刻 t3’. ・・・. J. ・ ・ ・. ・ ・ ・. 16. 18 19. 16 17 2. 17 時刻 t4’. 18 19. 表 2 実験結果. 負荷分散開始. 18 19. ・・・. J. 負荷分散終了 ・・・. なし 0.91. o 従来アルゴリズム. J. 16. 図 3 アルゴリズムの動作例 リズムを提案する.提案のアルゴリズムは,実行開始直 前のジョブではなく,先頭から k 番目(系内数 k)のジョ ブに対して負荷分散処理を行う.提案のアルゴリズムの 動作例を図 3(B)に示す.例では k=2 の場合を示している. 時刻 t3’においてジョブ 19 が先頭から 2 番目の位置に 到達した.この時,ファイルサーバにアクセスする実行 中ジョブの数とキューの先頭から k-1 番目までのジョブ の数の合計(時刻 t3’負荷算出対象)を負荷の推定値とし て計算し,負荷の小さいファイルサーバにファイルサー ビスを移動する負荷分散処理を行う.ジョブ 19 の実行 開始までに負荷分散が終了(時刻 t4’)すれば,ジョブ実 行の遅延操作の必要はなく,利用率の低下は発生しない. 従来アルゴリズムではジョブ実行開始の直前に負荷分 散処理を行うので,実行中ジョブの最新の負荷を計算す ることで最適な負荷分散を実行することができる.しか し,提案アルゴリズムでは利用率の低下を防止するため に事前に負荷分散処理を行うので,負荷を推定して計算 する必要があり,誤差により適切に負荷が分散できない 場合がある.特に,スーパーコンピュータの規模が大き く(すなわち最大のジョブ実行数が大きい),ジョブの実 行開始頻度が高い場合には,利用率の低下を防止するた めに系内数 k を大きく設定する必要があり,負荷の推定 の誤差が大きくなってしまう.そこで,スーパーコンピ ュータの規模を拡大した場合の転送速度を評価すること で,負荷分散の効果を検証する.. 4.. 転送速度の評価結果 負荷分散 従来アルゴリズム 提案アルゴリズム 転送速度 (⽐率) 1.0 0.99. 負荷算出対象. 18 19. 設定 約100時間 (1000ジョブ投⼊) スーパーコンピュータは同時に最⼤16ジョブを実⾏ 平均投⼊間隔 = 1 job/4 (min) (超アーラン分布からランダムにサンプリング) 平均実⾏時間 = 60 (min)/1 job (超アーラン分布からランダムにサンプリング). J. ・・・. 16. ・ ・ ・. ・ ・ ・. 17 18 19. J. :負荷分散完了後のジョブ. 17. 17 2. 実⾏開始. 時刻 t4. 17 18 19 #. ・・・. 実⾏開始. 2. J. ・・・. 負荷算出対象. 16. 2. 16. 実験条件 実験時間 ジョブ ジョブ 投⼊間隔 ジョブ 実⾏時間. キュー. 1 2. ・ ・ ・. ・ ・ ・. 17 18 19. 空 2 時刻 t3. J. :ジョブ. 表 1 実験条件. (B) 提案のアルゴリズム (例: 系内数k = 2). 負荷分散開始. 空 2 時刻 t2. ・・・. CPU. ・ ・ ・. 1 2. ・ ・ ・. 時刻 t1. 実⾏終了. スケーラビリティの検証. 提案のアルゴリズムを試作機に実装し,表 1 の条件で 実験を行った.ここで,利用率の低下は 0.1%以内を目標 とした.スーパーコンピュータの CPU 数が 1024 個の場合, これは約 1 個の CPU がアイドルすることに相当し,十分 小さい値である.表 1 の条件下では利用率の条件を満た す系内数 k は 2 以上であったので,k=2 と設定した.フ ァイル書き込み時の転送速度を測定した結果を表 2 に示 す.実験の結果,提案アルゴリズムは利用率の低下を防 止しながら,従来アルゴリズムと同等の転送速度を示し, 負荷分散なしの場合と比較して転送速度は 9%向上した. 次に,スーパーコンピュータの規模を拡大した場合の 転送速度をシミュレーションにより評価した.ファイル. 1-44. 転送速度 (⽐率). 実⾏終了. 8 7. 16. 6 5 4 3 2 1. 12. (利⽤率低下 > 2%). + 提案アルゴリズム. 14. (利⽤率低下 < 0.1%). * 負荷分散なし. 10 8 6 4 2. 22. 44. 66. 88. 10 12 10 12 ノード数. 14 14. 16 16. 図 4 シミュレーションによる転送速度の評価結果 サーバのノード数はスーパーコンピュータの規模に比例 して設定した.ただし,ノード数は試作機で用いている ファイルサーバの最大構成を上限として,最大 16 ノード とした.また,シミュレーションでは,スーパーコンピ ュータとファイルサーバ間ネットワークのデータ転送の 帯域不足など,転送速度のボトルネックが存在しない理 想的な場合を仮定した.系内数 k は,各ノード数におい て利用率の条件を満たすように設定した.評価結果を, 従来アルゴリズムでノード数=2 の転送速度を 1 とした時 の比率で図 4 に示す.その結果,規模を拡大しても従来 アルゴリズムと同等の転送速度を示し,ノード数ととも に比例する転送性能を示した.. 5.. まとめ. 省電力階層ストレージの性能向上のための負荷分散手 法であるジョブスケジューラ連携負荷分散について,ス ーパーコンピュータの利用率低下を防止する負荷分散ア ルゴリズムを提案した.実験の結果,提案のアルゴリズ ムは利用率の低下を防止しながら,転送速度を向上する ことを確認した.また,シミュレーションの結果,ノー ド数が 2~16 の範囲でノード数とともに比例する転送性 能を示し,性能スケーラビリティを確認した.今後は, 提案の負荷分散アルゴリズムを一般的なスケジューラ構 成である複数キューに対応させることが課題となる.. 謝辞 本研究は,文部科学省の委託研究「高機能・超低 消費電力スピンデバイス・ストレージ基盤技術の開発」 の成果の一部である. 参考文献 [1] 赤池洋俊,藤本和久,岡田尚也,三浦健司,村岡裕明, “HPC 向けストレージの省電力化を図るアクセス予知階層ストレージの予 知成功確率改善手法と効果の検証”, 第 72 回情報処理学会全国大 会, 2010 年 3 月. [2] 赤池洋俊,藤本和久,黒川大樹,三浦健司,村岡裕明, “HPC 向け省電力階層ストレージの性能向上のための負荷分散手法と効果 の検証”, 第 73 回情報処理学会全国大会, 2011 年 3 月.. Copyright 2012 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

層の項目 MaaS 提供にあたっての目的 データ連携を行う上でのルール MaaS に関連するプレイヤー ビジネスとしての MaaS MaaS

・ 化学設備等の改造等の作業にお ける設備の分解又は設備の内部 への立入りを関係請負人に行わせ

第1章 生物多様性とは 第2章 東京における生物多様性の現状と課題 第3章 東京の将来像 ( 案 ) 資料編第4章 将来像の実現に向けた

小学校における環境教育の中で、子供たちに家庭 における省エネなど環境に配慮した行動の実践を させることにより、CO 2

なお,今回の申請対象は D/G に接続する電気盤に対する HEAF 対策であるが,本資料では前回 の HEAF 対策(外部電源の給電時における非常用所内電源系統の電気盤に対する

SGTS の起動時刻と各シナリオの放出開始時刻に着目すると,DCH では SGTS 起動後に放出 が開始しているのに対して,大 LOCA(代替循環)では

大気中の気温の鉛直方向の変化を見ると、通常は地表面から上空に行くに従って気温