• 検索結果がありません。

動作HDD数制御を用いた仮想化環境におけるデータ再配置によるストレージ省電力化

N/A
N/A
Protected

Academic year: 2021

シェア "動作HDD数制御を用いた仮想化環境におけるデータ再配置によるストレージ省電力化"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. 動作 HDD 数制御を用いた仮想化環境における データ再配置によるストレージ省電力化 若色匠†1. 谷貝俊介†2. 山口実靖†3. 近年,情報技術が普及しデータセンター等において多数のサーバ計算機が稼動するようになった.これに伴い,サー バ計算機の消費電力の増加が問題となっている[1].この問題に対する解決策の一つとして,アプリケーションの動作 情報を用いてディスク上のデータレイアウトを変更し,HDD の消費電力を削減する手法がある.本研究では当該手法 の仮想化環境下への適用について考察する.具体的には,仮想化環境にて TPC-E を実行する環境において,各テー ブルデータへのアクセス間隔を調査し,HDD の I/O 処理の能力を超えない範囲でアクセス間隔の長いテーブルデータ を特定の HDD にまとめ,その HDD 停止時間の拡大を図る.そして,HDD 使用率を考慮した配置手法を提案し,性 能評価によりその有用性を示す.. 1. はじめに データセンターにて膨大な数の計算機が稼働しており,. Hot Data (1). Cold Data (1). Hot Data (2). HDD1. 多くの電力が消費されている.ストレージ機器はその中で. Cold Data(2). HDD2. HDD1,HDD2ともにロングイン ターバルを確保できない. も消費電力が大きい装置の一つであり,この電力消費の削 減は重要な課題の一つとなっている.この問題に対する解 決策の一つとして,アプリケーションの動作情報を用いて ディスク上のデータレイアウトを変更し,HDD の消費電力 を削減する手法がある[2]. 本研究では仮想化環境における HDD の消費電力の削減 に着目し,HDD の使用率を考慮したデータ配置手法を提案. Hot Data (1). Hot Data (2). Cold Data (1). HDD1. 図 1. Cold Data (2). HDD2にて十分なロングイン ターバルを確保できる. HDD2. 応用情報を用いたデータレイアウトの変更. には,仮想化環境下での TPC-E の各テーブルデータから HDD へのアクセス頻度を調査する.そして,長いアクセス 間隔が多く,短いアクセス間隔の少ないテーブルデータを 1 つの HDD にまとめ,HDD 停止時間がどの程度確保でき るか,スループットの低下はどの程度起こるか調査する.. HDD消費電力. する.そして,性能評価によりその有効性を示す.具体的. HDD停止時間. また HDD において停止時間を設定し,停止によるスルー. 時間. プットの低下はどの程度か,停止によって生じる消費電力 減少の程度を調査する.. HDD消費電力の 時間変化. 図 2. 停止と再起動時の電力の変化. 2. 既存研究 ストレージ省電力化手法の一つに,応用(アプリケーショ ン)情報を用いたデータレイアウト変更手法[1]がある.当 該手法では,データ(テーブル)のアクセス頻度を考慮しデ ィスクへのデータ配置を制御することによりディスクの省 電力機能を適用できるだけの I/O 発行間隔を生成している. アクセス数が多いデータを Hot データ,アクセス数が少な いデータを Cold データと呼び,この Cold データを 1 つの HDD に集中させることでアクセス間隔の拡大させ省電力 化を図っている [3].図 1 に応用情報を用いたデータレイ †1 工学院大学大学院工学研究科電気・電子工学専攻 Electrical Engineering and Electronics, Kogakuin University Graduate School †2 工学院大学大学院工学研究科電気・電子工学専攻 Electrical Engineering and Electronics, Kogakuin University Graduate School †3 工学院大学工学部情報通信工学科 Department of information and Communications Engineering, Kogakuin University. ⓒ 2015 Information Processing Society of Japan. アウトの変更法について示す. 図 2 にてストレージの停止と再起動時の電力の変化につ いて示す.ストレージ停止により削減できる電力量(A)とス トレージ再稼働により失われる電力量 (B)が等しくなる (A=B)ストレージ停止時間をブレークイーブンタイムと呼 び,それより長くなる HDD アクセス間隔(A>B)をロングイ ンターバルと呼び,上記手法ではロングインターバルを作 り出すことで,省電力化を実現している. ブレイクイーブンタイムは使用した HDD により異なり, 文献[3,4]ではそれぞれブレークイーブンタイムが 25 秒, 10 秒と定義されている.. 1.

(2) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. 1000000. 426192 317239 155711 73394 100000 67729 10065 7194 4030 4428 2837 2187 2192 1462. アクセス数[回数]. 10000. 699 641. 1000. 412 330 252 215. 100. 161. 96. 70. 44 18 17 17 9. 10. 2 1 1. テーブル名. 図3. 各テーブルデータへのアクセス数. 3. 基本調査 3.1 アクセス頻度調査 基本調査として 1 台の物理計算機上に 1 台の VM を稼働 させ,VM 上でベンチマークソフト tpcemysql を 2 時間実行 させ,各テーブルデータへのアクセス数とアクセス頻度を 調査した.調査は表 1 の環境にて行った.アクセス頻度は Linux カーネルの SCSI サブシステム内で観察した.よって ページキャッシュなどによりストレージアクセス(および それに伴う電力消費)を発生させないアクセスは計測に含 まれていない.ただし,データサイズの合計はゲスト OS メモリの約 16 倍であり,ページキャッシュはほぼヒットし ないようになっている. 各テーブルデータへのアクセス数を図 3 に示す.図 3 よ りテーブルデータへのアクセス数には大きな偏りがあり,. 表1. 提案手法評価の測定環境. CPU MEMORY HDD(OS用) HDD(データ用). Intel Celeron CPU G1101 2.27[GHz] 4[GB] VB0160EAVEQ 160[GB] WD5000AZRX-0 500[GB]. OS(共通) カーネル(共通) ホストOSメモリ ゲストOSメモリ 仮想HDD 合計データサイズ. CentOS6.3 x86_64 2.6.32.57 2[GB] 512[MB] 100[GB] 7.8[GB]. ⓒ 2015 Information Processing Society of Japan. 表2. 各テーブルデータのアクセス間隔. テーブル名\アクセス間隔[秒] trade daily_market trade_history cash_transaction settlement holding_summary holding news_item watch_item holding_history customer_account financial zip_code last_trade customer account_permission trade_request customer_taxrate broker company security taxrate company_competitor watch_list industry address exchange sector. 0~10 10~30 30~100 100~ 426191 0 0 0 317238 0 0 0 155710 0 0 0 73393 0 0 0 67728 0 0 0 9978 86 0 0 6973 220 0 0 4372 55 0 0 3974 55 0 0 2570 233 33 0 2031 93 67 0 1980 203 3 0 1202 246 13 0 464 134 100 0 397 185 58 0 209 116 86 0 87 152 90 0 180 17 26 28 1 105 108 0 68 20 49 23 31 9 29 26 16 4 16 33 1 1 12 29 4 1 1 11 0 0 0 16 2 2 3 9 0 0 0 8 1 0 0 0. 2.

(3) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. trade などの多いものでは 40 万以上,exchange などの少な. 20. いものでは 10 回以下であり 1 度もアクセスの無い charge. 18. などのテーブルデータもあった.. 16. 14. はアクセス数が 1 以下のテーブルはアクセス間隔が存在し. 12. ないため省いてある).表 2 より,30 秒以下のアクセス間 隔が 10 回以下である company_competitor よりアクセス数. 電力[W]. 各テーブルデータへのアクセス頻度を表 2 に示す(表 2 に. 10 8 6. の少ないテーブルは VM 数を増やしたとしても短い間隔で. 4. のアクセスが増えないと考えられるので,ロングインター. 2. バルを確保できると考えられる.また,100 秒以上の間隔. 0. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19. が比較的大きく見られ,30 秒以下の回数が少ない company, security,taxrate もロングインターバルを得られるのではな い か と 考 え ら れ る . 逆 に , 10 秒 以 下 の 間 隔 し か な い watch_item より上のテーブルデータは短いアクセスが多く ロングインターバルが存在しないため,これらのテーブル が 1 つでも存在すると HDD の停止時間を得ることが不可. 時間[s]. 図4 Table 1. スピンダウンからスピンアップまでの推移 Table 2. Table 1. VM1. VM2 HDD1. 能であることが分かる.また,30 秒以上の間隔がある broker. ーバルを得ることは難しいと考えられる 3.2 HDD の I/O 処理性能(Imax)の調査. VM2 HDD2. 配置手法 A. や trade_request より上のテーブルは 100 秒以上の間隔が無 く 30 秒以下のアクセスも多く見られるため,ロングインタ. VM1. Table 2. Table 1. Table 2. Table 1. VM1. VM2. VM1. HDD1. 3.1 の環境において HDD の 1 秒あたりの I/O 処理性能で. Table 2. VM2 HDD2. 配置手法 B. ある Imax(SCSI 層への要求量/測定時間)を調査した.測定 図5. した結果,本実験で用いる HDD の Imax は 329[回数/sec]. テーブル配置手法. であることがわかった. 3.3 ロングインターバルの調査. ある.図 4 より,5 秒の位置でスピンダウンが行われたこ. HDD をスピンダウンすると一時的に消費電力を下げる. とで消費電力が半分以下になったが,11 秒の位置でのスピ. ことができるが,スピンアップ時に一定の大きな電力消費. ンアップにより一時的に倍以上の消費電力が発生している. が発生する.スピンダウン時に減少した電力がスピンアッ. ことがわかる.スピンアップの際に生じる消費電力は一定. プ時に増加した電力より多くなる時間がロングインターバ. であり,この HDD では 8 秒以上のアクセス間隔がロング. ルである.表 3 の環境でロングインターバルの調査を行っ. インターバルとなる.. た.ただし,“WD5000AZRX-0”は, hdparm コマンドに よるスピンダウンの設定をすることができなかったため. HDD に“VB0160EAVEQ”を用いて行った. 図 4 は今回使用した HDD のスピンダウンからスピンア ップまでの電力をワットモニターを用いて調査した結果で. 4. VM イメージファイル配置と HDD 使用率 複数の HDD に複数の VM のファイルを配置する場合, 特定の VM のファイル群を複数の HDD に分散配置すると, I/O バウンドの処理であっても I/O 使用率の低下をまねき アプリケーション性能が低下することがある.換言すると,. 表3. アクセス頻度調査の測定環境. CPU MEMORY HDD(OS用) HDD(データ用). Intel Celeron CPU G1101 2.27[GHz] 12[GB] VB0160EAVEQ 160[GB] WD5000AZRX-0 500[GB]. OS(共通) カーネル(共通) ホストOSメモリ ゲストOSメモリ 仮想HDD 合計データサイズ. CentOS6.3 x86_64 2.6.32.57 2[GB] 3[GB] 30[GB] 6.5[GB]. ⓒ 2015 Information Processing Society of Japan. ある VM のファイル群を特定の HDD に全て格納すると, (その VM の処理が I/O バウンドであれば)その HDD へのア クセス要求は常に発行され,その HDD の使用率は常に高 くなる. TPC-E の テーブルファイルの配置を図 5 に示す.図内 の VM 上の四角の Table1 と Table2 は TPC-E のテーブル群 1 とテーブル群 2 である.配置手法 B では HDD へのアク セス数がなるべく均等になるようにテーブル群を分けてい る.表 1 の環境において図 5 の配置手法 A の様に(1 つの VM のテーブルを 1 つの HDD に集中)配置した場合と,配 置手法 B のように(1 つの VM のテーブルを複数の HDD に. 3.

(4) 100 90 80 70 60 50 40 30 20 10 0. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. 7. HDD1 HDD2. 0. スループット[Trans/sec]. ディスク使用率 [%util]. 情報処理学会研究報告 IPSJ SIG Technical Report. vm1. 6. vm2. 5. 4 3 2 1 0. 100 200 300 400 500 600 700 800 900 1000. 配置手法A. 配置手法B. ディスク使用率 [%util]. 配置手法 A 図7. 100 90 80 70 60 50 40 30 20 10 0. Table 1. Table 2. スループット. Table 3. VM1. HDD1. VM2. VM3. HDD1. HDD2 Table 1 VM1. Table 2. Table 3. VM2. VM3. HDD2. 0. 100 200 300 400 500 600 700 800 900 1000. Table 1 VM1. 配置手法 B 図6. VM2. Table 2. Table 3. VM3. HDD3. ディスク使用率. 再配置前 ファイルを分散)配置した場合の I/O 使用率と TPC-E 性能を. Table 1. 図 6,図 7 に示す.. Table 1. Table 2 VM1. VM2. 図 6 より,配置手法 A では常に I/O 使用率が高いが,配 置手法 B では I/O 使用率が低下することがあることが分か. Table 1. る.配置手法 A では,I/O バウンドであるアプリケーショ. VM1. ンが常にそれぞれの HDD に I/O 要求を発行し続け,結果と して HDD の使用率が低下することがない.これに対して. 作られ,またアクセス頻度もテーブルによって大きく異な. VM3. Table 3. VM2. VM3. HDD3. 再配置後手法 A. 状態(または使用率が低い状態)の少ない配置手法 A の方が. 前述のように TPC-E ではデータベーステーブルが複数. VM2. Table 3. VM1. 態(または使用率が低い状態)となる.図 7 より,アイドル. 5.1 再配置手法. Table 2. Table 3. て I/O 要求を発行することでもう片方の HDD がアイドル状. 5. データベーステーブル再配置手法. Table 2. HDD2. 配置手法 B では,両 VM が偶然同時に同一の HDD に対し. スループットが優れていることがわかる.. VM3. HDD1. Table 1. Table 1 VM1. Table 1 VM2. VM3. HDD1 Table 2. Table 2. Table 2. VM1. VM2. VM3. HDD2. り,ロングインターバルの存在するテーブルも複数存在す Table 3. る.本研究ではロングインターバルのあるテーブルを 1 つ の HDD にまとめることによりその HDD のアクセス間隔を. VM1. VM2. VM3. HDD3. 拡大し,HDD のロングインターバルを確保することにより. 再配置後手法 B. 停止による省電力化を実現する. 図8. ⓒ 2015 Information Processing Society of Japan. Table 3. Table 3. テーブル配置手法. 4.

(5) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. 30000. スループット [Trans/sec]. 4 3.5. 3 再配置前. 2.5 2. 再配置後 (配置A). 1.5. 再配置後 (配置B). 1 0.5. 停止によって減少する累計電力. 4.5. 25000 20000 15000 10000 5000 0. 0. 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100. vm1. 図9. vm2. vm3. 平均. 再配置前後のスループット. 停止までのアイドル時間. 図 10. 停止によって減少する累計電力と アイドル時間の関係図. 5.2 性能評価 提案手法の有効性を確認するための準備調査として,性 能測定を表 3 の環境にて行った.表 1 と比べてメモリを 3[GB]に増やし,合計のデータサイズを 1[GB]ほど減らした. 表 3 の設定で 1VM での秒間の I/O 処理性能(IOPS)を測定し た.その結果,IOPS は 216[回数/sec]となった. 次に提案手法の評価を行うため,1 台の物理計算機上に 3 台の VM を稼働させ,それぞれの VM 上でベンチマーク ソフト tpcemysql を実行し,テーブルデータ移動前後の各. ルが得られると考えられる図 3 の company_competitor 以下 のテーブルデータを移動し測定を行った. ロングインターバルのあるテーブルデータを配置した HDD における移動前後のアクセス間隔の発生頻度を表 4 に示す.表 4 より,移動前はロングインターバルは 1 回も 存在しなく,停止できる時間は無かった.しかし,移動後 はロングインターバルのある表のみを集めたため HDD3 の アクセス頻度が千分の一ほどに減少し,120 秒以上の間隔. VM のスループットとロングインターバルのあるテーブル. も多く得ることができた.そのため,HDD のスピンダウン. データを集約した HDD のアクセス間隔を調査した.また,. 設定により省電力化ができると考えられる.. ロ ン グ イ ン タ ー バ ルの あ るテ ー ブ ル デ ー タ を 集約 し た HDD にスピンダウン時間を設定し停止した場合のスルー プットと消費電力を調査した. 実験環境には物理 HDD が 4 台あり,1 台は OS のシステ ムファイルを格納し,残りの 3 台には TPC-E のテーブルデ ータを配置する.TPC-E の テーブルファイルの配置を図 8 に示す.図 8 上の赤い Table はロングインターバルの無い データ,青い Table はロングインターバルのあるデータで ある.図より,再配置によりロングインターバルの無いテ ーブルを配置する HDD 数(2 個)が VM 数(3 個)を下回るの で,配置手法 A では 1 つの VM のロングインターバルの無 いテーブルだけをアクセスが均等になるように 2 つの HDD に配置する.準備調査で IOPS が Imax の約 2/3 である ため,3 台の VM を 2 台の HDD に配置しても性能劣化は 起きにくいと考えられる.今回は確実にロングインターバ. 各 VM 上の tpcemysql のスループットの結果を図 9 に示 す.図 9 より,性能劣化は配置手法 A では平均約 6%であ り,配置手法 B では平均約 14%である.これより配置手法 A の方が少ない性能劣化で HDD 停止時間を確保できてい ることがわかる. 再稼働によって増加する消費電力は一定であるため,表 4 の結果を用いて停止によって減少する累計消費電力と停 止までのアイドル時間の関係を調査した.“アクセス間隔” が“停止までのアイドル時間”より大きいときに“アクセ ス間隔”-“停止までのアイドル時間”だけ HDD が停止 すると仮定し,停止により減少する累計電力は, “停止によ って減少する電力の合計”-“再稼働によって増加する電 力合計”の差によって求めた.Linux の hdparm は 5 秒間隔 でアイドル時間を設定するため,”停止までのアイドル時間” は 5 秒間隔で計算している.計算結果を図 10 に示す.図 10 より,アイドル時間を短くすればするほど削減される消. 表4. アクセス間隔の測定結果. アクセス間隔 [sec] 再配置前 ~120 0 120~60 0 60~30 0 30~10 0 10~1 209 1~0 474766. アクセス回数 再配置後 (配置A) 再配置後 (配置B) 19 19 15 20 9 7 1 0 43 46 357 328. ⓒ 2015 Information Processing Society of Japan. 費電力が大きくなることがわかる. ロングインターバルのあるテーブルデータを配置した HDD における配置手法 A のときのスループットとスピン ダウン時間を設定したときの平均消費電力,10 分毎の平均 消費電力推移の結果を図 11 と図 12,図 13 に示す. 図 11 より,HDD3 にはロングインターバルのあるテーブ ルのみを配置しているため,HDD 停止によるスループット. 5.

(6) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2015-DPS-162 No.1 Vol.2015-CSEC-68 No.1 2015/3/5. の低下はほどんど見られないことがわかる. 4.5. 図 12 より,HDD 停止によって消費電力が低下しており,. 4. スループット [Trans/sec]. 図 10 からもわかるように停止設定時間が短いほど平均の 消費電力が短くなっていることがわかる.スピンダウン時 間設定後は多くの停止時間が確保されているため,停止前 と比べて約半分ほど消費電力を下げることができている. 図 13 より,スピンダウン設定時間が 10 秒のときや 30 秒のときでは,停止されてないときよりも 10 分の平均電力. 停止無し. 3.5 3. 5秒間のアイドル時間 で停止. 2.5. 10秒間のアイドル時 間で停止. 2 1.5. 30秒間のアイドル時 間で停止. 1. 60秒間のアイドル時 間で停止. 0.5. が大きくなっているときがあることがわかる.これは HDD. 0. が停止後すぐにアクセスが来たためにロングインターバル が稼げなかったため,消費電力が逆に増えてしまった現象 が発生している.また,停止時間 60 秒のときでは 10 分間 8. が半数近く見らる.これは,スピンダウン時間前にアクセ. 7. スが来てしまったために停止ができなくなってしまい,平. 6. 均の消費電力が上がってしまっているからである.. 6. まとめ 本稿では,アプリケーションの動作情報を用いてディス ク上のデータレイアウトを変更し,HDD の消費電力を削減 する手法を紹介した.そして,その手法を仮想化環境に適. 秒間の平均消費電力[W]. の平均消費電力が停止時間 5 秒よりも大きくなってるとき. vm3. 平均. vm1. vm2. 図 11. 停止時間によるスループット. 5 4. 3 2 1 0. 用し,HDD の使用率を考慮したデータ配置手法を提案し, 評価結果を示した.結果から,小さい性能劣化でアクセス 間隔の拡大により大幅な省電力化ができることがわかった. またスピンダウンの設定時間によってスループットに大き. 図 12. 停止時間による平均消費電力. な差は見られなかったが,設定時間を適切に設定しないと 消費電力が増えてしまうことがわかった.. 20. 今後は,メモリの使用について調査し,その効果の検証. 謝辞 本研究は JSPS 科研費 24300034, 25280022, 26730040 の助成 を受けたものである.. 秒間の平均消費電力[W]. を行っていく予定である.. 停止無し. 18. 5秒間のアイドル時間で停止. 16. 10秒間のアイドル時間で停止. 14. 30秒間のアイドル時間で停止. 12. 60秒間のアイドル時間で停止. 10. 参考文献. 8. 6 4 2. [1] GIPC Survey and Estimation Committee Report FY2009. 0. (Summary),http://www.greenit-pc.jp/activity/reporting. 0. 2. 4. /100707/index.html,2009 [2]. Norifumi. Nishikawa,. Kitsuregawa,“Energy. 6. 8. 10. 10分毎の推移. Miyuki. Efficient. Nakano Storage. and. Masaru. 図 13. Management. 停止設定による電力の推移. Cooperated with Large Data Intensive Applications,” 28th IEEE International Conference on Data Engineering (IEEE ICDE. [4]西川. 2012),. ョン処理の I/O 挙動特性を利用したディスクの実行時省電. [3] Norifumi. Nisikawa , Miyuki. Kitsuregawa, ” Energy. Efficient. 美由紀,喜連川 優” アプリケーシ. Nakano. and. Masaru. 力手法とその評価:オンライントランザクション処理にお. Storage. Management. ける省電力効果” 電子情報通信学会論文誌, J95-D, 3, 1-13. Cooperated wuth Large Data Intensive Applications,” 28th. 記史,中野. (2012.03). IEEE International Conference on Data Engineering. (IEEE ICDE 2012),. ⓒ 2015 Information Processing Society of Japan. 6.

(7)

参照

関連したドキュメント

ques are usufu1 to reveal the micromorphology, texture, growing processes, crystalinity, chemical bond and the distribution of carbon materials.. In this article usefu1

算処理の効率化のliM点において従来よりも優れたモデリング手法について提案した.lMil9f

地球温暖化対策報告書制度 における 再エネ利用評価

最近の電装工事における作業環境は、電気機器及び電線布設量の増加により複雑化して

Abstract:  Conventional  practice  in  recording  information  on  archaeological  remains  is  to  take 

小・中学校における環境教育を通して、子供 たちに省エネなど環境に配慮した行動の実践 をさせることにより、CO 2

小学校における環境教育の中で、子供たちに家庭 における省エネなど環境に配慮した行動の実践を させることにより、CO 2

原子力規制委員会 設置法の一部の施 行に伴う変更(新 規制基準の施行に 伴う変更). 実用発電用原子炉 の設置,運転等に