• 検索結果がありません。

White Paper EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の分散重複除外機能によるバックアップ処理の高速化 実機による検証結果の報告 要約 EMC Data Domain Boost for Symantec OpenStorage( 以下 DD

N/A
N/A
Protected

Academic year: 2021

シェア "White Paper EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の分散重複除外機能によるバックアップ処理の高速化 実機による検証結果の報告 要約 EMC Data Domain Boost for Symantec OpenStorage( 以下 DD"

Copied!
17
0
0

読み込み中.... (全文を見る)

全文

(1)

White Paper

要約

EMC Data Domain Boost for Symantec OpenStorage(以下 DD Boost)と Symantec NetBackup の組み合わせによる実機を用 意し、DD Boost の分散重複除外効果を検証結果による裏付 けをもって報告します。分散重複除外機能を導入することで、 バックアップ処理が高速化し、バックアップ時間を短縮され ますが、既存のバックアップ環境にどのような影響を与える かを紹介します。 2011 年 8 月

EMC DATA DOMAIN BOOST と

SYMANTEC NETBACKUP の分散重複除外機能

によるバックアップ処理の高速化

実機による検証結果の報告

(2)

Copyright © 2011 EMC Corporation. All Rights Reserved. EMC Corporation は、この資料に記載される情報が、発行 日時点で正確であるとみなしています。この情報は予告 なく変更されることがあります。 この資料に記載される情報は、「現状有姿」の条件で提 供されています。EMC Corporation は、この資料に記載 される情報に関する、どのような内容についても表明保 証条項を設けず、特に、商品性や特定の目的に対する適 応性に対する黙示の保証はいたしません。 この資料に記載される、いかなるEMC ソフトウェアの 使用、複製、頒布も、当該ソフトウェア・ライセンスが 必要です。 最新のEMC 製品名リストについては、 http://japan.emc.com/にある「EMC Corporation の商標」 を参照してください。

VMware、ESX、および VMware vCenter は、米国および その他の国におけるVMware, Inc.の登録商標または商標 です。他のすべての名称ならびに製品についての商標は、 それぞれの所有者の商標または登録商標です。

(3)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

目次

エグゼクティブ・サマリー ... 4 対象読者 ... 4 テスト内容 ... 5 環境説明 ... 6 結果 ... 8 1. 初回フル・バックアップにおける結果... 8 バックアップ・サーバについて ... 8 Data Domain について ... 9 2. 2回目のフル・バックアップにおける結果 ...10 バックアップ・サーバについて ...10 Data Domain について ...12 3. 3回目のフル・バックアップにおける結果 ...12 4. ディスク使用量 ...14 考察 ...15 結論 ...17

(4)

エグゼクティブ・サマリー

EMC Data Domain 重複除外バックアップ・ストレージと DD Boost ソフトウェアは Symantec 社のバックアップ・ソフトウェアである NetBackup 環境に簡単に導入する ことができます。この組み合わせによって、業界唯一である分散重複除外機能を実 現し、バックアップのパフォーマンス向上やバックアップ時間の短縮が期待できま す。 このホワイト・ペーパーでは、株式会社シマンテックにて実際に用意した環境で検 証を行った結果をもとに、分散重複除外機能がバックアップ環境にどのような効果 をもたらすことができるのかを、具体的な数値をもって説明します。そして、得ら れた結果から考察する有効な適用環境を紹介します。

なお、このホワイト・ペーパーを読むにあたり、あらかじめ「EMC Data Domain Boost for Symantec NetBackup OpenStorage プランニングのベスト・プラクティス」 (文書番号h7296-J)を参照いただき、DD Boost の概要を理解していただくことをお 勧めします。

対象読者

DD Boost による分散重複除外機能を検討している方、Data Domain 導入に携わるシス テム管理者の方、およびシステム・インテグレータの担当者の方にお勧めします。

(5)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

テスト内容

Hyper-V の仮想マシン8台を順次フル・バックアップ。3回のフル・バックアップを 行い、DD Boost の有効/無効を比較することで、その効果を確認しました。測定項目 としては、以下の値を計測しました。 バックアップ・サーバ

 Processor Information(_Total)\% Processor Time  Memory\Available Mbytes

 Network Interface(*)\Bytes Total/sec Data Domain

 system show stats (CPU busy, Disk Read/Write)

 ddboost show stats (Pre-comp Write, Post-comp Write, Network bytes)

バックアップ・サーバOS(Windows Server 2008R2)のネットワーク・パラメータは デフォルト値のままを使用しました。

(6)

環境説明

全体の構成は以下の通りです。

物理サーバ:Windows Server 2008R2 + Hyper-V サーバ 仮想マシン:Hyper-V 仮想マシン8台

バックアップ・サーバ:NetBackup/Windows Server 2008R2 バックアップ・ストレージ:Data Domain DD670 + 2x ES20-32TB

(7)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

ネットワーク:

ネットワーク構成は以下の通りです。

物理サーバ - バックアップ・サーバ間(パブリック LAN):10Gb Ethernet バックアップ・サーバ - Data Domain 間(バックアップ LAN):

2 x 1Gb Ethernet(DD Boost Advanced Load Balancing and Failover 機能を用いてインタ フェースを多重化)

(8)

結果

1. 初回フル・バックアップにおける結果

バックアップ・サーバについて

使用帯域に関する評価

Data Domain とのやり取りが行われるバックアップ LAN の有効帯域は 2Gbps であ るため、 DD Boost を無効にした場合には、その帯域上限がボトルネックとなりイ ンフラ全体の性能を押し下げているのがわかります。 一方、DD Boost を有効にした場合には、仮想マシン間での重複除外がバックアップ 時間の初期段階から効果を発揮した結果、バックアップ LAN における実際の転送 データ量が大幅に低減できており、特にバックアップ時間の後半部分は大きな効果 を発揮していることが確認できました。 ※それぞれのグラフの横軸は秒数を表しています。 バックアップ・サーバのCPU 使用率に関する評価 DD Boost を無効にした場合には、ネットワーク帯域がボトルネックとなるため CPU の負荷はそれほど上がりませんでした。 一方、有効にした場合には見かけのスループットが高く次々に重複除外処理が行わ れるため、結果としてCPU の負荷は上昇していることが確認されました。しかしな がら、その効果のおかげでバックアップ時間は短縮されていることが注目される点 となります。

Backup LAN使用状況 (Mbps)

0 500 1000 1500 2000 2500 1 18 35 52 69 86 103 120 137 154 171 188 205 222 239 256 273 290 307 324 341 358 375 392 409 426 443 460 477 494

(9)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の バックアップ・サーバのメモリ使用率(空きメモリ容量)に関する評価 バックアップ時間の後半において、DD Boost を有効にしたケースのほうが使用可能 な空きメモリ容量により余裕があることが確認できました。 Data Domain について CPU 使用率に関する評価

DD Boost が無効の場合には、それなりの CPU 負荷が Data Domain で確認されま した。 有効の場合にはバックアップLAN 上のトラフィックにある程度連動する形で、負荷 の増減があり、特にバックアップ時間の後半はCPU 負荷の大幅な低減を実現してい ます。

CPU使用率 (%)

0 5 10 15 20 25 30 35 1 18 35 52 69 86 103 120 137 154 171 188 205 222 239 256 273 290 307 324 341 358 375 392 409 426 443 460 477 494

Boost Enabled - 1st Boost Disabled - 1st

使用可能メモリ量 (MB)

28600 28800 29000 29200 29400 29600 29800 1 18 35 52 69 86 103 120 137 154 171 188 205 222 239 256 273 290 307 324 341 358 375 392 409 426 443 460 477 494

(10)

2. 2回目のフル・バックアップにおける結果 バックアップ・サーバについて 使用帯域に関する評価 DD Boost を有効にした場合には、バックアップ LAN 上へのデータ送信を表す山が 見られず、その効果が非常に大きく表れていることが確認できました。 無効にした場合は、初回フル・バックアップの無効時と同様に 2Gbps に近い値にお いてボトルネックが発生しています。

CPU 使用率 (%)

0 5 10 15 20 25 30 35 40 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500 520

Boost Enabled - 1st Boost Disabled - 1st

Backup LAN使用状況 (Mbps)

0 500 1000 1500 2000 2500 1 19 37 55 73 91 109 127 145 163 181 199 217 235 253 271 289 307 325 343 361 379 397 415 433 451 469 487 505

(11)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の CPU 使用率に関する評価 DD Boost の有効/無効のいずれの場合でも CPU 使用率の値そのものは大きな違いは 見られませんが、見かけのスループットが2回目のフル・バックアップの場合も高 いため、バックアップ時間が短縮化できていることが確認できました。 バックアップ・サーバのメモリ使用率(空きメモリ容量)に関する評価 初回フル・バックアップと同様に、バックアップ時間の後半において、DD Boost を 有効にしたケースのほうが使用可能な空きメモリ容量により余裕があることが確認 できました。

CPU使用率 (%)

0 5 10 15 20 25 30 1 19 37 55 73 91 109 127 145 163 181 199 217 235 253 271 289 307 325 343 361 379 397 415 433 451 469 487 505

Boost Enabled - 2nd Boost Disabled - 2nd

使用可能メモリ量 (MB)

28800 29000 29200 29400 29600 29800 1 19 37 55 73 91 109 127 145 163 181 199 217 235 253 271 289 307 325 343 361 379 397 415 433 451 469 487 505

(12)

Data Domain について

CPU 使用率に関する評価

DD Boost が無効の場合には、初回フル・バックアップの無効時と同様に、それなり のCPU 負荷が Data Domain でも必要とされました。

一方、有効の場合には、分散重複除外の効果によりData Domain 側での大幅な負荷 低減を実現しています。 3. 3回目のフル・バックアップにおける結果 バックアップ・サーバおよびData Domain のいずれにおいても、2回目とほぼ同様 の傾向を示していました。 注意点としては、DD Boost 有効時のケースで、8多重でバックアップをしている際、 1つのバックアップ・ジョブにおいて Hyper-V のスナップショットの実行に時間を 要してしまい、バックアップ時間全体が大きくなっていたことが判明しました。こ のことにより、無効時のケースとバックアップ時間がそれほど変わらない結果と なっています。

CPU 使用率 (%)

0 5 10 15 20 25 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500

Boost Enabled - 2nd Boost Disabled - 2nd

Backup LAN使用状況 (Mbps)

0 500 1000 1500 2000 2500 1 19 37 55 73 91 109 127 145 163 181 199 217 235 253 271 289 307 325 343 361 379 397 415 433 451 469 487

(13)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

バックアップ・サーバ CPU使用率 (%)

0 5 10 15 20 25 30 1 18 35 52 69 86 103 120 137 154 171 188 205 222 239 256 273 290 307 324 341 358 375 392 409 426 443 460 477

Boost Enabled - 3rd Boost Disabled - 3rd

バックアップ・サーバ 使用可能メモリ量 (MB)

28800 29000 29200 29400 29600 29800 1 19 37 55 73 91 109 127 145 163 181 199 217 235 253 271 289 307 325 343 361 379 397 415 433 451 469 487

Boost Enabled - 3rd Boost Disabled - 3rd

Data Domain CPU 使用率 (%)

0 5 10 15 20 25 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480

(14)

4. ディスク使用量 別表に各回のバックアップにおけるデータ書き込み量を示します。バックアップ・ サーバで管理されている容量(重複除外前)に対し、実際にData Domain で消費し たデータ量(重複除外後)を比較しています。圧縮率の単位は「倍」です。3回の バックアップ合計で本来ならば 203.8GB 必要なところを、重複除外の効果によって 5.4GB に容量を抑えられているのがわかります。

ディスク使用量

0 100 200 300 デ ィ ス ク 使 用 量 (G iB ) 0.0 20.0 40.0 圧縮前 67.9 135.9 203.8 圧縮後 4.9 5.2 5.4 圧縮率 13.9 26.1 37.7 1 2 3

(15)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

考察

本検証を通して、分散重複除外処理によって以下の3つの効果を確認することがで きました。 1. バックアップ LAN に転送されるデータ量を大きく削減 2. バックアップ時間の短縮 3. プラットフォームの負荷低減 1. の効果に関しては、分散重複除外処理における圧縮率が大きなファクターになり ます。バックアップ世代間で重複除外効果が期待できるバックアップ対象であれば、 分散重複除外におけるデータ削減率も大きな値が期待できます。今回は、Hyper-V 環境の仮想マシンをバックアップしたため、世代間だけでなく同一世代内でも高い 重複除外効果が得られたため、さらに顕著な効果を確認することができました。 逆に、データベースにおけるトランザクション・ログをバックアップするケースな ど、世代間での重複除外効果がそれほど期待できないケースでは、転送しなければ ならないデータ量を大きくは削減できないので、分散重複除外による効果はある程 度限られてくることになり、注意が必要です。 2. に関しては、特に2回目のフル・バックアップで確認することができました。DD Boost の有効/無効いずれのケースにおいても、バックアップ開始から最初の約 100 秒は Hyper-V のスナップショット作成のための時間であったため、純粋なバック アップ・データ転送の時間はそれを外して考える必要があります。2回目のフル・ バックアップにおいてその分の時間を考慮すると、バックアップ・データの転送に 要した実際の時間は、 DD Boost 有効時:270 秒程度 DD Boost 無効時:490 秒程度 となり、有効時のほうがおおよそ 1.8 倍高速にバックアップできていることがわか ります。初回のフル・バックアップは通常転送データ量自体もそれなりにあるため、 バックアップの時間短縮は大きくは望めません。主に2回目以降のフル・バック アップにおいて期待できる効果と考えた方が良いでしょう。 なお、この効果の程度に関しても、実際にはバックアップ対象の圧縮率やバック アップ・サーバで利用可能なCPU リソース、バックアップ・クライアントの I/O 性 能などに影響受けることに注意して下さい。特に、バックアップ・クライアントの I/O 性能が低いと、バックアップ対象データがバックアップ・サーバに送り込まれて こないため、高いスループットを維持できないことが考えられます。

(16)

3. に関しても、主に2回目以降のフル・バックアップにおいて期待できる効果と言 えます。特に低減効果が大きいポイントは、バックアップ LAN の使用帯域と、 Data Domain に搭載される CPU 使用率です。

今までのバックアップ環境は、この2つのポイントの負荷が高いことが要因でパ フォーマンスが上がらず、それを補うために高価で柔軟性に欠けるSAN 環境を採用 したり、ストレージ・デバイスをいくつも並列に並べることによってスループット を向上させるような構成を取っていました。ただし、このような構成では、ディス ク・ベースのバックアップ・ストレージのメリットは理解されつつも、TCO が悪化 してしまうため、なかなか導入しにくいものになっていました。

そして、Data Domain と Symantec NetBackup の連携よる分散重複除外処理に よって、2つのポイントのボトルネックが大きく改善していることはテスト結果か らも明らかです。2回目のフル・バックアップにおいて 68.0GiB を 270 秒程度の時 間でバックアップが完了し、その平均バックアップ・スループットは 258MiB/s 程 度でした。本来ならば複数のギガビット・イーサネット接続が必要になりますが、 実際に流れた帯域を考慮すると1本のギガビット・イーサネット接続で十分間に合 うデータ量でした。加えて、この時のData Domain の CPU 負荷は極めて軽いため、 データ転送をより多重化することでさらに多くのバックアップ・データを処理でき ると考えられます。

このプラットフォームにおける負荷低減効果も、上記2つの効果と同様に重複除外 処理における圧縮率が主要なファクターになります。

(17)

EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の

結論

EMC Data Domain Boost for Symantec OpenStorage と Symantec NetBackup の組み合わ せにより実現する分散重複除外機能は、バックアップ環境構築における既存の考え 方を一変させる革新的な技術です。 このDD Boost の特徴を活かせる用途としては、以下のような環境が考えられます。 1. バックアップの統合を行った結果、大量のデータがネットワークに転送されるた めにボトルネックが発生してしまった場合に DD Boost を導入することでネットワー クのボトルネックを解消し、より高速な統合バックアップが実現する。 2. 複数のバックアップ処理を 1 つのバックアップ・サーバで行うにあたり、バック アップ・サーバの負荷が大きくなり、パフォーマンスが思うように上がらない場合 に DD Boost を導入することで、バックアップ・サーバの負荷を軽減することでパ フォーマンスの向上が実現する。 3. バックアップ専用に 10GbE のような高速なネットワークを配置することができな い環境において、1GbE ネットワーク帯域でも高速なバックアップを実現したい場合 に DD Boost を導入することで、ネットワーク帯域を最大限に活用してより高速な バックアップが実現する。

参照

関連したドキュメント

心臓核医学に心機能に関する標準はすべての機能検査の基礎となる重要な観

名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の  

以上のことから,心情の発現の機能を「創造的感性」による宗獅勺感情の表現であると

実行時の安全を保証するための例外機構は一方で速度低下の原因となるため,部分冗長性除去(Par- tial Redundancy

・Squamous cell carcinoma 8070 とその亜型/変異型 注3: 以下のような状況にて腫瘤の組織型が異なると

証明で使われる重要な結果は mod p ガロア表現の strictly compatible system への minimal lifting theorem (以下, LT と略記する) と modular lifting theorem (主に

口腔の持つ,種々の働き ( 機能)が障害された場 合,これらの働きがより健全に機能するよう手当

FAN49103 is a fully integrated synchronous, full bridge DC−DC converter that can operate in buck operation (during high PVIN), boost operation (for low PVIN) and a combination