• 検索結果がありません。

EMC Data Domain Archiver

N/A
N/A
Protected

Academic year: 2021

シェア "EMC Data Domain Archiver"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

US ホワイト・ペーパー翻訳版 要約 重複除外ストレージ・システムの導入により、多くの企業がオペレー ションのリカバリにおけるテープの使用を最小限に抑えることができる ようになりました。しかし、長期保存の要件があるお客様の場合、TCO (総所有コスト)、電力消費量、データの移植性、障害の切り分けの面 で利点があると考えられることから、依然としてテープ・ベース・ソ リューションに依存しています。長期保存データの保存に関するベス ト・プラクティスは、専用のアーカイブ・プロセスまたはアプリケーション を使用することですが、バックアップほど採用が進んでいないのが現 状です。このホワイト・ペーパーでは、業界初のバックアップの長期保 存システム である EMC® Data Domain® Archiver を紹介し、Data Domain システムの特長であるシステム・スループットおよび復旧性を 実現する仕組み、および優れたコスト・パフォーマンス、障害の切り分 け、データ管理の向上を実現する新しい最適化機能について説明し ます。DD Archiver は、現在一般的に運用されているバックアップ・プ ロセスから、長期保存のベスト・プラクティスの発展的導入への橋渡し としての役割を果たします。 2011 年 1 月

EMC Data Domain Archiver

詳細レビュー

(2)

Copyright © 2011 EMC Corporation. All Rights Reserved. EMC Corporation は、この資料に記載される情報が、発行日時点で正 確であるとみなしています。この情報は予告なく変更されることがあり ます。 この資料に記載される情報は、「現状有姿」の条件で提供されていま す。EMC Corporation は、この資料に記載される情報に関する、どの ような内容についても表明保証条項を設けず、特に、商品性や特定 の目的に対する適応性に対する黙示の保証はいたしません。 この資料で説明されているいかなる EMC ソフトウェアの使用、コピー、 配布に関しても、適切なソフトウェア・ライセンスが必要です。 最新の EMC 製品名リストについては、http://japan.emc.com/にある 「EMC Corporation の商標」を参照してください。 他のすべての名称ならびに製品についての商標は、それぞれの所有 者の商標または登録商標です。 パーツ番号h8140-J

(3)

目次

エグゼクティブ・サマリー... 4

概要 ... 5

対象読者 ... 5

Data Domain Archiver の概要 ... 5

データ移動ポリシー ... 8 拡張性に優れたシングル・ファイル・システム ... 9 技術的な実装 ... 11 アーカイブ・ユニットの障害の切り分けと詳細レベルのリカバリ ... 13 複製データからの詳細レベルのリカバリ ... 14 コスト・パフォーマンスに優れた拡張性... 15 将来のアーキテクチャ上の拡張 ... 16 一般的な導入シナリオとベスト・プラクティス ... 16 バックアップ・データの長期保存 ... 17 DD Archiver へのデータのアーカイブと階層化 ... 18 長期保存に関するDD Archiver とテープの比較 ... 19 最後に ... 19

(4)

エグゼクティブ・サマリー

バックアップ・リカバリに重複除外ストレージを導入することにより、多くの企業がテー プ・オートメーションの使用を最小限に抑えることができるようになりました 。EMC Data Domain 重複除外ストレージは、このカテゴリーにおけるマーケット・リーダーと しての地位を確立しています。通常、データのバックアップには数週間から数か月の 保存期間があります。保存要件が長期になると、多くのユーザーは単純にバックアッ プをテープに長期間保存しますが、専用のディスク・ベースのアーカイブ・アプローチ を採用するユーザーもいます。 テープは移植性、冗長性、障害の切り分けといった特長を備えていますが、データ 保存向けに使用する場合、次に示す欠点があります。  想定されるテープ・カートリッジの設備コスト面でのメリットよりもテープ・オート メーションのコストや運用コストが上回る場合が多い。  テープに保存されたファイルへのアクセスに非常に長い時間を要する(特にオフ サイトの場合)。  テープ・ドライブ・テクノロジーを移行する場合、5~7 年ごとに高価で時間のかか る旧テープの一括移行が必要となる場合がある。 長期保存向けにテープおよびバックアップ・プロセスを使用する代わりに、図 1 に示 すように、専用のアーカイブ・プロセスまたはアプリケーションを使用して、プライマ リ・ストレージおよび対応するバックアップ・プロセスからアーカイブ・プラットフォーム にデータを移動する方法があります。 図 1:バックアップの前にアーカイブを行う場合のベスト・プラクティス:1)重要な情報 を階層型インフラストラクチャにアーカイブ、2)使用頻度の高い本番情報をディスク にバックアップ、3)アーカイブから取得またはバックアップからリカバリ アーカイブ・プロセスを導入することにより、プライマリ・ストレージの容量が解放され、 データ保存が行われ、より効率的にバックアップ・プロセスを実行できるようになりま す。しかし、この代替アプローチは、複雑であると認識されている点、統一されたポリ シーまたは要件がない点、予算の制約、ソフトウェアの制約など、多くの理由から バックアップほど一般的に採用されていません。 その結果、運用面での課題が認識されているにもかかわらず、テープ・バックアップの 長期間にわたる保持が長期保存の代替アプローチとして最も広く採用されています。 バックアップ/アーカイブ・プロセスの進化に伴い、現在の一般的な運用方法から未 来のベスト・プラクティスへの橋渡しをするプラットフォームの必要性が高まっていま す。この移行過程では、保存を目的としてバックアップ・インフラストラクチャを使用す ることから脱却し、アーカイブ・プロセスの導入を図るお客様もいるかもしれませんが、 移行に要する期間は依然として未知数のままです。現時点では、ストレージ・プラット

(5)

フォームの要件に、バックアップ・データを迅速に取り込むことができる(高スルー プット)、コスト・パフォーマンスに優れながら堅牢に保存できることがあります。 EMC Data Domain Archiver は、業界初のバックアップ・データの長期保存システムで あり、既存のバックアップ・プロセスを変えずにそのまま導入することができます。DD Archiver は、バックアップ環境で広く導入されている実証済みのミッドレンジ Data Domain システムの構成を拡張し、大容量の静的データを格納するためのストレー ジ階層を組み込んでいます。大容量のストレージを徐々に拡張できるよう、新しく アーキテクチャを拡張し、システム・コストの削減、データの長期的な可用性と整合 性の確保が可能になります。アーカイブのアプローチが有効な場合は、ユーザーは アーカイブ・ワークロードのターゲットを同じインフラストラクチャ内の DD Archiver に 保存できます。

概要

このホワイト・ペーパーでは、EMC Data Domain Archiver を紹介し、Data Domain シ ステムの特長であるスループットおよび復旧性を実現する仕組み、および優れたコ スト・パフォーマンスと障害の切り分けを実現する新しい最適化機能について説明し ます。このホワイト・ペーパーを読むと、DD Archiver が、現在一般的に運用されてい るデータ保存向けのバックアップ・プロセスをどのようにサポートするのかをご理解い ただけます。 以降のセクションでは、データ移動、障害の切り分け、計画的なアーキテクチャの拡 張などの DD Archiver 独自の特徴に加え、他の長期保存オプションとの比較につい て説明します。 対象読者

このホワイト・ペーパーは、Data Domain Archiver の詳細に興味を持つ EMC のお客 様、テクニカル・コンサルタント、パートナー、EMC とパートナーのプロフェッショナル・ サービス・コミュニティのメンバーを対象としています。

Data Domain Archiver の概要

Data Domain Archiver は、内部階層化アプローチによる実証済みの Data Domain アーキテクチャを拡張することにより、拡張性およびコストに関する長期保存要件に 対応します。共通のコントローラ、管理、ネームスペースを共有する 2 つの階層があ ります。  オペレーションのリカバリで使用される標準の Data Domain システムと同様に機 能するアクティブ・ストレージ階層  長期保存のポリシーの閾値(前回の変更からの経過時間)を経過した場合にファ イルが内部的に移行されるアーカイブ・ストレージ階層 これらの階層は、1 台のコントローラに接続されているストレージの論理的な区分です。 データは最初にアクティブ階層に保存されます。ユーザーが定義した期間内に変更が 行われなかったデータはアーカイブ階層に移動されます。アーカイブ階層では、障害

(6)

の切り分けと詳細レベルのリカバリ性が追加で組み込まれており、より大きな容量が 長期保存用に確保されます。また、管理性が向上し、高度な圧縮が行われます。 異なる階層にデータが分離されるため、長期保存用に非常に大きな容量を持つこと ができます。この新しいアーキテクチャは、1 台の Data Domain コントローラの背後 に大きな拡張性を備えており、これを平均するとシステム・コストが低減します。 DD Archiver は、新しく独立したシステムであり、Data Domain システムをオプション で拡張したものではありません。ただし、標準バージョンの DD OS(Data Domain Operating System)が稼働する 1 台のコントローラで構成される従来の Data Domain システムを利用します。これは、標準の Data Domain ES20 ストレージ・シェ ルフに接続されています。バックアップの長期保存がメインの用途になりますが、加 えてアーカイブ用途(メール、ファイル、プロジェクト、階層化)を検討している場合、こ れらのデータ・タイプをコスト・パフォーマンスに優れた方法で DD Archiver に組み込 むこともできます。

図 2:DD Archiver で利用される従来の Data Domain システムの一般的なコンポー ネント

Data Domain Archiver のストレージ階層

DD Archiver のアクティブ階層は、基本的に標準の Data Domain システムと同様に 機能し、同じガイドラインに基づいてサイズが設定されます。たとえば、フル・バック アップを毎週行い、最大90 日間増分バックアップを毎日行えるようアクティブ階層の サイズを設定できます。アクティブ階層は、1~4 台のストレージ・シェルフで構成でき ます(利用できる容量は最大96 TB)。 アーカイブ階層は、1 台以上のアーカイブ・ユニットで構成されます。各アーカイブ・ ユニットは、ストレージ・シェルフの論理的なグループであり、独自の重複除外コンテ キストがあります。各アーカイブ・ユニットは、1~4 台のストレージ・シェルフで構成で きます(利用できる容量は最大96 TB)。 ユーザーが定義したポリシー・ベースのプロセスが定期的に実行され、古くなった データがアクティブ階層からアーカイブ・ユニットに移動されます。これは、アーカイ

(7)

ブ・ユニットに空き領域がなくなるまで実行されます。図 3 では、アクティブ階層から アーカイブ階層内のアーカイブ・ユニットへのデータの移動を示しています。

階層とアーカイブ・ユニットはエンド・ユーザーおよびアプリケーションに対して透過的 であるため、DD Archiver は単なる大規模な Data Domain システムのように見えます。

図 3:コントローラ、アクティブ階層、アーカイブ階層内のアーカイブ・ユニットで構成 される Data Domain Archiver。内部のデータ移動は、古くなったデータをアクティブ 階層から空き容量のあるアーカイブ・ユニットに移動することで行われます。 アーカイブ・ユニットのシーケンシャルなデータ移動 DD Archiver は、空き領域がなくなったアーカイブ・ユニットを直ちに封印して、障害か ら切り離す独自機能を備えています。各ユニットは、完全な自己完結型のデータ保 存ユニットです(「アーカイブ・ユニットの障害の切り分けと詳細レベルのリカバリ」を 参照)。あるアーカイブ・ユニットがいっぱいになり封印されると、次に使用可能な アーカイブ・ユニットに切り替わり、新たに古くなったデータが移動されます。この方 法では、図 4 に示すように、データが経過期間の順序でアーカイブ・ユニットに配置 されます。アクティブ階層は、増分バックアップといった直近のアクティブなバックアッ プ・データを保持します。一方、アーカイブ階層は、数か月または数年前に保存され たフル・バックアップといった比較的静的なデータを保持します。これにより、同じタイ プのコントローラを搭載した同等の従来の Data Domain システムの容量と比較して、 最大4 倍の容量にまでアーカイブ階層を拡張できます。

(8)

図 4:すべてのコンポーネントで構成されている DD Archiver。アーカイブ・ユニット 0 と 1 は空き領域がなく封印されています。アーカイブ・ユニット 3 にはアクティブ階層 から移動された新たに古くなったデータが現在移動されています。 データ移動ポリシー システム管理者は、DD Archiver のアクティブ階層からアーカイブ階層へのデータ移 動を指示するポリシーを構成できます。データ移動ポリシーは mtree に基づいて管 理され、該当する mtree のポリシーのしきい値を満たすファイルのみがアーカイブ階 層に移動されます。mtree は、Data Domain ファイル・システムのネームスペースの 論理パーティションであり、管理目的で一連のファイルをグループ化できます。たとえ ば、特定の用途に関連する一連のファイルに独自のスナップショット・スケジュール を適用できます。mtree の詳細については、「Data Domain User’s Guide」(5.0 以降) を参照してください。データセットごとに同じ DD Archiver の異なるデータ移動ポリ シーが必要な場合は、別々のmtree に配置する必要があります。 データ移動ポリシーは2 つのユーザー定義要素に基づいて実施されます。  ファイルの選択された最終更新日時(たとえば、変更が行われない状態で90 日後)  定期的なデータ移動スケジュール(たとえば、クリーンアップ・プロセスの前に毎週) データ移動プロセスの実行中、ファイルはアクティブ階層から空き容量のあるアーカ イブ・ユニットに移動されます。各ファイルは 1 回だけしか移動されません。データ移 動プロセスはシステムの稼働率が比較的低いときに実行するようスケジュールを設 定できるバックグラウンド・プロセスであるため、対象のデータをさらに圧縮すること ができます。具体的には、アクティブ階層からアーカイブ階層にデータを移動すると きに、よりプロセス集約的な圧縮アルゴリズムをシステムで実装して、データを再圧 縮し、より高い密度でデータをパッケージ化できます。これにより、アーカイブ階層の ストレージの効率性がさらに高くなります。 データ移動プロセスは、定期的に実行され、ユーザー定義のファイル保存期間ポリ シーに基づいてアクティブ階層からターゲットのアーカイブ・ユニットに個別のファイ

(9)

ルを移動します。ただし、物理的にコピーされるのはアーカイブ・ユニットごとに固有 のセグメントに限られます。これは、EMC Data Domain のファイル・レプリケーション・ オプションと同じプロセスです(詳細については、ホワイト・ペーパー「EMC Data Domain Replicator」を参照してください)。 定期的なデータ移動スケジュールは、Data Domain システムの「クリーニング」ス ペースの再利用プロセスと同様の方法でデータ移動ポリシーを開始します。データ 移動プロセスは、指定した時刻に実行、停止、再開、またはスロットリングするようス ケジュールを設定できます。データ移動プロセスは、長期保存ファイルをアーカイブ 階層に移動した直後にアクティブ階層内のすべての空き容量を再利用できるようク リーンアップ・プロセスの直前に実行することをお勧めします。 たとえば、バックアップの長期保存を行いたい場合は、指定したバックアップ・サイク ルの期間(たとえば、90 日間)は毎週のフル・バックアップと毎日の増分バックアップ を保存して、その期間後は長期(たとえば、7 年間)に渡り、月単位のフル・バックアッ プを保管することもできます。このデータ移動ポリシーを構成するには、対象の mtree のデータ移動プロセスを毎週実行し、指定した日付より前の 90 日の期間に 最終更新されたファイルをすべて移動するよう管理者がデータ移動プロセスを設定 します。保存期間のポリシー設定は、指定した日付の経過後に毎月のフル・バック アップのみを保管するようバックアップ・ソフトウェアで設定できます。毎週のデータ 移動では、90 日の期間が経過した残りのファイルはアーカイブ階層に移動されます。 拡張性に優れたシングル・ファイル・システム

従来のData Domain システムと同様に、DD Archiver はストレージ全体にわたりシング ル・ファイル・システム構成をとっており、使いやすさとシンプルな管理を実現します。 そのため、DD Archiver ではユニットや階層が別々に表示されず、エンド・ユーザーや アプリケーションからは大規模なData Domain システムのように認識されます。 当然、この単一のファイル・システムは、CIFS 共有(Windows の場合)、NFS マウン ト・ポイント(UNIX/Linux の場合)、または DD Boost(EMC NetWorker®Symantec

NetBackup、Backup Exec をサポート)による専用のバックアップ・ターゲットとして表 示できます。EMC Data Domain Virtual Tape Library ソフトウェア・オプションは、将来 のリリースでDD Archiver に対応する予定です。

古いデータを大量に保持している大規模な環境の場合、古いデータへのアクセス頻 度は時間の経過とともに大幅に低下すると予想されます。Data Domain Archiver は、 読み取りパフォーマンスを維持しながら数ペタバイトのデータを保存できるよう拡張 できます。ただし、各アーカイブ・ユニットが最大容量に達した場合を除きます。その 場合は、新しいデータに対してのアクセス性を優先します。最大容量に達したアーカ イブ・ユニットに保存されている古いデータにアクセスすると、読み取りで若干遅延が 生じているように感じる場合があります。これは、すべてのアーカイブ・ユニットのメタ データをシステム・コントローラのメモリに残す必要がないという発想に基づいていま す。アーカイブ・ユニットの使用容量が最大に達した場合には、いくつかのアーカイ ブ・ユニットのメタデータはメモリからスワップ・アウトされます。データは経過期間の 順序でアーカイブ・ユニットに書き込まれるため、システムにより各ユニットのアクセ ス頻度が管理されます。また、遅延の確率を減らすために、最も古くアクセス頻度の 低いデータが格納されているユニットの優先順位を下げます。ただし、スワップ・アウ

(10)

トされたアーカイブ・ユニットにアクセスした場合でも、最初に生じる遅延は 30 秒程 度にすぎません。その後、アクセスがあったユニットのメタデータが別のユニットに優 先してコントローラのメモリに取り込まれるので、以降は標準のパフォーマンスに戻っ て読み取りが行われます。 DD Archiver はテープの使用を最小限に抑えることを目的としているため、システムを 検討する際に、この低い確率でしか発生しない遅延(システムが最大容量に達した場 合にしか発生せず、最も古く最もアクセス頻度の低いデータにしか影響しない遅延)と、 オフラインのテープからデータにアクセスする場合に生じる遅延とを比較します。通常、 オフラインのテープは、シェルフの上に置いてあるか、外部の施設までオフサイトに輸 送されています。したがって、スワップ・アウトされたユニットに格納されているファイ ルの最初のバイトにアクセスする際に生じる 30 秒のレイテンシーと、オフラインの テープをテープ・ライブラリに入れてデータにアクセスする場合に生じる数時間あるい は数日の遅延と比較すれば、DD Archiver の方が望ましいのは明らかです。

(11)

技術的な実装 図 5 に示すように、従来の Data Domain システムには、物理ディスク・ストレージの 上位に複数レベルの論理データがあります。 図 5:Data Domain OS ファイル・システムでは、論理ファイル・システム・レイヤーに アクセ スするためのプロトコル固有のネームスペースが提供されています 。各 mtree 内のファイルとディレクトリ、および mtree スナップショットは、すべて一意のセ グメントが存在する同一のプールを参照しています。このプールはコレクションと呼 ばれ、ログ構造化コンテナで構成されます。これらのコンテナによりディスク上のセ グメントが整理され、スループットと重複除外効果が最適化されます。

この図は、Data Domain Operating System ファイル・システムの複数のコンポーネン トとレイヤーを示しています。 1. プロトコル固有のネームスペース:アプリケーションに対する外部インタフェース として、CIFS/NFS ファイル共有(Ethernet 経由)、仮想テープ・ライブラリ(ファイ バ・チャネル経由、DD Archiver では現時点で未サポート)、DD Boost ストレージ・ ユニットなどのプロトコル・ネームスペースがあります。Data Domain では、これら の任意の組み合わせで、同時にデータ保存ならびにアクセスできます。 2. ファイル・システムの mtree、ディレクトリ、ファイル、スナップショット:各ネームス ペースのファイルとディレクトリは、DD OS ファイル・システムの mtree に格納され ます。CIFS/NFS 以外の場合、データ(仮想テープ・カートリッジなど)は特別なディ レクトリの下にファイルとして格納されます。DD OS の mtree スナップショットは、 基盤となる同一データ・セグメントを共有するため、論理的で容量効率に非常に 優れています。

(12)

3. 一意のセグメント・コレクション、ローカリティ・コンテナに格納:「コレクション」は、 ファイル(または仮想テープ)と論理mtree スナップショットのセットです。システム は、各コンテナ内の重複データ・セグメントを特定し、重複除外後のデータ・セグメ ントを圧縮して物理ディスクに書き込みます。各セグメントは、コレクション内で一 意です(自己修復および高速リカバリを有効にするために DD OS で格納されて いる特定の重複は対象に入っていません)。Data Domain システムごとにコレク ションが 1 つあり、セグメント・ローカリティ・コンテナのログに格納されます。セグ メントのローカリティの詳細については、ホワイト・ペーパー「EMC Data Domain SISL™スケーリング・アーキテクチャ」を参照してください。

4. RAID 対応ディスク・ストレージ:これらのコレクション・コンテナは、高レベルの整 合性を確保するために RAID 対応ディスク・ドライブ・ブロック上で階層化されてい ます。Data Domain 重複除外ストレージ・システムでは、内蔵ディスクと拡張シェ ルフで構成されるData Domain RAID 6 を使用して、ディスクの 2 重障害に対応 します。

さらに、Data Domain Archiver では、アーキテクチャ上の拡張がいくつか導入されて います。図 6 では、アーカイブ・ユニットで構成されるアーカイブ階層を DD Archiver がどのように組み込んでいるかを示しています。 図6:DD OS ファイル・システムでは、論理ファイル・システム・レイヤーにアクセスする ためのプロトコル固有のネームスペースが提供されています。各 mtree のファイルと ディレクトリ、および mtree スナップショットは、一意のセグメントが存在する個別の フォールト・コンテインメント(障害封じ込め)ドメインを参照しています。このフォール ト・コンテインメント・ドメインはコレクション・パーティションと呼ばれ、ログ構造化コンテ ナで構成されます。これらのコンテナによりディスク上のセグメントが整理され、スルー プット、拡張性、重複除外効果が最適化され、一定の障害隔離が可能になります。

(13)

DD Archiver のアーキテクチャに関する技術革新は図 6 のレイヤー3 と 4 に反映さ れています。内部的な階層化、高度な拡張性、障害を隔離する機能を実装するため に、DD Archiver ではストレージをコレクション・パーティションで分割します。コレク ション・パーティションは、アクティブ階層とアーカイブ・ユニットとして分けられます。 各コレクション・パーティションは、アクティブ階層かアーカイブ・ユニットかにかかわら ず、RAID 6 で保護されたストレージ・シェルフに保存されます。アーカイブ階層の場 合、各ストレージ・ユニット単位にそれぞれ重複除外インデックスが割り当てられます。 アクティブ階層に新しい書き込みが行われる際は、これらのアーカイブ・ユニットのイ ンデックスはチェックしません。この設計により、移動するファイルのネームスペース に変更なく、アクティブ階層からアーカイブ・ユニットにデータを透過的に移動できま す。また、このアーキテクチャは、アーカイブ階層のドライブのスピン・ダウンなどの 拡張予定があります。ただし、アプリケーションやユーザーからはユニットと階層を見 分けることはできません。外面的には、ネームスペースの管理可能な要素はすべて 従来のData Domain システムと変わりません。 アーカイブ・ユニットの障害の切り分けと詳細レベルのリカバリ DD Archiver は、バックアップ・データの長期保存プラットフォームとして設計されてい ます。そのため、規模の拡張、および従来のディスク・ストレージよりも大幅に長い稼 働期間での運用が想定されています。長期保存を実現するために、システムは障害 の切り分けと詳細レベルのリカバリ性に重点を置いて設計されています。 前述のように、DD Archiver は RAID 6 で保護されており、同時に 2 つのディスク障害 でもデータを守り、ストレージ・シェルフの可用性を維持します。また、DD Archiver は、 DD OS の持つ特徴である、非脆弱性アーキテクチャ(DIA :Data Invulnerability Architecture)により堅牢に保護されます。非脆弱性アーキテクチャは、すべての保 存データを対象に、継続的な障害検出機能と自己修復機能を備えており、データの 整合性を確認し、bit lot(ビット崩壊)などの長期保存による悪影響がデータの整合 性に及ばないようにします。詳細については、ホワイト・ペーパー「EMC Data Domain Data Invulnerability Architecture」を参照してください。

RAID 6 や Data Invulnerability Architecture に加え、DD Archiver はアーカイブ・ユ ニットを封印することによる独自の障害の隔離機能を備えています。アーカイブ・ユ ニットの封印は、アーカイブ・ユニットが最大容量に達した時点で、ファイル・システム と重複除外のメタデータのスナップショットを各アーカイブ・ユニットに保存することで 行います。封印されたユニットにはデータが書き込まれなくなり、後続のデータ移動 ポリシーは次に用意されているアーカイブ・ユニットに送られます。各ユニットは障害 の切り分けを目的として封印されるため、すべてのアーカイブ・ユニットには他の アーカイブ・ユニットやアクティブ階層と異なる重複除外インデックスがそれぞれ割り 当てられます。障害の隔離でシステム全体の重複除外の効率性は下がりますが、 アーカイブ階層にはより強力な圧縮アルゴリズムが適用されるため、コスト効率を補 いながら、データの長期アクセスとリカバリ性というメリットをもたらします。 DD Archiver で不具合が発生、もしくはプライマリ・サイトでマイナーな災害が発生し たことで、1 つのアーカイブ・ユニットが使用不可の状態に陥った場合でも、影響を受 けていないコンポーネントを使用して稼働し続けます。他のファイル・システムの場合、 同様の事態(1 つの RAID グループを超えるような大規模なコンポーネント障害)が

(14)

発生すると、完全に使用不可の状態に陥り、データが完全または部分的に消失する 恐れがあります。DD Archiver の場合、システムは稼働し続け、影響を受けていない データにすべてアクセスできます。システムは、コントローラとアクティブ階層が機能 している限り稼働し続けます。 図 7:この例では、DD Archiver でアーカイブ・ユニット 2 に障害が発生しています。 影響を受けていないすべてのデータは引き続き使用でき、システムは機能し続けま す。 図 7 に示したような障害が発生した場合、次の 3 つの状況と対応のいずれかが想 定されます。  小規模な障害(ケーブル、コネクタ、ファンなど)の場合、アーカイブ・ユニットの障 害部分を修理してシステムに再接続できます。  アーカイブ・ユニットの主要部分が障害で使用できなくなり、リモート・サイトにレ プリケーション・データが残っているような場合は、新しいアーカイブ・ユニットをリ モート・サイトでデータ・コピーした後、ユニットをデータセンターに戻してシステム 復旧させます。  アーカイブ・ユニットが使用できなくなり、DR システムも用意されていない場合、 障害ユニットを新しいユニットに交換すれば、システムを再度稼働させることがで きます。 さらに障害の切り分けを掘り下げます。この災害の規模がさらに大きく、システムの 大半が影響を受け、複製データがない場合は、リカバリ対象のすべてのユニットを新 しい DD Archiver システムに交換できます。また、災害を切り抜け回収されたデータ は、新しいシステムで使用できます。 複製データからの詳細レベルのリカバリ 多くのストレージ・プラットフォームと同様にDD Archiver では、災害から免れることが できるリモート・サイトにあるシステムに、すべてのデータのフル・レプリカを保持する よう災害対策を行う必要があります。ただし、非常に大規模な従来のストレージ・シ ステムの場合、大きなシステム障害により、レプリケーションの同期が取れなくなった り、レプリケーションが完全に停止したりする場合があります。このような場合、管理 者が最も避けたい事態は、リモート・サイトからローカルのデータセンターにネット ワーク経由で数ペタバイトのデータを転送することです。WAN 経由による大量の データ転送は、数週間もかかることがあるため実用的ではありません。また、トラック でデータを輸送する場合、保存した容量によっては数十ものデバイスが含まれ、管 理が難しく費用がかかる場合があります。

(15)

DD Archiver は、独自のアーキテクチャを活用することにより、より詳細なレベルでの リカバリを実現します。データセンター内のソース・システムとリモート・サイト内のレ プリカ・システムとのシステム間のレプリケーション関係だけではなく、ソース・システ ム内のアクティブ・ユニット/アーカイブ・ユニットとレプリカ・システム内の相対するユ ニットとのレプリケーション関係を確立します。 図8:DR(災害復旧)構成が行われた 2 つの DD Archiver システムは、より詳細なレ ベルでのコレクション・レプリケーションを実現します。主なメリットは、この図の例の 場合、システム全体をリカバリしなくても 1 つのユニットをリカバリするだけでアーカ イブ・ユニット2 を交換できる点です。 図 8 で示したように、何らかの要因で主要コンポーネント(たとえば、ソース・システ ムのアーカイブ・ユニット 2)の可用性に影響が生じた場合、影響を受けたユニットの みを再同期またはリカバリする(リモート・サイトでシーディングしてデータセンターに 輸送する)だけで済みます。このような詳細のレプリケーション・レベルがない場合、 リモート・サイトからデータセンターにすべてのデータを送る必要があります。規模に よっては、トラックで20 個以上のコンポーネントに相当する量になります。 DD Archiver の詳細レベルのレプリケーション関係により、ペタバイト規模のシステム 内で特定のユニットが影響を受けた場合、より詳細なレベルでのリカバリを実現しま す。この詳細レベルのリカバリは、標準のファイル・システムのアプローチよりもリカ バリを高速化でき、影響を受けていないシステムへのリスクを軽減できます。 コスト・パフォーマンスに優れた拡張性 DD Archiver のもう 1 つのメリットとして、1 台のミッドレンジ・コントローラでのアーカイ ブ階層の高度な拡張性が挙げられます。現在、DD Archiver は、同じクラスのコント ローラを搭載した標準のData Domain システムの 4 倍の容量をサポートしています。 アクティブ階層の最大容量は 96 TB ですが、DD Archiver では有効容量を合計 570 TB にまで拡張できます。10~50 倍のバックアップの圧縮率を想定した場合、DD Archiver では長期保存バックアップ・データの容量を最大 28.5 PB にまで拡張できま す。多数のストレージ・シェルフでコントローラを共有すれば、拡張すればするほどコ

(16)

ントローラ・コストを抑えられます。バックアップの場合、前述のデータ削減率を想定 すると、DD Archiver の容量価格はギガバイトあたり 10 円~50 円レベルになります。 テープ・カートリッジの方が安価な場合もありますが、テープの運用に伴うリスクなど も考慮すると果たして適しているのかという懸念があり、前述のように予期しない追 加コストが生じる場合もあります。 将来のアーキテクチャ上の拡張 前述のすべてのメリットに加え、DD Archiver のアーキテクチャは高い拡張性を備え ており、将来のリリースでさらに追加機能を組み込む計画があります。具体的な計画 については、適切な守秘義務契約に基づいて EMC 担当者にご相談ください。今後 の拡張予定の一部を以下に示します。  モジュール形式のアップグレードおよびマイグレーション:DD Archiver は、モ ジュール形式で随時アップグレードできるよう設計されています。Data Domain のハイエンド・システムでは、すでにデータ・イン・プレース・アップグレードをサ ポートしており、データを移行しなくても最新のコントローラ・テクノロジーにアップ グレードできます。拡張機能を追加すると、さらに効率的にストレージ・サブシス テムをアップグレードしたり統合したりすることもできます。  電源管理/スピン・ダウン:アーカイブ・ユニットの封印および独立したユニットへ の重複除外コンテキストの分離により、アーカイブ・ユニットをスピン・ダウンして 電力消費量を削減できます。その場合でもデータ保存容量には影響ありません。  より圧縮率の高いデータ削減技術:現在、アクティブ階層のデフォルトの圧縮で は標準の LZ 圧縮アルゴリズムが使用されています。ただし、データをアーカイブ 階層に移動する際は、さらに圧縮率の高い GZ アルゴリズムでデータが圧縮され ます。将来、アーカイブ階層は、高密度のシェルフ/ドライブや圧縮率の高いグ ローバル/ローカル圧縮技術など、よりコスト効率を高めるための機能追加を重 視します。

 コンプライアンス規制のサポート:現在、DD Archiver は、EMC Data Domain Retention Lock ソフトウェアにより社内ガバナンス基準を満たしています。ただし、 将来的には、SEC 17a-4 などの厳格なコンプライアンス規制に対応できるように する予定です。

一般的な導入シナリオとベスト・プラクティス

Data Domain Archiver は、Data Domain 製品ファミリの一部であり、一般的なオペ レーティング・システムを利用するため、スタンドアロン・システムとして導入したり、お 客様の環境が大規模な場合に他の Data Domain システムの統合ターゲットとして使 用したりできます。DD Archiver は、さまざまな状況や用途で使用できます。ただし、主 な用途はバックアップの長期保存です。

(17)

バックアップ・データの長期保存

バックアップの短期保存と長期保存を 1 つのシステムで行ないたいお客様は、DD Archiver をスタンドアロン重複除外バックアップ・ストレージとして導入できます。この 用途では図 9 に示すように、EMC NetWorker や Symantec NetBackup などの標準 のバックアップ・ソフトウェアを利用して、セーブセットを DD Archiver に直接送信しま す。

図9:この例では、バックアップが Data Domain Archiver に直接送信される構成を示 しています。アクティブ階層のサイズは短期バックアップ・サイクルのデータを格納す るように設定されます。そして、アーカイブ階層は長期保存データにより時間の経過 とともに増加します。 アクティブ階層で複数のシェルフを利用することにより、DD Archiver は、データ・リス トア目的の短期バックアップ・データと、保存目的での長期バックアップ・データの両 方を 格納できます 。この構成の場合、ア クティ ブ階層のサイズは標準の Data Domain システムと同様に設定され、アーカイブ階層のサイズは必要な保存ポリシー (保存期間の長さ)に基づいて設定されます。 DD Archiver は、企業内の分散したシステム全体にわたる長期バックアップを統合す る目的でも使用できます。図 10 に示すように、他の Data Domain システムは一元 管理された1 つの Data Domain Archiver にレプリケーションを実行しています。この 構成の場合、各リモート・サイトのバックアップ・ソフトウェアがバックアップ・データを ローカルのData Domain システムに保存してから、DD Replicator および DD Boost を利用して長期保存向けに重複除外後の尐なくなったデータのみをWAN 経由で DD Archiver に送信します。 図 10:この例では、長期バックアップのみが他の DD システムから Data Domain Archiver にレプリケートされる構成を示しています。アクティブ階層のサイズはレプリ ケーション・データをサポートするように設定されます。一方、アーカイブ階層のサイ ズは集約したデータの長期保存を行い、時間の経過とともに増加します。

(18)

図 9 の最初の用途と異なり、この導入ではアクティブ階層がデータ・リカバリ向けに 使用されないため、データの送信量によっては、必要となるシェルフの台数は 1 台 か2 台で済みます。また、DD Archiver は DD Boost をサポートしているので、システ ム間のレプリケーションおよびレプリカの異なる保存期間の実装はシンプルになりま す。これは、すべての管理をバックアップ・ソフトウェアで行うことができるためです。 この管理の容易さは、DD Boost と EMC NetWorker を併用している場合、あるいは Symantec NetBackup または Backup Exec を使用している場合にのみ実現します。 DD Archiver へのデータのアーカイブと階層化

DD Archiver は、標準のバックアップ・データの保護に加え、長期保存向けにアーカイ ブ・データとファイル階層化データを同時に保存することもできます。通常の Data Domain システムと同様に DD Archiver は、バックアップ用途でもアーカイブ用途でも 使用できる多目的デバイスです。具体的には、DD Archiver は、仮想化ファイルの階 層化(EMC File Management Appliance または F5 ARX ファイル仮想化デバイスを使 用)、アーカイブ・プロジェクト・データ(手動またはスクリプトでアーカイブ)、および (EMC SourceOne™、Symantec Enterprise Vault などの)アーカイブ・アプリケーショ ンで実行したメール、ファイル、Microsoft SharePoint のアーカイブのターゲットとなり えます。どの場合でも、古いデータはプライマリ・ストレージから(よりコスト・パフォー マンスに優れた)DD Archiver に移動され、プライマリ・ストレージに残っているデータ は同一のDD Archiver システムに通常通りバックアップできます。 図 11:長期保存バックアップ・データの保存に加え、DD Archiver はアーカイブ・ワー クロードを組み込んでコスト・パフォーマンスに優れた方法で保存することもできます。 前述のようなバックアップ専用の用途の場合と異なり、この DD Archiver の導入では、 システムに保存される前の段階ですべてのデータはアーカイブ・データになるよう決 定されています。したがって、正式なサイジング解析は必要ですが、シェルフの台数 を尐なくしてアクティブ階層のサイズを設定したり、非常に積極的なデータ移動ポリ シーを構成したりできます。

(19)

長期保存に関する

DD Archiver とテープの比較

DD Archiver は、1 台のコントローラで優れた拡張性を備えています。この拡張性に 重複除外の効率性が加わることにより、ギガバイトあたりの容量価格で 10~50 円 の コ ス ト を 実 現 し ま す 。 こ の 平 均 コ ス ト は 、 ギ ガ バ イ ト あ た り 7~13 円程度のテープ・メディアのコストより安くはありません。しかし、全体的な テープ・コストの大部分は、テープ・ライブラリのコスト、テープ・ライブラリ管理ソフト ウェアのコスト、テープ・インフラストラクチャ管理者の人件費、テープの輸送コスト、 オフサイト・ストレージのコスト、5~7 年ごとに最新のテープ・ドライブ・テクノロジーに アップグレードする必要があるメディア移行コストになります。テープ・インフラストラ クチャの運用に伴う TCO(総所有コスト)を調査したところ、テープ・メディアのコストは テープ全体のコストを算定する方程式のごく一部にすぎません。したがって、ギガバ イトあたり10~50 円という DD Archiver はコスト・パフォーマンスに優れており、価格 破壊とも言えます。 DD Archiver の拡張時における平均システム・コスト、およびオンライン・データ・アク セス、障害の切り分け、詳細レベルのリカバリ性、管理性の向上といったメリットを同 時に実現する DD Archiver は、重複除外ストレージでのバックアップ長期保存の世界 に大きな変化をもたらすソリューションです。

最後に

DD Archiver は、現在および将来における長期保存の運用をサポートするストレー ジ・プラットフォームとして設計されています。お客様は、従来のアーカイブ・ソリュー ションを随時実装して、コスト・パフォーマンスに優れた方法でバックアップを長期間 ディスクに保存および保持できます。DD Archiver は、アーカイブ専用のワークロード と従来のバックアップ・ワークロードの両方をサポートする長期保存システムです。つ まり、事実上の標準のアーカイブ方法としての長期バックアップ保存から、専用の アーカイブ・プロセスへの段階的な移行をサポートします。 DD Archiver は、障害の切り分け機能を備えており、アーカイブ・ユニットをデータ保 存の自己完結型ユニットとして利用します。また、長期の詳細レベルのリカバリ性を 実現します。システムのコスト・パフォーマンスに優れた拡張性に加え、復旧性、モ ジュール式のアップグレードと移行、シンプルな管理、拡張可能なアーキテクチャに より、バックアップとアーカイブの橋渡しとしてのプラットフォームが満たす必要があ る長期保存の要件に対応できます。 また、バックアップ・ワークロードをサポートするには、バックアップを予定通りに完了 し、コスト・パフォーマンスに優れた方法でバックアップを保存するためのスループッ ト・パフォーマンスと適切な重複除外が必要となります。DD Archiver では、標準の Data Domain コントローラを使用して、アクティブ階層に保存されるバックアップ・ データについて最適化されたスループットと可変長の重複除外を実現します。 DD Archiver は、業界をリードする Data Domain テクノロジーを活用しているため、 Data Domain の実証済みの復旧性を備えています。こうしたテクノロジーには、非脆 弱 性 ア ーキ テ クチ ャ 、 ネ ッ ト ワー ク 効 率に 優れ た レ プ リ ケ ー シ ョ ン 向 けの DD

(20)

Replicator ソフトウェア・オプション、ハードウェアで実施されるファイル保存向けの Data Domain Retention Lock ソフトウェア・オプションがあります。

図 12:このグラフは、バックアップ・データの長期保存の要件を基準にした複数のプ ラットフォームのランクを示しています。バックアップを迅速に取り込み、コスト・パ フォーマンスに優れた方法で保存するには、高いバックアップ・スループットが必要 です。また、コスト・パフォーマンスに優れた長期保存を実現するには、保存モデル が必要となります。 2004 以来、Data Domain システムはオペレーションのリカバリにおけるテープの排除 に向けた最適なソリューションとしてのポジションを確立しています 。そして、DD Archiver は、バックアップ・データの長期に保存し、テープをさらに削減できます。図 12 に示すように、高いバックアップ・スループット、拡張性に優れた長期保存機能、コ スト・パフォーマンスに優れた設計、拡張可能なアーキテクチャを備えた DD Archiver は、究極のデータ保存プラットフォームであり、データ保護市場におけるテープの使 用率を低減します。

図 2:DD  Archiver で利用される従来の Data  Domain システムの一般的なコンポー ネント
図 3:コントローラ、アクティブ階層、アーカイブ階層内のアーカイブ・ユニットで構成 される Data  Domain  Archiver。内部のデータ移動は、古くなったデータをアクティブ 階層から空き容量のあるアーカイブ・ユニットに移動することで行われます。 アーカイブ・ユニットのシーケンシャルなデータ移動  DD Archiver は、空き領域がなくなったアーカイブ・ユニットを直ちに封印して、障害か ら切り離す独自機能を備えています。各ユニットは、完全な自己完結型のデータ保 存ユニットです(「アーカイブ・
図 4:すべてのコンポーネントで構成されている DD  Archiver。アーカイブ・ユニット 0 と 1 は空き領域がなく封印されています。アーカイブ・ユニット 3 にはアクティブ階層 から移動された新たに古くなったデータが現在移動されています。 データ移動ポリシー    システム管理者は、 DD  Archiver のアクティブ階層からアーカイブ階層へのデータ移 動を指示するポリシーを構成できます。データ移動ポリシーは mtree に基づいて管 理され、該当する mtree のポリシーのしきい値を満たす
図 9:この例では、バックアップが Data Domain Archiver に直接送信される構成を示 しています。アクティブ階層のサイズは短期バックアップ・サイクルのデータを格納す るように設定されます。そして、アーカイブ階層は長期保存データにより時間の経過 とともに増加します。  アクティブ階層で複数のシェルフを利用することにより、 DD  Archiver は、データ・リス トア目的の短期バックアップ・データと、保存目的での長期バックアップ・データの両 方を 格納できます 。この構成の場合、ア クティ
+3

参照

関連したドキュメント

Monotone domain decomposition algorithm for the parabolic problem (1.2) For solving the nonlinear difference scheme (2.5), we construct and investigate a paral- lel domain

Keywords: greatest common divisor, least common multiple, invertible ideal, pro- jective ideal, multiplication ideal, flat ideal, Pr¨ ufer domain, semihereditary ring, Bezout

Furuta, Log majorization via an order preserving operator inequality, Linear Algebra Appl.. Furuta, Operator functions on chaotic order involving order preserving operator

Byeon, Existence of large positive solutions of some nonlinear elliptic equations on singu- larly perturbed domains, Comm.. Chabrowski, Variational methods for potential

Theorem 4.8 shows that the addition of the nonlocal term to local diffusion pro- duces similar early pattern results when compared to the pure local case considered in [33].. Lemma

The damped eigen- functions are either whispering modes (see Figure 6(a)) or they are oriented towards the damping region as in Figure 6(c), whereas the undamped eigenfunctions

Using the multi-scale convergence method, we derive a homogenization result whose limit problem is defined on a fixed domain and is of the same type as the problem with

Next we integrate out all original domain wall indices α, β, γ, · · · and we get the effective weight function of M at each coarse grained (renormalized) dual link, where M is