• 検索結果がありません。

h Big Dataの保護

N/A
N/A
Protected

Academic year: 2021

シェア "h Big Dataの保護"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

BIG DATAの保護

Hadoopおよびビジネス データ レイク向けデータ保護ソリューション

要約

企業におけるBig Data分析は急速に成熟しており、企業の革新的なビジネス上の成果を促進 しています。それと同時に、ほとんどの場合Big Dataアプリケーションは、堅牢なデータ保護戦 略がないまま本番稼動を迎えています。Hadoopは、業界をリードするBig Dataフレームワー クです。企業は、バックアップからディザスタリカバリまで、包括的なデータ保護のシナリオを Hadoopに求めています。このホワイト ペーパーでは、Dell EMC Data Protection Suiteファミ リーの一部であるDell EMCのData Domain Boost for Enterprise Applicationsが、Hadoop 向けの真のバックアップ アプリケーション機能を業界で初めて提供し、Hadoop管理者がData Domain保護ストレージに対して独自のバックアップ/リカバリを実行するためのCLIコマンド セットを提供する仕組みについて説明します。また、他のデータ レイク コンポーネントをバック アップする、Isilon、NetWorker、ECS(Elastic Cloud Storage)のデータ保護オプションについ ても触れます。

(2)

この資料に記載される情報は、「現状有姿」の条件で提供されています。EMC Corporationは、この資料に記載される情報に関する、どのような 内容についても表明保証条項を設けず、特に、商品性や特定の目的に対する適応性に対する黙示の保証はいたしません。

本文書に記載される、いかなるEMCソフトウェアの使用、複製、頒布も、当該ソフトウェア ライセンスが必要です。

EMC2EMC、およびEMCのロゴは、EMC Corporationの登録商標または商標です。 その他のすべての商標は、各社の商標又は登録商標で

す。Copyright © 2016 EMC Corporation. All rights reserved.(不許複製・禁無断転載) Published in the USA. 10/16、ホワイト ペーパー、 H13932.4-J

EMC Corporationは、この資料に記載される情報が、発行日時点で正確であるとみなしています。予告なく変更される場合があります。 EMCは現在、Dell企業グループの一社です。

(3)

目次

エグゼクティブ

サマリー...5

課題

... 5

ソリューションの概要

... 5

はじめに

...5

受講対象者

... 5

バックグラウンド

...5

データ

レイクとは ... 5

Hadoop はほとんどのデータ レイクの基盤 ... 6

Cloudera Enterprise ... 6

Hortonworks Data Platform ... 7

一般的な

Hadoop 導入モデル... 8

データ保護は、

Big Data を企業に導入する際の障壁となる ... 8

DELL EMCのデータ保護ソリューションによるHADOOPのバックアップ/リカバリ ...9

Hadoop をバックアップする際に固有の考慮事項 ... 9

Dell EMC Data Domain 保護ストレージの概要情報 ... 9

Dell EMC DD Boost for Enterprise Applications ... 9

DD Boost for Enterprise Apps による Hadoop バックアップの運用化 ... 11

Hadoop 向け DD Boost for Enterprise Apps のメリット ... 12

DELL EMCのその他のデータ レイク保護ソリューション...12

Dell EMC のその他のデータ レイク保護ソリューションの概要 ... 12

Dell EMC のターゲット ストレージ オプション ... 13

Dell EMC Isilon スケールアウト NAS ストレージの概要情報 ... 13

Dell EMC ECS(Elastic Cloud Storage)の概要情報... 13

ECS による Hadoop 分散コピーのデータ保護 ... 13

ECS による Hadoop 分散コピーのデータ保護を使用するメリット... 14

NetWorker Snapshot Management による Isilon スナップショットの管理の概要 ... 14

NetWorker Snapshot Management による Isilon から Data Domain へのスナップショットの管理 ... 14

NetWorker による Isilon から Data Domain へのスナップショットの管理を使用するメリット ... 15

NetWorker による Isilon から Isilon へのスナップショットの管理 ... 15

(4)

NetWorker Snapshot Management による Isilon から ECS へのスナップショットの管理 ... 16

NetWorker による Isilon から ECS へのスナップショットの管理を使用するメリット ... 17

お客様のメリット

...17

(5)

5

エグゼクティブ

サマリー

企業におけるBig Data分析は急速に成熟しており、企業の革新的なビジネス上の成果を促進しています。Big Data分析が企業のビジネスの意 思決定を促進し、新しいミッション クリティカルなアプリケーションになるのは時間の問題です。今日のBig Dataのユースケースは急速に成熟して いますが、堅牢なデータ保護戦略がないまま本番稼動を迎えるケースも少なくありません。スナップショットとレプリケーションを活用する自社製 のバックアップ アプローチは、他のワークロードのための標準となるエンタープライズ クラスの信頼性、可用性、保守性に関する期待に直面して 限界を迎えています。Hadoopは業界をリードするBig Dataフレームワークであり、そうしたソリューションを使用して環境内の他のアプリケーショ ンを保護している企業は、Hadoop向けの真のバックアップ/ディザスタリカバリがないことをよく知っています。企業は、バックアップからディザスタ リカバリまでを網羅する包括的なデータ保護のシナリオをHadoopに求めています。

Dell EMC®は、Dell EMC Data Protection Suite Family®の一部であるDD Boost for Enterprise Applications®の課題においてさらなる進歩 を遂げ、Hadoop向けの専用バックアップ アプリケーションを提供します。Hadoop管理者は、市場をリードするDell EMCの保護ストレージである Data Domain®システムとのやり取りをネイティブUIによって実行しながら、Hadoopデータをバックアップ/リカバリできるようになりました。

課題

ネイティブのHadoopには、真のポイント イン タイムのバックアップ機能がありません。スナップショット機能およびレプリケーション機能は提供さ れますが、こうした機能ではソフトウェア エラー、データ破損、人為的ミスの復旧には不十分です。Hadoopにエンタープライズ対応バックアップ/ ディザスタリカバリ機能が欠如していることは、企業でHadoopを導入するうえでの大きな妨げになっています。Big Dataアプリケーションが主流 になると、ダウンタイムやデータロスによるビジネス上のリスクが大きくなります。そのため企業は、ITワークロードの主流と同様のSLAに従って Hadoopデータを保護したいと考えています。

ソリューションの概要

Dell EMCは、Hadoopとその他のBig Data環境に関連する課題に対処するため、効果的なデータ保護戦略を提供しています。このホワイト ペー パーでは、Dell EMC Data Protection Suiteファミリーの一部としてライセンス供与されるDD Boost for Enterprise Applicationsと、Dell EMCビ ジネス データ レイク向け保護ソリューションのその他のオプションについて説明します。含まれているオプションは次のとおりです。

• ClouderaおよびHortonworksディストリビューションによって構築され、コマンド ライン ツールとCloudera ManagerやHortonworks Ambariなどのネイティブ管理UIを使用して管理されるHadoopシステム。

• ローカルDASストレージまたはDell EMC Isilon®などの共有ストレージ システムを使用して構築されたHadoopクラスタのサポート。 • Hadoopネイティブの構成要素の使用とHadoopファイル システムへの統合。

• Hadoopおよび他のBig Dataフレームワークをバックアップするための他のDell EMC製品(NetWorker®、Isilon、Data Domain保護ス トレージ、ECS(Elastic Cloud Storage®)など)。

はじめに

このホワイト ペーパーの目的は、データ レイク、特にHadoopの保護が非常に重要になっている理由に関する背景情報を提供し、Hadoopを保 護するためのさまざまなDell EMC保護ソリューションについて説明することです。このホワイト ペーパーは、データ レイクの導入とBig Dataフ レームワークによって、お客様がビジネス バリューと運用効率を高めるために役立ちます。

受講対象者

このホワイト ペーパーは、ITおよびHadoop管理者、システム エンジニア、そしてDell EMCとパートナー企業のプロフェッショナル サービス コミュ ニティのメンバーであり、Dell EMCビジネス データ レイク保護ソリューションについての理解を深め、ソリューションの導入を検討されているパー トナー様を対象としています。

バックグラウンド

データ

レイクとは

簡単に言えば、データ レイクとは、広範なソースからデータを収集し、そのデータを多くの分析アプリケーションに提供する単一のセントラル リポ ジトリです。データ レイクは構造化データ、半構造化データ、非構造化データの組み合わせで構成されます。さまざまな分析アプリケーションは、

(6)

この「レイク(湖)」のデータを利用することで、データの再利用性と整合性を通じて効率性を高めています。データ レイクはEDW(エンタープライ ズ データ ウェアハウス)から進化したものですが、EDWとは違ってデータ レイクには初期のスキーマは不要です。そのため、HadoopやNoSQL データベースなど、こうした新しいデータ ソースを分析できる新たな分析フレームワークをサポートすることができます。この柔軟性により、お客 様はその他多くのデータ ソースを簡単に追加でき、そのデータに基づいてより優れたビジネスの意思決定を行うことができます。 データ レイクには、次の図1に示すように、従来型エンタープライズ アプリケーションから、半構造化データと非構造化データの新しいソースまで、 さまざまなデータ ソースが集約されます。

HADOOP はほとんどのデータ レイクの基盤

Hadoopは、さまざまな規模と速度のデータ ソースからの大量のデータを管理するためのオープン ソースのデータ プラットフォームです。 Apache Software Foundationによって管理されるHadoopは、当初、大規模なWeb企業への急速な導入が見られました。Clouderaや Hortonworksなどの企業が商用サポートを提供するディストリビューションが出現したことで、Hadoopは企業全体への導入が急速に進ん でいます。 Hadoopは、コモディティ サーバのクラスタ全体で大規模なデータセットを分散処理する際の性能に優れています。特に、従来の構造化データ ソースに加えて、膨大な非構造化データや半構造化データを受信して処理し、分析するのが得意です。このような点で品質が優れていることから、 Hadoopは分析プラットフォームとしての知名度を高めています。市場調査によると、HadoopはBig Dataシステムの約60%に含まれており、Big Dataプラットフォームとしてもっとも普及しているものです。 多くのBig Dataシステムには半構造化データと非構造化データも含まれており、多くの場合、Hadoopシステム(データ レイク)のデータを供給す る処理と、必要に応じて処理結果をデータ レイクに戻す処理も行います。したがってほとんどのデータ レイクの実装は、Hadoopを中心に展開さ れています。

CLOUDERA ENTERPRISE

CDH(Cloudera Enterprise)は、下の図2に示すように、Apache Hadoopと他の多くのオープン ソース プロジェクトがパッケージ化されたもので、 企業で使用されている一般的な商用Hadoopディストリビューションの1つです。クラスタのモニタリング、管理、操作はCloudera Manager UIから 実行します。

(7)

HORTONWORKS DATA PLATFORM

次の図3に示すHortonworks分析プラットフォームも、Apache Hadoopを基盤とした企業の間で普及しているものです。バッチ処理、ストリーミン グ、リアルタイムなど、広範な分析システムのためのApache Hadoopコンポーネントがパッケージ化されています。モニタリング、管理、運用は Hortonworks Ambari UIから実行します。Hortonworksは、Hadoopへのセキュリティ機能の追加も重視しています。

2:Cloudera Enterprise

(8)

一般的な

HADOOP 導入モデル

ディストリビューションに関係なく、Hadoopを導入する一般的な方法は3つあります。次の図4にその方法を示します。

データ保護は、

BIG DATA を企業に導入する際の障壁となる

Big Data分析が次のミッション クリティカルなエンタープライズ アプリケーションになりつつある今、企業はBig Dataシステム、特にHadoopのた めの堅牢なレベルのバックアップ、リカバリ、ディザスタリカバリ ソリューションを求めています。しかしネイティブのHadoopには、真のポイント イ ン タイムのバックアップ機能がありません。スナップショット機能およびレプリケーション機能は提供されますが、こうした機能ではソフトウェア エ ラー、データ破損、人為的ミスの復旧には不十分です。小規模で実験的なシステムでは、スナップショット機能とレプリケーション機能があれば バックアップとDRの戦略として十分です。 企業がアプリケーションの本番稼動を口にするとき、その企業にはアプリケーションの信頼性、アップタイム、復旧可能性に関する具体的な期待 値があります。そのような状況になると、スナップショット機能とレプリケーション機能だけではデータ保護戦略として不十分です。これらのアプ ローチの長所と短所を次にいくつか示します。 メリット デメリット スナップショット • 迅速なリカバリ • 人為的なミスからの保護 • Hadoop への組み込み • ストレージ要求量が多い:高価なプライマリ ストレー ジを消費 • 大規模環境の管理に時間がかかる • プライマリ ストレージ上で稼動(同じ障害ドメイン内) レプリケーション • 別のシステム上のコピー • Hadoop への組み込み • 同等のテクノロジーが必要 • ソフトウェアのバグや人為的ミス、データの破損から の防御にならない • ポイント イン タイム コピーでない バックアップ戦略の基本的な目的は次のとおりです。 1. 別の異なるシステム上にオリジナル データの真のポイント イン タイム コピーを作成する 2. 既知の正常なポイント イン タイムに戻すリカバリを実行できるようにする ご覧のように、Hadoopの組み込み型プリミティブは、真のバックアップ シナリオとは言えません。他のITアプリケーション向けにバックアップ製品 を使用している企業はこれを認識しており、Hadoop向けの真のバックアップ機能を求めています。ビジネス上の意思決定のために分析がますま す重要視され、依存度が高まっているので、ダウンタイムやデータロスのコストは非常に大きくなる可能性があります。そのため、Hadoopには バックアップ/リカバリ機能が必要です。

4:一般的な Hadoop 導入モデル

(9)

Dell EMC のデータ保護ソリューションによる Hadoop のバックアップ/リカバリ

HADOOP をバックアップする際に固有の考慮事項

Hadoopと従来のエンタープライズ システムのアーキテクチャには、次のような決定的な違いがあります。 • Hadoopは、コモディティ サーバとストレージのクラスタを基盤とするスケールアウト システムとして設計されており、個別コンポーネント の障害への耐性があります。多くのサーバ、つまり「ノード」間でデータを並列処理するように設計されています。 • HDFS(Hadoopファイル システム)も分散化されているという特性があります。HDFS内に格納されるファイルはブロックに分割され、シ ステム内のノード間に分散されます。 • ほとんどの場合、Hadoopクラスタはサーバ ローカル ディスク(DASストレージとも呼ばれる)上に導入されます。Hadoopを導入するも う1つの方法として、Dell EMC IsilonでHDFSとのネイティブ統合を利用するなど、共有(NFS)ストレージ システムに導入する方法があ ります。 • HDFSは、複数ノードの各ブロックを(通常は3回)レプリケートして冗長性を持たせることで、高可用性を提供します。 • Hadoopシステムは専任の管理者によって運用され、管理されます。そのため、ほとんどの場合、Hadoopのバックアップ/リカバリの責 任者は、バックアップやストレージの管理者ではなくHadoop管理者です。 したがって、HDFSをバックアップするには、HDFSとクラスタの管理ノード(ネーム ノードとも呼ばれる)にバックアップ アプリケーションを統合する 必要があります。HDFSのデータ ボリュームは大規模になる可能性があるため、バックアップ ウィンドウを適切なサイズにするには並列データ転 送が必要です。

DELL EMC DATA DOMAIN 保護ストレージの概要情報

Dell EMC Data Domain保護ストレージ システムは、業界をリードする速度と効率性によって最大68 TB/時のスループットを実現し、バックアップ をより短時間で完了し、バックアップ ウィンドウに対するプレッシャーを低減します。Data Domainシステムでは可変長重複排除を採用することに より、ディスク要件を最小限に抑え、あらかじめ重複排除済みのディスク上にデータを保存します。このシステムにより、バックアップ/アーカイブ ストレージの要件が平均10分の1~30分の1まで削減され、ディスクはコスト パフォーマンスに優れた、テープの代替となります。ディスク上の データは長期間にわたってオンラインかつオンサイトで利用でき、高速で信頼性の高いリストアと回復が実現します。この効率性により、Data Domainシステムは論理容量最大150 PBのバックアップ/アーカイブ データを1つのシステムで保護できます。

DD Boost(Data Domain Boost)は、バックアップ パフォーマンスを最大50%向上させ、帯域幅の使用量を最大99%削減する機能です。自動リ ンク統合とパス フェールオーバーによってバックアップの成功率が向上するだけではなく、他にもNFS経由のバックアップに比べていくつものメ リットがあります。

Data Domainシステムは、最終手段となるストレージとして設計されており、信頼性の高い方法で確実にデータをリカバリできるように構築されて います。Data Domain Data Invulnerability ArchitectureがあらゆるDD OS(Data Domain Operating System)に組み込まれているため、デー タ整合性の問題に対して業界でもっとも優れた防御策を提供します。Data Domainシステムの詳細については、「Dell EMC Data Domainデータ

シート」、「Data Domain Boostのビジネス バリュー」、「Dell EMC Data Domain Data Invulnerability Architectureホワイト ペーパー」を参照し

てください。

DELL EMC DD BOOST FOR ENTERPRISE APPLICATIONS

DD Boost for Enterprise Applicationsは、Dell EMC Data Protection Suiteファミリーのコンポーネントとして入手できます。DD Boost for Enterprise Appsは、DD Boostプロトコルを通じて、Dell EMC Data Domain保護ストレージに対するデータの真のポイント イン タイム バック アップ/リカバリを提供し、アプリケーションとの統合でアプリケーション エージェント( Microsoftアプリケーション エージェント、データベース アプリ ケーション エージェント、Hadoopアプリケーション エージェント)を使用します。Hadoopアプリケーション エージェントは、Big Dataのワークロード を保護する場合に使用されます。Data Domainシステムのストレージ効率と信頼性に、ネットワーク効率に優れたDD Boostプロトコルを組み合 わせて活用しているDD Boost for Enterprise Appsを利用することで、Hadoop管理者はCLIコマンド セットによって独自のバックアップ/リカバリ を実行できます。

DD Boost for Enterprise AppsとData Domainを基盤とするHadoop環境向けバックアップ ソリューションの技術的な特長は次のとおりです。 • Data Domainシステムに対するHadoopデータの真のポイント イン タイム バックアップ/リカバリです。

(10)

10 • HDFSの統合が3方向のストレージ冗長性を通じて透過的に動作し、データの一貫性のあるコピー1つをバックアップします。 • 分散型DD Boostエージェントを生成して、Data Domainシステムへのデータ転送を並列処理するために、標準のHadoop構成要素 (MapReduceやDistCpなど)を使用します。 • DD Boostの帯域幅効率性を備え、一意のデータのみをネットワーク経由で送信します。 • 管理とツール使用がシンプルです。個別のDD Boostエージェントを導入または管理する必要はありません。Hadoop管理者がHadoop クラスタ管理者コンソールからバックアップ/リカバリを実行します。

• DD Boost for Enterprise Appsには、バックアップ、リカバリ、ファイル検索、保存などのためのLinuxコマンド セットが用意されています。 各Hadoop管理者は、これらのコマンドをすぐに使用して他のワークフローに組み込むことできます。

• Oozieを使用して、バックアップ処理のスケジュールを詳細に設定したり、自動化したりできます。 • 構成変更の監査ログ

次の表は、Hadoopデータ保護用のDD Boost for Enterprise Applicationsについての要点を示しています。 バックアップ ソース HDFS ディレクトリと HBase テーブル

Cloudera Manager と Hortonworks Ambari

これらのソース/ターゲット Data Domain システム間でバックアップ ポリシーを関連 づけることができます。

バックアップ ターゲット 1 つまたは複数の Data Domain システム、DD Boost のライセンスを含む サポートされるストレージ構成 サーバ ローカル DAS(直接接続型)ストレージ

共有(NAS)ストレージ システム(Dell EMC Isilon など) ユーザー インターフェイス Linux コマンドライン アプリケーション

サポートされるディストリビューション Cloudera Enterprise 5.4 以降 Hortonworks Data Platform 2.2 以降

スケジュール設定と自動化 なし。スケジュール設定はOozie または cron を使用して実行可能

DD Boost for Enterprise Appsに必要な構成は最小限で、Hadoopクラスタのネーム ノードにのみインストールされます。Hadoopファイル シス テムと緊密に統合され、Hadoopのスケールアウト分散処理アーキテクチャを活用し、HadoopからData Domainシステムへのデータ転送を並列 処理します。DD Boostは、クライアント側重複排除を使用したネットワーク効率の高いデータ転送を提供し、Data Domainは重複排除と圧縮を 使用することでストレージ効率を高めます。これらが一体となり、HadoopクラスタからData Domainターゲット システムへ、大量のデータを移動 するもっとも効率の良い方法を提供しています。タスクを実行するには、分散ファイル コピーとHDFS/HBaseスナップショットなど、内部標準の Hadoop構成要素を活用します。

(11)

DD BOOST FOR ENTERPRISE APPS による HADOOP バックアップの運用化

プロビジョニングとセットアップのワークフローの概要:

• Hadoopクラスタのネーム ノードにアプリケーションをインストールします。

• 1つまたは複数のData Domainシステム(バックアップ ターゲット)をプロビジョニングします。他のワークロードをバックアップしている既 存のData DomainシステムでDD OS 6.0以降が実行されていれば、そのシステムにDD Boost for Enterprise Appsのバックアップを 送ることができます。

• DD Boost for Enterprise Appsのバックアップ ストリームを受信するには、ターゲットData Domainシステムにストレージ ユニットが1つ 以上プロビジョニングされている必要があります。 • Kerberos認証(Hadoopクラスタで有効化されている場合)は、この時点で有効にする必要があります。 バックアップとリストア処理のワークフローの概要: • バックアップ対象のHDFSディレクトリまたはHBaseテーブルを、バックアップが格納されるターゲットData Domainシステムおよびスト レージ ユニットに関連づけます。これは、バックアップのプロビジョニング手順です。 • バックアップをプロビジョニングする際には、保存期間の特性も指定します。 • 必要に応じて、プライマリ バックアップData Domainシステムからレプリケートされたバックアップを受信するセカンダリ(またはリモート) Data Domainシステムを指定できます。 • プロビジョニングされると、バックアップ コマンドにより、選択したHDFSディレクトリまたはHBaseテーブルがプロビジョニングされたData Domainシステムとストレージ ユニットにバックアップされます。バックアップ プロセスでは作業の過程でHDFSスナップショットを使用す るため、バックアップ対象のディレクトリまたはテーブルでスナップショットが有効になっていることを確認します。 • リストアが必要な場合、バックアップ一覧コマンドを実行するとターゲットData Domainシステム上のバックアップ カタログが表示され、 リストア ポイントを選択できます。目的のHDFSディレクトリまたはHBaseテーブルをリストアしてHDFSに戻すには、restoreコマンドを使 用します。 • HDFSと統合されているため、バックアップは実際にはHDFSからData DomainシステムへのDistCpジョブとして実行され、リストアは 逆方向のDistCpジョブとして実行されます。重要な違いは、このプロセスがバックグラウンドで透過的に実行され、ユーザーはこのプロ セスを一切管理する必要がないということです。 • バックアップとリストアでは、重複排除、ダイナミック インターフェイス グループ、TLS暗号化という固有のメリットを備えたDD Boostを内 部的に活用します。 Hadoopの保護のためのコマンド セットには以下があります。

Data Domain の構成 • Data Domain システムの追加/削除 • 構成の参照

• Data Domain システムへの接続テスト バックアップのプロビ

ジョニング

• ソースの HDFS ディレクトリまたは HBase テーブルを Data Domain ターゲットに関連づける • 保存期間の設定 • セカンダリ(オフサイト)Data Domain ターゲット システムの設定 バックアップ • HDFS ディレクトリ/HBase テーブルのバックアップ • マスター構成のバックアップ リストア • HDFS ディレクトリ/HBase テーブルのリストア • 1 つのサブディレクトリをバックアップからリストア • マスター構成のリストア ファイルの検索 • サブディレクトリ/ファイルのバックアップの検索 • 正規表現によるバックアップの検索

(12)

保存期間管理 • 絶対保存期間の変更 • 相対保存期間の変更 有効期限 • 古いバックアップの使用期間の終了 バックアップの一覧表示 • 単一バックアップの表示 • バックアップの一覧表示[範囲/日付フィルター] • 構成の一覧表示 削除 • 単一バックアップの削除 • バックアップの削除[範囲/日付フィルター] Kerberos • Kerberos 認証の有効化/無効化

HADOOP 向け DD BOOST FOR ENTERPRISE APPS のメリット

DD Boost for Enterprise Applicationsは、Hadoopデータ向けに真のバックアップ/リカバリ ソリューションを提供します。バックアップ/リカバリの 管理は、Hadoop管理者がHadoopネイティブ ツールを使用してクラスタ管理ツールから行います。アプリケーション中心のバックアップ ワークフ ローであるため、習得に要する期間が短くて済みます。作業全体は、スナップショットの管理やカスタム スクリプトによるレプリケーションの管理を 行う場合のように煩雑ではなく、バックアップ アプリケーションを使用する場合のように簡単です。

HDFSと緊密に統合されているため、Data Domainとの間のデータ バックアップ/リカバリでは、標準のHadoop構成要素とMapReduce、Yarn、 DistCpなどのツールを使用できます。 DD Boostは、クライアント側重複排除を使用したネットワーク効率の高いデータ転送を提供し、Data Domainは重複排除と圧縮を使用すること でストレージ効率を高めます。これらが一体となり、HadoopクラスタからData Domainターゲット システムへ、大量のデータを移動するもっとも効 率の良い方法を提供しています。その一方で、ユーザーには、BoostエージェントまたはNFSマウントのいずれかを個別に管理して操作性を向上 する責任はありません。ノードごとにエージェントを個別に管理することは、Hadoopなどのスケールアウト システム向けの拡張性に優れた戦略 ではありません。

Dell EMC のその他のデータ レイク保護ソリューション

DELL EMC のその他のデータ レイク保護ソリューションの概要

Dell EMCは、他にもビジネス データ レイクの保護のためにいくつかのソリューションを提供しています。共有ストレージ導入環境のDell EMC NetWorker Snapshot Managementによって管理されるIsilonスナップショット、およびDell EMC Elastic Cloud Storageです。次の図6はこれら のソリューションを示したものです。これらについては、このホワイト ペーパーの後半で詳しく説明します。

(13)

DELL EMC のターゲット ストレージ オプション

次のいくつかの段落で詳しく説明するように、図6に示すDell EMCのビジネス データ レイク保護ソリューションでは、アクセス性、ストレージ効率、 容量のニーズなどさまざまな要因に応じて、Dell EMC Data Domain、Dell EMC Isilon、またはDell EMC ECS(Elastic Cloud Storage)をター ゲット ストレージとして活用できます。Data Domainシステムは、重複排除に適しているワークロード(データベース、ファイルなど)に最適であり、 業界をリードする可変長重複排除と圧縮によってストレージ コストを削減します。Isilonは重複排除に適していないデータセット(ビデオ、音声など) に最適であり、単一システムから効率的でコスト パフォーマンスの高いストレージを提供します。ECSは、クラウド(エクサバイト)規模のオブジェ クト ワークロードに適しています。

DELL EMC ISILON スケールアウト NAS ストレージの概要情報

Dell EMC Isilonスケールアウト ストレージ ソリューションは、ストレージの管理ではなくデータの管理に集中したい企業向けのソリューションです。 Isilonのストレージ システムはパワフルで、しかもインストールと管理が容易で、ほぼあらゆる規模に拡張できます。また、従来のエンタープライ ズ ストレージとは異なり、Isilonのソリューションのシンプルさは、追加されるストレージ容量、必要とされるパフォーマンス、将来のビジネス ニー ズがどう変化しても変わりません。Isilonは企業のお客様にストレージについて違う見方をして頂くことで、よりシンプルで優れた方法、つまりDell EMC Isilonがあることをお分かりになれると考えています。 画期的なIsilon OneFSオペレーティング システム、高パフォーマンスの業界標準ハードウェア、強力なデータおよびストレージ管理ソフトウェアを 組み合わせたIsilonの革新的なストレージ ソリューションの完全なポートフォリオは、ミッション クリティカルなアプリケーション、ワークフロー、プロ セスを最適化してお客様のビジネス バリューを高めます。Isilonストレージを導入した世界中の企業や調査研究機関は、急増する大量のデータ を、拡張性とコスト パフォーマンスに優れた方法で簡単に管理しています。すべてのIsilonソリューションは、ミッション クリティカルなデータの増 加に合わせてストレージをシームレスに拡張しながら、ワークフローの生産性を高め、設備投資と運用コストを削減することができるように設計さ れています。Isilonの詳細については、「Dell EMC Isilonデータ シート」を参照してください。

DELL EMC ECS(ELASTIC CLOUD STORAGE)の概要情報

お客様は、今日のハイパースケールな拡張に対応するための、より効率的なアーキテクチャを探し求めています。Dell EMC ViPR®を搭載した 新しいECS™(Elastic Cloud Storage)アプライアンスは、最新のアプリケーションの要件に対応する、包括的なハイパースケール ストレージ イ ンフラストラクチャを実現します。どのような規模の組織でも、ECSアプライアンスを使用することで、競争優位性が高く、拡張性に優れたクラウド ストレージ サービスを提供できるようになります。ECSアプライアンスは、パブリック クラウド サービスのコスト プロファイル、シンプルさ、拡張性 とともに、Dell EMCならではの信頼性とサポートをあらゆるユーザーにもたらします。ECSアプライアンスによって、次のことを実現できます。 • データ サイエンティスト:Big Dataイニシアティブを促進 • クラウド プロバイダー:規模に応じた競争力のあるクラウド ストレージ サービスを実現 • 企業およびソフトウェア開発者:開発を加速 ECSアプライアンスを使用すると、ViPRの機能と低コストで高密度のスケールアウト コモディティ ハードウェア プラットフォームを組み合わせるこ とで、あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます。ECSアプライアンスは、段階的に導入して 拡張できる多数のフォーム ファクタで使用できるため、お客様はそれぞれの当面のニーズと予定される拡張に合った規模を選択できます。その 結果、アプリケーションとアクセスのニーズに基づいてソリューションを最適化でき、必要な柔軟性と管理性を得られます。Elastic Cloud Storage の詳細については、「Dell EMC ECSデータ シート」を参照してください。

ECS による HADOOP 分散コピーのデータ保護

このセクションでは、HDFS(Hadoop File System)に組み込まれたネイティブのDistCp(分散コピー)ユーティリティを活用して、統合されたコン ピューティングとストレージのデータ レイクをオン プレミスのElastic Cloud Storageアプライアンスにバックアップ/リストアする方法についての詳 細を説明します。 このソリューションのターゲット ストレージとしてECSを使用することは、主に次の3つの要因を考慮してお客様が選択します。 1. Data Domainシステムが提供する可変長重複排除と圧縮では、データのストレージ コストを大幅に削減することはできないのをすでに 承知しているかどうか。 2. ECSが提供するハイパースケールが必要かどうか。(エクサバイト) 3. オブジェクト/HDFSへのアクセスが必要かどうか。

(14)

DistCp(分散コピー)は、すべてのHadoopディストリビューションおよびバージョンに付属する、Hadoopのディレクトリ全体をコピーするために使 用できる標準ツールです。DistCpはMapReduceジョブとして実行されます。必要に応じてシステムを最大限に活用し、ファイルのコピーを並列で 実行します。帯域幅を制限して他のタスクへの影響を制御するオプションもあります。 このソリューションは、2つの方法で使用できます。 1. 1つ目の方法では、HadoopアプリケーションからHDFSのスナップショットを取得し、DistCpを使用して、そのスナップショットをターゲット ストレージに移動します。 2. 2つ目の方法では、ターゲット ストレージに対して直接DistCpを使用します。最初のアプローチのメリットは、スナップショットが終了した 後にアプリケーションが解放されることです。 このデータ レイク保護シナリオでは、Hadoop管理者はDistCpを使用し、Ethernet経由でNFSを使用してオン プレミスのECSアプライアンスへの フル バックアップを実行します。 ECSから従来のHadoopインフラストラクチャにDistCpバックアップをリストアする標準的な方法では、DistCpを逆方向で実行します。これを行う には、ソースとターゲットのパスをスワップするだけです。一部または全体のリストアを実行でき、リストア先には元の場所または別の場所を指定 することができます。 お客様は、ディザスタリカバリの保護を強化するために2番目のサイトにインストールされた別個のECSアプライアンスでECSレプリケーションを 活用することを選択できます。ディザスタリカバリのため、2番目のサイトのECSアプライアンスからDistCpのリストアを実行できます。

ECS による HADOOP 分散コピーのデータ保護を使用するメリット

お客様は、分散コピー データ レイクをElastic Cloud Storageで保護することで、非常に重要なメリットを達成できます。まずもっとも重要なことは、 このビジネス データ レイク保護ソリューションが、Hadoopをデータロスや破損から守るエンタープライズ クラスのデータ保護を提供するというこ とです。また、このソリューションはHadoop管理者に対して、データ レイクの保護に関する直接的な可視性と制御も提供します。 ECSアプライアンスを使用すると、ViPRの機能と低コストで高密度のスケールアウト コモディティ ハードウェア プラットフォームを組み合わせるこ とで、あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます。ECSアプライアンスは段階的に導入および 拡張できるので、差し迫ったニーズや成長予測に応じた適切なサイズを選択できます。ECSでは、アプリケーション、ストレージの要件、アクセス に関するニーズに基づいてデータ レイク保護ソリューションを最適化できるので、必要な柔軟性と制御を確保することができます。

お客様がすでに他のニーズのためにElastic Cloud Storageを使用している場合は、データ レイクを保護するために同じプロセスと専門技術を活 用できます。

NETWORKER SNAPSHOT MANAGEMENT による ISILON スナップショットの管理の概要

NetWorker Snapshot ManagementによるIsilonスナップショットの管理(図6の右側を参照)は、コンピューティングとストレージが分離され、 HDFSレイヤーが共有ストレージ上で実行されているデータ レイク導入環境に適用されます。共有ストレージが使用されているため、お客様はス トレージ レイヤーに組み込まれたデータ管理機能をすべて使用することができます。つまり、お客様は、NetWorkerによって管理されるIsilonス ナップショット機能を活用することができ、Data Domain保護ストレージへのロール オーバーを行うこともできます。ロールオーバーとは、スナップ ショットからセカンダリ ストレージ デバイスへのバックアップをNDMP経由で実行することです。これは通常、データの長期保存が必要な場合に 行います。

NETWORKER SNAPSHOT MANAGEMENT による ISILON から DATA DOMAIN へのスナップショットの管理

このセクションでは、コンピューティングとストレージが分離され、HDFSレイヤーがIsilonストレージで実行されているデータ レイク導入環境にお けるEMC NetWorkerスナップショット管理の活用についての詳細を説明します。共有Isilonストレージが使用されているため、お客様はストレー ジ レイヤーに組み込まれたIsilonデータ管理機能をすべて使用することができます。このデータ レイク保護シナリオでは、NetWorkerがIsilonス ナップショットを管理し、スナップショットはオン プレミスのData Domainストレージ システムにロールオーバーされます。 このソリューションのターゲット ストレージとしてData Domainシステムを使用することは、主に次の3つの要因を考慮してお客様が選択します。 1. 自社のデータに対してData Domainの可変長重複排除と圧縮ストレージのメリットがあるか。 2. Data Domainストレージの拡張性がニーズに合っているか。(テラバイト) 3. NFSはアクセス性の要件を満たしているか。

(15)

NetWorker管理者は、1つのポリシーを定義してデータ保護プロセスを自動化することができます。このポリシーには、データ レイクのIsilonシス テム上でスナップショットを開始し、Ethernet経由でNDMPテープ サーバを使用して、Isilonのスナップショットをオン プレミスData Domainシステ ム上へロールオーバーする処理が含まれます。Data Domainシステムはスナップショット データを取得し、可変長重複排除と圧縮を実行します。 NetWorkerは、すべてのバックアップ、スナップショット、クローンのカタログを保持しており、このデータ レイク保護ソリューションのリストアをシン プルで分かりやすくしています。NetWorkerでは、スナップショットの保存期間を管理することもできます。リストアを実行する場合、NetWorker管 理者は、最初のスナップショットからすばやく簡単にリストアできます。あるいは、Data DomainシステムにロールオーバーされたNDMPバック アップ セーブセットのいずれかを選択し、Ethernet経由のNDMPを使用して、プライマリIsilonシステムにリストアします。スナップショットからリス トアする場合は、RTOが大幅に短縮されるというメリットがあります。また、Data Domain上のバックアップからリカバリする場合は、長期間の RPOにすばやくアクセスできます。NetWorkerは一部または全体のリストアを実行でき、リストア先には元の場所または同じデバイス上の別の場 所を指定することができます。 お客様は、ディザスタリカバリの保護を強化するために2番目のサイトにインストールされた別個のData Domainシステムで、NetWorkerが管理 するレプリケーションを活用することを選択できます。NetWorkerは、ディザスタリカバリのために、2番目のサイトのData Domainシステムからリ ストアを実行することができます。

NETWORKER による ISILON から DATA DOMAIN へのスナップショットの管理を使用するメリット

お客様は、NetWorkerでIsilonのスナップショットを管理してData Domainシステムでデータ レイクを保護することで、重要なメリットを達成できま す。まずもっとも重要なことは、このビジネス データ レイク保護ソリューションが、Hadoopをデータロスや破損から守るエンタープライズ クラスの データ保護を提供し、優れたRTOを実現するということです。 NetWorkerスナップショット管理は、アレイのスナップショットとData Domainへのロールオーバーを自動化することで、データ保護プロセスを簡素 化します。このデータ保護ソリューションは、最初のスナップショットからのリカバリや、Data Domain保護ストレージ上のセーブセットからのロー ルオーバーによるリカバリなど、複数のリカバリ オプションを提供します。 Data Domainのデータ非脆弱性アーキテクチャは、必要なときにデータ レイクからデータをリカバリできることと、データが信頼できることを保証 するクラス最高のデータ保護を提供します。Data Domainシステムは、可変長重複排除と圧縮によってストレージ効率を高めており、通常はスト レージ要件が10分の1~30分の1まで削減されます。また、Data Domainシステムは非常に高速で、最大68 TB/時の速度でデータを取得でき、 データ レイクの保護バックアップを完了するまでに要する時間が最小限に抑えられます。お客様がすでにデータ保護に関する他のニーズのため にNetWorkerを使用している場合は、データ レイクを保護するために同じプロセスと専門技術を活用できます。最後に、NetWorkerを活用して帯 域幅効率に優れたData Domainレプリケーションを管理し、ディザスタリカバリ オプションのために用意した2番目のサイトのData Domainシステ ムへレプリケートすることができます。

NETWORKER による ISILON から ISILON へのスナップショットの管理

このセクションでは、コンピューティングとストレージが分離され、HDFSレイヤーがIsilonストレージで実行されているデータ レイク導入環境にお けるDell EMC NetWorkerスナップショット管理の活用についての詳細を説明します。共有Isilonストレージが使用されているため、お客様はスト レージ レイヤーに組み込まれたIsilonデータ管理機能をすべて使用することができます。このデータ レイク保護シナリオでは、NetWorkerが Isilonスナップショットを管理し、スナップショットは2番目のオン プレミスIsilonストレージ システムにレプリケートされます。 このソリューションでIsilonのスナップショットとレプリケーションによる保護を使用することは、主に次の4つの要因を考慮してお客様が選択します。 1. Data Domainシステムが提供する可変長重複排除と圧縮では、データのストレージ コストを大幅に削減することはできないのをすでに 承知しているかどうか。 2. 保護が必要なデータ量を割り当てられたバックアップ ウィンドウ内で保護可能かどうか。 3. Isilonストレージの拡張性がニーズに合っているか。(ペタバイト) 4. お客様の組織にはNFS/SMB(CIFS)/HDFSのアクセス性の要件があるか。 NetWorker管理者は、1つのポリシーを定義してデータ保護プロセスを自動化することができます。このポリシーには、データ レイクのIsilonシス テム上でスナップショットを開始し、Isilon SyncIQを使用して、Isilonのスナップショットを2番目のオン プレミスIsilonシステム上へ自動制御によっ てレプリケートする処理が含まれます。2番目のIsilonシステムには、NetWorkerとIsilon SyncIQによってレプリケートされているスナップショット データのコピーが保存されます。

NetWorkerは、すべてのバックアップ、スナップショット、クローンのカタログを保持しており、このデータ レイク保護ソリューションのリストアをシン プルで分かりやすくしています。NetWorkerでは、スナップショットの保存期間を管理することもできます。リストアを実行する場合、NetWorker管 理者は、最初のスナップショットからすばやく簡単にリストアできます。あるいは、ターゲットIsilonシステムにレプリケートされているスナップショッ

(16)

トのいずれかを選択して、プライマリIsilonシステムにリストアします。NetWorkerは一部または全体のリストアを実行でき、リストア先には元の場 所または同じデバイス上の別の場所を指定することができます。 リモート レプリケーションのシナリオでは、リモート サイトのData Domainシステムまたは他のバックアップ ターゲットへのNDMPのロールオー バーをNetWorkerがさらに調整および管理でき、本番環境のIsilonシステムからバックアップを完全にオフロードすることができます。これにより、 毎日の運用に影響を与えることなく、大規模なデータセットを毎週または四半期ごとにバックアップできます。

NETWORKER による ISILON 間のスナップショットの管理を使用するメリット

お客様は、NetWorkerでIsilonのスナップショットを管理してIsilonストレージでデータ レイクを保護することで、重要なメリットを達成できます。ま ずもっとも重要なことは、このビジネス データ レイク保護ソリューションが、Hadoopをデータロスや破損から守るエンタープライズ クラスのデータ 保護を提供し、優れたRTOを実現するということです。 NetWorkerスナップショット管理は、最初のスナップショットとセカンダリIsilonへのレプリケーション プロセスを自動化することで、データ保護プロ セスを簡素化します。このデータ保護ソリューションは、ソースIsilonシステム上の最初のスナップショットからのリカバリや、2番目のIsilonシステ ム上のレプリケートされたスナップショットからのリカバリなど、複数のリカバリ オプションを提供します。さらに、Data Domainシステムへロー ルオーバーする機能により長期保存が可能となり、データの破損や災害からの保護を強化することができます。スナップショット、レプリケーショ ン、ロールオーバーのプロセスはすべて1つのポリシーによって制御できます。 Isilonは、Hadoopおよび他のBig Dataアプリケーション用の理想的なプラットフォームです。消失訂正符号を使用してデータを保護するため、従 来のHDFSの33%のストレージ効率とは対照的に、80%超のストレージ効率が実現します。Isilonには、ノード タイプのクラスが複数あります。こ れにより、特定のワークロード向けにさまざまなIsilon階層を最適化できます。 お客様がすでに他のニーズのためにIsilonまたはNetWorkerを使用している場合は、データ レイク保護ソリューション向けに同じプロセスと専門 技術を活用できます。NetWorkerスナップショット管理は、スナップショットとバックアップの両方で共通のワークフローとユーザー インターフェイス を使用するNetWorkerの統合機能です。最後に、NetWorkerを活用してIsilonレプリケーションを管理し、ディザスタリカバリ オプションのために 用意した2番目のサイトのもう1つのIsilonシステムへレプリケートすることができます。

NETWORKER SNAPSHOT MANAGEMENT による ISILON から ECS へのスナップショットの管理

このセクションでは、コンピューティングとストレージが分離され、HDFSレイヤーがIsilonストレージで実行されているデータ レイク導入環境にお けるDell EMC NetWorkerスナップショット管理の活用についての詳細を説明します。共有Isilonストレージが使用されているため、お客様はスト レージ レイヤーに組み込まれたIsilonデータ管理機能をすべて使用することができます。このデータ レイク保護シナリオでは、NetWorkerが Isilonスナップショットを管理し、スナップショットはオン プレミスのECS(Elastic Cloud Storage)アプライアンスにロールオーバーされます。 このソリューションのターゲット ストレージとしてECSを使用することは、主に次の3つの要因を考慮してお客様が選択します。 1. Data Domainシステムが提供する可変長重複排除と圧縮では、データのストレージ コストを大幅に削減することはできないのをすでに 承知しているかどうか。 2. ECSが提供するハイパースケールが必要かどうか。(エクサバイト) 3. オブジェクト/HDFSへのアクセスが必要かどうか。 NetWorker管理者は、1つのポリシーを定義してデータ保護プロセスを自動化することができます。このポリシーには、データ レイクのIsilonシス テム上でスナップショットを開始し、Ethernet経由でECS APIを使用して、Isilonのスナップショットを2番目のオン プレミスECSアプライアンス上へ ロールオーバーする処理が含まれます。 NetWorkerは、すべてのバックアップ、スナップショット、クローンのカタログを保持しており、このデータ レイク保護ソリューションのリストアをシン プルで分かりやすくしています。NetWorkerでは、スナップショットの保存期間を管理することもできます。リストアを実行する場合、NetWorker管 理者は、最初のスナップショットから簡単にリストアできます。あるいは、ECSシステムにロールオーバーされたセーブセットのいずれかを選択し、 Ethernet経由のECS APIを使用して、プライマリIsilonシステムにリストアします。NetWorkerは一部または全体のリストアを実行でき、リストア先 には元の場所または同じデバイス上の別の場所を指定することができます。 お客様は、ディザスタリカバリの保護を強化するために2番目のサイトにインストールされた別個のECSアプライアンスでNetWorkerが管理する レプリケーションを活用することを選択できます。ディザスタリカバリのため、2番目のサイトのECSアプライアンスからNetWorkerのリストアを実 行できます。

(17)

NETWORKER による ISILON から ECS へのスナップショットの管理を使用するメリット

お客様は、NetWorkerでIsilonのスナップショットを管理してElastic Cloud Storageソリューションでデータ レイクを保護することで、重要なメリット を達成できます。まずもっとも重要なことは、このビジネス データ レイク保護ソリューションが、Hadoopをデータロスや破損から守るエンタープラ イズ クラスのデータ保護を提供し、優れたRTOを実現するということです。 NetWorkerスナップショット管理は、最初のスナップショットとECSへのロールオーバーを自動化することで、データ保護プロセスを簡素化します。 このデータ保護ソリューションは、最初のスナップショットからのリカバリや、ECSストレージ上のセーブセットからのロールオーバーによるリカバリ など、複数のリカバリ オプションを提供します。 ECSアプライアンスを使用すると、ViPRの機能と低コストで高密度のスケールアウト コモディティ ハードウェア プラットフォームを組み合わせるこ とで、あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます。ECSアプライアンスは段階的に導入および 拡張できるので、差し迫ったニーズや成長予測に応じた適切なサイズを選択できます。ECSでは、アプリケーション、ストレージの要件、アクセス に関するニーズに基づいてデータ レイク保護ソリューションを最適化できるので、必要な柔軟性と制御を確保することができます。

お客様がすでに他のニーズのためにNetWorkerまたはElastic Cloud Storageを使用している場合は、データ レイクを保護するために同じプロ セスと専門技術を活用できます。

お客様のメリット

前述のように、このホワイト ペーパーで示されているすべてのビジネス データ レイク保護ソリューションは、Hadoopをデータロスや破損から守る、 ニーズの高いエンタープライズ クラスのデータ保護を提供します。Dell EMCは、お客様のデータ レイクの大きさ、データ タイプ、アクセス性の要 件、ストレージとデータ保護に関する現在の専門技術に応じて、お客様が最良のデータ レイク保護ソリューションを選ぶための選択肢を提供し ます。 このホワイト ペーパーで説明している、保護ストレージ ターゲットとしてData Domainシステムを活用するビジネス データ レイク保護ソリューショ ンのオプションは、Data Domain固有の追加のメリットをもたらします。Data Domainのデータ非脆弱性アーキテクチャは、必要なときにデータ レ イクからデータをリカバリできることと、データが信頼できることを保証する究極のデータ保護を提供します。Data Domainシステムは、可変長重 複排除と圧縮によってストレージ効率を高めており、通常はストレージ要件が10分の1~30分の1まで削減されます。また、Data Domainシステ ムは非常に高速で、最大68 TB/時の速度でデータを取得でき、データ レイクの保護バックアップを完了するまでに要する時間が最小限に抑えら れます。お客様がすでにデータ保護に関する他のニーズのためにData Domainを使用している場合は、データ レイクを保護するために同じプロ セスと専門技術を活用できます。

Dell EMC Data Protection Suiteファミリーの一部であるDD Boost for Enterprise Applicationsは、Hadoopのデータ保護を提供します。DD Boostには、NFSよりも優れたバックアップ パフォーマンス、帯域幅要件の削減、ロード バランシングと信頼性の向上という特徴があり、Data DomainはDD Boostのこれらの機能を活用して、Hadoopのお客様にさらなるメリットを提供します。その際にDD Boost for Enterprise Appsは、 Hadoopクラスタの管理とHadoopファイル システムへの統合と、Hadoopネイティブの構成要素の活用により、優れたユーザー エクスペリエンス を提供します。 このホワイト ペーパーで説明している、ストレージ ターゲットとしてIsilonシステムを活用するビジネス データ レイク保護ソリューションのオプショ ンは、お客様に固有のメリットを独自に提供します。Isilonは消失訂正符号を使用してデータを保護するため、従来のHDFSの33%のストレージ 効率とは対照的に、80%超のストレージ効率が実現します。Isilonには、ノード タイプのクラスが複数あるため、特定のワークロード向けにさまざ まなIsilon階層を最適化できます。お客様の組織ですでに他のニーズのためにIsilonを使用している場合は、データ レイク保護ソリューションのこ れらのオプション向けに同じプロセスと専門技術を活用できます。

このホワイト ペーパーで説明している、ストレージ ターゲットとしてECS(Elastic Cloud Storage)を活用するビジネス データ レイク保護ソリュー ションのオプションは、拡張性とアクセス性のメリットをもたらします。ECSアプライアンスを使用すると、ViPRの機能と低コストで高密度のスケー ルアウト コモディティ ハードウェア プラットフォームを組み合わせることで、あらゆる規模の組織向けにハイパースケールなストレージとクラウド の経済性を実現できます。ECSでは、アプリケーション、ストレージの要件、アクセスに関するニーズに基づいてデータ レイク保護ソリューション を最適化できるので、必要な柔軟性と制御を確保することができます。最後に、お客様の組織ですでに他のニーズのためにElastic Cloud Storageを使用している場合は、データ レイクを保護するために同じプロセスと専門技術を活用できます。 このホワイト ペーパーで説明している、NetWorkerを活用するビジネス データ レイク保護ソリューションは、使用するストレージ オプションに関係 なくいくつかの追加のメリットをもたらします。NetWorker管理者は、データ保護のポリシーを定義してすべてのスナップショットおよびロールオー バー処理を自動化し、日々の運用を簡単かつ効果的にすることができます。NetWorkerでは、バックアップ、スナップショット、ロールオーバーの 保存に対する制御も提供されるので、手動の保存作業が最小限に抑えられます。さらにNetWorkerソリューションのオプションには、ロールオー バー セーブセットのほかにもIsilonスナップショットからリカバリする機能が含まれているので、優れたRTOと最大限の柔軟性が実現します。

(18)

まとめ

このホワイト ペーパーでは、Big Dataのユースケースが十分に発達してきたことを明確に示し、データ レイクの定義を提供するとともに、お客様 が本格的なエンタープライズ クラスのデータ レイク保護ソリューションを求めている理由を説明してきました。Dell EMCはBig Dataソリューション のソート リーダーして、Hadoopとその他のデータ レイクを保護するためのデータ保護戦略と、さまざまなデータ保護ソリューション オプションに ついて、このホワイト ペーパーで説明しました。Dell EMCはお客様に選択肢を提供して、どのソリューション アプローチとどのターゲット ストレー ジ オプションが拡張性とアクセス性に関するお客様のニーズを満たし、すでに存在する可能性のある既存の社内ストレージやデータ保護に関す る専門技術を活用できるかどうかの選択をお客様に委ねています。

Dell EMC Big Data、Hadoop、ビジネス データ レイク ソリューションの詳細については、Dell.comのBig Dataソリューションのページと、以下の 関連資料をご確認ください。

Dell EMC Data Domain Operating Systemデータ シート

Dell EMC Isilonスケールアウト ストレージ製品ファミリー データ シート Dell EMC ECS Appliance, powered by ViPRデータ シート

Dell EMC Data Domainデータ非脆弱性アーキテクチャ ホワイト ペーパー

Dell EMC NetWorkerデータ シート

図 1:エンタープライズ データ レイク
図 2:Cloudera Enterprise
図 6:Dell EMC のその他のビジネス データ レイク保護ソリューション

参照

関連したドキュメント

日頃から製造室内で行っていることを一般衛生管理計画 ①~⑩と重点 管理計画

クチャになった.各NFは複数のNF  ServiceのAPI を提供しNFの処理を行う.UDM(Unified  Data  Management) *11 を例にとれば,UDMがNF  Service

管理画面へのログイン ID について 管理画面のログイン ID について、 希望の ID がある場合は備考欄にご記載下さい。アルファベット小文字、 数字お よび記号 「_ (アンダーライン)

7.法第 25 条第 10 項の規定により準用する第 24 条の2第4項に定めた施設設置管理

児童について一緒に考えることが解決への糸口 になるのではないか。④保護者への対応も難し

の 立病院との連携が必要で、 立病院のケース ー ーに訪問看護の を らせ、利用者の をしてもらえるよう 報活動をする。 の ・看護 ・ケア

では,訪問看護認定看護師が在宅ケアの推進・質の高い看護の実践に対して,どのような活動

就学前の子どもの保護者 小学校 1 年生から 6 年生までの子どもの保護者 世帯主と子のみで構成されている世帯の 18 歳以下のお子さんの保護者 12 歳~18 歳の区民 25