ホワイトペーパー
EMC Isilon スケールアウト NAS による
Hadoop ストレージ環境の構築
要約
このホワイトペーパーでは、EMC Isilon スケールアウト NAS によってエンター プライズがHadoop データ分析ワークフローを導入する方法について詳細に説 明します。ここではコアアーキテクチャの関連コンポーネントを紹介するとと もに、進化するビッグデータの分析ワークフローのストレージ要件を満たすう えで、シンプルさを保ちつつ、信頼できるビジネスの洞察を迅速かつ効率的に 得るIsilon と Hadoop の併用の利点を明らかにしていきます。 2012 年 2 月
Copyright © 2012 EMC Corporation. All Rights Reserved. EMC Corporation は、この資料に記載される情報が、発行日時点で正確である とみなしています。また情報は予告なく変更されることがあります。 この資料に記載される情報は、「現状有姿」の条件で提供されています。EMC Corporation は、この資料に記載される情報に関する、どのような内容について も表明保証条項を設けず、特に、商品性や特定の目的に対する適応性に対する 黙示の保証はいたしません。 このドキュメントで説明されているいかなるEMC ソフトウェアの使用、コピー、 配布に関しても、適切なソフトウェア ライセンスが必要です。
最新のEMC 製品名については、EMC.com で EMC Corporation の商標を参照して ください。
VMware は、米国およびその他の国における VMware, Inc.の登録商標または商 標です。他のすべての名称ならびに製品についての商標は、それぞれの所有者 の商標または登録商標です。
目次
はじめに ... 4 Hadoop ソフトウェアの概要 ... 4 Hadoop MapReduce ... 5 Hadoop 分散ファイルシステム ... 5 Hadoop のディストリビューション ... 6 Hadoop エコシステム ... 6 Hadoop のアーキテクチャ ... 7EMC Isilon OneFS の概要 ... 8
Isilon のアーキテクチャ... 8 OneFS オプションモジュール ... 9 Isilon の Hadoop 接続 ... 10 シンプル ... 11 効率性 ... 12 柔軟性 ... 13 信頼性 ... 14 ファイルシステムジャーナル ... 15 ノード/デバイス障害に対するプロアクティブな対応 ... 15 Isilon のデータ整合性 ... 16 プロトコルのチェックサム ... 16 ダイナミックセクタ修復 ... 16 Mediascan ... 16 IntegrityScan ... 16 データの高可用性 ... 17 ビジネスの継続性 ... 17 まとめ ... 21 Isilon について ... 21
はじめに
企業は、急増する大量データ「ビッグデータ」の保存や管理に始終、対応を迫られて います。データの計算能力の拡大に合わせてディスクドライブの容量も拡大を続けて いますが、ビッグデータを分析して貴重な洞察を得るためのツールは、このような データの急増に追いついていません。既存の分析アーキテクチャは高価で処理速度が 遅すぎることが知られており、維持や管理がきわめて難しいことも明らかになってい ます。 Hadoop は、企業が保有するデータセットから貴重な洞察を短時間で得られるように 設 計 さ れ て い る オ ー プ ン ソ ー ス の 革 新 的 な 大 規 模 デ ー タ 分 析 エ ン ジ ン で す 。 MapReduce および HDFS(Hadoop Distributed File System)という 2 つの主要コンポー ネントで構成されています。MapReduce は、複数のノード上でジョブを並列処理し、 大規模データセットから結果を高速で取得する分散タスク処理フレームワークです。 またHDFS は、Hadoop 計算ファームが分析に必要な入力データすべてと、MapReduce ジョブによって生成される出力データのすべてを格納する、分散ファイルシステムで す。 Hadoop はスケールアウトという原則に基づいて構築されています。汎用ハードウェ アのクラスタ上で動作するインテリジェントなソフトウェアを使用して、貴重な洞察 を迅速に、かつ低コストで提供します。Hadoop がビッグデータの分析に最適なのは、 この分散並列型のタスク処理エンジンのおかげです。 さまざまなビッグデータのストレージニーズに対し、企業は今まで同様、EMC Isilon スケールアウトNAS(Network Attached Storage)に期待を寄せています。OneFS は Isilon スケールアウト NAS のオペレーティングシステムであり、クラスタを形成する複数 ノード上で実行される分散ファイルシステムでもあります。OneFS はハードウェアを スケールアウトするという観点に加えて、管理もスケールアウトできるように設計さ れており、大規模なシステムであっても従来のストレージシステムの管理に必要な人 員と同程度の人員で管理できます。OneFS には自己修復、および自己管理のための機 能が組み込まれており、ストレージ管理の複雑さを解消し、管理負荷を劇的に軽減で きるようになっています。また、OneFS は並列処理するように設計されているため、 複数のハードウェアユニットに分散されて主要なシステムサービスが実行されます。 その結果、OneFS はインフラストラクチャの拡張にとともに、すべての次元で仮想的 に拡張できるようになっており、今日のようにデータが急増したりワークフローが変 化する状況下においても、同じように機能し続けます。 柔軟性に富み、インフラストラクチャやデータ容量の需要の変化だけでなく、進化す るワークフローにも適応可能で、シンプルでかつ使いやすいEMC Isilon スケールアウ トNAS は、ビッグデータ分析ワークフローソリューションにおける Hadoop 向けスト レージとしてきわめて魅力的な選択肢となります。
Hadoop ソフトウェアの概要
Hadoop は、企業が保有するデータセットから企業活動に結び付く貴重な洞察を短時 間で得られるように設計された、革新的なオープンソースのビッグデータ分析エンジ ンです。Hadoop の主要コンポーネントは、以下のとおりです。Hadoop MapReduce: 計算ノードで構成されるクラスタ上の大規模データセットに対 してジョブを並列処理し、結果を高速で取得する分散タスク処理フレームワークです。 Hadoop HDFS(Hadoop Distributed File System): Hadoop による分析に必要なすべての データを格納する分散ファイルシステムで、Hadoop 計算ファームによって使用されま す。MapReduce はもともとコンピューティングパラダイムとして Google によって開発 されたものですが、Hadoop は Yahoo により MapReduce の実装として構築され、オー プンソースとして公開されています。
Hadoop MapReduce
Hadoop MapReduce はコード作成が容易なアプリケーション用のソフトウェアフレー ムワークで、汎用の計算ノードで構成される大規模クラスタ上で大量データを並列処 理します。 MapReduce フレームワークの構成要素は、以下のとおりです。 JobTracker(ジョブトラッカ): ジョブやコンポーネントタスクのスケジュール設定、 モニタ、管理をするマスターで、クラスタノードごとに1 つ存在します。 TaskTracker(タスクトラッカ): JobTracker に指示されたジョブに必要なタスクコン ポーネントを実行します。各スレーブクラスタノードごとに1 つ存在します。 MapReduce ジョブ(クエリ)は複数のマップタスクで構成されており、クラスタ全体 で完全に並列分散処理されます。MapReduce はマップの出力をソートします。この出 力は、タスクを減らすために入力として使用されます。ジョブの入力と出力は両方と も、HDFS を使用して計算ノードのクラスタ全体にわたって格納されます。MapReduce はタスクのスケジューリングやモニタリングを行い、失敗したタスクの再実行を管理 します。 Hadoop クラスタでは、一般に MapReduce 計算ノードと HDFS(HDFS ストレージ層) は同じノード上に存在します。MapReduce はこの構成により、データがすでに存在す るノード上のタスクを効率的にスケジューリングすることで、クラスタ内にあるデー タの移動にかかるネットワークのボトルネックを回避します。このような仕組みで、 計算層はHDFS 層上のデータの存在場所を整理して、重要な洞察を効率的に引き出し ます。Hadoop は Java で記述する必要がありますが、MapReduce アプリケーションは Java 以 外の言語でも記述可能です。MapReduce アプリケーションは特定のジョブに関して Hadoop Streaming インターフェイスを使用して、実行可能ファイルを mapper や reducer に指定します。
Hadoop 分散ファイルシステム
HDFS はクラスタ内の複数のノードにまたがるブロックベースのファイルシステムで あり、ファイルとしてユーザデータを格納します。ユーザやアプリケーションがファ イルやディレクトリを操作(作成、名前変更、移動、削除)できるように、従来の階 層の形でファイルを表示します。また、MapReduce フレームワークでアプリケーショ ンを実行する際に使用できるように、Streaming インターフェイスも表します。HDFS はハードリンクやソフトリンクの設定をサポートしておらず、特定のブロックを検索したり、ファイルを上書きすることはできません。またプログラムによるアクセスが 必要なため、ファイルシステムとしてマウントすることもできません。HDFS の通信 はすべて、TCP/IP プロトコル上に階層化されます。 HDFS の主要コンポーネントは、以下のとおりです。 NameNode(ネームノード): 単一のマスターメタデータサーバで、各ファイル、ファイ ルの場所、ファイル内の全ブロック、およびそれらが存在するDataNodes のインメモリ マップを所有します。 DataNode(データノード): 読み取り/書き込み要求を提供し、NameNode の指示に よりブロックの作成、削除、複製を行います。各スレーブクラスタノードに1 つ存在 します。 HDFS は、MapReduce ジョブの実行前にすべてのデータが存在するストレージ層です。 HDFS はブロックミラーリングを使用して Hadoop クラスタにデータを分散し、複数 の計算ノードのローカルデータとして保護します。デフォルトのブロックサイズは 64 MB で、デフォルトでは 3 面(3x)で複製されます。
Hadoop のディストリビューション
Apache Hadoop はオープンソースで、Apache Foundation(apache.org)によって管理 されています。その他のすべてのディストリビューションは、Apache Hadoop を基に 構築、拡張されたものです。現在利用できる一般的なHadoop ディストリビューショ ンには以下のものがあります。 ● Apache Hadoop ● Cloudera CDH3 ● Greenplum HD
● Hortonworks Data Platform
ここに挙げたものが今日利用できるHadoop のすべてではありません。これらはディ ストリビューションの一部です。Hadoop ディストリビューションの完全なリストは、 以下を参照してください。 http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support
Hadoop エコシステム
Hadoop エコシステムコンポーネントは Hadoop スタック上に実装され、追加の機能 を提供して分析ワークフローを有効にするアドオンコンポーネントです。Hadoop エ コシステムにおける主なオプションには、以下のものがあります。 ● Hive: HDFS に格納されたデータに対する、SQL に似たアドホックのクエリインター フェイスです。 ● HBase: HDFS 上に配置される、ランダム読み取り/書き込み可能な列指向の高パ フォーマンス構造化ストレージシステムです。 ● Pig: 並列コンピューティング用のハイレベルデータフロー言語、および実行フレーム ワークです。● Mahout: Hadoop を使用する拡張可能なマシン学習アルゴリズムです。 ● R(RHIPE): 大規模な複合データセットに対する統計分析用の分割および再結合 機能を提供します。 ここに挙げたものはHadoop エコシステムを構成するコンポーネントの一部です。 Hadoop の全コンポーネント
Hadoop のアーキテクチャ
以下の図は、Hadoop 計算クラスタで実行される Hadoop のコアコンポーネントのアー キテクチャを示したものです。 この計算環境では、一般に以下の処理が行われます。 1. HDFS レイヤにデータを取り込みます。 2. MapReduce を使用してデータを計算、または分析します。 3. Hadoop の全体的なワークフローに合わせて、HDFS やその他のインフラストラク チャに結果を格納、またはエクスポートします。 上の図ではNameNode が環境内に 1 つしかなく、もし NameNode に障害が発生した 場合、Hadoop 環境全体が利用できなくなるおそれがあります。 エコシステムR (RHIPE) Pig Mahout Hive HBase
コアコンポーネント Map Reduce-計算層 (ジョブスケジューリング/実行) HDFS-ストレージ層 (Hadoop 分散ファイルシステム) JobTracker、
DataNode、TaskTracker DataNode、TaskTracker DataNode、TaskTracker
DataNode、TaskTracker DataNode、TaskTracker DataNode、TaskTracker
Hadoop NameNode Ethernet
EMC Isilon OneFS の概要
OneFS は、従来のストレージアーキテクチャの 3 つの層(ファイルシステム、ボリュー ムマネージャ、RAID)を 1 つの統合ソフトウェア層に組み合わせたもので、Isilon スト レージクラスタ上で実行される単一のインテリジェントな分散ファイルシステムを形成 します。 OneFS はファイルシステム、ボリュームマネージャ、保護機能を インテリジェントな単一の分散システムに統合 これは革新的な OneFS の中核であり、エンタープライズ環境でスケールアウト NAS の活用を可能にしています。OneFS はスケールアウトの基本原則(インテリジェント ソフトウェア、汎用ハードウェア、分散アーキテクチャ)に基づいています。OneFS は単なるオペレーティングシステムではなく、データをIsilon ストレージクラスタに 格納する際に基盤となるファイルシステムでもあります。Isilon のアーキテクチャ
OneFS は、複数の Isilon ノードに対し専用の機能を提供します。複数のノードで単一 のクラスタを構成します。ノードはラックマウント型のアプライアンスで、メモリ、 CPU、1 ギガビットまたは 10 ギガビットのネットワークインターフェイス、NVRAM、 低遅延のInfiniband インターコネクト、ディスクコントローラ、ストレージメディア を搭載しています。つまり、クラスタを構成する各ノードは、ストレージ機能に加え てデータ処理機能も備えています。 現在のところ、Isilon のクラスタは最小構成の 3 ノードから最大 144 ノードまで拡張で きます。ノードにはいくつかのモデルがありますが、いずれも単一のクラスタに組み込 むことができます。ノードはモデルによって、容量に対するスループットやIOPS が異な ります。 OneFS では、単一のシステムに含むことができるノード数に理論上制限はありません。 ノードをクラスタに追加すると、ディスク、キャッシュ、CPU、およびネットワーク容 量が総量として増加します。OneFS は、構成するハードウェアを全体として活用するた め、各ハードウェアの単純な合計よりも大きな容量を利用できます。RAM は単一のコ ヒーレントキャッシュにグループ化され、クラスタ上の I/O はどの部分であっても、 キャッシュされたデータを(キャッシュされた場所を問わず)利用できます。NVRAM も グループ化され、電源故障時にも高スループットで安全に書き込みできます。スピンド ルとCPU が集約化されると、1 つのファイルへのアクセスであっても、複数ファイルへ ファイルシステム ボリュームマネージャ RAIDのアクセスであっても、クラスタが拡大するにつれて、スループット、容量、IOPS が増 加します。クラスタのストレージ容量は、単一のファイルシステム内で最小 18 テラバ イト(TB)から最大 15.5 ペタバイト(PB)まで拡張できます。 EMC Isilon のノードは、機能に応じていくつかのモデルに分類されます。 ● S シリーズ: IOPS を重視したアプリケーション ● X シリーズ: 大量の同時処理と高スループットのワークフローを実現 ● NL シリーズ: プライマリストレージ水準のアクセス性能とテープ並みのコストを 実現 ● パフォーマンスアクセラレータ: 容量と独立して性能を拡張 ● バックアップアクセラレータ: 高速かつ拡張性に優れたバックアップ/リストア を提供 企業環境に設置されるOneFS のコンポーネント この図は、ソフトウェア、ハードウェア、ネットワーク接続が企業環境内で連携して いる、完全なアーキテクチャを表しています。複数のサーバで完全に分散された単一 のファイルシステムを提供しており、負荷、容量およびスループットに基づくニーズ の変化に応じて、柔軟に拡張できるようになっています。
OneFS のオプションモジュール
OneFS には、お客様のニーズに合わせて利用できるアドオンのソフトウェアモジュー ルが提供されています。各モジュールの名称と概要は、以下のとおりです。 SnapshotIQTM- シンプルで拡張性と柔軟性に優れたスナップショットによるローカル データの保護 SmartConnectTM- ポリシーベースのデータアクセス、フェイルオーバと負荷分散によ る高可用性の実現 SmartQuotasTM- クラスタストレージのクォータ管理とシンプロビジョニング クライアント/アプリケーション層 Isilon ストレージ層 Windows、Linux、UNIX および Apple クライアント NFS、CIFS、 FTP、HTTP 標準的なギガビット Ethernet 層 クラスタ間通信 Infiniband または GigE 層SynclQTM- 高速かつ柔軟なファイルベースの非同期データレプリケーション SmartPoolsTM- 複数のディスク階層を使用したデータ管理と、ファイルの属性に基づ く情報ライフサイクル管理(ILM)ポリシーの適用 SmartLockTM- 思いがけない削除に対するポリシーベースの保存および保護 InsightIQTM- トレンドやホットスポットを特定できる強力でシンプルな分析プラット フォームで、主要クラスタの統計情報を提供 各ソフトウェアモジュールの詳細については、それぞれのデータシートをご覧くださ い。
Isilon の Hadoop 接続
HDFS の通信はすべて TCP/IP プロトコル上に階層化されるため、Isilon では HDFS 層 は OneFS の Over-the-wire プロトコルとして統合されています。この統合により、 Hadoop のコアコンポーネントにおいても、あるいはエコシステムコンポーネントに おいても、Hadoop アーキテクチャを構成するネイティブなパーツとしてスケールア ウトNAS プラットフォームを活用できます。その結果、Hadoop ワークフロー全体で、 シンプルかつ柔軟性、信頼性、効率性に優れたOneFS を活用できるようになります。Hadoop(コンピュータ層)に接続した Isilon スケールアウト NAS(ストレージ層)
上の図は、Isilon スケールアウト NAS を Over-the-wire プロトコル(HDFS)経由で Hadoop 計算クラスタに統合したアーキテクチャを示しています。このアーキテク チャでは、Isilon スケールアウト NAS が企業の Hadoop ワークフローにおいて主要な Hadoop 要素となっています。また、Hadoop ワークフローの 2 つのコアコンポーネン トを分離できるようになっています(計算層である MapReduce と、ストレージ層で ある HDFS)。今日、利用可能なネットワーク帯域幅は劇的に増加しており、OneFS は根本的に分散並列処理向けに構築されているため、共有型のスケールアウトスト レージモデルを活用して、Hadoop によるデータ分析ワークフローを実現できます。 以下の図は、Isilon スケールアウト NAS を活用した、Hadoop のすべてのコアコンポー ネントとエコシステムコンポーネントの詳細を示したものです。
R (RHIPE) Pig Mahout Hive HBase JobTracker TaskTracker
NameNode DataNode
HDFS
Hadoop 環境で動作する Isilon スケールアウト NAS と Hadoop の全コンポーネント
EMC Isilon OneFS は、単一ファイルシステムと単一のグローバルネームスペースを 15 PB にスケールアウトできます。また、この容量で同時スループットを 85 GB/s まで 拡張できます。Hadoop ワークフローの要件に合わせて、OneFS では直線的に容量と パフォーマンスを拡張できます。詳細については、specsfs2008 のベンチマーキング の結果をご覧ください(www.spec.org)。
以降のセクションでは、Hadoop ワークフローで EMC Isilon スケールアウト NAS を活 用する利点について、詳しく紹介します。
シンプル
EMC Isilon の OneFS では、ディスクプールのラック管理、ファイルシステムのプロビ ジョニング、最適なデータ保護メカニズムの適用に必要な複雑な作業が完全に不要と なります。データはいつでもアクセス可能であり、さまざまな障害に対して保護され ています。Hadoop を簡単に利用できるため、自社のデータを余すところなく活用し、 ビジネスを推進する洞察を得ることに集中できます。Hadoop をフル活用し、Hadoop エコシステムのストレージインフラの管理に時間を浪費することなく、主要な傾向を 明らかにすることで、ビジネスに役立つ新たな機会を見極めることができます。 Isilon ストレージの拡張は、通常 60 秒未満で完了します。既存のクラスタへのノード の追加は、ラックへの設置後、電源投入時にボタンを押すだけなので簡単です。この 「クラスタへの結合」プロセスにより、追加された容量はすぐに利用可能になり、新 たなノードにも適切なバージョンのOneFS と設定が適用されます。すぐに利用可能と なる追加容量に加え、バックグラウンドジョブの実行により、作業負荷がIsilon クラ スタ全体に均等に再配分されるため、データのホットスポット発生を回避できます。 このような容量拡張はすべて、スケールアウトストレージがオンラインのままで行わ れ、ネットワークに影響を及ぼさずにMapReduce ジョブが実行されます。HDFS プロ トコルに加え、OneFS では以下のプロトコルもサポートされています。 ● NFS ● CIFS/SMB R (RHIPE) Pig Hive HBase Mahout JobTracker TaskTracker OneFS ネットワーク 複数の 10 G インターフェイス NameNode DataNode MapReduce-演算層 (ジョブスケジューリング/実行) HDFS-ストレージ層
● FTP ● HTTP ● iSCSI ● REST Isilon HDFS の実装は、OneFS と HDFS クライアント間の軽量化プロトコル層です。標 準の POSIX で格納されたファイルは Isilon クラスタのファイルシステムと互換性を 保っているため、上記のプロトコルを使用してHadoop ワークフローで使うデータを 簡単に取得したり、Hadoop から得られた重要な洞察をデータ分析ワークフローの他 のコンポーネントにエクスポートできます。EMC Isilon スケールアウト NAS に格納済 みのデータであれば、OneFS で Hadoop 計算ファームを指定するだけです。Hadoop ワークフローに対して、時間やリソースを浪費する負荷配分作業を行う必要はありま せん。OneFS により、Hadoop 環境の HDFS 層を検証済みのファイルシステムとして 使用できます。
Isilon スケールアウト NAS により Hadoop ワークフローがシンプルになります
効率性
OneFS は、Isilon クラスタの容量利用率が 80% 以上になるように設計されており、 Hadoop データ分析ワークフローにおける効率性を高めます。ファイルシステムに存 在する各ブロックに 3 面のミラーリングを使用する従来の Hadoop アーキテクチャに 比べて容量利用率に優れ、ROI や TCO を最適化します。たとえば、12 PB の Hadoop データを格納したい場合、データの格納にデフォルトの 3 面ミラーリングを使用す る従来の Hadoop クラスタでは、36 PB 以上の物理容量が必要になります。しかし、 同じ Hadoop データ 12 PB をデータ保護をしたうえで OneFS に格納した場合、約 16PB の物理容量で済みます。結果として、設備投資コストが大幅に削減され、管理 対象のインフラストラクチャもシンプルになります。 単一のネームスペース、単一のボリューム 仮想化
Isilon による設備投資コストの削減には、運用が容易で管理が簡単になるだけではな く、環境面での利点もあります。Isilon のノードは容量が高密度になるため、従来型 ではストレージの直接接続でたとえば36 PB となる Hadoop クラスタの稼働に必要な 電力は、Isilon クラスタでは 16 PB の電力需要で賄えます。必要なラックスペースも 同様に少なくなります。Isilon クラスタでは、このような追加のコスト削減効果もあ ります。
Isilon スケールアウト NAS を Hadoop 環境の共有ストレージ層として使用すると、 Hadoop 計算ファームを集約して最小化できるという利点もあります。ストレージに 関連する HDFS のすべてのオーバヘッドを Isilon にオフロードすることによって、 Hadoop 計算ファームはローカルストレージを管理、保護しながらデータ分析を実行 する代わりに、分析ジョブをより効率的に実行できます。Hadoop 計算ファームにお けるこれらのHDFS 関連の全タスクの実行を軽減することによって、OneFS では既存 のHadoop コンピュータインフラストラクチャを活用してデータ分析ワークフローの その他のタスクを実行し、Hadoop 計算ファームの設置面積を削減できます。Hadoop で得られた主要な洞察をデータ分析ワークフローの他の部分に提供し、共有ストレー ジを他の標準プロトコルからアクセス可能にすることで、データ分析ワークフロー全 体が強化されます。このようなストレージの集約化によって、データ分析ワークフ ロー全体が合理化され、設備投資や運用コストが大幅に削減されます。
柔軟性
直接接続されたストレージを使用する従来のHadoop クラスタでは計算層とストレー ジ層が緊密に結合しており、一方だけを拡張することはできません。そのため、計算 能力が十分であってもストレージ容量が不足した場合、Hadoop クラスタ全体を拡張 する必要があります。拡張に伴い、計算インフラストラクチャとともにネットワーク インフラストラクチャも追加することになります。全体の利用率という点で効率性や 柔軟性で不利な方法です。 Hadoop の計算層とストレージ層を切り離すことによって、必要に応じて柔軟にスト レージや計算能力を個別に拡張できます。成長に合わせて投資するというこのような 柔軟なアーキテクチャによって、必要なときに必要なもののみを購入できるため、 Hadoop の複合的な環境をより効率的に活用できます。その結果、OneFS で小規模の 導入から開始し、Hadoop ストレージ層の同時スループットを必要に応じて最大 85 GB/s までスケールアウトできます。Hadoop のストレージのニーズに対して OneFS を使用することの主な利点は、Apache Hadoop に準拠しているということです。Hadoop データ分析ワークフローで使用する Hadoop ディストリビューションを柔軟に選択できます。EMC Isilon スケールアウト NAS は、以下の Hadoop ディストリビューションでテスト済みです。
● Apache Hadoop 0.20.203 ● Apache Hadoop 0.20.205 ● EMC Greenplum HD 1.1
信頼性
Hadoop 分析に対する投資効果を最大限に高めるため、企業は復元力の高いビッグ データストレージインフラストラクチャを必要としています。Isilon スケールアウト NAS および OneFS オペレーティングシステムは、データ資産を保護し、可用性の高い データ環境を実現するために、信頼性の高いインフラストラクチャと強力なデータ保 護を提供します。 従来の Hadoop クラスタでは、ハードウェア層でデータを保護するために HDFS 層で のミラーリング技術とともにカスタムのサブブロック CRC チェックサムを使用して おり、冗長データが発生していました。その結果、規模が拡大するにつれてコストが かさんでいきます。 Isilon のデータ保護は OneFS のファイルシステムレベルで実装され、ハードウェアの RAID コントローラには依存していません。この方法であれば、市場の状況やハード ウェアの性能進化に合わせて新しいデータ保護スキームを追加できるという利点が あります。保護がファイルレベルで適用されるため、新しい保護機能やパフォーマン ススキームを利用するにあたって、OneFS ソフトウェアだけをアップグレードすれば 対応できます。 OneFS はパリティの保護計算に、広く実証済みであるリードソロモン符号アルゴリズ ムを使用しています。ファイルレベルで適用される保護により、データの復元は迅速 で効率的に実行されます。I ノード、ディレクトリ、およびその他のメタデータは、 参照するデータブロックと同じ、または上位のレベルで保護されます。すべてのデー タ、メタデータおよび前方誤り訂正(FEC)ブロックが複数のノードにストライプさ れるため、専用のパリティドライブは必要ありません。この 2 つの方法により単一 障害点およびボトルネックを回避し、ファイルの再構築を高度に並列化されたプロセ スで実行可能にします。現在のところ、OneFS では最大 4 つのコンポーネントの同 時障害に対する保護を提供しており、N+1 から N+4 のパリティ保護レベルを使用でき ます。単一のノード障害による影響は個別のディスクに起こる障害と同レベルに、ま たノード全体でスペクトルのもう一端における障害のように最小限に抑制されます。 OneFS は複数のハイブリッド保護スキームもサポートしています。これには N+2:1 と N+3:1 も含まれ、それぞれ 2 ドライブの障害または 1 ノードの障害、3 ドライブの障 害または1 ノードの障害からデータを保護します。これらの保護スキームは、各ノー ドに数テラバイトレベルの SATA ドライブが最大 36 台搭載されるような、高密度の ノード構成では特に有用です。この場合、複数ドライブに障害が発生する可能性は ノード全体に障害が発生する可能性をはるかに上回ります。ファイルが「保護レベル を超える」など、複数のデバイスで同時に障害が発生するという起こりそうにない状 況でも、OneFS は可能な限りすべてを再保護し、Isilon のクラスタのログに個々のファ イルに関するエラーを報告します。OneFS のハイブリッドパリティ保護スキーム(N+M:x) ファイルシステムジャーナル すべてのIsilon ノードにはデュアルバッテリバックアップ型の 512 MB NVRAM カードが 搭載され、ノードのファイルシステムジャーナルを保護します。各ジャーナルはOneFS に よって安定したストレージとして使用され、突然の停電やその他の突発的な出来事から 書き込みトランザクションを保護します。ジャーナルはファイルシステムの一貫性を保 護し、充電は最大3 日間持続します。Isilon クラスタの各メンバーノードは NVRAM コン トローラを備えているため、OneFS ファイルシステム全体が完全にジャーナル化されま す。 ノード/デバイス障害に対するプロアクティブな対応
OneFS、または SmartFail によって検出された ECC エラーが特定のしきい値に達したドラ イブは事前予防的に取り除かれ、そのドライブのデータは自動的に再構築されてクラス タの別の場所に配置されます。SmartFail とその後の修復プロセスはいずれも完全に自動 化されており、管理者が介入する必要はありません。OneFS はデータをファイルレベル で保護するため、不整合やデータ損失は使用できないデバイス、障害のあるデバイスに 分離され、残りのファイルシステムが損なわれることなく利用可能です。 OneFS は高度に分散化されたアーキテクチャ上に構築されており、複数のノードの CPU、 メモリ、スピンドルを活用して、高度に並列化された効率的な方法で障害の発生したド ライブからデータを再構築できます。Isilon のストレージシステムは特定のドライブの速 度に影響されず、OneFS はドライブの障害から非常にすばやくリカバリが可能で、この 効率性はクラスタサイズに比例して向上します。そのため、Isilon クラスタ内の故障した ドライブは、数時間から数日を要するハードウェアRAID ベースのストレージデバイスの 再構築に比べてきわめて迅速に、数分から数時間程度で再構築されます。さらに、OneFS には専用の「ホットスペア」ドライブは必要ありません。 ノード1 ノード2 ノード3 ノード4 ノード5 パリティ パリティ パリティ パリティ パリティ パリティ パリティ パリティ パリティ データストライプ データストライプ データストライプ データストライプ
Isilon のデータ整合性
ISI Data Integrity(IDI)は、32 ビットの CRC チェックサムを介してファイルシステム 構造を破損から保護するOneFS プロセスです。ファイルおよびメタデータの両方につ いて、すべてのIsilon ブロックでチェックサム検証が使用されています。メタデータ チェックサムは、メタデータブロック自体に含まれており、ファイルデータチェック サムはメタデータとして保存され、参照整合性が維持されます。すべてのチェックサ ムはイニシエータによって再計算され、ノードはすべての要求時に特定の読み取りを 実行します。再計算されたチェックサムが保存されたチェックサムと一致しない場合、 OneFS はシステムアラートを生成し、イベントをログに記録、対応するパリティブ ロックを取得してクライアントに返し、疑わしいデータブロックを自動的に修復しよ うとします。 プロトコルのチェックサム
ブロックとメタデータに加えて、OneFS はRemote Block Management(RBM)プロトコ ルデータに対してもチェックサム検証を提供します。RBM はバックエンドクラスタの 相互接続用にIsilon が開発した、RPC ベースのユニキャストプロトコルです。RBM プ ロトコルのチェックサムは、Infiniband ハードウェアチェックサムに加えてネット ワーク層で提供され、故障したハードウェアコンポーネントや他の障害の発生状態を 示すハードウェアコンポーネントの検出、および分離に使用されます。 ダイナミックセクタ修復 OneFS は、不良ディスクセクタを回避し、ファイルシステムによって良好データが再 書き込み先にリダイレクトされる、DSR(ダイナミックセクタ修復)機能を備えてい ます。OneFS が正常動作中にブロックの読み取りに失敗すると、DSR が起動します。 DSR は消失データを再構築し、そのドライブ上の別の場所またはノード内の別のドラ イブにデータを書き込みます。この操作により、ブロックの後続の読み取りが失敗す るのを避けることができます。DSR は完全に自動化されており、エンドユーザに対し て完全に透過です。ディスクセクタのエラーおよびCRC の不一致では、ドライブの再 構築プロセスとほぼ同じプロセスが使用されます。 Mediascan OneFS における MediaScan の役割は、ディスクのセクタをチェックすることと、セク タ ECC エラーの発生時にディスクドライブがエラーを修復するように DSR メカニズ ムを起動することです。MediaScan は OneFS の一部として実装され、事前に設定した スケジュールに基づいて自動的に実行されます。影響が少ないバックグラウンドプロ セスとして設計されているため、MediaScan は完全に分散され、Isilon 独自の並列アー キテクチャの利点をフル活用できます。 IntegrityScan ファイルシステム全体の不整合を調べるIntegrityScan も OneFS のコンポーネントです。 各ブロックを系統的に読み取り、関連付けられているチェックサムを検証します。従 来の「fsck」形式のファイルシステム整合性チェックツールとは異なり、IntegrityScan はクラスタを完全に実行したままで動作するように設計されており、ダウンタイムは 発生しません。IntegrityScan によってチェックサムの不一致が検出された場合、シス テムアラートが生成され、syslog に書き込まれます。OneFS はエラーの疑いのあるブ
ロックの修復を自動的に試行します。
データの高可用性
直接接続されたストレージを使用する従来のHadoop クラスタで、あらゆるファイル システムの名前空間を操作するのは単一のNameNode だけです。Isilon ストレージで は、すべてのIsilon ノードが NameNode 要求または DataNode 要求に応答できます。 Hadoop 計算クライアントがファイルの要求を Isilon に送信するたびに、その要求は 別の Isilon ノードのアドレスに送信されます。Hadoop 環境ではクラスタ内のすべて の Isilon ノードが NameNode および DataNode になります。これにより、複数の Hadoop 計算ノードで実行される複数の mapper タスクや reducer タスクから複数の Isilon ノードに I/O の負荷分散が実行されます。OneFS はこのように、従来の Hadoop クラスタに存在する単一障害点を解消し、負荷分散を可能にします。
Isilon SmartConnect モジュールは、Hadoop 計算クライアントに対してダイナミック なフェイルオーバとフェイルバックをサポートすることにより、データの高可用性を 実現します。ノードに障害が発生した場合、MapReduce ジョブに関連する進行中の読 み取りや書き込みはすべてIsilon クラスタの別ノードに渡され、MapReduce ジョブま たはタスクは中断することなく処理を完了します。この処理は、SmartConnect Zone 名を Hadoop core-site.xml 設定ファイルの設定パラメータ、および Isilon クラスタの ダイナミックIP アドレスとして使用することによって可能になります。SmartConnect Zone 設定の詳細については、Isilon のユーザガイドを参照してください。この機能は、 HDFS ストレージ層を提供する Isilon OneFS で Hadoop MapReduce ジョブを実行して いる際に障害が発生しても、継続的なデータの可用性と負荷分散を提供します。
ビジネスの継続性
OneFS には、企業環境におけるビジネスの継続性を確保するために欠かせない、信頼 性の高いデータバックアップソリューションを提供する、堅牢なメカニズムが備わっ ています。Isilon の SnapshotIQ は、OneFS 内のすべてのディレクトリやサブディレク トリの読み取り専用のポイントインタイムコピーを取得します。このコピーは高速な ローカルバックアップとして機能します。OneFS スナップショットは拡張性が高く、 作成にかかる時間は通常1 秒未満です。ファイルシステムの活動レベル、サイズ、コ ピーされるディレクトリのサイズにかかわらず、パフォーマンスのオーバヘッドはほ とんどありません。またファイルの変更されたブロックは、スナップショットのアッ プデート時に保存されるため、スナップショットストレージが高い効率性で利用でき ます。ユーザは各ファイルシステムのディレクトリ下にある非表示のディレクトリ /.snapshot を経由して、使用可能なスナップショットにアクセスできます。Isilon SnapshotIQ は、クラスタ上に無制限のスナップショットを作成することもできます。 スナップショットの間隔を細分化してRPO 時間枠を向上できるため、他の大多数のス ナップショット実装に比べて、非常に大きな利点があります。
SnapshotIQ を使用したユーザ主導のファイルリカバリ SnapshotIQ には、失われたファイルや破損したファイルをユーザ自身がリカバリでき る利点に加えて、ファイルシステムへの影響を最小限に抑えつつバックアップする方 法も備わっています。スナップショットからのバックアップを起動するにはいくつか の利点があります。最も大きな利点は、読み取り専用スナップショットから直接バッ クアップを実行するため、ファイルシステムを停止する必要がないということです。 その結果、開いているファイルのロックの競合という問題が回避され、ユーザはバッ クアップジョブの実行中にもデータにフルアクセスできます。 SnapshotIQ はクラスタ上のスナップショットの最新バージョンをポイントするエイ リアスも自動で作成します。バックアップが常にそのエイリアスを参照するようにす れば、バックアッププロセスが容易になります。定義上、スナップショットはポイン トインタイムコピーであるため、スナップショットからのバックアップにより、ファ イルシステムまたはサブディレクトリの一貫性が維持されます。 このプロセスは、NDMP バックアップジョブの一部としてスナップショットを作成す る NDMP スナップショット機能を使用し、バックアップの完了後にそのスナップ ショットを削除することで、さらに合理化できます。OneFS では、広く普及した NDMP (ネットワークデータ管理プロトコル)のサポートにより、バックアップおよびリス トア機能を利用できます。NDMP は主要なデータバックアップ製品との互換性を提供 する、オープンな標準プロトコルです。Isilon は NDMP のバージョン 3、および 4 の 両方をサポートしています。OneFS NDMP モジュールには、以下の機能があります。 ● NDMP を使用した完全/増分バックアップおよびリストア ● ダイレクトアクセスリストア(DAR/DDAR)、単一ファイルリストア、3 方向バック アップ ● 任意のシステムへのリストア ● ACL(アクセス制御リスト)へのシームレスな統合、代替データストリームおよび エンドユーザ ファイルの削除 ファイルのリストア
リソースフォーク ● 選択的なファイルリカバリ ● レプリケーション後のバックアップ スナップショットと NDMP はローカルな障害に対する理想的なソリューションです が、致命的な障害や自然災害などへの備えは、第二の選択肢として地理的に離れてい る場所にデータセットをコピーするほうがより適切です。Isilon SyncIQ モジュールは、 広範な RPO(目標復旧地点)および RTO(目標復旧時間)を解決する、高パフォー マンスの非同期レプリケーションを提供します。これにより、インフラストラクチャ のコストと、災害発生時のデータ損失の可能性との最適なトレードオフを決定できま す。SyncIQ は複製されたファイルシステムにハードリミットを設けないため、データ の増加に伴って線形的に、マルチペタバイトの範囲で拡張できます。
SyncIQ を使用した、ローカルまたは地理的に離れた Isilon OneFS クラスタへの Hadoop データの レプリケーション
SyncIQ は、短距離または長距離のレプリケーション用に、LAN または WAN のどちら の接続でも容易に最適化されるため、サイト固有の、または地域的な災害の両方から データを保護できます。さらに SyncIQ は、クラスタストレージのパフォーマンスと 効率性を活用するように設計された、高度に並列化されたポリシーベースのレプリ ケーションアーキテクチャを採用しています。そのため、総スループットは容量に比 例して増加され、拡張データセット全体で RPO が一貫して保持されます。 従来の Hadoop ストレージ実装における課題は、HDFS ストレージ層の一部として EMC Isilon を導入することで解決できます。以下に要点を示します。
従来のHadoop ストレージ実装 EMC Isilon ストレージ実装
専用のストレージインフラストラクチャ - Hadoop での利用に限定される スケールアウトストレージ - 複数のアプリケーションとワークフローに 接続 SynclQ によるパラレルレプリケーション プライマリクラスタ DR クラスタ
単一障害点 - NameNode が単一障害点になる 単一障害点なし - 分散した NameNode エンタープライズレベルのデータ保護なし - スナップショット、レプリケーション、バッ クアップがない エンドツーエンドのデータ保護 - SnapshotIQ、 SyncIQ、 NDMP バックアップ 非効率なストレージ利用 - 3 面ミラーでデータ保護 業界随一のストレージの利用効率 - 使用率 80%以上 拡張性がない - ストレージと計算リソースを切り離せない 柔軟な拡張性 - 計算リソースとストレージを別々に拡張 手動でのインポート/エクスポート - プロトコルのサポートなし マルチプロトコル - 業界標準プロトコル - NFS、CIFS、FTP、HTTP、HDFS
まとめ
Hadoop は、企業のビッグデータから貴重な洞察を得るために必要な時間やリソース を劇的に削減する、革新的な分析エンジンです。このホワイトペーパーで詳述したよ うに、EMC Isilon スケールアウト NAS および Isilon OneFS オペレーティングシステム は、Over-the-wire プロトコルとして HDFS 層を利用することで、大きな利点をもたら します。この統合により、Hadoop のコアコンポーネントにおいても、エコシステム コンポーネントにおいても、スケールアウトNAS プラットフォームを Hadoop アーキ テクチャのネイティブな構成要素として活用できるようになります。また、Hadoop ワークフロー全体でシンプルさ、柔軟性、信頼性、効率性に優れたOneFS を活用でき ます。HDFS を統合することで業界標準の Apache Hadoop ディストリビューションと Isilon を組み合わせたビッグデータ分析ソリューションを容易に展開し、強力で効率 性と柔軟性に優れたビッグデータストレージと分析環境を構築できます。このアプ ローチにより、直接接続されたストレージを使用し、リソースを大量に消費する複雑 な従来のHadoop 導入上の課題が解消されます。Isilon スケールアウト NAS は進化す るビッグデータ分析ワークフローの要件を満たすためのシンプルさを保ちつつ、 Hadoop 環境のデータ保護を強化し、信頼性を高める、復元力の高いストレージイン フラストラクチャを提供します。
Isilon について
Isilon は EMC の一部門で、スケールアウト NAS のグローバルリーダーです。ストレー ジではなくデータの管理を望む企業にパワフルでシンプルなソリューションを提供 しています。Isilon の製品は規模にかかわらず導入、管理、拡張が容易です。従来の エンタープライズストレージとは異なり、Isilon は将来的にストレージが増えたり、 よりパフォーマンスが必要になったり、ビジネスニーズが変化してもシンプルなまま 運用できます。Isilon は企業のストレージに対する考え方を変革しようとしています。 考え方を変えることによって、お客様はより優れた、より簡単な方法を見つけること ができるようになります。詳細についてはwww.isilon.co.jp をご覧ください。