• 検索結果がありません。

EMC XtremIOストレージ アレイ(Ver. 4.0)の概要

N/A
N/A
Protected

Academic year: 2021

シェア "EMC XtremIOストレージ アレイ(Ver. 4.0)の概要"

Copied!
65
0
0

読み込み中.... (全文を見る)

全文

(1)

ホワイト ペーパー 要約 このホワイト ペーパーでは、EMC XtremIO ストレージ アレイにつ いて説明します。システム アーキテクチャ、オペレーション原理、 各種機能について詳しく解説します。XtremIO 独自の機能(イン ライン データ削減テクノロジー[インライン重複排除およびデー タ圧縮を含む]、拡張性の高いパフォーマンス、データ保護など) を使って、他のシステムでは解決できないデータ ストレージに 関する問題を解決する方法についても取り上げます。 2015 年 4 月

EMC XtremIO ストレージ アレイ

Ver. 4.0)の概要

詳細レビュー

(2)

Copyright © 2015EMC Corporation. All rights reserved. EMC Corporation は、この資料に記載される情報が、発行日 時点で正確であるとみなしています。この情報は予告なく変更 されることがあります。 この資料に記載される情報は、「現状有姿」の条件で提供され ています。EMC Corporation は、この資料に記載される情報に 関する、どのような内容についても表明保証条項を設けず、 特に、商品性や特定の目的に対する適応性に対する黙示の 保証はいたしません。 この資料に記載される、いかなるEMC ソフトウェアの使用、 複製、頒布も、当該ソフトウェア ライセンスが必要です。 最新のEMC 製品名については、EMC の Web サイトの EMC Corporation の商標を参照してください。

VMware は、米国およびその他の地域における VMware, Inc. の登録商標または商標です。その他のすべての名称ならびに

(3)

目次

エグゼクティブ サマリー ... 5 概要 ... 6 システム概要... 7 X-Brick ... 8 スケールアウト アーキテクチャ ... 10 10TB スターターX-Brick(5TB) ... 11 システム アーキテクチャ ... 12 動作原理 ... 14 マッピング テーブル ... 14 書き込みI/O フローの仕組み ... 15 読み取りI/O フローの仕組み... 20 システム機能... 21 シン プロビジョニング ... 22 インライン データ削減 ... 22 インライン データ重複排除... 22 インライン データ圧縮 ... 24 合計データ削減... 25

XtremIO Data Protection (XDP)... 26

XDP の仕組み ... 27 静止データ暗号化 ... 29 スナップショット ... 31 拡張性の高いパフォーマンス ... 37 均等なデータ分散 ... 40 高可用性 ... 41 無停止アップグレードと拡張 ... 43 VMware VAAI の統合 ... 44 XMS(XtremIO マネージメント サーバー) ... 48 システムGUI... 49 コマンド ライン インターフェイス ... 50 RESTful API ... 50 LDAP/LDAPS ... 51

(4)

リモート アレイへの XtremIO のレプリケーション ... 52 RecoverPoint ... 52 ソリューション概要 ... 53 XtremIO 向けの RecoverPoint ネイティブ レプリケーション ... 53 XtremIO 向けの同期と CDP レプリケーション ... 55 他のEMC 製品との統合 ... 58 システムの統合ソリューション ... 58 Vblock ... 58 VSPEX ... 58 ソリューションの管理およびモニタリング ... 59

ESA(EMC Storage Analytics) ... 59

Windows 向け ESI(EMC Storage Integrator)プラグイン ... 59

Oracle VM 向け ESI(EMC Storage Integrator)プラグイン ... 60

ViPR Controller ... 60

ViPR SRM ... 61

VMware vCenter 向け VSI(Virtual Storage Integrator)プラグイン ... 61

アプリケーション統合ソリューション ... 62

AppSync ... 62

OEM(Oracle Enterprise Manager)プラグ イン ... 62

ビジネス継続性と高可用性ソリューション ... 63

PowerPath ... 63

VPLEX ... 63

OpenStack の統合 ... 64

(5)

エグゼクティブ サマリー

フラッシュ ストレージは、データセンターで I/O パフォーマンスを上げるための魅力 的な方法です。ただし、コストが高く、拡張性、高可用性、エンタープライズ機能など の犠牲を常に伴います。 XtremIO の 100%フラッシュ ベース型スケールアウト エンタープライズ ストレージ アレイでは、高度なパフォーマンスやスケーラビリティだけでなく、新しいレベルの使 いやすいSAN ストレージを提供する一方で、これまで実現できなかった高度な機能 も実現します。 XtremIO の新しいオール フラッシュ アレイは、パフォーマンスを最大限に発揮してレ スポンス タイムのレーテンシーを一貫して低く抑え、エンタープライズ クラスの高可 用性機能、コストを大幅に削減するリアルタイム インライン データ削減、高度な機能 (シン プロビジョニング、VMware との緊密な統合、スナップショット、ボリューム クロ ーン、最高のデータ保護など)を実現するよう設計されています。 これは、所有コストを低く抑えることで達成されています。この製品のアーキテクチ ャは、フラッシュ メディアの寿命を延ばし、フラッシュ容量の効率コストを抑えるほか、 パフォーマンスとスケーラビリティの提供、運用効率の向上、高度なストレージ アレ イ機能の実現など、フラッシュ ベース ストレージの全要件に対応します。 このホワイト ペーパーは、XtremIO ストレージ アレイを幅広い観点から紹介し、シス テム アーキテクチャの詳細な説明、オペレーション原理、多彩な機能についても取り 上げます。

(6)

概要

XtremIO は、フラッシュの優れた可能性を完全に解放し、SSD やフラッシュ メディアを ベースにしたユニークな特性を活かすアレイ ベースの性能を実現するよう設計され たオール フラッシュ ストレージ アレイです。 XtremIO は業界標準のコンポーネントと独自のインテリジェント ソフトウェアを使用 して、比類ないレベルのパフォーマンスを実現します。達成可能なパフォーマンスは、 IOPS で数十万から数百万に達し、1 ミリ秒以下での安定した低いレーテンシーを達 成します。* また、システムは、プランニングの手間を最小にするよう設計されており、アレイのプ ロビジョニングと管理を極めて容易にするユーザー フレンドリーなインターフェイスを 備えています。 XtremIO は、次の主要な側面に価値をもたらすために、フラッシュを活用します。 • パフォーマンス:システムの混雑状況や、ストレージ容量の使用状況にかかわ らず、レーテンシーとスループットを一貫して予測可能な一定した状態に保ちます。 I/O 要求のアレイ内のレーテンシーは、通常 1 ミリ秒よりはるかに少なくなります。* • スケーラビリティ:XtremIO ストレージ システムは、スケールアウト アーキテクチャ に基づいています。システムは、X-Brick と呼ばれる単一のビルディング ブロック で開始されます。パフォーマンスや容量の追加が必要になると、システムは、 X-Brick を追加して拡張します。パフォーマンスが直線的に向上することで、単一 のX-Brick 構成に比べて、2 つの X-Brick であれば 2 倍の IOPS を、4 つの X-Brick であれば4 倍の IOPS を、6 つの X-Brick であれば 6 倍、8 つの X-Brick であれば 8 倍の IOPS を実現します。システムを拡張しても、一貫して低いレーテンシーが 保たれます。 • 効率性:コア エンジンは、コンテンツ ベースのインライン データ削減を実装します。 XtremIO ストレージ アレイは稼働中、システムにデータが到達するのに従い、 自動的にデータを削減(重複排除および圧縮)します。これはフラッシュに書き込 まれるデータの量を削減するため、メディアの寿命を延ばすとともに、コストの削 減に役立ちます。XtremIO アレイは、細かいデータ ブロックでボリュームにオン デマンドで容量を割り当てます。ボリュームは常に、パフォーマンス低下、容量 の過剰プロビジョニング、断片化を伴わずにシン プロビジョニングされます。コン テンツ ベースのインライン重複排除が実装されると、残りのデータはさらに圧縮 され、フラッシュ メディアに対する書き込みの量が削減されます。データ圧縮は 重複排除された(一意の)データ ブロックでインラインで実行されます。 高い割合で書き込みを行うのを避けることには次のメリットがあります。

(7)

 データの格納に必要な物理容量の減少により、ストレージ アレイの効率が向 上し、GB あたりのストレージ コストが大幅に削減

• データ保護:XtremIO はフラッシュに最適化された独自のデータ保護アルゴリズ ム(XtremIO Data Protection または XDP)を活用します。これにより、あらゆる既 存のRAID アルゴリズムを上回るパフォーマンスを実現しています。また、XDP の 最適化によって、データ保護目的でのフラッシュ メディアへの書き込みも減ります。 • 機能:XtremIO では、高性能および設置効率の高いスナップショット、インライン

データ削減(インライン重複排除およびデータ圧縮を含む)、シン プロビジョニング、 VMware VAAI の完全統合をサポートするほか、ファイバー チャネルと iSCSI プロト コルもサポートします。

システム概要

XtremIO ストレージ アレイは、スケールアウト アーキテクチャに基づいた、オール フ ラッシュ システムです。システムは、X-Brick と呼ばれるビルディング ブロックを使用 します。これを、図2で示すように、クラスター化することで、必要に応じてパフォーマ ンスや容量を増やすことができます。 システムの処理は、スタンドアロンの専用Linux ベース サーバーで制御されます。 これはXMS(XtremIO マネージメント サーバー)と呼ばれます。XMS のホストは物理ま たは仮想サーバーのいずれかを使用でき、複数のXtremIO クラスターを管理できます。 アレイはXMS から切断されても稼働し続けますが、構成や監視は実行できません。 XtremIO のアレイ アーキテクチャは、CPU、RAM、SSD、ホスト ポートなどの全リソー スをバランスの取れた状態で直線的に拡張しながら、フラッシュの潜在的なパフォー マンスをフルに発揮できるよう特別に設計されています。これにより、アレイは必要 などのレベルのパフォーマンスでも達成でき、さらに、予測可能なアプリケーションの 動作にとって不可欠な整合性のあるパフォーマンスを実現します。 XtremIO ストレージ システムは、長期間にわたって、システムの状態、アクセス パタ ーンに関係なく、一貫した極めて優れたパフォーマンスを提供します。それは真のラ ンダム I/O の設計されています。 システムのパフォーマンス レベルは、その容量使用率レベル、ボリューム数、エージ ングなどのいかなる影響も受けません。その上、パフォーマンスは「共有キャッシュ」 アーキテクチャに基づいていないため、データセット サイズやデータ アクセス パター ンなどの影響を受けません。 XtremIO は、コンテンツ対応ストレージ アーキテクチャにより、以下を実現します。 • データ ブロックが分散された状況下でも、本質的に最大のパフォーマンスと最小 のフラッシュ ウェアを提供 • 分散型のメタデータにも対応 • データやメタデータのホット スポットなし

(8)

• インライン データ削減(重複排除およびデータ圧縮)、シン プロビジョニング、 高度なデータ保護(XDP)、スナップショットなどの先進的なストレージ機能

X-Brick

図1はX-Brick を示しています。 図1:X-Brick X-Brick は XtremIO アレイの基礎となるビルディング ブロックです。 各X-Brick は、以下により構成されます。 • 以下を含む 2U DAE(ディスク アレイ エンクロージャ)×1:

 eMLC SSD(標準 X-Brick)×25 または eMLC SSDs(10TB スターターX-Brick [5TB])×13  冗長 PSU(電源ユニット)×2  冗長 SAS 相互接続モジュール×2 • バッテリ バックアップ ユニット×1 • 1U ストレージ コントローラー(冗長ストレージ プロセッサ)×2 各ストレージ コントローラーの構成:  冗長 PSU(電源ユニット)×2  8 GB/秒 FC(ファイバー チャネル)ポート×2  10 GbE iSCSI ポート×2  40 Gb/秒 InfiniBand ポート×2

(9)

表1に、X-Brick ごとのシステム仕様の概要を示します。

表1: システム仕様(X-Brick ごと)

機能 仕様(X-Brick ごと)

物理 • 5U

• eMLC Flash SSD(10TB スターターX-Brick [5TB])×13 • eMLC Flash SSD(標準 X-Brick)×25

高可用性 • 冗長 • ホット スワップ コンポーネント • SPOF(単一障害点なし)なし ホスト アクセス 対称アクティブ/アクティブ: どのコントローラー上のどのターゲット ポートからも、均一なパフォーマンスで、 どのボリュームにも並行してアクセスできます。ALUA の必要はありません。 ホスト ポート • 4×8 Gb/秒の FC • 4×10 Gb/秒の Ethernet iSCSI 有効容量* • 10TB スターターX-Brick(5TB)タイプの場合: - 3.26TiB(13 個の SSD、データ削減なし) - 7.22TiB(25 個の SSD、データ削減なし) • 10TB X-Brick タイプ: 7.58TiB(データ削減なし) • 20TB X-Brick タイプ: 15.16TiB(データ削減なし) • 40TB X-Brick タイプ: 30.55TiB(データ削減なし) レーテンシ 1 ミリ秒未満† *有効容量とはアレイに書き込み可能な圧縮できない一意のデータの量です。有効容量は通常、XtremIO のインライン データ

(10)

スケールアウト アーキテクチャ

XtremIO ストレージ システムには、単一の X-Brick か、複数の X-Brick のクラスター を含めることができます。図2および表2を参照してください。 図2:単一の X-Brick と複数の X-Brick クラスターのシステム構成 2 つまたはそれ以上の X-Brick のクラスターでは、XtremIO は、ストレージ コントロー ラー間のバックエンド接続性のために冗長40 Gb/秒 QDR InfiniBand ネットワークを 使用し、高い可用性と超低レーテンシー ネットワークを確保します。InfiniBand ネット ワークは、XtremIO アレイの完全管理型コンポーネントで、XtremIO システムの管理 者は、InfiniBand テクノロジで特殊なスキルを必要としません。 X-Brick クラスターx1 X-Brick クラスター×2 X-Brick クラスター×4 X-Brick クラスターx6 X-Brick クラスターx8

(11)

単一のX-Brick クラスターの構成: • X-Brick×1 • 交換用バッテリ バックアップ ユニット×1 複数のX-Brick クラスターの構成: • 2 台、4 台、6 台、8 台の X-Brick • InfiniBand スイッチ×2 表2:単一の X-Brick と複数の X-Brick クラスターのシステム構成 10TB スター ター X-Brick(5TB) X-Brick クラスターx1 X-Brick クラスター×2 X-Brick クラスター×4 X-Brick クラスターx6 X-brick クラスターx8 X-Brick の数 1 1 2 4 6 8 InfiniBand スイッチの数 0 0 2 2 2 2 交換用バッ テリ バックア ップ ユニット の数 1 1 0 0 0 0

10TB スターターX-Brick(5TB)

XtremIO の 10TB スターターX-Brick(5TB)は標準 X-Brick クラスターと同一ですが、 eMLC Flash SSD は 25 個ではなく 13 個しかありません。10TB スターターX-Brick (5TB)に 12 個の SSD を追加して標準 X-Brick に拡張することができます。

(12)

システム アーキテクチャ

XtremIO は他のあらゆるブロック ベース ストレージ アレイと同様に機能し、既存の SAN との統合が可能で、ホストへの接続には 8 Gb/秒のファイバー チャネルおよび 10 Gb/秒の Ethernet iSCSI(SFP+)接続のいずれかを選択できます。 ただし、他のブロック アレイとは異なり、XtremIO は専用フラッシュ ストレージ システ ムであり、最高のパフォーマンス、使いやすさ、高度なデータ管理サービスを提供す るよう設計されています。XtremIO アレイ内の各ストレージ コントローラーは、ベース プラットフォームとして特別にカスタマイズされた軽量なLinux ディストリビューション を実行します。XIOS(XtremIO オペレーティング システム)は、図3のように、Linux の上で稼働し、ストレージ コントローラー内のアクティビティをすべて処理します。 XIOS は高い I/O レートを処理し、システムの機能モジュールや InfiniBand を介した RDMA、監視、メモリ プールなどを管理します。

図3:X-Brick ブロックの図

XIOS は、コンテンツ対応、低いレーテンシー、高パフォーマンス ストレージ サブシス テムなどの特定の要件を満たすように設計された専用のプロセス スケジューリング/ 処理アルゴリズムを備えています。

(13)

XIOS では、以下が提供されます。

• 低レーテンシー スケジューリング:サブプロセスの効果的なコンテキスト切り替え を有効にし、スケジューリングを最適化して、待機時間を最小に抑えます

• リニアな CPU の拡張性:マルチコア CPU を含む、すべての CPU リソースを完全 に活用できるようにします • 制限された CPU コア間同期:サブプロセス間通信およびデータ転送を最適化し ます • CPU ソケット間同期なし:異なるソケットで実行されるサブプロセス間でのタスクの 同期や依存関係を最小化します • キャッシュ ライン対応:レーテンシーやデータ アクセスを最適化します 各X-Brick のストレージ コントローラーは、冗長 SAS 相互接続を通じて接続された DAE(ディスク アレイ エンクロージャ)を所有します。また、ストレージ コントローラーは、 冗長で高可用性のInfiniBand ファブリックに接続されます。ホストからどのストレージ コントローラーがI/O 要求を受信するかに関係なく、複数の X-Brick にある複数のスト レージ コントローラーが協調して要求を処理します。XtremIO システムのデータ レイ アウトでは、確実に、すべてのコンポーネントが本質的に負荷を共有し、I/O 動作に均 等に参加します。

(14)

動作原理

XtremIO ストレージ アレイは、データ ブロックでデータを処理することで、システムに データが到達するのに従い、データを自動的に削減(重複排除)します。重複排除は (システム全体にわたって)グローバルで、常時稼働で、リアルタイムで実行されます (後処理として実行されることはありません)。重複排除の後、データはインラインで 圧縮されてからSSD に書き込まれます。 XtremIO はグローバル メモリ キャッシュを使用します。これは重複排除済みのデー タや、本質的にアレイ全体にデータを均等に分散するコンテンツ ベースの分散に対 応します。すべてのボリュームはX-Brick 全体、および全ストレージ アレイのホスト ポートでアクセスできます。 システムは、高可用性のバックエンド InfiniBand ネットワーク(EMC 製)を使用します。 これは、クラスター内の全ストレージ コントローラー間で、超低レーテンシーおよび RDMA(Remote Direct Memory Access)で、高速アクセスを提供します。RDMA を活 用することにより、XtremIO システムは本質的に、全ストレージ コントローラーに広が る単一の共有メモリ スペースを実現します。 1 つの X-Brick の有効な論理容量は、格納されるデータセットによって異なります。 • 多くのクローンされた仮想化環境(仮想デスクトップ統合(VDI)など)でよく見られ る重複度の高い情報では、効率的な有効容量は、使用できる物理フラッシュ容 量より格段に大きくなります。5:1~10:1 の重複排除の比率は、こうした環境で 定期的に達成されます。 • 多くのデータベースやアプリケーション データで一般的に見られる圧縮可能なデ ータの場合、圧縮率は 2:1~3:1 の範囲内にあります。 • データ圧縮およびデータ重複排除の両方のメリットを得ている VSI(仮想サーバー インフラストラクチャ)などのシステムでは、一般に6:1 の比率を実現しています。

マッピング

テーブル

各ストレージ コントローラーには、SSD 上の各データ ブロックのロケーションを管理 するテーブルがあります。表3(15ページ)を参照してください。 テーブルは次の2 つの部分で構成されます。 • テーブルの最初の部分は、ホスト LBA をそのコンテンツ フィンガープリントにマッ プします。 • テーブルの 2 番目の部分は、コンテンツ フィンガープリントを SSD 上のロケーシ ョンにマップします。

(15)

杯で、書き込める空きのストライプがなくなったときに、新しいブロックの書き込み先 を選べるようにしたりできます。

書き込み

I/O フローの仕組み

一般的な書き込み処理では、入力データ ストリームがアクティブ/アクティブのストレ ージ コントローラーのいずれかに到達し、データ ブロックに分割されます。データ ブ ロックごとに、アレイは一意の識別子を使ってデータにフィンガープリントを作成します。 アレイは、このフィンガープリントを使ってテーブルを管理し(表3を参照)、着信の書 き込みがアレイ内にすでに存在するかをどうかを判断します。また、フィンガープリン トは、データの保存場所の判別にも使用されます。コンテンツ フィンガープリント マッ ピングに対するLBA が、ストレージ コントローラーのメモリ内で、メタデータに記録さ れます。 表3:マッピング テーブルの例 LBA オフ セット フィンガー プリント SSD オフセット/ 物理的な場所  Address 0  20147A8  40   Address 1  AB45CB7  8   Address 2  F3AFBA3  88   Address 3  963FE7B  24   Address 4  0325F7A  64   Address 5  134F871  128   Address 6  CA38C90  516   Address 7  963FE7B – 重複排除された –  注: 表3のデータ ブロックの色は、コンテンツに対応しています。一意のコンテンツが 別々の色で示され、重複するコンテンツは同一の色(赤)で示されています。 データ データ データ データ データ データ データ データ データ データ データ データ データ データ データ

(16)

システムは、フィンガープリントと、それに対応するデータ ブロックが、以前格納され たかどうかを検証します。 フィンガープリントが新規の場合、システムは以下を実行します。 • データを圧縮します。 • ブロックが格納されるアレイの場所を選択する(LBA ではなく、フィンガープリント に基づいて)。 • 「物理的な場所に対するフィンガープリント」マッピングを作成する。 • フィンガープリントの参照回数を 1 つずつ増やす。 • 書き込みを実行する。 「重複した」書き込みの場合は、システムは新しいLBA をフィンガープリント マッピン グに記録し、この特定のフィンガープリントの参照回数を1 つ増やします。データは すでにアレイ上に存在するため、物理的な場所へのフィンガープリント マッピングを 変更する必要も、SSD に書き込みを行う必要もありません。すべてのメタデータの変 更はメモリ内で実行されます。そのため、重複排除された書き込みは、最初の一意 のブロック書き込みより高速で実行されます。これは、XtremIO のインライン データ 削減の独自のメリットの1 つで、これにより、重複排除で実際に書き込みパフォーマ ンスが向上します。 SSD に対するデータ ブロックの実際の書き込みは、非同期で実行されます。アプリ ケーション書き込み時に、システムはデータ ブロックを(RDMA 経由で異なるストレー ジ コントローラーにレプリケートすることで保護されている)メモリ内書き込みバッファ ーに配置し、直ちに ACK をホストに返します。バッファーに十分なブロックが集まると、 システムはこれらをSSD 上の XDP(XtremIO データ保護)ストライプに書き込みます。 このプロセスは、最も効率的な方法で実行されます。詳細については、XtremIO デー タ保護ホワイト ペーパーを参照してください。

(17)

書き込みI/O がアレイに発行された場合: 1. システムは着信データを分析し、それを図4に示すようにデータ ブロックにセグ メント化します。 図4:固定ブロックに分割されたデータ 2. 図5で示すように、アレイは、データ ブロックごとに、データに一意のフィンガー プリントを割り当てます。 図5:各ブロックに割り当てられたフィンガープリント アレイではこのフィンガープリントを使ってテーブルが管理され、後続の書き込み が表 3(15ページ)に示すように、アレイ内にすでに存在するかどうか確認します。  システム内にデータ ブロックが存在しない場合は、データの場所を判別する ためにフィンガープリントを使用して、他のストレージ コントローラーにブロッ クを書き込もうとした履歴が、ストレージ コントローラーの処理により記録され ます。  データ ブロックがシステム内にすでに存在する場合は、図6に示すように書 き込みは行われません。 図6:既存/繰り返しブロックの重複排除

(18)

3. アレイはデータ ブロックごとに参照回数を増やします。 4. 整合性のある分散型マッピングを使用することで、各ブロックは関連するフィンガ ープリントのアドレス スペースに対応するストレージ コントローラーに経路指定さ れます。 整合性のある分散型マッピングは、コンテンツ フィンガープリントに基づいてい ます。フィンガープリントを計算する計算プロセスの結果、フィンガープリント値は 均等に分散され、フィンガープリントマッピングは、図7に示すように、クラスター 内のストレージ コントローラー間に均等に分散されます。 図7:クラスター全体に分散したデータ 注: クラスター間のデータ転送は、図7に示すように、RDMA を使用して、低レーテン シーおよび高速InfiniBand ネットワークで実行されます。 5. システムは、ACK をホストに送信します。

(19)

6. フィンガープリントの均等分散機能によって、クラスター内の各ストレージ コントロ ーラーは、均等なデータ ブロックの分配を受け取ります。追加ブロックが届くと、 図8に示すようにストライプに振り分けられます。 図8:フル ストライプに振り分けられた追加ブロック 7. システムはデータ ブロックを圧縮して、各データ ブロックのサイズをさらに削減し ます。 8. アレイ内で一番空きの多いストライプ(またはあればフル ストライプ)を埋めるの に十分なデータ ブロックがストレージ コントローラーに集まると、図9に示すよ うに、データ ブロックがキャッシュから SSD に転送されます。 図9:SSD にコミットされたストライプ

(20)

読み取り

I/O フローの仕組み

データ ブロック読み取り処理では、システムはフィンガープリント マッピングに対する 論理アドレスをLBA で検索します。フィンガープリントが見つかると、物理マッピング に対しそのフィンガープリントの検索を実行して、特定の物理的な場所からそのデー タ ブロックを取得します。データはクラスターおよび SSD 全体に均等に書き込まれる ため、読み取り負荷も均等に分散されます。 XtremIO の各ストレージ コントローラーには、メモリ ベースの読み取りキャッシュがあ ります。 • 従来のアレイでは、読み取りキャッシュは論理アドレス別に管理されていました。 読み取られる可能性の高いアドレスにあるブロックが、読み取りキャッシュに配 置されていました。 • XtremIO アレイでは、読み取りキャッシュはコンテンツ フィンガープリントで管理さ れます。読み取られる可能性の高いコンテンツを持つブロック(フィンガープリント ID によって識別)が、キャッシュに配置されます。 これにより、XtremIO の読み取りキャッシュ重複排除が機能します。つまり、比較的 小さい読み取りキャッシュが、従来の同サイズのキャッシュに比べて、格段に大きく 見えるようになります。 要求されたブロック長がデータ ブロック サイズより大きい場合は、XtremIO はクラス ター全体で並行してデータ ブロックの読み取りを実施し、それらをアプリケーションに 返す前に、より大きなブロックに組み立てます。 圧縮されたデータ ブロックは、デリバリする前に圧縮解除されます。 読み取りI/O がアレイに発行された場合: 1. システムは、各データ ブロックごとに LBA を識別するため着信要求を分析し、 データを保持するためのバッファーを作成します。 2. 次のプロセスは、並行して実行されます。  データ ブロックごとに、アレイは格納されたフィンガープリントを検索します。 フィンガープリントにより、X-Brick 上のデータ ブロックの場所が特定されます。 より大きなI/O(256 K など)では、複数の X-Brick により、各データ ブロックが 取得されます。  システムは、RDMA を通じ、InfiniBand を介して、要求された読み取りデータ を処理ストレージ コントローラーに送信します。 3. システムは、完全に取り込まれたデータ バッファーをホストに戻します。

(21)

システム機能

XtremIO ストレージ アレイでは、特別なライセンスがなくても常に利用できる幅広い 機能が提供されています。 システム機能には次が含まれます。 • データ サービス機能:すべての着信書き込みで順番(次のリストのとおり)に適用 されます。  シン プロビジョニング  インライン データ削減: − インライン データ重複排除 − インライン データ圧縮  XtremIO Data Protection (XDP)

 静止データ暗号化  スナップショット • システム全体の機能:  拡張性の高いパフォーマンス  均等なデータ分散  高可用性 • その他の機能:  無停止アップグレード  VMware VAAI の統合

(22)

シン

プロビジョニング

XtremIO ストレージは、小さな内部ブロック長を使用してネイティブにシン プロビジョ ニングされます。これにより、シン プロビジョニングされたスペースに対し、きめ細や かな解決策が提供されます。 システム内の全ボリュームはシン プロビジョニングされます。つまり、システムは実 際に必要なときにのみ容量を消費します。XtremIO は、一意のデータ ブロックのフィ ンガープリントID を計算した後、クラスター内にそれらを物理的に配置する場所を決 定します。そのため、書き込みの前にストレージ領域の事前割り当てをしたり、シック プロビジョニングをしたりすることは一切ありません。 XtremIO のコンテンツ対応アーキテクチャの結果、ブロックはシステムのどの場所に でも格納でき(場所を参照する場合はメタデータだけを使用)、一意のブロックを受け 取った場合にのみデータが書き込まれます。 そのため、多くのディスク中心型アーキテクチャを使用したシン プロビジョニングとは 異なり、XtremIO では、スペース クリープやガベージ コレクションが生じることはあり ません。さらに、時の経過とともに発生するボリュームの断片化はXtremIO には該 当せず(ブロックはランダム アクセスのアレイに分散するため)、デフラグメンテーショ ン ツールは不要です。 XtremIO の標準で備わっているシン プロビジョニングは、システム容量の使用率や システムへの書き込みパターンにかかわらず、ボリュームのライフサイクル全体での 一貫したパフォーマンスやデータ管理も可能にします。

インライン

データ削減

XtremIO の一意のインライン データ削減は次のテクニックを活用することで達成でき ます。 • インライン データ重複排除 • インライン データ圧縮 インライン データ重複排除 インライン データ重複排除では、データがフラッシュ メディアに書き込まれる前に、 冗長性を取り除きます。 XtremIO はデータがシステムに到達したとき、自動的かつ全体的に、データの重複 排除を行います。重複排除は後処理ではなく、リアルタイムで実行されます。つまり、 XtremIO ではリソースを消費するバックグラウンド プロセスや後処理に関連する追

(23)

XtremIO では、データ ブロックはボリューム内のユーザー レベルのアドレスではなく、 コンテンツ別に格納されます。この結果、容量とパフォーマンスの観点からシステム 内のデバイス全体で理想的なロード バランシングが行われます。データ ブロックが 変更されるたびに、システム内の任意のSSD セットにデータが配置され、システムが ブロックのコンテンツをすでに認識している場合には、書き込みは一切行われません。 すべてのSSD を均等に使用し、完全なウェア レベリングを実現することで、システム は常にアレイ全体にデータを分散させます。ホスト コンピューターによって同一の LBA(論理ブロック アドレス)が繰り返し書き込まれた場合でも、それぞれの書き込み はXtremIO アレイ内の異なるロケーションに割り振られます。ホストが繰り返し何度 も同一データを書き込んだ場合は、重複排除が行われるため、フラッシュに余分な 書き込みが行われることはありません。 XtremIO は効率の高いデータ重複排除のために、コンテンツ対応の、全体的に重複 排除されたキャッシュを使用します。システムのユニークなコンテンツ対応ストレージ アーキテクチャによって、小さいDRAM アロケーションで実質よりも大きいキャッシュ サイズを獲得することができます。そのため、XtremIO は仮想デスクトップ(VDI)環境 などに多い「ブート ストーム」などの困難なデータ アクセス パターンに最適なソリュ ーションと言えます。 さらに、システムはインライン データ重複排除用としてだけでなく、アレイ全体にデー タ ブロックを均等に分散するためにもコンテンツ フィンガープリントを使用します。こ れによって、パフォーマンスに本来備わっているロード バランシング機能を活用する ことで、データの再書き込みや再バランシングが不要なことから、フラッシュのウェア レベルの効率性が強化されます。 このプロセスをインラインで、かつ、アレイ全体で実行することで、SSD への書き込み も減少します。こうしてSSD の耐久性が向上し、後処理の重複排除に起因するパフ ォーマンスの低下を防ぎます。 XtremIO のインライン データ重複排除とインテリジェントなデータ ストレージ処理によ って、次のことが可能になります。 • システム パフォーマンスを最大限に活用して、システム リソースの使用状況を均 等化 • フラッシュの寿命を最大限に引き延ばす最小限のフラッシュ操作 • 均一なデータ分散により、システム全体でフラッシュ ウェアを均等に保つ • システム レベルでのガベージ コレクションが不要(後処理のデータ削減と逆) • ストレージ コストを最小化する SSD 容量のスマートな活用

(24)

インライン データ圧縮 インライン データ圧縮では、データがフラッシュ メディアに書き込まれる前に、すでに 重複排除されたデータを圧縮します。 XtremIO ではすべての重複データが取り除かれた後にデータを自動的に圧縮します。 これにより、一意のデータ ブロックに対してのみ圧縮が実行されるようになります。 データ圧縮は後処理ではなく、リアルタイムで実行されます。 データセットの特性が全体的な圧縮率を決定します。圧縮されたデータ ブロックはそ の後、アレイに保存されます。 圧縮により、SSD に書き込まれる必要がある物理的なデータの合計量を削減します。 この削減によってSSD の WA(書き込みの増大)を最小限に抑え、フラッシュ アレイ の耐久性が向上します。 XtremIO のインライン データ圧縮には次のメリットがあります。 • データ圧縮は常にインラインで、後処理として実行されることはありません。よっ てデータは常に一度だけ書き込まれます。 • 圧縮はさまざまなデータセット(データベース データ、VDI、VSI 環境など)に対応 します。 • データ圧縮は多くの場合データ重複排除を補完します。たとえば VDI 環境の重 複排除では、クローン化されたデスクトップに必要な容量が大幅に削減されます。 そして圧縮により特定のユーザー データが削減されます。結果として単一の X-Brick で、増加した VDI デスクトップ数を管理できるようになります。 • 圧縮によりデータ ブロックを最も効率よく保存することで、ストレージ容量を節約 します。 • XtremIO のパワフルなスナップショット機能と組み合わせると、ペタバイト規模の 有効なアプリケーション データを簡単にサポートできるようになります。

(25)

合計データ削減 XtremIO のデータ重複排除とデータ圧縮はお互いに補完しあいます。データ重複排 除では冗長データ ブロックを排除することで物理的なデータを削減します。データ圧 縮では、各データ ブロックのバイナリ レベル内でデータの冗長性を排除することで、 データの占有領域をさらに削減します。 図10はデータ重複排除とデータ圧縮プロセスの両方を組み合わせることの利点を 示しており、全体的なデータ削減につながります。 図10:データの重複排除と圧縮の組み合わせ この例では、ホストが書き込んだ12 個のデータ ブロックはまず 4 個のデータ ブロッ クに重複排除され、3:1 のデータ重複排除率を実現していますえ。データ圧縮プロセ スの後、4 個のデータ ブロックはそれぞれ 2:1 の比率で圧縮されるため、合計のデ ータ削減率は6:1 になります。

(26)

XtremIO Data Protection (XDP)

XtremIO ストレージ システムは、極めて効率の高い「自動修復型」ダブル パリティ データ保護を備えています。 データ保護とメタデータ用スペースのために、システムには、ほんのわずかの容量 のオーバーヘッドが必要です。これらは再構築に専用のスペア ドライブを必要としま せん。代わりに、「ホット スペース」という概念を活用し、アレイ上で空きスペースのあ る場所はどこでも、障害の発生したドライブの再構築に使用することができます。シ ステムは、1 台の再構築を実行するのに十分な分散容量を常時確保しています。 2 台の SSD が故障するまれなケースでは、データが全容量であっても、アレイでは 空き領域を使用してドライブのうち1 台のデータを再構築します。故障したドライブの うちの1 台が交換されると、2 台目のドライブを再構築します。両方のドライブのデー タを再構築するために十分な空き領域がある場合、同時に再構築します。 XtremIO は使用量が高くなったとしても、最小の容量オーバーヘッドでパフォーマン スを維持します。システムにはミラーリング スキーム(および、関連する 100%の容 量オーバーヘッド)は不要です。 XtremIO では、データ保護、メタデータ ストレージ、スナップショット、スペア ドライブ、 パフォーマンスに必要なリザーブ容量が極めて少なく、ユーザー データ用のスペー スが格段に多くなります。これにより、使用可能な GB あたりのコストを削減できます。 XtremIO ストレージ システムは、以下のことを実現します。 • N+2 データ保護 • わずか 8%という信じがたいほど少ないデータ保護容量オーバーヘッド • どんな RAID アルゴリズムの追随も許さないパフォーマンス(RAID アルゴリズム の中でも最も書き込み効率に優れたRAID 1 は、XDP(XtremIO Data Protection) に比べて 60%以上の書き込みが必要です)。 • 書き込み量が少なく、データが均等に分散されることから、どの RAID アルゴリズ ムよりも優れたフラッシュの寿命 • ドライブに障害が発生した場合には自動的に再構築を行い、従来の RAID アルゴ リズムに比べて、再構築時間を短縮 • システムに障害の発生したドライブが含まれていても、着信データを完璧に保護 する適応性の高いアルゴリズムのもたらす優れた堅牢性 • 同一個所の故障サポートによる管理性の向上

(27)

表4:XtremIO Data Protection と RAID スキームの比較 アルゴリ ズム パフォーマ ンス データ保護 容量のオー バーヘッド ストライプ 更新ごとの 読み取り 従来型アル ゴリズムの 読み取りの デメリット ストライ プ更新ご との書き 込み 従来型アル ゴリズムの 書き込みの デメリット RAID 1 高 1 つの障害 50% 0 – 2(64%) 1.6x RAID 5 中 1 つの障害 25%(3+1) 2(64%) 1.6x 2(64%) 1.6x RAID 6 低 2 つの障害 20%(8+2) 3(146%) 2.4x 3(146%) 2.4x XtremIO XDP RAID 1 を 60%上回る X-Brick あたり 2 つの障害 極めて低い 8%(23+2) 1.22 – 1.22 – XDP の仕組み

XDP(XtremIO Data Protection 護)は、フラッシュ メディア固有のプロパティと、 XtremIO のコンテンツ アドレス ストレージ アーキテクチャを活用するように設計され ています。 XDP は、データが保存されている場所をペナルティなしで制御できるというメリットを 得ながら、RAID 1 よりも優れたパフォーマンスで高い保護レベルと低ストレージ オー バーヘッドを達成します。またもう1 つのメリットとして、XDP(XtremIO Data Protection)では、従来のあらゆる RAID アルゴリズムに比べて、基盤となるフラッシ ュ メディアの耐久性(エンタープライズ フラッシュ アレイの考慮点)も大幅に強化され ています。 図11:行および対角パリティ XDP は図11に示すように、N+2 列および対角パリティの変化形を使用します。これ は1 台の SSD で同時に 2 つのエラーが発生した場合に保護を提供します。25 台の SSD をもつアレイでは、容量のオーバーヘッドはわずか 8%になるというわけです。

(28)

従来のアレイは、ディスクの物理的な同一の場所にあるLBA(論理ブロック アドレス) を更新します(これが原因でストライプの更新に高い I/O オーバーヘッドが生じます)。 XtremIO では、データは常に、最も空き容量の多いストライプに配置されます。ストラ イプの更新ごとの読み取りおよび書き込みのI/O 動作のオーバーヘッドを効果的に 減らす、最も空き容量の多いストライプへのデータの書き込みは、XtremIO のオール フラッシュのコンテンツ対応アーキテクチャでのみ実現可能です。このプロセスにより、 アレイが埋まってもXtremIO のパフォーマンスを均一に保ち、上書きと部分的なスト ライプの更新が増えた時でも、長期にわたり稼働できるようになります。 さらに、XtremIO は、優れた再構築プロセスも備えています。従来の RAID 6 アレイが 1 台のディスク障害に直面した場合、RAID 5 の方式を使用して、各ストライプを読み 取り、ストライプ内の他のセルで不足しているセルを計算することによって、ディスク を再構築します。一方、XtremIO では、不足した情報の再構築に P と Q の両方のパ リティを使用し、次のセルの再構築に必要な情報のみを読み取る精密なアルゴリズ ムを使用します。 表5:障害の発生したディスクを再構築するための XDP の読み取りと、他の RAID ス キームの読み取り方法の比較 アルゴリズム K 幅の障害のあるディスク ストライ プを再構築するための読み取り 従来のアルゴリズムのデメリット XtremIO XDP 3K/4 – RAID 1 1 なし RAID 5 K 33% RAID 6 K 33% 注:

XDP の詳細については、XtremIO Data Protection のホワイト ペーパーを参照してく ださい。

(29)

静止データ暗号化

静止データ暗号化(DARE)では、メディアがアレイから取り外された場合でも重要な データの安全性を確保するソリューションが提供されています。XtremIO アレイは高 パフォーマンスのインライン暗号化技術を採用しており、SSD メディアが取り外された 場合、アレイに格納されているすべてのデータが利用できなくなります。これにより、 盗難や輸送中の紛失などで不正アクセスを防ぐことができ、機密データを含む障害 コンポーネントを元に戻すまたは取り替えることができます。 DARE は多くの業界で確立されている必須の要件で、これには医療(患者の記録を 厳重に守る必要がある)、銀行(財務データの安全が極めて重要)、数々の行政機 関が含まれます。

XtremIO の DARE ソリューションの中心となっているのが、自己暗号化ドライブ(SED) 技術の使用です。SED には、SSD でデータの書き込みや読み取りを行う際に暗号化 および復号を行う専用のハードウェアがあります。暗号化のタスクをSSD にオフロー ドすることにより、XtremIO はアレイで暗号化が有効または無効になるときに同じソフ トウェア アーキテクチャを維持することができます。インライン データ削減、XtremIO Data Protection(XDP)、シン プロビジョニング、スナップショットを始めとする XtremIO のすべての機能やサービスは、暗号化されたクラスターで提供されます(非暗号化 クラスターでも提供)。 固有のデータ暗号化キー(DEK)がドライブ製造プロセスで作成されます。このキー はドライブから離れることはありません。DEK を消去または変更することはできます が、ドライブのデータは読み取れなくなり、DEK を回復させるオプションは提供されま せん。権限のあるホストだけがSED のデータにアクセスできるようにするために、 DEK は認証キー(AK)によって保護されています。このキーがなければ、DEK は暗号 化されたままで、データの暗号化または復号には使用できません。 図12:ロック解除された SED

(30)

SED はロックが解除された状態で出荷されます。つまり、どのホストでもドライブ デー タにアクセスできます。ロックが解除されたドライブでは、データは必ず暗号化されて います。しかし、DEK は必ず復号され、認証は必要ありません。 ドライブのロックは、デフォルト ドライブの AK を新しいプライベート AK に変更し、起 動後または電源障害後(SSD がアレイから取り外された場合など)でもロックされた ままになるようSED 設定を変更することで実現しています。SSD がアレイから取り外 されると、オフになり、起動時にAK が必要になります。正しい AK がない限り、SSD のデータは読み取り不可で安全です。 データにアクセスするには、ホストは正しいAK を提供する必要があります。これは、 ドライブの「取得」または「所有化」とも呼ばれ、DEK のロックを解除し、データへのア クセスを可能にします。 ドライブの取得は起動時にのみ行われ、アレイが作動している限りSED はロック解 除されたままになります。どの場合でも、データは暗号化または復号のハードウェア を通過するため、SED のロック時にパフォーマンス インパクトはありません。 図13:SED のオペレーション モード

XtremIO All-Flash Array は次の SSD でデータを暗号化します。 • データ SSD:すべてのユーザー データが格納されている場所

• ストレージ コントローラーSSD:ユーザー データ ジャーナル ダンプが含まれてい る場合がある

(31)

スナップショット

スナップショットは、特定の時点におけるボリュームのデータの状態を算出することで 作成されるので、ユーザーはソース ボリュームが変化したとしても、必要に応じてデ ータにアクセスできます。XtremIO スナップショットは本質的に書き込み可能ですが、 不変性を確保するために読み取り専用として作成することもできます。ソースまたは ソース ボリュームに属する任意のスナップショットのいずれかからスナップショットを 取得できます。 スナップショットは次に示すように、多様な事例で使用できます。 • 論理的な破損の保護 XtremIO ではスナップショット(目的の RPO インターバルで実行可能)を頻繁に作 成でき、論理データ破損からのリカバリにそれらを使用することができます。スナ ップショットは、必要である限りシステムに保持することができます。論理データ の破損が起きた場合は、既知のポイント イン タイムまでアプリケーションをリカバ リするために、以前のアプリケーションの状態のスナップショット(論理データの破 損の前)を使用できます。 • バックアップ バックアップ サーバー/エージェント用のスナップショットを作成できます。これは、 本番サーバーからバックアップ プロセスをオフロードするために使用できます。 • 開発とテスト システムはユーザーが本番データのスナップショットを作成し、本番システムの (設置率の高い、高パフォーマンスな)コピーを複数作成して、それを開発やテス ト目的で使用することを可能にします。 • クローン XtremIO では、データ保全の書き込み可能スナップショットを使い、クローンのよ うに使用することもできます。複数のサーバーの本番ボリュームのクローンとして 使用できます。クローンのパフォーマンスは、本番ボリュームのパフォーマンスと まったく同じです。 • オフライン処理 スナップショットを、本番サーバーからデータの処理をオフロードする手段として 使用することもできます。たとえば、データに対して(本番サーバーのパフォーマ ンスに影響を与えるほど)重いプロセスを実行する必要がある場合、スナップシ ョットを使用して本番データの最新コピーを作成し、それを別のサーバーにマウ ントできます。こうすることで、プロセスは本番サーバーのリソースを消費すること なく、(別のサーバーで)実行されます。

(32)

XtremIO では、スナップショットを管理し、操作性を最適化するために次の効率的な ツールを提供しています。 • コンシステンシー グループ CG(コンシステンシー グループ)を使用すると、データベースなどの単一アプリケ ーションによって通常使用される一連のボリュームの整合性のとれたイメージを 作成できます。XtremIO の CG を使用して、1 つのコマンドでグループ内のすべて のボリュームのスナップショットを作成できます。これにより、すべてのボリューム を同時に作成できます。1 つのボリュームに適用される多数の操作は、CG にも 適用できます。 • スナップショット セット スナップショット セットは、1 つのコマンドで作成したスナップショット グループで、 グループのポイント イン タイムを示します。スナップショット セットは、手動で選択し た一連のボリューム、別のスナップショット セット、CG で取得されたスナップショット からなります。スナップショット セットでは、作成元の親との関係が保持されます。 • 読み取り専用スナップショット 設計上、XtremIO のスナップショットは標準ボリュームで、書き込み可能なスナッ プショットとして作成されます。ローカルのバックアップと不変のコピーの必要性を 満たすため、読み取り専用スナップショットを作成するオプションがあります。読み 取り専用スナップショットは、バックアップ アプリケーションなどの外部ホストにマッ ピングできますが、書き込みはできません。 • Scheduler Scheduler はローカル保護の用途で使用できます。ボリューム、CG、スナップショ ット セットに適用できます。各 Scheduler は、秒、分、時間のインターバルで実行 するように定義できます。または、1 日または週の特定の時間に実行するように 設定できます。各Scheduler には、お客様が保持するコピー数や最も古いスナッ プショットの保存期間に基づいた保存ポリシーがあります。 • リストア 1 つのコマンドで、子のスナップショット セットのいずれかから本番ボリュームや CG をリストアできます。本番ボリュームの SCSI 面は、ホスト アプリケーションを 再スキャンし、新しいボリュームを再検出することなく、必要なスナップショット セ ットのスナップショットに移動できます。 • 更新 refresh コマンドは、テスト/開発環境とオフライン処理に使用できる強力なツール です。1 つのコマンドで、本番ボリュームや CG のスナップショットを作成し、テスト/ 開発アプリケーションにマッピングされたボリュームのSCSI 面をそこに移動させ

(33)

XtremIO のスナップショット テクノロジーは、システムのコンテンツ対応性(インライン データ削減)を活用して実装され、データの正しいタイム スタンプに I/O を誘導するユ ニークなメタデータ ツリー構造で、SSD メディア用に最適化されます。これにより、高い パフォーマンスを持続できる効率的なスナップショットが可能になる一方で、複数のス ナップショットを作成する手段として、また、スナップショットがサポートできるI/O 量の 両方で、メディアの寿命を最大限に引き延ばします。 スナップショットの作成時に、システムは(システム内の実際のデータの)親メタデー タへのポインターを生成します。このため、スナップショットの作成は非常に簡単な操 作で、システムに影響を及ぼすことはありません。また、容量は一切消費しません。 スナップショットの容量の消費は、変更で新しい一意のブロックの書き込みが必要に なった場合にのみ発生します。 スナップショットの作成では、そのメタデータは、親ボリュームのメタデータとまったく 同じになります。新しいブロックが親に書き込まれると、新しい書き込みを反映する ために親ボリュームのメタデータが更新されます(そして、標準の書き込みフロー プ ロセスを使用して、ブロックがシステムに格納されます)。このブロックは、スナップシ ョットと親ボリュームの間で共有されている限り、書き込みの後でシステムから削除 されることはありません。これは、ボリューム上の新しい場所への書き込み(未使用 のLBA への書き込み)と、すでに書き込まれている場所での再書き込みの両方に適 用されます。 スナップショットのメタデータと親のメタデータは、ツリー構造で管理されます。スナッ プショットと親ボリュームは、図14で示すように、この構造の葉として表現されてい ます。 図14:メタデータ ツリー構造

(34)

メタデータは、(スナップショットの元の親から)変更されていない全スナップショット ブ ロック間で共有されます。スナップショットは、データブロックがその親と異なるLBA のみの一意のメタデータを保持します。このメタデータの管理方法は経済的です。 新しいスナップショットが作成されると、システムは常に、スナップショットを作成したエ ンティティから"2 枚の葉"(2 つの子エンティティ)を作成します。これらの葉の 1 枚は スナップショットを、もう1 枚はソース エンティティを表します。スナップショットが作成 されたエンティティは、それ以降直接使用されることはなくなりますが、メタデータの管 理目的でのみ維持されます。 図15:スナップショットの作成

(35)

図 15は、XtremIO システムの 16 ブロックのボリュームを示します。1 行目(A(t0)/S(t0) とマークされた)は、最初のスナップショットが取得されたときのボリュームを示します (t0)。t0 では、親(A(t0))とスナップショット(S(t0))が同じデータとメタデータを持ってい ます。これは、S(t0)がA(t0)の読み取り専用スナップショットであるためです(親と同じ データを持っている)。 注: 16 個あるブロックのうち、使用されているのは 8 ブロックのみです。ブロック 0 とブロ ック4 は、重複排除の結果、物理容量の 1 ブロック分のみしか消費しません。空白 のドット地のブロックは、シン プロビジョニングされたブロックを表しています。これは、 物理容量は一切消費しません。 図15では、S(t1)にスナップショットを作成する前に、2 つの新しいブロックが P に書き 込まれています。 • H8 は H2 を上書きしています。 • H2 はブロック D に書き込まれます。しかし、A(t0)のブロック3 に格納された H2 と 同じであるため、物理容量はほとんど消費しません。(t0)のブロック 3 に格納さ れたH2 と同じなので、物理容量はほとんどとりません。 S(t1)は、読み取り/書き込みスナップショットです。これには、親とは異なる 2 つの追 加ブロック(2 と 3)が含まれます。 (変更されたブロックや各スナップのメタデータの全コピーに専用のスペースの確保 が必要であった)従来のスナップショットとは異なり、XtremIO ではスナップショットに 専用スペースを確保する必要はなく、メタデータの「膨張」も起こりません。 XtremIO のスナップショットは、どんなときにも、スナップショットの親エンティティと共 有されていないブロックにのみ使用される一意のメタデータのみを消費します。これ により、システムは、動的でエンティティの変更量に比例した極めて小さいストレージ オーバーヘッドを使用し、大量のスナップショットを効率的に管理できます。 たとえば、t2 の時点では、ブロック 0、3、4、6、8、A、B、D、F は親エンティティと共有 されています。ブロック5 のみがこのスナップショットで一意です。そのため、XtremIO の消費するメタデータ ユニットは 1 つだけです。残りのブロックは親と共有され、正 確なボリューム データと構造をコンパイルするために、親のデータ構造を使用します。 システムは、ボリューム セットでのスナップショットの作成をサポートしています。セッ ト内のボリュームから取得した全スナップショットは、相互に一貫性があり、全ボリュ ームの厳密に同一時点の情報を含みます。これは、スナップショットを作成するボリュ ーム セットを選択するか、ボリュームをコンシステンシ グループ コンテナーに配置し、 コンシステンシ グループのスナップショットを作成することで、手動で作成できます。 スナップショットの作成中、システム パフォーマンスや全体的なシステム レーテンシ ーに影響が及ぶことはありません(パフォーマンスは維持されます)。これは、システ ム内のスナップショット数やスナップショット ツリーのサイズに左右されるものではあ

(36)

スナップショットの削除は軽量で、エンティティ間の変更済みブロックの量にのみ比 例します。システムはコンテンツ対応性能により、スナップショットの削除を処理します。 各データ ブロックには、システム内の対象のブロックのインスタンス数を示すカウン ターが付いています。ブロックが削除されると、カウンターの値は 1 つずつ減少します。 このカウンター値がゼロのブロック(システムのボリュームまたはスナップショット全 体に、このブロックを参照するLBA(論理ブロック アドレス)が存在しないことを意味し ます)は、新しい一意のデータがシステムに入ってきた時点で、XDP によって上書きさ れます。 子孫を持たない子の削除には、システムによる追加的な処理は必要ありません。 ツリーの中にあるスナップショットを削除すると、非同期処理がトリガーされます。 このプロセスは、削除されたエンティティの子のメタデータと、親の親のメタデータを マージします。これにより、ツリー構造が断片化されることがなくなります。 XtremIO では、ブロックの削除が必要になると直ちに解放済みとしてマークされます。 そのため、ガベージ コレクションは不要で、孤立ブロックを見つけ出し、削除するた めにシステムがスキャン プロセスを実行する必要はありません。さらに、XtremIO で は、スナップショットの削除がシステムのパフォーマンスやSSD メディアの寿命に影 響を与えることはありません。 スナップショットの実装は完全にメタデータ中心で行われ、アレイのインライン データ 削減を活用するため、データがアレイ内にコピーされることはありません。こうして、 多くのスナップショットの維持が可能になります。 XtremIO のスナップショットの特徴は、以下のとおりです。 • 専用のスナップショット スペースは不要。 • ソース ボリュームの不変コピー/書き込み可能クローンの作成が可能。 • 瞬時に作成。 • ソース ボリュームやスナップショット自体へのパフォーマンスの影響はほとんど なし。 注: スナップショットの詳細については、XtremIO のスナップショットのホワイト ペーパー を参照してください。

(37)

拡張性の高いパフォーマンス

XtremIO は、新しいアプリケーションだけでなく、すでに導入されているアプリケーショ ンについても、将来的なパフォーマンスや容量のニーズに対応するためスケールア ウトできるよう設計されています。XtremIO のアーキテクチャにより、管理の一元化や システム全体のリソースのバランスを維持しながら、ビルディング ブロック(X-Brick) を追加することで、パフォーマンスや容量を向上させることができます。 スケールアウトは、XtremIO のアーキテクチャにおける本質的な部分であり、既存の ハードウェアを大掛かりにアップグレードしたり、長期間にわたるデータ転送をしなく ても実行できます。 XtremIO ストレージ システムは、パフォーマンスや容量の追加が必要になったときに、 X-Brick を追加することによってスケールアウトできます。複数の X-Brick は、可用性 の高い、超低レスポンス タイムの冗長 InfiniBand ネットワークを介して結合されます。 システムが拡張してもリソースはバランスの取れた状態で維持され、アレイのデータ はすべてのX-Brick に分散されます。これによって、均一なパフォーマンスとバランス の取れたフラッシュ ウェア レベルが保たれます。 システムの拡張には、ボリュームの構成や手作業でのボリュームの移動は不要です。 XtremIO では、再マッピングを最小限に抑える一貫したフィンガープリント アルゴリズ ムが使用されます。内部ロード バランシング スキームに新しい X-Brick が追加され、 既存の関連データのみが新しいDAE に転送されます。 ストレージの容量やパフォーマンスは、単一のX-Brick 構成に対して、2 つの X-Brick であれば2 倍の IOPS を、4 つの X-Brick であれば 4 倍の IOPS を、6 つの X-Brick であれば6 倍の IOPS を、8 つの X-Brick であれば 8 倍の IOPS を供給するなどのよ うに、直線的に拡張します。ただし、レーテンシーは図16に示すように、システムが 拡張されても一貫して低い状態(1 ミリ秒以下)が保たれます。

(38)

図16:一貫した低レーテンシーと直線的なパフォーマンス スケーラビリティ XtremIO はそのスケーラビリティに特化して開発されたため、そのソフトウェアにはク ラスター サイズに対する制限が元々ありません。*システム アーキテクチャは、レー テンシーについても最も効率的な方法で対処します。ソフトウェア設計は、モジュラー 式が採用されています。すべてのストレージ コントローラーでは、さまざまな組み合 わせのモジュールが実行され、負荷全体を共有します。このような分散型ソフトウェ ア モジュール(異なるストレージ コントローラー上にある)は、個別の I/O 動作を処 理し、これはクラスターを通過します。XtremIO は、単一の X-Brick システムか複数 のX-Brick クラスターかに関係なく、2 つのソフトウェア モジュール(2 ホップ)で、各 I/O 要求を処理します。そのため、クラスターのサイズにかかわらず、レーテンシー は常に一定に保たれます。 注: サブミリ秒のレーテンシーは、実際のテスト結果に基づいて、また、最悪の条件下で のシナリオを想定して検証されています。†

表 1 に、X-Brick ごとのシステム仕様の概要を示します。
図 3:X-Brick ブロックの図
表 4:XtremIO Data Protection と RAID スキームの比較  アルゴリ ズム パフォーマンス データ保護  容量のオーバーヘッド ストライプ 更新ごとの 読み取り  従来型アルゴリズムの読み取りの デメリット  ストライ  プ更新ごとの書き込み  従来型アルゴリズムの書き込みのデメリット  RAID 1  高  1 つの障害  50%  0  –  2(64%)  1.6x  RAID 5  中  1 つの障害  25%(3+1)  2(64%)  1.6x  2(64%)  1.
図 16:一貫した低レーテンシーと直線的なパフォーマンス スケーラビリティ  XtremIO はそのスケーラビリティに特化して開発されたため、そのソフトウェアにはク ラスター サイズに対する制限が元々ありません。 * システム アーキテクチャは、レー テンシーについても最も効率的な方法で対処します。ソフトウェア設計は、モジュラー 式が採用されています。すべてのストレージ コントローラーでは、さまざまな組み合 わせのモジュールが実行され、負荷全体を共有します。このような分散型ソフトウェ ア モジュール(異なる
+5

参照

関連したドキュメント

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

特に、耐熱性に優れた二次可塑剤です(DOSより良好)。ゴム軟化剤と

概要・目標 地域社会の発展や安全・安心の向上に取り組み、地域活性化 を目的としたプログラムの実施や緑化を推進していきます

定可能性は大前提とした上で、どの程度の時間で、どの程度のメモリを用いれば計

C. 

耐震性及び津波対策 作業性を確保するうえで必要な耐震機能を有するとともに,津波の遡上高さを

環境への影響を最小にし、持続可能な発展に貢

モノづくり,特に機械を設計して製作するためには時