EMC CLARiX
非対称アクティブ
/アクティブ機能(ALUA)
詳細レビュー
US ホワイトペーパー翻訳版 要約 このホワイト・ペーパーでは、EMC® CLARiX®の非対称アクティブ/アクティブ機能について概説し ます。EMC PowerPath®の構成、ベスト・プラクティス、実装の詳細、ホスト・イニシエータを非対 称アクティブ/アクティブ・モードに構成した場合のネイティブのマルチパス・ソフトウェアについ て扱います。 2008 年 3 月Copyright © 2007, 2008 EMC Corporation.不許複製 EMC Corporation は、この資料に記載される情報が、発効日時点で正確であるとみなします。情 報は予告なく変更されることがあります。 この資料に記載されている情報は、「現状有姿」の条件で提供されます。EMC Corporation は、 この資料に記載される情報に関する、どのような内容についても表明保証条項を設けず、特に、 商品性や特定の目的に対する適応性に対する黙示の保証はいたしません。 この資料に記載される、いかなるEMC ソフトウェアの使用、複製、頒布も、当該ソフトウェ ア・ライセンスが必要です。
最新のEMC 製品名については、EMC.com で EMC Corporation の商標を参照してください。
他のすべての名称ならびに製品についての商標は、それぞれの所有者の商標または登録商標です。 パーツ番号H2890.2-J
目次
エグゼクティブ・サマリー
...4
はじめに
...4
対象読者... 4 用語... 4非対称アクティブ
/アクティブ機能の概要 ...5
構成... 5実装
...6
レイヤー構造のドライバの影響... 7 明示的トレスパスと暗黙的トレスパス... 7ALUA の構成 ...7
ホストの構成... 8 PowerPath と ALUA の組み合わせ... 8 ネイティブ・フェイルオーバーとALUA の組み合わせ ... 9 CLARiX の構成... 10 アクティブ/アクティブ構成用の CLI コマンド ... 11 CLARiX のフェイルオーバー・モード... 11 CLARiX からの AULA 状態の取得 ... 11 ストレージ・システムのサポート... 13 パフォーマンスに関する考慮事項... 13 ベスト・プラクティス... 14非対称アクティブ
/アクティブ機能の影響 ... 14
CLARiX 非対称アクティブ/アクティブのメリット ... 14 ユーザー操作の向上... 14 標準のSCSI マルチパス・インターフェイスのサポート... 16 リダイレクタの影響... 16 バックエンド障害のマスキング... 16フェイルオーバー方法の比較
... 17
明示的および暗黙的フェイルオーバー・ソフトウェア... 18 PowerPath... 18 ネイティブのフェイルオーバー・ソフトウェア(MPIO など)... 19 NDU(無停止アップグレード)... 20 手動トレスパス... 20 パス、HBA、スイッチの障害 ... 21 SP 障害 ... 21結論
... 21
関連資料
... 22
エグゼクティブ・サマリー
FLARE®リリース26 で、EMC は CLARiX®ストレージ・システムに対する非対称アクティブ/アク ティブ機能を導入しました。非対称アクティブ/アクティブにより、CLARiX ストレージ・システ ムからホストにLUN(論理ストレージ・ユニット)を提示する新しい手段が提供され、ホスト は LUN オーナーシップ・モデルを使用する必要性がなくなります。これにより、どちらか片方、 または両方のストレージ・プロセッサにI/O を流すことができるため、ホストがアレイ上の LUN への複数の通信パスを管理する方法(一般的にパス管理と呼ばれる)が変わります。このホワイ ト・ペーパーでは、この機能のメリットと実装について説明します。
はじめに
このホワイトペーパーでは、CLARiX の非対称アクティブ/アクティブ機能の技術的な概要を紹介 し、PowerPath®およびネイティブMPIO(Multi-Pathed Input/Output)ソフトウェアとこの機能と の連携について説明します。 リリース26 よりも前は、すべての CLARiX ストレージ・システムは、1 つの SP が LUN を所有 し、そのLUN へのすべての I/O がその SP に送信されるという標準のアクティブ/パッシブ機能を 使用していました。ホストからSP へのすべてのパスに障害が発生すると、ホスト・ベースのパ ス管理ソフトウェアがトレスパス・コマンドを発行することによってI/O パスを調整します。こ れにより、ストレージ・システムがLUN のオーナー権をピア SP に変更し、I/O はピア SP に送信 されます。CLARiX 非対称アクティブ/アクティブは、新しいイニシエータ Failover Mode(Failover Mode 4) を導入した機能です。Failover Mode 4 として構成されたイニシエータは、どの SP が LUN を所有 しているかに関係なく、I/O を LUN に送信できます。この機能ではトレスパスに似たコマンドを 使用できますが、明示的なトレスパス動作は要求されません。
このホワイト・ペーパーは、ホワイト・ペーパー「EMC CLARiX Asymmetric Active/Active Feature」に代わるものです。
対象読者
このホワイト・ペーパーは、CLARiX 非対称アクティブ/アクティブ機能の実装、メリット、構成 について、およびそれぞれのストレージ環境で考えられるインパクトについて理解を深めようと するお客様、パートナー、EMC のフィールド担当者を対象にしています。用語
• ALUA:Asymmetric Logic Unit Access。
• CLARiX LUN:CLARiX ストレージ・システム内にある RAID グループの論理再分割。これ らのボリュームがホストに提示されます。
• CMI(CLARiX Messaging Interface):2 つの SP 間で通信を行うための冗長 PCI Express 接 続。 • フェイルオーバー・モード:オーナーでない SP で、LUN に向けられた I/O リクエストに対 してアレイがどのように応答するかを決定します。 • 非最適パス:I/O の準備ができているが、最高のパフォーマンスが得られない可能性のある パス。 • 最適パス:I/O の準備ができており、最高のパフォーマンスが得られる見込みのパス。
• 優先ビット:その SP が LUN のデフォルトのオーナーであることを示すビット。 • SP(ストレージ・プロセッサ):CLARiX のコントローラ。 • ターゲット・ポート・グループ:プライマリ SP ポートまたはセカンダリ SP ポート内のター ゲット・ポートのセット。 • トレスパス:SP またはそのピアが LUN のオーナー権を取得できるようになるコマンド。
非対称アクティブ
/アクティブ機能の概要
CLARiX 非対称アクティブ/アクティブは、ALUA(Asymmetric Logical Unit Access)規格を基礎 にしています。ALUA では、標準 SCSI SPC-3 仕様の一部(CLARiX 固有の実装ではなく)であ るSCSI 3 の主要コマンドを使用して、I/O パスを決定します。CLARiX などのデュアル SP シス テムでは、I/O はどちらの SP を通ることもできます。たとえば、ある LUN 向けの I/O が、その LUN をオーナーでない SP に送信された場合、その SP は LUN のオーナーSP に、その I/O をリダ イレクトします。このリダイレクトは、ストレージ・システム内の通信を使用して行われます。 これはホストからは透過的であり、ホストにはI/O が別の SP によって処理されたことが分かり ません。したがって、非オーナー(または非最適)SP に I/O が送信された場合もトレスパスは不 要です。
構成
ALUA をサポートするデュアル SP ストレージ・システムでは、各 LUN に対してターゲット・ポ ート・グループのセットが定義されます。現在のLUN のオーナーSP に対して 1 つ、オーナーで ないSP に対してもう一方のターゲット・ポート・グループが定義されます。ホスト・フェイル オーバー・ソフトウェアでは、標準のALUA コマンドを使用することにより、LUN のパスの状 態を知ることができます。REPORT TARGET PORT GROUP コマンドを実行すると、次の 3 つの属性がレポートされます。 • Preferred(優先):このポート・グループがデフォルト(優先)のポート・グループで
あるかどうかを示します。
• Asymmetric access state(非対称アクセス状態):ポート・グループの状態を示します。 ポート・グループの状態には、Active/Optimal、Active/Non-optimal、Standby、
Unavailable があり、これらについては後で説明します。
• Attribute(属性):現在の非対称アクセス状態がコマンドによって明示的に設定された ものか、ストレージ・システムによって暗黙的に設定または変更されたものかを示しま す。
SET TARGET PORT GROUP を使用すると、各ポート・グループのアクセス状態(Active/Optimal、 Active/Non-optimal、Standby、Unavailable)を設定または変更できます。アクセス状態の定義は、 次のとおりです。 • Active/Optimal:最高のパフォーマンスが得られるパスであり、I/O を完了するために上 位レベルでのリダイレクトは不要 • Active/Non-optimal:I/O を完了するために上位レベルでのリダイレクトが必要 • Standby:サポートされていない状態
• Unavailable:ダウンしている SP のポート・グループについて返される状態。SET TARGET PORT GROUP によって設定することは不可。
ターゲット・ポート・グループのコマンドは、ストレージ・システムのALUA レイヤーに実装 されます。ただし、これは実際には、コマンドの実行とパスの管理を行うホスト・ベースのパス 管理ソフトウェアです。これは、従来のパス管理機構と同様です。ただし、今まではベンダー固 有だった機構がALUA では標準化されています。
実装
FLARE 26 には、CLARiX の可用性を向上させる新しいリダイレクタ・ドライバが含まれていま す。このドライバは、各SP の上位および下位のリダイレクタから構成されています。上位リダ イレクタは、ホスト接続の近くに位置し、下位リダイレクタはCLARiX バックエンドの近くに位 置しています。NQM(Navisphere® Quality of Service Manager)、SnapView™などのレイヤー構造 のドライバは、図1に示すように、上位リダイレクタと下位リダイレクタの間に位置します。 Host Upper-redirector Layer drivers FLARE SP A SP B Upper-redirector FLAREOptimal Path Non - Optimal
Path CMI Link LUN Layer drivers Lower-redirector Lower-redirector Host Upper-redirector Layer drivers FLARE SP A SP B Upper-redirector FLARE
Optimal Path Non - Optimal
Path CMI Link LUN Layer drivers Lower-redirector Lower-redirector Host Upper-redirector Layer drivers FLARE SP A SP B Upper-redirector FLARE
Optimal Path Non - Optimal
Path CMI Link LUN Layer drivers Lower-redirector Lower-redirector 図1:CLARiX 非対称アクティブ/アクティブ機能 CLARiX の非対称アクティブ/アクティブ機能は、最適と非最適の 2 種類のターゲット・ポート・ グループをサポートします。最適ターゲット・ポート・グループは、LUN の現在のオーナーに 属するポートを表します。非最適ポート・グループは、LUN の現在のオーナーでない SP が所有 するポートを表します。これは、リダイレクタ・ドライバで実装されます。 I/O は、すべてのポートで受け入れられます。フロントエンド・パスに障害が発生すると、LUN をオーナーでないSP によって I/O が受信される可能性があります。LUN をオーナーでない SP の
上位リダイレクタは、オーナーSP に、内部 CMI チャネルを通じて I/O をルーティングします。 I/O リクエストは、LUN のオーナーSP によって処理されます。SP によって受信された I/O は、受 信時と同じパスを通じて、その SP によって受領証明を返す必要があることに注意してください。 1 つの SP 上のポート間におけるロード・バランシングは、PowerPath マルチパス・ソフトウェア でのロード・バランシングと同様に機能します。最適パスと非最適パスの間のロード・バランシ ングは、推奨されません。
レイヤー構造のドライバの影響
レイヤー構造のドライバ(MetaLUN、LUN Migration、SnapView、MirrorView™、SAN Copy™) の動作が非対称アクティブ/アクティブによって変更されることはありません。たとえば、LUN が LUN Migration でトレスパスされた場合、ターゲット LUN は今までと同様にトレスパスされ、 チェックポイントから同期が継続されます。 SnapView では、ソースとレプリカ(スナップまたは同期中のクローン)は常に同じ SP によって 所有されます。したがって、ソースまたはSnapView レプリカがトレスパスすると、そのソース またはSnapView レプリカは今までと同様、それぞれレプリカまたはソースに追従します。ただ し、ホストに展開されているフェイルオーバー・ソフトウェアによっては、ALUA モードではソ ースまたはSnapView レプリカをトレスパスする可能性が低下します。詳細については、 「SnapView およびクラスタの構成で発生する可能性がある、LUN のオーナー権が衝突する状況 を回避」セクションを参照してください。
MirrorView/S では、プライマリ LUN がトレスパスされた場合、セカンダリ LUN は直ちに
トレス
パスします。
MirrorView/A では、MirrorView のプライマリ LUN がトレスパスされた場合、セカンダリMirrorView LUN は更新中または更新の開始時にトレスパスします。
ローカルおよびリモートのSAN Copy セッションでは、SAN Copy イニシエータが ALUA モード を使用しないため、ソースまたはターゲット LUN がトレスパスした場合、そのセッションはピ ア SP 上で再開する必要があります。そのため、MirrorView と SAN Copy は以前と同様に動作し ます。
明示的トレスパスと暗黙的トレスパス
明示的トレスパスは、ユーザーまたはフェイルオーバー・ソフトウェアからの外部コマンドの結 果として発生します。SP がこのコマンドを(フェイルオーバー・ソフトウェアから、または Navisphere で LUN トレスパスコマンドを発行したユーザーから)受信すると、LUN のオーナー 権がそのSP に転送されます。これらのトレスパスは、PowerPath パス管理ソフトウェアによって (CLARiX 独自のコマンドを使用して)、または他の ALUA 互換パス管理ソフトウェアによって (SET TARGET PORT GROUP コマンドを使用して)発行することができます。
暗黙的トレスパスは、ストレージ・システム内のソフトウェア制御の結果として発生します。た とえば、非最適パスを経由して転送されるI/O の量が最適パスの I/O を一定の量(しきい値)上 回ったときに、暗黙的トレスパスが発生します。ソフトウェアはカウンタを使用して、最適パス のI/O と非最適パスの I/O を追跡しています。非最適パスを通る I/O が最適パスを通る I/O を 128,000 件多くなった時点で、ソフトウェアはトレスパスを開始します。
ALUA の構成
ホスト用のフェイルオーバー・ソフトウェアには、2 つの選択肢があります。PowerPath と、 ALUA 互換である OS のネイティブ・フェイルオーバー・ソフトウェア(MPIO など)です。こ の後のセクションでは、この2 つの選択肢の両方について説明します。
アプリケーション・データの高可用性を実現するには、ホスト・バス・アダプタ(HBA)、ファ イバ・ケーブル、フェイルオーバー・ソフトウェアなどの単一点障害に耐えられるようにホスト を構成する必要があります。CLARiX がサポートしているアタッチ方式の概要は、Powerlink®に ある「EMC CLARiX Open Systems Configuration Guide」で説明されています。
ホストの構成
多くのホスト(表1を参照)が、ネイティブのフェイルオーバー・ソフトウェアを使用すること により、CLARiX で ALUA モードの利点を活かすことができます。2008 年に出荷される FLARE のリリースでは、記されているとおり、追加の構成がサポートされる予定です。 最適な高可用性(データ可用性とサーバ稼働時間の最大化も含む)のためには、構成のすべての ポイントに対する冗長性が不可欠です。つまり、各サーバは少なくとも2 つの HBA(iSCSI 環境 ではNIC)を持ち、両方の SP に接続されている必要があります。2 つのスイッチにより、サー バからストレージへの独立した別個のパスが確保されます。3 つ以上のスイッチを使用する場合 は、ファブリック・フェイルオーバーを行うために、スイッチ間リンクを経由して冗長のスイッ チを接続する必要があります。 各HBA は、1 つの SP ポートを見るように(直接接続の場合)構成することも、両方の SP ポー トを見るように構成することもできます。これにより、HBA、ケーブル、スイッチ、または SP が失われた際に構成を保護することができ、パス管理ソフトウェアのフェイルオーバー機能およ びロード・バランシング機能を活用することができます。 サーバからLUN に対して複数のパスをアクティブにすることで、パス管理ソフトウェアのロー ド・バランシング・アルゴリズムを使用してパスの縛り(または単一のポートに限定されるこ と)を避けることができます。
PowerPath と ALUA の組み合わせ
PowerPath バージョン 5.1 は、AULA に準拠した最初のリリースです。バージョンが 5.1 以降であ ることを確認し、Powerlink の E-Lab™ Navigator を使用して各ホストでの考慮事項について調べ てください。PowerPath は、最適パス上でロード・バランシングを行います。すべての最適パスに障害が発生 していることをPowerPath が検知すると、PowerPath は LUN のオーナー権を変更するトレスパス を開始します。
Native with
Active/Passive Native with ALUA PowerPath with Active/Passive PowerPath with ALUA
Longhorn No See Note 1 See Note 1 See Note 1
W2K3 No No Yes Yes
Win2K No No Yes Yes
HP-UX 11i
v1 & v2 Yes No Yes Yes
HP-UX 11i v3 No Yes (11.31.0709) Yes Yes
Solaris 9/10 Yes Yes1 Yes Yes1
Linux (RH & SuSE) Yes
Yes (SLES 10.1 SLES 9 SP4 RH 5.1, 4.6) Yes Yes AIX No No Yes No VMWare Yes No No No Native with
Active/Passive Native with ALUA PowerPath with Active/Passive PowerPath with ALUA
Longhorn No See Note 1 See Note 1 See Note 1
W2K3 No No Yes Yes
Win2K No No Yes Yes
HP-UX 11i
v1 & v2 Yes No Yes Yes
HP-UX 11i v3 No Yes (11.31.0709) Yes Yes
Solaris 9/10 Yes Yes1 Yes Yes1
Linux (RH & SuSE) Yes
Yes (SLES 10.1 SLES 9 SP4 RH 5.1, 4.6) Yes Yes AIX No No Yes No VMWare Yes No No No 1 - ALUA モードは、SunCluster では今回サポートされません。 注1:2008 年半ばに、FLARE リリース 24 および 26 へのアップグレードとして利用可能になり ます。 列の定義
• Native with Active/Passive:そのOS(オペレーティング・システム)だけを使用した場合 に、標準のアクティブ/パッシブ・フェイルオーバー(ALUAでない)が提供されるかど うか。この場合は、代替パスを有効化するためのトレスパス・コマンドをOSが発行しま す。
• Native with ALUA:そのOSだけを使用した場合に(PowerPathを使用しなくても)ALUA 機能が提供されるかどうか。
• PowerPath with Active/Passive:そのOSで、PowerPathによって標準のアクティブ/パッシ ブ・フェイルオーバー(ALUAでない)が提供されるかどうか。この場合は、代替パス を有効化するためのトレスパス・コマンドをPowerPathが発行します。
• PowerPath with ALUA:ALUAの機能が、指定されたPowerPathのリリースとそのOSを組 み合わせて使用することによって提供されるかどうか。
ネイティブ・フェイルオーバーと
ALUA の組み合わせ
MPIO および他のネイティブなホスト・ベースのフェイルオーバー・アプリケーションは、 ALUA に準拠していれば ALUA と組み合わせて使用できます。次の点に注意してください。
• HPUX 11i v3.1 では、ALUA と組み合わせてネイティブ・フェイルオーバーをサポートす るにはパッチ11.31.0709 が必要
• Solaris 9 では、MPIO には StorEdge SAN Foundation Software 4.4.12 が必要
• Solaris 10 では、AULA と組み合わせてフェイルオーバーをサポートするには update 3 が 必要
• ホストに関する最新の考慮事項について、Powerlink の E-Lab Navigator を必ず参照してく ださい
表1 に、各種のオペレーティング・システムにおけるネイティブのフェイルオーバー・ソフトウ ェアのサポートについて一覧を示します。ネイティブのフェイルオーバー・ソフトウェアは、自 動リストア、ロード・バランシング、SAN 起動などの機能をサポートしていないことがありま
す。これらの機能をサポートしているソフトウェアについては、「EMC Support Matrix」を参照 してください。
CLARiX の構成
非対称アクティブ/アクティブを構成するには、ホスト・イニシエータを Failover Mode 4 に構成 する必要があります。Failover Mode を 4 に設定するには、Navisphere Manager または CLI を使用 します(Failover Mode の詳細については、「CLARiX のフェイルオーバー・モード」セクション を参照)。
図2に示したように、[Failover Mode]プルダウン・メニュー([Group Edit Initiators]ダイアロ グ・ボックス内)にはオプションとして[4]があります。Failover モードは initiator のオプション なので(storage group のオプションではなく)、ALUA ホストと非 ALUA ホスト(Failover Mode 4 で構成されていないホスト)の両方を同じ LUN にアタッチできます。
図2:非対称アクティブ/アクティブ用の新しい Failover Mode が表示された、Navisphere の [Group Edit Initiators]ダイアログ・ボックス
アクティブ/アクティブ構成用の CLI コマンド
ホストでフェイルオーバー・モードを4(非対称アクティブ/アクティブ)に設定するコマンド
naviseccli –h <SP_IP_Address> –user a –password a –scope 0 storagegroup –sethost –ip < IP Address> –failovermode 4
HBAUID に対してフェイルオーバー・モードを 4(アクティブ/アクティブ)に設定するコマン
ド
naviseccli –h <SP_IP_Address> –user a –password a –scope 0 storagegroup –setpath –hbauid xxxxx –sp a –spport xxxxx –failovermode 4
デフォルトのフェイルオーバー・モードの値を表示するコマンド
naviseccli –h <SP IP Address> –user a –password a –scope 0 port –list –failovermode
注意:デバイスをALUA 用(Failover Mode 4)に構成した後、ホストの再起動が必要です。
CLARiX のフェイルオーバー・モード
CLARiX LUN のトレスパスは、ストレージ・システムによって、またはサーバ上のパス管理ソフ トウェアによって開始されます。イニシエータのFailover Mode により、CLARiX がトレスパス 条件に対してどのように反応するかが決まります。CLARiX は、アタッチされるオペレーティン グ・システムに応じて5 種類の Failover Mode をサポートしています。
• Failover Mode=0。自動トレスパス・モード。オーナーでない SP に対するすべてのメディア のアクセスを拒否。
• Failover Mode=1。Passive Not Ready。オーナーでない SP に I/O が送信されるとコマンドが失 敗。
• Failover Mode=2。(DMP モード)、オーナーでない SP への I/O に対して Quiet Trespass を実 行。
• Failover Mode=3。Passive Always Ready。一部のコマンド(Test Unit Ready)は Passive Always Ready を返す。
• Failover Mode=4。非対称アクティブ/アクティブ。
CLARiX からの AULA 状態の取得
Navisphere CLI の getlun コマンドを使用すると、非対称アクティブ/アクティブ・ホストに接続 されているLUN に関する追加情報が表示されます。次に、このコマンドの実行結果の一部を示 します。
# naviseccli –h [SPipaddress] getlun 0 y Read Requests SPA: 236 y Read Requests SPB: 1480 y Write Requests SPA: 426 y Write Requests SPB: 627 y LUN Busy Ticks SPA: 273 y LUN Busy Ticks SPB: 297 y LUN Idle Ticks SPA: 0
y LUN Idle Ticks SPB: 0
y Number of arrivals with non-zero queue SPA: 398 y Number of arrivals with non-zero queue SPB: 398 y Sum queue lengths by arrivals SPA: 398 y Sum queue lengths by arrivals SPB: 398 y Explicit Trespasses: 5800
y Explicit Trespasses SPA: 2346 y Explicit Trespasses SPB: 3454 y Implicit Trespasses: 320 y Implicit Trespasses SPA: 214 y Implicit Trespasses SPB: 106
このコマンドの出力の意味はFailover Mode 4 でも変わりませんが、LUN から SPA と SPB の両方 に関する統計がレポートされます。また、明示的トレスパスと暗黙的トレスパスが表示されます。 [LUN Properties]ダイアログ・ボックス(図 3)は、Failover Mode 4 でイニシエータに接続されて いるLUN に関する統計を表示できるように拡張されています。これらの統計は、ストレージ・ システムで[Statistics Logging]が有効になっている場合に利用可能です。この統計には、最適パス および非最適パスを経由してルーティングされた読み取りおよび書き込みの数が含まれます。 Redirector Reassignment 値は、[Statistics Logging]が有効にされてからの非対称アクティブ/アクテ ィブによる暗黙的トレスパスの数を記録します。
図3:[LUN Properties]ダイアログ・ボックスの統計
ストレージ・システムのサポート
FLARE リリース 26 が実行されている CX3 および CX(700/500/300)ストレージ・システムは、 ALUA 準拠です。ALUA の機能は、ファイバ・チャネルと iSCSI のどちらでアタッチされている ホストであっても、Failover Mode 4 で接続され、ファイバ・チャネルと iSCSI の少なくともどち らかをサポートするALUA 対応のフェイルオーバー・ソフトウェアがインストールされていれ ば使用できます。AX システムは ALUA をサポートしていません。
パフォーマンスに関する考慮事項
オーナーでないSP に I/O が(非最適パスを経由して)ルーティングされると、パフォーマンス にある程度の影響があります。非最適パスの方が低速であるため、これはストレージへの通常の アクセス方法としては望ましくありません。アレイに関する新しい統計が使用可能になり、I/O が最適パスと非最適パスのどちらを通っているかの判断に役立てることができます。非最適パス をI/O が通る場合のパフォーマンスへの影響について詳細は、ホワイト・ペーパー「EMC CLARiX Best Practices for Fibre Channel Storage」を参照してください。
ベスト・プラクティス
• 2 つの SP の間で LUN のオーナー権のバランスを取る。 • I/O が LUN のオーナーでない SP にルーティングされる際のパフォーマンスへの影響を 避けるために、目的のLUN へのアクティブな最適パスのみを使用してロード・バランシ ングを行うようにフェイルオーバー・ソフトウェアを構成することを推奨。PowerPath は、 デフォルトでこれを実行。 • SAN の変更(コンポーネントの障害、交換)後、その変更が I/O パスの変更につながる 可能性のある場合は、ホストが引き続きLUN への最適パスを使用しているかどうかを確 認する。 • NDU 操作の後は、すべての LUN がデフォルトのオーナーに戻っていることを確認する。 PowerPath は、自動的にこれを実行。 • 障害またはパフォーマンスの問題が発生したときに、I/O が最適パスを通るようにルーテ ィングされることを確認する。非対称アクティブ
/アクティブ機能の影響
非対称アクティブ/アクティブは、ストレージ・システムの LUN のオーナー権(LUN を所有する のは1 つのコントローラのみ)を与える、リクエスト転送の実装です。ただし、これによって I/O はどちらのコントローラを通るルーティングも可能になります。LUN の現在のオーナーでな いコントローラは、ストレージ・システム内の内部通信パスを使用して、LUN を所有している コントローラにI/O をリダイレクトします。 SP に障害が発生した場合は、オーナーでない SP に I/O をリダイレクトするリダイレクタ・ドラ イバがアクセス不可能になるため、ALUA によるメリットはありません。したがって、SP に障 害が発生すると、ALUA は PNR(Failover Mode 2)モードで動作します。CLARiX 非対称アクティブ/アクティブのメリット
ユーザー操作の向上
CLARiX Asymmetric Active/Active は、次の機能を持っています。
• パスに障害が発生した際に SAN から起動できなくなることを回避 BIOS が非最適パスからの起動を試みたときに、フェイルオーバー・ソフトウェアが使用 できない(システムが起動中であるため)問題が、ALUA によって回避されます。 今までは、起動サーバがSP に到達できない場合(オペレーティング・システムが起動す る前に、そのSP へのすべてのパスに障害が発生したなど)、サーバを正常に起動するに は、ユーザーが手動でLUN をもう一方の SP にトレスパスする必要がありました。リク エスト転送方式では、ユーザーは明示的にLUN をもう一方の SP にトレスパスする必要 がありません。HBA 起動 BIOS が障害を逃れた SP に I/O を発行できるように構成されて いる場合、I/O は上位リダイレクタを経由してオーナーである SP にルーティングされ、 オペレーティング・システムは正常に起動します。
詳細については、HBA 起動 BIOS の構成方法を説明している E-Lab Navigator のホスト接 続ガイドをPowerlink で参照してください。
• ホストの構成ミスによってデータが使用できない状況を減らす アプリケーションが I/O を非最適パスに(LUN をオーナーでない SP に)送信するよう に、誤ってホストを構成してしまうことがあります。その場合、ホストにインストール されているフェイルオーバー・ソフトウェアによっては、CLARiX ストレージ・システ ムは I/O エラー・コンディションを返しません。代わりに、リクエスト転送機能により、 LUN のオーナーSP に I/O がルーティングされます。 さらに、CLARiX はストレージのアクセスに変更があったことを検知すると、自動的に LUN への最適パス設定を調整します(この「暗黙的トレスパス」は、「明示的トレスパ スと暗黙的トレスパス」セクションで説明されています)。この自動調整は、構成ミス の可能性が高くなる大規模な環境や、LUN のアクセスが時間の経過とともに変化する可 能性がある環境で、極めて大きなメリットがあります。 • SnapView およびクラスタの構成で発生する可能性がある、LUN のオーナー権の移行が 頻発する状況を回避 アクティブ/アクティブ・クラスタ構成では、LUN が複数のホストによって共有されて書 き込まれる場合、1SP に 1 パスのホスト構成における 2 つの SP 間での LUN のトレスパ スがALUA によって回避されます。 SnapView では、クローンまたはスナップショットのオーナーSP は、ソース LUN のオー ナーSP と同じでなければならないため、本番サーバがソース LUN に書き込み、スナッ プショット/クローンがバックアップ・サーバによってマウントされて書き込まれる場合、 本番ホストとバックアップ・ホストの両方が1SP に 1 パスの構成にすると(各サーバが 互いに別のSP へのパスを 1 本持つが、そのピアには持たない)、非 ALUA モードのサ ーバではパスの切り替えが頻発する可能性があります。
クラスタとSnapView の両方の構成で ALUA 規格を導入することで、LUN は 2 つの SP の間でトレスパスを繰り返すことがなくなり、ALUA モードのホストによってその LUN への最大のI/O リクエストを受信した SP によって所有されます。
Upper-redirector Layer drivers FLARE
SP A
SP B
Upper-redirector FLARE Optimal Path Non - Optimal Path CMI LinkLUN
Layer drivers Lower-redirector Lower-redirectorHost
Host
Upper-redirector Layer drivers FLARESP A
SP B
Upper-redirector FLARE Optimal Path Non - Optimal Path CMI LinkLUN
Layer drivers Lower-redirector Lower-redirectorHost
Host
図4:SnapView を使用した ALUA とクラスタ構成の影響標準の
SCSI マルチパス・インターフェイスのサポート
ALUA では、OS ベンダーのネイティブなマルチパスなどのフェイルオーバー・ソフトウェアの 実装が標準化されます。CLARiX は SCSI 標準の ALUA を実装しているため、ホストのフェイル オーバー・ソフトウェアは、CLARiX 固有のトレスパス・コマンドと競合することがありません。リダイレクタの影響
フロントエンドのパスに対する利点に加えて、新しいFLARE リリース 26 リダイレクタでは、フ ロントだけでなく「バックエンド」にもリダイレクト・サービスを提供することにより、すべて のアタッチ(従来のPNR および ALUA ベース)のタイプに関してメリットがあります。バックエンド障害のマスキング
LUN の現在のオーナーである SP にバックエンド障害(LCC 障害など)が発生した場合、ALUA のリクエスト転送機能を使用することにより、I/O は下位リダイレクタを経由して、安定したバ ックエンドを持つピアSP にルーティングされます。図 5に示すように、I/O の確認は下位リダイ レクタを使用することにより、LUN のオーナーSP を通じて送信されます。ホストでフェイルオ ーバー・ソフトウェアの介入は不要なので、特定のCLARiX バックエンド障害は隠れます。 次の例では、LUN は FLARE により、バックエンドで LUN にアクセス可能な SP にトレスパスさ れます。ホストは引き続き、ピアSP を通じてその LUN に I/O を送信します。バックエンド・エラーが修正されると、LUN は以前の SP に戻るようにトレスパスされ、その LUN への I/O がピア SP にリダイレクトされることはなくなります。その結果、トレスパス動作が行われてもホスト 上でI/O の遅れはほとんど発生しません。
これは、SnapView、MirrorView、SAN Copy などの CLARiX レイヤード・アプリケーションがリ ダイレクトが行われているかどうかを知る必要がないというメリットがあります。バックエンド 障害のマスキング機能は、すべてのFailover Mode タイプで提供されます。
Host
Layer drivers FLARESP A
SP B
FLARE Optimal Path CMI LinkLUN
Layer drivers Lower-redirector Lower-redirector Non Optimal Path Upper-redirector Upper-redirectorHost
Layer drivers FLARESP A
SP B
FLARE Optimal Path CMI LinkLUN
Layer drivers Lower-redirector Lower-redirector Non Optimal Path Upper-redirector Upper-redirector 図5:フェイルオーバー・ソフトウェアを使用しないバックエンド障害マスキング
フェイルオーバー方法の比較
パス管理ソフトウェアは、ストレージ・システムとのやり取りによってデータ・デバイスとの複 数のパスを自動化および管理する、通常はサーバ・ベースのアプリケーション
です。
パス管理 ソフトウェアのいくつかのオプションは、CLARiX ストレージ・システムによってサポートされ ています。「CLARiX のフェイルオーバー・モード」セクションで説明しているように、 CLARiX は各種のパス管理ソフトウェアと組み合わせて、数種類の Failover Mode で実行するよ うに構成できます。EMC PowerPath は、パス管理を行うホスト・ベースのソフトウェアです。PowerPath は、いくつ かのオペレーティング・システム上で、いくつかのストレージ・システムに対して、ファイバ・
チャネルおよびiSCSI データ・チャネルの両方で動作します。PowerPath の実装の詳細および各 種の機能と、それぞれのネイティブ・フェイルオーバー・ソフトウェア(MPIO)について、こ の次に説明します。
明示的および暗黙的フェイルオーバー・ソフトウェア
明示的および暗黙的フェイルオーバー・ソフトウェアは、すでに説明した明示的および暗黙的フ ェイルオーバー・トレスパス・コマンドと区別する必要があります。 明示的なALUA コマンドをサポートするフェイルオーバー・ソフトウェアは、最適パスと非最 適パスをREPORT TARGET PORT GROUPS コマンドを使用して監視し、SET TARGET PORT GROUPS コマンドを使用してその間の調整を行います。SET TARGET PORT GROUPS コマンド がコントローラから発行されると、他のコントローラにLUN がトレスパスされます。PowerPath は、実質的に明示的なトレスパスと同じ効果を持っていますが、従来のCLARiX 固有のコマンド を使用してトレスパスを開始します。Longhorn(Windows Server 2008)の MPIO では、明示的な ALUA コマンドがサポートされます。
ホストのマルチパス・ソフトウェアは、暗黙的なALUA 機能をサポートすることができます。 ホストは、ストレージ・システムからは分からない何らかの理由で、トラフィックを非最適パス にトレスパスすることがあります。その場合、ストレージ・システムは、非最適パス上に一定の I/O を検出した時点で暗黙的にトレスパスする必要があります。最適パスの情報を取得するため に、フェイルオーバー・ソフトウェア
は
REPORT TARGET PORT GROUPコマンドを使用しま
す。
フェイルオーバー・ソフトウェアには、自動リストア機能はありません。自動リストア機能 がないと、NDU の後ですべての LUN が同じ SP に所属する可能性があります。初期にサポート されていたHPUX 11iv3 はこの方式で動作していました。現在ではパッチによってこの動作は起 きなくなっており、現場でこの状況が発生することは考えられません。クラスタ・ソフトウェア も、この機能を使う可能性があります。PowerPath
PowerPath をストレージ・システムとともに使用することで、I/O パスを機能的に管理できます。 通常の状態では、PowerPath は最適パス(オーナーであるサポートへのパス)上の LUN に対して のみI/O を発行します。最適パスに障害が発生すると、PowerPath はトレスパス・コマンドを発 行して、LUN のオーナー権をもう一方の SP に変更し、非最適パスを最適パスに定義し直します。 PowerPath のユニークな機能として、ベンダー固有のクエリーをピア SP に対して使用して、パス の障害がSP の障害によるものかどうかを判断することができます。その場合、PowerPath はパス ごとのチェックを行わず、直ちにトレスパスを発行します。これは、MPIO よりも PowerPath が 優れている重要な点です。 PowerPathは、最適パス内でのみロード・バランシングを行うため、明示的なフェイルオーバ ー・ソフトウェアです。すべての最適パスに障害が発生すると、PowerPathはトレスパスを発行 して非最適パスを最適にし、それらの中でロード・バランシングを行います。また、PowerPath は、ALUAをサポートしているネイティブのフェイルオーバー・ソフトウェアがないオペレーテ ィング・システムに対して、非対称アクティブ/アクティブ機能をサポートしています。たとえ ば、Windows 2003のホストは、ALUAをサポートしているPowerPathバージョン5.1でALUAモー ドに構成できます。 PowerPathは、次の機能をサポートします。• パフォーマンスの低下につながる可能性がある、最適パスと非最適パスを使用したI/Oの ロード・バランシングは行わず、最適パスだけを使用してすべてのI/Oのロード・バラン シングを行う。ロード・バランシングのさまざまなポリシーをサポート。 • NDU、ケーブル、またはスイッチの障害の後でSPが正常な状態に戻ったときに、LUNを デフォルトのSPにリストアする自動リストア機能。これによってSP間でのバランスが平 準化し、パフォーマンスが安定。 • デバイスの優先順位付けおよびプロアクティブなパス・テストをサポート。 • バージョン5.1以降では、複数のアレイにアタッチされた同じホストで、ALUAと非 ALUAの両方のモードのLUNをサポート。 • ALUA固有のI/Oリトライ最適化により、SP障害発生時およびNDU(無停止アップグレー ド)時のフェイルオーバー時間を短縮。 • 各LUNごとに、モード(ALUAまたは非ALUA)をCLARiX適合名とともにPowerPathデ ィスプレイに表示。 • SANからの起動をサポート。
PowerPath のライセンス(全機能)は、AX シリーズ向けの PowerPath パッケージに組み込まれて います。CX300 および CX3-10 モデルでは、PowerPath のライセンス(全機能)はストレージ・ システムにバンドルされています。
PowerPath SE は、CLARiX の CX3-20 以上のモデルに無料でバンドルされています。PowerPath SE は、単一の HBA サポート、および限定的なロード・バランシング・オプションを備えていま す。CX3-20 以上のモデルで PowerPath の全機能を使用するためには、完全版の PowerPath ソフト ウェアを購入することができます。PowerPath の完全版には、柔軟性の高いアタッチ・オプショ ン(複数のHBA)およびロード・バランシング・ポリシーや、すでに説明したユニークな機能 が含まれます。
ネイティブのフェイルオーバー・ソフトウェア(
MPIO など)
多くの人にとって、ネイティブのフェイルオーバー・ソフトウェアは「MPIO」を意味します。 MPIOは、マルチパスLUNを扱うホスト側インターフェイスの名称として一般的に使用されてい ます。しかし、違うベンダーのオペレーティング・システムにおけるMPIOの実装は、APIが同一 ではありません。一部のオペレーティング・システムでは、ストレージのベンダーがMPIOフレ ームワークを実装する際、ライブラリを提供する必要があります。一方、Solaris MPIOなど一部 のオペレーティング・システムにはライブラリが含まれています。 MPIOフレームワークは、複数モードにすることができます。一部のベンダーは、アクティブ/ア クティブ、アクティブ/パッシブ、ALUAをサポートしています。HP-UX 11iv3およびMS Windows Server 2008(Longhorn)では、ALUAまたはアクティブ/アクティブのサポートは制限されます。 CLARiXは、表1に示すように、各種のネイティブMPIOソフトウェアをサポートしています。 ネイティブのフェイルオーバー・ソフトウェア(ALUAその他の非ALUA)は、PowerPathが提供 する機能の一部を提供していないことがあります。ネイティブのフェイルオーバー・ソフトウェ アを本格的に使用する前に、これらの点に注意する必要があります。フェイルオーバー・システ ムで提供されていない機能には、次のようなものがあります。 • Windows MPIO(iSCSI)には自動リストアがない。 • HP-UX PVLinks「クラシック」(11iv2よりも前)にはロード・バランシングがない。 • HP-UX 11iv3.1 MPIOにはロード・バランシングがあるが自動リストアはない。• LINUXのALUAベースのMPIOは、自動リストアがなく、ハングしたSPを検出できない。 Linuxにはタイマーがない。PowerPathは時間を計測し、ピアSPをチェックするので、ハ ングしたSPを検出可能。
• AIX MPIOおよびSolaris MPxIOは、自動リストアをサポートしていない。EMC PowerPath は自動リストア機能を提供。これによってSP間でのバランスが平準化し、パフォーマン スが安定。
NDU(無停止アップグレード
)
NDU では、各 SP を順番に再起動する必要があります。ALUA でも、NDU におけるストレー ジ・システムの動作はほとんど変わりません。アクティブ/パッシブ・モード(Failover Mode 1) のPowerPath を使用すると、オーナーである SP の再起動中、LUN はもう一方の SP にトレスパス されます。NDU 操作が完了すると、PowerPath は LUN をデフォルトのオーナーである SP に自動 リストアします。
非対称アクティブ/アクティブ・モードでは、SP の再起動中にフェイルオーバー・ソフトウェア がパスの障害を検知すると、動作している SP に I/O をリダイレクトします。NDU が終了すると、 CLARiX はフェイルオーバー・ソフトウェアを使用して、REPORT PORT GROUPS コマンドによ って返された優先ビットを調べることにより、LUN をデフォルトのオーナーに移動して下のパ ス構造を回復するかどうかを決定します。
NDU 操作の間、PowerPath は LUN をピア SP にトレスパスします。NDU が完了すると、 PowerPath は LUN をデフォルトのオーナーに自動リストアします。これは、イニシエータが Failover Mode 1(アクティブ/パッシブ)と 4(ALUA)のどちらに構成されている場合でも適用 されます。PowerPath は自動リストアの実行には優先ビットを使用せず、CLARiX 独自のコマン ドを使用してトレスパスを発行することに注意してください。
手動トレスパス
アクティブ/パッシブ・モード(Failover Mode 1)では、手動トレスパスが発行されると (Navisphere Manager または CLI を使用して)、手動トレスパスが発行された SP を通ってその LUN に向けられたその後の I/O は拒否されます。これにより、ホストの Unit Attention 条件が発 生し、フェイルオーバー・ソフトウェアはこのエラーを検知して、LUN のオーナーSP に I/O を リルートします。
自動であるか手動であるかに関係なく、すべてのトレスパス操作によってLUN のオーナー権は 変更され、接続されているホストにUnit Attention が送信されます。ALUA に対応したそれらの
ホストは、Unit Attention を解釈し、適切な Target Port Group コマンドを使用して現在のステータ スを照会します。
PowerPath、および ALUA に対応しているネイティブ MPIO は直ちに Unit Attention に反応して、 I/O が非最適パスを通過しないように、すべての I/O を最適パスにルーティングします。 したがって、手動でLUN をトレスパスすると、PowerPath と MPIO ソフトウェアのどちらも継続 的に最適パスを使用することになります。CLARiX ALUA の暗黙的トレスパス機構により、I/O バランスの変化がLUN の暗黙的なトレスパスを引き起こすことがあります(「明示的トレスパ スと暗黙的トレスパス」セクションで説明)。
パス、
HBA、スイッチの障害
ホストがFailover Mode 1 に構成されており、LUN のオーナーSP へのすべてのパス
に障害が発
生すると、LUN はホストのフェイルオーバー・ソフトウェアによってもう一方の SP に
トレスパスされます。
Failover Mode 4 では、パス、HBA、またはスイッチに障害が発生した場合、オーナーでない SP にI/O がルーティングされると、LUN は直ちにトレスパスされない可能性があります(ホストの フェイルオーバー・ソフトウェアに依存)。LUN がトレスパスされない場合は、その LUN への I/O リクエストを多く受け取る方の SP に、暗黙的トレスパス機構に基づいて FLARE が LUN を トレスパスします。
SP 障害
Failover Mode 1 に構成されたホストの下で SP に障害が発生した場合、フェイルオーバー・ソフ トウェアは障害を逃れたSP に LUN をトレスパスします。
Failover Mode 4 では、LUN のオーナーでない(非最適)SP の ALUA イニシエータから I/O が受 信された場合、フェイルオーバー・ソフトウェアまたはFLARE が内部トレスパス操作を開始し ます。この操作により、障害を逃れたSP にターゲット LUN のオーナー権が変更されます(ピア SP が機能しないので)。したがって、ホスト(フェイルオーバー・ソフトウェア)は、そのよ うな場合にI/O を発行できるように、セカンダリ SP へのアクセス権を持っている必要がありま す。
結論
FLARE リリース 26 の非対称アクティブ/アクティブ機能は、構成の柔軟性を高め、変化を続ける 環境に対する投資保護を促進し、システムの可用性を高めます。 非対称アクティブ/アクティブは、SCSI の新しい標準です。この仕様に準拠するホスト・フェイ ルオーバーの方法をサポートします。ホストは、LUN のオーナーSP に I/O をリダイレクトでき るため、特定の状況における意図しないトレスパスを避けることができます。バックエンド障害のマスキング機能は、すべてのFailover Mode タイプに提供されます。LUN の 現在のオーナーであるSP にバックエンド障害が発生した場合、I/O は下位リダイレクタを経由し て、安定したバックエンドを持つピアSP にルーティングされます。これにより、レプリケーシ ョン動作を妨げることがあるトレスパスを避けることができます。 すべてのポートを、同じLU へのアクセスに同時に使用できます。非対称アクティブ/アクティブ のマルチパス機能は、現在のベース・ソフトウェア・パッケージに対するソフトウェア拡張で、 既存のFailover Mode に対する上位互換性を持つ予定です。これは、非対称アクティブ/アクティ ブ・モデルに基づいており、REPORT TARGET PORT GROUP によってレポートされた最適パス および非最適パス上のすべてのポートを使用して、ホストI/O を LUN に送信できます。 非対称アクティブ/アクティブは、SPC-3 SCSI 標準の一部であり、Failover Mode の現在のモード である0(自動トレスパス)、1(Passive Not Ready)、2(DMP)、3(Passive Always Ready)と 完全に同じように選択できます。非対称アクティブ/アクティブモデルは、アレイに対するどん な接続にも適用できますが、システムのデフォルトの動作ではありません。PNR イニシエータお よび非対称アクティブ/アクティブ・イニシエータは、同じ物理 SP ポートを通じて接続でき、
PNR はレガシー・システムと同じように動作して、それぞれが異なるフェイルオーバー動作をし ます。