SteelEye Protection Suite for Linux v8.1.1
Software RAID (md) Recovery Kit
管 理 ガイド
This document and the information herein is the property of SIOS Technology Corp. (previously known as SteelEye® Technology, Inc.) and all unauthorized use and reproduction is prohibited. SIOS Technology Corp. makes no warranties with respect to the contents of this document and reserves the right to revise this publication and make changes to the products described herein without prior notification. It is the policy of SIOS Technology Corp. to improve products as new technology, components and software become available. SIOS Technology Corp., therefore, reserves the right to change specifications without prior notice.
LifeKeeper, SteelEye and SteelEye DataKeeper are registered trademarks of SIOS Technology Corp.
Other brand and product names used herein are for identification purposes only and may be trademarks of their respective companies.
To maintain the quality of our publications, we welcome your comments on the accuracy, clarity, organization, and value of this document.
Address correspondence to: [email protected]
Copyright © 2012
By SIOS Technology Corp. San Mateo, CA U.S.A. All rights reserved
目次
Chapter 1: はじめに
1
Software RAID (md) Recovery Kit ド キュメンテーション 1
ド キュメント の内 容 1 ド キュメンテーションとリファレンス 1
Chapter 2: 要件
3
ハード ウェア要 件 3 ソフト ウェア要 件 3Chapter 3: 概要
5
Software RAID (md) による処 理 5LifeKeeper for Linux Software RAID (md) Recovery Kit 7 Software RAID Recovery Kit の注 意 事 項 と制 約 事 項 8
起 動 中 の仮 想 デバイスのアクティベート 8 パーシステント スーパーブロック 8 HOMEHOST 8 Homehost セット を使 用 せずに MD デバイスを再 作 成 する 9 RAID レベルのサポート 9 スペアのサポート 9 Raw I/O および全 ディスクのサポート 9 仮 想 デバイスのパーティショニング 9 MD_ASSEMBLE_OPTIONS 9
Chapter 4: Software RAID 階層の作成と管理
11
階 層 作 成 の手 順 14
Software RAID の再 設 定 15
Software RAID の修 復 24
ターミナルリソース 35
MD デバイス番 号 35
すべての MD デバイスの In Service 化 35
Chapter 6: ト ラブルシューティング
37
エラーメッセージ 37
Chapter 1: はじめに
Software RAID (md) Recovery Kit ドキュメンテーション
SteelEye Protection Suite (SPS) for Linux Software RAID (md) Recovery Kit は、他 の LifeKeeper リカ バリキット に、ソフト ウェア RAID サポートを提 供 します。これにより、LifeKeeper で保 護 されたアプリケー ションは、低 コスト なデータ冗 長 性 、SAN を介 したデータレプリケーション、およびストレージ管 理 の簡 略 化 といった、ソフト ウェア RAID のメリットを活 用 できます。
Software RAID Recovery Kit は、単 体 で使 用 されることがなく、他 の LifeKeeper リソースに依 存 して 使 われる点 で、他 のほとんどの LifeKeeper リカバリキットと異 なります。そのため、LifeKeeper リカバリキッ ト に通 常 付 随 する多 くの作 業 (階 層 の作 成 など) は、Software RAID Recovery Kit に直 接 該 当 しま せん。
ドキュメント の内 容
このガイド では次 の事 項 について説 明 します。
l ド キュメンテーションとリファレンス。関 連 する LifeKeeper for Linux のド キュメントと、その入 手 場 所 、Linux Software RAID 製 品 に関 する多 数 の役 立 つド キュメントの参 照 情 報 の一 覧 を記 載 します。
l 要 件。Software RAID Recovery Kit を適 切 に設 定 、インストール、運 用 する上 で必 要 なハー ド ウェアとソフト ウェアを説 明 します。LifeKeeper for Linux ソフトウェアをインストールまたはアンイン スト ールする方 法 の詳 細 については、SPS for Linux インストールガイド を参 照 してください。 l 概 要。Software RAID Recovery Kit と対 応 するリソースタイプの概 要 を説 明 します。
l LifeKeeper Software RAID 階 層 の作 成 と管 理。LifeKeeper による Software RAID Recovery Kit の管 理 作 業 の詳 細 を説 明 します。
l ト ラブルシューティング。情 報 メッセージとエラーメッセージ、および推 奨 される対 処 方 法 の一 覧 を 示 します。
ドキュメンテーションとリファレンス
以 下 の SPS 製 品 ド キュメンテーションは、SIOS Technology Corp. の Web サイトから入 手 できます。 l SPS for Linux リリースノート
l SPS for Linux テクニカルド キュメンテーション l Optional Recovery Kit ド キュメンテーション
このド キュメンテーション、およびオプションの LifeKeeper Recovery Kit 関 連 のド キュメンテーションは、次 に示 す SIOS Technology Corp の Web サイトから入 手 できます。
ド キュメンテーションとリファレンス
http://docs.us.sios.com/
Linux Software RAID に関 する情 報 については、md(4) および mdadm(8) のマニュアルの内 容 と、HowTo (Jakob Østergaard および Emilio Bueso、管 理 人 、URL:
Chapter 2: 要件
LifeKeeper for Linux Software RAID (md) Recovery Kit をインスト ールする前 に、LifeKeeper の設 定 が 次 の要 件 を満 たしている必 要 があります。お使 いの LifeKeeper ハード ウェアおよびソフトウェアの設 定 に 関 する具 体 的 な手 順 については、SPS for Linux インストールガイド を参 照 してください。
ハードウェア要 件
l サーバ。このリカバリキット を使 用 するには、SIOS テクニカルド キュメンテーションサイト
(http://docs.us.sios.com/) にある SPS for Linux リリースノート および SPS for Linux インスト ール ガイド に記 載 の要 件 に従 って設 定 されたコンピュータが 2 台 以 上 必 要 です。
l データスト レージ。Software RAID Recovery Kit は、共 有 ストレージと併 用 できます。Network Attached Storage (NAS) と合 わせて使 用 することはできません。その他 、RAID デバイス上 のアプ リケーションを保 護 しているリカバリキット の要 件 を超 えるような、スト レージ設 定 に関 する特 別 な 要 件 はありません。
ソフト ウェア要 件
l オペレーティングシステム。Linux Software RAID 製 品 は、すべての主 要 Linux ディストリビューシ ョンに含 まれています。サポート されているディスト リビューションとバージョンについては、SPS for Linux リリースノート を参 照 してください。
l mdadm(8) ユーティリティ。リカバリキット をインスト ールするには、mdadm rpm パッケージがインス ト ールされている必 要 があります。サポート される mdadm のバージョンは、Linux ディストリビューシ ョンで提 供 されるバージョンです。
l LifeKeeper ソフト ウェア。各 サーバに同 一 のバージョンの LifeKeeper Core ソフト ウェア、Software RAID Recovery Kit を含 む任 意 のリカバリキット 、およびパッチをインスト ールする必 要 がありま す。具 体 的 な LifeKeeper の要 件 については、SPS for Linux リリースノートを参 照 してください。 l LifeKeeper for Linux Software RAID (md) Recovery Kit。Software RAID Recovery Kit
は、SPS インストールイメージファイル (sps.img) で提 供 されます。これは、Red Hat Package Manager (rpm) を使 用 してパッケージ、インスト ール、およびアンインスト ールします。steeleye-lkMD という rpm ファイルが SPS インスト ールイメージファイル (sps.img) で提 供 されます。
パッケージのインスト ール中 、サポート 対 象 バージョンの LifeKeeper Core パッケージと mdadm パッケージ の両 方 が、Software RAID Recovery Kit をインストールするシステム上 にあることの確 認 が行 われます。 これらのパッケージに要 求 されるバージョンについては、SPS for Linux リリースノートを参 照 してください。 LifeKeeper Core ソフト ウェアおよび Software RAID Recovery Kit をインスト ールまたはアンインスト ール する方 法 の詳 細 については、SPS for Linux インストールガイド を参 照 してください。
ソフト ウェア要 件
Software RAID Recovery Kit は、md を使 用 した Software RAID により LifeKeeper で保 護 するディス クリソースを管 理 するクラスタ内 の各 サーバ上 にインスト ールする必 要 があります。
Software RAID Recovery Kit は、RAID デバイス上 に配 置 されるアプリケーションの階 層 を作 成 および 拡 張 する前 に行 うインスト ールする必 要 があります。
Chapter 3: 概要
Software RAID (md) による処 理
Multiple Device ド ライバ (md) は、現 在 、主 要 な Linux ディスト リビューションすべてに含 まれている標 準 の Linux Software RAID 製 品 です。Linux Software RAID を使 用 すると、複 数 の物 理 ディスクやディス クパーティションをグループ化 して、仮 想 デバイスを構 成 できます。仮 想 デバイスは、標 準 のブロックデバ イスとしてアクセスできます。そのため、ブロックデバイスを直 接 扱 うことのできるファイルシステムや任 意 の アプリケーションによって使 用 できます。
Software RAID は、主 に、ハード ウェア RAID (またはスト レージレプリケーション) が現 実 的 ではないか、 実 現 不 可 能 である場 合 にデータの冗 長 性 を提 供 します。次 の図 は、Software RAID エンティティ間 の 関 係 を示 しています。ファイルシステムまたはアプリケーションは、仮 想 デバイスを使 用 します。仮 想 デバ イスは、1 つ以 上 の物 理 ディスクパーティションまたはディスクの集 合 です。
Software RAID (md) による処 理
図 1: Software RAID エンティティ間 の関 係
下 図 において、書 き込 みは、シングルパスミラー内 の両 方 のアレイに書 き込 まれます。これは、高 価 な スト レージレプリケーションの代 替 となる MD の第 一 の機 能 です。
LifeKeeper for Linux Software RAID (md) Recovery Kit
図 2 - シングルパスの MD の設 定
LifeKeeper for Linux Software RAID (md) Recovery Kit
LifeKeeper Software RAID (md) Recovery Kit は、その他 の LifeKeeper リカバリキット が Linux Software RAID 仮 想 デバイスと正 常 に連 携 するために必 要 なサポート を提 供 します。このサポート を実 現 するた めに、Software RAID Recovery Kit は、2 つの新 しいリソースタイプ、md および mdComponent をインス ト ールします。これらは、仮 想 デバイスと、仮 想 デバイス内 に設 定 された各 パーティションまたはディスクに 対 応 しています。md と mdComponent リソースは、LifeKeeper リソースを動 作 できるようにするという、 内 部 的 な目 的 のためのみに存 在 しています。
mdComponent リソースを使 用 すると、Software RAID Recovery Kit は、仮 想 デバイス内 の各 個 別 コン ポーネント の状 態 を提 示 できます。
Software RAID Recovery Kit の注 意 事 項 と制 約 事 項 ISP – コンポーネント は、仮 想 デバイス内 で正 しく設 定 されており、正 常 に動 作 しています。 ISU – コンポーネント はスペアデバイスです。デバイスが仮 想 デバイスにホット 追 加 された場 合 、デ バイスがリスト ア中 にもスペアとして反 応 することに注 意 してください。 OSU – コンポーネント は、仮 想 デバイス内 に設 定 されていません。これは、コンポーネント が仮 想 デバイスから削 除 された場 合 に発 生 することがあります。仮 想 デバイスに障 害 の発 生 したコン ポーネント があり、設 定 解 除 (停 止 ) し、再 設 定 (アセンブル) すると、その障 害 の発 生 したコン ポーネント は、設 定 済 みのデバイスとしては表 示 されません。つまり、障 害 が発 生 したデバイスと して表 示 されるのではなく、未 設 定 のデバイスとして表 示 されます。 OSF – コンポーネント に障 害 が発 生 しています。注 記 : この状 態 でメール通 知 を受 け取 る場 合 、lk_confignotifyalias(8) を使 用 してこのオプションを有 効 にします。 概 要 に示 すように、仮 想 デバイス md0 は、2 つのディスクパーティション、sda1 と c1d0p1 で構 成 されてい ます。これは、RAID-1 ミラーまたは RAID-0 ストライプトアレイを反 映 している可 能 性 があります。仮 想 デバイスを含 む一 般 的 な LifeKeeper 階 層 は、概 要 に示 す関 係 性 によく似 ています。図 4: Software RAID リソースを含 む LifeKeeper 階 層 実 際 の LifeKeeper 階 層 の例 については、LifeKeeper Software RAID 階 層 の作 成 と管 理セクションの図 4: Software RAID リソースを含 む LifeKeeper 階 層 を参 照 し てください。
Software RAID Recovery Kit は、mdadm パッケージで提 供 される mdadm(8) コマンド を使 用 し て、LifeKeeper 階 層 内 の仮 想 デバイスリソースを管 理 します。仮 想 デバイスは、フェイルオーバやスイッ チオーバ動 作 中 に階 層 が in-service になったときに設 定 (またはアセンブル) され、階 層 が out-of-service のときは設 定 解 除 (または停 止 ) されます。
Software RAID Recovery Kit の注 意 事 項 と制 約 事 項
以 下 の注 意 事 項 と制 約 事 項 は、本 バージョンの Software RAID Recovery Kit に適 用 されます。
起動中の仮想デバイスのアクティベート
共 有 スト レージ上 の仮 想 デバイスは、システムの起 動 中 にアクティベート してはなりません。パーシステント スーパーブロック
全 ての仮 想 デバイスは、パーシステント スーパーブロックで構 成 する必 要 があります。このスーパーブロック の長 さは 4K で、デバイスの終 端 から 64K 以 上 128K 未 満 で開 始 する 64K で整 列 されたブロックとして 書 き込 まれます。この空 間 は、アプリケーションで使 用 することができないため、仮 想 デバイスのプランニ ング時 に考 慮 する必 要 があります。注 記 : MD は、「内 部 」機 能 を使 用 してビットマップで設 定 できるよう になりました。これにより、既 に必 須 であるスーパーブロック内 にビット マップが作 成 されるため、追 加 の空 間 、追 加 の LUN、または追 加 のファイルシステムは必 要 ありません。ビットマップは階 層 に表 示 されるこ となく、単 に「自 動 的 に」使 用 されます。詳 細 については、ド キュメンテーションとリファレンスセクションに 記 載 されている、mdadm(8) と md(4) のマニュアルページを参 照 してください。HOMEHOST
新 しいバージョンの mdadm に搭 載 されている HOMEHOST 機 能 は、LifeKeeper ではサポートされてい ません。ミラーが HOMEHOST セットを使 用 して設 定 されている場 合 、LifeKeeper はリソースの作 成 時 にエラーとなります。
図 3: ファイルシステム階 層 作 成 のエラー 図 3: ファイルシステム階 層 作 成 のエラーに示 すように、次 のメ ッセージが表 示 されます。
Homehost セット を使 用 せずに MD デバイスを再 作 成 する
「The MD device "/dev/md5" is configured with the unsupported "homehost" setting.」 「Recreate the MD device without homehost set.」
図 3: ファイルシステム階 層 作 成 のエラー
Homehost セット を使 用 せずに MD デバイスを再 作 成 する
MD デバイスを再 作 成 するには、「--homehost=''」の設 定 を次 のように使 用 する必 要 があります。 mdadm --create /dev/md5 --level=1 --raid-devices=2 /dev/sde1 /dev/sdf1 --homehost=''
RAID レベルのサポート
サポート される RAID レベルは、リニア、RAID 0 (ストライピング)、RAID 1 (ミラーリング)、RAID 10 (ストラ イプト ミラー) です。
スペアのサポート
スペアコンポーネント は、特 定 の仮 想 デバイスの要 素 としてサポート されています。「spare-group」はサ ポート されていません。
Raw I/O および全ディスクのサポート
概 要 概 要 は、ファイルシステム配 下 にある仮 想 デバイスを示 しています。Software RAID Recovery Kit を LifeKeeper Raw I/O Recovery Kit と組 み合 わせて使 用 した場 合 、仮 想 デバイスへの raw アクセスを サポート 可 能 であることは重 要 です。このとき、1 つ以 上 のディスクパーティション (例 : /dev/sdc1) ではな く、1 つ以 上 の全 ディスク (例 : /dev/sdc) で構 成 される仮 想 デバイスを管 理 できます。
仮想デバイスのパーティショニング
Linux Software RAID は、仮 想 デバイスの直 接 パーティショニングをサポート していません。個 人 によっ て、パーティショニングのサポート を追 加 する試 みがいくつかなされましたが、md ド ライバの管 理 人 はこれ を許 可 しませんでした。直 接 パーティショニングの代 わりに、上 述 のド キュメンテーションとリファレンス
のSoftware RAID HowTo セクションでは、LVM の使 用 を推 奨 しています。図 6: Software RAID リソー スを含 む LifeKeeper 階 層 は、LVM を使 用 した階 層 を示 しています。
MD_ASSEMBLE_OPTIONS
本 バージョンの Software RAID Recovery Kit では、パラメータ “--run” は、ラーをアセンブル (開 始 ) するた めに使 用 する mdadm コマンド から除 外 されています。このパラメータは、mdadm がコンポーネントの状 態 を把 握 できない一 部 のエラー状 況 において必 要 になります。この不 確 かさにより、データが壊 れる可 能 性 があるため、デフォルト では、このパラメータはもう使 用 されません。in service の強 制 ミラーが試 行 される前 は、エラーは次 のように表 示 されます。
Tue Apr 27 11:46:02 EDT 2010 restore:BEGIN restore of "md23051" on server "shrek.sc.steeleye.com"
Tue Apr 27 11:46:06 EDT 2010 restore: start: mdadm: failed to add /dev/sdc1 to /dev/md1:Invalid argument
MD_ASSEMBLE_OPTIONS 推 奨 はしませんが、このパラメータは、MD_ASSEMBLE_OPTIONS=--run のように LifeKeeper のデフォ ルト に追 加 することで使 用 できます (これで、アセンブル時 に毎 回 使 用 されるようになります)。 その代 わ りに、クラスタ内 のログを確 認 して最 も良 いデータを持 つコンポーネント /レッグを特 定 し、mdadm を使 用 して手 動 でミラーをアセンブルすることを推 奨 します。 注 記 : 一 部 のシステム (RHEL 6 を実 行 しているシステムなど) では、起 動 時 に自 動 的 にミラーを開 始 する設 定 ファイル (/etc/mdadm.conf) に AUTO エントリがあります (例 :AUTO +imsm +1.x –
all)。LifeKeeper では、ミラーを自 動 的 に開 始 しないようにする必 要 があるので、このエント リを編 集 し、 起 動 時 に自 動 的 に開 始 しないように指 定 する必 要 があります。前 の例 (AUTO +imsm +1.x –all) は、imsm メタデータおよび 1.x メタデータから他 のすべてを除 いたものを使 用 して作 成 したミラーを自 動 的 に開 始 するようにシステムに指 示 しています。このエント リを「AUTO -all」に変 更 し、あらゆるもの「マイ ナス」すべてを自 動 的 に開 始 するように (つまり、何 も自 動 的 に開 始 されないように) システムに通 知 す る必 要 があります。重 要 :クリティカルなシステムリソース (root など) が MD を使 用 している場 合 、それら のミラーが他 の方 法 で開 始 され、LifeKeeper で保 護 されているミラーは開 始 されないことを確 認 してくだ さい。
Chapter 4: Software RAID 階層の作成と管理
LifeKeeper Software RAID 階 層 は、仮 想 デバイス上 に配 置 されるリソースの作 成 処 理 中 に自 動 的 に 作 成 されます。Software RAID リソースタイプを含 む階 層 の作 成 と拡 張 は、常 に、より高 位 のリソースタ イプの作 成 および拡 張 プロセスから開 始 されます。削 除 と拡 張 解 除 についても同 様 です。
図 4: Software RAID リソースを含 む LifeKeeper 階 層 は、Software RAID リソースを含 む階 層 全 体 を 示 す LifeKeeper GUI のスクリーンショットです。階 層 内 のリソースは、LifeKeeper タグが表 示 される、デフ ォルト 表 示 で表 示 されています。図 5: Software RAID リソースを含 む LifeKeeper 階 層 では、同 じ階 層 を LifeKeeper ID で表 示 したものです。
Chapter 4: Software RAID 階 層 の作 成 と管 理
図 4: Software RAID リソースを含 む LifeKeeper 階 層
図 4: Software RAID リソースを含 む LifeKeeper 階 層 は、ファイルシステム階 層 です。これは、[Edit ]> [Server] > [Create Resource Hierarchy] メニューから [File System] リカバリキット を選 択 して作 成 されま す。これは、タグ md8657 の Software RAID 仮 想 デバイスにマウントされたファイルシステムリソース tests/mirror0 で構 成 されています。この仮 想 デバイスは、2 つのコンポーネント 、mdComponent8660 お よび mdComponent8918 を持 つ RAID-1 (ミラー) です。これらのコンポーネントは、異 なるデバイスタイプ 上 のパーティション上 に設 定 されています。1 つは、CCISS リカバリキット (CCISS_device8884) で、1 つ はデフォルト の SCSI リカバリキット (device9142) を使 用 しています。階 層 内 の、各 ディスクパーティション 配 下 には、ディスクデバイス、CCISS_disk8699 および disk9061 があります。階 層 には、各 階 層 の最 下 部 を、単 一 のリソースに接 続 するために「ターミナルリソース」を含 むことができます。ターミナルリソース の詳 細 については、後 述 のベスト プラクティスセクションのターミナルリソースを参 照 してください。
Chapter 4: Software RAID 階 層 の作 成 と管 理
図 5: Software RAID リソースを含 む LifeKeeper 階 層
mdComponent リソースが、配 下 のデバイスと同 一 の ID を持 っていることに注 目 してくださ
い。LifeKeeper 階 層 では例 外 的 です。このようになっているのは、mdComponent が、仮 想 デバイス内 の各 コンポーネント の状 態 を Software RAID Recovery Kit を使 用 してに表 示 できるようにするリソース であるためです。
階 層 作 成 の手 順
図 6: Software RAID リソースを含 む LifeKeeper 階 層
図 6: Software RAID リソースを含 む LifeKeeper 階 層 は、ソフトウェア RAID で LVM を使 用 した階 層 を 示 しています。
階 層 作 成 の手 順
ファイルシステムまたは高 レベルアプリケーションがソフト ウェア RAID の仮 想 デバイスを使 用 する階 層 を 作 成 するには、次 の高 レベル手 順 に従 う必 要 があります。 1. 仮 想 デバイスに必 要 な設 定 を決 定 します。このとき、その仮 想 デバイスに関 連 するすべてのディ スクリソースを、LifeKeeper クラスタ内 のサーバ間 で一 緒 に移 動 させる必 要 があることを考 慮 して ください。 2. アプリケーションのプライマリサーバとするシステム上 で、mdadm(8) を使 用 して必 要 な仮 想 デバイ スを作 成 します。mdadm(8) については、mdadm パッケージで提 供 され、前 述 のド キュメンテーシ ョンとリファレンスセクションにある Linux Software RAID HowTo および mdadm(8) オンラインマニュ アルページで説 明 されています。仮 想 デバイスを作 成 するときは、パーシステント スーパーブロック を使 用 する必 要 があります。詳 細 については、上 述 のパーシステント スーパーブロックを参 照 して ください。 3. 共 有 スト レージを使 用 する場 合 、仮 想 デバイスのすべてのコンポーネント が、保 護 されたアプリ ケーションが実 行 される LifeKeeper クラスタ内 のマシン間 で正 しく共 有 されていることを確 認 して ください。4. 各 仮 想 デバイス上 でファイルシステムを作 成 してください。raw I/O を使 用 する場 合 は、raw デバ イスを各 仮 想 デバイスにバインド してください。
5. 使 用 するアプリケーションに関 連 する LifeKeeper リカバリキット 管 理 ガイド に記 載 されている設 定 手 順 に従 い、保 護 されたアプリケーションをファイルシステム上 で設 定 します。
Software RAID の再 設 定 6. 適 切 なリカバリキット 管 理 ガイド に記 載 の手 順 に従 って、アプリケーション階 層 を作 成 および拡 張 します。
Software RAID の再 設 定
Software RAID を利 用 する一 番 のメリット の 1 つは、スト レージ要 件 の変 化 に応 じて、仮 想 デバイスを 動 的 に追 加 、削 除 、サイズ変 更 できることです。これは、仮 想 デバイス定 義 への物 理 パーティションや ディスクの追 加 または削 除 を伴 う場 合 があるため、Software RAID Recovery Kit には、そのような変 更 内 容 を反 映 して、既 存 のリソース階 層 を修 正 する仕 組 みが含 まれています。変 更 内 容 を反 映 して LifeKeeper 階 層 を修 正 する前 に、すべての仮 想 デバイスとファイルシステムの再 設 定 を LifeKeeper 階 層 の外 部 で行 う必 要 があります。その方 法 については、ド キュメンテーションとリフ ァレンスセクションで紹 介 する Software RAID HowTo ド キュメントを参 照 してください。いずれかの手 順 において、LifeKeeper で保 護 されているリソースをマウント解 除 または設 定 解 除 する必 要 が生 じた場 合 、必 ず LifeKeeper GUI から Out-of-Service 操 作 を選 択 して行 ってください。
これらの変 更 後 に LifeKeeper 階 層 を更 新 するには、まず、変 更 した md リソースの [Resource
Properties] ダイアログを開 きます。このダイアログは、md リソースを右 クリックするか、[Properties] を選 択 するか、[Edit] > [Resource] > [Properties] メニューを選 択 し、 [Select Resource] フィールド で適 切 な md リソースを選 択 することで開 けます。[Resource Properties] ダイアログは、以 下 の図 7: Software RAID の [Resource Properties] ダイアログ 図 7: Software RAID の [Resource Properties] ダイアログの ように表 示 されます。図 に示 すように、下 部 に [Status] および [Reconfigure] ボタンがあります。
Software RAID の再 設 定
図 7: Software RAID の [Resource Properties] ダイアログ
[Status] ボタンをクリックすると、仮 想 デバイスの現 在 の状 態 を示 す情 報 ボックスが表 示 されます。図 8: Software RAID の状 態 (下 図 ) は、すべてのコンポーネント が正 常 に動 作 している場 合 の仮 想 デバイス の状 態 を示 しています。
Software RAID の再 設 定 図 8: Software RAID の状 態 [Reconfigure] ボタンをクリックすると、階 層 を再 設 定 して、仮 想 デバイスリソースに加 えられた変 更 を反 映 するための仕 組 みが開 始 されます。少 し待 つと、情 報 ボックスに LifeKeeper が検 出 した変 更 内 容 が 表 示 されます。 次 の 3 つの図 に、デバイスを仮 想 デバイスから削 除 した際 に表 示 される、状 態 と設 定 を示 す情 報 ボッ クスを示 します。
Software RAID の再 設 定
Software RAID の再 設 定 図 10: 削 除 されたデバイスの Software RAID の再 設 定 情 報 ボックスの説 明 にあるように、検 出 された変 更 内 容 を反 映 して LifeKeeper 仮 想 デバイスを再 設 定 するには、単 に [Reconfigure] ボタンをクリックしてください。LifeKeeper 階 層 の変 更 をキャンセルする 場 合 、[Cancel].をクリックしてください。 [Reconfigure] ボタンをクリックした後 、再 設 定 手 順 の進 捗 状 況 を示 す情 報 ボックスが表 示 されます (以 下 の図 11: 削 除 されたデバイスの再 設 定 が完 了 した Software RAID 参 照 )。処 理 が正 常 に完 了 する と、[Done] ボタンが有 効 になります。[Done] ボタンをクリックすると、情 報 ボックスが閉 じ、[Resource Properties] ダイアログが開 きます。
Software RAID の再 設 定
図 11: 削 除 されたデバイスの再 設 定 が完 了 した Software RAID
次 の 4 つの図 に、デバイスを仮 想 デバイスに追 加 した際 に表 示 される、状 態 と設 定 を示 す情 報 ボック スを示 します。
Software RAID の再 設 定
Software RAID の再 設 定
図 13: 追 加 されたデバイスの再 設 定 が完 了 した Software RAID コンポーネント を仮 想 デバイスに設 定 する間 、[Status] に同 期 の進 捗 状 況 が表 示 されます。
Software RAID の再 設 定
Software RAID の修 復 図 15: 再 同 期 中 の LifeKeeper 階 層
Software RAID の修 復
ミラーのいずれかのレッグに障 害 が発 生 した場 合 、そのレッグを修 復 できます。 問 題 が発 生 した場 合 、そのリソースは OSF とマーキングされます。(注 記 : 有 効 な場 合 、E メール通 知 が行 われます。)Software RAID の修 復 図 16: 障 害 が発 生 したコンポーネントを含 む LifeKeeper 階 層 mdComponent は、ディスクが正 常 なときに OSF とマーキングされることがありますが、そのコンポーネント はミラーでは「faulty」とマーキングされます。これは、デバイスがオンラインになった際 に mdadm によって検 知 された何 らかの問 題 (詳 細 についてはエラーログを参 照 ) や、mdadm ユーティリティを使 用 してミラー を「中 断 」した手 動 動 作 などによって発 生 することがあります。
mdComponent と配 下 のディスク / デバイスは、in-service 動 作 中 にエラーが発 生 した場 合 、OSF とマー キングすることができます。たとえば、仮 想 デバイスを起 動 した際 にディスクが「壊 れていた」場 合 や、物 理 的 に接 続 されていなかった場 合 です。 以 下 のスクリーンショット は、あるアレイ障 害 について、アレイに障 害 が発 生 する前 の状 態 と、障 害 の 1 次 処 置 によって状 態 が「failed」になり、それを in service に戻 すまでを示 しています。(これらのスクリーン ショット には、「ターミナルリソース」を使 用 して各 階 層 の最 下 部 を単 一 のリソースに接 続 する例 が含 ま れています。)
Software RAID の修 復
Software RAID の修 復
図 18 - アレイ障 害 後
アレイ障 害 の 1 次 処 置 後 、すべてのリソースは OSF とマーキングされます。この障 害 の間 、IO は正 常 なコンポーネント またはミラーのレッグを引 き続 き使 用 します。
Software RAID の修 復
Software RAID の修 復 図 20 - 障 害 の発 生 したコンポーネントをスタンバイに更 新 エラー処 置 中 に、障 害 の発 生 したコンポーネント がミラー設 定 から正 しく削 除 されると、リソースは OSU に移 行 します。これは、障 害 発 生 後 に MD quickCheck が実 行 されるときに行 われます。障 害 が発 生 したコンポーネント を処 置 中 にミラー設 定 から削 除 できない場 合 、リソースは OSF 状 態 のままになりま す。
Software RAID の修 復
図 21 - リストアされたストレージリソース
スト レージの障 害 を修 復 するためなど、障 害 が発 生 した状 態 でサーバを再 起 動 する必 要 がある場 合 、障 害 が発 生 したコンポーネント 配 下 のスト レージリソースは (正 常 に修 復 された場 合 ) リストアされ ますが、障 害 が発 生 したコンポーネント はミラーに自 動 的 には再 追 加 されません。障 害 の発 生 したコン ポーネント を (GUI または perform_action(1M) を使 用 して) in-service にすることで、そのコンポーネントを 再 追 加 できます。これにより、IO がレッグに再 接 続 されます。その後 、内 部 ビットマップが設 定 されている
Software RAID の修 復
場 合 はミラーにより部 分 的 な再 同 期 を実 行 され、設 定 されていない場 合 はミラーにより完 全 な再 同 期 が実 行 されます。
図 22: Software RAID の In-Service 状 態
障 害 の発 生 したレッグが仮 想 デバイス内 で手 作 業 で修 復 された場 合 、LifeKeeper はその変 更 内 容 を quickCheck の実 行 時 に自 動 的 に検 出 します。リソースの状 態 は、その新 しい状 態 を反 映 して変 化 し ます。しかし、コンポーネント 配 下 のリソース (すなわちデバイスやディスク) に障 害 が発 生 した場 合 、それ らの状 態 は更 新 されません。これらの状 態 を更 新 するには、GUI または perform_action(1M) を使 用 し てリソースを in-service にする必 要 があります。
Software RAID の修 復
Software RAID の修 復 重 要 : リソースが OSF にマーキングされる障 害 、特 に、リソースが (sendevent により) 別 のシ ステムに移 動 される障 害 が発 生 したとき、そのリソースが修 復 されていることを管 理 者 が確 認 してから、障 害 の発 生 したリソースを in-service にすることが重 要 です。 その一 例 は、すべてのパスが失 われた場 合 の MD kit です。ミラーへのすべてのパスが失 わ れた場 合 、MD kit は、ミラーをスタンバイシステムに移 動 することで復 旧 します。キットは、ス タンバイシステム上 でパスを in-service にする前 に、障 害 が発 生 したシステム上 の階 層 のす べての部 分 をクリーンアップ (削 除 ) します。しかし、多 くの場 合 、これらの部 分 またはリソー スを完 全 にクリーンアップすることは、障 害 によって不 可 能 です。 管 理 者 が障 害 を修 復 するとき、管 理 者 は、その他 残 りの OS 項 目 がすべてクリーンアップさ れていることを確 認 する必 要 があります。障 害 の発 生 したミラーにマウント されたファイルシス テムがある場 合 、このファイルシステムをマウント 解 除 できない場 合 がほとんどです。そのた め、LifeKeeper がファイルシステムをスタンバイシステムに移 動 しても、障 害 が発 生 したシス テムではファイルシステムが (mount コマンド により) マウントされているものとして表 示 されま す。これは、後 で管 理 者 が LifeKeeper ファイルシステム階 層 を修 復 後 のシステムに戻 すと きに問 題 になります。 管 理 者 は、障 害 の発 生 したパスを修 復 するだけではなく、階 層 のすべての部 分 がクリーン アップされていること (MD デバイスが未 設 定 で、ファイルシステムがマウントされておらず、アプ リケーションが完 全 に停 止 しているなど) を確 認 する必 要 があります。クリーンな再 起 動 は、 階 層 のすべての側 面 がクリーンアップされるために必 要 です。
Chapter 5: ベスト プラクティス
ターミナルリソース
ミラーのすべてのコンポーネント に障 害 が発 生 したときに見 られる障 害 を回 避 するため、ターミナルリソー ス (またはインスタンスもしくはリーフノード ) を作 成 することを推 奨 します。このターミナルリソースは、ミラー のすべてのコンポーネント (レッグ) を単 一 点 に接 続 するために使 用 される「gen app」リソースです。この ターミナルインスタンスは、いくつかの理 由 で役 立 ちます。 l すべてのコンポーネント を 1 つずつ選 択 する代 わりに、階 層 全 体 を out of service にする単 一 点 が提 供 されます。 l これは、あるノード 上 では階 層 の一 部 がアクティブで、別 のノード 上 ではまた一 部 がアクティブで あるという、混 乱 した過 渡 状 況 の発 生 を防 止 します。これは、階 層 をサーバ間 で移 動 する際 に 特 に見 られます。移 動 が完 了 すると、すべてのリソースが同 じサーバ上 に置 かれますが、L-ifeKeeper がすべてを移 動 している最 中 は、表 示 がおかしくなることがあります。 l LifeKeeper はリソースをシステム間 で迅 速 に移 動 しようとしているにもかかわらず (すべてのパスの 障 害 )、クラスタ障 害 によってリソースの起 動 処 理 が遅 い場 合 のエラー状 況 を防 ぎます。これによ り、LifeKeeper は、1 つのノード を out of service にしてそのコンポーネントを in service にしてか ら、次 のコンポーネント を out of service にしてそのコンポーネントを in service にするといったやり 方 ではなく、すべてのリソースを一 度 に out of service にします。ターミナルリソースは、[Create Resource Hierarchy] オプションで作 成 します。表 示 される [Create Resource Wizard] で、[Recovery Kit] リスト から [Generic Application] を選 択 します。
ターミナルリソースの作 成 方 法 については、SPS for Linux Technical Documentation
(http://docs.us.sios.com/の LifeKeeper>Administration>Administrator Tasks> Creating Resource Hierarchies > Creating a Generic Application Resource Hierarchy) を参 照 してください。
MD デバイス番 号
MD デバイスをクラスタ内 のノード 上 に設 定 する場 合 、MD デバイスを LifeKeeper で使 用 または制 御 し ない場 合 でも、クラスタ内 で一 意 の MD 番 号 を使 用 してください。
すべての MD デバイスの In Service 化
クラスタ内 に NetRAID リソースを作 成 するとき、クラスタ内 に設 定 されたすべての MD デバイスを NetRAID デバイスが設 定 されたノード 上 で in-service にする必 要 があります。これにより、NetRAID が 既 存 の MD デバイスと重 複 しない MD 番 号 を使 用 できます。この作 業 を行 わない場 合 、MD kit は、 次 の in-service 動 作 で重 複 する MD リソースに使 用 される番 号 を並 び替 えます。
Chapter 6: ト ラブルシューティング
エラーメッセージ
このセクションでは、SPS Software RAID Recovery Kit の使 用 中 に表 示 される可 能 性 のあるメッセージ の一 覧 を示 します。必 要 に応 じて、エラーの原 因 およびエラー状 態 を解 消 するために必 要 な処 置 につ いても説 明 しています。
Software RAID Recovery Kit は、階 層 の作 成 および拡 張 時 に他 の SPS コンポーネント を利 用 するた め、それらの他 のコンポーネント によるメッセージが表 示 されることもあります。その場 合 、メッセージカタロ グ (テクニカルド キュメンテーション Web サイトの「エラーコード の検 索 」内 ) を参 照 してください。メッセージ カタログでは、操 作 、管 理 、GUI など、SteelEye Protection Suite for Linux を使 用 しているときに表 示 される可 能 性 がある、すべてのエラーコード の一 覧 を示 します。また、エラーコード の原 因 に関 する追 加 の説 明 や、問 題 解 決 のために必 要 な処 置 についても、必 要 に応 じて記 載 します。この一 覧 から、受 信 したエラーコード を検 索 できます。また、該 当 する SPS コンポーネントの個 別 のメッセージカタログに直 接 アクセスすることもできます。
Software RAID Recovery Kit のエラーメッセージ
エラー番 号
エラーメッセージ
117000
<resource type> resource type is not installed on <LifeKeeper server name> 処 置 : MD Recovery Kit を特 定 されたシステムにインストールしてください。 117001 This script must be executed on <LifeKeeper server name>
117002 Failed to create <device name> hierarchy
117003 Failed to create dependency <resource tag>-<resource tag> on machine <LifeKeeper server name>
117004 LifeKeeper internal ID <resource ID> already in use 117005 <resource type> constructor requires a valid argument