SIOS Protection Suite for Linux
MD Recovery Kit
v8.3.0
管 理 ガイド
本 書 およびその内 容 は SIOS Technology Corp. (旧 称 SteelEye® Technology, Inc.) の所 有 物 であり、許 可 なき使 用 および複 製 は禁 止 されています。SIOS Technology Corp. は本 書 の内 容 に関 していかなる保 証 も 行 いません。また、事 前 の通 知 なく本 書 を改 訂 し、本 書 に記 載 された製 品 に変 更 を加 える権 利 を保 有 して います。SIOS Technology Corp. は、新 しい技 術 、コンポーネント、およびソフトウェアが利 用 可 能 になるのに 合 わせて製 品 を改 善 することを方 針 としています。そのため、SIOS Technology Corp. は事 前 の通 知 なく仕 様 を変 更 する権 利 を留 保 します。
LifeKeeper、SteelEye、および SteelEye DataKeeper は SIOS Technology Corp. の登 録 商 標 です。
本 書 で使 用 されるその他 のブランド 名 および製 品 名 は、識 別 のみを目 的 として使 用 されており、各 社 の商 標 が含 まれています。 出 版 物 の品 質 を維 持 するために、弊 社 は本 書 の正 確 性 、明 瞭 性 、構 成 、および価 値 に関 するお客 様 のご 意 見 を歓 迎 いたします。 以 下 の宛 先 に電 子 メールを送 信 してください。 [email protected] Copyright © 2014
By SIOS Technology Corp. San Mateo, CA U.S.A. All rights reserved
目次
Chapter 1: はじめに
1
Software RAID (md) Recovery Kit ド キュメンテーション 1
ド キュメント の内 容 1 ド キュメンテーションとリファレンス 1
Chapter 2: 要件
3
ハード ウェア要 件 3 ソフト ウェア要 件 3Chapter 3: 概要
5
Software RAID (md) による処 理 5LifeKeeper for Linux Software RAID (md) Recovery Kit 7 Software RAID Recovery Kit の注 意 事 項 と制 約 事 項 8
起 動 中 の仮 想 デバイスのアクティベート 8 パーシステント スーパーブロック 8 HOMEHOST 8 Homehost セット を使 用 せずに MD デバイスを再 作 成 する 9 RAID レベルのサポート 9 スペアのサポート 9 Raw I/O および全 ディスクのサポート 10 仮 想 デバイスのパーティショニング 10 MD_ASSEMBLE_OPTIONS 10
Chapter 4: Software RAID 階層の作成と管理
11
階 層 作 成 の手 順 14
Software RAID の再 設 定 15
Software RAID の修 復 24
ターミナルリソース 33
MD デバイス番 号 33
すべての MD デバイスの In Service 化 33
Chapter 6: ト ラブルシューティング
35
エラーメッセージ 35
Chapter 1: はじめに
Software RAID (md) Recovery Kit ドキュメンテーション
SIOS Protection Suite (SPS) for Linux Software RAID (md) Recovery Kit は、他 の LifeKeeper リカバリキット に、ソフト ウェア RAID サポートを提 供 します。これにより、LifeKeeper で保 護 されたアプリケーションは、低 コスト なデータ冗 長 性 、SAN を介 したデータレプリケーション、およびストレージ管 理 の簡 略 化 といった、ソフトウェア RAID のメリット を活 用 できます。
Software RAID Recovery Kit は、単 体 で使 用 されることがなく、他 の LifeKeeper リソースに依 存 して使 われる 点 で、他 のほとんどの LifeKeeper リカバリキットと異 なります。そのため、LifeKeeper リカバリキットに通 常 付 随 す る多 くの作 業 (階 層 の作 成 など) は、Software RAID Recovery Kit に直 接 該 当 しません。
ドキュメント の内 容
このガイド では次 の事 項 について説 明 します。
l ド キュメンテーションとリファレンス。関 連 する LifeKeeper for Linux のド キュメントと、その入 手 場 所 、Linux Software RAID 製 品 に関 する多 数 の役 立 つド キュメント の参 照 情 報 の一 覧 を記 載 します。
l 要 件。Software RAID Recovery Kit を適 切 に設 定 、インストール、運 用 する上 で必 要 なハード ウェアと ソフト ウェアを説 明 します。LifeKeeper for Linux ソフトウェアをインストールまたはアンインストールする方 法 の詳 細 については、SPS for Linux インストールガイド を参 照 してください。
l 概 要。Software RAID Recovery Kit と対 応 するリソースタイプの概 要 を説 明 します。
l LifeKeeper Software RAID 階 層 の作 成 と管 理。LifeKeeper による Software RAID Recovery Kit の管 理 作 業 の詳 細 を説 明 します。
l ト ラブルシューティング。情 報 メッセージとエラーメッセージ、および推 奨 される対 処 方 法 の一 覧 を示 しま す。
ドキュメンテーションとリファレンス
以 下 の SPS 製 品 ド キュメンテーションは、SIOS Technology Corp. の Web サイトから入 手 できます。 l SPS for Linux リリースノート
l SPS for Linux テクニカルド キュメンテーション l Optional Recovery Kit ド キュメンテーション
このド キュメンテーション、およびオプションの LifeKeeper Recovery Kit 関 連 のド キュメンテーションは、次 に示 す SIOS Technology Corp の Web サイト から入 手 できます。
ド キュメンテーションとリファレンス
http://docs.us.sios.com/
Linux Software RAID に関 する情 報 については、md(4) および mdadm(8) のマニュアルの内 容 と、HowTo (Jakob Østergaard および Emilio Bueso、管 理 人 、URL:
Chapter 2: 要件
LifeKeeper for Linux Software RAID (md) Recovery Kit をインスト ールする前 に、LifeKeeper の設 定 が次 の要 件 を満 たしている必 要 があります。お使 いの LifeKeeper ハード ウェアおよびソフトウェアの設 定 に関 する具 体 的 な手 順 については、SPS for Linux インストールガイド を参 照 してください。ハードウェア要 件
l サーバ。このリカバリキット を使 用 するには、SIOS テクニカルド キュメンテーションサイト (
http://-docs.us.sios.com/) にある SPS for Linux リリースノート および SPS for Linux インスト ールガイド に記 載 の 要 件 に従 って設 定 されたコンピュータが 2 台 以 上 必 要 です。
l データスト レージ。Software RAID Recovery Kit は、共 有 ストレージと併 用 できます。Network Attached Storage (NAS) と合 わせて使 用 することはできません。その他 、RAID デバイス上 のアプリケーションを保 護 しているリカバリキット の要 件 を超 えるような、スト レージ設 定 に関 する特 別 な要 件 はありません。
ソフト ウェア要 件
l オペレーティングシステム。Linux Software RAID 製 品 は、すべての主 要 Linux ディストリビューションに含 まれています。サポート されているディスト リビューションとバージョンについては、SPS for Linux リリースノー ト を参 照 してください。
l mdadm(8) ユーティリティ。 リカバリキット をインスト ールするには、mdadm rpm パッケージがインスト ールされ ている必 要 があります。サポート される mdadm のバージョンは、Linux ディストリビューションで提 供 される バージョンです。
l LifeKeeper ソフト ウェア。各 サーバに同 一 のバージョンの LifeKeeper Core ソフト ウェア、Software RAID Recovery Kit を含 む任 意 のリカバリキット 、およびパッチをインスト ールする必 要 があります。具 体 的 な LifeKeeper の要 件 については、SPS for Linux リリースノート を参 照 してください。
l LifeKeeper for Linux Software RAID (md) Recovery Kit。Software RAID Recovery Kit は、SPS イ ンスト ールイメージファイル (sps.img) で提 供 されます。これは、Red Hat Package Manager (rpm) を使 用 してパッケージ、インスト ール、およびアンインスト ールします。steeleye-lkMD という rpm ファイルが SPS イ ンスト ールイメージファイル (sps.img) で提 供 されます。
パッケージのインスト ール中 、サポート 対 象 バージョンの LifeKeeper Core パッケージと mdadm パッケージの両 方 が、Software RAID Recovery Kit をインストールするシステム上 にあることの確 認 が行 われます。これらのパッケー ジに要 求 されるバージョンについては、SPS for Linux リリースノートを参 照 してください。
LifeKeeper Core ソフト ウェアおよび Software RAID Recovery Kit をインスト ールまたは削 除 する手 順 について は、SPS for Linux インストールガイド を参 照 してください。
ソフト ウェア要 件
Software RAID Recovery Kit は、md を使 用 した Software RAID により LifeKeeper で保 護 するディスクリソース を管 理 するクラスタ内 の各 サーバ上 にインスト ールする必 要 があります。
Software RAID Recovery Kit は、RAID デバイス上 に配 置 されるアプリケーションの階 層 を作 成 および拡 張 する 前 に行 うインスト ールする必 要 があります。
Chapter 3: 概要
Software RAID (md) による処 理
Multiple Device ド ライバ (md) は、現 在 、主 要 な Linux ディスト リビューションすべてに含 まれている標 準 の Linux Software RAID 製 品 です。Linux Software RAID を使 用 すると、複 数 の物 理 ディスクやディスクパーティションをグ ループ化 して、仮 想 デバイスを構 成 できます。仮 想 デバイスは、標 準 のブロックデバイスとしてアクセスできます。 そのため、ブロックデバイスを直 接 扱 うことのできるファイルシステムや任 意 のアプリケーションによって使 用 できま す。
Software RAID は、主 に、ハード ウェア RAID (またはスト レージレプリケーション) が現 実 的 ではないか、実 現 不 可 能 である場 合 にデータの冗 長 性 を提 供 します。次 の図 は、Software RAID エンティティ間 の関 係 を示 してい ます。ファイルシステムまたはアプリケーションは、仮 想 デバイスを使 用 します。仮 想 デバイスは、1 つ以 上 の物 理 ディスクパーティションまたはディスクの集 合 です。
Software RAID (md) による処 理
Figure 1: Software RAID エンティティ間 の関 係
以 下 の図 2 において、書 き込 みは、シングルパスミラー内 の両 方 のアレイに書 き込 まれます。これは、高 価 なス ト レージレプリケーションの代 替 となる MD の第 一 の機 能 です。
LifeKeeper for Linux Software RAID (md) Recovery Kit
図 2:シングルパスの MD の設 定
LifeKeeper for Linux Software RAID (md) Recovery Kit
LifeKeeper Software RAID (md) Recovery Kit は、その他 の LifeKeeper リカバリキット が Linux Software RAID 仮 想 デバイスと正 常 に連 携 するために必 要 なサポート を提 供 します。このサポート を実 現 するために、Software RAID Recovery Kit は、2 つの新 しいリソースタイプ、md および mdComponent をインスト ールします。これらは、 仮 想 デバイスと、仮 想 デバイス内 に設 定 された各 パーティションまたはディスクに対 応 しています。md と
mdComponent リソースは、LifeKeeper リソースを動 作 できるようにするという、内 部 的 な目 的 のためのみに存 在 しています。
mdComponent リソースを使 用 すると、Software RAID Recovery Kit は、仮 想 デバイス内 の各 個 別 コンポーネン ト の状 態 を提 示 できます。
Software RAID Recovery Kit の注 意 事 項 と制 約 事 項 ISP – コンポーネント は、仮 想 デバイス内 で正 しく設 定 されており、正 常 に動 作 しています。 ISU – コンポーネント はスペアデバイスです。デバイスが仮 想 デバイスにホット 追 加 された場 合 、デバイスが リスト ア中 にもスペアとして反 応 することに注 意 してください。 OSU – コンポーネント は、仮 想 デバイス内 に設 定 されていません。これは、コンポーネント が仮 想 デバイス から削 除 された場 合 に発 生 することがあります。仮 想 デバイスに障 害 の発 生 したコンポーネント があり、 設 定 解 除 (停 止 ) し、再 設 定 (アセンブル) すると、その障 害 の発 生 したコンポーネントは、設 定 済 みのデ バイスとしては表 示 されません。つまり、障 害 が発 生 したデバイスとして表 示 されるのではなく、未 設 定 の デバイスとして表 示 されます。 OSF – コンポーネント に障 害 が発 生 しています。注 記 : この状 態 でメール通 知 を受 け取 る場 合 、lk_ confignotifyalias(8) を使 用 してこのオプションを有 効 にします。 図 1 に示 すように、仮 想 デバイス md0 は、2 つのディスクパーティション、sda1 と c1d0p1 で構 成 されています。こ れは、RAID-1 ミラーを反 映 している可 能 性 があります。仮 想 デバイスを含 む一 般 的 な LifeKeeper 階 層 は、図 1 に示 す関 係 に非 常 に近 いようです。実 際 の LifeKeeper 階 層 の例 については、LifeKeeper Software RAID 階 層 の作 成 と管 理セクションの図 4 を参 照 してください。
Software RAID Recovery Kit は、mdadm パッケージで提 供 される mdadm(8) コマンド を使 用 して、LifeKeeper 階 層 内 の仮 想 デバイスリソースを管 理 します。仮 想 デバイスは、フェイルオーバやスイッチオーバ動 作 中 に階 層 が InService になったときに設 定 (またはアセンブル) され、階 層 が Out of Service のときは設 定 解 除 (または停 止 ) されます。
Software RAID Recovery Kit の注 意 事 項 と制 約 事 項
以 下 の注 意 事 項 と制 約 事 項 は、本 バージョンの Software RAID Recovery Kit に適 用 されます。
起 動 中 の仮 想 デバイスのアクティベート
共 有 スト レージ上 の仮 想 デバイスは、システムの起 動 中 にアクティベート してはなりません。パーシステント スーパーブロック
全 ての仮 想 デバイスは、パーシステント スーパーブロックで構 成 する必 要 があります。このスーパーブロックの長 さは 4K で、デバイスの終 端 から 64K 以 上 128K 未 満 で開 始 する 64K で整 列 されたブロックとして書 き込 まれます。 この空 間 は、アプリケーションで使 用 することができないため、仮 想 デバイスのプランニング時 に考 慮 する必 要 が あります。注 記 : MD は、「内 部 」機 能 を使 用 してビットマップで設 定 できるようになりました。これにより、既 に必 須 であるスーパーブロック内 にビット マップが作 成 されるため、追 加 の空 間 、追 加 の LUN、または追 加 のファイル システムは必 要 ありません。ビット マップは階 層 に表 示 されることなく、単 に「自 動 的 に」使 用 されます。詳 細 につ いては、ド キュメンテーションとリファレンスセクションに記 載 されている、mdadm(8) と md(4) のマニュアルページを参 照 してください。HOMEHOST
新 しいバージョンの mdadm に搭 載 されている HOMEHOST 機 能 は、LifeKeeper ではサポートされていません。 ミラーが HOMEHOST セットを使 用 して設 定 されている場 合 、LifeKeeper はリソースの作 成 時 にエラーとなりま す。
図 3: ファイルシステム階 層 作 成 のエラー 図 3: ファイルシステム階 層 作 成 のエラーに示 すように、次 のメッセージ が表 示 されます。
Homehost セット を使 用 せずに MD デバイスを再 作 成 する
「The MD device "/dev/md5" is configured with the unsupported "homehost" setting.」 「Recreate the MD device without homehost set.」
図 3: ファイルシステム階 層 作 成 のエラー
Homehost セット を使 用 せずに MD デバイスを再 作 成 する
MD デバイスを再 作 成 するには、「--homehost=''」の設 定 を次 のように使 用 する必 要 があります。 mdadm --create /dev/md5 --level=1 --raid-devices=2 /dev/sde1 /dev/sdf1 --homehost=''
RAID レベルのサポート
サポート される RAID レベルは、リニア、RAID 0 (ストライピング)、RAID 1 (ミラーリング)、RAID 10 (ストライプトミ ラー) です。
スペアのサポート
スペアコンポーネント は、特 定 の仮 想 デバイスの要 素 としてサポート されています。「spare-group」はサポートされ ていません。
Raw I/O および全 ディスクのサポート
Raw I/O および全 ディスクのサポート
概 要 概 要 は、ファイルシステム配 下 にある仮 想 デバイスを示 しています。Software RAID Recovery Kit を LifeKeeper Raw I/O Recovery Kit と組 み合 わせて使 用 した場 合 、仮 想 デバイスへの raw アクセスをサポート 可 能 であることは重 要 です。このとき、1 つ以 上 のディスクパーティション (例 : /dev/sdc1) ではなく、1 つ以 上 の全 ディ スク (例 : /dev/sdc) で構 成 される仮 想 デバイスを管 理 できます。
仮 想 デバイスのパーティショニング
Linux Software RAID は、仮 想 デバイスの直 接 パーティショニングをサポート していません。個 人 によって、パー ティショニングのサポート を追 加 する試 みがいくつかなされましたが、md ド ライバの管 理 人 はこれを許 可 しません でした。直 接 パーティショニングの代 わりに、上 述 のド キュメンテーションとリファレンスのSoftware RAID HowTo セクションでは、LVM の使 用 を推 奨 しています。Software RAID 階 層 の作 成 と管 理 は、LVM を使 用 した階 層 を示 しています。
MD_ASSEMBLE_OPTIONS
本 バージョンの Software RAID Recovery Kit では、パラメータ “--run” は、ラーをアセンブル (開 始 ) するために使 用 する mdadm コマンド から除 外 されています。このパラメータは、mdadm がコンポーネントの状 態 を把 握 できな い一 部 のエラー状 況 において必 要 になります。この不 確 かさにより、データが壊 れる可 能 性 があるため、デフォル ト では、このパラメータはもう使 用 されません。in service の強 制 ミラーが試 行 される前 は、エラーは次 のように表 示 されます。
Tue Apr 27 11:46:02 EDT 2010 restore:BEGIN restore of "md23051" on server "shrek.sc.steeleye.com" Tue Apr 27 11:46:06 EDT 2010 restore: start: mdadm: failed to add /dev/sdc1 to /dev/md1:Invalid argument mdadm:/dev/md1 assembled from 0 drives - not enough to start the array
推 奨 はしませんが、このパラメータは、MD_ASSEMBLE_OPTIONS=--run のように LifeKeeper のデフォルトに追 加 することで使 用 できます (これで、アセンブル時 に毎 回 使 用 されるようになります)。 その代 わりに、クラスタ内 の ログを確 認 して最 も良 いデータを持 つコンポーネント /レッグを特 定 し、mdadm を使 用 して手 動 でミラーをアセンブ ルすることを推 奨 します。
注 記 : 一 部 のシステム (RHEL 6 を実 行 しているシステムなど) では、起 動 時 に自 動 的 にミラーを開 始 する設 定 ファイル (/etc/mdadm.conf) に AUTO エントリがあります (例 :AUTO +imsm +1.x –all)。LifeKeeper では、ミラーを 自 動 的 に開 始 しないようにする必 要 があるので、このエント リを編 集 し、起 動 時 に自 動 的 に開 始 しないように 指 定 する必 要 があります。前 の例 (AUTO +imsm +1.x –all) は、imsm メタデータおよび 1.x メタデータから他 のす べてを除 いたものを使 用 して作 成 したミラーを自 動 的 に開 始 するようにシステムに指 示 しています。このエント リ を「AUTO -all」に変 更 し、あらゆるもの「マイナス」すべてを自 動 的 に開 始 するように (つまり、何 も自 動 的 に開 始 されないように) システムに通 知 する必 要 があります。重 要 :クリティカルなシステムリソース (root など) が MD を使 用 している場 合 、それらのミラーが他 の方 法 で開 始 され、LifeKeeper で保 護 されているミラーは開 始 されないこ とを確 認 してください。
Chapter 4: Software RAID 階層の作成と管理
LifeKeeper Software RAID 階 層 は、仮 想 デバイス上 に配 置 されるリソースの作 成 処 理 中 に自 動 的 に作 成 さ れます。Software RAID リソースタイプを含 む階 層 の作 成 と拡 張 は、常 に、より高 位 のリソースタイプの作 成 およ び拡 張 プロセスから開 始 されます。削 除 と拡 張 解 除 についても同 様 です。図 4 は、Software RAID リソースを含 む階 層 全 体 を示 す LifeKeeper GUI のスクリーンショットです。階 層 内 のリ ソースは、LifeKeeper タグが表 示 される、デフォルト表 示 で表 示 されています。図 5 は、同 じ階 層 を LifeKeeper ID で表 示 したものです。
Chapter 4: Software RAID 階 層 の作 成 と管 理
図 4:Software RAID リソースを含 む LifeKeeper 階 層
図 4 に示 される階 層 はファイルシステム階 層 です。これは、[Edit] > [Server] > [Create Resource Hierarchy] メ ニューから [File System] リカバリキットを選 択 して作 成 されます。これは、タグ md8657 の Software RAID 仮 想 デバイスにマウント されたファイルシステムリソース tests/mirror0 で構 成 されています。この仮 想 デバイスは、2 つの コンポーネント 、mdComponent8660 および mdComponent8918 を持 つ RAID-1 (ミラー) です。これらのコンポーネ ント は、異 なるデバイスタイプ上 のパーティション上 に設 定 されています。1 つは、CCISS リカバリキット (CCISS_ device8884) で、1 つはデフォルト の SCSI リカバリキット (device9142) を使 用 しています。階 層 内 の、各 ディスク パーティション配 下 には、ディスクデバイス、CCISS_disk8699 および disk9061 があります。階 層 には、各 階 層 の 最 下 部 を、単 一 のリソースに接 続 するために「ターミナルリソース」を含 むことができます。ターミナルリソースの詳 細 については、ベスト プラクティスセクションのターミナルリソースを参 照 してください。
Chapter 4: Software RAID 階 層 の作 成 と管 理
図 5:Software RAID リソースを含 む LifeKeeper 階 層
mdComponent リソースが、配 下 のデバイスと同 一 の ID を持 っていることに注 目 してください。LifeKeeper 階 層 で は例 外 的 です。このようになっているのは、mdComponent が、仮 想 デバイス内 の各 コンポーネントの状 態 を Software RAID Recovery Kit を使 用 して表 示 できるようにするリソースであるためです。
階 層 作 成 の手 順
図 6:Software RAID リソースを含 む LifeKeeper 階 層 上 の図 6 は、ソフトウェア RAID で LVM を使 用 した階 層 を示 しています。
階 層 作 成 の手 順
ファイルシステムまたは高 レベルアプリケーションがソフト ウェア RAID の仮 想 デバイスを使 用 する階 層 を作 成 する には、次 の高 レベル手 順 に従 う必 要 があります。 1. 仮 想 デバイスに必 要 な設 定 を決 定 します。このとき、その仮 想 デバイスに関 連 するすべてのディスクリソー スを、LifeKeeper クラスタ内 のサーバ間 で一 緒 に移 動 させる必 要 があることを考 慮 してください。 2. アプリケーションのプライマリサーバとするシステム上 で、mdadm(8) を使 用 して必 要 な仮 想 デバイスを作 成 します。mdadm(8) については、mdadm パッケージで提 供 され、前 述 のド キュメンテーションとリファレン スセクションにある Linux Software RAID HowTo および mdadm(8) オンラインマニュアルページで説 明 され ています。仮 想 デバイスを作 成 するときは、パーシステント スーパーブロックを使 用 する必 要 があります。詳 細 については、上 述 のパーシステント スーパーブロックを参 照 してください。3. 共 有 スト レージを使 用 する場 合 、仮 想 デバイスのすべてのコンポーネント が、保 護 されたアプリケーション が実 行 される LifeKeeper クラスタ内 のマシン間 で正 しく共 有 されていることを確 認 してください。
4. 各 仮 想 デバイス上 でファイルシステムを作 成 してください。raw I/O を使 用 する場 合 は、raw デバイスを各 仮 想 デバイスにバインド してください。
5. 使 用 するアプリケーションに関 連 する LifeKeeper リカバリキット 管 理 ガイド に記 載 されている設 定 手 順 に 従 い、保 護 されたアプリケーションをファイルシステム上 で設 定 します。
Software RAID の再 設 定
Software RAID の再 設 定
Software RAID を利 用 する一 番 のメリット の 1 つは、スト レージ要 件 の変 化 に応 じて、仮 想 デバイスを動 的 に 追 加 、削 除 、サイズ変 更 できることです。これは、仮 想 デバイス定 義 への物 理 パーティションやディスクの追 加 ま たは削 除 を伴 う場 合 があるため、Software RAID Recovery Kit には、そのような変 更 内 容 を反 映 して、既 存 のリソース階 層 を修 正 する仕 組 みが含 まれています。
変 更 内 容 を反 映 して LifeKeeper 階 層 を修 正 する前 に、すべての仮 想 デバイスとファイルシステムの再 設 定 を LifeKeeper 階 層 の外 部 で行 う必 要 があります。その方 法 については、ド キュメンテーションとリファレンスセクション で紹 介 する Software RAID HowTo ド キュメントを参 照 してください。いずれかの手 順 において、LifeKeeper で保 護 されているリソースをマウント 解 除 または設 定 解 除 する必 要 が生 じた場 合 、必 ず LifeKeeper GUI から Out-of-Service 操 作 を選 択 して行 ってください。
これらの変 更 後 に LifeKeeper 階 層 を更 新 するには、まず、変 更 した md リソースの [Resource Properties] ダ イアログを開 きます。このダイアログは、md リソースを右 クリックするか、[Properties] を選 択 するか、[Edit] > [Resource] > [Properties] メニューを選 択 し、 [Select Resource] フィールド で適 切 な md リソースを選 択 する ことで開 けます。[Resource Properties] ダイアログは、以 下 の図 7:Software RAID の [Resource
Properties] ダイアログのように表 示 されます。図 に示 すように、下 部 に [Status] および [Reconfigure] ボタンが あります。
Software RAID の再 設 定
図 7:Software RAID の [Resource Properties] ダイアログ
[Status] ボタンをクリックすると、仮 想 デバイスの現 在 の状 態 を示 す情 報 ボックスが表 示 されます。図 8:Software RAID の状 態 (下 図 ) は、すべてのコンポーネント が正 常 に動 作 している場 合 の仮 想 デバイスの状 態 を示 してい ます。
Software RAID の再 設 定 図 8:Software RAID の状 態 [Reconfigure] ボタンをクリックすると、階 層 を再 設 定 して、仮 想 デバイスリソースに加 えられた変 更 を反 映 する ための仕 組 みが開 始 されます。少 し待 つと、情 報 ボックスに LifeKeeper が検 出 した変 更 内 容 が表 示 されま す。 次 の 3 つの図 に、デバイスを仮 想 デバイスから削 除 した際 に表 示 される、状 態 と設 定 を示 す情 報 ボックスを示 します。
Software RAID の再 設 定
Software RAID の再 設 定
図 10:削 除 されたデバイスの Software RAID の再 設 定
情 報 ボックスの説 明 にあるように、検 出 された変 更 内 容 を反 映 して LifeKeeper 仮 想 デバイスを再 設 定 するに は、単 に [Reconfigure] ボタンをクリックしてください。LifeKeeper 階 層 の変 更 をキャンセルする場 合 、[Cancel]. をクリックしてください。
[Reconfigure] ボタンをクリックした後 、再 設 定 手 順 の進 捗 状 況 を示 す情 報 ボックスが表 示 されます (以 下 の図 11:削 除 されたデバイスの再 設 定 が完 了 した Software RAID 参 照 )。処 理 が正 常 に完 了 すると、[Done] ボタ ンが有 効 になります。[Done] ボタンをクリックすると、情 報 ボックスが閉 じ、[Resource Properties] ダイアログが 開 きます。
Software RAID の再 設 定
図 11:削 除 されたデバイスの再 設 定 が完 了 した Software RAID
次 の 4 つの図 に、デバイスを仮 想 デバイスに追 加 した際 に表 示 される、状 態 と設 定 を示 す情 報 ボックスを示 し ます。
Software RAID の再 設 定
Software RAID の再 設 定
図 13:追 加 されたデバイスの再 設 定 が完 了 した Software RAID コンポーネント を仮 想 デバイスに設 定 する間 、[Status] に同 期 の進 捗 状 況 が表 示 されます。
Software RAID の再 設 定
Software RAID の修 復 図 15:再 同 期 中 の LifeKeeper 階 層
Software RAID の修 復
ミラーのいずれかのレッグに障 害 が発 生 した場 合 、そのレッグを修 復 できます。 問 題 が発 生 した場 合 、そのリソースは OSF とマーキングされます。(注 記 : 有 効 な場 合 、E メール通 知が行 われ ます。)Software RAID の修 復 図 16: 障 害 が発 生 したコンポーネントを含 む LifeKeeper 階 層 mdComponent は、ディスクが正 常 なときに OSF とマーキングされることがありますが、そのコンポーネント はミラー では「faulty」とマーキングされます。これは、デバイスがオンラインになった際 に mdadm によって検 知 された何 らか の問 題 (詳 細 についてはエラーログを参 照 ) や、mdadm ユーティリティを使 用 してミラーを「中 断 」した手 動 動 作 などによって発 生 することがあります。
mdComponent と配 下 のディスク / デバイスは、in-service 動 作 中 にエラーが発 生 した場 合 、OSF とマーキング することができます。たとえば、仮 想 デバイスを起 動 した際 にディスクが「壊 れていた」場 合 や、物 理 的 に接 続 さ れていなかった場 合 です。
以 下 のスクリーンショット は、あるアレイ障 害 について、アレイに障 害 が発 生 する前 の状 態 と、障 害 の 1 次 処 置 によって状 態 が「failed」になり、それを in service に戻 すまでを示 しています。(これらのスクリーンショットには、 「ターミナルリソース」を使 用 して各 階 層 の最 下 部 を単 一 のリソースに接 続 する例 が含 まれています。)
Software RAID の修 復
Software RAID の修 復
図 18 - アレイ障 害 後
アレイ障 害 の 1 次 処 置 後 、すべてのリソースは OSF とマーキングされます。この障 害 の間 、IO は正 常 なコンポー ネント またはミラーのレッグを引 き続 き使 用 します。
Software RAID の修 復
Software RAID の修 復
図 20 - 障 害 の発 生 したコンポーネントをスタンバイに更 新
エラー処 置 中 に、障 害 の発 生 したコンポーネント がミラー設 定 から正 しく削 除 されると、リソースは OSU に移 行 します。これは、障 害 発 生 後 に MD quickCheck が実 行 されるときに行 われます。障 害 が発 生 したコンポーネン ト を処 置 中 にミラー設 定 から削 除 できない場 合 、リソースは OSF 状 態 のままになります。
Software RAID の修 復 図 21 - リストアされたストレージリソース スト レージの障 害 を修 復 するためなど、障 害 が発 生 した状 態 でサーバを再 起 動 する必 要 がある場 合 、障 害 が 発 生 したコンポーネント 配 下 のスト レージリソースは (正 常 に修 復 された場 合 ) リストアされますが、障 害 が発 生 したコンポーネント はミラーに自 動 的 には再 追 加 されません。障 害 の発 生 したコンポーネント を (GUI または perform_action(1M) を使 用 して) in-service にすることで、そのコンポーネント を再 追 加 できます。これによ り、IO がレッグに再 接 続 されます。その後 、内 部 ビットマップが設 定 されている場 合 はミラーにより部 分 的 な再 同 期 を実 行 され、設 定 されていない場 合 はミラーにより完 全 な再 同 期 が実 行 されます。
Software RAID の修 復
図 22: Software RAID の In-Service 状 態
障 害 の発 生 したレッグが仮 想 デバイス内 で手 作 業 で修 復 された場 合 、LifeKeeper はその変 更 内 容 を
quickCheck の実 行 時 に自 動 的 に検 出 します。リソースの状 態 は、その新 しい状 態 を反 映 して変 化 します。し かし、コンポーネント 配 下 のリソース (すなわちデバイスやディスク) に障 害 が発 生 した場 合 、それらの状 態 は更 新 されません。これらの状 態 を更 新 するには、GUI または perform_action(1M) を使 用 してリソースを in-service にする必 要 があります。
Software RAID の修 復
図 23: Software RAID In-Service に成 功 した状 態
重 要 : リソースが OSF にマーキングされる障 害 、特 に、リソースが (sendevent により) 別 のシステムに 移 動 される障 害 が発 生 したとき、そのリソースが修 復 されていることを管 理 者 が確 認 してから、障 害 の発 生 したリソースを in-service にすることが重 要 です。 その一 例 は、すべてのパスが失 われた場 合 の MD kit です。ミラーへのすべてのパスが失 われた場 合 、MD kit は、ミラーをスタンバイシステムに移 動 することで復 旧 します。キットは、スタンバイシステム 上 でパスを in-service にする前 に、障 害 が発 生 したシステム上 の階 層 のすべての部 分 をクリーンアッ プ (削 除 ) します。しかし、多 くの場 合 、これらの部 分 またはリソースを完 全 にクリーンアップすること は、障 害 によって不 可 能 です。 管 理 者 が障 害 を修 復 するとき、管 理 者 は、その他 残 りの OS 項 目 がすべてクリーンアップされている ことを確 認 する必 要 があります。障 害 の発 生 したミラーにマウント されたファイルシステムがある場 合 、このファイルシステムをマウント 解 除 できない場 合 がほとんどです。そのため、LifeKeeper がファイ ルシステムをスタンバイシステムに移 動 しても、障 害 が発 生 したシステムではファイルシステムが (mount コマンド により) マウント されているものとして表 示 されます。これは、後 で管 理 者 が LifeKeeper ファイルシステム階 層 を修 復 後 のシステムに戻 すときに問 題 になります。 管 理 者 は、障 害 の発 生 したパスを修 復 するだけではなく、階 層 のすべての部 分 がクリーンアップされ ていること (MD デバイスが未 設 定 で、ファイルシステムがマウントされておらず、アプリケーションが完 全 に停 止 しているなど) を確 認 する必 要 があります。クリーンな再 起 動 は、階 層 のすべての側 面
Chapter 5: ベスト プラクティス
ターミナルリソース
ミラーのすべてのコンポーネント に障 害 が発 生 したときに見 られる障 害 を回 避 するため、ターミナルリソース (また はインスタンスもしくはリーフノード ) を作 成 することを推 奨 します。このターミナルリソースは、ミラーのすべてのコン ポーネント (レッグ) を単 一 点 に接 続 するために使 用 される「gen app」リソースです。このターミナルインスタンスは、 いくつかの理 由 で役 立 ちます。 l すべてのコンポーネント を 1 つずつ選 択 する代 わりに、階 層 全 体 を Out of Service にする単 一 点 が提 供 されます。 l これは、あるノード 上 では階 層 の一 部 がアクティブで、別 のノード 上 ではまた一 部 がアクティブであるとい う、混 乱 した過 渡 状 況 の発 生 を防 止 します。これは、階 層 をサーバ間 で移 動 する際 に特 に見 られま す。移 動 が完 了 すると、すべてのリソースが同 じサーバ上 に置 かれますが、LifeKeeper がすべてを移 動 し ている最 中 は、表 示 がおかしくなることがあります。 l LifeKeeper はリソースをシステム間 で迅 速 に移 動 しようとしているにもかかわらず (すべてのパスの障 害 )、クラスタ障 害 によってリソースの起 動 処 理 が遅 い場 合 のエラー状 況 を防 ぎます。これにより、LifeKeeper は、1 つのノード を Out of Service にしてそのコンポーネントを In Service にしてから、次 の コンポーネント を Out of Service にしてそのコンポーネントを In Service にするといったやり方 ではなく、すべ てのリソースを一 度 に Out of Service にします。
ターミナルリソースは、[Create Resource Hierarchy] オプションで作 成 します。表 示 される [Create Resource Wizard] で、[Recovery Kit] リスト から [Generic Application] を選 択 します。
ターミナルリソースの作 成 方 法 については、SPS for Linux テクニカルド キュメンテーションのGeneric Application リソース階 層 の作 成セクションを参 照 してください (http://docs.us.sios.com/の LifeKeeper > Administration > Administrator Tasks > Creating Resource Hierarchies > Creating a Generic Application Resource Hierarchy)。
MD デバイス番 号
MD デバイスをクラスタ内 のノード 上 に設 定 する場 合 、MD デバイスを LifeKeeper で使 用 または制 御 しない場 合 でも、クラスタ内 で一 意 の MD 番 号 を使 用 してください。すべての MD デバイスの In Service 化
クラスタ内 に NetRAID リソースを作 成 するとき、クラスタ内 に設 定 されたすべての MD デバイスを NetRAID デバ イスが設 定 されたノード 上 で in-service にする必 要 があります。これにより、NetRAID が既 存 の MD デバイスと 重 複 しない MD 番 号 を使 用 できます。この作 業 を行 わない場 合 、MD kit は、次 の in-service 動 作 で重 複 する MD リソースに使 用 される番 号 を並 び替 えます。Chapter 6: ト ラブルシューティング
エラーメッセージ
このセクションでは、SPS Software RAID Recovery Kit の使 用 中 に表 示 される可 能 性 のあるメッセージの一 覧 を示 します。必 要 に応 じて、エラーの原 因 およびエラー状 態 を解 消 するために必 要 な処 置 についても説 明 して います。
Software RAID Recovery Kit は、階 層 の作 成 および拡 張 時 に他 の SPS コンポーネント を利 用 するため、それ らの他 のコンポーネント によるメッセージが表 示 されることもあります。その場 合 、メッセージカタログ (テクニカルド キュメンテーション Web サイトの「エラーコード の検 索 」内 ) を参 照 してください。メッセージカタログでは、操 作 、管 理 、GUI など、SIOS Protection Suite for Linux を使 用 しているときに表 示 される可 能 性 がある、すべてのエラー コード の一 覧 を示 します。また、エラーコード の原 因 に関 する追 加 の説 明 や、問 題 解 決 のために必 要 な処 置 に ついても、必 要 に応 じて記 載 します。この一 覧 から、受 信 したエラーコード を検 索 できます。また、該 当 する SPS コンポーネント の個 別 のメッセージカタログに直 接 アクセスすることもできます。
Software RAID Recovery Kit のエラーメッセージ
エラー番 号
エラーメッセージ
117000
<resource type> resource type is not installed on <LifeKeeper server name> 処 置 : MD Recovery Kit を特 定 されたシステムにインストールしてください。 117001 This script must be executed on <LifeKeeper server name>
117002 Failed to create <device name> hierarchy
117003 Failed to create dependency <resource tag>-<resource tag> on machine <LifeKeeper server name>
117004 LifeKeeper internal ID <resource ID> already in use 117005 <resource type> constructor requires a valid argument