• 検索結果がありません。

5. CLUSTERPROとの連携

5.2. カスタムモニタリソースによる CLUSTERPRO との連携

(1) CLUSTERPROとの連携について

ディスク装置の動作状態をモニタするコマンド srgstat(1M) をCLUSTERPROの カスタムモニタリソースとして登録することで、ディスク装置の障害時のノードダウン、

ノード切り替えを実現します。

本機能を利用する場合は、不必要にCLUSTERPRO のサーバ管理プロセス (clpnm) を killしないためにStorageSaverのコンフィグレーション(srg.config)の

VG_FAULT_ACTIONVG_STALL_ACTIONにはACTION_NONEを指定してください。

この方式であれば、複数ノードクラスタシステムでのノード切り替えだけでなく 縮退した状態でのノードダウンや1ノードのクラスタシステムでのノードダウンを 実現できますので、非常に有用な手法です。

【プロセスモデル】

フェイルオーバ グループ

監視デーモン clpnm clprm clprc 等

VGの状態を 定期監視

srgping srgd

管理コマンド srgadmin

SG ファイル リクエスト

Test フェイルオーバ

グループ

カスタムモニタ リソース

srgstat

ディスク装置障害時には

srgstatが終了し、

ノード切り替えを行う

CLUSTERPRO

69

(2) srgstatの運用について

ディスク装置に障害が発生すると、srgd(1M)がI/OパスおよびVGレベルの管理ステータスを down状態に変更し、syslog、コンソールにエラーメッセージを出力します。

srgstat(1M)は共有メモリを経由してVGレベルの管理ステータスをモニタします。

VGがdown状態に遷移した時点で、srgstat(1M)は異常終了し、CLUSTERPROがカスタムモニタリソー スのダウンを検出しノード切り替え、ノードダウンが発生します。

srgstat(1M)は、srgd(1M)およびsrgping(1M)のプロセスが起動され、ディスク装置の 監視を行っている場合に有効に機能します。

以下のようなリソース監視を停止している場合は、VG障害を検出できません。

- srgd(1M)およびsrgping(1M)のプロセスが起動されていない。

- srgadmin(1M)のオペレーション操作でリソース監視停止を指示されている。

<syslogメッセージの出力例>

LVMかつシングルディスク構成での事例です。

下記の順序でsyslogにメッセージが出力されます。

ディスク装置へのファイルI/Oが停止すると、syslogに記録されない場合もあります。

● 最初に、I/Oパスの片系障害(正系LUN障害)を検出

Jan 10 18:03:28 node1 srgd[xxxxx]: PV status change fail .

[hwpath = pci-0000:1a:00.1-fc-0x2001000013840322:0x0000000000000000: s.f = /dev/sdb]

● 次に、I/Oパスの両系障害(副系LUN障害)を検出

Jan 10 18:05:29 node1 srgd[xxxxx]: PV status change fail .

[hwpath = pci-0000:1a:00.0-fc-0x2002000013840322:0x0000000000000000: s.f = /dev/sdc]

Jan 10 18:05:29 node1 srgd[xxxxx]: VG status change down .(vg=VolGroup01)

● VGへのアクセス不可を検出し、srgstatが異常終了しノードダウン、ノード切り替えを実行 Jan 10 18:05:29 node1 srgstat[xxxxx]: found VG status is down

70

(3) カスタムモニタリソースの設定手順について

srgstatをCLUSTERPROのカスタムモニタリソースに登録する手順については、後述の

“10.4 カスタムモニタリソースによる CLUSTERPRO との連携手順"

を参照してください。

71

5.3. CLUSTERPRO の サ ー バ 管 理 プ ロ セ ス (clpnm) の 強 制 終 了 に よ る

関連したドキュメント