5. CLUSTERPROとの連携
5.2. カスタムモニタリソースによる CLUSTERPRO との連携
(1) CLUSTERPROとの連携について
ディスク装置の動作状態をモニタするコマンド srgstat(1M) をCLUSTERPROの カスタムモニタリソースとして登録することで、ディスク装置の障害時のノードダウン、
ノード切り替えを実現します。
本機能を利用する場合は、不必要にCLUSTERPRO のサーバ管理プロセス (clpnm) を killしないためにStorageSaverのコンフィグレーション(srg.config)の
VG_FAULT_ACTION、VG_STALL_ACTIONにはACTION_NONEを指定してください。
この方式であれば、複数ノードクラスタシステムでのノード切り替えだけでなく 縮退した状態でのノードダウンや1ノードのクラスタシステムでのノードダウンを 実現できますので、非常に有用な手法です。
【プロセスモデル】
フェイルオーバ グループ
監視デーモン clpnm clprm clprc 等
VGの状態を 定期監視
srgping srgd
管理コマンド srgadmin
SG ファイル リクエスト
Test フェイルオーバ
グループ
カスタムモニタ リソース
srgstat
ディスク装置障害時には
srgstatが終了し、
ノード切り替えを行う
CLUSTERPRO
69
(2) srgstatの運用について
ディスク装置に障害が発生すると、srgd(1M)がI/OパスおよびVGレベルの管理ステータスを down状態に変更し、syslog、コンソールにエラーメッセージを出力します。
srgstat(1M)は共有メモリを経由してVGレベルの管理ステータスをモニタします。
VGがdown状態に遷移した時点で、srgstat(1M)は異常終了し、CLUSTERPROがカスタムモニタリソー スのダウンを検出しノード切り替え、ノードダウンが発生します。
srgstat(1M)は、srgd(1M)およびsrgping(1M)のプロセスが起動され、ディスク装置の 監視を行っている場合に有効に機能します。
以下のようなリソース監視を停止している場合は、VG障害を検出できません。
- srgd(1M)およびsrgping(1M)のプロセスが起動されていない。
- srgadmin(1M)のオペレーション操作でリソース監視停止を指示されている。
<syslogメッセージの出力例>
LVMかつシングルディスク構成での事例です。
下記の順序でsyslogにメッセージが出力されます。
ディスク装置へのファイルI/Oが停止すると、syslogに記録されない場合もあります。
● 最初に、I/Oパスの片系障害(正系LUN障害)を検出
Jan 10 18:03:28 node1 srgd[xxxxx]: PV status change fail .
[hwpath = pci-0000:1a:00.1-fc-0x2001000013840322:0x0000000000000000: s.f = /dev/sdb]
● 次に、I/Oパスの両系障害(副系LUN障害)を検出
Jan 10 18:05:29 node1 srgd[xxxxx]: PV status change fail .
[hwpath = pci-0000:1a:00.0-fc-0x2002000013840322:0x0000000000000000: s.f = /dev/sdc]
Jan 10 18:05:29 node1 srgd[xxxxx]: VG status change down .(vg=VolGroup01)
● VGへのアクセス不可を検出し、srgstatが異常終了しノードダウン、ノード切り替えを実行 Jan 10 18:05:29 node1 srgstat[xxxxx]: found VG status is down
70
(3) カスタムモニタリソースの設定手順について
srgstatをCLUSTERPROのカスタムモニタリソースに登録する手順については、後述の
“10.4 カスタムモニタリソースによる CLUSTERPRO との連携手順"
を参照してください。
71