第8章 Sun Clusterシステム固有の手順
8.1 Sun Clusterシステムへの登録
51
2.9 各ノードで管理される情報の統一
Systemwalker Operation Managerがクラスタシステムで正常に動作するため には、各ノードで管理されている情報のいくつかを運用系と待機系の間で、統 一する必要があります。本節では、各ノードで統一する情報について以下の内 容で説明します。
OS情報の統一
Systemwalker Operation Managerの環境定義の統一
2.9.1 OS情報の統一
下記の情報は、運用系と待機系で同じにする必要があります。下記の情報を 変更する場合は、運用系、待機系の両方に対して、同じ変更を加えてください。
ユーザ名、パスワード、ユーザグループ
“hosts”ファイル
“services”ファイル
出口ファイル、バッチファイル、実行ファイル、データなどの、
Systemwalker Operation Managerから実行されるバッチ業務が必要とす るユーザ資源、ファイルシステム
2.9.2 Systemwalker Operation Managerの環境定義の統一
Systemwalker Operation Managerが管理する情報のうち、以下の情報は各ノ ードで別々に管理されています。このため、一方のノードで情報を変更しても、
クラスタを構成する他のノードには変更が反映されません。したがって、以下 の情報を追加・変更した場合は、運用系と待機系の間で情報を同じにするため に、変更した側のノードの定義情報を変更していない側のノードに複写してく ださい。
監視ホスト定義情報
複写する契機:
環境設定の、“監視ホスト情報の定義”で変更を行った場合 複写方法:
以下のファイルを、rcpなどのコマンドを利用して、他方のノードに 複写してください。
/var/opt/FJSVJMCMN/etc/monitor_hosts /var/opt/FJSVJMCMN/etc/*.mhs
パスワード管理簿情報/ホスト情報定義
複写する契機:
パスワード管理コマンドで、ユーザやグループの追加/削除/パスワー ドの変更を行った場合
52
2.9 各ノードで管理される情報の統一
または、ホスト情報ファイルを作成/更新した場合 複写方法:
以下のファイルを、rcpなどのコマンドを利用して、他方のノードに 複写してください。
/opt/FJSVsnjss/manage/*.*
ジョブフォルダ情報
複写する契機:
ジョブフォルダを追加した場合
ジョブフォルダ情報を含んだ資源をリストアした場合 環境設定の、“ポリシーの配付”を行った場合 複写方法:
ジョブフォルダに定義した、ディレクトリおよびそのディレクトリ配 下すべてを、rcpなどのコマンドを利用して他方のノードに複写してく ださい。
注意:
共有ディスクに存在するディレクトリをジョブフォルダに指定して いる場合は、複写する必要はありません。
N:1運用待機、および2ノード相互待機の場合、クラスタシステムに複 数の運用系が存在します。クラスタシステム内に複数の運用系が存在す る場合、以下の点を注意してください。
- 監視ホスト定義情報、パスワード管理簿情報、ホスト情報定義、
およびジョブフォルダ情報は、すべての運用系で同じにしてくだ さい。各運用系で異なる情報を定義することはできません。
53
2.10 ジョブを再起動させる設定
スケジュールサーバと実行サーバがともに同じクラスタシステム上で運用 されている場合、フェールオーバ時に実行中だったジョブネットおよびジョブ は、フェールオーバ完了後に異常終了(実行中断状態:終了コード=239)として 表示されます。
フェールオーバ時に実行中断されたジョブネットやジョブの再実行等のリ カバリ処理は、自動的には行われません。異常終了を確認後、再起動等の対処 を行ってください。
フェールオーバ後も運用を継続するためには、以下のような動作を行うジョ ブを作成し、このジョブを、サーバ起動時に実行するジョブネットとして登録 してください。登録するジョブネットには、必ず起動日を設定してください。
起動日を設定していない場合、ジョブネットはフェールオーバ後に起動しませ ん。
1. jobschprint -n コマンドでジョブネット状態一覧を出力する。出力結 果をファイルにリダイレクトして保存する。
2. 1.で保存したファイルを読み込み、ジョブネットの状態が実行中断かど うかをチェックする。実行中断かどうかは、終了コードが239かどうか で判断する。
3. 実行中断ジョブネットの場合、そのジョブネットをjobschcontrol rerun コマンドで再起動する。
4. ジョブネット一覧の数だけ、2.3.を繰り返す。
この処理のサンプルソースは以下に格納されています。
/opt/FJSVJOBSC/sample/abendrerun.c
jobschprintコマンド、jobschcontrolコマンドの詳細は、“Systemwalker Operation Manager リファレンスマニュアル”を参照してください。
54
2.11 クラスタシステムからのアンインストール
55
2.11 クラスタシステムからのアンインストール
クラスタシステムからSystemwalker Operation Managerをアンインストール する手順は、各クラスタシステムの固有情報で説明します。
SafeCLUSTERシステムからアンインストールする。
→“4.2 SafeCLUSTERシステムからのアンインストール”参照