9.1.1 サーバダウンからの復帰
障害が発生したサーバは、自動的にサブクラスタから切り離された状態になります。必要と する保守作業は、この状態のうちに行ってください。
サーバのプロパティで自動復帰モードが設定されていない場合には、障害を取り除いた再起 動直後のサーバは、『ダウン後再起動状態』になります。この状態から、クラスタとして機能 できる正常な状態に戻すためには、CLUSTERPROマネージャよりサーバの復帰を実行する必 要があります。以下のいずれかの操作で、サーバの復帰を行ってください。
サーバの復帰により、障害を起こしたサーバのコンフィグレーション情報の不整合を修復し、
正常なクラスタ運用に戻します。
・サーバ名を選択した上で、[操作]-[サーバの復帰]選択
・サーバを右クリックすると表示される[サーバの復帰]を選択
・サーバを選択した上で、ツールバーよりアイコン選択:
ただし、この段階では、復帰されたサーバをプライマリサーバとするフェイルオーバグルー プは移動可能な別サーバで動作しています。フェイルオーバグループの移動、またはクラスタ 再立ち上げによりプライマリサーバで起動されます。
9.1.2 全サーバダウンからの復帰
ハードウェア障害などで、すべてのサーバがクラスタから切り離された状態にある場合、
CLUSTERPROマネージャより、サーバの強制復帰を行って、元のクラスタに復帰させる必要 があります。
以下のいずれかの操作を行ってください。
(1) 1台のサーバに「サーバの強制復帰」を行い、残りのサーバに「サーバの復帰を実施」
- サーバ名を選択した上で、[操作]-[サーバの強制復帰]選択
- -サーバを右クリックすると表示される[サーバの強制復帰]を選択
- サーバを選択した上で、ツールバーよりアイコン選択:
残りのサーバに対して、「4.1.1 サーバダウンからの復帰」の手順を行ってくだ さい。
(*1) 強制復帰を行ったサーバの構成情報が、クラスタの構成情報として使用されます。
ハードウェア不良が発生していない信頼できるサーバを強制復帰させるようにしてく ださい。
(*2) 強制復帰を行ったサーバの構成情報が破壊されていた場合、クラスタとして正しく動 作しなくなります。
サーバの強制復帰を行った直後は、フェイルオーバグループはすべて停止した状態です。フェ イルオーバグループを起動させてください。
(2) 「クラスタの復帰」の実施
CLUSTERPROが強制復帰すべきサーバを判断し、そのサーバに対する強制復帰と 残りのサーバの復帰を一度に行います。
- サブクラスタ名を選択した上で、[操作]-[クラスタの復帰]を選択 - サブクラスタを右クリックすると表示される。[クラスタの復帰]を選択 - サブクラスタを選択した上で、ツールバーよりアイコンを選択
9.1.3 障害サーバの交換
CLUSTERPROをインストールしたサーバは、起動時にブロードキャストを行い、自分が登 録されたスーパークラスタ管理サーバを探します。スーパークラスタ管理サーバから応答があ れば、自分のサーバに関する構成情報を読み込みます。
そのため、サーバ内のCLUSTERPROに関する構成情報が不正状態になったとしても、次の 起動時にはスーパークラスタ管理サーバから構成情報を読み込むため、不正状態は解消されま す。
ホスト名とIPアドレスが、スーパークラスタ管理サーバの情報と一致していれば、スーパー クラスタ管理サーバから構成情報の読み込みを行います。
この機能を利用すると、障害サーバの交換を行うことができます。
(1) SEの場合
(1) ハードウェアの故障などでサーバを取り替えたとき、OSやネットワークの設定を以 前と同一にします。
(2) 新しくしたサーバにCLUSTERPROをセットアップします。「システム構築ガイド クラスタ生成ガイド 共有ディスク編」の以下を参照してください。
CLUSTERPROサーバのセットアップ
- CLUSTERPROサーバのインストール
- インストール後の設定
・スタートアップの状態変更
・ネットワークの確認
・OSブート時間の調整
・OSの再起動
・ローダブルモジュールの確認 (2) LEの場合
(1) ハードウェアの故障などでサーバを取り替えたとき、OSやネットワークの設定を以 前と同一にします。
(2) 新しくしたサーバにCLUSTERPROをセットアップします。「システム構築ガイド クラスタ生成ガイド ミラーディスク編」の以下を参照してください。
CLUSTERPROサーバのセットアップ
- CLUSTERPROサーバのインストール
- インストール後の設定
・ミラー対象ディスクのパーティション分割
・スタートアップの状態変更
・ネットワークの確認
・OSの再起動
・ローダブルモジュールの確認
以上の手順により、CLUSTERPROの設定に関しては、自動的にサーバ交換前の設定に戻り ます。手動で新たに再設定する必要はありません。
9.1.4 共有ディスク交換時のリストア手順
共有ディスク交換時のリストア手順です。
交換前の共有ディスクからバックアップ媒体へセーブを行った後、以下の作業を実施してく ださい。
(1) ディスク交換前、交換するディスクが接続されているサブクラスタ内のどれか1台の サーバで、armstartupコマンドでCLUSTERPROのユーザモードモジュールと kernelモジュールを起動しない設定に変更する。
(2) CLUSTERPROマネージャから、交換するディスクが接続されているサブクラスタ
のクラスタシャットダウンを行う。
共有ディスクを交換する。
交換したディスクの電源をOnにして、手順1でCLUSTERPROのモジュールが起動 しない設定にしたサーバを起動する。
(3) 共有ディスク上のパーティションの設定、ファイルシステムの構築などを行う。
ここから手順7までは通常の外付けディスクと同じように扱うことができる。
(4) バックアップ媒体からリストアする。
(5) 手順1のサーバでarmstartupでCLUSTERPROのユーザモードモジュール、kernel モジュール共に自動起動に設定する。
(6) 手順1 のサーバをシャットダウンする。
(7) 交換したディスクが接続されているサブクラスタ内のサーバをすべて起動する。以 降、サブクラスタとして正常に使用できる。
armstartupコマンドについてはクラスタ生成ガイドを参照してください。
9.1.5 共有ディスク保守時の注意事項
共有ディスクの保守を行う場合は、対象となる共有ディスクが接続されているサブクラスタ について、CLUSTERPROのユーザモードモジュールとkernelモジュールを起動しない設定に 変更し、クラスタシャットダウンを行ってから実施してください。
サービスの停止方法は armstartupコマンドを参照してください。
9.1.6 サーバの保守
フェイルオーバ型クラスタでは、メモリ追加などのサーバ保守は片方のサーバずつアップグ レード(ローリングアップグレード)することでシステム停止時間を最小限にとどめることが可 能です。
以下の手順で行います。
(1) 待機系サーバの切り離し
CLUSTERPROマネージャから、待機系サーバを選択しサーバ切り離しを行います。
(2) 待機系サーバをサーバシャットダウン
(3) 待機系サーバにメモリ追加などを行い、再起動します。
(4) 待機系サーバの復帰
CLUSTERPROマネージャで、待機系サーバを選択しサーバ復帰を行います。
(5) フェイルオーバグループ移動
CLUSTERPROマネージャで、運用系サーバで動作しているフェイルオーバグルー プを、待機系サーバへ移動します。
(6) 現用系サーバの切り離し
(7) 現用系サーバのサーバシャットダウン
(8) 現用系サーバにメモリを追加などを行い、再起動します。
(9) 現用系サーバの復帰
(10) フェイルオーバグループ移動
CLUSTERPROマネージャで、待機系サーバで動作しているフェイルオーバグルー プを、現用用系サーバへ移動します。
<注意>
ソフトウェアのローリングアップグレードは現用系と待機系でソフト ウェアリビジョンが変わることによる弊害が考えられます。
共有ディスク上のデータの互換性など問題が無いことが分かっている 場合以外は行わないでください。