共有ディスクシステムの運用 - CLUSTERPRO for Linux システム構築ガイド

9.1.1 サーバダウンからの復帰

障害が発生したサーバは、自動的にサブクラスタから切り離された状態になります。必要とする保守作業は、この状態のうちに行ってください。

サーバのプロパティで自動復帰モードが設定されていない場合には、障害を取り除いた再起動直後のサーバは、『ダウン後再起動状態』になります。この状態から、クラスタとして機能できる正常な状態に戻すためには、CLUSTERPROマネージャよりサーバの復帰を実行する必要があります。以下のいずれかの操作で、サーバの復帰を行ってください。

サーバの復帰により、障害を起こしたサーバのコンフィグレーション情報の不整合を修復し、

正常なクラスタ運用に戻します。

・サーバ名を選択した上で、[操作]-[ｻｰﾊﾞの復帰]選択

・サーバを右クリックすると表示される[ｻｰﾊﾞの復帰]を選択

・サーバを選択した上で、ツールバーよりアイコン選択：

ただし、この段階では、復帰されたサーバをプライマリサーバとするフェイルオーバグループは移動可能な別サーバで動作しています。フェイルオーバグループの移動、またはクラスタ再立ち上げによりプライマリサーバで起動されます。

9.1.2 全サーバダウンからの復帰

ハードウェア障害などで、すべてのサーバがクラスタから切り離された状態にある場合、

CLUSTERPROマネージャより、サーバの強制復帰を行って、元のクラスタに復帰させる必要があります。

以下のいずれかの操作を行ってください。

(1) 1台のサーバに「サーバの強制復帰」を行い、残りのサーバに「サーバの復帰を実施」

- サーバ名を選択した上で、[操作]－[ｻｰﾊﾞの強制復帰]選択

- -サーバを右クリックすると表示される[ｻｰﾊﾞの強制復帰]を選択

- サーバを選択した上で、ツールバーよりアイコン選択：

残りのサーバに対して、「4.1.1 サーバダウンからの復帰」の手順を行ってください。

(*1) 強制復帰を行ったサーバの構成情報が、クラスタの構成情報として使用されます。

ハードウェア不良が発生していない信頼できるサーバを強制復帰させるようにしてください。

(*2) 強制復帰を行ったサーバの構成情報が破壊されていた場合、クラスタとして正しく動作しなくなります。

サーバの強制復帰を行った直後は、フェイルオーバグループはすべて停止した状態です。フェイルオーバグループを起動させてください。

(2) 「クラスタの復帰」の実施

CLUSTERPROが強制復帰すべきサーバを判断し、そのサーバに対する強制復帰と残りのサーバの復帰を一度に行います。

- サブクラスタ名を選択した上で、[操作]－[クラスタの復帰]を選択 - サブクラスタを右クリックすると表示される。[クラスタの復帰]を選択 - サブクラスタを選択した上で、ツールバーよりアイコンを選択

9.1.3 障害サーバの交換

CLUSTERPROをインストールしたサーバは、起動時にブロードキャストを行い、自分が登録されたスーパークラスタ管理サーバを探します。スーパークラスタ管理サーバから応答があれば、自分のサーバに関する構成情報を読み込みます。

そのため、サーバ内のCLUSTERPROに関する構成情報が不正状態になったとしても、次の起動時にはスーパークラスタ管理サーバから構成情報を読み込むため、不正状態は解消されます。

ホスト名とIPアドレスが、スーパークラスタ管理サーバの情報と一致していれば、スーパークラスタ管理サーバから構成情報の読み込みを行います。

この機能を利用すると、障害サーバの交換を行うことができます。

(1) SEの場合

(1) ハードウェアの故障などでサーバを取り替えたとき、OSやネットワークの設定を以前と同一にします。

(2) 新しくしたサーバにCLUSTERPROをセットアップします。「システム構築ガイドクラスタ生成ガイド共有ディスク編」の以下を参照してください。

CLUSTERPROサーバのセットアップ

- CLUSTERPROサーバのインストール

- インストール後の設定

・スタートアップの状態変更

・ネットワークの確認

・OSブート時間の調整

・OSの再起動

・ローダブルモジュールの確認 (2) LEの場合

(1) ハードウェアの故障などでサーバを取り替えたとき、OSやネットワークの設定を以前と同一にします。

(2) 新しくしたサーバにCLUSTERPROをセットアップします。「システム構築ガイドクラスタ生成ガイドミラーディスク編」の以下を参照してください。

CLUSTERPROサーバのセットアップ

- CLUSTERPROサーバのインストール

- インストール後の設定

・ミラー対象ディスクのパーティション分割

・スタートアップの状態変更

・ネットワークの確認

・OSの再起動

・ローダブルモジュールの確認

以上の手順により、CLUSTERPROの設定に関しては、自動的にサーバ交換前の設定に戻ります。手動で新たに再設定する必要はありません。

9.1.4 共有ディスク交換時のリストア手順

共有ディスク交換時のリストア手順です。

交換前の共有ディスクからバックアップ媒体へセーブを行った後、以下の作業を実施してください。

(1) ディスク交換前、交換するディスクが接続されているサブクラスタ内のどれか1台のサーバで、armstartupコマンドでCLUSTERPROのユーザモードモジュールと kernelモジュールを起動しない設定に変更する。

(2) CLUSTERPROマネージャから、交換するディスクが接続されているサブクラスタ

のクラスタシャットダウンを行う。

共有ディスクを交換する。

交換したディスクの電源をOnにして、手順1でCLUSTERPROのモジュールが起動しない設定にしたサーバを起動する。

(3) 共有ディスク上のパーティションの設定、ファイルシステムの構築などを行う。

ここから手順7までは通常の外付けディスクと同じように扱うことができる。

(4) バックアップ媒体からリストアする。

(5) 手順1のサーバでarmstartupでCLUSTERPROのユーザモードモジュール、kernel モジュール共に自動起動に設定する。

(6) 手順1 のサーバをシャットダウンする。

(7) 交換したディスクが接続されているサブクラスタ内のサーバをすべて起動する。以降、サブクラスタとして正常に使用できる。

armstartupコマンドについてはクラスタ生成ガイドを参照してください。

9.1.5 共有ディスク保守時の注意事項

共有ディスクの保守を行う場合は、対象となる共有ディスクが接続されているサブクラスタについて、CLUSTERPROのユーザモードモジュールとkernelモジュールを起動しない設定に変更し、クラスタシャットダウンを行ってから実施してください。

サービスの停止方法は armstartupコマンドを参照してください。

9.1.6 サーバの保守

フェイルオーバ型クラスタでは、メモリ追加などのサーバ保守は片方のサーバずつアップグレード(ローリングアップグレード)することでシステム停止時間を最小限にとどめることが可能です。

以下の手順で行います。

(1) 待機系サーバの切り離し

CLUSTERPROマネージャから、待機系サーバを選択しサーバ切り離しを行います。

(2) 待機系サーバをサーバシャットダウン

(3) 待機系サーバにメモリ追加などを行い、再起動します。

(4) 待機系サーバの復帰

CLUSTERPROマネージャで、待機系サーバを選択しサーバ復帰を行います。

(5) フェイルオーバグループ移動

CLUSTERPROマネージャで、運用系サーバで動作しているフェイルオーバグループを、待機系サーバへ移動します。

(6) 現用系サーバの切り離し

(7) 現用系サーバのサーバシャットダウン

(8) 現用系サーバにメモリを追加などを行い、再起動します。

(9) 現用系サーバの復帰

(10) フェイルオーバグループ移動

CLUSTERPROマネージャで、待機系サーバで動作しているフェイルオーバグループを、現用用系サーバへ移動します。

<注意>

ソフトウェアのローリングアップグレードは現用系と待機系でソフトウェアリビジョンが変わることによる弊害が考えられます。

共有ディスク上のデータの互換性など問題が無いことが分かっている場合以外は行わないでください。

ドキュメント内 CLUSTERPRO for Linux システム構築ガイド (ページ 53-58)