3. サーバ監視
3.3 異常時の自動復旧(ASR&R) コンソールPC 対象サーバ
iRMCには、ServerView Agentsと連携しOS稼働監視などを行うASR&R(Automatic Server Reconfiguration &
Restart)があります。OSがハングアップなどで異常停止している際自動的に再起動しますが、OS異常停止の 検知にはServerView Agentsの導入が必須です。本項の手順は、管理コンソール用PCで行います。
• ASR&Rの自動復旧設定
ServerView ASR&R
ASR&R 概要図
【起動監視の設定例】
サーバの起動が一定時間かかった場合は再起動(注1)。 ここでは、「10分経過した場合」とします。
【死活監視の設定例】
サーバ運用中にOSが無応答状態になった場合は再起動(注1)。 ここでは、「5分経過した場合」とします。
システム停止 起動に10分経過
電源ON 再起動
OSが無応答になって5分経過
運用中 再起動
運用時間帯
OSが無応答
(注1) ASR&Rの設定と併せて、各ウォッチドッグの設定が必要です。
ASR&Rの自動復旧設定
ASR&Rを用いることで、システムの異常を検知する だけではなく、自動的にサーバを再起動するなど、
管 理 者 不 在 で あ っ て も シ ス テ ム の 運 用 効 率 化 が 図れます。
1. ASR&Rの設定をします。「設定」-「サーバ管理 情報」ページを開きます。
「ASR&Rオプション」を展開します。
2. ASR&Rの設定値を入力し、「適用」をクリック します。
ASR&R
起動間隔 サーバが再起動する前の遅延 時間(1~30分)
リトライ カウンタ 最大値
ASR&R契機発生後、サーバに 許可する最大リスタート回数
(0~7)
リトライ
カウンタ 重大なエラー発生後に、サーバ が施行するリスタート施行回数 サイクル間隔 パワー 電源オンからオフまでの間の
間隔(7~15秒)
BIOSの
自動書換 起 動 時 に B I O S を 自 動 で 書 き 換える機能
温度異常時に
電源オン 温度が限界値に達した時に、
電源が入らないようにする機能
ブートウォッチドッグは、サーバが起動してから ServerView Agentsが使用可能になるまでを監視 します。ServerView Agentsが指定された時間内に iRMCへの接続を確立できない場合は、起動プロセスに 異 常 が あ っ た と し て 「 異 常 時 動 作 」 で 設 定 し た アクションを実行します。
3. 「設定」-「サーバ管理情報」ページを開きます。
「ブートウォッチドッグ」を展開し、以下のよう に設定します。
•
ブートウォッチドッグ:有効•
タイムアウアト時間:10分•
異常時動作:リセットソフトウェアウォッチドッグは、ServerView Agents を使用してシステムの監視をします。ServerView Agentsからの応答が無い場合は、システムに異常が あったとして「異常時動作」で設定したアクションを 実行します。
4. 「設定」-「サーバ管理情報」ページを開きます。
「ソフトウェアウォッチドッグ」を展開し、以下 のように設定します。