• 検索結果がありません。

サーバ起動時の障害と運用

ドキュメント内 Hitachi HA Toolkit (ページ 88-92)

4   サーバの運用(HiRDB の影 響分散スタンバイレス型系

4.4  サーバの起動(影響分散スタンバイレス 型)

4.4.4  サーバ起動時の障害と運用

(1) サーバ障害時の実行サーバの起動失敗

サーバ(HiRDB)の要因で実行サーバを起動できなかった場合,サーバから

HA Toolkit

Ex

に実行サーバの起動失敗が通知されます。HA Toolkit Exは通知を受け取った時点で 実行サーバを起動失敗と判断します。このとき,クラスタソフトの設定によって,系切 り替えを実施します。

サーバのメッセージによって,起動に失敗した原因を調査してください。

(2) 実行サーバのタイムアウト検知

HA Toolkit Ex

では,実行サーバが一定の時間内に起動完了するかを監視できます。

定義内容の不正,サーバ起動コマンドの不正,リソース不足などの理由で,一定の時間 内にサーバが起動しなかった場合,HA Toolkit Exはサーバの起動失敗と判断します。

実行サーバの起動タイムアウト検知時の動作および対処は,OSによって異なります。

OS

ごとのタイムアウト検知時の動作および対処を次に示します。

HP-UX

の場合

HA Toolkit Ex

がタイムアウト検知をした場合,起動監視時間ごとに警告メッセージ

(KAME475-W)が出力されます。

KAME475-W

が出力された場合,出力されたメッセージに従って対処してくださ

い。対処をしても警告メッセージが出力される場合は,単にサーバの起動に時間が 掛かっていると考えられます。単にサーバの起動に時間が掛かっているときは,警 告メッセージを無視してください。または,HA Toolkit Exの定義ファイル

(servers)で,サーバ起動監視時間(actpatrolオペランド)の変更を検討してくだ さい。

Solaris

の場合

HA Toolkit Ex

がタイムアウト検知をした場合,起動監視時間ごとに警告メッセージ

(KAME475-W)が出力されます。

KAME475-W

が出力された場合,出力されたメッセージに従って対処してくださ

い。対処をしても警告メッセージが出力される場合は,単にサーバの起動に時間が 掛かっていると考えられます。単にサーバの起動に時間が掛かっているときは,警 告メッセージを無視してください。または,HA Toolkit Exの定義ファイル

(servers)で,サーバ起動監視時間(actpatrolオペランド)の変更を検討してくだ さい。

また,VCSでも,サーバが一定の時間内に起動完了するかを監視できます。VCSが 起動タイムアウトを検知した時点でサーバの起動失敗と判断し,系切り替えをしま す。

Windows

の場合

HA Toolkit Ex

の定義ファイル(servers)で

actpatrol

オペランドに指定したサーバ 起動監視時間に達すると,サーバの起動失敗と判断します。MSCSが系切り替えを します。

また,MSCSでも,サーバが一定の時間内に起動完了するかを監視できます。

MSCS

が起動タイムアウトを検知した時点でサーバの起動失敗と判断し,系切り替

えをします。

(3) 待機サーバが未起動の系での,実行サーバの起動失敗

HiRDB

の影響分散スタンバイレス型系切り替えでは,一つの系に掛かる負担を分散する

ために,HiRDBが一つの系で起動できる実行サーバの数を決めます。このため,実行 サーバが設定した数だけ起動した時点で,同じ系にある待機サーバは実行サーバに切り 替われない状態,つまり未起動状態になります。

クラスタソフトによって系切り替えが実行されるか,またはクラスタソフトのコマンド によってサービスグループをオンライン化したときに,HA Toolkit Exが待機サーバの未 起動を検知すると,サービスプロセスを起動失敗にします。クラスタソフトに,ほかの 系に系切り替えさせます。これによって,タイムアウト検知を待ったり,障害が発生し た実行サーバの再起動を待ったりする必要がなくなり,実行サーバの起動に時間が掛か りません。

HiRDB

の影響分散スタンバイレス型系切り替えでは,HA Toolkit Exの定義ファイル

(servers)の

switch_nosby

オペランドに

actfail

を指定して,待機サーバが起動してい ない系では実行サーバが起動に失敗する設定にしてください。

! !

! !

注意事項

HA Toolkit Exの定義ファイル(servers)でswitch_nosbyオペランドにactfailを指定しな いと,HA Toolkit Exは実行サーバを起動失敗にしません。この場合,OSによって次の処 理をします。

HP-UXの場合

HA Toolkit Exは実行サーバの再起動を待ち続けます。待機サーバがあるほかの系に系切

り替えができません。

SolarisおよびWindowsの場合

クラスタソフトのタイムアウト検知まで待ってから,待機サーバがあるほかの系に系切り 替えをします。このため,迅速な系切り替えができません。

HA Toolkit Ex

が待機サーバの未起動を判断し,サービスプロセスを起動失敗させるの

は,次の場合です。

● 障害時,待機サーバが起動していない系で,系切り替え処理を開始した場合

● 通常時,待機サーバが起動していない系で,実行サーバを起動するためにサービスグ ループがオンライン化された場合

待機サーバが未起動の系でのサービスプロセスの起動失敗による,待機サーバが未起動 の系での系切り替えの概要を,次に示します。

4-1 待機サーバが未起動の系での系切り替えの概要(影響分散スタンバイレス型)

前述の図では,HiRDBで一つの系で起動できる実行サーバの数を二つに設定していま す。そのため,実行サーバがすでに二つ起動している系

3

では,待機サーバが未起動状 態になっています。待機サーバが起動していない系では実行サーバを起動できないので,

1

で障害が発生して実行サーバ二つの系切り替えをする場合でも,系

3

に切り替える ことはできません。そこでクラスタソフトは,系

3

で実行サーバの起動に失敗したと判 断し,実行サーバの起動数が設定よりも少ない系

2

に切り替えます。

ドキュメント内 Hitachi HA Toolkit (ページ 88-92)