4 サーバの運用(HiRDB の影 響分散スタンバイレス型系
4.4 サーバの起動(影響分散スタンバイレス 型)
4.4.4 サーバ起動時の障害と運用
(1) サーバ障害時の実行サーバの起動失敗
サーバ(HiRDB)の要因で実行サーバを起動できなかった場合,サーバから
HA Toolkit
Ex
に実行サーバの起動失敗が通知されます。HA Toolkit Exは通知を受け取った時点で 実行サーバを起動失敗と判断します。このとき,クラスタソフトの設定によって,系切 り替えを実施します。サーバのメッセージによって,起動に失敗した原因を調査してください。
(2) 実行サーバのタイムアウト検知
HA Toolkit Ex
では,実行サーバが一定の時間内に起動完了するかを監視できます。定義内容の不正,サーバ起動コマンドの不正,リソース不足などの理由で,一定の時間 内にサーバが起動しなかった場合,HA Toolkit Exはサーバの起動失敗と判断します。
実行サーバの起動タイムアウト検知時の動作および対処は,OSによって異なります。
OS
ごとのタイムアウト検知時の動作および対処を次に示します。HP-UX
の場合HA Toolkit Ex
がタイムアウト検知をした場合,起動監視時間ごとに警告メッセージ(KAME475-W)が出力されます。
KAME475-W
が出力された場合,出力されたメッセージに従って対処してください。対処をしても警告メッセージが出力される場合は,単にサーバの起動に時間が 掛かっていると考えられます。単にサーバの起動に時間が掛かっているときは,警 告メッセージを無視してください。または,HA Toolkit Exの定義ファイル
(servers)で,サーバ起動監視時間(actpatrolオペランド)の変更を検討してくだ さい。
Solaris
の場合HA Toolkit Ex
がタイムアウト検知をした場合,起動監視時間ごとに警告メッセージ(KAME475-W)が出力されます。
KAME475-W
が出力された場合,出力されたメッセージに従って対処してください。対処をしても警告メッセージが出力される場合は,単にサーバの起動に時間が 掛かっていると考えられます。単にサーバの起動に時間が掛かっているときは,警 告メッセージを無視してください。または,HA Toolkit Exの定義ファイル
(servers)で,サーバ起動監視時間(actpatrolオペランド)の変更を検討してくだ さい。
また,VCSでも,サーバが一定の時間内に起動完了するかを監視できます。VCSが 起動タイムアウトを検知した時点でサーバの起動失敗と判断し,系切り替えをしま す。
Windows
の場合HA Toolkit Ex
の定義ファイル(servers)でactpatrol
オペランドに指定したサーバ 起動監視時間に達すると,サーバの起動失敗と判断します。MSCSが系切り替えを します。また,MSCSでも,サーバが一定の時間内に起動完了するかを監視できます。
MSCS
が起動タイムアウトを検知した時点でサーバの起動失敗と判断し,系切り替えをします。
(3) 待機サーバが未起動の系での,実行サーバの起動失敗
HiRDB
の影響分散スタンバイレス型系切り替えでは,一つの系に掛かる負担を分散するために,HiRDBが一つの系で起動できる実行サーバの数を決めます。このため,実行 サーバが設定した数だけ起動した時点で,同じ系にある待機サーバは実行サーバに切り 替われない状態,つまり未起動状態になります。
クラスタソフトによって系切り替えが実行されるか,またはクラスタソフトのコマンド によってサービスグループをオンライン化したときに,HA Toolkit Exが待機サーバの未 起動を検知すると,サービスプロセスを起動失敗にします。クラスタソフトに,ほかの 系に系切り替えさせます。これによって,タイムアウト検知を待ったり,障害が発生し た実行サーバの再起動を待ったりする必要がなくなり,実行サーバの起動に時間が掛か りません。
HiRDB
の影響分散スタンバイレス型系切り替えでは,HA Toolkit Exの定義ファイル(servers)の
switch_nosby
オペランドにactfail
を指定して,待機サーバが起動してい ない系では実行サーバが起動に失敗する設定にしてください。! !
! !
注意事項HA Toolkit Exの定義ファイル(servers)でswitch_nosbyオペランドにactfailを指定しな いと,HA Toolkit Exは実行サーバを起動失敗にしません。この場合,OSによって次の処 理をします。
• HP-UXの場合
HA Toolkit Exは実行サーバの再起動を待ち続けます。待機サーバがあるほかの系に系切
り替えができません。
• SolarisおよびWindowsの場合
クラスタソフトのタイムアウト検知まで待ってから,待機サーバがあるほかの系に系切り 替えをします。このため,迅速な系切り替えができません。
HA Toolkit Ex
が待機サーバの未起動を判断し,サービスプロセスを起動失敗させるのは,次の場合です。
● 障害時,待機サーバが起動していない系で,系切り替え処理を開始した場合
● 通常時,待機サーバが起動していない系で,実行サーバを起動するためにサービスグ ループがオンライン化された場合
待機サーバが未起動の系でのサービスプロセスの起動失敗による,待機サーバが未起動 の系での系切り替えの概要を,次に示します。
図
4-1 待機サーバが未起動の系での系切り替えの概要(影響分散スタンバイレス型)
前述の図では,HiRDBで一つの系で起動できる実行サーバの数を二つに設定していま す。そのため,実行サーバがすでに二つ起動している系
3
では,待機サーバが未起動状 態になっています。待機サーバが起動していない系では実行サーバを起動できないので,系