第 6 章 RMS に関するメッセージ
6.1 RMSメッセージ
6.1.10 DET: ディテクタ
対処
Online スクリプトを実行後にリソースが Online 状態に変更されることを確認してください。
(DET, 7) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource unexpectedly becoming Offline.
内容
このメッセージはリソースが不意に Offline になったときに表示されます。ディテクタが BM への応答を停止すると、リソースに障害が発 生したと判断されます。
対処
<resource> に示されるリソースが不意に Offline 状態になった原因を調査してください。リソースが不意に Offline 状態になった原因が 判明しない場合は、調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 8) Failed to create DET_REP_Q
内容
RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出 力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 9) Message send failed in detector request Q: queue
内容
hvlogclean の実行中に、ディテクタ要求キュー queue を使用して BM からディテクタに情報を送信します。この通信で問題が発生する
と、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 11) DETECTOR STARTUP FAILED: Corrupted command line <commandline>.
内容
このメッセージは、コマンド行に何も指定されていない場合、または無効な値が指定されている場合に表示されます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 12) DETECTOR STARTUP FAILED <detector>.REASON: errorreason.
内容
ディテクタ detector がerrorreason が理由で起動しない場合、このメッセージが出力されます。理由 errorreason は次のいずれかです。
・ ディテクタ detector が存在しない。
・ ディテクタdetector に実行権限がない。
・ ディテクタのプロセスを出力できない。
・ BM が同時に出力するプロセス数が 128 より多い。
対処
エラーの原因に応じて適切な対処を行ってください。
(DET, 13) Failed to execute script <script>.
内容
ディテクタスクリプトが不良であるか、フォーマットが誤っています。
対処
ディテクタ起動スクリプトをチェックしてください。
(DET, 16) Cannot create gdet queue of kind gkind
内容
各汎用ディテクタは、BM との通信に使用するメッセージキューを持っています。ディテクタ用にkind という種類のキューを作成すると きに問題が発生すると、このメッセージが出力されて、RMS が終了コード 12 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 18) Error reading hvgdstartup file. Error message: errorreason.
内容
RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Q を作成できない場合に、このメッセージが出 力されて、RMS が終了コード 12 で終了します。このファイルを読取るときにエラーが発生すると、上記のメッセージがエラーの理由 errorreason とともに出力されます。RMS は終了コード 26 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 24) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Standby after running its OnlineScript (onlinescript).
内容
スタンバイ要求中に Online スクリプトを実行すると、リソースは Standby になります。
ScriptTimeout 属性に指定された時間(秒)内に状態が変更されない場合、または Standby か Online 以外の状態に変更された場合、
リソースは Faulted の状態であると判断されます。
対処
スタンバイ要求中に Online スクリプトを実行後、リソースが Standby または Online 状態に変更されることを確認してください。
(DET, 25) <resource>: received unexpected detector report "DetReportsOffline" - ignoring it Reason:
Standby processing in progress, detector report may result from an interim transition state.
内容
Offline 状態から Standby 状態への状態遷移中であったため、クラスタ(RMS)は、状態遷移中の一時的な Offline 状態が通知された
ものと判断して、本 Offline 状態の通知を無視した(フェイルオーバのトリガにしなかった)ことを示しています。
対処
情報のメッセージのため、対処不要です。
(DET, 26) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Online.
内容
このメッセージは、リソースを Faulted 状態にする可能性のある Online スクリプトを実行した後、リソースが Online になれなかった場合 に表示されます。
対処
リソース resource が Online 状態になれなかった原因を調べてください。
(DET, 28) <object>: CalculateState() was invoked for a non-local object! This must never happen. Check for possible configuration errors!
内容
状態エンジンの中で要求を処理しているときに、要求トークンまたは応答トークンがオブジェクトに配信されましたが、そのオブジェクト がローカルノードに定義されていません。重大な内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 33) DETECTOR STARTUP FAILED: Restart count exceeded.
内容
ディテクタに異常があり所定回数以上、ディテクタを再起動しました。ディテクタの異常が考えられます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(DET, 34) No heartbeat has been received from the detector with pid <pid>, <startupcommand>, during the last <seconds> seconds. The base monitor will send the process a SIGALRM to interrupt the detector if it is currently stalled waiting for the alarm.
内容
RMS ディテクタが停止しないようにするため、各ディテクタは BM に対し定期的にハートビートメッセージを送信します。ハートビートが 一定期間途絶えると、switchlog に本メッセージが出力されます。BM は失速したプロセスにアラームシグナルを送信して、ディテクタが メインループを適切に処理します。メッセージには、BM がディテクタのハートビートを前回受信してからの経過時間が記載されていま す。この時間が 300 秒を超えていると BM は実行できません。BM は現在リアルタイムプロセスですが、メモリにはロックされません。こ のメッセージは bm プロセスがスワップアウトされ再度起動されることがなかった場合に出力されます。
対処
truss(1) や strace(1) 等のシステムツールを使用して、BM とディタクタが稼動しているかを確認してください。ハートビートの中断期間
がタイムアウト時間の 300 秒を大きく超える場合は、システムスワップが必要であるかメインメモリが不足している可能性があります。