第 6 章 RMS に関するメッセージ
6.1 RMSメッセージ
6.1.14 NOD: ノードディテクタ
(NOD, 6) Usage: detector -t time_interval.
内容
ディテクタ <detector> に対して整数以外の引数を指定すると、このメッセージが出力されて、ディテクタが終了コード 103 で終了しま す。
対処
ディテクタ <detector> に対する引数 <time_interval> を整数で指定してください。
(NOD, 7) cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed. Further out-of-sync messages will appear in the syslog.
内容
<host> に示されるノードと自ノードの時刻がずれています。
対処
すべてのクラスタノード間で時刻を同期させてください。
(NOD, 8) Usage: detector -t time_interval [-d] [-n]
内容
ディテクタ <detector> に対する引数 -t <time_interval> を指定しなかった場合、または -d あるいは -n 以外の引数を使用すると、この メッセージが switchlog に書き込まれて、ディテクタが終了コード 103 で終了します。
対処
正しい構文でディテクタを起動してください。
(NOD, 9) detector: Failed to open req_queue.
内容
ディテクタ hvdet_node は req_queue キューを使用して BM からジョブを取得します。このキューに問題があると、このメッセージが出力 されて、ディテクタが終了コード 106 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 10) detector: Failed to open rep_queue.
内容
ディテクタ hvdet_node は req_queue キューを使用して、クラスタ内に存在する他の SysNode の状態を、同じノード上でディテクタとして 機能している BM に報告します。状態情報を BM に送信するときに問題が発生すると、このメッセージが出力されて、ディテクタが終了コード 112 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 11) service: getservbyname returned NULL.
内容
サービス <service> が常駐するポートをディテクタが見つけられないと、このメッセージがswitchlog に書き込まれて、ディテクタが終了コード
126 で終了します。
対処
サービス <service> のエントリが /etc/services にあることを確認してください。
(NOD, 12) detector: no NODE_SYS_Q.
内容
ディテクタ hvdet_node は NODE_SYS_Q キューを使用して、同じノード上でディテクタとして機能する BM から SysNode のリストを取 得します。ディテクタはこのキューの作成を、成功するまでまたは 10 回(少ない方)試みます。キューの作成に失敗すると、上記のメッ セージが出力されて、ディテクタが終了コード 106 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 13) The RMS-CF-CIP mapping for SysNode <sysnode> to the CIP name has failed. Please verify all entries in /etc/hosts and /etc/cip.cf are correct and that CF and CIP are fully configured.
内容
SysNode<sysnode> に対応する CIP エントリが /etc/cip.cf にない場合に、このメッセージが出力されて、hvdet_node が終了コード 139 で終了します。
対処
SysNode<sysnode> に対応する CIP エントリが /etc/cip.cf にあることを確認してください。
(NOD, 16) detector: failed to get information about RMS base monitor bm!
内容
ディテクタ hvdet_node は RMS BM に関する情報を取得できないと、終了コード 142 で終了します。
対処
hvdet_node を RMS と別に起動したことが、原因として考えられます。
hvdet_node を RMS と同時に起動してください。
(NOD, 17) Failed to set up SIGCHLD handler!
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 18) Can't fork child hvdet_node.
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 20) detector: Cannot create socket: errorreason
内容
クラスタ内の異なるノード上のディテクタ <detector> 間で行う通信のエンドポイントを作成するときに問題が発生すると、このメッセージが
switchlog に書き込まれて、ディテクタが終了コード 111 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 21) detector: Failed to bind address to socket: errorreason
内容
クラスタ内の異なるノード上のディテクタ <detector> 間で行う通信のエンドポイントを特定のポートにバインドするときに問題が発生する と、このメッセージがこのエラーの理由を示すerrorreason とともに出力されます。ディテクタは終了コード 130 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 22) The interconnect interconnect to the cluster host host failed.
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 25) The network connection to the cluster host host failed.
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 26) detector: detector can't report resource state.
内容
ディテクタ <detector> がクラスタ内の他の SysNode の状態を、同じノード上でディテクタとして機能する BM に報告できない場合に、こ のメッセージが出力されます。ディテクタが状態を報告するときに、キューで問題が発生したと考えられます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 27) Detector for cluster host hostname has reported online.
内容
クラスタホスト <hostname> の Detector が Online を報告しています。
対処
情報のメッセージのため、対処不要です。
(NOD, 28) detector: SysNode list empty in hvdet_node.
内容
hvdet_node は BM から SysNode のリストを取得しますが、取得したリストが空の場合は、このメッセージが出力されます。RMS は終了コード 129 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 29) The RMS-CF interface is inconsistent and will require operator intervention. The routine "routine" failed with error code errorcode - "errorreason".
内容
これは、ルーチン <routine> の実行が <errorreason> の理由で失敗したこと、および RMS-CF インタフェースが不整合であることを示 すメッセージです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 30) detector: message get doesn't work in hvdet_node.
内容
hvdet_node が BM から SysNode のリストを取得しようとして、10 回試行してもリストを取得できない場合に、このメッセージが switchlog
に書き込まれます。これは、hvdet_node と BM の間のメッセージキューに問題があるということです。RMS は終了コード 129 で終了し ます。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 31) detector: nodename nodename not in NODELIST
内容
これは、ディテクタ <detector> がノードリストの中でノード <nodename> を見つけられないという重大な問題を示すメッセージです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 33) The interface interface connection to the cluster host host failed.
内容
内部エラーです。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 34) detector: Failed to call osd select:errorreason
内容
ディテクタ hvdet_node がシステムコール select でメッセージの読取りに失敗すると、このメッセージとエラーの理由 <errorreason> が
switchlog に書き込まれます。ディテクタは終了コード 131 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(NOD, 37) Child hvdet_node died. Will try to restart hvdet_node.
内容
ディテクタ hvdet_node が終了しました。hvdet_node が再起動します。
対処
対処する必要はありません。
(NOD, 38) cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed.
内容
クラスタノード <host> に示されるノードと自ノードの時刻が大きく(5 秒以上)ずれているため、RMS は正しく動作できません。
対処
すべてのクラスタノード間で時刻を同期させてください。詳細については、"PRIMECLUSTER 導入運用手引書" を参照してください。