第 6 章 RMS に関するメッセージ
6.1 RMSメッセージ
6.1.1 ADC: Admin 構成
(ADC, 1) Since this host <hostname> has been online for no more than time seconds and due to the previous error, it will shut down now.
内容
time は、環境変数 HV_CHECKSUM_INTERVAL の値でデフォルト値は、120 秒です。このメッセージが出力されるのは、ローカル
ノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、かつ経過時間が time 秒以内であり、かつ以下のいずれかの 条件が満たされる場合です。
・ リモートノードがクラスタに参入し、ローカルノード上のすべてのアプリケーションがOffline または Faulted の状態である。RMS が 終了コード 60 で終了する。
・ リモートノードの構成にローカルノードが含まれているが、ローカルノードの構成にリモートノードが含まれていない。ローカルノード hostname が終了コード 60 で終了する。
対処
ローカルノードおよびリモートノードが別々の RMS 構成定義ファイルで実行されています。両方のノードが同じ RMS 構成定義ファイ ルで実行するようにしてください。
(ADC, 2) Since not all of the applications are offline or faulted on this host <hostname>, and due to the previous error, it will remain online, but neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.
内容
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、経過時間が HV_CHECKSUM_INTERVAL に指定 された秒数以内であり、Offline または Faulted でないアプリケーションが存在します。RMS は Online 状態を維持しますが、ディテクタ detector がOffline または Faulted を報告するまでは、このノード上で自動切替および手動切替のいずれもできません。
対処
ローカルノードとリモートノードの両方が同じ RMS 構成定義ファイルで稼動するようにしてください。
(ADC, 3) Remote host <hostname> reported the checksum (remotechecksum) which is different from the local checksum (localchecksum).
内容
リモートノード <hostname> が報告する RMS 構成定義ファイルのチェックサムが、ローカルノード上の RMS 構成定義ファイルのチェッ クサムと異なる場合に、このメッセージが出力されます。
対処
ローカルノードとリモートノードが異なる RMS 構成定義ファイルで実行されています。ローカルノードとリモートノードが同じ RMS 構成
(ADC, 4) Host <hostname> is not in the local configuration.
内容
このメッセージが出力される原因は次のとおりです。リモートノードが報告するチェックサムがローカルノードのチェックサムと異なり、ロー カルノードの RMS 構成定義ファイルにリモートノード名が含まれていないにもかかわらず、リモートノードhostname の RMS 構成定義 ファイルにローカルノードが含まれています。
対処
ローカルノードとリモートノードが同じ RMS 構成定義ファイルで稼動するようにしてください。
(ADC, 5) Since this host <hostname> has been online for more than time seconds, and due to the previous error, it will remain online, but neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.
内容
ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、このノードがオンラインになってから time 秒以上が 経過した場合に(環境変数HV_CHECKSUM_INTERVAL が設定されている場合、time はその値です。HV_CHECKSUM_INTERVAL が設定されていない場合、time は 120 秒です)、RMS が上記のメッセージを出力します。
対処
クラスタ内のすべてのノードが同じ RMS 構成定義ファイルで実行するようにしてください。
(ADC, 15) Global environment variable <envattribute> is not set in hvenv file.
内容
このメッセージは、グローバル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗し た場合に出力されます。envattribute は次のいずれかです:
RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、
HV_LOG_WARNING_THRESHOLD、 HV_WAIT_CONFIG、HV_RCSTART。これにより RMS は終了コード 1 で終了します。
対処
環境変数に適切な値を設定してください。
(ADC, 16) Because some of the global environment variables were not set in hvenv file - RMS cannot start up. Shutting down.
内容
RMS が 正 し く 機 能 す る に は 、 す べ て の グ ロ ー バ ル 環 境 変 数 RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、
HV_CHECKSUM_INTERVAL 、 HV_LOG_ACTION_THRESHOLD 、 HV_LOG_WARNING_THRESHOLD 、
HV_WAIT_CONFIG、および HV_RCSTART を hvenv で設定する必要があります。未設定のグローバル環境変数があると、RMS が 終了コード 1 で終了します。
対処
すべての環境変数の値を hvenv で設定してください。
(ADC, 17) <hostname> is not in the Wait state, hvutil -u request skipped!
内容
hvutil -u をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした(内部オプション)。
対処
hvutil -u コマンドを発行するのが早すぎた場合は、ノードが Wait 状態になってから再発行してください。
(ADC, 18) Local environmental variable <envattribute> is not set up in hvenv file.
内容
このメッセージは、ローカル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した 場合に出力されます。envattribute は次のいずれかです:
SCRIPTS_TIME_OUT、RELIANT_INITSCRIPT、RELIANT_STARTUP_PATH、HV_CONNECT_TIMEOUT、HV_MAXPROC、
HV_SYSLOG_USE。これにより RMS は終了コード 1 で終了します。
対処
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルのローカル環境変数に適切な値を設定してください。
(ADC, 20) <hostname> is not in the Wait state. hvutil -o request skipped!
内容
hvutil -o をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした。(内部オプション)。
対処
hvutil -o コマンドを発行するのが早すぎた場合は、ノードが Wait 状態になってから再発行してください。
(ADC, 21) Because some of the local environment variables were not set in hvenv file, RMS cannot start up. Shutting down.
内容
一部のローカル環境変数を hvenv ファイルで設定してない場合に、このメッセージが出力されて、RMS が終了コード 1 で終了します。
対処
/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルで、すべてのローカル環境変数を適切な値に設定してあることを確認してください。
(ADC, 23) File <filename> can't be opened: <errortext>.
内容
リモートノードに送信するためのファイルを開くことができません。
対処
<errortext> や、その他のWARNING/ERROR メッセージを確認してください。
(ADC, 24) File cannot be open for read.
内容
リモートノードに送信するためのファイルを読み取ることができません。
対処
メッセージ (ADC, 23) も出力されます。(ADC, 23) の<errortext> や、その他のWARNING/ERRORメッセージを確認してください。
(ADC, 25) Application <userapplication> is locked or busy, modification request skipped.
内容
hvmod が -l オプションの指定なしで起動され、アプリケーションが他の処理を実行中の場合にこのメッセージが表示されます。
対処
クラスタアプリケーションが現在の切替要求を完了した時点で、hvmod コマンドを再発行してください。
(ADC, 27) Dynamic modification failed.
内容
動的変更が失敗しました。障害の原因は先行するメッセージに表示されています。
対処
switchlog でこのメッセージの前に出力されたエラーメッセージを調べるか、または失敗の正確な原因を突き止めてください。
(ADC, 30) HV_WAIT_CONFIG value <seconds> is incorrect, using 120 instead.
内容
環境変数 HV_WAIT_CONFIG の値が 0 となっています。値が設定されていない場合は、代わりにデフォルト値の 120 が使用されま す。
対処
/opt/SMAW/SMAWRrms/bin/hvenv で HV_WAIT_CONFIG の値を設定してください。
(ADC, 31) Cannot get the NET_SEND_Q queue.
内容
RMS はコントラクト情報の送信に NET_SEND_Q キューを使用します。このキューに問題がある場合、処理は中止されます。この処理
には、hvrcp または hvcopy のいずれかを使用します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(ADC, 32) Message send failed during the file copy of file <filename>.
内容
ネットワーク上でファイル <filename> を転送中にエラーが発生しました。
対処
ネットワークに問題がないかどうかを確認してください。
(ADC, 33) Dynamic modification timeout.
内容
動的変更の所要時間がタイムアウト値を超えました。環境変数 MODIFYTIMEOUTLIMIT の値が 0 より大きい場合、タイムアウトはそ の値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。環境変数自体が定義されていない場合、タイムアウト値はデ フォルトで 120 秒です。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(ADC, 34) Dynamic modification timeout during start up, bm will exit.
bm 起動中に動的変更の所要時間が環境変数 MODIFYTIMEOUTLIMIT に指定されるタイムアウト値を超えると、このエラーメッセー ジが出力されます。値が 0 より大きい場合、タイムアウトはその値になります。環境変数の値が 0 以下の場合、タイムアウトは 0 です。
環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120 秒です。RMS は終了コード 63 で終了します。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(ADC, 35) Dynamic modification timeout, bm will exit.
内容
重大な内部エラーが発生しました。
対処
このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法に ついては、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
(ADC, 37) Dynamic modification failed: cannot make a non-critical resource <resource> critical by changing its attribute MonitorOnly to 0 since this resource is not online while it belongs to an online application
<userapplication>; switch the application offline before making this resource critical.
内容
クラスタアプリケーション <userapplication> が Online のときに、動的変更によりリソース<resource> を MonitorOnly にしようとすると、変 更したいリソース <resource> が Online ではなくても、このメッセージが生成されて、動的変更が中止されます。
対処
クラスタアプリケーションを Offline に切替えてからリソースの重要度を上げてください。
(ADC, 38) Dynamic modification failed: application <userapplication> has no children, or its children are not valid resources.
内容
動的変更の実行中に、クラスタアプリケーション <userapplication> が子を持たないことがわかると、このメッセージが switchlog に書き 込まれ、動的変更が異常終了します。
対処
動的変更の実行中に、クラスタアプリケーションに有効な子があることを確認してください。
(ADC, 39) The putenv() has failed (failurereason)
内容
RMS ウィザードは動的変更 HVMOD_HOST の実行中に環境変数 HVMOD_HOST を使用します。この変数には、hvmod を呼び出 したノードの名前が含まれています。この変数を関数 putenv() で設定できない場合に、このメッセージと理由 failurereason が switchlog に書き込まれます。
対処
switchlog で理由failurereason を調べて、この操作が失敗した理由を判別し、修正措置をとってください。
(ADC, 41) The Wizard action failed (command)
内容
ウィザードは hvmod の実行中にアクションファイルを使用します。終了コールでプロセスが終了する際、このアクションファイル
(command) の実行が失敗すると、このメッセージと失敗の理由が switchlog に書き込まれます。
対処
switchlog を調べて失敗の理由を検出し、問題を解決してから hvmod コマンドを再発行してください。
(ADC, 43) The file transfer for <filename> failed in "command". The dynamic modification will be aborted.
内容
動的変更の実行中に、変更情報を記録したファイルのクラスタのノード間での転送に失敗しました。
対処
ノードとクラスタがcommand を正常に実行できる状態になっていることを確認してください。
(ADC, 44) The file transfer for <filename> failed in "command". The join will be aborted.
内容
ノードはクラスタに参入すると、RMS 構成定義ファイルを受信します。ファイル転送が失敗すると、動的変更は中止されます。