第 5 章 CF のメッセージ
5.2 シャットダウン機構メッセージ
シャットダウン機構に関するメッセージをアルファベット順に説明します。
1.The SA <Shutdown Agent> to test host <nodename> has exceeded its configured timeout, <Process ID> will be terminated
2.WARNING : <Process ID> is not able to be terminated.
The SA <SA名> is now disabled from host <nodename>
内容
ノード <nodename> で、シャットダウンエージェント <Shutdown Agent> がタイムアウトしました。
対処
シャットダウン機構を再起動してください。
Advertisement Client : sendto error on socket errno 146
内容
sendto()が -1 で復帰(errno =146)したことを意味しています。
本メッセージが出力された場合、スプリットブレイン時に意図しないノードが停止される場合があります。
対処
当社技術員 (SE) に連絡してください。
can't bind local address, errno xxx
内容
シャットダウン機構の設定時に存在しない IP アドレスが設定されました。
対処
シャットダウン機構で設定した IP アドレスを見直してください。
Host <nodename > has been put in the shutdown list.
内容
ノード <nodename > がシャットダウンリストに入りました。ノード <nodename > は停止されます。
対処
情報メッセージのため対処不要です。
Host <nodename > ICF communication failure detected.
内容
ノード <nodename > のハートビート停止がシャットダウン機構に通知されました。
対処
情報メッセージのため対処不要です。
MA Monitoring Agent reported host nodename leftcluster, state MA_paniced_fsnotflushed.
内容
コンソール非同期監視を行っている運用で、コンソールに "panic" の文字列を検出しました。
対処
情報メッセージのため対処不要です。
MA Monitoring Agent reported host nodename leftcluster, state MA_inprom
内容
コンソール非同期監視を行っている運用で、コンソールに OBP プロンプトを表す文字列を検出しました。
対処
情報メッセージのため対処不要です。
MA Monitoring Agent reported host nodename leftcluster, state MA_poweredoff
内容
非同期監視を行っている運用で、ノードの電源 OFF を検出しました。
対処
情報メッセージのため対処不要です。
PID pid has indicated a successful host shutdown.
内容
PID pid がノードの停止に成功しました。
対処
情報メッセージのため対処不要です。
rcsd died abnormally. Restart it.
内容
シャットダウンデーモン (rcsd) が異常終了後、再起動しました。
対処
シャットダウンデーモンは自動復旧するため対処は不要です。
SA SA_mmbp.so to shutdown host <nodename > succeeded
内容
MMB シャットダウンエージェントが ノード <nodename > を停止するのに成功しました。
対処
情報メッセージのため対処不要です。
SMAWsf : fopen of /etc/opt/SMAW/SMAWsf/rcsd.cfg failed, errno 2
内容
シャットダウン機構の設定が実施されておらず、シャットダウン機構の起動に失敗しています。
対処
シャットダウン機構の設定を見直した後、シャットダウンデーモンを起動し直してください。
SMAWsf : Fork Shutdown Agent(PID pid) to action host nodename
内容
ノード <nodename> に対するアクション <action> を実行するためにシャットダウンエージェント <Shutdown Agent> を起動しました。
対処
情報メッセージのため対処不要です。
SMAWsf : Host nodename has been put in the shutdown list
内容
ノード <nodename> はすでにシャットダウン対象となっています。
対処
情報メッセージのため対処不要です。
SMAWsf : PID pid has indicated a {successful | failed} host action
内容
シャットダウンエージェントが正常値、もしくは異常値を戻り値として終了しました。
対処
情報メッセージのため対処不要です。
SMAWsf : Processing event for host nodename
内容
受信したノード <nodename> の CF イベント <event> の処理を開始しました。
対処
情報メッセージのため対処不要です。
SMAWsf : SA Shutdown Agent to init host nodename failed
内容
ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の初期化処理に失敗しました。
対処
調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。
SMAWsf : SA Shutdown Agent to init host nodename succeeded
内容
ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の初期化処理に成功しました。
対処
情報メッセージのため対処不要です。
SMAWsf : SA Shutdown Agent to shutdown host nodename failed
内容
シャットダウンエージェント <Shutdown Agent> がノード <nodename> を停止するのに失敗しました。
対処
調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。
SMAWsf : SA Shutdown Agent to shutdown host nodename succeeded
内容
シャットダウンエージェント <Shutdown Agent> がノード <nodename> を停止するのに成功しました。
対処
情報メッセージのため対処不要です。
SMAWsf : SA Shutdown Agent to unInit host nodename failed
内容
ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の終了時処理に失敗しました。
対処
調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。
SMAWsf : SA Shutdown Agent to unInit host nodename succeeded
内容
ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の終了時処理に成功しました。
対処
情報メッセージのため対処不要です。
SMAWsf : SA SA_xscfp.so to test host nodename failed SMAWsf : SA SA_xscfr.so to test host nodename failed SMAWsf : SA SA_rccu.so to test host nodename failed SMAWsf : SA SA_ilomp.so to test host nodename failed
内容
XSCF、RCCUまたはILOMへの接続確認に失敗しました。
対処
接続確認失敗の原因として以下が考えられます。
・ XSCF、RCCUまたはILOMが正しく設定されていない
・ メッセージが表示されたノードからメッセージ中の nodename の XSCF、RCCUまたはILOM への接続ができない
・ ILOM 3.0 の場合、シャットダウン機構用のログインユーザに必要な権限が設定されていない
・ ILOM 3.0 の場合、シャットダウン機構用のログインユーザにSSH ホストベースキー認証を使用している
・ システムまたはネットワークの高負荷状態が続いた
上記について問題ないことを確認後、メッセージが出力されたノードで以下のコマンドを実行し、コンソール非同期監視機能および シャットダウン機構を再起動してください。
# /etc/opt/FJSVcluster/bin/clrccumonctl restart
# /opt/SMAW/bin/sdtool -r
本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採 取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。
SMAWsf : SA SA_pprcip.so to test host nodename failed SMAWsf : SA SA_pprcir.so to test host nodename failed
内容
RCIへの接続確認に失敗しました。
対処
接続確認に失敗した原因として以下が考えられます。
・ RCIが正しく設定されていない
・ ケーブルが接続されていない
・ SCF/RCI経由での監視タイムアウト時間が/etc/systemファイルに設定されていない(監視タイムアウト時間の設定方法については、
PRIMECLUSTER導入運用手引書を参照してください)
・ システムの高負荷状態が続いた
上記について問題ないことを確認後、メッセージが出力されたノードで以下のコマンドを実行し、RCI 非同期監視機能およびシャット ダウン機構を再起動してください。
# /etc/opt/FJSVcluster/bin/clrcimonctl restart
# /opt/SMAW/bin/sdtool -r
本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採
SMAWsf : SA SA_mmbp.so to test host nodename failed SMAWsf : SA SA_mmbr.so to test host nodename failed
内容
MMBへの接続確認に失敗しました。
対処
本メッセージがOS起動直後にのみ出力され、メッセージ出力の10分後に下記3083のメッセージが出力されている場合は、snmptrapd デーモンが起動中のため表示されるもので、対処不要です。
3083: Monitoring another node has been started.
上記に該当しない場合は、以下の設定を確認してください。
・ MMBのIPアドレス、または、MMBシャットダウン機構のシャットダウンデーモンに設定した、自ノードにおける管理LANのIPアドレ
スに、誤ったIPアドレスが指定されていないこと
・ MMBシャットダウン機構のMMB情報に登録されている、RMCPでMMBを制御するためのユーザのユーザ名・パスワードが誤っ
ていないこと
・ MMBシャットダウン機構に設定した、RMCPでMMBを制御するためのユーザの[Privilege]が「Admin」になっていること
・ MMBシャットダウン機構に設定した、RMCPでMMBを制御するためのユーザの[Status]が「Enabled」になっていること
MMBシャットダウン機構に設定した、RMCPでMMBを制御するためのユーザの設定を確認する方法については、"PRIMEQUEST 500/400シリーズ リファレンスマニュアル: 基本操作/GUI/コマンド"を参照してください。
設定に誤りがある場合は正しく変更後、全ノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。
# /opt/SMAW/bin/sdtool -r
設定に誤りがなかった場合は、以下について確認してください。
・ snmptrapd デーモンが起動していること(ps(1) コマンド等により snmptrapd のプロセスの存在を確認)
・ HUB と LAN ケーブルが接続されているポートの正常ランプが点灯していること
・ MMB ポートのコネクタ、HUB 側コネクタから LAN ケーブルが抜けていないこと
・ MMB が故障していないこと
・ ノードやネットワークに負荷がかかっていないこと
上記が原因と判明した場合、対処を行った後、MMB 非同期監視は自動復旧します。
自動復旧には最大で 10 分かかります。
本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。
調査情報の採取方法については、"PRIMECLUSTER活用ガイド<トラブルシューティング編>" を参照してください。
SMAWsf : select of CLI Pipe and RCSDNetPipe failed, error number 10
内容
シャットダウンデーモン中の select 関数がシグナルを受信し、異常復帰しました。
対処
シャットダウン機構が、CLI のパイプを再開させる動作を行います。また、システムで動く他のプロセスへの影響はないので、対処不要 です。
SMAWsf : sleep n seconds before invoking Shutdown Agent to kill nodename
内容
ノード <nodname> に対してシャットダウンエージェント <Shutdown Agent> を用いた強制シャットダウンを <n> 秒後に実行します。