• 検索結果がありません。

シャットダウン機構メッセージ

ドキュメント内 活用ガイド <メッセージ集> (ページ 121-136)

第 5 章 CF のメッセージ

5.2 シャットダウン機構メッセージ

シャットダウン機構に関するメッセージをアルファベット順に説明します。

1.The SA <Shutdown Agent> to test host <nodename> has exceeded its configured timeout, <Process ID> will be terminated

2.WARNING : <Process ID> is not able to be terminated.

The SA <SA名> is now disabled from host <nodename>

内容

ノード <nodename> で、シャットダウンエージェント <Shutdown Agent> がタイムアウトしました。

対処

シャットダウン機構を再起動してください。

Advertisement Client : sendto error on socket errno 146

内容

sendto() -1 で復帰(errno =146)したことを意味しています。

本メッセージが出力された場合、スプリットブレイン時に意図しないノードが停止される場合があります。

対処

当社技術員 (SE) に連絡してください。

can't bind local address, errno xxx

内容

シャットダウン機構の設定時に存在しない IP アドレスが設定されました。

対処

シャットダウン機構で設定した IP アドレスを見直してください。

Host <nodename > has been put in the shutdown list.

内容

ノード <nodename > がシャットダウンリストに入りました。ノード <nodename > は停止されます。

対処

情報メッセージのため対処不要です。

Host <nodename > ICF communication failure detected.

内容

ノード <nodename > のハートビート停止がシャットダウン機構に通知されました。

対処

情報メッセージのため対処不要です。

MA Monitoring Agent reported host nodename leftcluster, state MA_paniced_fsnotflushed.

内容

コンソール非同期監視を行っている運用で、コンソールに "panic" の文字列を検出しました。

対処

情報メッセージのため対処不要です。

MA Monitoring Agent reported host nodename leftcluster, state MA_inprom

内容

コンソール非同期監視を行っている運用で、コンソールに OBP プロンプトを表す文字列を検出しました。

対処

情報メッセージのため対処不要です。

MA Monitoring Agent reported host nodename leftcluster, state MA_poweredoff

内容

非同期監視を行っている運用で、ノードの電源 OFF を検出しました。

対処

情報メッセージのため対処不要です。

PID pid has indicated a successful host shutdown.

内容

PID pid がノードの停止に成功しました。

対処

情報メッセージのため対処不要です。

rcsd died abnormally. Restart it.

内容

シャットダウンデーモン (rcsd) が異常終了後、再起動しました。

対処

シャットダウンデーモンは自動復旧するため対処は不要です。

SA SA_mmbp.so to shutdown host <nodename > succeeded

内容

MMB シャットダウンエージェントが ノード <nodename > を停止するのに成功しました。

対処

情報メッセージのため対処不要です。

SMAWsf : fopen of /etc/opt/SMAW/SMAWsf/rcsd.cfg failed, errno 2

内容

シャットダウン機構の設定が実施されておらず、シャットダウン機構の起動に失敗しています。

対処

シャットダウン機構の設定を見直した後、シャットダウンデーモンを起動し直してください。

SMAWsf : Fork Shutdown Agent(PID pid) to action host nodename

内容

ノード <nodename> に対するアクション <action> を実行するためにシャットダウンエージェント <Shutdown Agent> を起動しました。

対処

情報メッセージのため対処不要です。

SMAWsf : Host nodename has been put in the shutdown list

内容

ノード <nodename> はすでにシャットダウン対象となっています。

対処

情報メッセージのため対処不要です。

SMAWsf : PID pid has indicated a {successful | failed} host action

内容

シャットダウンエージェントが正常値、もしくは異常値を戻り値として終了しました。

対処

情報メッセージのため対処不要です。

SMAWsf : Processing event for host nodename

内容

受信したノード <nodename> CF イベント <event> の処理を開始しました。

対処

情報メッセージのため対処不要です。

SMAWsf : SA Shutdown Agent to init host nodename failed

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の初期化処理に失敗しました。

対処

調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。

SMAWsf : SA Shutdown Agent to init host nodename succeeded

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の初期化処理に成功しました。

対処

情報メッセージのため対処不要です。

SMAWsf : SA Shutdown Agent to shutdown host nodename failed

内容

シャットダウンエージェント <Shutdown Agent> がノード <nodename> を停止するのに失敗しました。

対処

調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。

SMAWsf : SA Shutdown Agent to shutdown host nodename succeeded

内容

シャットダウンエージェント <Shutdown Agent> がノード <nodename> を停止するのに成功しました。

対処

情報メッセージのため対処不要です。

SMAWsf : SA Shutdown Agent to unInit host nodename failed

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の終了時処理に失敗しました。

対処

調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<ト ラブルシューティング編>" を参照してください。

SMAWsf : SA Shutdown Agent to unInit host nodename succeeded

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の終了時処理に成功しました。

対処

情報メッセージのため対処不要です。

SMAWsf : SA SA_xscfp.so to test host nodename failed SMAWsf : SA SA_xscfr.so to test host nodename failed SMAWsf : SA SA_rccu.so to test host nodename failed SMAWsf : SA SA_ilomp.so to test host nodename failed

内容

XSCF、RCCUまたはILOMへの接続確認に失敗しました。

対処

接続確認失敗の原因として以下が考えられます。

XSCF、RCCUまたはILOMが正しく設定されていない

・ メッセージが表示されたノードからメッセージ中の nodename の XSCF、RCCUまたはILOM への接続ができない

ILOM 3.0 の場合、シャットダウン機構用のログインユーザに必要な権限が設定されていない

ILOM 3.0 の場合、シャットダウン機構用のログインユーザにSSH ホストベースキー認証を使用している

・ システムまたはネットワークの高負荷状態が続いた

上記について問題ないことを確認後、メッセージが出力されたノードで以下のコマンドを実行し、コンソール非同期監視機能および シャットダウン機構を再起動してください。

# /etc/opt/FJSVcluster/bin/clrccumonctl restart

# /opt/SMAW/bin/sdtool -r

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採 取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SMAWsf : SA SA_pprcip.so to test host nodename failed SMAWsf : SA SA_pprcir.so to test host nodename failed

内容

RCIへの接続確認に失敗しました。

対処

接続確認に失敗した原因として以下が考えられます。

RCIが正しく設定されていない

・ ケーブルが接続されていない

SCF/RCI経由での監視タイムアウト時間が/etc/systemファイルに設定されていない(監視タイムアウト時間の設定方法については、

PRIMECLUSTER導入運用手引書を参照してください)

・ システムの高負荷状態が続いた

上記について問題ないことを確認後、メッセージが出力されたノードで以下のコマンドを実行し、RCI 非同期監視機能およびシャット ダウン機構を再起動してください。

# /etc/opt/FJSVcluster/bin/clrcimonctl restart

# /opt/SMAW/bin/sdtool -r

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採

SMAWsf : SA SA_mmbp.so to test host nodename failed SMAWsf : SA SA_mmbr.so to test host nodename failed

内容

MMBへの接続確認に失敗しました。

対処

本メッセージがOS起動直後にのみ出力され、メッセージ出力の10分後に下記3083のメッセージが出力されている場合は、snmptrapd デーモンが起動中のため表示されるもので、対処不要です。

3083: Monitoring another node has been started.

上記に該当しない場合は、以下の設定を確認してください。

MMBのIPアドレス、または、MMBシャットダウン機構のシャットダウンデーモンに設定した、自ノードにおける管理LANのIPアドレ

スに、誤ったIPアドレスが指定されていないこと

MMBシャットダウン機構のMMB情報に登録されている、RMCPでMMBを制御するためのユーザのユーザ名・パスワードが誤っ

ていないこと

MMBシャットダウン機構に設定した、RMCPMMBを制御するためのユーザの[Privilege]が「Admin」になっていること

MMBシャットダウン機構に設定した、RMCPMMBを制御するためのユーザの[Status]が「Enabled」になっていること

MMBシャットダウン機構に設定した、RMCPでMMBを制御するためのユーザの設定を確認する方法については、"PRIMEQUEST 500/400シリーズ リファレンスマニュアル: 基本操作/GUI/コマンド"を参照してください。

設定に誤りがある場合は正しく変更後、全ノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -r

設定に誤りがなかった場合は、以下について確認してください。

snmptrapd デーモンが起動していること(ps(1) コマンド等により snmptrapd のプロセスの存在を確認)

HUB と LAN ケーブルが接続されているポートの正常ランプが点灯していること

MMB ポートのコネクタ、HUB 側コネクタから LAN ケーブルが抜けていないこと

MMB が故障していないこと

・ ノードやネットワークに負荷がかかっていないこと

上記が原因と判明した場合、対処を行った後、MMB 非同期監視は自動復旧します。

自動復旧には最大で 10 分かかります。

本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER活用ガイド<トラブルシューティング編>" を参照してください。

SMAWsf : select of CLI Pipe and RCSDNetPipe failed, error number 10

内容

シャットダウンデーモン中の select 関数がシグナルを受信し、異常復帰しました。

対処

シャットダウン機構が、CLI のパイプを再開させる動作を行います。また、システムで動く他のプロセスへの影響はないので、対処不要 です。

SMAWsf : sleep n seconds before invoking Shutdown Agent to kill nodename

内容

ノード <nodname> に対してシャットダウンエージェント <Shutdown Agent> を用いた強制シャットダウンを <n> 秒後に実行します。

ドキュメント内 活用ガイド <メッセージ集> (ページ 121-136)