• 検索結果がありません。

ジョブスケジューラサーバの処理がハングアップしてしまう【UNIX 版】

ドキュメント内 トラブルシューティングガイド (ページ 156-162)

jobschmsgevent event_name[:project_name[/job_net_name]

4.13.4 ジョブスケジューラサーバの処理がハングアップしてしまう【UNIX 版】

対象バージョンレベル

・ Solaris版:5.0以降

・ Linux版:5.2、V10.0L10以降

・ Linux for Itanium版:V12.0L10以降

・ HP版:5.1以降

対処

原因

同時実行するジョブネットおよびジョブが多い場合や、メッセージ起動のジョブネットが多い場合、ジョブネットおよびジョブの起動が遅 れたり、ジョブ実行制御属性のジョブの状態が、ジョブスケジューラで正しく認識できなくなったりすることがあります。

対処方法

以下に示す方法で、メッセージキューを拡張してください。

Solaris 7/8/9の場合:

/etc/systemファイルに以下の設定を追加し、ファイルの編集後にシステムを再起動してください。

set msgsys:msginfo_msgtql=同時起動ジョブネット数(注1) × 4

set msgsys:msginfo_msgmnb=同時起動ジョブネット数(注1) × 200(注2) set msgsys:msginfo_msgseg(注3)=同時起動ジョブネット数(注1) × 200(注2) ÷ msginfo_msgssz値

set msgsys:msginfo_msgmap(注3)=msginfo_msgtql値 + 2(注4) set msgsys:msginfo_msgmni=4×利用サブシステム数(注5) 注1)

ジョブ実行制御属性およびInterstage属性のジョブネットを利用する場合は、同時起動ジョブ数も足して計算してください。

2)

“200”は標準的な値であり、ホスト名や出力ファイルへのパスの長さに依存して変化します。十分に検証を行って、適切な値を設定 してください。

3)

Solaris8以降では、“msgsys:msginfo_msgseg” および“msgsys:msginfo_msgmap”の値を設定する必要はありません。

4)

先にmsgsys:msginfo_msgtqlの値を求め、その値をもとに計算してください。

5)

EE版の場合です。SE版の場合は、利用サブシステム数を1としてください。

備考.

msgsys:msginfo_msgmnbとmsgsys:msginfo_msgmapは、最大値を指定するパラメタのため、現在の値が上記より小さい場合に修

正してください。それ以外のパラメタについては、現在の値に上記の設定値を加算してください。

Solaris 10の場合

/etc/projectファイルの設定値を、以下の値にしてください。

process.max-msg-qbytes=(privileged,同時起動ジョブネット数(注1)×200(注2),deny) project.max-msg-ids=(privileged,4×利用サブシステム数(注3),deny)

1)

ジョブ実行制御属性のジョブを利用する場合は、同時起動ジョブ数も足して計算してください。

2)

“200”は標準的な値であり、ホスト名や出力ファイルへのパスの長さに依存して変化します。十分に検証を行って、適切な値を設定 してください。

3)

EE/GEE版の場合です。SE版の場合は、利用サブシステム数を1としてください。

備考.

max-msg-qbytesとmax-msg-idsのOSのデフォルト値は、以下のとおりです。

- max-msg-qbytes:64KB

- max-msg-ids:128 HP版の場合:

msgtql 同時起動ジョブネット数(注1) × 4

msgmnb 同時起動ジョブネット数(注1) × 200(注2)

msgseg 同時起動ジョブネット数(注1) × 200(注2) ÷ msgssz値 msgmap msgtql値+2(注3)

msgmni 4×利用サブシステム数(注4)

1)

ジョブ実行制御属性のジョブを利用する場合は、同時起動ジョブ数も足して計算してください。

2)

“200”は標準的な値であり、ホスト名や出力ファイルへのパスの長さに依存して変化します。十分に検証を行って、適切な値を設定 してください。

3)

先にmsgtqlの値を求め、その値をもとに計算してください。

4)

EE版の場合です。SE版の場合は、利用サブシステム数を1としてください。

備考.

msgmnbとmsgmapは、最大値を指定するパラメタのため、現在の値が上記より小さい場合に修正してください。それ以外のパラメ

タについては、現在の値に上記の設定値を加算してください。

Linux版の場合:

/etc/sysctl.confファイルに以下の設定を追加し、ファイルの編集後にシステムを再起動してください。

kernel.msgmnb = 同時起動ジョブネット数(注1) × 200(注2)

kernel.msgmni = 4×利用サブシステム数(注3)

1)

ジョブ実行制御属性のジョブを利用する場合は、同時起動ジョブ数も足して計算してください。

2)

“200”は標準的な値であり、ホスト名や出力ファイルへのパスの長さに依存して変化します。十分に検証を行って、適切な値を設定 してください。

3)

EE版の場合です。SE版の場合は、利用サブシステム数を1としてください。

備考.

kernel.msgmnbは、最大値を指定するパラメタのため、現在の値が上記より小さい場合に修正してください。それ以外のパラメタに

ついては、現在の値に上記の設定値を加算してください。

(EE版のみ)

Linux版で複数サブシステム運用を行う場合、使用されるメッセージキューの数は、サブシステム数の4倍になります。そのため、使用

可能なメッセージキューの最大数をオーバーしてしまい、サブシステムの起動ができなくなることがあります。

この場合は、/etc/sysctl.confファイルに以下の設定を追加し、システムで使用可能なメッセージキューの最大数を拡張してください。

ファイルの編集後にはシステムを再起動してください。

kernel.msgmni=(使用可能なメッセージキューの最大数)

4.13.5 [接続先ホストの指定]ダイアログボックスで[OK]を選択すると応答がなくなる

対象バージョンレベル

・ Windows版:V5.0L10以降

・ Solaris版:5.0以降

・ Linux版:5.2、V10.0L10以降

・ Linux for Itanium版:V12.0L10以降

・ HP版:5.1以降

・ AIX版:5.1以降

・ DS版:V20L10

対処

確認ポイント

Systemwalker Operation Managerが使用するポート番号を他のアプリケーションで使用していませんか

対処方法

Operation Manager共通基盤デーモン/サービスが使用するポート番号(9367/tcp)を他のアプリケーションが使用していないか確認して

ください。

確認方法を以下に示します。

1. Systemwalker Operation Managerのデーモンまたはサービスを停止します。

2. netstat -anコマンドを投入し、ポート番号(9367/tcp)が使用されていないか確認します。

ポート番号 9367/tcpを他のアプリケーションで使用している場合は、Systemwalker Operation Managerが使用するポート番号を変更し てください。変更方法は、以下に示すマニュアルを参照してください。

・ V10.0L10/10.0以降の場合

“導入手引書”の“ポート番号の変更方法”

・ V5.0L10/5.0/V5.0L20/5.1/V5.0L30/5.2の場合

“導入手引書”の“ポート番号を変更する”

4.13.6 クラスタシステム運用中にフェールオーバが発生し、メッセージ「指定のホス

トが見つかりません」が表示される

エラーメッセージ

指定のホストが見つかりません

対象バージョンレベル

・ Windows版:V5.0L10以降

・ Solaris版:5.0以降

・ Linux版:5.2、V10.0L10以降

・ Linux for Itanium版:V12.0L10以降

・ HP版:10.0以降

・ AIX版:V13.2.0

対処

確認ポイント

待機系のノードに監視ホストの定義はありますか

原因

待機系のノードに監視ホストの定義がない、または誤っていることが考えられます。

対処方法

待機系の監視ホストの定義を、運用系の設定に合わせて定義を修正してください。

[Windows版の場合]

ポリシー抽出/配付機能を利用して、定義してある監視ホストの定義情報を、もう一方のノードに反映します。

[UNIX版の場合]

以下のファイルを、rcpなどのコマンドを利用して、他方のノードに複写してください。

Solaris版およびLinux版の場合:

/var/opt/FJSVJMCMN/etc/monitor_hosts HP版の場合:

/opt/FHPJMCMN/db/etc/monitor_hosts AIX版の場合:

/opt/FAIXJMCMN/db/etc/monitor_hosts 詳細は、以下に示すマニュアルを参照してください。

・ V10.0L10/10.0以降の場合

“クラスタ適用ガイド”の“Systemwalker Operation Managerの環境定義の統一”

・ V5.0L30/5.2の場合

“導入手引書”の“SystemWalker/OperationMGRの環境定義の統一”

・ V5.0L10/V5.0L20の場合

“導入手引書”の“SystemWalker/OperationMGRでの環境設定”

・ 5.0/5.1の場合

“解説書”の“環境定義”

4.13.7 ファイル待ち合わせをするジョブを多数登録しているが、CPU の負荷が高く

なる【UNIX 版】

対象バージョンレベル

・ Solaris版:5.0~10.1

・ Linux版:5.2、V10.0L10

・ HP版:5.1、10.0

・ AIX版:5.1、10.0

・ DS版:V20L10

対処

原因

サンプルを提供しているchkfile.shでは、1秒間隔でファイル更新をチェックしています。運用環境に合わせ、CPU 負荷を考慮して間 隔を変更してください。chkfile.shの以下の部分を変更します。

例)ファイルチェック間隔を1秒(デフォルト)から、10秒に変更する場合 変更前: sleep 1

変更後: sleep 10

4.13.8 xxxxxxxx.exe アプリケーションを正しく初期化できませんでした。(xxxxxxxx は、tskgrsrv、tskelsrv、tskwnsrv、tskbasrv、tskussrv、tskevsrv のい ずれか)【Windows 版】

対象バージョンレベル

・ Windows版:V5.0L10以降

対処

確認ポイント

デスクトップヒープ領域の設定を変更していませんか

原因

ジョブスケジューラサービスの起動時にデスクトップヒープ領域が割り当てられないためと考えられます。

対処方法

レジストリを修正してデスクトップヒープを拡大してください。適正値を見積もる方法はありませんので、徐々に拡大してください。

手順は以下のとおりです。

1. レジストリエディタを起動します。

[スタート]-[ファイル名を指定して実行]で“regedt32”と入力して[OK]ボタンを押してください。

2. SubSystemsキーに移動します。

HKEY_LOCAL_MACHINEサブツリーから次のキーに移動します。

¥System¥CurrentControlSet¥Control¥Session Manager¥SubSystems

3. [Windows] の値を選択します。

4. [編集] メニューで [文字列] を選択します。

5. SharedSectionパラメータの値を変更し、デスクトップヒープを増加させます。

3番目の値“zzzz”を増加(256KB、または512KBずつ)させてください。

SharedSection=xxxx,yyyy,zzzz

注)1番目の値“xxxx”と2番目の値“yyyy”は変更する必要はありません。

- 例)変更前

SharedSection=1024,3072,512

- 例)変更後

SharedSection=1024,3072,1024 6. システムを再起動します。

参考

レジストリを修正して、デスクトップヒープを拡大する方法についての詳細は、「マイクロソフト サポート技術情報 - 126962」を参照してく ださい。また、デスクトップヒープについては「マイクロソフト サポート技術情報 - 184802」を参照してください。

ドキュメント内 トラブルシューティングガイド (ページ 156-162)

Outline

関連したドキュメント