• 検索結果がありません。

アプリケーション固有のチューニング

3. チューニング・リファレンス

3.1. mpitune ユーティリティーを使用

3.1.2. アプリケーション固有のチューニング

チューナーにコマンドラインを指定することで、任意のアプリケーションのチューニングを実行します。パ フォーマンスは、指定されたアプリケーションの逆実行時間として計測されます。全体のチューニング時間を 短縮するため、設定 (ファブリック、ランクの配置など) を適用可能な、もっとも典型的なアプリケーションの ワークロードを使用します。

注意

アプリケーション固有モードでは、同様なコマンドラインと環境を使用して最も適切なチューニング結果を得 ることができます。

次に例を示します。

指定されたアプリケーションの構成設定を収集します。

$mpitune --application \"mpirun -n 32 ./myprog\" -of ./myprog.conf アプリケーションを実行する場合、記録された設定ファイルを使用します。

$mpirun -tune ./myprog.conf -n 32 ./myprog

デフォルトのチューニング規則に基づき、自動化されたチューニング・ユーティリティーは、アプリケーショ ンの実行時間を最小化するため、すべてのライブラリーを構成するパラメーターを評価します。デフォルトで は、生成されたファイルはすべてカレント・ワーキング・ディレクトリーに保存されます。

アプリケーションの設定ファイルには、そのアプリケーションと構成のみに最適なインテル® MPI ライブラリー のパラメーターが含まれます。インテル® MPI ライブラリーを同じアプリケーションの異なる構成 (ホスト数、

ワークロードなど) にチューニングする場合、対象の構成で自動チューニング・ユーティリティーを再実行して ください。

注意

デフォルトでは、自動チューニング・ユーティリティーは既存のアプリケーション向けの設定ファイルを上書 きします。アプリケーションの設定ファイルを保持したい場合、異なる名前で保存し、必要な時にすぐに選択 できるように、名前を付ける必要があります。

高速チューニング

ここでは、インテル® MPI ライブラリー向けの最適な設定を見つけるため mpitune ユーティリティーを使用す る方法を説明します。

構文

--fast [<value>] または –f [<value>]

または

I_MPI_TUNE_FAST=<value>

引数

<value> バイナリー・インジケーター。

enable | yes | on | 1 高速アプリケーション・チューニングを有効にします。この値は、ア

プリケーションのチューニングモードでのみ有効です。

disable | no | off | 0 高速アプリケーション・チューニングを無効にします。これは、デ

フォルト値です。

説明

I_MPI_TUNE_FASTをenableに設定すると、mpituneユーティリティーは代替の高速アプリケーション・

チューニング手順を実行します。高速アプリケーション・チューニングは、前回のチューニングに使用した設 定ファイルを使用します。

例 1

$ mpitune --application \”mpirun …\” --fast 例 2

$ export I_MPI_TUNE_FAST=enable

$ mpitune --application \”mpirun …\”

注意

-help と -fast オプションを指定すると、app_tune に関するヘルプが表示されます。

トポロジーを考慮したアプリケーションのチューニング

ここでは、mpitune ユーティリティーを使用してトポロジーを考慮したチューニングを行う方法を説明します。

ダイナミック・メソッドでこのチューニングを行う場合、「-use-app-topology」と

「I_MPI_HYDRA_USE_APP_TOPOLOGY」の説明をご覧ください。

I_MPI_TUNE_RANK_PLACEMENT

構文

--rank-placement [<value>] または -rp [<value>]

または

I_MPI_TUNE_RANK_PLACEMENT=<value>

引数

<value> バイナリー・インジケーター。

enable | yes | on | 1 mpituneユーティリティーをトポロジー・チューニング・ツールに 切り替えます。この値は、アプリケーションのチューニング・モード でのみ有効です。例えば、–applicationオプションもしくはアプ リケーション通信グラフ (ACG) とオプションのハードウェア・トポロ

ジー/グラフ (HTG) は、追加オプション-acgと-htgで渡されま

す。

disable | no | off | 0 トポロジー・チューニング・ツールを off に切り替えます。これ は、デフォルト値です。

説明

I_MPI_TUNE_RANK_PLACEMENTをenableに設定すると、mpituneラッパーは代替トポロジーツール

(mpitune_rank_placement) を実行します。

$ mpitune --application \”mpirun … \” --rank-placement

$ mpitune --application \”mpirun … \” --rank-placement enable

$ mpitune --application \”mpirun … \” -rp -acg <path to acg_file> -htg <path to htg_file>

結果は、host ファイルと host ファイルを使用して自動的に記録される設定ファイルです。

注意

--help と --rank-placement オプションを指定すると、mpitune_rank_placement に関するヘルプが表 示されます。

I_MPI_TUNE_APPLICATION_STATISTICS

構文

--application-statistics [<value>] または -s [<value>]

または

I_MPI_TUNE_APPLICATION_STATICSTICS=<value>

引数

<value> インテル® MPI ライブラリーのネイティブ統計ファイルのレベル 1 以

上へのパス。この設定は、--rank-placement オプションと同時に 指定された場合にのみ適用されます。

説明

インテル® MPI ライブラリーの統計ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニン

グ時間を短縮できます。

$ mpitune -rp -s <path to statistics file>

I_MPI_TUNE_APPLICATION_COMMUNICATION_GRAPH

構文

--application-communication-graph [<value>] または -acg [<value>]

または

I_MPI_TUNE_APPLICATION_COMMUNICATION_GRAPH=<value>

引数

<value> ACG ファイルへのパス。この設定は、--rank-placement オプショ ンと同時に指定された場合にのみ適用されます。

説明

ACG ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニング時間を短縮できます。

$ mpitune -rp -acg <path to acg_file>

I_MPI_TUNE_HARDWARE_TOPOLOGY_GRAPH

構文

--hardware-topology-graph [<value>] または -htg [<value>]

または

I_MPI_TUNE_HARDWARE_TOPOLOGY_GRAPH=<value>

引数

<value> ハードウェア・トポロジー・グラフが記述されたファイルへのパス。

この設定は、--rank-placement オプションと同時に指定された場 合にのみ適用されます。

説明

HTG ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニング時間を短縮できます。

$ mpitune -rp -acg <path to acg_file> -htg <path to htg_file>