3. チューニング・リファレンス
3.1. mpitune ユーティリティーを使用
3.1.2. アプリケーション固有のチューニング
チューナーにコマンドラインを指定することで、任意のアプリケーションのチューニングを実行します。パ フォーマンスは、指定されたアプリケーションの逆実行時間として計測されます。全体のチューニング時間を 短縮するため、設定 (ファブリック、ランクの配置など) を適用可能な、もっとも典型的なアプリケーションの ワークロードを使用します。
注意
アプリケーション固有モードでは、同様なコマンドラインと環境を使用して最も適切なチューニング結果を得 ることができます。
次に例を示します。
指定されたアプリケーションの構成設定を収集します。
$mpitune --application \"mpirun -n 32 ./myprog\" -of ./myprog.conf アプリケーションを実行する場合、記録された設定ファイルを使用します。
$mpirun -tune ./myprog.conf -n 32 ./myprog
デフォルトのチューニング規則に基づき、自動化されたチューニング・ユーティリティーは、アプリケーショ ンの実行時間を最小化するため、すべてのライブラリーを構成するパラメーターを評価します。デフォルトで は、生成されたファイルはすべてカレント・ワーキング・ディレクトリーに保存されます。
アプリケーションの設定ファイルには、そのアプリケーションと構成のみに最適なインテル® MPI ライブラリー のパラメーターが含まれます。インテル® MPI ライブラリーを同じアプリケーションの異なる構成 (ホスト数、
ワークロードなど) にチューニングする場合、対象の構成で自動チューニング・ユーティリティーを再実行して ください。
注意
デフォルトでは、自動チューニング・ユーティリティーは既存のアプリケーション向けの設定ファイルを上書 きします。アプリケーションの設定ファイルを保持したい場合、異なる名前で保存し、必要な時にすぐに選択 できるように、名前を付ける必要があります。
高速チューニング
ここでは、インテル® MPI ライブラリー向けの最適な設定を見つけるため mpitune ユーティリティーを使用す る方法を説明します。
構文
--fast [<value>] または –f [<value>]
または
I_MPI_TUNE_FAST=<value>
引数
<value> バイナリー・インジケーター。
enable | yes | on | 1 高速アプリケーション・チューニングを有効にします。この値は、ア
プリケーションのチューニングモードでのみ有効です。
disable | no | off | 0 高速アプリケーション・チューニングを無効にします。これは、デ
フォルト値です。
説明
I_MPI_TUNE_FASTをenableに設定すると、mpituneユーティリティーは代替の高速アプリケーション・
チューニング手順を実行します。高速アプリケーション・チューニングは、前回のチューニングに使用した設 定ファイルを使用します。
例 1
$ mpitune --application \”mpirun …\” --fast 例 2
$ export I_MPI_TUNE_FAST=enable
$ mpitune --application \”mpirun …\”
注意
-help と -fast オプションを指定すると、app_tune に関するヘルプが表示されます。
トポロジーを考慮したアプリケーションのチューニング
ここでは、mpitune ユーティリティーを使用してトポロジーを考慮したチューニングを行う方法を説明します。
ダイナミック・メソッドでこのチューニングを行う場合、「-use-app-topology」と
「I_MPI_HYDRA_USE_APP_TOPOLOGY」の説明をご覧ください。
I_MPI_TUNE_RANK_PLACEMENT
構文
--rank-placement [<value>] または -rp [<value>]
または
I_MPI_TUNE_RANK_PLACEMENT=<value>
引数
<value> バイナリー・インジケーター。
enable | yes | on | 1 mpituneユーティリティーをトポロジー・チューニング・ツールに 切り替えます。この値は、アプリケーションのチューニング・モード でのみ有効です。例えば、–applicationオプションもしくはアプ リケーション通信グラフ (ACG) とオプションのハードウェア・トポロ
ジー/グラフ (HTG) は、追加オプション-acgと-htgで渡されま
す。
disable | no | off | 0 トポロジー・チューニング・ツールを off に切り替えます。これ は、デフォルト値です。
説明
I_MPI_TUNE_RANK_PLACEMENTをenableに設定すると、mpituneラッパーは代替トポロジーツール
(mpitune_rank_placement) を実行します。
例
$ mpitune --application \”mpirun … \” --rank-placement
$ mpitune --application \”mpirun … \” --rank-placement enable
$ mpitune --application \”mpirun … \” -rp -acg <path to acg_file> -htg <path to htg_file>
結果は、host ファイルと host ファイルを使用して自動的に記録される設定ファイルです。
注意
--help と --rank-placement オプションを指定すると、mpitune_rank_placement に関するヘルプが表 示されます。
I_MPI_TUNE_APPLICATION_STATISTICS
構文
--application-statistics [<value>] または -s [<value>]
または
I_MPI_TUNE_APPLICATION_STATICSTICS=<value>
引数
<value> インテル® MPI ライブラリーのネイティブ統計ファイルのレベル 1 以
上へのパス。この設定は、--rank-placement オプションと同時に 指定された場合にのみ適用されます。
説明
インテル® MPI ライブラリーの統計ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニン
グ時間を短縮できます。
例
$ mpitune -rp -s <path to statistics file>
I_MPI_TUNE_APPLICATION_COMMUNICATION_GRAPH
構文
--application-communication-graph [<value>] または -acg [<value>]
または
I_MPI_TUNE_APPLICATION_COMMUNICATION_GRAPH=<value>
引数
<value> ACG ファイルへのパス。この設定は、--rank-placement オプショ ンと同時に指定された場合にのみ適用されます。
説明
ACG ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニング時間を短縮できます。
例
$ mpitune -rp -acg <path to acg_file>
I_MPI_TUNE_HARDWARE_TOPOLOGY_GRAPH
構文
--hardware-topology-graph [<value>] または -htg [<value>]
または
I_MPI_TUNE_HARDWARE_TOPOLOGY_GRAPH=<value>
引数
<value> ハードウェア・トポロジー・グラフが記述されたファイルへのパス。
この設定は、--rank-placement オプションと同時に指定された場 合にのみ適用されます。
説明
HTG ファイルを mpitune (mpitune_rank_placement) へ渡すと、チューニング時間を短縮できます。
例
$ mpitune -rp -acg <path to acg_file> -htg <path to htg_file>