アプリケーションの並列実行

この節では複数のプロセッサによる並列処理での

OpenFOAM

の実行方法について説明しま

す．

OpenFOAM

による並列処理の方法はドメインの分割として知られており，ジオメトリと

関連したフィールドを解析に用いるプロセッサに合わせてピースに分割します．並列処理には，

メッシュとフィールドの分割と，並列でのアプリケーションの実行がありますが，分割したケースの前処理については以降の節で説明します．並列処理には，標準の

MPI (message passing interface)

の実装である

openMPI

というパブリックドメインを使用しています．

3.4.1

メッシュの分解と初期フィールド・データ

メッシュとフィールドは，

decomposePar

ユーティリティを用いて分割します．この根本的な目的は，最小限の労力でドメインを分割しつつ，解析の効率性を向上させようとするものです．

ジオメトリとフィールドのデータは，

decomposeParDict

と名前のつけられたディクショナリの中で指定されたパラメータにより分割されますが，このディクショナリは対象とするケースの

system

ディレクトリの中におかれている必要があります．もしユーザが必要とする場合には，

interFoam/damBreak

チュートリアルから

decomposeParDict

ディクショナリをコピーすることができます．そして，ディクショナリ中のエントリを次のように置き換えます．

17 /*---*- C++ -*---*\

18 | ========= | |

19 | \\ / F ield | OpenFOAM: The Open Source CFD Toolbox |

20 | \\ / O peration | Version: 2.2.0 |

21 | \\ / A nd | Web: www.OpenFOAM.com |

22 | \\/ M anipulation | |

23 \*---*/

24 FoamFile

25 {

26 version 2.0;

27 format ascii;

28 class dictionary;

29 location "system";

30 object decomposeParDict;

31 }

32 // * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * //

34 numberOfSubdomains 4;

36 method simple;

38 simpleCoeffs

39 {

40 n ( 2 2 1 );

41 delta 0.001;

42 }

44 hierarchicalCoeffs

45 {

46 n ( 1 1 1 );

47 delta 0.001;

48 order xyz;

49 }

51 manualCoeffs

52 {

53 dataFile "";

54 }

56 distributed no;

58 roots ( );

59 60

61 // ************************************************************************* //

ユーザは，以下に述べる

method

キーワードにより指定できる四つの分割方法から選択します．

simple

簡単なジオメトリの分割：ドメインはx^，y^{方向に，例えば}x^{方向に二つに，}y^方向一つにというように，ピースが分割されます．

hierarchical

階層的なジオメトリの分割方法：基本的には

simple

と同じですが，ユーザが，

最初にy方向を，次にx方向を，というように，各方向の分割する順番を指定する点が異なっています．

scotch Scotch

分割はユーザからのジオメトリの入力を必要とせず，プロセッサの限界の数

値を最小化するよう試みます．ユーザは，任意指定の

processorWeights

^{キーワードに} よりプロセッサ間の重み付けを行うことができるため，パフォーマンスの異なるマシン同士を有効に使うことができます．また，もう一つ

strategy

という任意のキーワードエントリがあり，複雑な文字列を

Scotch

に渡すことにより分割の戦略を制御できます．

さらなる情報を得るには，ソースコードファイル

$FOAM_SRC/decompositionMethods/

decompositionMethods/scotchDecomp/scotchDecomp.C

を読んでください．

manual

マニュアルでの分割：個別のプロセッサに対して，各々のセルの割り当てを直接指定

します．

これらの各

method

については，ディクショナリのリストに示すように，

<method>coeffs

^と名前の付けられた

decompositionDict

のサブディクショナリの中で指定された係数のセットがあり

ます．

decompositionDict

ディクショナリの中にある入力のキーワードのフルセットの説明を，

表3.4に示します．

decomposePar

ユーティリティは以下のように入力することで正常に実行されます．

decomposePar

必須入力

numberOfSubdomains サブドメインの総数 N

method 分割方法

simple/

hierarchical/

scotch/ metis/

manual/

simpleCoeffsエントリ

n x，y，zのサブドメイン数 (nx, ny, nz)

delta セルのスキュー因数一般的には，10⁻³

hierarchicalCoeffsエントリ

n x，y，zのサブドメイン数 (n_x, n_y, n_z)

delta セルのスキュー因数一般的には，10⁻³

order 分割の順序 xyz/xzy/yzx...

scotchCoeffsエントリ processorWeights

（省略可）

プロセッサへのセルの割当の重み係数の一覧．例：

<wt1>はプロセッサ1の重み係数．重みは規格化され，どんな範囲の値も取ることが可能．

(<wt1>...<wtN>)

strategy 分割の戦略（省略可）．デフォルトは"b"

manualCoeffsエントリ

dataFile プロセッサへのセルの割当のデータを含むファイ

ル名

"<fileName>"

分散型データの入力（省略可）—3.4.3項参照

distributed データはいくつかのディスクのに分散しますか？ yes/no

roots ケースディレクトリへのルートパス．例：<rt1>

はノード1へのルートパス

(<rt1>...<rtN>)

表3.4 decompositionDictディクショナリのキーワード

最終的に，ケースディレクトリ内に各プロセッサに一つずつ一連のサブディレクトリが作成されるでしょう．そのディレクトリはプロセッサナンバを表すN = 0,1, . . .^を用いて

processorN

と名づけられ，そして分割されたフィールドの説明を含むタイムディレクトリや分解されたメッシュの説明を含む

constant/polyMesh

ディレクトリをもっています．

3.4.2

分解ケースの実行

分解された

OpenFOAM

のケースは

MPI

の

openMPI

を使って並列実行されます．

構成される

LAM

マルチコンピュータのホストマシンの名前があるファイルを作成する必要があります．ファイルには名前とパスを与えることができます．以下の記述では，フルパスを含んだ一般的な名前として

<machines>

としています．

この

<machines>

^{ファイルは，}

1

^行ごとに

1

台のマシンのリストをもっています．これらの名前は，

LAM

のスタート時にマシンの

/etc/hosts

ファイルの中のホスト名と，完全に一致させる必要があります．リストには，

openMPI

を実行するマシンの名前をもたせる必要があります．

ここに，マシンのノードは一つ以上のプロセッサをもっており，ノードの名称は

cpu=n

の登録に依存しますが，このn^{はノード上で}

openMPI

が実行されるプロセッサの数です．

例として，

aaa

，二つのプロセッサをもつ

bbb

^，

ccc

というマシン構成からマシン

aaa

^をホス

トとして

openMPI

を実行させるものとします．

<machines>

は次のようにします．

aaa

bbb cpu=2 ccc

openMPI

はそのとき以下の実行によって起動されます．

あるアプリケーションを

mpirun

を使って並列実行します．

mpirun --hostfile <machines> -np <nProcs>

<foamExec> <otherArgs> -parallel > log &

ここにあげた

<nProcs>

はプロセッサーの数，

<foamExec>

は

icoFoam

のような実行可能なファイル名であり，アウトプットは

log

と名前の付けられたファイルに変更されています．例えば，

$FOAM_RUN/tutorials/incompressible/icoFoam

^{ディレクトリの中の}

cavity

^{チュートリアルにお}

いて

icoFoam

を四つのノード上で走らせる場合には，以下のコマンドを実行させる必要があり

ます

mpirun --hostfile machines -np 4 icoFoam -parallel > log &

3.4.3

複数のディスクへのデータの分配

例であげたように，ローカルのディスクのみのパフォーマンスを向上させるために，データファイルを分配する必要が生じる場合が考えられます．このようなケースでは，ユーザは異なるマシン間のケースディレクトリに対するパスを見つけなければなりません．その場合には，

distributed

^と

roots

のキーワードを使って，パスを

decomposeParDict

^{ディクショナリの中} に指定する必要があります．

distributed

のエントリが以下のように読み込まれなければなりません．

distributed yes;

また，

roots

のエントリは，各々のノードである，

<root0>

^，

<root1>

^，

. . .

，のルートパスのリストとなっています．

roots

<nRoots>

(

"<root0>"

"<root1>"

...

);

<nRoots>

^{はルートの数です．}

各

processorN

^{ディレクトリは，}

decomposeParDict

ディクショナリの中で指定された各ルートパスにあるケースディレクトリの中に置かなければなりません．

system

ディレクトリや

constant

ディレクトリ中のファイルについてもまた，各々のケースディレクトリの中にある必要があり

ます．

constant

ディレクトリの中のファイル類は必要となりますが，

polyMesh

ディレクトリは

必要のないことに注意してください．

3.4.4

並列実行されたケースの後処理

並列実行されたケースの後処理時には，ユーザにふたつのオプションがあります．

完全なドメインとフィールドを再生するためにメッシュとフィールドの再構築を行う．ここではノーマルとして後処理を行うことができます．分割されたドメインを個別に引数で後処理を行う．

3.4.4.1

メッシュとデータの再構築

ケースが並列処理された後に，後処理によって再構築を行うことができます．ケースは，時刻ディレクトリの一つのセットの中にある各

processorN

ディレクトリから，時刻ディレクトリのセットを合併操作することにより再構築されます．

reconstructPar

ユーティリティは，次のように，コマンドラインから実行することにより機能を発揮します

reconstructPar

データが異なるディスクに分散されるときには，最初に，再構築におけるローカルのケースディレクトリにコピーされる必要があります．

3.4.4.2

分解ケースの後処理

6.1^{節に示すように}

paraFoam

ポストプロセッサを使って分割された各ケースの後処理を行えます．シミュレーション全体はケースを再構築することで後処理できますし，またはその代わりに個々のプロセッサディレクトリをそれ自体でひとつのケースとして扱うことで個々に分解されたドメインのセグメントを後処理することもできます．

ドキュメント内 OpenFOAM User Guide (ページ 86-90)