• 検索結果がありません。

GeoFEM開発の経験から

N/A
N/A
Protected

Academic year: 2021

シェア "GeoFEM開発の経験から"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

FrontISTRにおける

並列計算のしくみ <領域分割に基づく並列FEM>

メッシュ分割 領域分割 メッシュ分割 領域分割

領域

分割

(パーティショニング ツール)

メッシュ分割 領域分割 メッシュ分割 領域分割

領域

分割

(パーティショニング ツール)

ログ

Front ISTR

領域分割ツール 可視化ツール off リスター トデータ

Front ISTR

領域分割ツール 可視化ツール 可視化ツール 並列計算 逐次計算

全体制御

“hecmw_ctrl.dat”

解析制御

・境界条件 ・材料物性 ・計算制御パラメータ ・可視化パラメータ

メッシュ

off-line 可視化

可視化画像

計算結果

ログ

リスタート データ ・REVOCAP_Prepost ・AVS, ParaView

(2)

FrontISTRにおける

並列計算のしくみ <領域分割に基づく並列FEM>

FEMの主な演算

剛性マトリックスの作成

→部分領域(要素)ごとに並列処理可

剛性行列の求解 {反復法ソルバー, 直接法ソルバー}

反復法ソルバー

4種類の演算からなる

(1) 疎行列・ベクトル積

(2) ベクトル・ベクトル内積

(3) ベクトルの加減(DAXPY)

(4) 前処理

(3)

前処理付きCG法のアルゴリズム

compute r

(0)

= b – Ax

(0)

for some initial guess x

(0)

for i= 1,2,...

solve M z

(i-1)

= r

(i-1)

(M: preconditioning matrix)

i-1

= r

(i-1)T

z

(i-1)

if i=1

p

(1)

= z

(0)

else

i-1

=

i-1

/

i-2

p

(i)

= z

(i-1)

+

i-1

p

(i-1)

endif

q

(i)

= A p

(i)

i

=

i-1

/(p

(i)T

q

(i)

)

x

(i)

= x

(i-1)

+

i

p

(i)

r

(i)

= r

(i-1)

-

i

q

(i)

check convergence; continue if necessary

end

Preconditioning Dot Product (1) DAXPY (1) MATVEC Dot Product (2) DAXPY (2) DAXPY (3)

compute r

(0)

= b – Ax

(0)

for some initial guess x

(0)

for i= 1,2,...

solve M z

(i-1)

= r

(i-1)

(M: preconditioning matrix)

i-1

= r

(i-1)T

z

(i-1)

if i=1

p

(1)

= z

(0)

else

i-1

=

i-1

/

i-2

p

(i)

= z

(i-1)

+

i-1

p

(i-1)

endif

q

(i)

= A p

(i)

i

=

i-1

/(p

(i)T

q

(i)

)

x

(i)

= x

(i-1)

+

i

p

(i)

r

(i)

= r

(i-1)

-

i

q

(i)

check convergence; continue if necessary

end

Preconditioning Dot Product (1) DAXPY (1) MATVEC Dot Product (2) DAXPY (2) DAXPY (3)

(4)

FrontISTRにおける

並列計算のしくみ <領域分割に基づく並列FEM>

反復法ソルバーの並列処理

4種類の演算からなる

→通信しながら部分領域ごとに並列処理可

(1) 疎行列・ベクトル積

(2) ベクトル・ベクトル内積

(3) ベクトル(およびその実数倍)の加減(DAXPY)

通信不要

(4) 前処理

(5)

FrontISTRにおける

並列計算のしくみ <領域分割に基づく並列FEM>

領域分割 (domain decomposition, partitioning)

分散メッシュ = (通常の)メッシュ情報 + 通信テーブル

SPMD (Single Program Multiple Data) プログラム

部分領域ごとに(通常の)FEM計算 + 通信

通信はMPIによる

(6)

Large file handling → Local distributed data

Local Data

Local Data

Local Data

Local Data

MPI

MPI

MPI

Solver Subsystem

Solver Subsystem

Solver Subsystem

Solver Subsystem

Global operation occurs only in linear solver.

FEM Code

FEM Code

FEM Code

FEM Code

FE analysis modules just consider local operation

(element matrix assemble)

(7)

参考: FrontISTRにおける

並列計算のしくみ <ハイブリッド並列>

MPI – OpenMP ハイブリッド並列

領域分割

(フレーム部品)

部分領域間通信

スレッド並列

部分領域マトリックス

注意:本日の話題は MPI 並列のみです

(8)

+- hecmw_solve_CG_33 | +- hecmw_precond_33 | +- hecmw_matvec_33 | | | +- hecmw_update_3_R | | | +- hecmw_solve_SEND_RECV_33 | | | | | +- MPI_ISEND | | +- MPI_IRECV | | +- MPI_WAITALL | | +- MPI_WAITALL | | +- hecmw_InnerProduct_R | | | +- hecmw_allreduce_R1 | | | +- hecmw_allreduce_R | | | +- MPI_allREDUCE | program fstr_main | +- hecmw_init | +- T1 = hecmw_Wtime() | +- hecmw_get_mesh +- hecmw2fstr_mesh_conv +- fstr_init +- fstr_rcap_initialize | +- T2 = hecmw_Wtime() | +- fstr_linear_static_analysis | | | +- FSTR_SOLVE_LINEAR | | | +- solve_LINEQ | | | +- hecmw_solve_33 | | | +- ll.201-274: Block LU | | | +- hecmw_solve_CG_33 | +- T3 = hecmw_Wtime() | end program

連立一次方程式の求解(CG法)

行列ベクトル積

FrontISTRプログラムの構造 -- 並列CG法

CG iter. CG iter.

(9)

9

HEC-MW構造体(1) 分散メッシュ構造体

type hecmwST_local_mesh :: hecMESH

内容)

節点・要素・材料情報,PEおよび通信情報

特徴)

hecmw_get_mesh によりセット.

HPC-MW ライブラリィのハンドル的役割も

(2) PEおよび通信情報

integer(kind=kint) :: zero #0領域か? integer(kind=kint) :: my_rank ランク integer(kind=kint) :: PETOT 総領域数 integer(kind=kint) :: n_subdomain 総領域数(局所分散データからの読み込み) integer(kind=kint) :: n_neighbor_pe 隣接領域数 integer(kind=kint),pointer :: neighbor_pe(:) 隣接領域ID

integer(kind=kint),pointer :: import_index(:) 受信テーブル用一次元インデックス integer(kind=kint),pointer :: import_item(:) 受信テーブル配列 integer(kind=kint),pointer :: export_index(:) 受信テーブル用一次元インデックス integer(kind=kint),pointer :: export_item(:) 受信テーブル配列 integer(kind=kint),pointer :: shared_index(:) 送受信テーブル用一次元インデックス integer(kind=kint),pointer :: shared_item(:) 受信テーブル配列

(1) 全体情報

…前出

(3) 節点情報

…前出

(4) 要素情報

…前出

(5) 下部構造

…前出

構造体成分

(抜粋)

(PEおよび通信情報)

局所データには部分領域間の通

信テーブルも含まれている

(10)

10

領域間オーバーラップ要素を含む節点ベース領域分割

剛性マトリクスの足し込みなどの処理を

各領域で並列に

実施するためには、

オーバーラップ要素の情報が必要

5 21 22 23 24 25 16 17 18 19 20 11 13 14 15 6 7 8 9 10

PE#0

PE#1

PE#2

PE#3

12 3 2 4 1 5 21 22 23 24 25 16 17 18 19 20 11 13 14 15 6 7 8 9 10

PE#0

PE#1

PE#2

PE#3

12 3 2 4 1 1 2 3 4 5 6 7 8 9 11 10 14 13 15 12

PE#0

7 8 9 10 4 5 6 12 3 11 1 2

PE#1

7 1 2 3 10 9 11 12 5 6 8 4

PE#2

3 4 8 6 9 10 12 1 2 5 11 7

PE#3

1 2 3 4 5 6 7 8 9 11 10 14 13 15 12

PE#0

7 8 9 10 4 5 6 12 3 11 1 2

PE#1

7 1 2 3 10 9 11 12 5 6 8 4

PE#2

3 4 8 6 9 10 12 1 2 5 11 7

PE#3

節点は、通信の観点から以下の3種類に分類される:

{ } 内は PE#0 の例

・内点(Internal Nodes):各領域に割り当てられた節点

{1,2,3,4,5,6,7}

・外点(External Nodes):他の領域に属しているが、各領域の要素に含まれている節点

{8.9.10,11,12,13,14,15}

・境界点(Boundary Nodes):他の領域の外点となっている内点

{1,2,3,4,6}

4領域へ分割

(11)

11

境界点における値は隣接領域へ「送信(send)」され、送信先

では外点として「受信(receive)」される

SEND phase (PE#2 の例)

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

1

2

3

4

5

6

7

8

9

11

10

14

13

15

12

PE#0

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

1

2

3

4

5

6

7

8

9

11

10

14

13

15

12

PE#0

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

do neib= 1, NEIBPETOT istart= EXPORT_INDEX(neib-1)

inum = EXPORT_INDEX(neib ) - istart do k= istart+1, istart+inum

WS(k)= X(EXPORT_NODE(k)) enddo

call MPI_ISEND

(WS(istart+1), inum, MPI_DOUBLE_PRECISION, & NEIBPE(neib), 0, SOLVER_COMM, & req1(neib), ierr)

(12)

12

(つづき)

RECEIVE phase (PE#2 の例)

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

1

2

3

4

5

6

7

8

9

11

10

14

13

15

12

PE#0

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

1

2

3

4

5

6

7

8

9

11

10

14

13

15

12

PE#0

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

do neib= 1, NEIBPETOT istart= IMPORT_INDEX(neib-1)

inum = IMPORT_INDEX(neib ) - istart call MPI_IRECV

(WR(istart+1), inum, MPI_DOUBLE_PRECISION, & NEIBPE(neib), 0, SOLVER_COMM, & req2(neib), ierr)

enddo

call MPI_WAITALL (NEIBPETOT, req2, sta2, ierr) do neib= 1, NEIBPETOT

istart= IMPORT_INDEX(neib-1)

inum = IMPORT_INDEX(neib ) - istart do k= istart+1, istart+inum

X(IMPORT_NODE(k))= WR(k) enddo

enddo

(13)

疎行列・ベクトル積

do i= 1, N isL= INL(i-1) + 1 ieL= INL(i ) WVAL= WW(i,R) do j= isL, ieL inod = IAL(j)

WVAL= WVAL - AL(j) * WW(inod,Z) enddo

WW(i,Z)= WVAL * DD(i) enddo do i= N, 1, -1 SW = 0.0d0 isU= INU(i-1) + 1 ieU= INU(i ) do j= isU, ieU inod = IAU(j) SW= SW + AU(j) * WW(inod,Z) enddo

WW(i,Z)= WW(i,Z) - DD(i) * SW enddo

hecmw_matvec の中では、前出の通信を行ったのちに、部分領域ごとに並列に以

下の行列・ベクトル積を実行する

+- hecmw_solve_CG_33 | +- hecmw_precond_33 | +- hecmw_matvec_33 | | | +- hecmw_update_3_R | | | +- hecmw_solve_SEND_RECV_33 | | | | | +- MPI_ISEND | | +- MPI_IRECV | | +- MPI_WAITALL | | +- MPI_WAITALL | | +- hecmw_InnerProduct_R | | | +- hecmw_allreduce_R1 | | | +- hecmw_allreduce_R | | | +- MPI_allREDUCE |

行列・ベクトル積

(14)
(15)

Local Data Structure

Node-based Partitioning

internal nodes - elements - external nodes

5

21

22

23

24

25

16

17

18

19

20

11

12

13

14

15

6

7

8

9

10

1

2

3

4

5

6

7

8

9

11

10

14

13

15

12

PE#0

7

8

9

10

4

5

6

12

3

11

1

2

PE#1

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

5

21

22

23

24

25

16

17

18

19

20

11

12

13

14

15

6

7

8

9

10

PE#0

PE#1

PE#2

PE#3

5

21

22

23

24

25

16

17

18

19

20

11

12

13

14

15

6

7

8

9

10

(16)

Elements which include “internal nodes”

Provide data locality in order to carry

out element-by-element operation in

each partition

Local Data Structure : PE#0

internal nodes - elements - external nodes

1

2

3

4

5

6

7

PE#0

Partitioned nodes themselves

internal nodes

8

9

11

10

14

13

15

12

Nodes included in the elements

external nodes

Numbering : internal -> external

7

8

9

10

4

5

6

12

3

11

1

2

PE#1

7

1

2

3

10

9

11

12

5

6

8

4

PE#2

3

4

8

6

9

10

12

1

2

5

11

7

PE#3

Internal nodes which are “external nodes”

for other partitions

boundary nodes

参照

関連したドキュメント

12,000 円割引 + 500 円割引 = 12,500 インターネットからの 新規お申込みだと 円割引 ※1. 初度登録から

オープン後 1 年間で、世界 160 ヵ国以上から約 230 万人のお客様にお越しいただき、訪日外国人割合は約

ある周波数帯域を時間軸方向で複数に分割し,各時分割された周波数帯域をタイムスロット

【ヒアリング要旨】 地域女性ネット高岡のメンバーに聞く

製造業種における Operational Technology(OT)領域の Digital

吸収分割契約承認取締役会(東京電力株式会社) 平成27年5月1日 吸収分割契約承認取締役決定(当社) 平成27年5月1日 吸収分割契約締結

法人と各拠点 と各拠点 と各拠点 と各拠点 の連携及び、分割 の連携及び、分割 の連携及び、分割 の連携及び、分割. グループホーム

の主成分である。2015 年度における都内 SOx 排出量では、約 7