Call DDI_SCOPE(DDI_WORLD) - Microsoft PowerPoint - 計算科学技術特論_小林

[1] M. Katouda, M. Kobayashi, H. Nakai, and S. Nagase, J. Comput. Chem.32, 2756 (2011).

2 段階並列 DC‐MP2: 並列性能評価

 T2K‐Tsukuba での並列加速度

(OpenMP

化はしていない

)

基底関数: 6‐31G*

中央領域: AUTO (4 Å) バッファ: 7 Å

NGROUP = N_core/ 16

– β

ストランド

(Ala) ₂₀ – (Ala) ₄₀

大規模系で特に高い並列計算効率を実現

0 128 256 384 512

N

_core

Acceleration ratio

Two-level One-level

0 128 256 384 512

N

_core

Acceleration ratio

Two-level

2 段階並列 DC‐MP2: 「京」での性能評価

 京での並列加速度



ポリエン鎖

C ₃₀₀ H ₃₀₂

 DC‐MP2/6‐31G*

 MPI+ARMCI/OpenMP hybrid

N _node N _thread ^* FLOPS

計算時間

[s] α strong

72 504 6.01% 4845

144 1008 5.80% 2478 98%

288 2016 5.45% 1246 97%

576 4032 3.99% 715 85%

1152 8064 2.36% 468 65%

部分系: C₂H₂₍₃₎(1ユニット) バッファ領域: 左右8ユニット NGROUP = N_node/ 18

SERIAL MP2アルゴリズム

*

各ノードで

ARMCI

の通信スレッド立ち上がるため、

1

ノードにつき

7

スレッド利用

講義概要

 7/7 量子化学計算の概要と構成要素、高速化



量子化学計算の目的と種類



量子化学計算の手順、構成要素と高速化

 7/14 大規模系に適用するための量子化学計算法



フラグメント分割に基づく方法



フラグメント分子軌道

(FMO)

法



分割統治

(DC)

法



ラプラス変換

MP2

法

 2

電子積分の密度フィッティング法

 MP2

計算への応用

Laplace 変換 MP2 法 ^[1,2]

 MP2 エネルギー :



分母があるので、このままでは

O(N ⁴ )

よりも小さくできない

 Laplace 変換を利用



分子積分

(ia|jb)

も

Γ

になおす

[O(N ⁵ )

の積分変換を除去

]



積分

(

数値求積

)

が必要

 

occ vir MP2

, ,

( | ) 2( | ) ( | )

i j

b a b

i j a

ia jb ia jb ib ja E       

   

1 exp( xs s )d x

 





MP2 , , ,

, ,

( ) ( ) ( ) ( ) [2 ]

( | )[2 ]

E X s Y s X s Y s ds

ds

         

 

   



 



      

    

 





 ^{( )}

^{o c}^c

^e

ⁱ^s ⁱ ⁱ^T

s  

^

^{C C}

X

i T

v r

( ) e

^a^s

a a

s  

^^

^{C C}

Y

[1] M. Häser, Theor. Chim. Acta87, 147 (1993).

[2] P. Y. Ayala and G. E. Scuseria, J. Chem. Phys.110, 3660 (1999).

Laplace 変換 MP2: 求積法

 最小二乗法で求積点を決定

 O(N ⁴ )

の点数に対して実行するのは非効率

 Minimax 法 ^[1]



求積誤差の最大値を最小にする

 一般的な求積法

 Gauss‐Laguerre

 Exponential

に減衰する

[0, ∞]

積分に有効

 Euler‐Maclaurin

法



台形公式の誤差を見積もる方法

 Romberg

積分

 Euler‐Maclaurin

法の誤差への外挿法

有限範囲への変数変換が必要

[1] A. Takatsuka, S. Ten‐no, and W. Hackbusch, J. Chem. Phys.129, 044112 (2008).

Laplace 変換 MP2: Euler‐Maclaurin 求積

 求積を台形公式で実行



積分範囲を有限にする変数変換が必要

 Euler‐Maclaurin 法による誤差の見積もり

(A) (B)

 

2 2 2 2

0 1

1 1

( )d (0) (1)

1 1 2

f r r f k f f



_



   

             



(5) (7)

2 2 2 2

2 4 6 8

(0) (0) (0) (0

12( 1) 720( 1) 30240( 1) 120

) 9600( 1)

f f f f

   

     

 





 

 

( )

( ) d f r e s dr s



r = 0 でヤコビアンが 0 になるような変数変換を利用

2 3 4 5 6

( 0.9 ) 4 d

d 0

(1 )

r r r r s

s r r

r



    

  





 



 

3 4

0 2

2 2 0

0.9 tan / 2

(1 )

d d

0, 0

d

s

r r

s r r s

r r

r 

 

  

 

 

  

 

Laplace 変換 MP2: 計算手順

 求積点ごとに以下を実行 ( 求積点 : s, 重み : w)

1.

行列

X(s)

と

Y(s)

を求める

2. Schwarz

のスクリーニングに用いる行列を求める

3.

各

κε

に対し、を求めてディスクに保存

 Γ

を計算し、を足しこみ



を足しこみ

4.

を足しこみ

5.

を足しこみ

6.

を求めてエネルギーに足しこみ

occ T

( ) e

ⁱ^s _i _i

s  

^

X C C ( )

^vir

e

^a^s _a ^T_a

s  

^^

Y C C

( | ) X

_ _{ },



    

( | ) Y

_

( | )



     

(   | )

( | ) X

_

( | )



     

( | ) Y

_

( | )



     

, ,

[2 

_{ }

 

_{ }

]

3

～

6

で

Schwarz

の不等式を利用した

スクリーニング

Laplace 変換 MP2: 計算時間

 MP2 計算時間



ポリエン鎖

C _n H _n+2

0 50 100 150 200 250

0 30 60 90 120 150

Canonical MP2 Laplace MP2

n

Comput at ional time [hour]

[Pentium4/3.0 GHz]



計算時間の削減に成功

 n

に対するスケーリングも改善

Laplace 変換 MP2: 求積法の精度

 MP2 相関エネルギーの求積法依存性



ベンゼン

/6‐31G*

求積法求積点数

E _corr (diff.)

Gauss‐Laguerre 5 ‐0.733451 (+0.051311) Euler‐Maclaurin (A) 5 ‐0.770241 (+0.014521) Euler‐Maclaurin (B) 5 ‐0.784540 (+0.000221) Romberg (A) 7 ‐0.784643 (+0.000118) Romberg (B) 7 ‐0.783803 (+0.000958)

Canonical MP2 ‐0.784761

 Euler‐Maclaurin (B) や Romberg が良い結果

 誤差解析の結果にも対応

[Hartree]

[1] M. Kobayashi and H. Nakai, Chem. Phys. Lett.420, 250 (2006).

2 電子積分の密度フィッティング (RI 近似 )

 2 電子積分



メモリにストアすることは困難

(4

階テンソル

)

 原子軌道の積を補助基底関数で展開



誤差の自己反発積分を最小化するように決定



まとめると

d d

1 2

( ) ( )

1 1

r

( ) ( )

2 2

 







 ^









   ^{r r} ^r ^r ^r ^r

( ) ( )

 

 r  r ( )

( ) ( )

( )

d

^ m

 

 



 ^r  ^r   ^r  ^r

1 2

( ) ( )

ドキュメント内 Microsoft PowerPoint - 計算科学技術特論_小林_0712.pptx (ページ 34-44)

Call DDI_SCOPE(DDI_WORLD)

2 段階並列 DC‐MP2: 並列性能評価

 T2K‐Tsukuba での並列加速度

(OpenMP

)

– β

(Ala) 20 – (Ala) 40

0 128 256 384 512

0 128 256 384 512

N

Acceleration ratio

Two-level One-level

0 128 256 384 512

0 128 256 384 512

N

Acceleration ratio

Two-level

2 段階並列 DC‐MP2: 「京」での性能評価

 京での並列加速度



C 300 H 302

 DC‐MP2/6‐31G*

 MPI+ARMCI/OpenMP hybrid

N node N thread * FLOPS

[s] α strong

72 504 6.01% 4845

144 1008 5.80% 2478 98%

288 2016 5.45% 1246 97%

576 4032 3.99% 715 85%

1152 8064 2.36% 468 65%

*

ARMCI

1

7

講義概要

 7/7 量子化学計算の概要と構成要素、高速化





 7/14 大規模系に適用するための量子化学計算法





(FMO)



(DC)



MP2

 2

 MP2

Laplace 変換 MP2 法 [1,2]

 MP2 エネルギー :



O(N 4 )

 Laplace 変換 を利用



(ia|jb)

Γ

[O(N 5 )

]



(

)

 

( | ) 2( | ) ( | )

ia jb ia jb ib ja E       

   

1 exp( xs s )d x

 



( ) ( ) ( ) ( ) [2 ]

( | )[2 ]

E X s Y s X s Y s ds

ds

 

      

    

 





 ( )

e

(Ala) ₂₀ – (Ala) ₄₀

C ₃₀₀ H ₃₀₂

N _node N _thread ^* FLOPS

Laplace 変換 MP2 法 ^[1,2]

O(N ⁴ )

 Laplace 変換を利用

[O(N ⁵ )

 ^{( )}

^e

^{C C}

^{C C}

 O(N ⁴ )

 Minimax 法 ^[1]