[1] M. Katouda, M. Kobayashi, H. Nakai, and S. Nagase, J. Comput. Chem.32, 2756 (2011).
2 段階並列 DC‐MP2: 並列性能評価
T2K‐Tsukuba での並列加速度
(OpenMP
化はしていない)
基底関数: 6‐31G*
中央領域: AUTO (4 Å) バッファ: 7 Å
NGROUP = Ncore/ 16
– β
ストランド(Ala) 20 – (Ala) 40
大規模系で特に高い並列計算効率を実現
0 128 256 384 512
0 128 256 384 512
N
coreAcceleration ratio
Two-level One-level
0 128 256 384 512
0 128 256 384 512
N
coreAcceleration ratio
Two-level
2 段階並列 DC‐MP2: 「京」での性能評価
京での並列加速度
ポリエン鎖C 300 H 302
DC‐MP2/6‐31G*
MPI+ARMCI/OpenMP hybrid
N node N thread * FLOPS
計算時間[s] α strong
72 504 6.01% 4845
144 1008 5.80% 2478 98%
288 2016 5.45% 1246 97%
576 4032 3.99% 715 85%
1152 8064 2.36% 468 65%
部分系: C2H2(3)(1ユニット) バッファ領域: 左右8ユニット NGROUP = Nnode/ 18
SERIAL MP2アルゴリズム
*
各ノードでARMCI
の通信スレッド立ち上がるため、1
ノードにつき7
スレッド利用講義概要
7/7 量子化学計算の概要と構成要素、高速化
量子化学計算の目的と種類
量子化学計算の手順、構成要素と高速化 7/14 大規模系に適用するための量子化学計算法
フラグメント分割に基づく方法
フラグメント分子軌道(FMO)
法
分割統治(DC)
法
ラプラス変換MP2
法 2
電子積分の密度フィッティング法 MP2
計算への応用Laplace 変換 MP2 法 [1,2]
MP2 エネルギー :
分母があるので、このままではO(N 4 )
よりも小さくできない Laplace 変換 を利用
分子積分(ia|jb)
もΓ
になおす[O(N 5 )
の積分変換を除去]
積分(
数値求積)
が必要
occ vir MP2
, ,
( | ) 2( | ) ( | )
i j
b a b
i j a
ia jb ia jb ib ja E
0
1 exp( xs s )d x
0
0
MP2 , , ,
, ,
( ) ( ) ( ) ( ) [2 ]
( | )[2 ]
E X s Y s X s Y s ds
ds
( )
o cce
is i iTi
s
C C
X
i T
v r
( ) e
asa
a a
s
C C
Y
[1] M. Häser, Theor. Chim. Acta87, 147 (1993).
[2] P. Y. Ayala and G. E. Scuseria, J. Chem. Phys.110, 3660 (1999).
Laplace 変換 MP2: 求積法
最小二乗法で求積点を決定
O(N 4 )
の点数に対して実行するのは非効率 Minimax 法 [1]
求積誤差の最大値を最小にする 一般的な求積法
Gauss‐Laguerre
Exponential
に減衰する[0, ∞]
積分に有効 Euler‐Maclaurin
法
台形公式の誤差を見積もる方法 Romberg
積分 Euler‐Maclaurin
法の誤差への外挿法有限範囲への 変数変換が必要
[1] A. Takatsuka, S. Ten‐no, and W. Hackbusch, J. Chem. Phys.129, 044112 (2008).
Laplace 変換 MP2: Euler‐Maclaurin 求積
求積を台形公式で実行
積分範囲を有限にする変数変換が必要 Euler‐Maclaurin 法による誤差の見積もり
(A) (B)
1
2 2 2 2
0 1
1 1
( )d (0) (1)
1
k1 2
f r r f k f f
(5) (7)
2 2 2 2
2 4 6 8
(0) (0) (0) (0
12( 1) 720( 1) 30240( 1) 120
) 9600( 1)
f f f f
2
( )
2( ) d f r e s dr s
r = 0 でヤコビアンが 0 になるような変数変換を利用
2 3 4 5 6
2
0
( 0.9 ) 4 d
d 0
(1 )
rr r r r s
s r r
r
3 4
2
0 2
2 2 0
0.9 tan / 2
(1 )
d d
0, 0
d
rd
rs
r r
s r r s
r r
r
Laplace 変換 MP2: 計算手順
求積点ごとに以下を実行 ( 求積点 : s, 重み : w)
1.
行列X(s)
とY(s)
を求める2. Schwarz
のスクリーニングに用いる行列を求める3.
各κε
に対し、 を求めてディスクに保存 Γ
を計算し、 を足しこみ
を足しこみ4.
を足しこみ5.
を足しこみ6.
を求めてエネルギーに足しこみocc T
( ) e
is i ii
s
X C C ( )
vire
as a Taa
s
Y C C
( | ) X
,
( | ) Y
( | )
( | )
( | ) X
( | )
( | ) Y
( | )
, ,
[2
]
3
~6
でSchwarz
の 不等式を利用したスクリーニング
Laplace 変換 MP2: 計算時間
MP2 計算時間
ポリエン鎖C n H n+2
0 50 100 150 200 250
0 30 60 90 120 150
Canonical MP2 Laplace MP2
n
Comput at ional time [hour]
[Pentium4/3.0 GHz]
計算時間の削減 に成功 n
に対するスケー リングも改善Laplace 変換 MP2: 求積法の精度
MP2 相関エネルギーの求積法依存性
ベンゼン/6‐31G*
求積法 求積点数
E corr (diff.)
Gauss‐Laguerre 5 ‐0.733451 (+0.051311) Euler‐Maclaurin (A) 5 ‐0.770241 (+0.014521) Euler‐Maclaurin (B) 5 ‐0.784540 (+0.000221) Romberg (A) 7 ‐0.784643 (+0.000118) Romberg (B) 7 ‐0.783803 (+0.000958)
Canonical MP2 ‐0.784761
Euler‐Maclaurin (B) や Romberg が良い結果
誤差解析の結果にも対応
[Hartree]
[1] M. Kobayashi and H. Nakai, Chem. Phys. Lett.420, 250 (2006).
2 電子積分の密度フィッティング (RI 近似 )
2 電子積分
メモリにストアすることは困難(4
階テンソル)
原子軌道の積 を補助基底関数で展開
誤差の自己反発積分を最小化するように決定
まとめると1
,
d d
1 2( ) ( )
1 1r
12( ) ( )
2 2
r r r r r r
( ) ( )
r r ( )
( ) ( )
m( )
m
d
m
r r r r
1 2
1 2
12