BiCGStar法の提案と性能評価
5
0
0
全文
(2) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-HPC-138 No.2 2013/2/21. まず,Hk+1 Rk+1 の Rk を展開することで次式が得られる.. Hk+1 Rk+1 = Hk+1 Rk − αk λHk+1 Pk ,. (5). v k = x k + α k pk ,. (20). xk+1 = tk + αk wk .. (21). と表される.. Hk+1 Rk の Hk+1 を展開すると Hk+1 Rk = (1 + ηk )Hk Rk − ζk λHk Rk − ηk Hk−1 Rk .. (6). ここで,安定化多項式のパラメータは准残差のノルム ||a r k || を局所的に最小化するよう に決定する.式 (11) より,z k = uk−1 − r k とおくと,准残差は. となる.同様に,Hk+1 Pk の Hk+1 を展開すると,. Hk+1 Pk = (1 + ηk )Hk Pk − ζk λHk Pk − ηk Hk−1 Pk. ||a r k || = ||r k − ζk Ar k − ηk z k ||.. (7). となる.式 (6),(7) より,Hk Rk+1 ,Hk Pk+1 を更新する必要がある.Rk+1 ,Pk+1 を展開. と表される.式 (22) より,ζk ,ηk は,正規方程式. (. することで,. Hk Rk+1 = Hk Rk − αk λHk Pk ,. (8). Hk Pk+1 = Hk Rk+1 − βk Hk Pk .. (9). 式 (5) - (9) より,Hk Rk ,Hk Pk から Hk+1 Rk+1 が得られることがわかる.また,Hk+1 Pk+1. T. (Ar k z k ) (Ar k z k ). = (Ar k z k )T r k .. ηk. (23). (z k , z k )(Ar k , r k ) − (Ar k , z k )(z k , r k ) , (Ar k , Ar k )(z k , z k ) − (Ar k , z k )(z k , Az k ) (Ar k , Ar k )(z k , r k ) − (Ar k , z k )(Ar k , r k ) ηk = . (Ar k , Ar k )(z k , z k ) − (Ar k , z k )(z k , Az k ) ζk =. (10). ここで,三つの補助ベクトルを wk := Hk+1 (A)Pk (A)r 0 ,pk := Hk (A)Rk+1 (A)r 0 ,. uk := Hk (A)Pk+1 (A)r 0 と定義する.このとき,式 (5) - (9) より,以下のベクトルの更新 式が得られる.. ). ζk. を解くことにより,以下で与えられる.. は次式で得られる.. Hk+1 Pk+1 = Hk Rk+1 − βk Hk+1 Pk .. (22). (24) (25). αk ,βk は,双直交条件より Hk (A)Rk+1 (A)r 0 と AHk (A)Pk+1 (A)r 0 が初期シャドウ残. a r k = (1 + ηk )r k − ζk Ar k − ηk uk−1 ,. (11). wk = (1 + ηk )pk − ζk Apk − ηk q k−1 ,. (12). ˜ 0 と直交するように決定する. 差r uk = r k − αk Apk ⊥ r ∗0 , Aq k = Auk − βk Apk ⊥. (26). r ∗0 ,. uk = r k − αk Apk ,. (13). r k+1 = a r k − αk Awk ,. (14). より,(˜ r 0 , r k ) − αk (˜ r 0 , Apk ) = 0, (˜ r 0 , Auk ) − βk (˜ r 0 , Apk ) = 0 となる.したがって,αk ,. q k = uk − βk pk ,. (15). βk は次式で与えられる.. pk+1 = r k+1 − βk wk .. (16). αk =. 更新には Ar k ,Apk ,Awk の 3 回の行列ベクトル積を必要とするが,漸化式. Apk+1 = Ar k+1 − βk Awk .. (17). 次に,残差に関する更新式 (11) と (12) そして (14) に対応する近似解の更新式を求める.. (a). ⓒ 2013 Information Processing Society of Japan. (28). 文献1) に倣い,(r ∗0 , Auk ) = (AT r ∗0 , uk ) より,βk = は反復開始前に計算する.. (b) tk = (1 + ηk )xk + ζk r k − ηk (xk−1 + αk−1 uk−1 ).. (r ∗0 , Auk ) . (r ∗0 , Apk ). 式 (28) による βk の更新は行列ベクトル積 Auk を必要とする.行列ベクトル積の計算を避. 式 (11) に対応する近似解の更新式は,ベクトル tk を b − Atk = a r k を満たすベクトルと すると,. と得られる.同様に,式 (12),(14) に対応する更新式は,. βk =. けるため βk の計算方法として以下の 2 通りを考える.. により Apk+1 を更新することで,行列ベクトル積の計算 1 回が不要となる.. b − Atk = (1 + ηk )r k − ζk Ar k − ηk uk−1 ,. (r ∗0 , r k ) , (r ∗0 , Apk ). (27). 文献9) に倣い,βk = − αζ k · k. (r ∗ 0 ,r k+1 ) (r ∗ ,r k ) 0. (AT r ∗ 0 ,uk ) (r ∗ ,Apk ) 0. が得られる.AT r ∗0. とする.(r ∗0 , r k+1 ) は更新後の r k+1 を用いる.. (18) (19). ここでは,上記の (a) の方法を用いる. 以上の結果から,BiCGStar 法のアルゴリズムが次のように得られる.. 2.
(3) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-HPC-138 No.2 2013/2/21. 2.2 BiCGStar 法のアルゴリズム Algorithm 1: BiCGStar 法 1. Let x0 be an initial guess, and put r 0 = b − Ax0 2. Choose r ∗0 such that (r 0 , r ∗0 ) ̸= 0 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22.. T. (1). Compute Ar 0 , A Set β−1 = 0, q −1 = v −1 = w−1 = z 0 = 0 for k = 0, 1, . . . , do : begin pk = r k − βk−1 wk−1 , Apk = Ar k − βk−1 Awk−1 , (r ∗ , r k ) αk = ∗0 , (r 0 , Apk ) (Ar k , r k )(z k , z k ) − (z k , r k )(Ar k , z k ) ζk = , (Ar k , Ar k )(z k , z k ) − (z k , Ar k )(Ar k , z k ) (Ar k , Ar k )(z k , r k ) − (z k , Ar k )(Ar k , r k ) ηk = , (Ar k , Ar k )(z k , z k ) − (z k , Ar k )(Ar k , z k ) (Ar k , r k ) (if k = 0, then ζk = , ηk = 0), (Ar k , Ar k ) a r k = r k − ζk Ar k − ηk z k , tk = (1 + ηk )xk + ζk r k − ηk v k−1 , wk = (1 + ηk )pk − ζk Apk − ηk q k−1 , Compute Awk , v k = xk + αk pk , uk = r k − αk Apk , r k+1 = a r k − αk Awk , xk+1 = tk + αk wk , ||r k+1 ||2 if ≤ ϵ stop, ||r 0 ||2 Compute Ar k+1 , βk =. 3. 数 値 実 験 数値実験では,GPBiCG 法,GPBiCG v1- v2 法,BiCGStar 法の合計四つの解法につ. 計算機環境. . 計算機:Dell Power Edge(CPU: Intel Xeon X5570, クロック周波数: 2.93GHz, メモリ: 24Gbytes, OS: RedHatEnterprise Linux 5.6,ホスト名:dell3). r ∗0. (AT r ∗0 , uk ) , (r ∗0 , Apk ) 24. q k = uk − βk pk , 25. z k+1 = uk − r k+1 , 26. end do 23.. 3.1 計算機環境と計算条件. . (2). プログラム言語:Fortran90,コンパイラ:Intel Fortran Compiler ver. 11.1. (3). 最適化オプションは “-O3” を使用した.. (4). 計算は倍精度浮動小数点演算で行い,時間計測は C 言語の関数 gettimeofday を用いた.. . 計算条件. (1). ˆ = (1, 1, ..., 1)T とし,b = Aˆ 右辺項ベクトル b は厳密解を x x で作成した.. (2). 収束判定値は相対残差の 2 ノルム:||r k+1 ||2 /||r 0 ||2 ≤ 10−12 とした.. (3). 初期近似解 x0 はすべて 0,最大反復回数は 50000 回とした.. (4). 行列は予め対角スケーリングによって対角項を 1 に正規化した.. (5). 前処理は ILU(0) とし,加速係数 γ の値は 1.0 とした.. (6). 初期シャドウ残差 r ∗0 は初期残差 r 0 と同じとした.. . . . 3.2 テスト行列 表 1 にテスト行列の特徴を示す.行列はフロリダ大学の疎行列データベース6) より選出 した.また,テスト行列は全部で 10 個,すべて非対称行列である.. 3.3 実 験 結 果 表 2 に各解法の実験結果を示す.ここで,“比 1” は原型の GPBiCG 法に対する計算時間 の比を示し,“比 2” は原型の GPBiCG 法に対する 1 反復当たりの平均計算時間の比を示 す.“比 3” は平均時間の比を表す. 表 2 の結果から,次の観察が得られた.. (1). 行列 xenon2 において,BiCGStar 法が,反復回数,計算時間共に最も優れている.. (2). 行列 bcircuit,sme3Da では,BiCGStar 法の反復回数が GPBiCG 法の約 80%と優. (3). TRR は解法による差がほとんど見られない.. れた値となった. 表 3 に各解法の計算時間による順位を示す.. いて実験を行った.. ⓒ 2013 Information Processing Society of Japan. 3.
(4) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-HPC-138 No.2 2013/2/21. 表 2 各反復解法の性能比較 Table 2 Comparison of performance of some iterative methods.. 表 1 テスト行列の特徴 Table 1 Specification of test matrices. 行列. atmosmodd poisson3Db water tank bcircuit xenon2 sme3Da sme3Dc big ecl32 k3plates. 次元数. 非零要素数. 平均非零 要素数. 解析分野 問題分野. 行列. 解法. 1,270,432 85,623 60,740 68,902 157,464 12,504 42,930 13,209 51,993 11,107. 8,814,880 2,374,949 2,035,281 375,558 3,866,688 874,887 3,148,656 91,465 380,415 378,927. 6.94 27.74 33.51 5.45 24.5 69.97 73.34 6.92 7.32 34.12. 流体問題 同上 同上. atmosmodd. GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar. 回路問題 要素問題. poisson3Db. 構造解析 同上 重み付きグラフ 半導体問題. water tank. 音響問題. bcircuit. 表 3 の結果から,次の観察が得られる.. (1). BiCGStar 法が七つの行列に対して最も速い結果になった.. (2). その他の解法では,GPBiCG v2 法が優れていた.. xenon2. 図 1(a)-(d) に各解法の四つの行列に対する残差履歴を示す. 図 1 に示したグラフから,以下の観察が得られた.. (1). 図 1(a) より,行列 xenon2 では,BiCGStar 法が最も速く収束した.. (2). その他の行列でも,BiCGStar 法は平均的に速く収束した.. 4. ま と め. sme3Da. sme3Dc. 本稿では,准残差と三項漸化式に基づいた BiCGStar 法を示した.准残差を使用するこ とで,収束性が変化することが得られた.数値実験により,BiCGStar 法が GPBiCG 法, 三項漸化式を使用する二つの変形版 GPBiCG 法と比較して,収束性が優れているという結. big. 論が得られた.. 参. 考. 文. 献. 1) K. Abe, G.L.G. Sleijpen, Solving linear equations with a stabilized GPBiCG method, to be published in Applied Numerical Mathematics, (http://dx.doi.org/ 10.1016/j.apnum.2011.06.010). 2) S. Fujino, M. Fujiwara and M. Yoshida: BiCGSafe method based on minimization of associate residual, Transactions of JSCES, No.20050028, 2005. (in Japanese). ⓒ 2013 Information Processing Society of Japan. ecl32. k3plates. 反復 回数. 比1. 合計計算 時間 [s]. 比2. 平均 時間 [ms]. 比3. TRR. 308 296 283 296 286 297 288 284 2,034 2,062 1,953 2,054 15,567 12,477 16,966 12,855 1,158 1,192 1,166 1,085 4,099 3,583 2,859 3,322 5,366 6,600 4,742 4,770 1,745 1,761 1,776 1,791 377 370 347 373 4,892 4,774 4,417 4,282. 1.00 0.96 0.92 0.96 1.00 1.04 1.01 0.99 1.00 1.01 0.96 1.01 1.00 0.80 1.09 0.83 1.00 1.03 1.01 0.94 1.00 0.87 0.70 0.81 1.00 1.23 0.88 0.89 1.00 1.01 1.02 1.03 1.00 0.98 0.92 0.99 1.00 0.98 0.90 0.88. 26.430 25.550 24.424 22.408 4.832 5.059 4.871 4.658 18.955 19.342 18.369 18.507 57.084 47.796 63.879 44.325 23.018 24.010 23.680 20.491 15.354 13.731 10.798 12.272 98.413 121.121 86.980 86.315 1.033 1.081 1.084 1.020 1.014 1.050 0.978 0.939 6.340 6.242 5.749 5.398. 1.00 0.97 0.92 0.85 1.00 1.05 1.01 0.96 1.00 1.02 0.97 0.98 1.00 0.84 1.12 0.78 1.00 1.04 1.03 0.89 1.00 0.89 0.70 0.80 1.00 1.23 0.88 0.88 1.00 1.05 1.05 0.99 1.00 1.04 0.96 0.93 1.00 0.98 0.91 0.85. 85.614 86.111 86.085 75.493 16.853 16.993 16.872 16.359 9.316 9.376 9.401 9.006 3.667 3.830 3.765 3.448 19.863 20.129 20.295 18.870 3.745 3.831 3.776 3.693 18.338 18.350 18.340 18.093 0.591 0.614 0.610 0.569 2.682 2.832 2.810 2.512 1.296 1.307 1.301 1.260. 1.00 1.01 1.01 0.88 1.00 1.01 1.00 0.97 1.00 1.01 1.01 0.97 1.00 1.04 1.03 0.94 1.00 1.01 1.02 0.95 1.00 1.02 1.01 0.99 1.00 1.00 1.00 0.99 1.00 1.04 1.03 0.96 1.00 1.06 1.05 0.94 1.00 1.01 1.00 0.97. -10.00 -10.10 -10.00 -10.01 -10.00 -10.00 -10.00 -10.04 -10.19 -10.03 -10.02 -10.02 -10.02 -9.60 -9.86 -9.77 -10.00 -10.02 -10.00 -10.00 -11.30 -9.53 -9.86 -9.86 -9.99 -9.34 -9.18 -9.45 -10.03 -9.66 -9.67 -10.52 -10.00 -10.09 -10.01 -10.12 -10.05 -10.00 -10.04 -10.04. 4.
(5) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-HPC-138 No.2 2013/2/21. 表 3 各解法の計算時間による順位 Table 3 Ranking of iterative methods in view of computational time 解法. GPBiCG GPBiCG v1 GPBiCG v2 BiCGStar 合計 0. 合計. 合計 順位. 29 34 24 13 -. 3 4 2 1 -. 4 3 5 2 0 10 0. GPBiCG GPBiCG-v1 GPBiCG-v2 BiCGStar. GPBiCG GPBiCG-v1 GPBiCG-v2 BiCGStar. -2 Log10 relative residual. -2 Log10 relative residual. 順位 2 3 2 4 1 4 4 2 3 0 10 10. 1 1 0 2 7 10. -4. -6. -8. -10. -4. -6. -8. -10 0. 200. 400 600 800 1000 Number of matrix vector multiplications. 1200. 0. (a) 行列:xenon2 0. -8.5 Log10 relative residual. Log10 relative residual. -4. -6. -8. 2000 3000 4000 5000 Number of matrix vector multiplications. 6000. 7000. (b) 行列:sme3Dc -8. GPBiCG GPBiCG-v1 GPBiCG-v2 BiCGStar. -2. 1000. 3) Moethuthu, S. Fujino: Stability of GPBiCG AR method based on minimization of associate residual, Journal of ASCM, pp.108-120, 2008. 4) H. Rutishauser: Theory of gradient method, Refined Iterative Methods for Computation of the Solution and the Eigenvalues of Self-Adjoint Value Problems, Mitt. Inst. Angew. Math. ETH Z¨ urich, Birkh¨ auser, Basel, pp.24-49, 1959. 5) G.L.G. Sleijpen, P. Sonneveld, M. B. van Gijzen: Bi-CGSTAB as an induced dimension reduction method: Applied Numerical Math., Vol.60, pp.1100-1114, 2010. 6) University of Florida Sparse Matrix Collection: http://www.cise.ufl.edu/research/sparse/matrices/index.html 7) H.A. van der Vorst: Bi-CGSTAB: A fast and smoothly converging variant of BiCG for the solution of nonsymmetric linear systems, SIAM J. Sci. Stat. Comput., Vol.13, pp.631-644, 1992. 8) H.A. van der Vorst; Iterative Krylov preconditionings for large linear systems, Cambridge University Press, Cambridge, 2003. 9) S.-L. Zhang: GPBi-CG: Generalized product-type preconditionings based on BiCG for solving nonsymmetric linear systems, SIAM J. Sci. Comput., Vol.18, pp.537551, 1997. 10) S.-L. Zhang, M. Natori, C.-H. Jin: Product-type Krylov-Subspace Methods for Solving Nonsymmetric Linear Systems, Vol.989, 92-102, 1997.. GPBiCG GPBiCG-v1 GPBiCG-v2 BiCGStar. -9 -9.5 -10 -10.5. -10 0. 2000. 4000 6000 8000 10000 12000 14000 16000 Number of matrix vector multiplications. (c) 行列:bcircuit. -11 12000 12500 13000 13500 14000 14500 15000 15500 16000 Number of matrix vector multiplications. (d) 行列:bcircuit の拡大図. 図 1 各解法の三つの行列に対する残差履歴 Fig. 1 History of relative residual 2-norm of iterative methods for three matrices.. ⓒ 2013 Information Processing Society of Japan. 5.
(6)
図
関連したドキュメント
の変化は空間的に滑らかである」という仮定に基づいて おり,任意の画素と隣接する画素のフローの差分が小さ くなるまで推定を何回も繰り返す必要がある
厳密にいえば博物館法に定められた博物館ですらな
バックスイングの小さい ことはミートの不安がある からで初心者の時には小さ い。その構えもスマッシュ
累積誤差の無い上限と 下限を設ける あいまいな変化点を除 外し、要求される平面 部分で管理を行う 出来形計測の評価範
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
(( . entrenchment のであって、それ自体は質的な手段( )ではない。 カナダ憲法では憲法上の人権を といい、
学期 指導計画(学習内容) 小学校との連携 評価の観点 評価基準 主な評価方法 主な判定基準. (おおむね満足できる
17‑4‑672 (香法 ' 9 8 ).. 例えば︑塾は教育︑ という性格のものではなく︑ )ット ~,..