計算速度

第 3 章シミュレーションの詳細 24

4.4 計算速度

第 4章結果 4.4. 計算速度

での推定残差の値であり、各方向での推定精度を表した図である。この図から、r= 10⁻²では推定しきれずに精度が他と比べてやや悪くなるが、r≤10⁻³の場合では特にGSより内側でほとんど推定結果が変化していないことがわかる。図4.17と図4.18より、まずGSより情報がある赤線より内側で推定が行われ、その後外側の推定が行われていると考えることができる。しかし赤線より外側ではGSからの情報はまったくないので計算を繰り返しても正しい推定がされることはない。つまり、内側の推定が終わった頃に計算を打ち切るのが最も効率がいい。今回はこの結果から r= 10⁻³を採用する。このときの計算の反復回数はGSの数や配置によらず300回前後であり、計算時間にすると約1.5秒であった。Wind Methodの場合、行列の大きさ、測定値の量が増えるため3sほどかかった。

4.4.2 各過程の計算に要する時間

さて、ここではさらに詳しく計算時間について見ていく。今回の計算は A. 測定値s¯をCPUメモリからGPUメモリに移す B. GPUメモリ上で(GP¯ )^Ts¯=z

C. GPUメモリ上で(GP¯ )^T(GP¯ )x=zに対して共役勾配法を行う。

共役勾配法の詳細はAppendix Bを参照。

D. GPUメモリ上でφmv=P xにより推定値を求める。

E. 最後にGPUメモリ上の推定値のデータをCPUメモリ上に移す。

という過程で行われる。ここでP は対角スケーリングの前処理行列である(Appendix B)。また、

GP¯ や(GP¯ )^T は事前に計算してある。実際に各過程でかかった時間を表4.1にまとめる。表4.1 から計算時間の大部分は行列とベクトルのかけ算が占めていることがわかる。特に共役勾配法の反復回数が増加するほど行列とベクトルのかけ算の回数が増えるため、全体の計算時間も増加する。

今回の計算では反復回数は250回〜300回であるので、共役勾配法で約1.5〜1.8sの計算時間が必要となっている。前節で見たように今回計算にかかった時間は約1.5sであるので共役勾配法を解くのにかかる時間がほぼ全体の計算時間となっていることがわかる。

この結果から計算時間を減らすためにはまず共役勾配法の反復回数を減らすことが必要である。

今回用いた対角スケーリングによって、反復回数は約半分になった。この対角スケーリングは前処理の中でもっともシンプルな手法であり、そこまで大きな効果は期待できない。共役勾配法の前処理は盛んに研究されている分野であり、様々な手法があるのでいろいろ試してみる必要がある。また、より高性能なパソコンやGPUを用いて基礎的な計算時間の向上も重要である。

第 4章結果 4.4. 計算速度

過程計算時間[ms]

A. CPUからGPUへ¯sのデータ転送 0.64 B.z= (GP¯ )^Ts¯ 2.58 C.共役勾配法(Appendix B参照)

for文より前 C.0. B =|z| 0.3

C.1. t=Ax0 5.5

C.2. r0=z−t 0.54 C.3. p0=r0 0.005 C.4. R0=|r0| 0.35 C.5. 収束の判定 0.001以下 for文 C.6. qk−1=Apk−1 5.4

C.7. ek =pk−1·qk−1 0.32 C.8. αk−1=Rk−1/ek 0.001以下 C.9. xk=xk−1+αk−1pk−1 0.004 C.10. rk =rk−1−αk−1qk−1 0.004 C.11. Rk=|rk| 0.3

C.12. 収束の判定 0.001以下

C.13. ck=rk·qk−1 0.3 C.14. βk=−ck/ek 0.001以下 C.15. pk =rk+βkpk−1 0.004 for文内の合計 6.332

D.φmv=P x 0.91

E. GPUからCPUへφmvのデータ転送 0.71

表4.1: 各過程に要する計算時間。ここでAx= (GP¯ )^T(GP¯ )xを表している。測定できる計算時間は 1ms単位であるので、ここでは同じ操作を100回繰り返したときにかかった計算時間を100で割った数を載せている。また、100回の計算でも1ms以下の計算時間である場合は1000回の計算を行った。

ドキュメント内 The accuracy and computing speed of tomographic wavefront reconstruction for Multi-Object Adaptive Optics of Extreme Large Telescope 24 (ページ 55-58)

第 3 章 シミュレーションの詳細 24

4.4 計算速度

4.4.2 各過程の計算に要する時間

第 3 章シミュレーションの詳細 24