固体系量子モンテカルロ電子状態計算のAPUを用いた高速化
1
0
0
全文
(2) !. 90. CPU1. $". 80. GPU. " $! . 70. !. 60. 800. 50 600. 30 20. 200. GPU. CPU. UNB. CPU. GPU. 2.02x. 10. 0. CPU. 3.71x. 40. 400. GPU. 0 56. 168. 384. 軌道数. ・計算部分が10μs以下なのに対して各Packagingでは数十倍、 結果の取得に関しては数百倍の時間を要している 内蔵型のGPUは外付け型のGPUと比べ、メモリバンド幅こそ劣るが、 UNB(Unified North Bridge)という機能を利用することで、CPUと同一のメモリを扱い、 PCIeを介さず、直接データのやりとりができるという利点がある ※本研究ではAMD社のAPUを指す. Ⅲ. Implementation. ー Packagingに関して言えば、今回作成したプログラムでは、 計算ルーチンにはいたびにpackagingを行っていたが、 原理的に係数部分はpackagingを1回にすることが可能 ー 基底関数計算部分も計算ルーチンにはいる前の計算段階でpackagingが可能 ー 倍精度が利用できれば精度を戻す作業が不要 ・積和算を行うCalculating部分のみで比較すると最大で約10倍の高速化. 平衡化部分の律速1つとして 試行関数を構成する一体軌道関数 ( ri)の再計算部分がある. . L. . 64. . { j (ri )} j=1 = a js s (ri ) s=1. j=1. 軌道: j と s のループを並列計算可能. 再計算部分をGPUで計算することで高速化を実現する L 64 64 a js s (ri ) s=1 j=1 s=1 j ( ri) = a j11 ( ri) + a j 2 2 ( ri) ++,, +a + j 64 64 ( ri). L { j (ri )} j=1. k ( ri) = ak11 ( ri) + ak 2 2 ( ri) +,, +a + k 64 64 ( ri). . . Ⅴ. Summary. L. L ( ri) = aL11 ( ri) + aL 2 2 ( ri) ++,, +a + L 64 64 ( ri). ⓒ 2014 Information Processing Society of Japan. ・成果 内蔵型のGPUを利用することで最大約10倍の高速化が可能 ・今後の課題 利用するデータの扱いを最適化する必要がある References 1 !$"%$"&!&$" +) * *')*$!**78);7.<8/64570* 1",- $"$ 1) * ) * *')*$!**76)6698-66:6/64550*. 36.
(3)
関連したドキュメント
(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計
充電器内のAC系統部と高電圧部を共通設計,車両とのイ
、肩 かた 深 ふかさ を掛け合わせて、ある定数で 割り、積石数を算出する近似計算法が 使われるようになりました。この定数は船
分配関数に関する古典統計力学の近似 注: ややまどろっこしいが、基本的な考え方は、q-p 空間において、 ①エネルギー En を取る量子状態
なお、関連して、電源電池の待機時間については、開発品に使用した電源 電池(4.4.3 に記載)で
・発電設備の連続運転可能周波数は, 48.5Hz を超え 50.5Hz 以下としていただく。なお,周波数低下リレーの整 定値は,原則として,FRT
・発電設備の連続運転可能周波数は, 48.5Hz を超え 50.5Hz 以下としていただく。なお,周波数低下リレーの整 定値は,原則として,FRT
・私は小さい頃は人見知りの激しい子どもでした。しかし、当時の担任の先生が遊びを