• 検索結果がありません。

大規模分子動力学計算の並列化効率

N/A
N/A
Protected

Academic year: 2021

シェア "大規模分子動力学計算の並列化効率"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)2011年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2011. HPCS2011 2011/1/18. 大規模分子動力学計算の並列化効率 渡辺宙志 1 , 鈴木将 2 , 伊藤伸泰 3 東大物性研, 2 九大工, 3 東大工 [email protected] 1. 概要 空間分割により並列化された分子動力学法コードの開発、及び並列化効率について調べた。ウィークスケー リングにて最大 8192 プロセス、41 億粒子までの計算を行ったところ、通信時間はほぼ無視できると思われるの にもかかわらず、並列化効率の顕著な低下が見られた。これはオペレーティングシステムによる干渉 (OS Jitter) の影響であると思われる。. 我々は分子動力学法を用いた沸騰現象の全粒子計算を. 0.25 (a). 行っている。マルチスケールな現象の直接計算には大規 0.2 Average [SEC]. 模計算が必須となる。そこで、大規模並列計算向けの分 子動力学法コードを開発し、その並列化効率について調 べた。コードは単純空間分割により並列化され、通信に は MPI を用いた。なお、開発言語は C++である。相互. 0.15 0.1. 2 128. 0.05. 作用ポテンシャルには Lennard-Jones 型を用い、カット オフ距離は相互作用半径を σ として 3.0σ とし、一つのプ. 0 0. ロセスには一辺 100σ の立方体領域を割り当てた。プロ. 200. 400. 600. 800. 1000. Step. セスあたりの粒子数を 50 万粒子に固定したままプロセ. 1.2. ス数を増やす、ウィークスケーリングにより核融合科学. (b). 2 128. 研究所のプラズマシミュレータ (HITACHI SR16000)、 及び東京大学物性研究所のシステム B (SGI Altix ICE. 8400EX) にてベンチマークを取った。その結果、並列化 効率が 1024 プロセスで 80%から 90%程度、8192 プロ セスで 60%から 70%程度にまで低下した。分子動力学. Relative Difference. 1 0.8 0.6 0.4 0.2. 法における計算のホットスポットは粒子間に働く力の計. 0 900. 算であり、その計算時間に比べて通信時間は無視できる. 950 Step. 1000. と思われる。この並列化効率の低下要因について調べる ため、通信を含まない、力の計算時間のみをプロセスご. 図 1: (a) ステップごとの力の計算にかかった平均時間。. とに調べた。その結果、計算時間の平均値はプロセス数. 2 ノードの計算でも 128 ノードの計算でも力の計算の平 均時間はほとんど変わらない。(b) プロセスごとの計算. にほとんど依存しないが、計算時間の揺らぎがプロセス 数が増えるにつれて増大することがわかった。. 時間の揺らぎ。2 ノードの計算に比べ、128 ノードでの. 図 1 (a) は力の計算にかかった時間を全プロセスにつ いて平均したものをステップごとに表示したものである。 ノード数 (プロセス数) が増えても平均値はほとんど変. 計算では揺らぎが増大している。 化効率を下げていることがわかった。この揺らぎの原因. わらないことがわかる。図 1 (b) はステップごとに最も. は、通信時間を含まない計算時間が揺らぎ、かつ最も遅. 遅かったプロセスの計算時間から最も速かったプロセス. いプロセスが試行ごとに異なることからオペレーティン. の計算時間を引き、平均時間で規格化したものを表示し. グシステムの干渉によるもの、すなわち OS Jitter によ. た。2 ノード (128 プロセス) ではほとんど計算時間に揺. る可能性が高い。今後、1 万個以上のコアを持つ MPP 型. らぎが見られないのに対して、128 ノード (8192 プロセ. の計算機にて高い並列化効率を達成するためには、ユー. ス) では大きく揺らいでいることがわかる。今回開発し. ザプログラムだけでなく、OS 側でもなんらかの工夫が. たコードでは高速化のために Bookkeeping 法を用いてお. 必要になると思われる。. り、これはステップごとに全てのプロセスの同期を必要. 本研究は KAUST GRP(KUK-I1-005-04)、名古屋大学. とする。プロセス数が増えるにつれて増大する計算時間. COE 計算科学フロンティア、及び科学研究費補助金 若 手研究 (B) 課題番号 19740235 の助成を受けて行われた。. の揺らぎが実質的なロードバランスの悪化となり、並列. 52. ⓒ 2011 Information Processing Society of Japan.

(2)

参照

関連したドキュメント

本節では本研究で実際にスレッドのトレースを行うた めに用いた Linux ftrace 及び ftrace を利用する Android Systrace について説明する.. 2.1

0.1uF のポリプロピレン・コンデンサと 10uF を並列に配置した 100M

[r]

自動車環境管理計画書及び地球温暖化対策計 画書の対象事業者に対し、自動車の使用又は

NCP43080 Secondary Side Synchronous Rectification Driver SOIC-8, DFN-8, WDFN-8 NCP4305/8 High Performance Secondary Side Synchronous Rectification Driver SOIC-8, DFN-8,

年間約5万人の子ども達が訪れる埋立処分場 見学会を、温暖化問題などについて総合的に

原子炉水位変化について,原子炉圧力容器内挙動をより精緻に評価可能な SAFER コ ードと比較を行った。CCFL

    その後,同計画書並びに原子力安全・保安院からの指示文書「原子力発電 所再循環配管に係る点検・検査結果の調査について」 (平成 14・09・20