理論シミュレーション計画

第 3 章現代の宇宙観測と未来を目指す長期計画

3.11 理論シミュレーション計画

3.11.1 分野の現状

ここでは、主にシミュレーション研究の現状についてまとめる。理論シミュレーションによって推進されるべきサイエンスについては、2.10を参照されたい。

大規模シミュレーションは、理論・観測と並ぶ重要な研究ツールになってきた。これは通常の意味での実験が困難である天文学の特性と、計算機の能力が過去数十年にわたって指数関数的に発展してきたことによる。宇宙全体を含む様々な天体は、構成要素間の相互作用が基礎的な物理法則そのもので記述できるという意味で、生命や社会のようなシステムに比べて理解しやすいシステムである。システムを記述する方程式系が解析的には解けない場合においても、コンピュータによる数値計算によってシステムの振る舞いを知り、

そこから理論的な理解を構築し、また観測と比較することで理解を検証することができる。

このため、計算機の能力の向上、計算手法の改良によって、これまで扱うことができなかったシステムが扱えるようになることが直接に研究の発展に結びついてきた。

まず、計算機の能力の向上と計算手法の改良のそれぞれについて現状をまとめる。1980 年代から 90年代初めまでは、スーパーコンピューター技術において日本が世界をリードしていた。また重力多体シミュレーションについては、90年代初めからは、日本で開発が継

113

続されている GRAPE システムが性能で世界をリードしてきた。これらのお蔭で、シミュレーション研究のいくつかの領域では日本のグループが世界をリードしてきている。

しかし、GRAPE が優位である多体シミュレーションの分野を除くと、日本のスーパーコンピューターの優位性は 2000 年代にはいってから急速に失われつつある。これは、日本のスーパーコンピューター開発が、航技研の数値風洞(富士通VPP500の原型)や地球シミュレータ(NEC SX-6の特別モデル)に代表されるように、70年代に開発されたアーキテクチャであるベクトルアーキテクチャを元にした分散並列システムが主体でありつづけたのに対し、諸外国ではスカラー型マイクロプロセッサ、特に安価な x86 アーキテクチャプロセッサによるクラスタシステムに移行してきたためである。

さらに近年では、パソコンの画像表示用プロセッサである GPU を汎用計算に使う

GPGPU と言われる動きも盛んになっており、GPU メーカーも積極的にこれをサポートし

ている。 GPU の性能は単精度であれば1チップで 1 Tflops(2009年時点)と汎用マイクロ

プロセッサの1 桁上であり、応用によっては高い性能が得られそうに見える。じっさい

GPGPU の応用は、GRAPE でのアルゴリズム開発の実績がある多体系シミュレーション

では良い結果がでているが、それ以外の分野での実績はあまり多くはない。

日本では、スーパーコンピューター技術における優位性を回復することを目指す京速コンピュータプロジェクトが 2006年度から7年計画でスタートした。これはベクトルアーキテクチャでの分散並列システムとスカラアーキテクチャでの分散並列システムをそれぞれ開発し、協調してシミュレーションをさせる、というプロジェクトであったが、2009年 5月にベクトル部分の開発を担当していた2社がプロジェクトからの撤退を表明する等、混乱した状況が続いている。

GRAPE 開発グループは2004年度から、プロセッサアーキテクチャを大きく変更した

GRAPE-DR システムの開発をスタートした。これは、上のGPGPU と類似した考え方で、

重力計算専用パイプラインプロセッサを使っていた GRAPE に代わり、プログラム可能だが単純なプロセッサを多数並列動作させるものである。2006年度にチップが完成し、2009 年5月現在で 85 Tflopsのシステムが稼働している。このシステムは電力あたりの演算性能で世界一を実現しており、電力コストがハードウェア調達コストを上回りつつある現在では非常に注目されるものとなっている。

計算手法については、数値解法、物理モデルの改良と同時に、上のような計算機アーキテクチャの変化に柔軟に対応でき、新しいアーキテクチャで高い実行効率を実現する計算コードの開発が、世界的にも重要な課題になっている。流体計算では Flash、Enzo に代表される並列化された AMR コード、重力多体や SPH による自己重力流体では Gadget、

PKDGRAV/Gasoline に代表されるツリー法ベースの並列コードが主流であるが、これらは

いずれも大規模で複雑なコードであり、複数の開発者からなる開発チームがコードの様々な部分を開発し、さらに開発されたコードを使ったサイエンス研究は多くのユーザーが行うという分業体制が成立しつつある。日本では AMR の SFUMATO、AMRO や重力多体

114

のGreeM、SPH の ASURA 等高いレベルでのコード開発は行われているが、ASURA を

例外として開発は個人ベースに留まっている。

3.11.2 将来計画

シミュレーション研究で世界をリードしていくためには以下の2つを並行して進めていくことが必須となる。

a) GRAPE、GRAPE-DRのような、天文シミュレーションに最適化した専用計算機ハー

ドウェアの自主開発

b) 専用計算機、汎用計算機を問わず、大規模並列システムで効率良く実行できる並列シミュレーションソフトウェアの継続的開発

ハードウェア開発については、半導体技術自体の成熟により、カスタム LSI開発が極めて大きな初期コストを必要とするという問題がある。これについては、以下の3つの方向を並行して進めることで対応していく。

1. ある程度の汎用性をもつ、GRAPE-DR 的なシステムの改良・継続開発を行なうこと。

これは多額の費用を必要とするため、天文学の枠の中だけで継続するのは困難であり、

京速コンピュータの次の世代、あるいは同時並行的に、計算科学のプロジェクトとして推進していくことが望ましい。

2. アプリケーションに高度に専用化したシステムを、構造化 ASIC など、トランジスタ利用効率は劣るが初期コストの低いチップを使って開発すること。

3. GPGPU、FPGA 等の、商業的に利用可能なチップをそのまま利用すること。

1. については、例えば4年後の2013年の完成を目指すなら GRAPE-DR の後継システムとして 30Pflops (京速コンピュータの3倍)程度の性能を開発費 20億程度(京速コンピュータの 1/50) で実現することが可能である。これにより、自己重力粒子系などの天文シミュレーションだけでなく、量子化学計算や古典 MD などのいくつかの重要なアプリケーションが実行可能であることは GRAPE-DR で実証されている。さらに5年後を考えると、

半導体技術の状況が予測困難だが、16nm 程度までは微細化が進むと最近はいわれており、

さらに 20-30倍の性能向上が可能であろう。すなわち、Exaflops が実現可能となる。

2. については、利用可能になりつつある構造化 ASIC と言われる技術を用いると、トランジスタ利用効率の面では 1/10 程度だが、初期コストは数千万円と、カスタムチップに比べて1桁以上小さくて済む。そこでこれを用いて GRAPE 的な専用計算機の開発を継続する。この場合、上のプログラム可能なアーキテクチャと同程度の性能を、ずっと小さい初期コストで実現でき、また消費電力も小さくなる。このアプローチでは、1億円程度の中規模プロジェクトで、世界最高速程度が実現できる。

3. については、実際に実用になるかどうかは現状では疑わしいが、技術動向に常に留意しておく必要はある。

115

シミュレーションソフトウェアの継続的開発については、京速コンピュータプロジェクトの中でそのようなことを進める開発グループをもつ計画もあり、宇宙は素粒子・原子核の研究と合わせ、そのための重点分野の候補にもなっている。このような制度的なサポートを有効に活用すると同時に、国立天文台、筑波大学計算科学センター、高エネルギー加速器研究機構などの計算科学・シミュレーション天文学の研究拠点において、継続的開発を行う体制を整備することが急務である。

116

ドキュメント内 Microsoft Word - １.scj21期（天文学宇宙物理学分科会）.doc (ページ 112-116)

第 3 章 現代の宇宙観測と未来を目指す長期計画

3.11 理論シミュレーション計画

第 3 章現代の宇宙観測と未来を目指す長期計画