• 検索結果がありません。

理論シミュレーション計画

第 3 章 現代の宇宙観測と未来を目指す長期計画

3.11 理論シミュレーション計画

3.11.1 分野の現状

ここでは、主にシミュレーション研究の現状についてまとめる。理論シミュレーション によって推進されるべきサイエンスについては、2.10を参照されたい。

大規模シミュレーションは、理論・観測と並ぶ重要な研究ツールになってきた。これは 通常の意味での実験が困難である天文学の特性と、計算機の能力が過去数十年にわたって 指数関数的に発展してきたことによる。宇宙全体を含む様々な天体は、構成要素間の相互 作用が基礎的な物理法則そのもので記述できるという意味で、生命や社会のようなシステ ムに比べて理解しやすいシステムである。システムを記述する方程式系が解析的には解け ない場合においても、コンピュータによる数値計算によってシステムの振る舞いを知り、

そこから理論的な理解を構築し、また観測と比較することで理解を検証することができる。

このため、計算機の能力の向上、計算手法の改良によって、これまで扱うことができなか ったシステムが扱えるようになることが直接に研究の発展に結びついてきた。

まず、計算機の能力の向上と計算手法の改良のそれぞれについて現状をまとめる。1980 年代から 90年代初めまでは、スーパーコンピューター技術において日本が世界をリードし ていた。また重力多体シミュレーションについては、90年代初めからは、日本で開発が継

113

続されている GRAPE システムが性能で世界をリードしてきた。これらのお蔭で、シミュ レーション研究のいくつかの領域では日本のグループが世界をリードしてきている。

しかし、GRAPE が優位である多体シミュレーションの分野を除くと、日本のスーパー コンピューターの優位性は 2000 年代にはいってから急速に失われつつある。これは、日 本のスーパーコンピューター開発が、航技研の数値風洞(富士通VPP500の原型)や地球シミ ュレータ(NEC SX-6の特別モデル)に代表されるように、70年代に開発されたアーキテク チャであるベクトルアーキテクチャを元にした分散並列システムが主体でありつづけたの に対し、諸外国ではスカラー型マイクロプロセッサ、特に安価な x86 アーキテクチャプロ セッサによるクラスタシステムに移行してきたためである。

さらに近年では、パソコンの画像表示用プロセッサである GPU を汎用計算に使う

GPGPU と言われる動きも盛んになっており、GPU メーカーも積極的にこれをサポートし

ている。 GPU の性能は単精度であれば1チップで 1 Tflops(2009年時点)と汎用マイクロ

プロセッサの1 桁上であり、応用によっては高い性能が得られそうに見える。じっさい

GPGPU の応用は、GRAPE でのアルゴリズム開発の実績がある多体系シミュレーション

では良い結果がでているが、それ以外の分野での実績はあまり多くはない。

日本では、スーパーコンピューター技術における優位性を回復することを目指す京速コ ンピュータプロジェクトが 2006年度から7年計画でスタートした。これはベクトルアー キテクチャでの分散並列システムとスカラアーキテクチャでの分散並列システムをそれぞ れ開発し、協調してシミュレーションをさせる、というプロジェクトであったが、2009年 5月にベクトル部分の開発を担当していた2社がプロジェクトからの撤退を表明する等、混 乱した状況が続いている。

GRAPE 開発グループは2004年度から、プロセッサアーキテクチャを大きく変更した

GRAPE-DR システムの開発をスタートした。これは、上のGPGPU と類似した考え方で、

重力計算専用パイプラインプロセッサを使っていた GRAPE に代わり、プログラム可能だ が単純なプロセッサを多数並列動作させるものである。2006年度にチップが完成し、2009 年5月現在で 85 Tflopsのシステムが稼働している。このシステムは電力あたりの演算性 能で世界一を実現しており、電力コストがハードウェア調達コストを上回りつつある現在 では非常に注目されるものとなっている。

計算手法については、数値解法、物理モデルの改良と同時に、上のような計算機アーキ テクチャの変化に柔軟に対応でき、新しいアーキテクチャで高い実行効率を実現する計算 コードの開発が、世界的にも重要な課題になっている。流体計算では Flash、Enzo に代表 される並列化された AMR コード、重力多体や SPH による自己重力流体では Gadget、

PKDGRAV/Gasoline に代表されるツリー法ベースの並列コードが主流であるが、これらは

いずれも大規模で複雑なコードであり、複数の開発者からなる開発チームがコードの様々 な部分を開発し、さらに開発されたコードを使ったサイエンス研究は多くのユーザーが行 うという分業体制が成立しつつある。日本では AMR の SFUMATO、AMRO や重力多体

114

のGreeM、SPH の ASURA 等高いレベルでのコード開発は行われているが、ASURA を

例外として開発は個人ベースに留まっている。

3.11.2 将来計画

シミュレーション研究で世界をリードしていくためには以下の2つを並行して進めてい くことが必須となる。

a) GRAPE、GRAPE-DRのような、天文シミュレーションに最適化した専用計算機ハー

ドウェアの自主開発

b) 専用計算機、汎用計算機を問わず、大規模並列システムで効率良く実行できる並列シ ミュレーションソフトウェアの継続的開発

ハードウェア開発については、半導体技術自体の成熟により、カスタム LSI開発が極めて 大きな初期コストを必要とするという問題がある。これについては、以下の3つの方向を 並行して進めることで対応していく。

1. ある程度の汎用性をもつ、GRAPE-DR 的なシステムの改良・継続開発を行なうこと。

これは多額の費用を必要とするため、天文学の枠の中だけで継続するのは困難であり、

京速コンピュータの次の世代、あるいは同時並行的に、計算科学のプロジェクトとして 推進していくことが望ましい。

2. アプリケーションに高度に専用化したシステムを、構造化 ASIC など、トランジスタ利 用効率は劣るが初期コストの低いチップを使って開発すること。

3. GPGPU、FPGA 等の、商業的に利用可能なチップをそのまま利用すること。

1. については、例えば4年後の2013年の完成を目指すなら GRAPE-DR の後継システ ムとして 30Pflops (京速コンピュータの3倍)程度の性能を開発費 20億程度(京速コンピュ ータの 1/50) で実現することが可能である。これにより、自己重力粒子系などの天文シミ ュレーションだけでなく、量子化学計算や古典 MD などのいくつかの重要なアプリケーシ ョンが実行可能であることは GRAPE-DR で実証されている。さらに5年後を考えると、

半導体技術の状況が予測困難だが、16nm 程度までは微細化が進むと最近はいわれており、

さらに 20-30倍の性能向上が可能であろう。すなわち、Exaflops が実現可能となる。

2. については、利用可能になりつつある構造化 ASIC と言われる技術を用いると、トラ ンジスタ利用効率の面では 1/10 程度だが、初期コストは数千万円と、カスタムチップに比 べて1桁以上小さくて済む。そこでこれを用いて GRAPE 的な専用計算機の開発を継続す る。この場合、上のプログラム可能なアーキテクチャと同程度の性能を、ずっと小さい初 期コストで実現でき、また消費電力も小さくなる。このアプローチでは、1億円程度の中規 模プロジェクトで、世界最高速程度が実現できる。

3. については、実際に実用になるかどうかは現状では疑わしいが、技術動向に常に留意 しておく必要はある。

115

シミュレーションソフトウェアの継続的開発については、京速コンピュータプロジェク トの中でそのようなことを進める開発グループをもつ計画もあり、宇宙は素粒子・原子核 の研究と合わせ、そのための重点分野の候補にもなっている。このような制度的なサポー トを有効に活用すると同時に、国立天文台、筑波大学計算科学センター、高エネルギー加 速器研究機構などの計算科学・シミュレーション天文学の研究拠点において、継続的開発 を行う体制を整備することが急務である。

116