京都大学学術情報メディアセンター
新スーパーコンピュータ運用開始とT2K連携の始動
アピールポイント • 61.2 テラフロップスの京大版 T2K オープンスパコン運用開始 • 東大、筑波大とのT2K 連携による計算科学・工学分野におけるネットワーク型研究 推進、人材育成、アプリケーション高度化支援の活動を開始 概要 国立大学法人京都大学(総長・尾池和夫)学術情報メディアセンター(センター長・美 濃導彦)では、2008 年 6 月から新しいスーパーコンピュータ(スパコン)の運用を開始し ます。このスパコンの導入にあたっては、2006 年春より本センターと筑波大学計算科学研 究センターならびに東京大学情報基盤センターの 3 機関による共同研究を実施し、その成 果であるT2K オープンスパコン仕様を基に、3 機関が連携しつつそれぞれ調達を進めてま いりました。本センターでは、総理論演算性能 61.2 テラフロップス、Linpack 性能 50.5 テラフロップスのT2K オープンスパコンと、それを中核とする複合型スパコンシステムが 稼働を始めました。 本センターでは、この国内有数の規模・性能を有する新スパコンにより、計算科学、計 算工学分野の様々な計算需要に応えていくとともに、計算科学・計算工学分野の研究支援、 人材育成支援を行ってまいります。このために、本センターと、筑波大学、東京大学の各 センターは3大学間での連携協力の推進に関する協定書に調印し、研究・教育・支援など 様々な連携活動を開始しました。 詳細 1. システム構成について 新スーパーコンピュータシステムは、富士通株式会社製の高性能サーバHX600 を 416 ノ ード結合した、京大版T2K オープンスパコン【用語解説1】である大規模並列クラスタを 中心として構成されています。HX600 は米国 AMD 社製の最新4コアプロセッサ【用語解 説2】であるOpteron 8350(コード名 Barcelona)を4基搭載した共有メモリ型【用語解 説3】の高性能サーバであり、147 ギガフロップス【用語解説4】の優れた演算性能と 32 ギガバイト【用語解説5】の大容量メモリを有しています。また毎秒2ギガバイトの通信 性能【用語解説6】を持つInfiniband のリンクを4本束ねた、毎秒8ギガバイトの超高速 ネットワークによりサーバ間を結合することで、多数のサーバを利用する並列処理を効率 的に行なうことができます。したがって HX600 クラスタ全体では、ピーク演算性能 61.2 テラフロップス、総メモリ容量13 テラバイト、ネットワーク性能毎秒 3.3 テラバイトとい う、きわめて高性能・大規模なシステムとなっています。またスパコン性能の測定に用いられるLinpack【用語解説7】の性能は 50.5 テラフロップスであり、地球シミュレータ【用 語解説8】(35.9 テラフロップス)の 1.4 倍もの値を達成しています。 新システムには、富士通株式会社製の大規模共有メモリサーバであるSPARC Enterprise M9000 を7ノード結合したサブシステムも装備されています。M9000 はノードあたり 128 個のCPU コアと1テラバイトの大容量メモリを搭載しており、巨大なメモリ空間を必要と する応用プログラムに適しています。さらにHX600 クラスタと M9000 クラスタの双方か らアクセスできる、総ディスク容量 883 テラバイトのストレージシステムも用意されてお り、巨大なデータの解析・生成にも対応できます。 2. T2Kオープンスパコンについて HX600 クラスタは、筑波大学計算科学研究センターならびに東京大学情報基盤センター と共同で策定したT2K オープンスパコン仕様に基づくものです。この仕様は、ハードウェ アやシステムソフトウェアを、一般のパソコンなどに用いられる「コモディティ技術」に より実現することを特徴としており、このことが新システムを高性能・大規模なものにす ることができた最大の要因となっています。またLinux をはじめとするオープンソースソ フトウェアを基本とし、PC クラスタ【用語解説9】との強い親和性を持つことも特徴です。 この結果、これまでスパコンを利用していなかった研究者、特に非数値分野の研究者にも 使いやすいスパコンとなっており、実際に全体の1/3 以上の計算資源が非数値分野のユーザ に割り当てられています。 3. T2K連携について T2K の3センターは、共通仕様に基づくスパコン基盤を利用した連携を強化・推進する ために、2008 年 4 月 1 日に「3センターの間における連携・協力の推進に関する協定書」 (T2K 連携協定)を締結しました。この協定書に基づき、以下の連携活動を進めていきま す。 (1) 学際研究推進連携 筑波大学では、計算科学・工学者と計算機科学・工学者【用語解説10】の共同研究 による学際研究推進を進めています。このためのインフラに3大学のスパコンが使用 される予定です。 (2) 人材育成のための教材製作連携 東京大学では、全学レベルで計算科学・工学及びその基盤技術としての計算機科学・ 工学に関するカリキュラムを開発中です。スパコン実習の教材開発で筑波大学と京都 大学と連携します。 (3) プログラム高度化支援連携 京都大学では、公募・選定したユーザプログラムの高度化支援を新たな業務として今 夏より開始します。具体的には、プログラムの中で性能に大きな影響を及ぼす部分を
改造するチューニング、スパコンの構造・特徴を生かすように計算方法を改良するマ シン適合化、新しい計算方法を導入するプログラム再設計など、様々な高性能化・高 度化を外部委託も活用しつつ実施します。またアーキテクチャの共通性を生かした3 大学全てのユーザを対象とした支援、さらには次世代スパコンに向けた高度化支援も 計画しています。 (4) グリッド連携 現在、3大学によるグリッド【用語解説11】運用テストを進めています。7 月には NAREGI【用語解説11】を部分的に用いたグリッド環境の実運用システムでの実験 を行い、秋には主要機能の導入をNAREGI のバージョンアップ工程に合わせて順次開 始する予定です。グリッド運用で問題とされるアーキテクチャや基本ソフトウェアの 違いによるユーザプログラムの動作保障、負担金体系などの運用方針の違いなどは、 T2K オープンスパコンと3大学の協調体制により解決されます。 関連資料 z 新スーパーコンピュータ運用開始とT2K連携の始動について(発表スライド) z T2K 連携協定 z 学術情報メディアセンターホームページ http://www.media.kyoto-u.ac.jp/ z T2Kオープンスパコンホームページ http://www.open-supercomputer.org/ 問い合わせ先 z 美濃 導彦(学術情報メディアセンター長、教授) 075-753-9060 [email protected] z 中島 浩(同・副センター長、教授) 075-753-7457 [email protected] 用語解説 1. T2K(ティーツーケイ)オープンスパコン T2K は、北から順番に筑波大学、東京大学、京都大学の頭文字、T, T, K を並べたもの。 3大学が策定した仕様に基づくスパコンをT2K オープンスパコンと呼んでいる。 2. 4コアプロセッサ 1個のVLSI チップの上に4個のCPUを搭載したプロセッサ。汎用的なプロセッサでは 現在4コアが最大であり、一般のパソコンなどにも2コアのプロセッサが普及しつつある。 3. 共有メモリ型 複数のプロセッサからなるコンピュータの構成形態の一つであり、メモリが全てのプロ
セッサから共通に読み書きができること(共有メモリであること)が要件である。これに 対し、個々のプロセッサ(群)が他からは読み書きできない固有のメモリを持つ形態を分 散メモリ型という。T2K オープンスパコンは、個々のノードは共有メモリ型、クラスタ全 体は分散メモリ型という、階層的な構造を持っている。 4. ギガフロップス、テラフロップス、ペタフロップス スーパーコンピュータの性能を表現する単位。フロップスは1秒間に行なうことのでき る浮動小数点演算(加減乗算)の回数を表し、1ギガフロップは10億回、1テラフロッ プスは1兆回、1ペタフロップスは1000兆回の演算ができることを意味する。京大版 T2K オープンスパコンは 61.2 テラフロップスであるので、最大で毎秒61兆2000億回 の演算が可能である。また国家プロジェクトとして開発が進行している次世代スーパーコ ンピュータは、10 ペタフロップス(毎秒1京回)以上の演算性能を達成すると期待されて いる。 5. ギガバイト、テラバイト コンピュータのメモリやディスクの容量を表現する単位。1ギガバイトは230バイト(約 10 億バイト)、1テラバイトは 240バイト(約1兆バイト)である。一般のパソコンのメモ リ容量は数ギガバイト、ディスク容量は数百ギガバイトであるので、京大版T2K オープン スパコンのメモリ容量(13テラバイト)はパソコンの数千倍、またシステムのストレー ジ容量(833 テラバイト)もパソコンの数千倍である。 6. 通信性能 1秒間に転送可能なビット数やバイト数で表現されることが多い。一般的な光ブロード バンド通信の性能は毎秒100 メガビット程度、また LAN の主流であるギガビットイーサネ ットの性能は毎秒1ギガビットであるので、バイト(8ビット)で表現するとそれぞれ毎 秒12.5 メガバイト、125 メガバイトとなる。したがって、HX600 の通信性能(毎秒8ギガ バイト)は光ブロードバンドの640 倍、LAN の 64 倍となる。 7. Linpack 多元連立一次方程式を解くプログラム。毎年6月と11月に発表される、世界中のスパ コンの性能番付TOP500 (http://www.top500.org/) の順位は Linpack の性能で定められ、 上位のマシンでは未知数の数が百万を超える巨大な方程式を数時間かけて解いたときの性 能が報告されている。
8. 地球シミュレータ
6 月から 2004 年 6 月まで、5 回連続で TOP500 の1位(世界最速)に君臨した。 9. PC クラスタ パソコンの心臓部(プロセッサ、メモリなど)を多数ネットワークで繋いだ並列コンピ ュータ。比較的安価に高性能システムを構築する手段として、大学の研究室レベルにも数 多く普及している。ラックマウントサーバやブレードサーバなども、一種のPCクラスタ と考えることができる。 10. 計算科学・工学と計算機科学・工学
計算科学(Computational Science)・計算工学(Computational Engineering)は、自 然科学や社会科学の様々な分野の問題をコンピュータを用いて解くための学問分野、たと えば計算物理学、計算化学、計算生物学、計算流体力学、計算構造力学、計算経済学など の総称であり、スーパーコンピュータを用いたシミュレーションが主要な技術として用い られている。計算機科学(Computer Science)・計算機工学(Computer Engineering)は、 大まかに言ってコンピュータやソフトウェアを作るための学問分野であり、日本では情報 科学や情報工学に近い意味で用いられることが多い。
11. グリッドと NAREGI
地理的に離れた場所にある複数のスパコンなどの計算資源を統合し、理想的には1つの システムとして使えるようにしたものを(計算)グリッドという。NAREGI は文部科学省 が推進するCSI(Cyber Science Infrastructure)事業の一環として、国立情報学研究所を 中心に開発された国産グリッドソフトウェアのパッケージであり、計算の分配、計算資源 の状態把握、ユーザの統一的認証、計算の流れや実行を指示するためウェブインタフェー スなど、様々なコンポーネントから構成されている。