National Institute of Advanced Industrial Science and Technology
Is Grid ready for e-Science?
産業技術総合研究所
産業技術総合研究所
グリッド研究センター
グリッド研究センター
田中
田中
良夫
良夫
[email protected]
[email protected]
自己紹介
1995
1995
慶應大学で学位取得
Parallel GC (Garbage Collection)
1996~1999:
1996~1999:
新情報処理開発機構(RWCP)
新情報処理開発機構(RWCP)
SMPクラスタにおけるプログラミングモデル、性能評価
グリッド
2000:
2000:
電子技術総合研究所
電子技術総合研究所
グリッド
2001~:
2001~:
産業技術総合研究所
産業技術総合研究所
グリッド研究センター 基盤ソフトチーム長
専門
専門
プログラミング環境
セキュリティ
性能評価
産総研
国内最大規模の研究所
国内最大規模の研究所
研究テーマ
研究テーマ
Environment
Material
Bio/Life science
Standards (JIS/OSI)
Geographical survey
Semiconductor device
Computer Science
etc.
3,500
3,500
常勤職員
常勤職員
+ 3,000
+ 3,000
非常勤職員
非常勤職員
年間約
年間約
1500
1500
億の予算
AIST Tsukuba Main Campus
国内に7つのキャンパス
億の予算
成田
東京
つくば
50km 40km 50kmグリッド研究センター
2002/ 2002/ 1 1 20032003/1/1 20042004/1/1 Researchers Researchers 20 20 12 12 33 33 65 65 1 1 8 8 Full time Full time 1414 1919 Fellowship Fellowship 11 99 Collaborators Collaborators 77 3232 60 60 1 1 9 9 Sub total Sub total 2222 Staff Staff Administration Administration 22 Support Support 55設立
設立
Since Jan. 1, 2002
7 years term
24
thResearch Center of
AIST
オフィス
オフィス
Tsukuba Central
Umezono 1-1, TsukubaTokyo Office
秋葉原クロスフィールド 30 people for software developmentグリッド技術の研究開発
グリッド技術の研究開発
年間約
チーム構成
National Institute of Advanced Industrial Science and Technology センター長:
センター長: 関口関口 智嗣智嗣 副センター長:副センター長: 横川横川 美津夫美津夫
科学技術応用チーム
科学技術応用チーム ((Leader: Leader: 長嶋長嶋 雲兵雲兵))
R&D on Scientific Applications on Grid. QC Grid / Gaussian Portal
ビジネス応用チーム
ビジネス応用チーム ((Leader: Leader: 伊藤伊藤 智智))
R&D of Middleware and Applications for Business on Grid.
R&D of Middleware and Applications for Business on Grid. Grid PSE BuilderGrid PSE Builder
データグリッドチーム
データグリッドチーム ((Leader: Leader: 小島小島 功功))
Data Grid / Database and Grid (OGSA-DAIS, etc.)
科学技術基盤チーム
科学技術基盤チーム ((Leader: Leader: 横川横川 美津夫美津夫))
E-Science 基盤ソフトチーム
基盤ソフトチーム ((Leader: 田中Leader: 田中 良夫良夫))
Programming Middleware, Testbed Development, Grid Security. NinfNinf--G, G, ApGridApGrid
クラスタ技術チーム
クラスタ技術チーム ((Leader: Leader: 工藤工藤 知宏知宏))
話の内容
e
e
-
-
Science
Science
とは?
とは?
グリッドとは?
グリッドとは?
技術的課題(さらっと)
技術的課題(さらっと)
今、何ができているか?
今、何ができているか?
Is Grid ready for e
eサイエンスとは
情報技術の高度利用に立脚した新しい科学技術研究手法
情報技術の高度利用に立脚した新しい科学技術研究手法
ネットワークで接続された様々な高機能資源(高性能計算
機、高速ネットワーク、大規模データベース、実験装置など)
を統合的に活用することにより、科学技術における新たな
発見や融合研究領域などの新たな研究分野を創出するこ
とを目指す。
センサー、装置 記憶装置 高性能計算機 ソフトウェア 専門家 視覚装置 高速ネットワーク ユーザ ユーザ ユーザeサイエンスの例
DB @ Thailand DB @ Japan Mirror DB Satellite 地質情報科学 resource investigation disaster prevention EnvironmentWeb Service: Meta Database
Data Grid: Grid File Systems Storage Cluster Computer Cluster Computer user
国際的情勢
eサイエンスに関する研究は
eサイエンスに関する研究は
2000
2000
年頃より活発化
年頃より活発化
諸外国
諸外国
欧州: 年間数億ユーロの研究投資
UK-eScience, 2000年11月∼Enabling Grid for E-Science in Europe (EGEE), 2004年4月∼
米国: 年間数億ドルの研究投資
International Virtual Data Grid Laboratory (iVDGL), 2001年9月∼ Open Science Grid, 2004年9月∼
NEESit, 2004年10月∼
アジア:韓国、中国、タイ等でネットワークの科学技術応用をeサイエンス
として統合する動きが見られるようになってきたが、アジア全体を視野に
含めるには至っていない。
平成16年3月22日に日中韓の科学技術担当局長による会合において”CJK e-Science Testbed”の提案があり、積極的に推進することが議論された。我が国
我が国
文部科学省
NAREGI(National Research Grid Initiative)プロジェクト
において、ナノサイエンスをターゲットにグリッドミドルウェア開発および実
証実験を進めている。
National Institute of Advanced Industrial Science and Technology
3年位前の新聞記事から
読売新聞 2002年3月26日(夕刊)
日本経済新聞 2002年2月4日
日本経済新聞 2001年12月30日
The Grid Problem (definition)
Flexible, secure, coordinated resource
Flexible, secure, coordinated resource
sharing among dynamic collections of
sharing among dynamic collections of
individuals, institutions, and resources
individuals, institutions, and resources
グリッドのもう少し分かりやすい定義
仮想組織
仮想組織
(Virtual Organization)
(Virtual Organization)
がインターネット上に
がインターネット上に
分散並列
分散並列
「仮想計算
「仮想計算
環
環
境
境
」
」
(Virtual computing environment)
(Virtual computing environment)
を動的に形成
を動的に形成
計算
計算
機
機
などの資源が「どこにあるか」を抽象化⇒
などの資源が「どこにあるか」を抽象化⇒
サービスの質
サービスの質
(
(
QoS
QoS
)
)
はグリッド
はグリッド
が判断
が判断
計算インフラ・セキュリティインフラ・データインフラなど⇒資源の共用、抽象化さ
計算インフラ・セキュリティインフラ・データインフラなど⇒資源の共用、抽象化さ
れた標準のアクセス法
れた標準のアクセス法
(Web
(Web
のように
のように
)
)
ストレッジ
ストレッジ
リソース
リソース
超高速
超高速
ネットワーク
ネットワーク
計算リソース
計算リソース
会社
B
仮想組織
研究所
A
仮想計算機
グリッドの歴史
90
90
年代はじめ
年代はじめ
広域分散計算、グローバルコンピューティング、 メタコンピューティング
90
90
年代中ごろ∼終わり
年代中ごろ∼終わり
(アカデミック)ソフトウェアの開発、実証実験
“
Grid”という用語が会議・論文等ではじめて使われたのは97年9月(たぶ
ん)
現在
現在
科学技術計算分野における多数のプロジェクト、コミュニティ
テストベッドの構築
NASA IPG, TeraGrid, UK-eScience, EUDG, EGEE, ApGrid, …
大規模実証実験
事実上の標準ソフトウェアの登場:
Globus Toolkit
TM技術的にはかなり
matureになってきている。
産業界からも注目
グリッド協議会
http://www.jpgrid.org/
2002
2002
年
年
6
6
月
月
17
17
日発足
日発足
産総研コンソーシアム設置規定
産総研コンソーシアム設置規定
法人会員
法人会員
57
57
社(
社(
163
163
名)、個人会員
名)、個人会員
90
90
名
名
(4
(4
月
月
27
27
日時点
日時点
)
)
国内におけるグリッド技術の情報交流と人的交流
国内におけるグリッド技術の情報交流と人的交流
活動内容
活動内容
調査会:
GGFを中心に標準化・技術動向の調査と報告
ワークショップ:特定技術に焦点を持つ小規模討論会
講習会:チュートリアルによる技術普及
講演会・シンポジウム:対象を広く取った複数の講演
GridWorld
GridWorld2004
GridWorld2004
世界初のグリッドに関する展示会・シンポジウム
3000人登録、2000人来場、20団体による展示
GridWorld2005
GridWorld2005
は
は
5
5
月
月
11
11
-
-
12
12
日@東京国際フォーラム
日@東京国際フォーラム
入場無料
基調講演:村井純先生
チュートリアル等
http://www.jpgrid.org/
GridWorld2006
GridWorld2006
は来年
は来年
6
6
月(
月(
GGF
GGF
と同時開催)
と同時開催)
National Institute of Advanced Industrial Science and Technology
単位の確認
Flops (floating ops. per
second)
- 計算機の性能を表す単位
- 1秒間に何回の小数点演算を
実行できるかを表す
bps (bits per second)
- ネットワークのデータ転送の性
能を表す単位
- 1秒間に何ビットのデータを転
送できるかを表す
103 104 106 107 108 109 1012 1015 1016 1018 1020 1021 1024 K − M − − G T P − E − Z Y kilo − mega − − giga tera peta − exa − zeta yota 千 万 − − 億 − 兆 − 京 − 垓 − 秭(し)コンピュータの性能と値段
パソコン パソコン (PC)(PC) ∼ 数Gflops, ∼ 100万円 Workstations Workstations ∼ 数十Gflops, ∼ 1000万円 Supercomputers Supercomputers ∼ Tflops, 数億円∼数百億円 As of Nov. 2004No. 1: BlueGene/L (IBM/DOE) 0.7GHz PowerPC 440 / 32768cpu 70.72 / 91.75 TFlops
No. 2: Columbia (NASA/Ames Research Center) SGI Altix 1.5GHz / 10160cpu
51.87 / 60.96 TFlops
No. 3: Earth Simulator (The Earth Simulator Center) 5120cpu
35.86 / 40.96 TFlops
No. 4: MareNostrum (Barcelona Supercomputer Center) PowerPC 970 2.2GHz / 3564cpu
20.53 / 31.363 TFlops
No. 5: Thunder (Lawrence Livermore National Laboratory) Intel Itanium2 Tiger 4 1.4GHz – Quadrics / 4096cpu
クラスタコンピュータ −手づくりのスパコンー
数台∼千台規模のパソコンを高速
数台∼千台規模のパソコンを高速
ネットワーク(イーサネット、
ネットワーク(イーサネット、
Myrinet
Myrinet
など)で接続し、並列計算機(スパコ
など)で接続し、並列計算機(スパコ
ン)とみたてる
ン)とみたてる
利点
利点
コストパフォーマンスが良い
アバウトに
1Tflops == 1億
地球シミュレータは
400億で約
40Tflops
最先端の
CPUを利用可能
ご自由な構成
台数、ネットワーク、
CPUなど
今の高性能計算機は実質クラスタ型
今の高性能計算機は実質クラスタ型
AIST Super Cluster
P32
: IBM eServer325 Opteron 2.0GHz, 6GB 2way x 1074 node Myrinet 20008.59TFlops
/peak 10,800mm 10,200mmM64
: Intel Tiger 4 Madison 1.3GHz, 16GB 4way x 131 node Myrinet 20002.72TFlop
s/peakF32
: Linux Networx Xeon 3.06GHz, 2GB 2way x 260+ node GbE3.13TFlops
/peakあくなき要求
より速く計算したい
より速く計算したい
より大きなデータを解析したい
より大きなデータを解析したい
より大きなデータベースを作成・利用したい
より大きなデータベースを作成・利用したい
手元にない装置を使いたい
手元にない装置を使いたい
…
…
National Institute of Advanced Industrial Science and Technology
グリッド技術のめざすところ
次世代の情報通信基盤として、すべてのサービス、ユーティリ
次世代の情報通信基盤として、すべてのサービス、ユーティリ
ティを提供する手段
ティを提供する手段
TCP/IP や Internet Browserに相当
ネットワークで接続された情報資源(コンピュータ、人、実験装置、
ネットワークで接続された情報資源(コンピュータ、人、実験装置、
可視化、DB、ソフトウエア、
可視化、DB、ソフトウエア、
PDA
PDA
、など)に対して
、など)に対して
だれでも、どこからでも、いつでも、
$5K PC @ NY = $500 PC @ Africa (by CeC)
ネットワーク
/サーバそのものを意識することなく
Bandwidth, routing, scheduling, Accounting, Security
Servers/Clients’ location, OS, CPU, etc
必要なときに必要なサービスを即座/瞬時/簡便に享受でき
るようになる/なって欲しい
もともとは電力網の
もともとは電力網の
Power Grid
Power Grid
からきた用語
からきた用語
これを実現する技術をグリッド(GRID)と呼ぶ
これを実現する技術をグリッド
目的
ペタフロップス超の能力を確保(アーキテクチャ的興味)
ペタフロップス超の能力を確保(アーキテクチャ的興味)
Supercomputer (100G x 20台→10T x 100台)
PC群 (1GFlops x 100,000台) e.g. SETI@HOME
Grand Challenge (
Grand Challenge (
超大規模応用、計算科学的興味
超大規模応用、計算科学的興味
)
)
高エネルギー物理学
ゲノム・バイオインフォマティクス
地球科学など
ビジネスアプリケーションへの展開
ビジネスアプリケーションへの展開
高対費用効果
高耐故障性
日常業務への波及展開(産業活動支援)
日常業務への波及展開(産業活動支援)
中小企業等の裾野への機会提供
HPC計算資源交換市場の創出
新たな計算センターの形態、ASP、Virtual Laboratory危機管理対応計算環境(危機管理)
危機管理対応計算環境(危機管理)
緊急時にネットワーク接続された計算機による負荷分散
ネットワーク技術との連携…
What Grid makes it possible?
Online Access to Remote Instruments
Online Access to Remote Instruments
Petabyte
Petabyte
-
-
scale Data Analysis
scale Data Analysis
Detector for ALICE experiment Detector for LHCb experiment
What Grid makes it possible? (cont’d)
Large
Large
-
-
scale Distributed Computing
scale Distributed Computing
Large
What Grid makes it possible? (cont’d)
High Throughput Computing
High Throughput Computing
Integration of Human Resources
今日の話は計算グリッドに着目
その他:データグリッド、センサーグリッド
グリッドにおけるプログラミングは何が違う?
グリッド(固有)の性質
グリッド(固有)の性質
複数のサイト
複数の計算機
非均質性
非集中管理
不安定
…
プログラミングは?
プログラミングは?
意識したくない
グリッドにおけるプログラミング方法および
それらをサポートするソフトウェアの現状
使いやすいが 柔軟性に欠けるポータル
特定のアプリケーションを利用するためのWeb インタフェースを提供。ユーザはプログラミングの必要なし。 NPACI HotPage, GridPort, Ninf-G Portal, QC Portalなど産総研で開発を進めているシステム (Ninf-G)を高レベルミドルウェアの 標準的なシステムの1つとして普及さ せる。本システムを基にしたプロトコ ル、API等をGGFにおいて標準化。
高レベルミドルウェア
並列・分散プログラミングを容易に行うためのシステム。 低レベルミドルウェアが提供するグリッドに必要な機能を 容易に利用する手段を提供。ほとんどのアプリケーション プログラマは高レベルミドルウェアを利用することになる。 ポータルにおけるバックエンドとしても必要不可欠。 この階層においては、競争が激しい低レベルミドルウェア
セキュリティ、資源管理、(安全な)通信、データ転送、 情報サービスなど、グリッドにおいて必要な要素技術を 提供。豊富な機能と柔軟な利用方法を提供するが、 一般ユーザが直接利用するのは難しい。 米国で開発されたGlobus Toolkitが 事実上の標準基本機能、プリミティブ
Operating Systemレベルでの通信機能および認証機能 などの基本機能およびプリミティブ。低レベルミドルウェア はこれらの機能を元に実装されている。 難しいが 柔軟な処理が 記述できる代表的な並列プログラミング手法:
MPI
データ並列(計算対象のデータを分割し、複数のプロ
データ並列(計算対象のデータを分割し、複数のプロ
セスで並列に実行するモデル)に適している
セスで並列に実行するモデル)に適している
例: 行列の足し算
+
=
各プロセスに分配 各自足し算 結果を集める代表的な並列プログラミング手法:
MPI (cont’d)
すべてのプロセスが同じプログラムを実行する。ただ
すべてのプロセスが同じプログラムを実行する。ただ
し計算の対象となるデータが違う
し計算の対象となるデータが違う
SPMD (Single Program Multiple Data)
プロセス間でデータを送受信するためのプログラミン
プロセス間でデータを送受信するためのプログラミン
グインタフェースを規定(仕様)
グインタフェースを規定(仕様)
MPI_Send(), MPI_Recv()
MPI_Barrier()
MPI_Reduce()
などなど
並列計算のプログラミング方法として超有名
並列計算のプログラミング方法として超有名
代表的な並列プログラミング手法:
multi thread
複数の
複数の
thread
thread
と呼ばれるプログラムを実行する実体
と呼ばれるプログラムを実行する実体
を生成し、並列処理。
を生成し、並列処理。
1つのプロセス内に複数の
1つのプロセス内に複数の
thread
thread
を生成。データはメ
を生成。データはメ
モリを使って共有する。
モリを使って共有する。
共有メモリ型並列計算機でしか使えない。
共有メモリ型並列計算機でしか使えない。
代表的?な並列プログラミング手法:
RPC
タスク並列(行なうべき計算がたくさんある)に適して
タスク並列(行なうべき計算がたくさんある)に適して
いる。
いる。
遠隔手続き呼び出し
遠隔手続き呼び出し
(Remote Procedure Call)
(Remote Procedure Call)
を
を
使ってリモート計算機上で計算を実行。
使ってリモート計算機上で計算を実行。
Structural Optimization Vehicle Routing Problem
GridRPC とは?
GridRPC
スーパーコンピュータ
の遠隔利用
ユーザInternet
① 関数呼び出し ② 結果の通知特殊なライブラリの
遠隔呼び出し
グリッド上の複数の高性能計算機を利用した大規模計算
ポータル、ASPの
バックエンドとして利用
クライアント・サーバモデルにもとづき、独立する1つ以上
の計算(タスク)を遠隔計算機で実行
同期
RPCと非同期RPC
非同期
非同期
RPC
RPC
同期
同期
RPC
RPC
サーバ側の処理が終了するまで
クライアントの処理はブロック
通常の関数呼び出しと同一のセ
マンティクスを提供
サーバ側の処理終了を待たずに
呼び出しが終了
複数タスクの並列実行を支援
grpc_call_async(...);
grpc_wait_*(…);
grpc_call_async
grpc_call_async
(...);
(...);
grpc_wait
grpc_wait
_*(
_*(
…
…
);
);
grpc_call(...);
grpc_call
grpc_call
(...);
(...);
grpc_call_async
Client
ServerA
ServerB
grpc_call_async
grpc_wait_all
grpc_call
典型的なシナリオ(その1:デスクトップスーパーコンピューティング)
手元の計算機(
手元の計算機(
PC,
PC,
ワークステーション)から遠隔スー
ワークステーション)から遠隔スー
パーコンピュータに計算を依頼
パーコンピュータに計算を依頼
ライブラリの集中管理が可能
ライブラリの集中管理が可能
ASP
ASP
ライクアプローチ
ライクアプローチ
Numerical Libraries
Applications
Ninf_call(FUNC, arg1, ...)
client
server
arguments
results
典型的なシナリオ(その2:パラメータサーベイ)
独立する大量の計算(タス
独立する大量の計算(タス
ク)を大量の遠隔計算機上
ク)を大量の遠隔計算機上
にばらまいて実行
にばらまいて実行
eg. TDDFT, 気象シミュ
レーション
障害ノードは適宜捨てる・リ
障害ノードは適宜捨てる・リ
トライ
トライ
新たなノードを動的に追加
新たなノードを動的に追加
Client
Servers
Servers
典型的なシナリオ(その3:
GridRPC+MPI)
粒度の大きな並列プログラム
粒度の大きな並列プログラム
(
(
MPI)
MPI)
を複数のクラスタで実行
を複数のクラスタで実行
eg. QM/MDシミュレーション
粗粒度並列(
粗粒度並列(
by
by
GridRPC
GridRPC
)
)
と細
と細
粒度並列
粒度並列
(by MPI)
(by MPI)
の組み合わ
の組み合わ
せ
せ
利用するクラスタの動的な切り替
利用するクラスタの動的な切り替
えが可能
えが可能
大規模実行へのアプローチとし
大規模実行へのアプローチとし
て非常に現実的
て非常に現実的
Client
Servers
Servers
GridRPC v.s. MPI
GridRPC
GridRPC
タスク並列
タスク並列
クライアント・サーバ
クライアント・サーバ
GridRPC
GridRPC
API
API
必須ではない
必須ではない
対応タスクのみ停止
対応タスクのみ停止
利用可能
利用可能
動的に指定可能
動的に指定可能
既存並列プログラム
既存並列プログラム
のグリッド化が容易
のグリッド化が容易
並列性
並列性
モデル
モデル
API
API
co
co
-
-
allocation
allocation
障害発生時
障害発生時
private IP
private IP
ノード
ノード
利用資源
利用資源
その他
その他
MPI
MPI
データ並列
データ並列
SPMD
SPMD
MPI
MPI
必須
必須
全体が停止
全体が停止
利用不可
利用不可
静的に決定*
静的に決定*
well known
well known
既存プログラムをその
既存プログラムをその
ままグリッドで実行
ままグリッドで実行
*MPI2のspawn機能を使えば動的利用可能GridRPCの現状
Ninf
Ninf
、
、
NetSolve
NetSolve
プロジェクトは
プロジェクトは
1994
1994
年頃スタート
年頃スタート
当初はクライアント・サーバ型
(1対1)の計算モデルを想定
クラスタの普及に伴い、マスター・ワーカ型
(1対多)の計算モ
デルが主流に
既存のシステムおよびその利用
既存のシステムおよびその利用
NetSolve
細胞生理学向けモンテカルロシミュレーション
(MCell)
OmniRPC
HMCS-G (GRAPE-6 + CP-PACS)
Ninf
数値、組み合わせ最適化問題(
BMI, SDPA)
レプリカ交換モンテカルロ
(HPC Challenge @ SC2002)
Ninf-G
ApGrid Testbed上での気象シミュレーション
QM/MD simulation, TDDFT
ApGrid/TeraGridでの大規模デモ
Ninf-Gとは?
GridRPC
GridRPC
によるプログラム開発および実行を支援す
によるプログラム開発および実行を支援す
るソフトウェアパッケージ。
るソフトウェアパッケージ。
Ninf
Ninf
-
-
G includes
G includes
C/C++, Java APIsとライブラリ
IDL コンパイラ
シェルスクリプト
クライアントプログラムのコンパイルドライバ
リモートライブラリの構築および管理
例プログラム
マニュアル
Ninf-G アプリケーション事例
分子シミュレーション
分子シミュレーション
レプリカ交換モンテカルロ:
分子のポテンシャルエネルギーサーベイ SC2002においてMetacomputing Testbed上で 700CPUを用いた実験を実施Time Dependent DFTシミュレーション:
分子の電子状態を計算 ApGrid テストベッド上で1週間にわたって継続計算最適化問題
最適化問題
配送計画問題
最短経路探索Supply Chain Management
天気予報シミュレーション
天気予報シミュレーション
S-modelプログラム:
短中期にわたる広域天気予報シミュレーション SC2003においてTeraGrid/ApGrid/PRAGMA testbed上で実験を実施気象シミュレーション
@SC2003
Client
(AIST)TeraGrid Severs
NCSA Cluster (225 CPU)
利用CPU数:500 サンプルシミュレーション数:1000 実行時間:90秒 利用CPU数:500 サンプルシミュレーション数:1000 実行時間:90秒 perturbation mean Sample simulation 2 Sample simulation Sample simulation 1 Time evolution statistics Time evolution Time evolution
…
100 ~ 1000ターゲットアプリケーションの特徴
必要とされる特性
必要とされる特性
スケーラビリティ
頑健性
柔軟性
Current target
Current target
CPU数 実行時間 10 100 1000 10000 1 1 分 1 時間 1 日 1 週間 1 月 Climate simulation TD-DFT REX-MC 100~1000 CPUs 1 時間 ~ 1 週間 占有環境 1 年Next Target
Next Target
1000 ~10000 CPUs 1 月 ~ 1 年 非占有環境 計算資源 A 計算資源 C 計算資源 B 時間 Resource A Resource B Resource C application application application 実験期間全体にわたり 利用可能 実験期間 Resource B application Resource C application Resource A application 計算資源 A 計算資源 C 計算資源 B 時間 実験期間の一部のみ 利用可能 実験期間Gridプログラミングモデル
既存の
既存の
Grid
Grid
プログラミングモデルではこれらの条件を満足することは困難
プログラミングモデルではこれらの条件を満足することは困難
GridRPC
動的実行☺
co-allocation不要 計算機資源の動的変更が容易 障害検知可能☺
遠隔実行プログラムの障害を検知 他の計算機資源を動的に選択可能 多数の遠隔実行プログラムを効率的に管理することは困難 クライアントがボトルネックになりやすいGrid-enabled MPI
効率的なプロセス間通信☺
通信ボトルネックを回避しやすい 静的実行 co-allocationの必要性 実行中にプロセス数を変化させることは困難 障害に弱い 1プロセスに障害発生 全プロセスが実行継続困難にGridRPCとMPIの組み合わせによるプログラムのGrid化
両者の長所の組み合わせによる大規模プログラムの
両者の長所の組み合わせによる大規模プログラムの
Grid
Grid
化
化
Grid RPC
MPIプログラムを動的に起動
クライアントとサーバ間の疎な
(loose)通信を支援
数十∼数百の
MPIプログラムを実行管理
MPI
サーバプログラム内の密な
(tight)通信を支援
疎に連携する
疎に連携する
(loosely coupled)
(loosely coupled)
並列プログラムから構成されるアプ
並列プログラムから構成されるアプ
リケーションのグリッド化を目的
リケーションのグリッド化を目的
多原理
(multi-disciplinary) シミュレーション
Hybrid QM/MD simulation
GridRPC
Ninf-G clientGridRPC
MPI ProgramsGridRPC
大規模
Atomistic Simulationの必要性
Quantum description of bond breaking [ Deformation process ] [ Stress distribution ] 大規模Atomistic Simulation 適切な実行時間 適切な精度保持微細レベルの解析を通じた詳細な知識を提供
微細レベルの解析を通じた詳細な知識を提供
次世代半導体素子の設計
マイクロマシンの設計
微細レベル解析の特徴
微細レベル解析の特徴
ナノスケールの現象を対象
多数の原子を取り扱う環境に敏感
高精度シミュレーションが必要Atomistic Simulationの現状
2
2
つの条件を満足することは困難
つの条件を満足することは困難
MD Simulation:
計算コスト:小 (~10-6 m, 10-9 sec, 108 atoms) 精度:低QM Simulation:
計算コスト:大 (< 10-8 m, 10-12 sec, 103 atoms) 精度:高Benchmark tests
on 1024-node Cray T3E
適切な計算コスト
Hybrid QM/MD Simulation
大規模な
大規模な
Atomistic simulation
Atomistic simulation
の高精度実行を可能に
の高精度実行を可能に
MD SimulationとQM simulationを連携
MD simulation
全領域の原子の振舞いを計算
経験的原子間ポテンシャルを用いた古典
MDシミュレーション
QM simulation
興味のある領域のみを対象に実行,
MDの結果を修正
Density Functional Theory (DFT)に基づくQMシミュレーション
MD Simulation
QM simulation based on DFT
Hybrid QM/MD Simulation Algorithm
シミュレーションアルゴリズム
シミュレーションアルゴリズム
Dr. Nakano (USC), Dr. Ogata (Nitech), et.alにより開発
原プログラムは
原プログラムは
MPI
MPI
を用いて実装
を用いて実装
MPICH-G2や他のGrid aware MPIを用いればGrid上で無修正で実行可能 幾つかの問題が存在
Co-allocation problem Static configuration Weak fault tolerance
Ninf-Gを用いた再実装
MD prog. QM prog.
initial set-up
Calculate MD forces of QM+MD regions
Update atomic positions and velocities
Calculate QM force of the QM region
Calculate QM force of the QM regionCalculate QM force of the QM region Calculate MD forces of QM region
initial set-up Initialization InitializationInitialization Initial parameters Data of QM atoms QM forces Data of QM atoms QM forces Calculate QM force of the QM regionCalculate QM force of the QM regionCalculate QM force
SC2004における動作実験
4
つの
QM
領域
#0
: 69 atoms
including
2H
2O+2OH
#1
: 68 atoms
including
H
2O
#2
: 44 atoms
including
H
2O
#3
: 56 atoms
including
H
2O
Close-up view
Stress
環境下における
Nano-structured Si system
と水分子の化
学反応
◆ 傾斜した柱により接合された2枚 のSi slabs ◆ 0.11million atoms実験用テストベッド
P32 (512 CPU) F32 (256 CPU) TCS (512 CPU) @ PSC P32 (512 CPU) F32 (1 CPU)QM #0: 69 atoms
including 2H
2O+2OH
QM #2: 44 atoms
including H
2O
QM #1: 68 atoms
including H
2O
QM #3: 56 atoms
including H
2O
MD: 110,000 atomsTCS@ PSC (512 CPU)
ES45 alpha (1.0 GHz) 4-way cluster
ASC@AIST (1281 CPU)
P32 (1024 CPU)
Opteron (2.0 GHz) 2-way cluster
F32 (257 CPU)
Xeon (3.06 GHz) 2-way cluster
TCS@ PSC (512 CPU)
ES45 alpha (1.0 GHz) 4-way cluster
ASC@AIST (1281 CPU)
P32 (1024 CPU)
Opteron (2.0 GHz) 2-way cluster F32 (257 CPU)
Xeon (3.06 GHz) 2-way cluster
Totally 1792 CPUs on 3 clusters
QM/MD simulation over the Pacific
QM Server
QM Server
initial set-up Calculate MD forces of QM+MD regionsUpdate atomic positions and velocities
Calculate QM force of the QM regionCalculate QM force of the QM regionCalculate QM force
of the QM region Calculate MD forces of QM region
MD Client
P32 (512 CPU) P32 (512 CPU) F32 (256 CPU) TCS (512 CPU) @ PSCTotal number of CPUs: 1792