BioServerによる高精度結合自由エネルギー計算
8
0
0
全文
(2) ンピュータなどで用いられている従来の並列アルゴ リズムではなく、世界中のインターネッ トで繋がっている数万台のコンピュータにシミュレーションを並列分散させる独自の方法を 考案して超難問の蛋白質の畳み込み計算を初めて実現した [2]。スーパーコンピュータなどで 用いられている Message Passing Interface (MPI) などの並列化アルゴ リズムでは CPU 台数 が多くなるに従い CPU 間のデータ通信が占める割合が飛躍的に増加して効率的な計算を妨 げる事になる。例えば数万台の CPU で数万倍の効率的なシミュレーションを実行するため には、シミュレーションの根本アルゴ リズムから変更する必要がある。 蛋白質がリボゾームで生成され 、畳み込みにより立体構造を獲得した後に、他の生体高分 子やリガンド とどの様に相互作用をするかを調べる事は、基礎的研究の大きな課題であると 同時に応用の観点からも極めて重要である。特に蛋白質と薬候補化合物であるリガンド との 結合自由エネルギーを正確に求める事は、創薬分野における永年の課題である。我々はこの 課題に対して独自のアルゴ リズムと超並列専用計算機を開発して、FKBP 蛋白質とリガンド の結合エネルギーを正確に求める事に成功した [3]。. 2. 結合自由エネルギー計算方法. あるリガンドがターゲットとする蛋白質に強く結合する場合は、その蛋白質本来の機能を リガンドが阻害して薬効果が現れる可能性が高い。この為、種々のリガンドが蛋白質に結合す るエネルギーを精確に求める事が 、計算機を使った薬設計 (Computational Drug Design) を 実現する為の必須条件になる。一般に薬候補化合物と蛋白質の結合エネルギーは -10kcal/mol 程度であり、薬候補化合物間の優劣を判断するには 1kcal/mol ほど の精度で結合自由エネ ルギーを求める必要がある。室温での熱揺らぎエネルギー (kB T kB :ボルツマン定数) が約 0.6kcal/mol なので、1kcal/mol の精度で結合エネルギーを計算するのは至難の業であり、従 来の方法では実現不可能であった。 今迄に蛋白質とリガンド の結合エネルギーを求める様々の計算方法が提案されているが 、 その多くが実験データに基いた経験的な方法であり、実験データのない未知の系についても 適用可能になる為に必要な “強固な物理理論に基づいた方法” は行われていなかった。そもそ も結合エネルギーとは蛋白質とリガンド 分子が水中 (細胞液) で結合した状態と、蛋白質とリ ガンドがそれぞれ別に水中に溶けている二つの異った平衡状態の間の自由エネルギー差であ る。この異った二つの熱力学状態の間を遷移する時に、蛋白質やリガンドは熱揺らぎによっ て様々に構造が変化したり、弱く結合する状態から自由エネルギーがより低くて強く結合す る状態へと結合状態を変化させる。一般に薬化合物は数十から二百くらいまでの原子からな る分子であり、蛋白質は数百から数十万原子からなる巨大分子なので、結合エネルギーを精 確に求めるには、これらの構造変化によるエントロピー変化を精密に計算する必要がある。 蛋白質とリガンドが離れた状態から安定な結合状態に遷移するのにマイクロ秒のオーダを 要するが 、この間のエントロピー変化を計算するにはこの間の分子動力学シミュレーション を行って経巡る相空間のサンプリングを行う必要があ る。分子動力学の 1 ステップを 1 秒で 計算する高速のコンピュータを用いても、1 マイクロ秒までの 109 ステップを計算するには 32 年を要する。 この不可能な計算を実行するには、まったく新しい超並列化アルゴ リズムが必要である。 1997 年に Jarzynski は熱平衡状態間の非平衡仕事量の指数関数平均が二つの状態間の自由エ ネルギー差になるという基礎的な等式 ΔG = −kB T lnexp(−W/kB T )av を証明した [4]。こ のアイデアに基いて蛋白質とリガンドが別々に水に溶けて蛋白質とリガンド 間に相互作用が −36− 2.
(3) 無い状態 H[λ = 0] と、蛋白質とリガンド 間の相互作用が働いて結合している状態 H[λ = 1] を考える。相互作用の強さ λ をパラメータとして種々の中間状態を考えて、その隣合う状態 間の遷移に必要な仕事量を求める。この仕事量の単純な指数関数平均を取るだけでは、仕事 分布の裾の誤差が大きく現れて、精確な自由エネルギー差は得られない。これを克服する為 に、図 2 の様に λ が小くなる方向と大きくなる二方向の仕事量を独立に求めて、その二つの 分布からベネット受容比法 (Bennet Acceptance Ratio: BAR) を用いてそれぞれの間の自由 エネルギー差を求める [5]。. 㱗䋽1. 㱗䋽0.75. P F (W ). P R( W). G1. P F (W ). +. 㱗䋽0.5. P R( W). G2. P F (W ). +. 㱗䋽0.25. P R( W). G3. P F (W ). +. 㱗䋽0. P R( W). G4. =G. 図 2 非平衡仕事量の測定 図 2 では五つの λ 状態を図示しているが 、計算精度を向上させる為に λ の刻み間隔をより 小くして最適化する必要がある。またそれぞれの λ で独立に分子動力学を実行するが 、その 初期運動量分布によってサンプリングされる相空間が異なり、異なる自由エネルギーが得ら れるので、異なる初期運動量分布を持った λ のセットを多数用意する必要がある。λ の間隔 と異なる初期運動量セットの数を最適化した処、33 点の λ 状態を 60 セット用いることで最 もよい自由エネルギー分布が得られ、これ以上初期運動量セットを増やしても同じ分布が得 られる事が分った。これで 33 × 60 = 1980 の分子動力学を同時並列に実行して、個々の分子 動力学計算を 1 ナノ秒実行すると、全体ではマイクロ秒オーダの探索を行ったのと同等の計 算量になる。. 3. FKBP リガンド. FK506 は臓器移植やアトピーなど の病気治療に用いられる免疫抑制剤で、FK506 に結合 する蛋白質 FKBP(FK506 Biding Protein) は殆どの生物種に存在して蛋白質の主鎖の向きを 大きく変換出来る酵素活性を持っている。FKBP は 107 個のアミノ酸基からなる蛋白質で、 1666 個の原子からなる。図 3 は今回結合エネルギー計算を行った FK506 とそのアナログであ る。図の右側の数値は実験で得られた抑制定数 (inhibition constatant: Ki ) であり、kB T ln Ki が結合エネルギーの実験値になる [6]。 FKBP 蛋白質とこれらのリガンド の結合自由エネルギーの絶対値を計算で求めるには、ま ずその結合している時の原子座標を全て知る必要がある。L8 、L9 、FK506 の三種類のリガ ンドについては FKBP と結合している状態の X 線解析データがあり、原子座標値が Protein Data Bank に登録されている。他のリガンドについては結合状態の X 線データが無く、構造 が分っている三つのデータから結合状態を推測して初期座標を决めた。この FKBP とリガ ンドが結合している回りに水分子をランダムに配して分子動力学計算に用いる初期構造を作 −37− 3.
(4) 成した。. L2. L8. 10. L9. 7. 2000. L3. 660. L5. 110. L6. 12. L12. 30. FK506. 0.4. 図 3 FKBP リガンド 全ての系に対して初期構造を緩和する為に室温での分子動力学計算を 10 から 20 ナノ秒ほ ど 行った。水分子が初期のランダム配置から、室温で蛋白質の回りに構造をもった状態に緩. (a). (b). 図 4 FKBP と L2 リガンド の結合状態 和するのに通常 1 から 3 ナノ秒掛るが 、これに比較すると遥かに長い時間の緩和計算が必要 −38− 4.
(5) である。理由の一つには、初期構造が安定ではなく緩和シミュレーションを行っている間に 構造が変化する事による。図 3 の全てのリガンド はピペコリトと α-ケト アミノを持ってお り、これが L8 、L9 、FK506 では FKBP の疎水ポケットの底に入る様に結合している。その 為、他のリガンド も同様の結合形状を持っていると推測した。 図 4(a) は L2 の初期構造でピペコリトが FKBP の疎水ポケットの底にあり、黄色で示され ている FKBP の 59 番目アミノ酸であるトリプトファンのインド ールの直ぐ 上にある。これ が分子動力学シミュレーションを行っている間に、疎水ポケットの中で回転して (b) の様に ピペコリトが上になって安定した。この間約 14 ナノ秒である。L3 でも同様にピペコリトが 疎水ポケットの上になったが 、他のリガンドではこの様な回転は起らずに初期構造と同じ疎 水ポケットの底にピペコリトは滞った。. 図 5 BioServer による結合エネルギー計算 この緩和された構造を超並列結合エネルギー計算の初期構造として BioServer を使用して 実行する。BioServer は一ラックに 1920 個の FR-V プロセッサを塔載した計算エンジンで [7] 、 磁気ディスクを持ったサーバー機とペアになって機能する。実際に計算を進めるには、サー バ機で相互作用強度 λ や初期運動量分布を変えて初期の入力データを作成して、各 FR-V プ ロセッサーで 100 ピコ秒の分子動力学シミュレーションを実行させる。その結果をサーバ計 算機に戻して、次の 100 ピコ秒のシミュレーションを行う為の入力データを作って FR ー V で次の計算を行わせる。この様にしてサーバ機には全ての独立な分子動力学シミュレーショ ンの 100 ピコ秒毎の結果が蓄えられる。この 100 ピコ秒毎の二方向の仕事量から BAR 法で 結合エネルギーを計算し 、数千の FR-V プロセッサーで同時進行中の計算の進み具合をモニ ターする。 BioServer の中では相互作用の強さ λ が異なるシミュレーションが独立に行われているの で、ある FR-V プロセッサを見ると蛋白質とリガンドが密に結合した状態の相空間のサンプ リングが起こなわれており、他の FR-V プロセッサでは蛋白質とリガンドが離れた状態が 、 また他では中間の強さの相空間のサンプリングが行われている (図 5)。 この方法による結合 エネルギーの収束速度はリガンド の種類にも依存するが 、大体 1000 個オーダの FR-V プロ セッサを使用して 0.5 から 1.5 ナノ秒の分子動力学によるサンプリングによって良好な収束 −39− 5.
(6) が得られる。この様にして蛋白質とリガンドが水中で離れた状態から安定な結合状態を形成 するまでのマイクロ秒オーダの相空間サンプリングを、1000 個オーダの並列化を行って同時 処理する事が可能になった。. 4. 計算精度. BioServer の中の個々の FR-V プロセッサで行っている分子動力学シミュレーションには 単精度版の改造した GROMACS(http://www.gromacs.org) を使用した。有限要素法を使った. Calculation (kcal/mol). -3 構造解析や電気回路 シミュ L2 レーションなど 殆ど の数値 -4 L3 シミュレーションには倍精 -5 度演算が必須であるが 、分 L5 -6 子動力学シミュレーション L12 は例外的に単精度で殆ど の -7 L8 演算を行っても計算精度に -8 L6 は支障がない。これは運動 L9 -9 方程式を解く時間ステップ が短い為に 、原子間に働く -10 FK506 力の計算精度を上げ る必要 -11 がない為である。 0.1 1 10 100 1000 10000 図 6 は BioServer によって Experimental Inhibition constant (nM) 得られた FKBP 蛋白質と 8 図 6 FKBP の結合自由エネルギー 種類のリガンド の結合自由 エネルギーを縦軸に、抑制定数の実験値を横軸に示した。計算値の直線からのずれの RMS エラーは 0.4 kcal/mol であり、従来の精度と比較すると一桁以上の改善が見られる。倍精度 の GROMACS を用いて同じ計算を行ったが 、単精度の計算値からのずれは 0.2 kcal/mol 以 内で、結合自由エネルギー計算には単精度版 GROMACS による計算で十分である事が実証 された。. 5. 計算機の新たな方向. 蛋白質とリガンド の結合自由エネルギーの絶対値を 1 kcal/mol 以内の精度で計算する事は コンピュータによる創薬を行う上で永年の悲願であった。BioServer を使用した超並列計算 による結合エネルギー計算方法は、AMBER 力場を用いておりその基礎は分子の電子構造に 基づく。また解離状態から結合状態に致るエントロピーを正確に計算する方法は物理の基礎 理論に基いている。この様に “強固な物理理論に基づいた方法” を用いたシミュレーション 技術は実験結果に新たな光明を当てて、より深く事象を理解する大きな助けになる。一個の 蛋白質とリガンド の結合エネルギーを求めるのに膨大な計算機資源を必要とするが 、得られ る知見は何者にも代えがたい深い意味を含んでいる。 この方法が創薬の現場にどの程度のインパクトを与えるかは今後の進展を見守る必要があ るが 、まずこの様な従来は不可能であったシミュレーションを実行可能にする計算機とソフ トウェアを提供する事が重要である。図 7 は BioServer の製品版プロセッサボックスである。 −40− 6.
(7) 一枚のボード に 8 並列 VLIW アーキテクチャの高性能 FR-V プロセッサーが 4 個載り、それ が 2U のボックスの中に 32 枚実装されている。ある蛋白質とリガンド の一つのセットの自由 エネルギーを求めるのに少なく見積ってもプロセッサボックス 5 個くらいを使うのが効率的 である。一つのターゲット蛋白質に対して複数のリガンド の結合エネルギーを平行して求め るのが一般的なので、実際に自由エネルギー計算をスタートすると計算機を休み無く動かす 様になり、いとも簡単に 1920 個のプロセッサが入ったラックを自由エネルギー計算のジョブ で一杯にして仕舞う。動くのは単精度 GROMACS だけである。. Processor Box (PB) Number of PE. 128PE. Peak performance. 184GFLOPS. Memory capacity. 32GB. Power consumption. 720VA. LAN. 1000Base-T㬍2port 100Base-TX㬍1port. Size (W㬍D㬍H). 482mm㬍785mm㬍87mm (2U). 図 7 AC55: 製品版 BioServer プロセッサボックス. SPARC や X86 などの高速汎用プロセッサでは、スーパースカラーなどのハード ウェアによ る並列化処理がサポートされており、多くのプログラムを効率的に動作させるのが比較的容 易であるが 、純粋な演算以外の処理が多くて電力の消費が大きくなる。これに対して VLIW アーキの FR-V ではプログラム構造とコンパイラ技術だけで並列化効率が決るので、任意の プログラムを効率的に動作させるのは難しくなる。しかし FR-V では純粋な並列演算処理だ けが動いて、前処理などによる余分な電力消費は無く、同一演算処理量にたいする消費電力 は FR-V の方が格段に少くなる。 高性能 X86 プロセッサでは CPU 一個だけで 100 ワット以上を消費するのに対して、FR-V では 1.5 ワット以下である。プロセッサのクロック周波数比は 10 倍程であるのに対して、1 個のプロセッサ当りの消費電力は 60 倍近く異なる。この為に FR-V の VLIW 並列度が活用 出来るアプリケーションを動かす場合には、消費電力や設置面積で優位になる。今回の場合 の様に一つのプログラムが沢山のプロセッサで四六時中動いている状況では、VLIW に対す −41− 7.
(8) る並列最適化に多少の労力を割いても最終的パフォーマンスで多大なメリットが得られる。 地球温暖化が大きな社会問題になっている現代では、低消費電力並列計算機が活躍する場 面が今後多く現れると考えられる。. 謝辞 共同研究者である Stanford 大学の Guha Jayachandran 、Christopher D. Snow 、Michael R. Shirts 、Eric J. Sorin 、Vijay S. Pande 、富士通研究所の谷田 義明、伊藤 正勝の各氏と、富士 通 BioServer プロジェクトのメンバーに謝意を表します。GROMACS の改造では Stockholm 大学の Erik Lindahl 氏にお世話になりました。この研究は NEDO の『バイオ・IT 融合機器 開発プロジェクト 』の支援を受けています。. 参考文献 [1] Y. Duan, L. WAng, and P. A. Kollman, Proc. Natl. Acad. Sci. USA 95, 9897 (1998). [2] C. D. Snow, H. Nguyen, V. S. Pande, and M. Gruebele, Nature 420, 102 (2002). [3] H. Fujitani, Y. Tanida, M. Ito, G. Jayachandran, C. D. Snow, M. R. Shirts, E. J. Sorin, and V. S. Pande, J. Chem. Phys. in press. [4] C. Jarzynski, Phys. Rev. Lett. 78, 2690 (1997). [5] M. R. Shirts, E. Bair, G. Hooker, and V. S. Pande, Phys. Rev. Lett. 91, 140601 (2003). [6] D. A. Holt, J. I. Luengo, D. S. Yamashita, H. J. Oh, A. L. Konialian, H. K. Yen, L. W. Rozamus, M. Brandt, M. J. Bossard, M. A. Levy, D. S. Eggleston, J. Liang, L. W. Schultz, T. J. Stout, and J. Clardyt, J. Am. Chem. Soc. 115, 9925 (1993). [7] H. Okano, A. Suga, T. Shiota, Y. Takebe, Y. Nakamura, N. Higaki, H. Kimura, H. Miyake, T. Satoh, K. Kawasaki, R. Sasagawa, W. Shibamoto, M. Sasaki, N. Ando, T. Yamana, I. Fukushi, S. Tago, F. Hayakawa, T. Kamigata, S. Imai, A. Satoh, Y. Hatta, N. Nishimura, Y. Asada, T. Satoh, T. Sukemura, S. Ando, and H. Takahashi, ISSCC Dig. Tech. Papers, 374 (2002).. −42− 8.
(9)
関連したドキュメント
4)線大地間 TNR が機器ケースにアースされている場合は、A に漏電遮断器を使用するか又は、C に TNR
⑥ニューマチックケーソン 職種 設計計画 設計計算 設計図 数量計算 照査 報告書作成 合計.. 設計計画 設計計算 設計図 数量計算
(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計
、肩 かた 深 ふかさ を掛け合わせて、ある定数で 割り、積石数を算出する近似計算法が 使われるようになりました。この定数は船
越欠損金額を合併法人の所得の金額の計算上︑損金の額に算入
2 省エネルギーの推進 東京工場のエネルギー総使用量を 2005 年までに 105kL(原油換 算:99 年比 99%)削減する。.
(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計
大都市の責務として、ゼロエミッション東京を実現するためには、使用するエネルギーを可能な限り最小化するととも