44
hp150200 「京」以外 HPCI 一般利用 HPCI other than K General Use
フラグメント分子軌道法を利用した蛋白質間ドッキングの評価
Evaluation of protein-protein docking and time estimation of fragment molecular
orbital calculation for development of novel protein-protein docking system
川下理日人*、高木達也 Norihito Kawashita*, Tatsuya Takagi
大阪大学大学院薬学研究科
Graduate School of Pharmaceutical Sciences, Osaka University
* 現所属:近畿大学理工学部生命科学科 * Present Affiliation: Faculty of Science and Engineering, Kindai University
要旨
本研究は蛋白質間ドッキングソフトにより出力されたドッキングポーズに対して、フラグメン ト分子軌道(Fragment Molecular Orbital: FMO)法による蛋白質間相互作用エネルギーの計算を行 うことにより精度良く出力を分類し、蛋白質間相互作用を効率よく評価することを目的とした。 今回の検討では 5 個の蛋白質複合体系を対象に、蛋白質間ドッキングによる評価と FMO による 計算を行った。その結果、FMO 計算の Total IFIE(Inter-fragment Interaction Energy: IFIE)による比較 においては、より結晶構造に近いポーズがより安定なエネルギーを有するという結果を得た。現 在のところ計算が終了している例が少なく、比較例は少ないものの、この結果は Total IFIE がよ り正しいポーズの選定に利用できる可能性を示唆している。 キーワード:蛋白質間相互作用、蛋白質間ドッキングシミュレーション、ドッキングポーズ、フ ラグメント分子軌道法、電子状態 Abstract
The purpose of this study is to rank the output accurately and to evaluate the protein-protein interaction efficiently, by calculating the protein-protein interaction energy obtained from the fragment molecular orbital (FMO) method for the docking poses by the protein-protein docking software. In this study, we evaluated the five protein complex systems by protein-protein docking and FMO calculation. As a result, in the comparison of the total inter-fragment interaction energy (IFIE) obtained from FMO calculation, the docking pose similar to the crystal structure had more stable total IFIE. Although there are few current examples, this result suggests that total IFIE may be used to select a more correct docking pose.
Keywords : Protein-protein interaction, Protein-protein docking simulation, Docking pose, Fragment
Molecular Orbital Method, Electronic structure
© 2020 Research Organization for Information Science and Technology All rights reserved. Received: 24 April 2020
Accepted: 7 December 2020 Available online: 25 December 2020
45 1. 研究の背景と目的 蛋白質間ドッキングにおける in Silico 予測の正答率は近年上昇しつつある。[1] その予測アル ゴリズムの例としては、フーリエ変換したグリッドベースの三次元空間へ配座を生じて配置させ たものや、標的蛋白質の分子表面形状に対して相補的な配座を多数発生させた後に自由エネルギ ー計算による再評価を行ったものなど、多数存在している。[2-4] 一方、蛋白質間相互作用を有す る複合体には予測の困難な系もいまだ存在しているため、完全な再現にはその出力数を多くして 多面的に評価する必要がある。 完全な再現が困難な原因の一端にスコア関数の問題がある。蛋白質間ドッキングシミュレーシ ョンに用いられているスコア関数には、表面形状および静電的な相互作用から算出したもの、脱 溶媒和を考慮したもの[5]、疎水性相補性を考慮したもの[6]など種々存在する。これを用いて各ソ フトウェアではドッキングさせた構造に対し既知の結晶構造の再現を図っている。一方、蛋白質 間相互作用の多くは蛋白質表面間での分散力などに寄与する弱い相互作用の占める割合が多く、 従来のスコア関数では完全に評価できていないのではないかと考えた。
北浦らによって報告されたフラグメント分子軌道(Fragment Molecular Orbital: FMO)法 [7] で は蛋白質間の相互作用についても分散力などの弱い相互作用を評価できるため、創薬研究への応 用が期待されており、例えば FMO 法を用いた低分子化合物のドッキングシミュレーションに関 する評価例も報告されている。[8] よって、FMO 法を用いることで蛋白質間ドッキングの評価 改善を図ることができると考えた。そこで我々は FMO 法と従来のドッキングソフトの結果を組 み合わせた蛋白質間ドッキングの評価改善を目的に、予備検討として蛋白質間ドッキングと FMO 法による相互作用エネルギーの計算を行った。 本研究では、蛋白質間相互作用系としては残基数が比較的少なく、ドッキングおよび FMO 計 算に時間を要さない系であることを理由に、5 つの蛋白質間相互作用を有する複合体を選定し、 これらに対してドッキングを行った。ここから、各複合体の結晶構造とドッキングスコアの順位 が高かったもの、ならびに結晶構造と目視により重なりの大きいと判断したドッキングポーズ数 種類を選んで FMO 法を行った。FMO 法により得られるフラグメント間相互作用エネルギー(inter-fragment interaction energy: IFIE)の全体和である Total IFIE にてそれらの結果を比較したところ、結 晶構造と重なりの大きいドッキング構造では結晶構造と同程度の Total IFIE を有していたのに対 し、結晶構造と重なりの小さいと判断したドッキング構造においては、結晶構造と比較して Total IFIE が著しく不安定化した。このことから、Total IFIE による比較を行うことで、より尤もらしい ドッキングポーズを選択できるのではないかと示唆された。
46
2. 計算モデル
本検討では、Protein Data Bank(PDB)より取得した 4PK7(SA2-Scc1), 4ZI2(BARTL1/CCDC104 with Arl3FL-GppNHP), 5CL1(Norrin-Fizzled4), 5C50(Atg101-atg13), 5EU3(HLA-peptide-Antigen) の 5 つの蛋白質間相互作用複合体(図 1)について、蛋白質間ドッキングならびに FMO 法によ る Total IFIE の評価を行った。 もし蛋白質間ドッキングで最もスコアの高く、かつ目視による判定で結晶構造との重なりが最 も大きいと判断した場合はドッキングのみで十分な評価が可能であると判断できるため、FMO 法 による評価は不要とした。一方、これに該当しない場合は、最もスコアが高かったドッキングポ ーズと、目視による判定で最も結晶構造との重なりが大きいと判断したポーズを中心に FMO 法 による評価を行った。なお、結晶構造との重なりの大きさについて、今回は目視により判定を行 ったが、今後は定量的な評価を導入する予定である。さらに、各複合体の結晶構造についても合 わせて FMO 法による計算を行った。この両者の計算で得られた Total IFIE を比較することで、ど のような蛋白質間相互作用系が蛋白質間ドッキングをそのまま適用できるのか、どのような系で あれば FMO 法によるドッキング評価の改善が可能であるかを検証した。
本検討では、蛋白質構造のモデリングに関しては Shrӧdinger 社の Maestro9.9 [9]ならびに CCG 社の MOE2014.10 [10]を用いた。蛋白質の欠損部分の補完は、Shrӧdinger 社の Prime [11]を用いて 行った。蛋白質間ドッキングについては Shrӧdinger 社の Bioluminate 1.1 [12]を用いた。今回は図 1 に記載したポリマー鎖を蛋白質間ドッキングに用い、パラメータは全てデフォルトで実施した。 なお、今回の検討では水分子を全て削除し、蛋白質の構造は両者とも固定してドッキングを行っ た。FMO 計算は、TSUBAME に新規インストールされた ABINIT-MP [13]を用いた。結晶構造に ついてはドッキング前の構造を用い、ドッキングした構造については、ドッキングソフトにより 評価を行った状態と同じ構造とするため、ドッキングで得られた構造をそのまま用いて一点計算 を行った。また、計算レベルとして MP2/6-31g*を用いた。
図1 蛋白質間ドッキングおよび FMO 計算に用いた複合体構造(構造の下には PDB ID および分 子名、ドッキングに用いた鎖を記載。)
47 3. 並列計算の方法と効果(性能) ABINIT-MP を用いた検証ではスレッド数を 16 に固定し、ノード数を 16 ノード(192cpu)と 64 ノード(768cpu)として比較を行った。評価には 5c50.pdb(6827 原子系)を用い、計算レベルは MP2/6-31g*にて計算を行った。その結果、計算終了までに 16 ノードでは 45,098 秒、64 ノードで は 14,220 秒を要し、約 3.17 倍の計算性能の向上(並列加速率)が見られた。よって、並列化率は 99.95%、並列化効率は 79.29%と計算された。GAMESS の並列化率は約 60%であったため、並列 化効率の向上が見られたことから、FMO 計算を行うには ABINIT-MP の使用が適している。ただ し、GAMESS には IFIE を 4 つのエネルギー成分(静電相互作用エネルギー、交換反発エネルギ ー、電荷移動相互作用エネルギー、分散エネルギー)に分割する PIEDA(Pair Interaction Energy Decomposition Analysis)[14]の機能が含まれている一方、課題実行時に用いた ABINIT-MP では含 まれていなかった(最新版には搭載されている)ため、PIEDA を用いたより詳細な検証には有償 の MIZUHO/Biostation[15]に搭載されている ABINIT-MP を用いて計算を行う必要がある。 4. 研究成果 本検討全体での計算結果概要を表 1 にまとめる。 これらの結果の詳細は以下のとおりである。 1) 4PK7(16495 原子系、AB 鎖でドッキング) ドッキングの結果、1 位と 3 位が結晶構造との重なりが大きいと判断したポーズであり、他は 結晶構造との重なりが小さいポーズであった。よって、本系では 1 位~3 位のドッキング構造と 結晶構造について FMO 計算を行ったが、結晶構造のみ計算が完了し、他は TSUBAME の制限時 間である 4 日間以内に計算が終了せず、計算結果との比較ができなかった。制限時間内に計算が 終了しなかった要因の1つとして、ドッキング後の構造はこれをそのまま用いて計算を行ったた 表 1 計算に用いた蛋白質系の詳細と計算結果 PDB ID ドッキング鎖 蛋白質間ドッキングによる最適配置の順位 原子数 FMO 計算の結果 4PK7 AB 1, 3 位 16,495 結晶構造のみ計算完了 4ZI2 AC 2 位 5,856 結晶構造のみ計算完了 5CL1 AD 1, 2, 12 位 9,143 結晶構造と2 位につい て計算完了 5C50 AB 1, 2 位 6,146 結晶構造、1 位、2 位 について計算完了 5EU3 AB 2 位 5,999 結晶構造のみ計算完了
48 め十分な構造最適化がなされておらず、FMO 計算中で自己無撞着な電荷場となるために時間を 要したからではないかと考えられる。 2) 4ZI2(5856 原子系、AC 鎖でドッキング) ドッキングの結果、1 位が結晶構造との重なりが大きいと判断したポーズであったが、他は結 晶構造との重なりが小さいポーズであった。よって、1 位と 2 位のポーズならびに結晶構造につ いて FMO 法を検討したが、結晶構造のみ計算が完了し、他は制限時間内に計算が終了しなかっ たため、計算結果での比較ができなかった。原因は、1)と同様であると考えている。 3) 5CL1(9143 原子系、AC 鎖でドッキング) ドッキングの結果、2 位が結晶構造との重なりが最も大きいと判断したポーズであり、12 位も 結晶構造との重なりが 2 位と同様に大きいと判断したポーズであったが、他は結晶構造との重な りが小さいポーズであった。本系では 1 位、2 位、12 位のポーズと結晶構造について FMO 計算 を行ったが、2 位と結晶構造のみ計算が完了し、他は制限時間内に計算が終了しなかった。ポー ズ間の比較ができなかったものの、計算が完了した 2 者で Total IFIE を比較したところ、2 位のポ ーズの方が結晶構造よりも約 5,000 kcal/mol 安定であることが分かった。すなわち、結晶構造よ りもより安定な Total IFIE を有するポーズは、結晶構造同様に適した複合体構造であることが示 唆された。 4) 5C50(6146 原子系、AB 鎖でドッキング) ドッキングの結果、1 位が結晶構造との重なりが最も大きいと判断したポーズであったが、2 位 についても 1 位ほどではないものの結晶構造との重なりが大きいと判断したポーズであった。他 は結晶構造との重なりが小さいポーズであった。よって、1 位と 2 位のポーズと結晶構造につい て FMO 法を検討し、全ての計算が完了した。Total IFIE を比較したところ、1 位のポーズについ ては結晶構造と比較して約 500 kcal/mol 不安定という結果が得られたのに対し、2 位のポーズは 結晶構造より約 46,000 kcal/mol という著しい不安定化を示した。1 位の複合体についてはわずか な側鎖の配向の違いが多数の残基で積み重なることにより、不安定化を生じたものと考えられる。 一方 2 位のポーズでは、蛋白質間ドッキングで生じた側鎖間の異常な接触があったことにより、 著しい不安定化を生じたものと考えられた。本複合体についてはドッキングのみで良い結果が得 られているため改善は必要ないものの、Total IFIE を用いることで目視では確認しづらいわずか な構造の違いからより適したポーズを選択できることがわかった。 5) 5EU3(5999 原子系、AB 鎖でドッキング) ドッキングの結果、2 位が結晶構造との重なりが最も大きいと判断したポーズであったが、他 は結晶構造との重なりが小さいポーズであった。よって 2 位のポーズと結晶構造について FMO 法を検討したが、結晶構造のみ計算が完了し、2 位については制限時間内に計算が終了しなかっ た。計算が終了しなかった原因は、1) と同様であると考えている。本系では現状結果を比較す ることはできなかったため、再計算を行う必要がある。
49 5. まとめと今後の課題 今回の検討では複数の蛋白質複合体系を対象に、蛋白質間ドッキングによる評価と FMO によ る計算を行った。その結果、一部の蛋白質複合体ではエラーが生じて計算が終了していないもの の、Total IFIE による比較においては、より結晶構造に近いポーズがより安定なエネルギーを有す るという結果を得た。このことは Total IFIE が、より正しいポーズの選定に利用できる可能性を 示唆している。 一方、本検討では大多数のドッキング系で FMO 計算が完了していないため、ドッキングとの 比較という点では十分な評価ができなかった。これについては、先に触れたとおり、ドッキング 後の構造では十分な最適化がなされていなかったために若干不安定な構造となっていたことか ら、FMO 法において必要となる系全体が自己無撞着な電荷場を満たされた状態となるために時 間を要し、TSUBAME の最長制限時間である 4 日間を超えたことが考えられる。よって、蛋白質 間ドッキングを行った後に FMO 法を行うためには、ドッキング構造を一旦構造最適化する、あ るいは水分子を足して分子動力学計算を行い、平衡化するなどの処置を行ってから FMO 法を行 えば、計算の改善につながると考えられる。 このような検討については、我々の知る限り存在していないことから、今後本検討に関する諸 問題を解決することで、FMO 法が蛋白質間ドッキングの結果の評価に利用できるのかどうかを 引き続き検討したい。 謝辞 本研究におけるフラグメント分子軌道法計算は、東京工業大学のスパコン TSUBAME 2.5 を用 いて行いました。ここに御礼申し上げます。 参考文献
[1] S. Ruiz-Carmona, D. Alvarez-Garcia, N. Foloppe, A. B. Garmendia-Doval, S. Juhos, P. Schmidtke, X. Barril, R. E. Hubbard, and S. D. Morley, PLoS Comput. Biol. 10e1003571 (2014).
[2] C. Bissantz, G. Folkers, and D. Rognan, J. Med. Chem. 43 4759-4767 (2000). [3] B. G. Pierce, Y. Hourai, and Z. Weng, PLoS One 6 e24657 (2011).
[4] M. Ohue, T. Shimoda, S. Suzuki, Y. Matsuzaki, T. Ishida, and Y. Akiyama, Bioinformatics 30 3281-3283 (2014).
[5] V. A. Roberts, E. E. Thompson, M. E. Pique, M. S. Perez, and L. F. Ten Eyck, J. Comput. Chem. 34 1743-1758 (2013).
[6] E. Katchalski-Katzir E, I. Shariv, M, Eisenstein, A. A. Friesem, C. Aflalo, and I. A. Vakser, Proc. Natl. Acad. Sci. U. S. A. 89 2195-2199 (1992).
[7] K. Kitaura, T. Sawai, T. Asada, T. Nakano, and M. Uebayasi, Chem. Phys. Lett. 312 319-324 (1999). [8] JAMSTEC 地球シミュレータ利用報告書
50
https://www.jamstec.go.jp/es/jp/project/sangyou_report/H21_KISSEI_jp.pdf [9] Scrodinger 社 Maestro https://www.schrodinger.com/jp/maestro
[10] MOE https://www.chemcomp.com/
[11] Scrodinger 社 PRIME https://www.schrodinger.com/jp/prime
[12] Scrodinger 社 Bioluminate https://www.schrodinger.com/jp/bioluminate
[13] S. Tanaka, Y. Mochizuki, Y. Komeiji, Y. Okiyama, K. Fukuzawa, Phys. Chem. Chem. Phys. 16 (2014) 10310-10344.
[14] D. G. Fedorov, K. Kitaura, J. Comput. Chem., 28, 222-237 (2007). [15] MIZUHO/Biostation