• 検索結果がありません。

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

N/A
N/A
Protected

Academic year: 2021

シェア "遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

78回 月例発表会(20057月) 知的システムデザイン研究室

遺伝的交叉を用いた並列シミュレーテッドアニーリングによる

タンパク質立体構造予測

宇野 尚子

Naoko UNO

1 はじめに

近年,タンパク質の立体構造予測が注目されている. タンパク質はアミノ酸が複数連なって構成される物質 で,自然界ではある決まった構造に折りたたまれた状態 で存在している.この構造をタンパク質の立体構造と呼 び,タンパク質の機能と密接に関わっていると言われて いる.そのため,立体構造を解明することによって病理 の解明や新薬の開発につながることが期待されている. タンパク質はエネルギーの低い安定した構造に折り たたまれるので,エネルギー最小化問題と捉えることが できる.本研究室では「遺伝的交叉を用いた並列シミュ レーテッドアニーリング (Parallel Simulated Annealing with Genetic Crossover:PSA/GAc)1)」を用いて立体 構造予測を行っている.本報告では,タンパク質の立体 構造予測の難しさと,PSA/GAc が抱えている問題点を 挙げ,今後の研究方針について述べる.

2 タンパク質立体構造予測

2.1 エネルギー関数 目的関数は,タンパク質の系をモデル化したエネル ギー関数を用いる.タンパク質のエネルギー関数は非常 に複雑で,Fig. 1 のように大域的にいくつかの,局所的 に無数の極小値を持つと考えられている. Energy ᦨㆡ⸃ ዪᚲ⸃ ዪᚲ⸃ ዪᚲ⸃ Fig. 1 エネルギー関数の模式図 本研究では,TINKER2) という分子動力学計算プロ グラムパッケージを元に名古屋大学の岡本先生が手を加 えたものをエネルギー関数として使用する.設計変数は, 原子間の回転角である二面角を用いる. 2.2 予測結果の評価基準 タンパク質の立体構造予測を行う際に,評価する基準 は 2 つある.1 つはエネルギー値,もう 1 つは構造の形で ある.構造が既知のタンパク質ならば,シミュレーショ ン結果がどの程度その構造に似ているかが重要となる. 2つの構造の差異を定量化するために用いられる量が RMSD(Root Mean Square Deviation)である.RMSD は 2 つの分子構造を重ね合わせて,対応する各原子のず れの二乗を平均したものの平方根で定義される.式 (1) に RMSD の求め方を示す. RMSD(A, B) =     1 N N  i=1 (ai− bi)2 (1) RMSDの単位は ˚Aで,値が小さいほど 2 つの構造が よく似ていることになる. 2.3 立体構造予測の現状 タンパク質の立体構造予測問題は,CASP63) という 世界的なタンパク質の立体構造予測コンテストが行われ るほど盛んに行われている研究である.現在の最も大き な問題は,タンパク質のエネルギー関数が完璧ではない ということである.現段階では「天然構造のエネルギー は最小にならない」エネルギー関数を使わざるを得な い状況にある.Fig. 2 は Protein-A というタンパク質を エネルギー最小化したときの履歴である.縦軸がエネル ギー値 (kcal/mol),横軸が RMSD(˚A)である. Fig. 2 RMSDとエネルギーの履歴 1

(2)

Fig. 2のように,全体を見れば徐々に RMSD が小さ くなる方向に推移している.しかし,探索終盤では一度 RMSDが小さくなったにも関わらず,それよりエネル ギーの低い個体があったために,RMSD が大きくなる 方向に推移している.このように,エネルギー最小化を 行っても天然構造に近い構造を得るのは難しい.

3 遺伝的交叉を用いた並列シミュレーテッド

アニーリング

(PSA/GAc)

3.1 概要 PSA/GAcは Fig. 3 のように並列に実行している SA の解の伝達時に遺伝的アルゴリズムのオペレータである 遺伝的交叉を用いたものである. Crosso v e r End SA SA SA SA ࡮࡮࡮ d d d : Crossover Interval High

Temperature Individual LowTemperature

d Crossover X4 X4 X4 X4 X1X2X3X4 X1X2X3X4 X1X2X3X4 X1X2X3X4 X1 X2X3 X1 X2X3 X1X2X3 X1X2X3 Crosso v e r d Fig. 3 PSA/GAcの模式図 このモデルでは,解の伝達時に並列に実行している SAから親としてランダムに 2 個体を選択し,設計変数 交叉を行う.設計変数間交叉は Fig. 4 のように各設計 変数の間でのみ交叉を行う.そして,親個体と生成され た子個体を合わせた 4 個体の中から良好な 2 個体を選択 し,次の探索点とする. Crossover Child1 Parent1 Parent2 Child2 -2.0 -1.1 -0.8 Energy 2 3 1 4 Rank Parent1 Child1

Next Search Point

X4 X1X2X3X4 X1X2X3X4 X2 X3 -2.3X4 X1X2X3 X1 -2.3 X1X2X3X4 -2.3X4 X1X2X3 Fig. 4 設計変数間交叉 PSA/GAcでは SA を並列化することで探索点が増え るため収束が早くなる.また遺伝的交叉を行うため,部 分解がある問題に対して有効な手法であるといえる. 3.2 問題点 タンパク質立体構造予測問題において,PSA/GAc は PSAより性能が向上することが知られている.そのた め,遺伝的交叉によってより良い探索が行われていると 考えられてきた.しかし,昨年の研究で,交叉によって 親個体よりエネルギーの低い子個体が生まれる割合が非 常に低いことがわかった4).Fig. 5 に交叉後に選択され る親個体・子個体の割合を示す.対象問題が Protein-A, 交叉間隔 64MCsweep,8 並列で 6000MCsweep した場 合の結果である.縦軸が交叉後の選択される個体の割合 (%),横軸が交叉手法である. Fig. 5 交叉後の個体の選択割合 このように,子個体が選ばれる確率は最高でも 1 点交 叉の約 20 %で,2 点交叉,4 点交叉では 10 %未満であ る.そのため,交叉で生成された子個体がほとんど選択 されておらず,交叉が有効に機能していないという問題 があることがわかった.

4 今後の目標

今後の研究方針は,PSA/GAc における遺伝的交叉を 有効に機能させるような交叉手法を開発することであ る.今までの交叉では,大きく構造が異なる親同士で交 叉すると,子個体の構造も大きく変わってしまい,エネ ルギーが高くなる場合が多かった.したがって,今後は 構造が大きく変わらないようにしつつ親の形質を受け継 ぐような子個体を生成する方法を開発する必要がある.

参考文献

1) 廣安知之, 三木光範, 小掠真貴, 岡本祐幸. 遺伝的交叉を用いた並列シミュレーテッドアニーリ ングの検討. 情報処理学会論文誌:数値モデルと応用, Vol.43, No.SIG10(TOM7). 2002.

2) TINKER Home Page.

http://dasher.wustl.edu/tinker/

3) CASP6 Home Page.

http://predictioncenter.llnl.gov/casp6/ 4) 永松秀人. 遺伝的交叉を用いた並列シミュレーテッドアニーリ ングによるタンパク質立体構造予測における遺伝的 交叉の検討. 同志社大学大学院 修士論文.2004. 2

Fig. 2 のように,全体を見れば徐々に RMSD が小さ くなる方向に推移している.しかし,探索終盤では一度 RMSD が小さくなったにも関わらず,それよりエネル ギーの低い個体があったために,RMSD が大きくなる 方向に推移している.このように,エネルギー最小化を 行っても天然構造に近い構造を得るのは難しい. 3 遺伝的交叉を用いた並列シミュレーテッド アニーリング (PSA/GAc) 3.1 概要 PSA/GAc は Fig

参照

関連したドキュメント

2000 個, 2500 個, 4000 個, 4653 個)つないだ 8 種類 の時間 Kripke 構造を用いて実験を行った.また,三つ

問についてだが︑この間いに直接に答える前に確認しなけれ

SD カードが装置に挿入されている場合に表示され ます。 SD カードを取り出す場合はこの項目を選択 します。「 SD

マーカーによる遺伝子型の矛盾については、プライマーによる特定遺伝子型の選択によって説明す

[r]

基本的に個体が 2 ~ 3 個体で連なっており、円形や 楕円形になる。 Parascolymia に似ているが、.

・逆解析は,GA(遺伝的アルゴリズム)を用い,パラメータは,個体数 20,世 代数 100,交叉確率 0.75,突然変異率は

★分割によりその調査手法や評価が全体を対象とした 場合と変わることがないように調査計画を立案する必要 がある。..