• 検索結果がありません。

NetSolveを用いたPSA/GAcによるタンパク質立体構造予測

N/A
N/A
Protected

Academic year: 2021

シェア "NetSolveを用いたPSA/GAcによるタンパク質立体構造予測"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

NetSolve

を用いた

PSA/GAc

によるタンパク質立体構造予測

Prediction of Protein Tertiary Structure with PSA/GAc using NetSolve System

廣安 知之

三木 光範

宇野 尚子

岡本 祐幸

§

Tomoyuki HIROYASU

Mitsunori MIKI

Naoko UNO

Yuko OKAMOTO

1.

はじめに

近年タンパク質の立体構造予測が注目されている.タ ンパク質は生物の体を形成する重要な物質で,その機能 は構造に大きく関わっているといわれている.したがっ てタンパク質の立体構造を知ることにより,病理の解明 や新薬の開発につながることが期待されている.タンパ ク質はエネルギーが低く安定した状態に折り畳まれるた め,シミュレーションによるタンパク質の立体構造予測 は,エネルギー最小化問題として捉えることができる. シミュレーションによるタンパク質の立体構造予測では 非常に多くの反復計算が必要になる.そこで本研究では Gridミドルウェアの 1 つである NetSolve[1] を用いて, Grid環境におけるタンパク質立体構造予測システムを 構築する.また,最適化手法として遺伝的交叉を用いた 並列シミュレーテッドアニーリング (Parallel Simulated

Annealing using Genetic Crossover:PSA/GAc)[2] を用

いる.PSA/GAc の探索の大部分は SA であり,この部 分は独立に実行できる.また一定間隔で解交換のための 交叉を行う部分は 2 つ以上の個体で同期をとる必要があ る.このため,RPC 機能を用いて Grid 上に PSA/GAc を実装する場合,SA の部分を Server が行い,交叉処理 を Client が行うシステムが考えられる.しかし,この方 法では Server が処理する SA はある対象問題に特化した SAとなり汎用性に欠ける.そこで本研究では最適化部 分と評価部分を分離したシステムを構築する.

2.

遺伝的交叉を用いた並列シミュレーテッド

アニーリング

PSA/GAcは並列に実行している SA の解の伝達時に 遺伝的アルゴリズムのオペレータである遺伝的交叉を用 いたものである.図 1 に PSA/GAc の模式図を示す. Crosso v e r End SA SA SA SA ࡮࡮࡮ d d d : Crossover Interval High

Temperature Individual LowTemperature

d Crossover X4 X4 X4 X4 X1X2X3X4 X1X2X3X4 X1X2X3X4 X1X2X3X4 X1 X2X3 X1 X2X3 X1X2X3 X1X2X3 Crosso v e r d 図 1: PSA/GAc の仕組み このモデルでは,解の伝達時に並列に実行している SA から親としてランダムに 2 個体を選択し,設計変数交叉 を行う.設計変数間交叉とは各設計変数の間でのみ交叉 を行うことである.親個体と生成された子個体を合わせ 同志社大学 工学部 同志社大学大学院 工学研究科 §岡崎国立共同研究機構 分子科学研究所 た 4 個体の中から良好な 2 個体を選択し,次の探索点と する.以上の「並列 SA」「遺伝的交叉」の処理を終了条 件まで繰り返す.

3.

Grid NetSolve System

-3.1 Grid とは

Gridとは計算資源の場所やネットワークの接続方法な

どを意識せずに,世界各地の計算資源を利用できるよう にする技術である.遠隔地にある計算資源のライブラリ を呼び出す方法として,RPC(Remote Procedure Call) 機能を Grid 上で実現した GridRPC がある. 3.2 NetSolve System 本研究では,Grid 環境で PSA/GAc を実装するため, GridRPC機能を使用できる Grid ミドルウェアの 1 つで ある NetSolve を用いた.図 2 に NetSolve の模式図を 示す. NetSolve Server N tS l A t NetSolve Client (1)࡜ࠗࡉ࡜࡝ታⴕⷐ᳞ (2)Serverㆬᛯ (3)࠺࡯࠲ㅍା (4)ಣℂ⚿ᨐฃା ⊓㍳ 図 2: NetSolve の構成 NetSolveは,計算資源を提供する Server,計算資源を

利用する Client,Server と Client の間を取り持つ Agent の 3 つのコンポーネントから構成されている.

あらかじめ各 Server は Agent に登録されている.ま ず,Client が Agent に対してライブラリの実行要求を行 うと,Agent は Client の要求するライブラリが実行で きる Server を Client に紹介する.Client が Agent から 紹介された Server にデータを送ると,Server はライブ ラリを実行し,処理結果を Client に返す.このように,

NetSolveでは Client が Server の情報を持っていなくて

もライブラリを実行することができる.

4.

現在のモデル

PSA/GAcの SA の部分を NetSolve の API を用いて

Serverで実行するモデルを図 3 に示す.

以下に現在のモデルの処理を示す.

1. Clientは Agent に「SA によるタンパク質立体構造

(2)

NetSolve Server NetSolve Client (2)Serverㆬᛯ (3)࠺࡯࠲ㅍା ⊓㍳ NetSolve Agent (1)࡜ࠗࡉ࡜࡝ ታⴕⷐ᳞ (5)ಣℂ⚿ᨐฃା (6)Crossover (4)SA Met-enkephalin (4)SA Met-enkephalin (4)SA Met-enkephalin

X

(4)SA C-peptide (4)SA ProteinG 図 3: 現在のモデル 2. Agentは「SA によるタンパク質立体構造予測」ラ イブラリを持つ Server を Client に紹介する.

3. Clientは Agent から紹介された Server に個体情報

と SA のパラメータを送信する. 4. Serverは Client から受け取ったデータを元に SA を 行う. 5. Serverは SA の探索が終了すると,結果 (個体情報 やパラメータ) を Client に返す. 6. Clientは Server から個体情報を受け取り,ランダ ムに 2 個体選択し,設計変数間交叉を行う. 7. 1∼6 の処理を終了条件まで繰り返す. しかしこのモデルでは特定のタンパク質のエネルギー 値が計算できる SA のライブラリを各タンパク質で作成 する必要があり,汎用性に欠ける.

5.

提案モデル

現 在 の モ デ ル で は 汎 用 性 に 欠 け る と い う 問 題 を 解 消 す る た め ,図 4 の よ う に 最 適 化 処 理 を 行 う

Server(Optimization Server:O-Server) と評価計算を行

う Server(Evaluation Server:E-Server) を分離したモデ ルを提案する.

以下に提案モデルの処理を示す.

1. Clientは Agent に SA のライブラリの実行要求を

行う.

2. Agentは SA のライブラリを持つ O-Server を Client

に紹介する.

3. Clientは Agent から紹介された O-Server に個体情

報,SA のパラメータ,対象タンパク質の情報を送 信する.

4. O-Serverでは SA の探索が行われる.

(a) O-Serverでは評価部で Client から指定された

タンパク質のエネルギー計算を行うライブラ リの実行要求を行う. NetSolve Server NetSolve Client (2)Serverㆬᛯ (3)࠺࡯࠲ㅍା ⊓㍳ NetSolve Agent (1)࡜ࠗࡉ࡜࡝ ታⴕⷐ᳞ (7)ಣℂ⚿ᨐฃା (8)Crossover (4)SA (4)SA (4)SA

X

ProteinG Met-enkephalin C-peptide (5)⸳⸘ᄌᢙ (6)⹏ଔ୯ Optimization

Server EvaluationServer

図 4: 提案モデル (b) Agentは特定のタンパク質の評価計算ができ る E-Server を O-Server に紹介する. (c) O-Serverは E-Server に設計変数 (二面角) を 送信する. (d) E-Serverは O-Server から送られた設計変数を もとに評価計算を行い,結果を O-Server に返 す. 5. O-Serverで SA の探索が終了するまで,4 の (a)∼ (d)の処理を繰り返す. 6. O-Serverは SA の探索が終了すると,結果 (個体情 報やパラメータ) を Client に返す. 7. Clientは O-Server から個体情報を受け取り,ラン ダムに 2 個体選択し設計変数間交叉を行う. 8. 1∼7 の処理を終了条件まで繰り返す. このように SA を行う Server と評価を行う Server に 分けることによって,ある問題に特化した SA のライブ ラリを持つ Server は不必要になる.Client は「SA を行 うライブラリ」を持つ Server に問題の種類と SA の実行 要求を行えばよい.

6.

おわりに

本稿では,多くの反復計算が必要であるシミュレー ションによるタンパク質立体構造予測システムとして, NetSolveを用いた PSA/GAc によるシステムを構築し た.現在はある問題に特化したライブラリを持つ Server を用意していたが,それでは汎用性が低いため,SA を 行う Server と評価を行う Server に分けたモデルを提案 した.これにより様々な問題に適用できるシステムと なった.

参考文献

[1] NetSolve http://icl.cs.utk.edu/netsolve/ [2] 廣安 知之, 三木 光範, 小掠 真貴, 岡本 祐幸. 遺伝的交叉を用いた並列シ ミュレーテッドアニーリングの検討. 情報処理学会論文誌:数値モデルと応 用, Vol.43, No.SIG10(TOM7), 2002.

参照

関連したドキュメント

に至ったことである︒

行ない難いことを当然予想している制度であり︑

5世紀後半以降の日本においても同様であったこ

が成立し、本年七月一日から施行の予定である。労働組合、学者等の強い反対を押し切っての成立であり、多く

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

実際, クラス C の多様体については, ここでは 詳細には述べないが, 代数 reduction をはじめ類似のいくつかの方法を 組み合わせてその構造を組織的に研究することができる

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

・ 教育、文化、コミュニケーション、など、具体的に形のない、容易に形骸化する対 策ではなく、⑤のように、システム的に機械的に防止できる設備が必要。.. 質問 質問内容