• 検索結果がありません。

ƒOƒ[ƒoƒ‹ƒRƒ“ƒsƒ…[ƒeƒBƒ“ƒOŠÂ‹«‚É‚¨‚¯‚éPSA/GAc‚ÌŒŸ“¢

N/A
N/A
Protected

Academic year: 2021

シェア "ƒOƒ[ƒoƒ‹ƒRƒ“ƒsƒ…[ƒeƒBƒ“ƒOŠÂ‹«‚É‚¨‚¯‚éPSA/GAc‚ÌŒŸ“¢"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

44回 月例発表会(200111月) 知的システムデザイン研究室

グローバルコンピューティング環境における

PSA/GAc

の検討

Examination of Parallel Simulated Annealing using Genetic Crossover on the Global Computing Environment

青井 桂子

Keiko AOI

Abstract: This paper examines the search by PSA/GAc on the global computing environment. In the case of prediction of huge protein structure, we should use global computing. This study uses NetSolve as implementation model of global computing environment, and makes sure of effective of PSA/GAc on the global computing environment.

1 はじめに

これまでの研究で,PSA/GAc はタンパク質の立体構 造予測において,従来用いられていた SA よりも有効で あることが明らかとなっている1).大規模なタンパク質 の立体構造予測には並列化による計算時間の短縮が不可 欠であり,我々は PSA/GAc の並列モデルの研究も行っ てきた2).本研究では,今後更に大規模なタンパク質 の立体構造予測を行うために,ネットワークを介して遠 隔地にある計算資源を利用する,グローバルコンピュー ティング環境下での PSA/GAc の検討を行う.

2 グローバルコンピューティング化のための

PSA/GAc モデル

2.1 グローバルコンピューティング 3) グローバルコンピューティングとは,広域ネットワー ク上に分散した計算資源や情報資源を積極的に活用し , 科学技術計算に代表されるような大規模な計算を高速に 処理することである.計算資源とは高性能な計算サーバ や大規模なストレージをもつファイルサーバである.情 報資源とは計算を行うのに必要なデータやプログラムそ のものである.これらの資源が広域ネットワークに接続 され,グローバルコンピューティング環境を形成する. 2.2 グローバルコンピューティング環境の特徴 グ ローバルコンピューティング 環境は,従来のコン ピューティング環境に比べて,様々な障害により,ネッ トワークに大きな遅延が発生したり,完全に切断される などして,資源の構成が動的に変化する.計算が複数の 資源にまたがって行われるため,ある資源で計算した途 中結果を別の資源で計算する場合に利用することが必要 となる.大規模なタンパク質の構造予測を行う場合,解 探索過程に要する時間が長くなるため,途中で資源に何 らかの問題が発生した場合に,それまでの計算を無駄に しないことが重要となる. 2.3 PSA/GAcによる断続的な探索 PSA/GAc での探索の途中結果を生かして次の探索に 引き継ぐモデルを考える.タンパク質の主鎖の構造には, α-helix などの水素結合により安定した二次構造が存在 し,これらが部分解となっていることが多く見受けられ る.この空間構造は設計変数である二面角からなってい るため,前の試行の探索を引き継ぐ ものとして二面角の 値を採用する構造を設けた. PSA/GAc において1試行目の出力ファイルの一つに, 2試行目の初期パラメータファイルとなるものを作成す ることで,より効率の良い探索が可能になると思われる. 2試行目以降の初期パラメータファイルでは,前の試行 で最も良かった解の二面角 (設計変数) の値と SA のパ ラメータである温度を用いて再び探索を続けるモデルを 作成した.概念図を Fig. 1 に示す. PSA/GAc PSA/GAc PSA/GAc PSA/GAc PSA/GAc PSA/GAc  ndimen      19  popsize     16  dividestep  32  inittempera 1.80958429  coolingrate 0.999  step        100  rseed       3  trial       1  bound       180. 46.9 142.0 177.4 79.1  84.7 55.1 -137.8 152.0  -148.0 -68.4 -173.9 -96.7 119.9 177.1 -101.3 -76.5 -175.4 -154.6 58.3 output input Fig. 1 グ ローバル コンピューティング 化のための PSA/GAc 2.4 数値実験 探索期間の短い PSA/GAc を複数回行ったときと,探 索期間の長い PSA/GAc を行ったときに,変わらない解 精度,成功率が得られるかど うかの実験を行った. PSA/GAc において 16 個体を用いて 6000MCsweep の 計算を行い, Met-enkephalin の構造予測を行った.Met-enkephalin は-11kcal/mol 以下のエネルギー値のとき に最適構造をとることが 知られている4) .6000MC-1

(2)

sweep を連続的に探索を行ったもの,1000MCsweep, 250MCsweep,100MCsweep ごとの探索を断続的に合 計 6000MCsweep となるように探索を行ったものとを比 較するパラメータの値は設計変数 19,交叉周期 32,初 期温度 2.0,冷却率 0.999 とした.この時の解精度の推 移を Fig. 2 に示す.また,この時の成功率を Fig. 3 に 示す.成功率とは,最適構造を得られた回数を試行回数 で割ったものである.これらの結果は 10 回試行平均で ある. -4.0 -5.0 -6.0 -7.0 -8.0 -9.0 -10.0 -11.0 -12.0 1000 2000 3000 4000 5000 6000 6000 MCsweep 1000 MCsweep 250 MCsweep 100 MCsweep Fig. 2 解精度 1000 2000 3000 4000 5000 6000 (%) 0 10 20 30 40 50 60 70 80 90 6000 1000 250 M 100 Fig. 3 成功率 これらの結果から,短い探索を断続的に行っても比較 的良い割合で解を求めることができることがわかった. よって,グローバルコンピューティング環境で PSA/GAc を実装しても解精度及び成功率が極端に落ちることがな いことが示された.

3 NetSolve におけるグローバルコンピュー

ティング環境の実装

NetSolve はクライアントサーバーモデルに基づいて 設計されているミドルウェア層のシステムである. 3.1 NetSolveシステムの構成 NetSolve システムでは Client,Server,Agent の 3 つ の要素の概念がある.NetSolve で実行できる問題は , Server 側に予めライブラリと PDF(Problems Descrip-tion Files) で記述しているもののみである.

Client は指定した Agent に,計算の要求をする.(call fnetsl(”function”, a, b, ierr)) 要求を受けた Agent はそ の Agent に接続されている Server の中から必要なマシ ンを選択し,そのマシンに Client から送られた入力デー タ (関数名と引数の数値データ) を送る.Server は,必 要なデータと用いる関数が送られると,実行する関数が Server 側で定義されているものであればプログラムが実 行され,数値データが返される.Fig. 4 に NetSolve の 概念図を示す. Fig. 4 NetSolve 3.2 NetSolveでのプログラムの実行 NetSolve を使って実際に Server 側にライブ ラリと PDF を作り,プログラムを実行させた.

4 考察と今後の課題

PSA/GAc を断続的に行った場合と連続的に行った場 合の解精度や成功率を比較したところ,ほぼ同等の性能 が示された.これによって,計算量が膨大なものに対し ても,グローバルコンピューティング環境で様々な資源 を利用して断続的に探索することで最適構造が得られる ことが示された. 今後の課題としては,NetSolve の MPI の動作の調査 を行い,MPI が 動くことが 確認されれば NetSolve に よる PSA/GAc の非同期モデルの構築を行い,これを NetSolve で実行する.

参考文献

1) 小掠真貴, 廣安知之, 三木光範, 角美智子, 岡本祐幸. 遺 伝的交叉を用いた並列シミュレーテッド アニーリングの検 討.情報処理学会研究報告, Vol. 2001, No. 27, pp. 57–60, 2001. 2) 廣安知之,三木光範,角美智子,小掠真貴. 遺伝的交叉を用 いた並列SA(分散メモリ型並列計算機への実装モデルの検 討). 情報処理学会第62回全国大会 講演論文集, 2001. 3) 谷村勇輔.グローバルコンピューティング環境における遺 伝的アルゴ リズム. 修士論文, pp. 300–303, 2001. 4) Yuko Okamoto, Takeshi Kikuchi, and Hikaru Kawai.

Prediction of Low-Energy Structures of Met-Enkephalin by Monte Carlo Simulated Annealing. CHEMISTRY

LETTERS, pp. 1275–1278, 1992.

参照

関連したドキュメント

また,この領域では透水性の高い地 質構造に対して効果的にグラウト孔 を配置するために,カバーロックと

自己防禦の立場に追いこまれている。死はもう自己の内的問題ではなく外から

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

算処理の効率化のliM点において従来よりも優れたモデリング手法について提案した.lMil9f

実際, クラス C の多様体については, ここでは 詳細には述べないが, 代数 reduction をはじめ類似のいくつかの方法を 組み合わせてその構造を組織的に研究することができる

はありますが、これまでの 40 人から 35

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

大阪府では、これまで大切にしてきた、子ども一人ひとりが違いを認め合いそれぞれの力