第59回 月例発表会(2003年6月) 知的システムデザイン研究室
PSA/GAc における交叉間隔と MCsweep 数の数値実験
青井 桂子
1 今月の課題
• PSA/GAc における 1 個体あたりの MCsweep 数と
交叉間隔の検討
• 上記の実験の実行時間の測定
2 MCsweep 数と交叉間隔の検討と実行時間
2.1 実験概要
これまでの実験より,タンパク質立体構造予測問題に
おいて PSA/GAc は SA よりも探索性能が良いことが明
らかである.PSA/GAc は一定間隔で交叉処理を行い良
い個体の形質を伝達するためと考えられる.このため今回
は特に交叉オペレータにおける交叉間隔と 1 個体あたり
の MCsweep 数の検討を行う.実験では PSA/GAc の総
評価計算回数を凡そ一定とし,1 個体あたりの MCsweep
数の検討に関しては 16 個体× 6000MCsweep,32 個体
× 3000MCsweep,64 個体× 1500MCsweep の 3 パター
ンを検討する.また,交叉処理における交叉間隔をそれ
ぞれ 1, 2, 4, 8, 16, 32, 64, 交叉処理なし (PSA) の 8 パ
ターンについて実験を行い,この時の解探索性能を比
較する.実験で用いた対象タンパク質は Met-enkehalin,
C-peptide,PTH(1-34) である.
2.2 交叉間隔と MCsweep 数の検討
Fig. 1に得られたエネルギーの平均値をを示す.
㑆㓒
ࠛࡀ࡞ࠡ
C-peptide
1 2 4 8 16 32 64 PSA
-44
-42
-40
-38
-36
-34
-32
64 1500MCsweep
32 3000MCsweep
16 6000MCsweep
1 2 4 8 16 32 64 PSA
-12.0
-11.6
-11.2
-10.8
-10.4
-10.0
㑆㓒
ࠛࡀ࡞ࠡ
Met-enkephalin
㑆㓒
ࠛࡀ࡞ࠡ
PTH(1-34)
1 2 4 8 16 32 64 PSA
-250
-240
-230
-220
-210
Fig. 1 エネルギーの平均値
実験結果より,各タンパク質で適正な探索ステップや
1個体あたりの MCsweep 数によって適正な交叉間隔は
異なることが示された.またより原子量の大きなタンパ
ク質に対しては,PSA/GAc の交叉間隔を頻繁に行うほ
ど良い結果が得られた.
2.3 実行時間
交叉間隔と MCsweep 数の実験ではパラメータによっ
て評価計算回数や実行時間が異なる.本実験で用いた
PSA/GAcは Fig. 2 に示すように並列可能部分と逐次
部分に分けられる.交叉部分は逐次処理になるため交叉
間隔が短い場合には並列化効率が悪くなると考えられる.
Proc1 ProcN
SA SA SA SA
Genetic Crossover
SA SA SA SA
Genetic Crossover
SA SA SA SA
Time
ဖᆿ݈က
ဖᆿ࿊݈က
)ජ୶ᅫ*
ဖᆿ݈က
ဖᆿ࿊݈က
)ජ୶ᅫ*
Fig. 2 PSA/GAcにおける並列可能部分と逐次部分
Fig. 3に各パラメータでの実行時間を示す.
1 2 4 8 16 32 64 PSA
0
10
20
30
40
50
60
70
㑆㓒
⸘▚ᤨ㑆
(sec)
Met-enkephalin
1 2 4 8 16 32 64 PSA
0
200
400
600
800
1000
1200
1400
1600
㑆㓒
C-peptide
1 2 4 8 16 32 64 PSA
0
5
10
15
20
25
30
35
㑆㓒
PTH(1-34)
16 6000 MCsweep
32 3000 MCsweep
64 1500 MCsweep
⸘▚ᤨ㑆
(sec)
⸘▚ᤨ㑆
(
100
0 sec)
Fig. 3 実行時間
実験結果より交叉間隔が短い場合,Met-enkephalin で
は PSA の倍以上の時間を要していることから並列化効
率が悪い.しかし,C-peptide や PTH(1-34) では交叉間
隔が短い場合でも,並列化効率はほとんど低下しない.
3 今後の研究課題
NetSolveを用いた PSA/GAc の非同期モデルの実装
1