生物システムの最適化アノレゴリズム
平藤雅之
11川11川川11川川11川川11川川11川11川川11川111川11川川11川11川川11川川11川川11川川11川川11川川11川川川11111川川11川川11川川11川川11川11川11川川11川111川111川11川川11川川11川川11川川11川11川11川川11川川11川11川川11川川11川11川川11川11川川11川川l川川11川11川川11川川11川11川11川川11山川11川川11川11川11川川11川11川川11川川11川111川川11川川11川川11川川11川川11川川11川川11川川11川11川川11川川11川川11川11川川11川川11川川11川川11川川11川川11川川11川11川川l川川11川11川11川川11川11川11川11川11川川11川川11川川11川川11川11川11川111川川11川川11川11川11川11川11川川11川11川川11川11川11川川11川川11川川11川川11川11川11川11川11川川11川11川11川11川l川川11川11川11川川11川川11川11川川11川川11川川11川川11川川11川川11川川11川11川川11川川11川川11川川11川川11川11川川11川11川11川川11川11川川11川川11川11川11川川11削11川川11川川11川11川11川11川11川川11川川11川川11川川|川川11川川11川川11川川11川川11川川11川11川11川川11川11川11川川11川川11川川11川川11川川11川川l川川11川11川川l川川11川川11川11川111川川111川11川11川111川川11川111川川11川川11川11川川11川11川11川川11川111川川11川川11川11川川11川川11川11川川11川川11川川11川川11川川11川川11川川11川川11川川11川川11川111川1111川11川111川11川11川11川11川川11川11川川11川川11川11川川11川川11川川11川川11川11川11川11川11川川11川11川11川11川11川11川川11川11川川11川川11川川11川川11川川|川川11川11川11川11川11川11川川11川11川1111
.
はじめに
生物対象および生産手段が生物であるということは, 農業の大きな特徴である.生物現象は最も複雑な自然現 象であり,生物系を含む農業生産システムは極端に複雑 なものである.作付計画,栽培管理,作業計画,出荷調 整,施設の操業管理,作業機器の設計などでは,いずれ も対象とする動植物の挙動が最も重要なプアクターであ る.生産コストや利潤に限定した純粋に経済的な問題で あっても,生物の要素は無視できない. 一方,扱う生物の種や品種の違い,土壌や気象などの 環鏡条件,経営規模,立地条件などの違いに応じて問題 の内容は大きく異なるため,個別に対処しなければなら ない要素が多い.わが国では,経営単位の経済的規模が 小規模であることから,研究開発にかかるコスト,導入 に必要なハードウェアや基礎データの収集に要するコス ト,利用法を会得するまでにかかる時間的なコストなど が収支に占める割合が大きい.すなわち自己を最適化す るためのコストが大きいため,目的関数には自己を最適 化するのに要するコストも含めて考えなければならな L 、. コンピュータを農業に利用する場合では,次の目的関 数 φ を最大化する問題として考える必要がある. φ =G-H-S-D-U (1) ここで G は最適化によって得られた利潤 H は計 算機のハードウェアのコスト , S はソフトウェアのコス ト , D は計算に必要なデータの入手にかかるコスト , U はユーザーがソフトの使い方をマスターするためにかか る時間的コストである.最近はHが低下したため,パソ コンの導入が即,収益増になると考えられがちである. しかし,現実にはソフトの開発に要する費用 S が非常に 大きいため, φ>0 を実現するのはなかなか難しい. ただし, G の対象範囲を限定すれば S が小さい場合は ひらふじ まさゆき 農林水産省農業研究センター 〒 305 つくば市観音台 3 ー 1-1 1991 年 10 月号 ある.たとえば,多変量解析や線形計画法などの市販の パッケージソフトを利用すれば , G>S となる問題は少 なくない(フリーウェアの使用では S=o である).しか しながら,一般ユーザーが使いこなすには理論や操作法 が難解すぎるため , U ,:> G となる.農家レベルでコンビ ュータを経営に応用した事例が少ないのは,これが主因 と思われる. きて,農業におけるコンピュータの用途は以下のよう なものである.それぞれにおいて,カッコ内に示すよう なコンピュータモデルが必要で、ある. (乱) 生物システムの制御(生物+環境) 刷機械・施設の自動化(生物+環境+機械) (c) 生産方法の改善(生物+環境+機械+人間) 位) 生産システムの最適化(生物+環境+機械+人 問+経済) これらの用途で使われる個々のモデルの同定は,非線 形関数の最適化問題に帰着される.また, (c), ω) 自体は 非線形関数の最適化問題,あるいは組合せ最適化問題に なる. 以下では,キーポイントとなる複雑系の最適化方法に ついて,生物との関連が深い最適化アルゴリズムの観点 から考えてみる.2
.
非線形システムの最適化
組合せ最適化問題はホップフィールドモデル[1 ]のよ うな方法を使えば非線形関数の最適化問題に帰着させる ことができる.逆に,非線形関数の最適化問題はパラメ ータの離散化によって組合せ最適化問題に変換できる. したがって,いずれかの方法でよい解法が得られれば十 分である.また,最小化問題と最大化問題は評価関数を 適当に変換すれば同じアルゴリズムで解くことができ る.1:.-たがって,ここではこれらを特に区別しないで扱 うことにする. 非線形関数の最適化は,一般に非線形関数 φ (x)eR xeRn を fi(X)~O, i=I, 2,… (2)(
7
)
4
8
5
© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.の制約条件下で最小化する問題として表わされる.線形 あるいは準線形問題では,制約条件がつくほど問題は難 しくなるが,非線形問題では (2) を, φ'(X)=φ (X)+P (fl(X).!2(X) , … (3) とすれば,単に φ'(X) の最小化問題として扱うことがで きる.ここで , P( ・)は (2) の制約を満たさない場合にお ける違反の程度を表わすペナルティー関数である. (3) の最小化方法には多くの手法が提案されているが, 興味深いことに生物現象をヒントにした方法や生物モデ ルを流用した方法(以下,一括して生物学的最適化アル ゴリズムと呼ぶ)が意外とよい結果を示している.幸い なことに,最初に示した(a)-(d)で、使われる生物モデルを 作る研究は,生物学的最適化アルゴリズムとオーパーラ ップさせることができる.この接近方法は,生物系を含 む問題( (1) 式が評価関数である問題)において効率的 な戦略である.しかも,生物学的最適化アルゴリズムで は,これまでに蓄積された知識をアドホックに活用でき る可能性がある. 最適化が最も顕著に行なわれている生物現象は,いう までもなく進化であろう.進化モデルでは,ダーウィン の進化論が最もポピュラーであり,これは淘汰によって 最適化を行なうアルゴリズムとみなせる.これを最適化 アルゴリズムとして利用したものに,遺伝的アルゴリズ ム [2
J
(GA: Genetic
Algorithms) がある.GA は,成分が離散値のベクトル S を遺伝子型と考 え,評価関数 g(X) を最大にする s を探索するアルゴリ ズムである.初期状態をランダムに選んだ m 個のベクト ルを元にもつ集合 K={Xtli=I , 2, … , m} としたとき, 評価関数の大きい遺伝子をもっ個体ほど繁殖するという 生存競争の状況を
nt=/(gtl
(
4
)
で表わすことにする.ここで , nt はおt の個体数 , gt は 引の評価値,/は任意の単調増加関数である. このと き,異なった遺伝子型 Xü
xJ をもっ 2 個体聞では,υ=~.~ム (N= 制
N N ¥
f';IO"!
(5) の確率で遺伝子の交差が起こり,新たな 2 個体が発生す る (X;, Xj の成分を 2 分割して置換).同時に,突然変 異(ベクトル的の成分が一定の確率でランダムに変化) によっても,新しい遺伝子型をもっ個体が発生する. 遺伝子の交差と突然変異によって生み出された新しい 遺伝子型の集合を K' としたとき,これを元の集合 K に 追加して,4
8
8
(8) K:=KUK' (6) とする .Kの元の数m を一定として,評価値が小さい遺 伝子型をもっ個体は絶滅する (Kから削除). GA ではこの手続きの繰り返しによって,評価値が大 きい遺伝子型の探索を行なう.上記に,遺伝学における 優性遺伝,性などの概念や,生態学におけるニッチなど の効果を組み込むことも試みられている [3J
.
GA は評 価値 g さえ得られれば適用できるため,適用範囲が非常 に広い.たとえば,筆者はニューラルネットによるパタ ーン認識結果を評価値として,植物の葉表面の顕微鏡像 から気孔を強調するさいに必要な画像処理演算の探索に GA を適用し, 煩雑な画像処理の自動化を行なってい る [4J
.
進化にもとづくアルゴリズムでは,模擬進化法 (SE:Simulated Evoluation) [5
J も提案されている.これ らは DNA レベルというよりも,むしろ染色体レベルの 遺伝的なメカユズムを応用している.分子進化を参考に したアルゴリズムとしては, DNA における遺伝情報の ばらつきをモデル化した模擬分子進化法 (SME:Simul
a
t
e
d
Molecular Evolution) [6
J が提案されている. SME では, DNA の転写におけるエラー分布の存在 を重視し,複製される DNA に一定の分布をもたせるよ うにしている.すなわち,オリジナルの DNA の塩基配 列を At , コピーされた DNA の塩基配列を At' とした とき , At' はハミング距離が H までの範囲で分布し,[At-A
/J
<H
,
i=I
,
2
,
…
(7) と考える.さらに,それぞれの DNA 群は,種の独立性 を維持するため相互に一定のハミング距離D 以上は必ず 離れていると考えて,[At-AjJ<H
,
i*j
(
8
)
としている. GA では不要な組合せをもった遺伝子型が 多数存在して冗長であるが, SME はこの冗長さを減ら すことで探索領域を限定し,探索が効率化している. GA や SME は,粗結合並列プロセッサやコンピュー タネットワークの環境で利用しやすいアルゴリズムであ り,この面でも高速化が図れる.しかし,多少効率化し ても,自由度が大きくなると手に負えなくなるという欠 点がある. GA や SME で,コンピュータのプログラム が自動作成できるかどうかを考えてみよう. サイズが 100 パイトのプログラムがあるとき,たった 1 パイトの変異で 10200種ものプログラムが得られる. ところが,ランダムなプログラムコードの変更はパグの 発生に他ならず,正常に動作するプログラムは皆無に近 オベレーションズ・リサーチ © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.γγγ
光合成が活発な場合V
ー
qw
ー
ρ
吋
Vi
光合成が不活発な場合 図 1 植物の生長における形態変化のコンピュータモデル(ダイズ) い.このような問題では, GA や SME のようなプロセ スの繰り返しによって元のプログラムよりも優れたプロ グラムが得られる可能性は非常に少ない.これは,ダー ウィンの進化論の欠点としても知られている.換言すれ ぽ,人間の DNA (約 lG パイト)を生み出す進化メカ ニズムでは,もっと効率のよい最適化アルゴリズムを見 いだす必要がある.3
.
対象を限定した生物毛デル
前章のアルゴリズムは対象を限定していないため,対 象の自由度が大きくなると破綻するが,対象の構造を限 定すれば大きな自由度をもっシステムでも最適化が可能 である. ニューラルネット (Artificialn
e
u
r
a
l
networks
Ht
, 神経回路網を単純化したコンピュータモデルであるが, 脳が多数のシナプス荷重や神経細胞をもっため,モデル に含まれる自由パラメータの数は極端に多い.このモデ ルて・は,エネルギ一関数や誤差関数の最小化によって, 全パラメータが同定される.網膜におけるオプテイカル フローの検出のような不良設定問題でもエネルギ一関数 の最小化によって解くことができる.これらに共通する 最小化原理は他の生物モデルにおいても,大変,示唆に 富むものである. (もっとも, パターン認識やパターン 1991 年 10 月号 変換などの機能を工学的に応用することへの期待の方が 一般的に高いが) ニューラルネットの学習アルゴリズムとしては,誤差 逆伝搬法 (BP:
B
a
c
k
-
P
r
o
p
a
g
a
t
i
o
n
)
[7
J の応用が多 い. BP は最急降下法の一種であり,ローカルミニマム ( 2 乗誤差の極小解)にトラップされるなどの問題点も残 されている.それにもかかわらず BP の適用例が多いの は,多変量解析的な性質を備えているためで、ある. ニューラルネットに期待される機能として,学習サン フ, J!- にないパターンでも正しく推定できる機能(汎化) があげられる.特に階層型ネットワークを学習させたと き, 中間層にはデータの中に含まれる情報が集約され る.この場合の汎化能力は,多変量解析的機能によると 考えられている [8Jー [12J. ユューラルネットにおける 入力パターン Xiから出力パターンれへの変換をfと すると ,{X
i,Y
il
i
=
1, 2,…}をデータセットとして f を最小 2 乗推定する学習は,/が線形射像のとき重回帰 分析および判別分析に一致する./が非線形変換となる ニューラルネットは,重回帰分析および判 }}IJ 分析,数量 化理論I, n 類などを非線形領域へ拡張したものに相当 する.また,/が恒等射像の場合は,主成分分析を非線 形領域へ拡張したものに相当し,中間層出力値が主成分 に相当する.(
9
)
4
8
7
© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.生物現象のレベノレ コンビュ タ上での表現
にき盟主:二仁二二L二士三
,-ーー一一ーーーーーー・ーーーーー -r- ーーーーーー --r--- --,、l
内部メカニズム プログラムi
にー『ーーーーーーーーー四ーーーーーー _1__ーーーーーーー _1_c豆召堕二T二二ゴ二三;:3")
テÞ.つ
図 2 生物現象の表現形式 最近は汎化能力を向上させるテクニック [13J[14J や, 極小値の脱出技法 [15J ,連続時間リカレントネットワー ク [16J [17J などが提案され,機能が強化されている. また, トンネリングアルゴリズム [18J のような一般的な 非線形最適化アルゴリズムとの併用や,A 1
C などの従 来から利用されてきた統計手法との併用も可能である. 生物学的問題におけるニューラルネットの適用事例に は, DNA シーケンスの解析[19J ,タンパク質の 2 次構 造の推定 [20J ,ランドサット画像における土地被覆分類 [21J ,診断型エキスパートシステム [22J ,植物生長モデ ル [23J など(図 1 )をはじめ,食味計,農産物の形状判 定などの産業的な応用も多い.4
.
おわりに 生物現象は,図 2 のように 3 つの階層に大きく分ける ことができる.たとえば,植物の生長速度は CO2 濃度 や光強度で変化するが,この現象の表層は,コンピュー タにおいてデータの集合として表現できる.さらに,生 長にかかわる光合成や呼吸などの内部のメカニズムは, プログラムコード(手続き,ルール)として扱うことが できる.しかしながら,われわれが生物を見て生物らし さを強く感じる部分は,形態形成,分化,適応,進化な どのような自己組織的現象である.こういった抽象的機 能はアルゴリズムで表現するのが自然、であり,たとえば 植物の生長における適応のl つは,受光エネルギーの最 大化アルゴリズムとして表現できる[24J. 生物のように極端に複雑な現象の把揮にはコンビュー タが不可欠であるが,一方,そのモデルの開発過程から生 み出されるアルゴリズムには広範な応用の可能性が期待 できる(このような研究パラダイムは ArtificialL
i
f
e
:
人工生命 [25J と呼ばれている).しかし,生物学的最適 化アルゴリズムは内容が複雑化するほど機能が向上する 傾向が見られる.この傾向がつづくと,現在の単純さを 失って非常に複雑なものとなるが(生物現象の複雑さの 原因の 1 つはこの種のアルゴリズムの進化によるものだ4
8
8
(
1
0
)
ろう), 生物現象とのアナロジーが保たれていれば直感 的な理解しやすさとし、う特徴は維持されると思われる. 引用文献[1] Hopfield
,
J
.
J
.
and Tank
,
D. W.: Neural
computation of d
i
c
i
s
i
o
n
s
i
n
optimization
problems
,B
i
o
l
.
Cybernetics
,52
,1985
,1
4
1
-
1
5
2
.
[
2
J Holland
,
J
.
H. :
Adaptation i
n
Natural and
Artij官cial
S
y
s
t
e
m
s
"
Ann Arbor
,
The Univ.
o
f
Michigan Press
,
1
9
7
5
.
[
3
] Goldberg
,
D. E
.
Genetic Algorithms i
n
Search
,Optimization
,and Machine Learning
,Addison-Wesley Publishing Company
,
1
9
8
9
.
[4J
平藤雅之:多モジュール MLP による気孔開度の計測アルゴリズム農業気象学会・生物環境調節学 会合同大会講演要旨 I
1990
,3
0
2
-
3
0
3
.
[
5
J King
,
R. M. and Banerjee.
,
P :
ESP :
Placeュ
ment by Simulated Evolution
,
IEEE Trans.
CAD-8-3
,
2
4
5
-
2
5
6
(
1
9
8
6
)
.
[6 J Wang
,
Q.Optimization by Simulated
Molecular Evolution
,B
i
o
l
.
Cybernetics
,57
,1987
,
9
6
-
1
0
1.[
7
J Rumelhart
,D. E.
,Hinton
,G. E
.
and Willュ
iams
,
R. J
.
:
Learning I
n
t
e
r
n
a
l
Representaュ
t
i
o
n
s
by Error Propagation. In Parallel
D
i
s
t
r
i
b
u
t
e
d
Processing
,
Vo
1.
1
,
D. E
.
Rumelュ
hart
,
J
.
L
.
MaClelland and t
h
e
PDP Research
Group. MIT Press
,
1986
,
3
5
4-3
6
1.[8 J Asoh
,
H. and Otsu
,
N.: Nonlinear Data
Analysis and Mult
i
1
ayer Perceptrons
,
Proュ
ceedings of
IJCNN
1989 i
n
Washington D.C.
,
II
,
1989
,
411-415.
[9 J Bourland
,
Y and Kamp
,
Y.: Auto-Associaュ
t
i
o
n
by Multilayer Perceptrons and Singular
Value Decomposition
,B
i
o
l
.
Cybernetics
,59
,1988
,
2
9
1
-
2
9
4
.
[
1
0
J
Galliari
,P.
,Thiria
,S
.
and Soulie
,F
.
F
.
:
Mult
i
1
ayer Perceptron and Data Analysis
,
Proceedings of IJCNN
1
9
8
8
i
n
Sandiego
,
Vo
1.
1
,
1988
,
39
•
399.
[IIJ 平藤雅之,小野良孝,小林恭:ニューラルネッ トによる多変量解析とエキスパートシステム構築方 法, 日本ソフトウェア科学会第 5 回大会論文集, オベレーションズ・リサーチ © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.1989
,
1
1
3
-
1
1
6
.
[
1
2
J
Saund
,
E
.
:
Dimensionality-Reduction Using
Connectionist Networks,
IEEE Transactions
on pattern a
n
a
l
y
s
i
s
and machine intelligence
,
Vo
l
.
n
,
No. え 1989,3
0
4
-
3
1
4
.
[
1
3
J
石川真澄:忘却を用いたコネクショニストモデルの構造学習アルゴリズム人工知能学会誌 5 ,
1990
,
5
9
5
-
6
0
3
.
[
1
4
J
Rumelhart
,
D. E
.
P
a
r
a
l
l
e
l
D
i
s
t
r
i
b
u
t
e
d
Processing
,
IEEE l
n
t
e
r
n
a
t
i
o
n
a
l
Conf量renceon Neural Networks
,
Plenary Session
,
1
9
8
8
.
[
1
5
J
松葉育雄:ニューラルネットワークによる最適化計算,計測と制御,
Vo
1.
28
,No.12
,1990
,4
4-47.
[
1
6
J
Pearlmutter
,
B.A.: Learning S
t
a
t
e
Space
T
r
a
j
e
c
t
r
i
e
s
i
n
Recurrent Neural Networks
,
Proceedings 01 lJCNN
1
9
8
9
i
n
Washington
D.C.
, II ,1989
,3
6
5
-
3
7
2
.
[
1
7
J
Pineda
,
F
.
J
.
:
G
e
n
e
r
a
l
i
z
a
t
i
o
n
o
f
Back-Proュ
pagation t
o
Recurrent Neural Networks
,
Physical Review Letters
,59
,1987
,2
2
2
9
-
2
2
3
2
.
[
1
8
J
Levy
,
A. V. and Montalvo
,
A.: The tunneュ
l
i
n
g
algorithm f
o
r
g
l
o
b
a
l
minimization o
f
functions.
,SIAM J
,S
c
i
.
S
t
a
t
.
Comput.
,Vo
l
.
6
,No.l
,January
,1985
,1
5
-
2
9
.
[
1
9
J
Qian
,
N. and Senowski
,
T.J. :
Predicting
t
h
e
Secondary S
t
r
u
c
t
u
r
e
o
f
Globular P
r
o
t
e
i
n
s
Using Neural Network models
,
J
.
Mol. Bíol.
,
202
,
1988
,
8
6
5
-
8
8
4
.
[
2
0
J
Lapedes
,A.
,Barnes.
,C.
,Burks
,C. Farher
,R. and Sirotkin
,
K.: Application o
f
Neural
Networks and Other Machine Learning
Algorithms t
o
DNA Sequence Analysis
,
Computer and DNA
,
SFI S
t
u
d
i
e
s
i
n
t
h
e
S
c
i
e
n
c
e
s
01
Comρlexity,Vo
l
.
VII
,
Eds. G.
B
e
l
l
and T. Marr
,
Addison-W e
s
l
e
y
.
1
9
9
0
.
[
2
1
J
本篠毅:リモートセンシングデータの画像解析, バイオエキスパートシステムズ,コロナ社,1990
,1
3
4-1
3
8
.
ロ2J 平藤雅之:大豆の病気診断ニューラルエキスパー トシステム,パイオエキスパートシステムズ,コロ ナ社,1990
,1
3
8
-
1
41
.
[
2
3
J
平藤雅之:ファジイニューラルネットによる植物 生物のモデノレ,情報処理学会研究報告,32
, 5,1
9
91
.
[
2
4
J
Sakai
,
S
.
:
A Model Analysis f
o
r
the Adapュ
t
i
v
e
Architecture o
f
Herbaceous Plants
,
J.Theor. Biol.
,148
,1991
,5
3
5
-
5
4
4
.
[
2
5
J
Langton
,
C.G.(Ed.):ARTIFICIAL LIFE
,
The proceedings 01 an i
n
t
e
r
d
i
s
c
i
p
l
i
n
a
r
y
workshop on t
h
e
s
y
n
t
h
e
s
i
s
and s
i
m
u
l
a
t
i
o
n
01
l
i
v
i
n
g
systems
,
held september i
n
Los Alaュ
mos
,New Mexico
,Addison-Wesley
,1
9
8
7
.
....・-・4