非線形作用素勾配系モデル

第 3 章多様体上に束縛された非線形力学系による制約条件付最適化 34

3.2 単位シンプレックス上の制約条件付最適化

3.2.1 非線形作用素勾配系モデル

正規化線形等式・非負制約付最適化問題を解く勾配系モデルを考えた場合，制約として

(3.1)式に等式条件が含まれるため，2.2節で考えたように作用素Gを導入して有界領域に

閉じ込めるためモデル(2.4)として，適切なGを恣意的に与えることは容易ではない．そこで，等式条件の充足には勾配射影法[3, 85, 86, 91]を用い，さらに非負制約の充足を考えた勾配系モデルを導出する．

(3.1)式の制約領域Xを規定する正規化等式

Xn i=1

x_i = 1 (3.3)

の法線ベクトル1= [1,· · · ,1]の直交補空間へ，計量M(x)の下で任意のベクトルを射影する射影行列は

P₁^M(x)=I−M(x)⁻¹1^T(1M(x)⁻¹1^T)⁻¹1 (3.4) で与えられる．ここで，非負制約を考慮し，xi = 0に近いほど対応する勾配成分を縮退させるため，

M(x) = diag[1/x_i] (3.5)

とおくと，(3.4)式の射影行列P₁^M^(x)は

P₁^M^(x) =I−







x₁ · · · x₁ ... ... x_n · · · x_n





 (3.6)

となる．したがって，逆勾配−c∇E(x)に計量行列の逆行列M(x)⁻¹を乗じて縮退させて非負制約を充足させるようにした上で射影行列P₁^M^(x)を用いて単位シンプレックス上に，

−c∇E(x)を射影した方向にxを変化させるモデルは，可変計量勾配射影法モデル¹と称され，

1この文脈における可変計量（Variable Metric）とは，位置xに依存して時間的に連続変化する計量を意味する．一方，一般に準ニュートン法[3, 14, 23, 65, 91]として知られる可変計量法は，離散時間的に変化（更新）する計量と解

dx(t)

dt =−cP₁^M(x(t))M(x(t))⁻¹∇E(x(t)) (3.7)

で与えられる[18, 19, 32, 38, 55, 59]．これを成分表現すると，

dx_i(t)

dt =−cx_i(t)

(∂E(x(t))

∂xi − Xn

j=1

x_j(t)∂E(x(t))

∂xj

)

=−c









xi(t)(1−xi(t))∂E(x(t))

∂x_i + Xn

j=1 j6=i

(−xi(t)xj(t))∂E(x(t))

∂x_j









, i= 1,· · · , n (3.8) となる．この式を(2.6)式と比較すると，

g_ij(x) =





x_i(1−x_i), j =i

−x_ix_j, j 6=i

j = 1,· · · , n (3.9)

とおいたことになる．ここで，以下の定理が成り立つことを示す．

定理3.1 (3.9)式のg_ij(x)を用いた(2.5)式の関数行列G(x)は，(3.1)式で与えられる領域Xにおいて半正定である．

（証明）任意のn次元実ベクトルv= [v1,· · · , vn]^T に対し，

v^TG(x)v = Xn

i=1

Xn j=1

g_ij(x)v_iv_j = Xn

i=1

x_i(1−x_i)v_i²− Xn

i=1

j=1 j6=i

x_ix_jv_iv_j

= Xn

i=1

x_iv²_i − Ã _n

i=1

Xn j=1

x_ix_jv_iv_j

= Xn

i=1

x_iv²_i − Ã _n

i=1

x_iv_i

(3.10)

が成り立つ．一方，

¯ v =

Xn i=1

x_iv_i (3.11)

とおくと，等式条件Pn

i=1x_i = 1，および非負条件x_i ≥0, i= 1,· · · , nのもと，

0≤ Xn

i=1

x_i(v_i−¯v)² = Xn

i=1

x_i¡

v²_i −2v_i¯v+ ¯v²¢

= Xn

i=1

x_iv_i²−2¯v Xn

i=1

x_iv_i+ ¯v² Xn

i=1

x_i

= Xn

i=1

x_iv_i²−¯v² = Xn

i=1

x_iv_i²− Ã _n

i=1

x_iv_i

(3.12) が成り立つ．したがって，(3.10)式と(3.12)式の同値性から，命題は示された．■

定理3.1より，(3.9)式に対応する関数行列G(x)，すなわち(3.7)式における勾配への作用P₁^M^(x(t))M(x(t))⁻¹は条件2.1を満たすので，勾配系(3.7)，(3.8)は降下法モデルであることが示される．

さらに，(2.10)式は dx_i duj





x_i(1−x_i), j =i

−x_ix_j, j 6=i

j = 1,· · · , n (3.13)

となり，これを満たす関数f として

x_i =f_i(u) = expu_i Pn

j=1expu_j, i= 1,· · · , n (3.14) が得られる[55]．この関数は制約領域に対する有界性および全射性は満たすが，単射性は満足されないために逆関数を与えることはできない．しかし，(3.14)式のf を(2.7) 式へ当てはめれば，可変計量勾配射影法モデルの内部状態表現を実現することができる．

ところで，(3.8)式の右辺を0とおくことにより，

条件3.1 力学モデル(3.8)の平衡点は，以下の(i)，(ii)のいずれかの条件を満たす．

(i) x_i = 0, i= 1,· · · , n，

(ii)

Ã∂E(x)

∂x_i − Xn

j=1

x_j∂E(x)

∂x_j

= 0, i= 1,· · · , n．

が得られる．ここで，少なくとも1つの成分について(i)の条件が成り立つとき，xは(3.1)

式で与えられる制約領域Xの境界 bd X =

( x

¯¯

¯ Xn

j=1

x_j = 1, x_i ≥0, i= 1,· · · , n かつ∃k ∈ {1,· · · , n} x_k= 0 )

(3.15) に存在する．さもなければ，x は制約領域Xの内部

intX = (

¯¯

¯ Xn

j=1

x_j = 1, x_i >0, i= 1,· · ·, n )

(3.16) に存在する．このとき，すべての成分が条件3.1の(ii)の条件を満たすことになるが，この場合はさらに以下のように場合を分けて考える．

条件3.2 条件3.1の(ii)の場合は，さらに以下の(ii-1)，(ii-2)へ場合分けされる．

(ii-1) ∂E(x)

∂x_i = 0, i= 1,· · · , n，

(ii-2) ∃k ∈ {1,· · ·, n} ∂E(x)

∂x_k 6= 0，かつ Ã∂E(x)

∂x_i − Xn

j=1

x_j∂E(x)

∂x_j

= 0, i= 1,· · · , n．

(ii-1)は，目的関数自体の最小点が制約領域である単位シンプレックス上にちょうど存在

する場合へ対応する．他方，(ii-2)の場合，条件中後者の等式が

∂E(x)

∂x_i = Xn

j=1

x_j∂E(x)

∂x_j = const., i= 1,· · · , n (3.17) と変形され，勾配の全成分が等しい値になることが必要がある．したがって，条件(ii-2) を満たす平衡点は，単位シンプレックス上で勾配が[1,· · · ,1]^T 方向に平行する点であるり，幾何学的に解釈すればその点における勾配が単位シンプレックス面と直交するため射影によって潰れてしまう点である．また，これは最適性に関するKarush-Kuhn-Tucker条件に他ならない．

次に，内部状態表現モデルにおける平衡点について議論する．まず，(3.14)式のfは単射でなく，決定変数xの1値を与える複数の内部状態量uが存在することを確認する．

具体的には，(3.14)式からxとuとの自明な関係として，

ui(t) = logxi(t), i= 1,· · · , n (3.18)

が見出される[59]．しかし，a6= 0，b= log|a|に対して expu_i

j=1expuj

= aexpu_i aPn

j=1expuj

= aexpu_i Pn

j=1aexpuj

= expb·expui

j=1expb·expu_j = exp(ui+b) Pn

j=1exp(u_j+b) (3.19) がなりたつから，b =−Cとおいて

u_i(t) = logx_i(t) +C, i= 1,· · ·, n (3.20)

もまた(3.14)式を満足する．これは，xとuの対応関係を2次元の場合を例として図3.1に

示す通り，決定変数空間の1点が，内部状態変数空間では[1,· · · ,1]^T を方向ベクトルとする1本の直線に対応することを意味する．したがって，他の条件なしにxからuを一意に定めることはできない．

さらに，決定変数に関する平衡点の性質によって場合分けして，内部状態表現モデルとの対応を考えると，以下のことがいえる．

(a) x∈bd Xのとき

xの少なくとも1つの成分，たとえばx_k，k ∈ {1,· · ·, n}が制約領域Xの内部int Xから境界へ近づくとすると，(3.14)式から

∃k ∈ {1,· · · , n} x_k→0 =⇒ u_k → −∞ (3.21) となって，内部状態量はその成分に関して負に発散する．

(b) x∈int Xかつ∇E(x) = 0のとき

∇E(x) = 0を(2.9a)式へあてはめると，du/dt =0となるので，内部状態量もその空

間の平衡点になる．この値は，決定変数の平衡点へ一意に対応する内部状態変数空間の直線に含まれる1点に対応する．

∇E(x) =λ[1,· · · ,1]^T, λ6= 0 (3.22) を満たす．したがって，決定変数xは制約領域内部intXである点に収束しても，uは決定変数の平衡点へ一意に対応する内部状態変数空間の直線，すなわち図3.1のある直線に沿うように変化し続け，やがて発散する．

2次元の例として，可変計量勾配法の内部状態表現モデルで決定変数が上記(a)〜(c)の条件にあう平衡点へ収束するとき，対応する内部状態変数のその空間における挙動を示し

た結果は図3.2の通りである．決定変数が制約領域内部で有限値へ収束するにもかかわらず，内部状態量の発散が起こることはきわめて興味深い．

ところで，集団遺伝学における進化現象の基本モデルとして，複製方程式もしくはレプリケータモデル[88]と称される力学系







 dx_i(t)

dt =x_i(t){s_i(x(t))−s(x(t))¯ }

s(x(t)) = Xn

j=1

x_j(t)s_j(x(t))

(3.23)

がある．ここで，ある集団がn種類の要素から構成されているとするとき，x_iは第i要素が占める割合，si(x)は集団の状態x= [x1,· · · , xn]^T に依存した第i要素の適応度，また

s(x)は各要素の適応度をそれぞれの割合で重みづけして和をとった集団全体の平均適応度である．初期状態を(3.1)式の単位シンプレックス上にとると，(3.23)式によって生成される軌道x(t)は，その単位シンプレックス上から逸脱することなく時間発展し，すべての要素の進化をあらわすものとされている．(3.23)の第2式を第1式に代入すると

dx_i(t)

dt =x_i(t) (

s_i(x(t))− Xn j=1

x_j(t)s_j(x(t)) )

, i= 1,· · · , n (3.24) となり，単位シンプレックス上の非線形作用素勾配系である可変計量勾配射影モデル(3.8) でc= 1とした力学系と比較すると，(3.24)式において

s_i(x) = −∂E(x)

∂x_i , i= 1,· · ·, n (3.25) とおいたものであることがわかる．

なお，レプリケータモデルは，非負領域で定義されるShahshahani計量[89]のもとでの

Riemann多様体上の力学系モデルとして解釈することができる[60, 61] ²．

レプリケータモデルは，生態システムではLotka-VolterraモデルやPrice方程式，分子システムではQuasispecies方程式など，各種進化モデルと関連づけられるほか[76]，ゲーム理論への応用[34]をはじめとして，近年でもさかんに研究されている[25, 30, 83]．

2.2節と同様に，関数Eとして2次関数

E(x) =−1 2

Xn i=1

Xn j=1

w_ijx_ix_j − Xn

i=1

θ_ix_i (w_ij =w_ji) (3.26)

2Shahshahaniは，(2.1)式の領域Xに対し，x∈X におけるベクトルyとzの内積を，hy,zi=Pn i=1

1 x_iyiziと定義した．これは，(3.5)式を計量行列にとったことに他ならない．

を考えると，

s_i(x) = Xn

j=1

w_ijx_j +θ_i (3.27)

となり，この場合(3.23)式は，Fisherが初期に提唱した淘汰方程式となる[22]．このことを逆に言えば，この淘汰方程式(3.23)は，(3.26)式の2次関数Eを単位シンプレックス上で最小化する最適化問題，すなわち2次関数最大化問題

maxx

1 2

Xn i=1

Xn j=1

w_ijx_ix_j+ Xn

i=1

θ_ix_i (3.28a)

subject to Xn

j=1

xj = 1, xi ≥0, i= 1,· · · , n (3.28b) を解く力学系のモデルに他ならない．したがって，問題(3.28)に対する複製方程式・淘汰方程式モデル(3.23)は，−Wを結合係数，−θを閾値として，図3.3に示す相互結合型ニューラルネットワークを模した演算回路として実現することができる．文献[60]では，(3.27) のs(x)を用いたレプリケータモデルを，組合せ最適化の計算手法として論じている．

また，統計力学との関連では，スピンモデルを拡張したPottsモデル[101]に対して平均場近似を適用すると，スピン状態の平均場近似変数は(3.14)の形で与えられ，平均場方程式は2次関数に対して本項における非線形作用素勾配系の内部状態表現を与えたモデルと同様の構造をとることが示され，文献[81]ではグラフ分割問題に用いられている．ちなみに，グラフ分割問題の特殊な場合が，組合せ最適化における有名な巡回セールスマン問題（TSP）である．

図 3.1: 決定変数xと内部状態uの対応関係

(a) xが制約領域の境界bd X上の点に収束する場合

(b) xが制約領域の内部int Xで勾配が零となる点に収束する場合

（単位シンプレックス面に直交する）点に収束する場合図 3.2: 内部状態量uの軌道

図 3.3: 疑似相互結合ニューラルネットワーク型の演算回路

ドキュメント内多様体上の非線形力学系による制約条件付最適化に関する研究 (ページ 40-50)

第 3 章 多様体上に束縛された非線形力学系による制約条件付最適化 34

3.2 単位シンプレックス上の制約条件付最適化

3.2.1 非線形作用素勾配系モデル

第 3 章多様体上に束縛された非線形力学系による制約条件付最適化 34