M 凸関数最小化問題の近接定理の証明 - 近接定理の証明

第 4 章 M 凸関数の連続緩和と最小化 59

4.7 近接定理の証明

4.7.1 M 凸関数最小化問題の近接定理の証明

M凸関数最小化問題(MC)の近接定理である，定理4.21を証明する．この定理の証明のためには，(MC)の代わりに，以下のような問題(GMC)

(GMC) Minimize F(x) subject to x∈dom_RF∩Zⁿ

を考えるほうが都合がよい．ただし，F : Rⁿ → R∪ {+∞}^{は連続変数の閉真}M凸関数である．定理4.1に述べたように，任意の離散M凸関数f :Zⁿ → R∪ {+∞}について，連続変数のある閉真M凸関数F : Rⁿ → R∪ {+∞}が存在して，任意の x ∈ Zⁿ に対して

F(x) =f(x) を満たすので、問題(GMC)は(MC)よりも一般化されていることがわかる。

(GMC)の連続緩和問題は，ごく自然に

(GMC) Minimize F(x) subject to x∈dom_RF と定義される．問題(GMC)の近接定理を示す．

定理 4.32.

(i) (GMC)の任意の最適解y_∗ ∈Zⁿ に対して，(GMC)のある最適解 x_∗ ∈Rⁿ が存在して，

∥x_∗−y_∗∥_∞< n−1を満たす．

(ii) (GMC)の任意の最適解 x_∗ ∈ Rⁿ ^{に対して，}(GMC)のある最適解 y_∗ ∈Zⁿ ^{が存在して，}

∥y_∗−x_∗∥∞< n−1を満たす．

問題(MC)は(GMC)の特殊ケースであるので，定理4.21は定理4.32から即座に導かれる．

定理4.32から、閉真M凸関数F がargmin_RF ̸=∅を満たすためには，argmin{F(y)|y∈ Zⁿ} ̸=∅となることが必要十分であることがわかる（後述する注意4.2も参照されたい）．

定理4.32 (i)の証明

定理4.32(i)の証明のために，これから述べる2つの性質を用いる．次の補題の主張は，閉

真M凸関数F を任意に選んだ座標軸i∈N に沿って射影すると，優モジュラ関数になるというものである．

補題 4.33 ([72, 命題 3.12]). 任意のx,y ∈ Rⁿ^と任意のi ∈N について，F(x) +F(y) ≤

F( ˆx) +F( ˇy) が成り立つ．ただし，xˆとyˇは ˆ

x(j) =





min{x(j), y(j)} (j ∈N \ {i}^のとき), x(N)− ∑

k∈N\{i}

min{x(k), y(k)} (j=iのとき),

ˇ y(j) =





max{x(j), y(j)} (j∈N \ {i}^のとき), y(N)− ∑

k∈N\{i}

max{x(k), y(k)} (j=iのとき) と定義されるベクトルである。

実数γ ∈R^{に対して，}

level(F, γ) ={x∈Rⁿ|F(x)≤γ}

と定義する．このとき，F は閉凸関数であるので，level(F, γ)は閉集合である（[83,定理 7.1]

などを参照）．

補題 4.34. ベクトルy_∗ ∈dom_RF と，level(F, γ)が空にならない実数値γ ∈Rを考える．

ベクトルx˜ ∈level(F, γ)がlevel(F, γ)の中で∥x˜−y_∗∥1の値を最小にするとする．

(i)k∈N が

F(y_∗−χi+χk)≥F(y_∗) (∀i∈N) (4.9) の条件を満たすとき，x(k)˜ −y_∗(k)< n−1となる．

(ii)k∈N が

F(y_∗−χk+χj)≥F(y_∗) (∀j∈N) の条件を満たすとき，x(k)˜ −y_∗(k)>−(n−1)となる．

証明. (i)のみを証明する．(ii)も同様に証明できる．x(k)˜ > y_∗(k)の場合を考えればよい．

このとき，

F( ˜x−ε(χk−χi))> F( ˜x)

(∀i∈supp⁻( ˜x−y_∗), 0<∀ε≤min{x(k)˜ −y_∗(k), y_∗(i)−x(i)˜ }) (4.10) が成り立つ．なぜなら，そうでないとすれば，あるベクトルx^′∈dom_RFが存在して，F(x^′)≤ F( ˜x)≤γかつ∥x^′−y_∗∥1<∥x˜−y_∗∥1を満たすことになるが，これはx˜の選び方に矛盾するからである．supp⁻( ˜x−y_∗) ={i1, i2, . . . , it}^{とする．ただし，}t=|supp⁻( ˜x−y_∗)|(≤n−1) である．y0=y_∗として，λh∈R+とyh∈Rⁿをh= 1,2, . . . , tに対して順次

λh= sup{λ|yh−1+λ(χk−χih)∈dom_RF,

λ≤min{x(k)˜ −yh−1(k), yh−1(ih)−x(i˜ h)},

F(yh−1+λ^′(χk−χih))はλ^′∈[0, λ]の範囲で真に減少する}, yh=yh−1+λh(χk−χih)

と定義する．ここで、λh= 0の場合もあり得る。yhの定義とF の閉凸性から，

F(yh)< F(yh−1) （λh>0のとき）, (4.11) F(yh+λ(χk−χih))≥F(yh) (∀λ >0)

（x(k)˜ > yh(k)かつyh(ih)>x(i˜ h)のとき） (4.12)

が成り立つ．

Claim 1: ∑t

h=1λh= ˜x(k)−y0(k).

[Claim 1の証明] 矛盾を導くために，∑t

h=1λh<x(k)˜ −y0(k)と仮定する．k∈supp⁺( ˜x− yt)であるので，(M-EXC[R]) よりあるih ∈supp⁻( ˜x−yt)と十分に小さなλ > 0が存在して，

F( ˜x) +F(yt)≥F( ˜x−λ(χk−χih)) +F(yt+λ(χk−χih)) を満たす．補題4.33のi=kの場合を考えると，

F(yh+λ(χk−χih)) +F(yt)≤F(yt+λ(χk−χih)) +F(yh) となる．この2つの不等式を合わせると，

F(yh+λ(χk−χih))−F(yh)≤F( ˜x)−F( ˜x−λ(χk−χih))<0 (4.13) となる．最後の不等式は，ih∈supp⁻( ˜x−yt)⊆supp⁻( ˜x−y_∗)と式(4.10)による。この式

(4.13)は，式(4.12)に矛盾する． [Claim 1の証明終わり]

Claim 2: h= 1,2, . . . , tについて，λh>0であればF(y_∗+λh(χk−χih))< F(y_∗)が成り立つ．

[Claim 2の証明] h∈ {1,2, . . . , t},λh>0とする．補題4.33のi=kの場合を考えると，

F(y_∗+λh(χk−χih)) +F(yh−1)≤F(yh) +F(y_∗) となり，

F(y_∗+λh(χk−χih))−F(y_∗)≤F(yh)−F(yh−1)<0

が成り立つ．なお、最後の不等式は式(4.11)による． [Claim 2の証明終わり] 不等式(4.9)とF の凸性を用いると，

F(y_∗+β(χk−χi))≥F(y_∗) (任意のβ ≥1, i∈N に対して)

が成り立つ．従ってClaim 2より任意のh = 1,2, . . . , tに対してλh<1が言えて，Claim 1 と合わせると，目的の不等式

x(k)−y_∗(k) = ˜x(k)−y0(k) =

∑t h=1

λh< t≤n−1 の成り立つことがわかる．

定理 4.32(i)を証明する準備が整った．y_∗ が(GMC) の最小解である，つまり F(y_∗) = min{F(y)|y∈Zⁿ}を満たすとする．任意のk∈N に対して不等式

F(y_∗−χi+χk)≥F(y_∗) (任意のi∈N に対して), (4.14) F(y_∗−χk+χj)≥F(y_∗) (任意のj∈N に対して) (4.15)

が成り立つ．

まずargmin_RF ̸=∅を仮定し，γ = min{F(x)|x∈Rⁿ}とする．このとき，level(F, γ) = argmin_RF となる．x˜ ∈ Rⁿ を level(F, γ) のすべてのベクトルの中で，∥x˜ −y_∗∥1 の値を最小化するものと仮定する．式 (4.14) と補題 4.34(i) より，任意の k ∈ N に対して

x(k)−y_∗(k) < n−1 となる．同様に，式 (4.15)と補題4.34(ii) より，任意のk ∈ N に対して x(k)˜ −y_∗(k) > −(n −1) となる．これより，x˜ ∈ level(F, γ) = argmin_RF は

∥x˜−y_∗∥∞< n−1を満たすことがわかる．

argmin_RF ̸=∅を示せば証明が完了する．このために，次の性質

level(F, γ)̸=∅を満たす任意のγ ∈Rに対して，

あるx∈level(F, γ)が存在して，∥x−y_∗∥∞≤n−1を満たす (4.16) に着目する．実際、x˜ ∈dom_RF をlevel(F, γ)のベクトルの中で，∥x˜−y_∗∥1の値を最小化するものとすると、補題4.34 (i)と式(4.14)より任意のk∈N に対してx(k)˜ −y_∗(k)< n−1となり、同様に，補題4.34 (ii)と式(4.15)より任意のk∈Nに対してx(k)˜ −y_∗(k)>−(n−1) となるので、式(4.16)が成り立つことがわかる．

式(4.16)の性質から，

inf{F(x)|x∈dom_RF, ∥x−y_∗∥∞≤n−1}= inf{F(x)|x∈dom_RF}, argmin{F(x)|x∈dom_RF, ∥x−y_∗∥∞≤n−1} ⊆argmin_RF

が成り立つことがわかる．また、

argmin{F(x)|x∈dom_RF,∥x−y_∗∥_∞≤n−1} ̸=∅

が成り立つ．なぜなら，F は閉真凸関数であり，{x∈dom_RF | ∥x−y_∗∥∞≤n−1}は有界かつ閉集合だからである．ゆえに，argmin_RF ̸=∅となる．

定理4.32 (ii)の証明

定理4.32 (i)と(ii)は、近接の方向がいわば逆方向の関係にある。そこで(ii)の証明には，

先に証明した(i)に摂動を適用する．x_∗∈Rⁿ^を(GMC)の最適解とする．y_∗ ∈Zⁿ^を(GMC) の最適解のうち，∥x_∗−y_∗∥1の値を最小にするものとする．正の数δを用いて，新しい問題 (GMC^δ)を

(GMC^δ) Minimize F(y) +δ∥y−x_∗∥1 subject to y∈Zⁿ

と定義する．関数δ∥y−x_∗∥1はyについての分離凸関数であるので，F(y) +δ∥y−x_∗∥1は yについての閉真M凸関数である．なぜなら、分離凸関数との和はM凸性を保存するからである [62, 定理 6.49]．x_∗が(GMC^δ)の連続緩和問題の唯一の最適解であることは容易にわかる．さらに，δが十分に小さい正の数であれば，y_∗は(GMC^δ)の最適解である．ゆえに，定理4.32(i)を(GMC^δ)と連続緩和問題に適用すると，∥x_∗−y_∗∥∞< n−1が得られる．

注意 4.2. 定理 4.32 より，閉真 M 凸関数 F が argmin_RF ̸= ∅ を満たすためには， argmin{F(y) | y ∈ Zⁿ} ̸= ∅ の成り立つことが必要十分である．しかし，F が M 凸関

数ではない一般の場合，argmin_RF ̸=∅とargmin{F(y)|y∈Zⁿ} ̸=∅ の2つの条件は，次に示す2つの例のように，必要条件でも十分条件でもない．

1つめの例として、F :R²→R∪ {+∞}を F(x1, x2) =





(2x2−1)²

x1+ 1 (x1≥0かつ0≤x2≤1のとき), +∞ (その他)

と定義された閉真凸関数とする．argmin_RF ={(x1,0.5)|x1∈R, x1≥0} ̸=∅ となる．一方，任意の整数ベクトルy= (y1, y2)∈Z²についてF(y)>0であり、さらにinf{F(y)|y∈ Z²}= inf{1/(y1+ 1)|y1∈Z+}= 0である．このことからargmin{F(y)|y∈Z²}=∅となることがわかる．

2つめの例として，G:R²→R∪ {+∞}^を G(x1, x2) =

{ 1/(x1+ 1) (x1≥0かつx2=√

2·x1のとき),

+∞ (その他)

と定義された閉真凸関数とする．(0,0)は関数Gが有限値をとる唯一の整数ベクトルであるので，argmin{G(y)|y∈Z²}={(0,0)}^{となる．一方，任意の}x∈R²^についてG(x)>0であり，infG= inf{1/(x1+ 1)|x1≥0}= 0となる．このことからargmin_RG=∅となることがわかる．

ドキュメント内離散凸最適化のアルゴリズムとソフトウェアの研究 (ページ 98-102)