CCCP アルゴリズム - CCPD アルゴリズム - BNPD アルゴリズムと CCPD アルゴリズム 15

第 2 章 BNPD アルゴリズムと CCPD アルゴリズム 15

2.4 CCPD アルゴリズム

2.4.1 CCCP アルゴリズム

まず，Bethe自由エネルギーと concave-convex procedure (CCCP) について述べる (Yuille [72], Yuille ら[73])．確率伝播法はタナーグラフに短い閉路が多数存在すると収束しない場合があるが，CCCPはたとえタナーグラフに短い閉路が存在したとしても収束が保証されているアルゴリズムである．

2.3節で提案した BNPDアルゴリズムはタナーグラフが短い閉路を多数持つとき，確率伝播法を適用することはできない．しかし，本節で述べる「CCCPアルゴリズム」はタナーグラフに短い閉路が存在しても用いることができ，これはBethe自由エネルギーFB(q)を最小化する方法である．Yedidia [70] は確率伝播法で求めた事後確率の Bethe 自由エネルギーの勾配が 0，すなわち，∇FB(q) =0 であることを示している．

したがって，タナーグラフに閉路がないとき Bethe自由エネルギーを最小にする belief q がちょうど事後確率に対応している．閉路があると

きは Bethe自由エネルギーを最小にするbelief と真の事後確率との偏り

が存在する．しかし，∇F_B(q) =0 かつF_B(q) ができるだけ小さくなるような q を見つけることにより事後確率の近似値を得ることができる．

Bethe 自由エネルギーの定義

マルコフネットワークを定義し，その上で Bethe自由エネルギーを定義する．I を無向グラフの頂点の集合とする．任意のi∈I に対して，有限個の値をとる確率変数 W_i を考え，W = (W_i)_i_∈_I，Y をW の部分ベクトルとし，Y は観測されているとする．i, j ∈I に対して，Wi とWj

が条件付独立となるような V ⊂ {W1, W2, . . . , W_|_I_|} \ {Wi, Wj}^が存在しないとき，iとj が辺で結ばれているグラフをマルコフネットワークと呼ぶ．マルコフネットワークの辺集合をT とする．

さらに，Wi の値をwi，観測ベクトルをyで表す．W の事前確率が次のように与えられていると仮定する．

P(W =w|Y =y) =K ∏

(i,j)∈T

ψ_ij(w_i, w_j)∏

i∈I

ψ_i(w_i). (2.9)

ただし，w= (w_i)_i_∈_I である．ψ_i(w_i) とψ_ij(w_i, w_j) はポテンシャルと呼ばれ，K は正規化定数である．ここで，yは固定されているので式 (2.9) の値は w_i のみによっており，y_i を省略して ψ_i(w_i) が1 変数関数であることを強調しているが，ψ_i(w_i)はw_i とy_i の関数であることに注意する．

T は I×I の部分集合である．

このとき q=((

qi(wi))

i∈I,wi∈Wi,(

qij(wi, wj))

(i,j)∈T ,(wi,wj)∈Wi×Wj

)

とする．ただし，制約条件

∑

wi∈Wi

qi(wi) = 1 (i∈I),

∑

(wi,wj)∈Wi×Wj

q_ij(w_i, w_j) = 1 ((i, j)∈T),

∑

wi∈Wi

q_ij(w_i, w_j) =q_j(w_j) forw_j ∈ Wj ((i, j)∈T),

∑

wj∈Wj

q_ij(w_i, w_j) =q_i(w_i) forw_i ∈ Wi ((i, j)∈T).

を満たしているとする．このとき，Bethe 自由エネルギーは F_B(q) = ∑

(i,j)∈T

∑

(wi,wj)∈Wi×Wj

q_ij(w_i, w_j) log q_ij(w_i, w_j) ϕij(wi, wj)

−∑

i∈I

(|N(i)| −1) ∑

wi∈Wi

qi(wi) log q_i(w_i) ψi(wi)

(2.10)

と定義される．ただし，ϕij(wi, wj) =ψij(wi, wj)ψi(wi)ψj(wj)である．また，ψ(wi, wj) = 0のときqij(wi, wj) = 0，ψi(wi) = 0のとき qi(wi) = 0 と仮定する．

Bethe 自由エネルギーの最小化

CCCPはBethe自由エネルギーをある線形の制約条件のもとで最小に

する q を得るための方法である(Yuille [72])．CCCPはShibuya ら[56]

により，LDPC 符号の復号アルゴリズムにも応用されている．

CCCPでは次の自由エネルギーの最小化問題を考える．

最小化問題. q = (q1, . . . , qN) とし，F(q) が下に有界なエネルギー関数でF(q) = F_vex(q) +F_cave(q) と表されるとする．ただし，F_vex(q) =

∑_N

i=1q_ilog(q_i/ψ_i) と F_cave(q) をそれぞれ q の下に凸と上に凸な関数とする．L個の線形な制約条件a_ℓ·q=b_ℓ (ℓ= 1, . . . , L) のもとでF(q) の最小化を考える．ただし，a_ℓ = (a_ℓ1, . . . , a_ℓN) でb_ℓ は定数である．

条件付最小化問題において，更新式q^(t⁻¹⁾ 7→q^(t) は{α_ℓ}^とq^(t⁻¹⁾ が得られたもとでq^(t) をF(q^(t)) を最小にするように選ぶので

∇Fvex(q^(t)) =−∇Fcave(q^(t⁻¹⁾)−

∑L ℓ=1

αℓaℓ

を満たすように与えられる．ただし，初期値q⁽⁰⁾ は考える問題に依存して決定されるべきであり，得られる事後確率の推定値はこの初期値に依存している．この更新式を用いると F(q) は単調に減少し∇F_B(q) =0 を満たす q に収束する．α_ℓ (ℓ= 1, . . . , L) はℓ 番目の線形な制約条件に対するラグランジュ乗数であり，a_ℓ·q^(t)=b_ℓ を保証するように選ばれる．

CCCP アルゴリズム (Yuille [72])

更新式は q^(t) について下に凸なエネルギー関数

F^(t)(q^(t)) =q^(t)·h+

∑N i=1

q^(t)_i logq_i^(t) ψ_i +

∑L ℓ=1

α_ℓ(a_ℓ·q^(t)−b_ℓ)

を最小化することに対応する．ただし，h=∇Fcave(q^(t⁻¹⁾) である．ラグランジュ乗数のベクトル α= (α1, . . . , αL) 対し

q^(t)_i (α) =ψie⁻^(1+hⁱ⁾

∏L ℓ=1

e⁻^α^ℓ^a^ℓi (2.11)

を満たす q^(t)(α) = (q₁^(t)(α), . . . , q^(t)_N(α)) はF^(t)(q^(t)) を最小にする．このとき，α は双対エネルギー

Fˆ^(t)(α) =−

∑N i=1

q_i^(t)(α)−

∑L ℓ=1

α_ℓb_ℓ. (2.12)

を最大にする α である．

CCCP アルゴリズムは2 重のloop からなるアルゴリズムである．つまり，outer loop では式 (2.11) を計算し，inner loop では式 (2.12) の Fˆ^(t)(α) を最大にするα の値を計算する．また，以下の命題が成り立つ．

命題 3 (Yuille [72]). CCCPアルゴリズムは ∇F_B(q) =0 を満たす q に収束する．さらに確率伝播法が収束するとき，この q は確率伝播法により求めた周辺事後確率と一致する．

ドキュメント内グループテストにもとづく事後確率の近似計算アルゴリズム (ページ 45-48)