近似アルゴリズム

6 数値実験 35

6.3 近似アルゴリズム

DBCの通信路容量域を求める問題において、その目的関数 C^(µ)(W₁, W₂)≜ max

p∈P(W1,W2){µI_p(X;Y|U) +I_p(Z;U)}

はp(u, x) =p(u)p(x|u)のp(x|u)を固定すると、p(u)について上に凸な関数を目的関数とする凸最適化問題となる。実際、µIp(X;Y|U) +Ip(Z;U)について

µI_p(X;Y|U) +I_p(Z;U) =X

p(u)

µ (X

x,y

p(x|u)W₁(y|x) log W₁(y|x) p(y|u)

)

p(z|u) log p(z|u) p(z)

上式の第一項 X

p(u)

µ (X

x,y

p(x|u)W₁(y|x) log W₁(y|x) P

xp(x|u)W₁(y|x) )#

はp(u)に線形な関数である。また、

p(u)

p(z|u) log p(z|u) p(z)

p(u)X

{p(z|u) [logp(z|u)−logp(z)]}

p(u)X

x,z

p(x|u)(W₁W₂)(z|x)

logX

p(x|u)(W₁W₂)(z|x)−logX

u,x

p(u)p(x|u)(W₁W₂)(z|x)

上式の第一項はp(u)について線形な関数、第二項はp(u)について上に凸な関数である。

以上から、µI_p(X;Y|U) +I_p(Z;U)はp(x|u)を固定することで、凸関数となっていることがわかる。したがって、C^(µ)(W₁, W₂)を数値的に求める問題は凸関数を目的関数とした凸最適化問題になることがわかる。

前節の総当たりアルゴリズムは、2元、3元の場合において妥当な結果を得ることができていると考えられる。しかし、その計算量は交互最大化アルゴリズムと比べて非常に大きなものとなっている。以下では、p(x|u)についての総当たりとp(u)についての交互最大化を組み合わせた近似アルゴリズムについて記述する。

DBCにおいて、境界の領域を与える最適な分布をq^∗(u, x) = q^∗(u)q^∗(x|u)とする。以

第 6 章数値実験 41 下ではq(x|u)をq^∗(x|u)に固定し、W₀(x|u)と表記する。

F(pU, qU) =µI(X;Y|U) +I(U;Z) +D(qZ||pZ)−D(qU||pU)

q(u) (

µX

x,y

q^∗(x|u)W₁(y|x) logW₁(y|x) q^∗(y|u) +X

q^∗(z|u) log q^∗(z|u) q(z)

q^∗(z|u) logq(z) p(z)

)

−X

q(u) logq(u) p(u)

q(u) (

µX

x,y

W₀(x|u)W₁(y|x) log W₁(y|x) P

xW₀(x|u)W₁(y|x)

x,y,z

W₀(x|u)W₁(y|x)W₂(z|u) log P

x,yW0(x|u)W1(y|x)W2(z|u) p(z)

)

−X

q(u) log q(u) p(u)

q(u) log

exp{A_p_U(u)} · p(u) q(u)

=−X

q(u) log q(u) exp{A_p_U(u)}p(u)

=−X

q(u) log q(u)

K exp{ApU(u)}p(u) + logK

≤logK ここで

A_p_U(u) =µX

x,y

W₀(x|u)W₁(y|x) log W₁(y|x) P

xW0(x|u)W1(y|x)

x,y,z

W₀(x|u)W₁(y|x)W₂(z|u) log P

x,yW₀(x|u)W₁(y|x)W₂(z|u) p(z)

等号条件は

q(u) = 1

K exp{A_p_U(u)}p(u)

D(q_Z||p_Z)≤D(q_U||p_U)より、p_U =q_U のときF(p_U, q_U)は最大値 F(qU, qU) = µI(X;Y|U) +I(Z;U) 分布更新式を

q^[t+1](u) = 1 K_texp

A_q[t](u) q^[t](u)

第 6 章数値実験 42 ここで

K_t=X

exp

A_q[t](u) q^[t](u) 命題 9. t = 0,1,2, . . . に対し、次の不等式が成り立つ。

F(q^[0], q^[0])

(a)≤ F(q^[0], q^[1])

(b)≤ F(q^[1], q^[1])≤. . . .

(a)≤ F(q^[t⁻^1], q^[t])

(b)≤ F(q^[t], q^[t]) (6.1)

(a)≤ F(q^[t], q^[t+1]) (6.2)

(b)≤ F(q^[t+1], q^[t+1])≤. . . .

≤C^(µ)(W₁, W₂)

ここで不等式 (6.1)および式 (6.2)の右辺に現れる量に関してはそれぞれ以下が成り立つ。

F(q^[t], q^[t]) =I_q[t](X;Y|U) +µI_q[t](U;Z) F(q^[t], q^[t+1]) = logK_t

=A_q^[t](u, x) + log q^[t]

q^[t+1]

F(pU, qU)の最適値を与える分布をq^∗(u)とすると C^(µ)(W₁, W₂) = max

pU {µI_p_U(X;Y|U) +I_p_U(U;Z)}

=F(q^∗, q^∗)

=µI_q∗(X;Y|U) +I_q∗(U;Z) 収束性について次の命題が成り立つ。

命題 10. t = 0,1,2, . . . に対し、以下が成り立つ。

C^(µ)(W1, W2)−F(q^[t], q^[t+1])

=F(q^∗, q^∗)−F(q^[t], q^[t+1])

q^∗(u)

A_q∗(u)−A_q[t](u)

q^∗(u) logq^[t+1](u) q^[t](u)

=−D(q^∗_Z||q_Z^[t]) +D(q^∗_U||q_U^[t])−D(q_U^∗||q^[t+1]_U )

第 6 章数値実験 43 命題2の結果より、次の定理が得られる。

定理 2. Arimoto-Blahutアルゴリズムの定める分布列n q^[t]_U

o+∞ t=0

はt→ +∞のときq_U^∗ に収束する。

証明. 命題2よりt = 0,1,2, . . . について以下が成り立つ。

C(W)−F(q^[t], q^[t+1])≤D(q_U^∗||q_U^[t])−D(q^∗_U||q_U^[t+1]) そこで∆_t=C(W)−F(q^[t], q^[t+1])とおくと、

∆_t≤D(q_U^∗||q_U^[t])−D(q_U^∗||q_U^[t+1]) t= 0,1,2, . . . T について和をとると、

XT t=0

∆t ≤D(q_U^∗||q^[0]_U )−D(q_U^∗||q_U^[T^+1]) (6.3) 命題1より{∆_t}^T_t=0は単調減少列であるから式 (6.3)より、

T∆_T ≤ XT

t=0

∆_t ≤D(q_U^∗||q^[0]_U) これより

0≤∆_t ≤ 1

TD(q_U^∗||q^[0]_U )→0(T →+∞) となり、分布更新アルゴリズムが最適値を与える分布へ収束する。

この近似アルゴリズムは、総当たりアルゴリズムより計算量が少なくなることが期待されたが、3元以降では総当たりアルゴリズムより計算量が大きくなってしまうことがわかった。

6.4 ^{結果の考察}

異なる収束が得られる理由を考察する。µ = 1のときの収束分布q_{U X}^∗ (u, x)を以下に示す

第 6 章数値実験 44

C−1 :





0.106 0.097 0.116 0.091 0.131 0.113 0.137 0.122 0.089



 C−2 :





0.104 0.118 0.125 0.097 0.096 0.130 0.119 0.149 0.063





C−3 :





0.130 0.078 0.132 0.085 0.100 0.114 0.130 0.101 0.131



 C−4 :





0.138 0.106 0.097 0.111 0.132 0.082 0.125 0.136 0.072





C−5 :





0.090 0.104 0.113 0.111 0.101 0.100 0.131 0.119 0.130





図 6.3より、µ= 1のとき、それぞれ同じR1, R2が得られている。つまり、初期分布に関わらず目的関数はR₁ =C(W₁), R₂ = 0へと収束している。しかし、分布は異なる値へと収束している。したがって、R₁ =C(W₁), R₂ = 0を与える最適分布が複数存在していることがわかる。以上より、それぞれの分布は目的関数を交互最大化によって同じ値へと最大化させているが、目的関数上では異なる座標に収束しているのではないかと考えられる。

第 7 ^章

収束の十分条件

安井[5]は、自身の提案したArimoto-Blahut型通信路容量域計算アルゴリズムにおいて、分布列が領域の境界を与える最適分布に収束するための十分条件を得た。次節では、

緩和項を用いた容量域計算アルゴリズムが定める分布列が最適分布に収束するための十分条件を導き、安井の結果と比較を行う。

7.1 ^{凸領域における収束}

f^(α,µ)(q)を以下のように定義する。

f^(α,µ)(q) =F^(α,µ)(q, q)

=µI_q(X;Y|U) +I_q(Z;U)−αD(q_ZY_|_XU||W₁, W₂|q_XU)

−µD(q_Y_|_XU||W₁|q_XU)

f^(α,µ)(q)のk−上位集合を以下のように定義する。

定義 1.

S_k,(α,µ) ≜

q|f^(α,µ)(q)≥k

集合T_k,(α,µ)(˜q)をq(˜∈ S_k,(α,µ))から連続経路で到達できる全てのq(∈ S_k,(α,µ))の集合と定義する。このとき、補題 8を得る。

補題 8. q^[t]∈ S_k,(α,µ)であると仮定する。このときアルゴリズムによりq^[t]から生成され

るq^[t+1]はT_k,(α,µ)(q^[t])に入る。

証明. pをq^[t]で固定したときの目的関数を

F˜_q^(α,µ)[t] (q) = F^(α,µ)(q^[t], q)

第 7 章収束の十分条件 46 とし、そのk−上位集合を

S˜_k,(α,µ) = n

q|F˜_q^(α,µ)[t] (q)≥k o

とする。補題2よりf^(α,µ)(q)≥ F˜_q^(α,µ)_[t] (q)なのでS˜_k,(α,µ) ⊆S_k,(α,µ)である。また、q =q^[t]

であるときf^(α,µ)(q^[t]) = ˜F_q^(α,µ)_[t] (q^[t])となるのでq^[t]∈S˜_k,(α,µ)である。

pを固定するとF^(α,µ)(p, q)はqで上に凸である。したがってS˜_k,(α,µ)は凸集合である。

S˜_k,(α,µ)が凸集合であることより、∀q^′ ∈ S˜_k,(α,µ)とq^[t]を結ぶ線分上の任意の点はS˜_k,(α,µ) に属する。T_k,θ(q^[t])はq^[t](∈ S_k,(α,µ))から連続経路で到達できる全てのq(∈ S_k,(α,µ))の集合なので、S˜_k,(α,µ)⊆T_k,(α,µ)(q^[t])である。

凸関数F˜_q^(α,µ)[t] (q)の最適分布をq^[t+1]とすると、q^[t+1]= arg max ˜F_q^(α,µ)[t] (q^[t])である。そのためF˜^(α,µ)

q^[t] (q^[t+1]) ≥ F˜^(α,µ)

q^[t] (q^[t])≥ kとなり、q^[t+1] ∈ S˜_k,(α,µ)である。したがってq^[t+1] ∈ T_k,(α,µ)(q^[t])となる。

以後、領域T で関数f^(α,µ)(q)が上に凸だと仮定して議論する。

補題 9. 関数f :Rⁿ→ Rが領域T ⊆Rⁿで上に凸であることと、T が凸集合であり、任意のx, y ∈ T に対してf(y)≤ f(x) + (∇f|x)^T(y−x)が成り立つことは同値である。ここで、∇f|xは点xにおけるfの勾配である。

補題 9より命題 11を得る。

命題 11. 関数f^(α,µ)(q)が集合T において上に凸であることと、T が凸集合であり任意の

q_a, q_b ∈T について

µD(q_{a Y}_|_U||q_{b Y}_|_U|q_{a U}) +D(q_{a Z}||q_{b Z})

+αD(q_{a ZY}_|XU||q_{b ZY}_|XU|qa XU)−D(q_{a Z}_|U||q_{b Z|U}|qa U)≥0 (7.1) が成り立つことは同値である。

証明. f^(α,µ)(q)を入力分布について偏微分すると

∂f

∂q(u, x, y, z) = X

u,x,y,z

µlog W₁(y|x)

q_Y_|_U(y|u) + logq_Z_|_U(z|u)

q_Z(z) +αlog W₂(z|y)W₁(y|x) q_ZY_|_XU(z, y|x, u)

−R_s(q)

ここで R_s(q)≜ X

u,x,y,z

( µ q_Y_|_U(y|u) ·

x,zq(u, x, y, z) P

x,y^′,zq(u, x, y^′, z)

!_′

− 1

q_Z_|_U(z|u)· P

x,yq(u, x, y, z) P

x,y,z^′q(u, x, y, z^′)

!_′

+ 1

q_Z(z)· X

u,x,y

q(u, x, y, z)

!_′

+α· 1

q_ZY_|_XU(z, y|x, u)

q(u, x, y, z) P

y^′,z^′q(u, x, y^′, z^′)

!_′)

第 7 章収束の十分条件 47 以上より

u,x,y,z

q_b(u, x, y, z) ∂f

∂q(u, x, y, z)

= X

u,x,y,z

q_b(u, x, y, z)

µlog W₁(y|x)

q_{b Y}_|_U(y|u) + logq_{b Z}_|_U(z|u) q_{b Z}(z)

+αlog W₂(z|y)W₁(y|x) q_{b ZY}_|_XU(z, y|x, u)

− X

u,x,y,z

qb(u, x, y, z)Rs(qb)

=f^(α,µ)(q_b)−R_s(q_b) と

u,x,y,z

qa(u, x, y, z) ∂f

∂q(u, x, y, z)

=f^(α,µ)(qa) +µ X

u,x,y,z

qa(u, x, y, z) log q_{a Y}_|_U(y|u) q_{b Y}_|_U(y|u)

+ X

u,x,y,z

qa(u, x, y, z) log q_{a Z}(z)q_{b Z}_|_U(z|u) q_{b Z}(z)q_{a Z}_|_U(z|u)

+α X

u,x,y,z

qa(u, x, y, z) logq_{a ZY}_|_XU(z, y|x, u)

q_{b ZY}_|_XU(z, y|x, u) −Rs(qb)

が成り立つ。補題 9より

f^(α,µ)(q_a)≤f^(α,µ)(q_b) + X

u,x,y,z

∂f

∂q(u, x, y, z)

q_b(q_a(u, x, y, z)−q_b(u, x, y, z)) したがって

µ X

u,x,y,z

q_a(u, x, y, z) logq_{a Y}_|_U(y|u)

q_{b Y}_|_U(y|u) + X

u,x,y,z

q_a(u, x, y, z) logq_{a Z}(z)q_{b Z}_|_U(z|u) q_{b Z}(z)q_{a Z}_|_U(z|u)

+α X

u,x,y,z

q_a(u, x, y, z) log q_{a ZY}_|_XU(z, y|x, u) q_{b ZY}_|_XU(z, y|x, u)

=µD(q_{a Y}_|_U||q_{b Y}_|_U|q_{a U}) +D(q_{a Z}||q_{b Z}) +αD(q_{a ZY}_|_XU||q_{b ZY}_|_XU|q_{a XU})

−D(q_{a Z}_|_U||q_{b Z}_|_U|q_{a U})≥0 以上より命題11は証明された。

式 (7.1)より、q_a, q_bをq^∗, q^[t]に置き換えれば µD(q_Y^∗_|_U||q_Y^[t]_|_U|q_U^∗) +D(q^∗_Z||q^[t]_Z)

+αD(q_ZY^∗ _|_XU||q_ZY^[t] _|XU|q_XU^∗ )−D(q_Z^∗_|_U||q^[t]_Z|U|q_U^∗)≥0 (7.2)

第 7 章収束の十分条件 48 が得られる。

以上より、緩和項を用いた容量域計算アルゴリズムに対し、領域の境界を与える最適な分布に収束するための十分条件が得られた。

定理 3. 0 ≤ µ≤ 1に対し、q^∗がT_k,(α,µ)(˜q)に存在し、関数f^(α,µ)(q)が領域T_k,(α,µ)(˜q)で上に凸であり、初期分布q^[0] ∈T_k,(α,µ)(˜q)ならば、F^(α,µ)(p, q)はC^(α,µ)(W₁, W₂)に下から収束する。

7.2 ^{十分条件の比較}

q^∗, q^[t]∈ P(W₁, W₂)とすると補題6の証明と同様に f^(α,µ)(q) = µI_q(X;Y|U) +I_q(Z;U)

−αD(q_ZY_|_XU||W₁, W₂|q_XU)−µD(q_Y_|_XU||W₁|q_XU)

=µI_q(X;Y|U) +I_q(Z;U) = f^(µ)(q)

また、式 (7.2)においても以下が成り立つ。

µD(q_Y^∗_|_U||q_Y^[t]_|_U|q_U^∗) +D(q_Z^∗||q_Z^[t])−D(q_Z^∗_|_U||q^[t]_Z_|_U|q_U^∗)≥0 (7.3)

目的関数f^(µ)(q)と式 (7.3)の条件式は、安井の提案したアルゴリズムにおける目的関数

と大域収束のための十分条件に一致している。したがって、式 (7.2)の条件は、緩和項を用いたことによりq^∗, q^[t]∈ P(W1, W2)という制約を満たす必要がないことから、安井の得た大域収束の十分条件より緩いことが期待される。

第 8 ^章結論

本研究では緩和項を用いた容領域計算アルゴリズムに対する数値実験を行った。アルゴリズムの妥当性を検討するために提案した総当たりアルゴリズム、近似アルゴリズムとの比較を行い、アルゴリズムの収束性について考察した。同一の通信路に対して複数の収束が得られた理由について考察を行った。同じ結果を与える複数の最適分布が存在する理由について予想を行ったが、これを証明するためにはさらに厳密な目的関数の解析が必要だと考えられる。また、凸領域において緩和項を用いた容量域計算アルゴリズムが境界を与える最適分布へ収束するための十分条件を導いた。この結果は、安井の得た結果を内包する形となっており、比較した場合に条件が緩い可能性がある。

謝辞

本論文は、電気通信大学大濱靖匡教授ご指導のもと、筆者が在学中に行った研究の成果をまとめたものです。ご多忙を極める中、先生から賜った御教示、御鞭撻に深く感謝致します。また、ゼミや学会でお世話になりました川端勉教授、八木秀樹准教授、サントソ・バグス准教授に心より感謝致します。そして、ともに研究に勤しんだ大濱研究室や関連研究室の学生の皆様方に、感謝申し上げます。

ドキュメント内劣化型放送通信路における緩和項を用いた容量域計算アルゴリズムと収束性 (ページ 42-53)

6 数値実験 35

6.3 近似アルゴリズム

6.4 結果の考察

第 7 章

収束の十分条件

7.1 凸領域における収束

7.2 十分条件の比較

第 8 章 結論

謝辞

6.4 ^{結果の考察}

第 7 ^章

7.1 ^{凸領域における収束}

7.2 ^{十分条件の比較}

第 8 ^章結論