• 検索結果がありません。

確率伝搬法と量子系の平均場理論 田中和之

N/A
N/A
Protected

Academic year: 2021

シェア "確率伝搬法と量子系の平均場理論 田中和之"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

科研費特定領域研究「情報統計力学の深化と展開」平成

18

年度研究成果発表会

確率伝搬法と量子系の平均場理論

田中和之

1

東北大学大学院情報科学研究科応用情報科学専攻 宮城県仙台市青葉区荒巻字青葉

6-3-09

1 はじめに

確率モデルを用いた情報処理は画像処理, 誤り訂正符号,移動体通信から確率推論まで様々に拡がりつ つあり, 確率的情報処理として定着しつつある

[1, 2, 3, 4, 5].

近年,この確率的情報処理に統計力学がアル ゴリズム化とその性能の解析を中心に大きな役割を果たし,情報統計力学として急速な深化を始めつつある

[6, 7, 8].

情報統計力学における展開のブランチの一つとして確率伝搬法を用いた近似アルゴリズムがあげられる.

確率伝搬法は人工知能における確率推論アルゴリズムのひとつとして提案されたものである

[9].

その後, り訂正符号における高性能の復号方式である

Turbo

符号,低密度パリティ検査符号等とのアルゴリズムと しての構造の等価性から注目を浴びることとなる

[10].

そして統計力学における平均場理論との数理構造の 類似性が指摘されるにいたり,情報工学,統計力学,統計科学,数理工学等の各分野の研究者を巻き込んで新 たなる確率的情報処理の近似アルゴリズムの提案に向けて動き出しつつある

[11, 12, 13].

平均場理論のひ とつとして材料物性科学において長い歴史をもつもののひとつにクラスター変分法がある

[14, 15, 16].

率伝搬法がこのクラスター変分法を用いることで一般化された確率伝搬法へと拡張されることが指摘され たことは特に大きな発展ということができる

[12, 13, 17].

情報統計力学の次なる目標の一つは量子力学的概念を確率的情報処理に本質的意味において導入するこ とである

[20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30].

確率的情報処理への統計力学的アプローチの本質はた くさんの構成要素が関連しながら集まることで生み出される数理構造の本質を理解し,如何にうまく取り扱 うかにある. 量子力学的概念を確率的情報処理に持ち込む以上,量子力学的状態を伴うたくさんの基本構成 要素の間に相互作用を伴う物理モデル,すなわち量子力学的に拡張された相関を伴う確率モデルに対する計 算アルゴリズムの提案が避けては通れない課題のひとつとなる. そこで,まず考えたい研究テーマのひとつ に,確率的情報処理において大きな成功をおさめた確率伝搬法がはたして量子力学的に拡張された確率的情 報処理にどの程度の範囲で転用できるのかがある.

既に述べたとおり確率伝搬法は平均場理論, 特にクラスター変分法と数理的構造において深い関係があ

[12, 13, 17].

統計力学において

20

世紀半ばからこの平均場理論とクラスター変分法は多くの量子力学的

概念に基づいて構成された物理モデルに対して用いられている

[18].

確率的情報処理に量子力学的概念を持 ち込むことにより構成された物理モデルに対して,平均場理論やクラスター変分法を応用することは, これ までの情報統計力学の成功を考えるとごく自然なことである. その出発点として,まず従来の確率伝搬法を そのまま適用することの困難さがどこにあるのか? 量子力学を持ち込むことにより,従来の確率伝搬法で行 われていた操作のどの部分が安易に行ってはならない操作になるのか? そして量子力学的に拡張された確 率モデルに対する平均場理論,クラスター変分法からどのような確率伝搬法のアルゴリズムが定式化される のか? を確認しておく必要がある.

本稿では統計力学における量子力学的に拡張された確率モデル,すなわち量子系のクラスター変分法の 量子系に対する定式化を与え, 従来の確率伝搬法の定式化との比較を与える.

2

節では

1

次元鎖としてつ ながったグラフ上の簡単な量子系の定義を与え, 2次元格子上の確率モデルに写像されることを示すことで, 一見, 確率モデルの量子力学的拡張が従来の確率伝搬法を単純に適用できるわけではないことを説明する.

3

節では量子系に対するクラスター変分法について説明する.

4

節では量子系に対するクラスター変分 法が量子力学的拡張が行われていない確率モデル

(統計力学でいうところの古典系)

に対してどのような形 で従来の確率伝搬法に帰着されるかについて,その導出の詳細を与える.

5

節はまとめである.

2 1 次元量子系と Suzuki-Trotter 公式

本節では

1

次元鎖上に配置された少数の頂点からなるグラフ上の量子系の統計量が単純に転送行列法す なわち従来の確率伝搬法を用いて厳密に計算することが困難であるかについて説明する.

1

e-mail address: [email protected], webpage URL: http://www.smapip.is.tohoku.ac.jp/˜kazu/

(2)

確率変数

x 1 , x 2 , x 3 , x 4

を考え,それぞれが

0, 1

2

状態をとり,その結合確率分布

(Joint Probability

Destribution)

は以下のように与えられるものとする.

P (x 1 , x 2 , x 3 ) = w 12 (x 1 , x 2 )w 23 (x 2 , x 3 )

x

1

=0,1

x

2

=0,1

x

3

=0,1

w 12 (x 1 , x 2 )w 23 (x 2 , x 3 ) (1)

ここで,

x

3

=0,1

w 12 (x 1 , x 2 )w 23 (x 2 , x 3 ) = w 12 (x 1 , x 2 )

x

3

=0,1

w 23 (x 2 , x 3 ) (2)

という等式が成り立つことから,メッセージを

M 3→2 ( x 2 )

x

3

=0,1

W 23 ( x 2 , x 3 ) , M 1→2 ( x 2 )

x

1

=0,1

W 12 ( x 1 , x 2 ) (3)

と導入すると, たとえば周辺確率分布

(Marginal Probability Distribution) P (x 2 ), P (x 1 , x 2 ), P (x 1 , x 2 )

どは次のように表される.

P(x 2 ) =

x

1

=0,1

x

3

=0,1

P(x 1 , x 2 , x 3 ) = M 3→2 (x 2 )M 3→2 (x 2 )

x

1

=0,1

x

2

=0,1

M 3→2 (x 2 )M 3→2 (x 2 ) (4)

P (x 1 , x 2 ) =

x

3

=0,1

P (x 1 , x 2 , x 3 ) = W 12 (x 1 , x 2 )M 3→2 (x 2 )

x

1

=0,1

x

2

=0,1

W 12 (x 1 , x 2 )M 3→2 (x 2 ) (5)

この計算を更に多くの頂点からなる木構造をもつグラフ表現により与えられる結合確率分布に適用してゆ くものが確率伝搬法であり,更にループを伴うグラフ構造により与えられる結合確率分布にも近似アルゴリ ズムとして拡張されている. その基礎は式

(2)

のような等式が成り立つことにある.

次に式

(1)

の結合確率分布を量子系に拡張することを考えてみよう. たとえば

x i = 0 (i = 1, 2, 3)

x i = 0| ≡

1 0

, x i = 1 (i = 1, 2, 3)

x i = 1| ≡ 0

1

というベクトル表現に形式的に置き換える. 同時

(x 1 , x 2 ), (x 2 , x 3 ), (x 1 , x 2 , x 3 )

という状態は

|x 1 ⊗|x 2 , |x 2 ⊗|x 3 , |x 1 ⊗|x 2 ⊗|x 3

という表現へとそれ ぞれ書き換えられる.

これらのベクトル表現とその直積操作を用いると次の

2 3 ×2 3

の行列

P

が定義される.

P =

x

1

=0,1

x

2

=0,1

x

3

=0,1

w 12 (x 1 , x 2 )w 23 (x 2 , x 3 )(|x 1 ⊗|x 2 ⊗|x 3 )(x 1 |⊗x 2 |⊗x 3 |)

tr

x

1

=0,1

x

2

=0,1

x

3

=0,1

w 12 (x 1 , x 2 )w 23 (x 2 , x 3 )(|x 1 ⊗|x 2 ⊗|x 3 )(x 1 |⊗x 2 |⊗x 3 |) (6)

この行列

P

は非対角成分がすべて

0

であり,対角成分と

P (x 1 , x 2 , x 3 )

が次の関係式で対応している.

P ( x 1 , x 2 , x 3 ) =

x 1 |⊗x 2 |⊗x 3 | P

|x 1 ⊗|x 2 ⊗|x 3

(7)

更に行列

A

に対する指数関数を

exp(A) +∞

n=1

1

n! A n (8)

と定義して導入すると式

(6)

の行列表現は次のように書き換えられる.

P = exp

E tr exp

E (9)

E E 12 + E 23 (10)

(3)

E 12

z

1

=0,1

z

2

=0,1

z

3

=0,1

z

1

=0,1

z

2

=0,1

z

3

=0,1

lnw 12 (z 1 , z 2 )

δ z

1

,z

1

δ z

2

,z

2

δ z

3

,z

3

|z 1 ⊗|z 2 ⊗|z 3

z 1 |⊗z 2 |⊗z 3 | (11)

E 23

z

1

=0,1

z

2

=0,1

z

3

=0,1

z

1

=0,1

z

2

=0,1

z

3

=0,1

ln w 23 ( z 2 , z 3 )

δ z

1

,z

1

δ z

2

,z

2

δ z

3

,z

3

|z 1 ⊗|z 2 ⊗|z 3

z 1 |⊗z 2 |⊗z 3 | (12)

ここまでは単に結合確率分布

P (x 1 , x 2 , x 3 )

を新たに

2 3

2 3

列の行列による表現に書き換えたに過ぎ ない. 次にこの行列表現に量子効果を加えた場合を説明する. 関数

u 12 (x 1 , x 2 , x 1 , x 2 ), u 23 (x 2 , x 3 , x 2 , x 3 )

新たに導入する.

(10)-(12)

E

の代わりに次の式で定義される

2 3

2 3

列の行列

H

を考える.

H H 12 + H 23 (13)

H 12

z

1

=0,1

z

2

=0,1

z

3

=0,1

z

1

=0,1

z

2

=0,1

z

3

=0,1

u 12 (z 1 , z 2 , z 1 , z 2 z

3

,z

3

|z 1 ⊗|z 2 ⊗|z 3

z 1 |⊗z 2 |⊗z 3 | (14)

H 12

z

1

=0,1

z

2

=0,1

z

3

=0,1

z

1

=0,1

z

2

=0,1

z

3

=0,1

u 23 (z 2 , z 3 , z 2 , z 3 z

1

,z

1

|z 1 ⊗|z 2 ⊗|z 3

z 1 |⊗z 2 |⊗z 3 | (15)

この行列

H

から

2 3

2 3

列の行列

Q

を次のように定義する.

Q = exp(−H)

tr exp(−H) (16)

(13)-(16)

で定義される行列

Q

は量子統計力学では密度行列

(Dencity Matrix)

と呼ばれる. 一般に

密度行列により表される量子力学に基づく体系を総称して量子系と本稿では呼ぶことにする.

密度行列

Q

は非対角項が非零の値を持つことがあるため

tr exp

H 12 H 23

= tr exp

H 12 exp

H 23

(17)

のような等式はもはや一般には成り立たなくなる. 指数関数の定義を用いると

exp

H 12 H 23

= exp

H 12 exp

H 23 +

H 23 H 12 H 12 H 23

+ · · · (18)

という形に

O(1)

の補正項が残ってしまう. そこで通常は

Suzuki-Trotter

公式

(Suzuki-Trotter Formula)

と呼ばれる次の公式が用いられる

[19, 31].

exp 1

n H 12 1

n H 23 n

= exp 1

n H 12 exp

1

n H 23 n

+ O(n −1 ) (n→ + ∞) (19)

この公式を用いると, 例えば式

(16)

の分母

tr exp(−H)

は次のように書き換えられる.

tr exp(−H) = lim

n→+∞ tr exp 1

n H 12 exp

1

n H 23 n

= lim

n→+∞

{a

i,j

|i=1,2, j=1,2,···,n}

a 1,1 | exp( 1

n H 12 ) |a 2,1 a 2,1 | exp( 1

n H 23 ) |a 1,2

× a 1,2 |exp(− 1

n H 12 )|a 2,2 a 2,2 |exp(− 1

n H 23 )|a 1,3

×· · ·

× a 1,n |exp(− 1

n H 23 )|a 2,n a 2,n |exp(− 1

n H 23 )|a 1,1 (20)

(20)

は実は次の量に対応づけられる.

tr exp( −H ) = lim

n→+∞

{x

i,j

|i=1,2, j=1,2,···,n}

n j=1 y=0,1

v 12 ( x 1,j , x 2,j , x 1,j+1 , y ) v 23 ( y, x 3,j , x 2,j+1 , x 3,j+1 )

(21)

(4)

v 12 ( ξ 1 , ξ 2 , η 1 , η 2 )

ξ 1 |⊗ξ 2 | exp( 1

n H 12 )

1 ⊗|η 2

(22) v 232 , ξ 3 , η 2 , η 3 )

ξ 2 |⊗ξ 3 | exp(− 1

n H 34 )

2 ⊗|η 3

(23)

この場合

2 3

2 3

列の行列

exp(− n 1 H 23 )

I⊗exp(− n 1 H 23 )

を対角化することになる. しかし,これが計 算できるのであればそもそも行列

exp(−H 23 H 23 )

の対角化ができることになり,計算量的には何ら代わ らないことになる.

一方,

(21)

における量子系と古典系の対応関係をみると,

(16)

の量子系の統計量の計算は,等式

(16)

から確率変数

x = {x 1,1 , x 2,1 , x 3,1 , x 1,2 , x 2,2 , x 3,2 , · · ·, x 1,n , x 2,n , x 3,n }

に対する結合確率分布

Q(x) =

n j=1 y=0,1

v 12 (x 1,j , x 2,j , x 1,j+1 , y)v 23 (y, x 3,j , x 2,j+1 , x 3,j+1 )

{x

i,j

|i=1,2, j=1,2,···,n}

n j=1 y=0,1

v 12 (x 1,j , x 2,j , x 1,j+1 , y)v 23 (y, x 3,j , x 2,j+1 , x 3,j+1 ) (24)

の分母が

tr exp( −H )

に関係づけられることがわかる. しかしながら,

(24)

で与えられる確率モデルに

対して一般化された確率伝搬法のアルゴリズムを書き下してみるとメッセージが

3

変数の関数になり,メッ セージ更新規則の

1

回の計算量は

2 3

通りの状態の和を含むこととなる. つまり計算量的にはもともとの量 子系を計算するのと手間が変わらないことになる.

本節では

3

個の確率変数

x 1 , x 2 , x 3

からなる結合確率分布

P (x 1 , x 2 , x 3 )

から出発し,それを量子系の 密度行列

Q

に拡張した場合を例にあげ,何故,古典系に対する確率伝搬法

(すなわち統計力学で言うところ

の転送行列法)をそのまま量子系に適用することが困難である理由を説明した. この状況は木構造をもつグ ラフ表現上で与えられた量子系一般に言えることなのである.

3 量子系のクラスター変分法

N

個の頂点

1 , 2 , · · ·, N

を考え,そのうちいくつかの頂点間が線分により結ばれているグラフを考える.

線分により結ばれた頂点対を隣接頂点対と呼ぶことにする. 頂点

i

と頂点

j

が線分により結ばれるとき, の隣接頂点対を

ij

という記号により表すことにする. すべての頂点からなる集合を

Ω = {1, 2, · · ·, N},

べての隣接頂点対からなる集合を

B

によりそれぞれ表す. 各頂点

i

には

|0 ≡

1 0

|1 ≡ 0

1

という

2

つのベクトル表現により与えられた状態のいずれかをとるものとする. この状態をもとに

2 N

2 N

列の 行列

H

を以下のように導入する.

H

ij∈B

H ij (25)

H ij

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

u ij (z i , z j , z i , z j )

× N

k=1

δ i,k + δ j,k + (1 δ i,k δ j,kz

k

,z

k

×

|z 1 ⊗|z 2 ⊗· · ·⊗|z N

z 1 |⊗z 2 |⊗· · ·⊗z N |

(26)

行列

H

から

2 N

2 N

列の試行行列

R

に対する量

F [R] = trR

H + lnR

(27)

を導入すると

arg max R

F[R] trR = 1

= Q (28)

Q exp( −H )

tr exp(−H) (29)

(5)

という等式が得られる. 量子統計力学において

H

はハミルトニアン,

Q

は密度行列,

F [ Q ] = ln

tr exp( −H )

は自由エネルギーに対応するものである.

密度行列

Q

に対する縮約密度行列

(Reduced Density Matrix) Q i tr \i Q , Q ij tr \ij Q

を以下のよ うに導入する.

x i |Q i |y i = x i |tr \i Q|y i

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

N k=1

δ i,k δ z

k

,x

k

δ z

k

,y

k

+ (1 δ i,kz

k

,z

k

×

z 1 |⊗z 2 |⊗· · ·⊗z N | Q

|z 1 ⊗|z 2 ⊗· · ·⊗|z N

(30) x i |⊗x j |

Q ij

|y i ⊗|y j

=

x i |⊗x j | tr \ij Q

|y i ⊗|y j

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

N k=1

i,k + δ j,kz

k

,x

k

δ z

k

,y

k

+ (1 δ i,k δ j,kz

k

,z

k

×

z 1 |⊗z 2 |⊗· · ·⊗z N | Q

|z 1 ⊗|z 2 ⊗· · ·⊗|z N

(31)

これらの縮約密度行列を与えられた

Q

から厳密に計算するためには

2 N

2 N

列の行列の対角化を行 う必要があり,その計算量は

N

とともに指数関数的に増大してしまう. 本節の以後の部分では与えられた

Q

からその縮約密度行列

Q i

および

Q ij

を求める近似アルゴリズムをクラスター変分法の立場から与える.

(26)

2 N

2 N

列の行列

H ij

z 1 |⊗z 2 |⊗· · ·⊗z N | H ij

|z 1 ⊗|z 2 ⊗· · ·⊗|z N

z k = z k ( k = i, j )

に対してのみ非零の値をもち,その値は

z i , z j , z i , z j

のみに依存する関数であることを考慮すると 次の

2

2

列の行列表現に書き換えることができる.

H ij

z

i

=0,1

z

j

=0,1

u ij (z i , z j , z i , z j )

|z i ⊗|z j

z i |⊗z j |

(32)

この表現と式

(31)

および式

(30)

を用いると式

(27)

F[Q]

F[Q] =

ij∈B

trQ ij H ij + trQlnQ (33)

と書き換えられる.

(33)

の右辺の第

2

項の

S[Q] ≡ −trQlnQ

は量子統計力学におけるエントロピーに対応するが,クラ スター変分法ではこれを式

(31)

および式

(30)

Q i , Q ij

を用いて次のように近似される.

S[Q] ≡ −trQlnQ

i∈Ω

trQ i lnQ i

ij∈B

trQ ij lnQ ij trQ i lnQ i trQ j lnQ j

(34)

すなわち,

(33)

F[Q]

の近似量として次の式で定義される

F Bethe

{Q i , Q ij }

を考える.

F Bethe

{Q i , Q ij }

ij∈B

trQ ij H ij +

i∈Ω

trQ i lnQ i +

ij∈B

trQ ij lnQ ij trQ i lnQ i trQ j lnQ j (35)

(31)

および式

(30)

Q i , Q ij

は以下の等式が成り立つことが要請される.

Q i = tr \i Q ij , Q j = tr \j Q ij , trQ ij = 1, trQ i = 1 (36)

ここで記号

tr \i Q ij

および

tr \j Q ij

は具体的には次のように定義される.

x i |tr \i Q ij |y i

z

i

=0,1

z

j

=0,1

z

i

=0,1

z

j

=0,1

δ z

i

,x

i

δ z

i

,y

i

δ z

j

,z

j

z i |⊗z j | Q ij

|z i ⊗|z j

(37)

x j | tr \j Q ij |y j

z

i

=0,1

z

j

=0,1

z

i

=0,1

z

j

=0,1

δ z

i

,z

i

δ z

j

,x

j

δ z

j

,y

j

z i |⊗z j | Q ij

|z i ⊗|z j

(38)

(6)

クラスター変分法では式

(36)

を拘束条件として式

(35)

F Bethe

{Q i , Q ij }

を最小化するように決定 された

Q i , Q ij

を式

(31)

および式

(30)

Q i , Q ij

に対する近似として計算される.

{ Q i , Q ij } = arg min

{ Q

i

, Q

ij

}

F Bethe

{Q i , Q ij } Q i = tr \j Q ij , Q j = tr \i Q ij , trQ ij = 1, trQ i = 1 (i∈Ω, ij∈B)

(39)

(36)

の拘束条件に対してラグランジュの未定乗数

L ij,i , L ij,j , λ ij , λ i

を次のように導入する.

L Bethe

{Q i , Q ij }

ij∈B

trQ ij H ij +

i∈Ω

trQ i lnQ i +

ij∈B

trQ ij lnQ ij trQ i lnQ i trQ j lnQ j

+

ij∈B

tr L ij,i

Q i tr \i Q ij

+ tr L ij,j

Q j tr \j Q ij

+

i∈Ω

λ i

tr Q i 1

+

ij∈B

λ ij

tr Q ij 1

(40)

(40)

の極値条件を求めることにより

Q i

Q ij

は次のように与えられる.

Q i = exp

1

|c

i

|−1

k∈c

i

L ik,i

tr exp 1

|c

i

|−1

k∈c

i

L ik,i

(i∈Ω) (41)

Q ij = exp

H ij + L ij,i ⊗I + I⊗L ij,j

tr exp

H ij + L ij,i ⊗I + I⊗L ij,j ( ij∈B ) (42)

(41)

および式

(42)

{L ij,i , L ij,j |ij∈B}

に対して

L ij,i =

k∈c

i

\{j}

C k→i , L ij,i =

k∈c

i

\{j}

C k→i (43)

という形で

{C i→j , C j→i |ij∈B}

への変数変換を考える. これにより式

(41)

および式

(42)

は次のような表 式に書き換えられる.

Q i =

exp

k∈c

i

C k→i

tr exp

k∈c

i

C k→i ( i∈ Ω) (44)

Q ij = exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j

tr exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j

( ij ∈B ) (45)

最後に式

(42)

と式

(45)

を式

(36)

の第

1

式および第

2

式に代入することにより

{C i→j , C j→i |ij∈B}

対する決定方程式が導かれる.

exp

k∈c

i

C k→i

tr exp

k∈c

i

C k→i

=

tr \j exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j

tr exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j

( ij∈B ) (46)

(7)

exp

k∈c

j

C k→j

tr exp

k∈c

j

C k→j =

tr \i exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j

tr exp

H ij +

k∈c

i

\{j}

C k→i ⊗I +

k∈c

j

\{i}

I⊗C k→j (ij∈B) (47)

2

2

列の行列

{C i→j , C j→i |ij ∈B}

は量子系における有効場

(Effective Field)

と呼ばれる量である.

4 確率伝搬法と量子系のクラスター変分法

本節では量子系におけるクラスター変分法が従来の確率モデル

(グラフィカルモデル)

に対してどのよ うにして確率伝搬法に帰着されるかについて概説する. 従来の確率モデルは一般に量子系の特別の場合とし て与えられることができる. すなわち, 従来の確率伝搬法は量子系に対するクラスター変分法の特別な場合 として与えられる.

(26)

u ij (z i , z j , z i , z j )

u ij (z i , z j , z i , z j ) ≡ −δ z

i

,z

i

δ z

j

,z

j

lnw(z i , z j ) (48)

により定義すると式

(25)-(26)

で定義される

2 N

2 N

列の行列

H

の非対角成分はすべて

0

となってしま う. すなわち式

(29)

Q

も非対角成分はすべて

0

となってしまう. 行列

H

と行列

Q

の対角成分は

x 1 |⊗x 2 |⊗· · ·⊗x N | Q

|x 1 ⊗|x 2 ⊗· · ·⊗|x N

= ij∈B

w ij (x i , x j )

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1 ij∈B

w ij (z i , z j ) (49)

により与えられる. すなわち,この場合には密度行列

Q

が頂点集合

Ω

と隣接頂点対

B

により定義された グラフ上で確率変数

{x 1 , x 2 , · · ·, x N }

の確率分布

P(x 1 , x 2 , · · ·, x N ) = ij∈B

w ij ( x i , x j )

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1 ij∈B

w ij (z i , z j ) (50)

により与えられた確率モデル

(グラフィカルモデル)

に帰着されることを意味している.

x 1 |⊗x 2 |⊗· · ·⊗x N | Q

|x 1 ⊗|x 2 ⊗· · ·⊗|x N

= P ( x 1 , x 2 , · · ·, x N ) (51)

縮約密度行列

Q i tr \i Q, Q ij tr \ij Q

もその定義である式

(30)

および式

(31)

からやはり非対角成 分はすべて

0

である. 縮約密度行列の対角成分

x i |Q i |x i

および

x i |⊗x i |

Q ij |x i ⊗|x j

は式

(50)

の確 率分布

P (x 1 , x 2 , · · ·, x N )

の周辺確率分布

P i (x i )

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

δ x

i

,z

i

P (z 1 , z 2 , · · ·, z N ) (52)

P ij (x i , x j )

z

1

=0,1

z

2

=0,1

· · ·

z

N

=0,1

δ x

i

,z

i

δ x

j

,z

j

P (z 1 , z 2 , · · ·, z N ) (53)

にそれぞれ等しくなる.

x i |Q i |x i = P i (x i ) (54) x i |⊗x i |

Q ij |x i ⊗|x j = P ij (x i , x j ) (55)

(36)

の拘束条件の中で

Q i = tr \i Q ij , Q j = tr \j Q ij

の両辺の非対角成分については両辺とも

0

とな り, 自動的に成り立つことから対角成分のみの等式が拘束条件として意味を持つ. なので

x i |C i→j |y i = δ x

i

,y

i

lnM i→j (x i ) (56)

(8)

x i | Q i |y i = δ x

i

,y

i

Q i ( x i ) (57) x i |⊗x j | Q i

|y i ⊗|y j

= δ x

i

,y

i

δ x

j

,y

j

Q i (x i , x j ) (58)

という表現として与えられ,

(44)-(46)

は以下の形に帰着される.

Q i ( x i ) =

k∈c

i

M k→i ( x i )

z

i

=0,1

k∈c

i

M k→i ( z i ) ( i∈ Ω) (59)

Q ij (x i , x j ) = k∈c

i

\{j}

M k→i (x i )

w ij (x i , x j )

k∈c

j

\{i}

M k→j (x j )

z

i

=0,1

z

j

=0,1 k∈c

i

\{j}

M k→i ( z i )

w ij ( z i , z j )

k∈c

j

\{i}

M k→j ( z j )

(ij∈B) (60)

M j→i (x i )

z

i

=0,1

k∈c

i

M k→i (z i ) =

z

j

=0,1

w i,j ( x i , z j )

k∈c

j

\{i}

M k→j ( z j )

z

i

=0,1

z

j

=0,1 k∈c

i

\{j}

M k→i (z i )

w ij (z i , z j )

k∈c

j

\{i}

M k→j (z j )

(ij∈B) (61)

M i→j (x j )

z

j

=0,1

k∈c

j

M k→i (z j ) =

z

i

=0,1

w i,j (z i , x j )

k∈c

i

\{j}

M k→j (z i )

z

i

=0,1

z

j

=0,1 k∈c

i

\{j}

M k→i (z i )

w ij (z i , z j )

k∈c

j

\{i}

M k→j (z j )

(ij ∈B) (62)

更に

i→j (x j ), μ j→i (x i )|ij ∈B}

μ i→j (x i ) M i→j (x j )

z

j

=0,1

M i→j (z j ) , μ j→j (x j ) M j→i (x i )

z

i

=0,1

M j→i (z i ) (63)

により導入すると,

(59)-(62)

は以下の様な表式に帰着される.

Q i ( x i ) =

k∈c

i

μ k→i (x i )

z

i

=0,1

k∈c

i

μ k→i (z i )

( i∈ Ω) (64)

Q ij (x i , x j ) = k∈c

i

\{j}

μ k→i (x i )

w ij (x i , x j )

k∈c

j

\{i}

μ k→j (x j )

z

i

=0,1

z

j

=0,1 k∈c

i

\{j}

μ k→i ( z i )

w ij ( z i , z j )

k∈c

j

\{i}

μ k→j ( z j )

(ij ∈B) (65)

μ j→i ( x i ) =

z

j

=0,1

w i,j (x i , z j )

k∈c

j

\{i}

μ k→j (z j )

z

i

=0,1

z

j

=0,1

w i,j ( z i , z j )

k∈c

j

\{i}

μ k→j ( z j ) ( ij∈B ) (66)

(9)

μ i→j (x j ) =

z

i

=0,1

w i,j (z i , x j )

k∈c

i

\{j}

μ k→j (z i )

z

i

=0,1

z

j

=0,1

w i,j (z i , z j )

k∈c

i

\{j}

μ k→j (z i ) (ij∈B) (67)

(64)-(67)

はにより決定される

Q i (x i )

Q ij (x i , x j )

は式

(50)

の確率分布

P(x 1 , x 2 , · · ·, x N )

の周辺確率 分布

P i ( x i )

および

P ij ( x i , x j )

に対する確率伝搬法による近似値

(グラフが 1

次元鎖または木である場合は 厳密解)になる.

5 まとめ

本稿では統計力学における量子力学的に拡張された確率モデル,すなわち量子系が古典系と比べてどの ように難しくなるかを説明し,更にクラスター変分法の量子系に対する定式化を与えた. 更に,量子力学的 拡張が行われる前の確率モデル

(いわゆる古典系)

に対して, この量子系に対するクラスター変分法からど のようにして従来の確率伝搬法が導かれるかの導出の詳細も説明した.

今後はこれらのクラスター変分法の量子系を視野に入れた定式化を具体的な確率的情報処理の個別の問 題へと適用する試みが進められてゆくことが想定される. そのなかで個別の問題に内在する難しさに応じて 具体的な量子情報統計力学としての近似アルゴリズムとして作り込まれることにより,クラスター変分法が 更に洗練されたものとして深化して行くことが期待される.

謝辞

本研究の一部は文部科学省科学研究費補助金

(No.17500134, No.18079002)

の補助を得て行われたもの である.

References

[1] B. J. Frey: Graphical Models for Machine Learning and Digital Communication, MIT Press, Cam- bridge, 1998.

[2] M. I. Jordan (eds): Learning in Graphical Models, MIT Press, Cambridge, 1999.

[3] F. V. Jensen: Bayesian Networks and Decision Graphs (Statistics for Engineering and Information Science), Springer-Verlag, 2001.

[4]

渡辺澄夫,萩原克幸,赤穂昭太郎,本村陽一,福水健次,岡田真人,青柳美輝: 「学習システムの理論と実 現」, 森北出版, 2005.

[5]

繁桝算男,植野真臣,本村陽一: ベイジアンネットワーク概説,培風館, 2006.

[6]

西森秀稔: 「スピングラス理論と情報統計力学」, 岩波書店, 1999.

[7] H. Nishimori: Statistical Physics of Spin Glasses and Information Processing: An Introduction, Oxford University Press, Oxford, 2001.

[8]

田中和之編著: 臨時別冊・数理科学

SGC

ライブラリ「確率的情報処理と統計力学

—様々なアプローチ

とそのチュートリアル」,サイエンス社,2006.

[9] J. Pearl: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan Kaufmann, 1988.

[10]

岡育生編: 「小特集/ターボ符号・LDPC符号と繰り返し復号の理論」, 電子情報通信学会誌, vol.88,

no.4, pp.243-265, 2005.

[11] M. Opper and D. Saad (eds): Advanced Mean Field Methods — Theory and Practice —, MIT Press, 2001.

[12]

汪金芳,田栗正章,手塚集,樺島祥介,上田修功: 「統計科学のフロンティア/計算統計

I —確率計算の

新しい手法」,岩波書店, 2003.

(10)

[13]

田中和之著: 確率モデルによる画像処理技術入門, 森北出版, 2006.

[14]

小口武彦: 磁性体の統計理論,裳華房, 1970.

[15]

守田徹: 新しい物性

(石原明,

和達三樹編),

2

章 フラストレートした磁性体の統計力学, 共立出版,

1990.

[16]

菊池良一,毛利哲雄: クラスター変分法 材料物性論への応用,森北出版, 1997.

[17] J. S. Yedidia, W. T. Freeman and Y. Weiss: Constructing free-energy approximations and generalized belief propagation algorithms, IEEE Transactions on Information Theory, vol.51, no.7, pp.2282-2312, 2005.

[18] T. Morita: Cluster variation method of cooperative phenomena and its generalization II. Quantum Statistics, Journal of the Physical Society of Japan, vol.12, no.10, pp.1060-1063, 1957.

[19]

宮下精二: 熱・統計力学,培風館, 1993.

[20] H. Nishimori and Y. Nonomura: Quantum effects in neural networks, Journal of the Physical Society of Japan, vol.65, no.12, pp.3780-3796, 1996.

[21]

田中和之,堀口剛: 画像修復に対する量子統計力学的反復計算法,電子情報通信学会論文誌

(A), vol.J80- A, no.12, pp.2117-2126, 1997; translated in Electronics and Communications in Japan, Part 3:

Fundamental Electronic Science, Vol.83, No.3, pp.84-94, 2000.

[22] T. Kadowaki and H. Nishimori: Quantum annealing in the transverse Ising model, Physical Review E, vol.58, no.5, pp.5355-5363, 1998.

[23]

田中和之: 量子力学的に拡張されたライン場をもつ結合ガウス・マルコフ確率場モデルを用いた画像修 復,電子情報通信学会論文誌

(D-II), vol.J84-D-II, no.4, pp.737-743, 2001.

[24] J. Inoue: Application of the quantum spin glass theory to image restoration, Physical Review E, vol.63, no.4, article no.046114, pp.1-10, 2001.

[25] H. Nishimori and P. Sollich: Error counting in a quantum error-correcting code and the ground-state energy of a spin glass, Journal of the Physical Society of Japan, vol.73, no.10, pp.2701-2707, 2004.

[26] K. Takeda and H. Nishimori: Self-dual random-plaquette gauge model and the quantum toric code, Nuclear Physics B, vol.686, no.3, pp.377-396, 2004.

[27] S. Suzuki and M. Okada: Residual energies after slow quantum annealing, Journal of the Physical Society of Japan, vol.74, no.6, pp.1649-1652, 2005.

[28]

西森秀稔: 量子情報処理と統計力学

(リレー連載/確率的情報処理と統計力学 ―様々なアプローチとそ

のチュートリアル

10),

数理科学, no.510, pp.77-83, 2005.

[29] S. Morita and H. Nishimori: Convergence theorems for quantum annealing, Journal of Physics A, vol.39, no.45, pp.13903-13920, 2006.

[30] A. Das and B. K. Chakrabarti (eds): Quantum Annealing and Related Optimization Methods, Series: Lecture Notes in Physics, vol. 679, Springer-Heidelberg, 2005.

[31]

大貫義郎,鈴木増雄,柏太郎: 経路積分の方法,岩波書店, 2000.

参照

関連したドキュメント

Veeramani, “On existence of equilibrium pair for constrained generalized games,” Fixed Point Theory and Applications, vol.. Veeramani, “On best proximity pair theorems and

[文献] Ballarino, Gabriele and Fabrizio Bernardi, 2016, “The Intergenerational Transmission of Inequality and Education in Fourteen Countries: A Comparison,” Fabrizio Bernardi

III.2 Polynomial majorants and minorants for the Heaviside indicator function 78 III.3 Polynomial majorants and minorants for the stop-loss function 79 III.4 The

191 IV.5.1 Analytical structure of the stop-loss ordered minimal distribution 191 IV.5.2 Comparisons with the Chebyshev-Markov extremal random variables 194 IV.5.3 Small

administrative behaviors and the usefulness of knowledge and skills after completing the Japanese Nursing Association’s certified nursing administration course and 2) to clarify

プライマリセル(PCell:Primary  Cell) *18 または PSCell(Primary SCell) *19

On figures 2 and 6, the minimum, maximum and two of the intermediate free energies discussed in subsections 3.5 and 6.5 are shown for sinusoidal and exponential histories with n =

The dynamic nature of our drawing algorithm relies on the fact that at any time, a free port on any vertex may safely be connected to a free port of any other vertex without