変分ベイズ学習の力学系

5 Conclusions

5.1 変分ベイズ学習の力学系

ベルヌーイ分布側の次元がM = 3である真の分布を以下で与える．

p^∗(x) = 0.8·(

0.9x1·0.1¹⁻x1)

+ 0.2·(

0.1x2·0.9¹⁻x2) この分布をすべてのサンプルの発生確率とともに示したのが図1である．

図1: 真の分布(左)と各サンプルの発生確率．真の分布は白いほど高い確率を表す．また，サンプルについては白が1，黒が0を表す．

ここで真の分布について，上部の棒グラフがその混合比を表し，その下にベルヌーイ分布のパラメータ，すなわち各分布におけるxi(i= 1,2)の発生頻度をグレースケールで表した．ここで白いほど発生確率が高いものとしている．上述の定理から，この分布はa= ³⁺¹₂ = 2に相転移点をもつと考えられる．また，真の分布から発生するデータは，図1右の表にある8つのパターンで，それぞれの確率を表の最右列に示した．

以下の実験では，真の分布からサンプルを直接発生させるのではなく，総サンプル数Nに対して各サンプルの確率の比でそれぞれのデータが発生すると考える．この場合，サンプルによる揺らぎを考慮する必要がなくなるため，変分ベイズ学習のアルゴリズムはハイパーパラメータをもつ力学系と見なすことができる．なお，以下の実験ではN = 10000としている．

前述の8種類のサンプルS_i(i = 1,· · · ,8)の第t成分 S^(t)_i (t= 1,2,3)，S1〜S8のそれぞれの発生確率をP1〜 P8として変分ベイズアルゴリズムを書き換えた力学系は以下にようになる．

VB e-step

logρ_S_i_k = Ψ_α(k)

+ S_i⁽¹⁾Ψ₁(k) + (1−S_i⁽¹⁾)Ψ^′₁(k) + Ψ^′₂(k) + S_i⁽²⁾Ψ1(k) + (1−S_i⁽²⁾)Ψ^′₁(k) + Ψ^′₂(k) + S_i⁽³⁾Ψ1(k) + (1−S_i⁽³⁾)Ψ^′₁(k) + Ψ^′₂(k) rS_ik = ρS_ik

∑4 k=1ρSik

VB m-step

Nk =

∑4

i=1

N PirS_ik, ak=a+Nk

η_1k = b+r_S₁_kN P₁+r_S₂_kN P₂+r_S₃_kN P₃+r_S₄_kN P₄ η_2k = b+r_S₁_kN P₁+r_S₂_kN P₂+r_S₅_kN P₅+r_S₆_kN P₆ η_3k = b+r_S₁_kN P₁+r_S₄_kN P₄+r_S₅_kN P₅+r_S₇_kN P₇ η_1k^′ = b+rS₅kN P5+rS₆kN P6+rS₇kN P7+rS₈kN P8

η_2k^′ = b+rS₃kN P3+rS₄kN P4+rS₇kN P7+rS₈kN P8

η_3k^′ = b+rS₂kN P2+rS₃kN P3+rS₆kN P6+rS₈kN P8

ここで

Ψ_α(k) = ψ(α_k)−ψ ( _K

∑

α_k )

Ψ1(k) = ψ(ηk1)−ψ(η^′_k1) +ψ(η^′_k1)−ψ(ηk1+η^′_k1), Ψ₂(k) = ψ(η_k2)−ψ(η^′_k2) +ψ(η^′_k2)−ψ(η_k2+η^′_k2), Ψ^′₁(k) = ψ(η_k1^′ )−ψ(η_k1+η^′_k1),

Ψ^′₂(k) = ψ(η_k2^′ )−ψ(η_k2+η^′_k2) とした．

5.2 実験結果

学習モデルの混合分布数をK = 4として，上記のアルゴリズムにより学習を行った結果が図2である．ここで横軸，縦軸はそれぞれハイパーパラメータa, bであり，

いずれも0.001〜10まで変化させている(logスケールで表示)．また，図のグレースケールは学習結果の混合比(平均パラメータ)を大きい順に並び替えたπ₁,· · · , π₄ に対してz =|π1−0.8|+|π2−0.2| を算出したものであり，zが0に近い(黒い)ほど冗長な分布を含まず，混合比も含めて真の分布に近い学習結果と考えることができる．この結果から上述の定理が示唆するように，冗長な表現への切り替え（相転移）はa=M^∗ = ³⁺¹₂ = 2 の前後で発生しているが，その値はbに依存していることがわかる．

図2: ハイパーパラメータと混合比の関係．横軸はa，縦 軸はbであり，濃淡はz=|π₁−0.8|+|π₂−0.2|の値を表す．

この様子をさらに図2中の四角で囲った領域で拡大したものが図3上段右の図である．この学習結果は大きく以下の3つの種類に分類することがができる．

• 領域A:コンポーネント数を絞り込み，2つの混合

分布で表現する．．

• 領域B:AからCへの移行過程．

• 領域C:すべてのコンポーネントを用いて分布を表

現する．

この分類にしたがって領域を分け，相図を作成したものが上段左の図である．また，それぞれの領域での学習結果に対する予測分布(平均パラメータによる分布) を下段に示した．この図から，冗長なコンポーネントを除き，

より少ない混合分布数で学習結果を表現する場合にはa を小さくし，bを0.5より大きくとると良いことがわかる．特にb = 0.5からb = 1のときにより冗長な項の混合比が一番低くなっている．また，aが小さい場合でもbを小さく設定すると，コンポーネント数が増える傾向にある．これはベルヌーイ分布側の確率が1または0 近づくような事前分布を与えるハイパーパラメータを設定することで，小さなカテゴリを検出しやすくなるためと考えられる．このようなハイパーパラメータの設定はアンケートやマーケティング解析などの少数意見の抽出に応用することができる[11]．

相図からは，さらにハイパーパラメータを変えた際の予測分布の変化の様子の違いを読み取ることもできる．すなわち，a >2.0の領域でbを大きくした場合，Bのような移行過程領域からAの冗長性のない分布の領域に

向かう途中で，Cの冗長な表現をする領域をb= 0.5付近で通過することになる．一方，a <2.0のような領域では領域Cを跨らずに，直接的に領域Aに向かうことになる．

図4はベルヌーイ分布の次元をM = 2とした場合の真の分布(左)と実験結果である．

図3: 相転移の領域(上段:左),ハイパーパラメータと混合比の関係拡大図(上段:右),各領域での平均パラメータによる学習結果(下段)

この場合も相転移点や前述の領域A,B,Cの位置関係は大きくは変わらず，相図としてはほぼ同じものが得られる．

図 4: M = 2での真の分布(左)とハイパーパラメータと混合比の関係(右)

これらの結果から設定したハイパーパラメータa, bを変更することで抽出するクラスタの粒度やコンポーネント使い方，すなわち，すべてのコンポーネントを使用す

るか/コンポーネントの絞込みを行うかを調整できることがわかった．応用の観点では，これらの相図は混合ベルヌーイ分布をクラスタリングのツールとして用いる場合，目的とする分類粒度に応じて，どのようなハイパーパラメータを設定すべきかの方針を与える図になっていると考えられる．

6 おわりに

変分ベイズ法を用いた混合ベルヌーイ分布の学習におけるハイパーパラメータと学習結果の関係を調べ，M = 2, M = 3の場合の相図を示した．相図は相転移点での挙動に関する多くの情報を与えるだけでなく，応用の立場からもクラスタリングへ利用する際のハイパーパラメータ設定に関する指針を提供する．一方，相転移と変分自由エネルギー，汎化誤差の関係についてはまだ多くのことは分かっておらず，理論的な解明を含め今後の課題である．

参考文献

[1] K. Watanabe and S. Watanabe. Stochastic com-plexities of general mixture models in Varia-tional Bayesian Approximation. Neural Computa-tion, Vol. 18, No. 5, pp.1007-1065, 2006.

[2] S. Nakajima and S. Watanabe. Variational Bayes Solution of Linear Neural Networks and its Gen-eralization Performance.Neural Computation, Vol.

19, No. 4, pp. 1112-1153, 2007.

[3] C. M. Bishop. Pattern Recognition and Machine Learning.Springer, 2006.

[4] S. Watanabe. Algebraic analysis for singular sta-tistical estimation. Proc. of International Jour-nal of AlgorithmicLearningTheory Lecture Notes on Computer Sciences,1720, pp.39-50, 1999.

[5] S. Watanabe. Algebraic Analysis for Noniden-tiﬁable LearningMachines. Neural Computation, Vol.13, No.4, pp.899-933, 2001

[6] S. Watanabe. Learning eﬃciency of redundant neu-ral networksin Bayesian estimation.IEEE Transac-tions on NeuralNetworks , Vol.12, No.6, pp.1475-1486, 2001.

[7] H. Attias. Inferring parameters and structure of latent variable models by variational Bayes, In Proc. of Uncertainty in Artiﬁcial Intelligence(UAI 99),1999.

[8] M. J. Beal. Variational Algorithms for approximate Bayesian inference.PhD thesis, University College London, 2003.

[9] Z. Ghahramani and M. J. Beal. Graphical Models and Variational Methods. InAdvanced Mean Field.

Methods. MIT Press, 2000

[10] P. F. Lazarsfeld and N. W. Henry. Latent struc-ture analysis.Houghton Miﬄin, 1968

[11] D. Kaji and S. Watanabe. Optimal Hyperparam-eters for Generalized Learning and Knowledge Dis-covery in Variational Bayes.To appear in Proc. of ICONIP, 2009

[12] 大山慎史,渡辺澄夫.変分ベイズ学習におけるハイパーパラメータの汎化誤差への影響について.信学技報（NC研究会）, January 2009.

情報論的学習理論テクニカルレポート

領域ベースの隠れ変数を用いた決定論的画像領域分割

三好誠司

^£

岡田真人

^Ý

" #$ %

はじめに

多数の変数とその変数間の無向性相互作用からなる系はマルコフ確率場（）と呼ばれ，画像の確率モデルとして広く利用されている^&'⁽^)*．に基づく画像処理においては，事後分布を用いるベイズ推定がよく用いられる^&(⁾ ^+*．この場合，ベイズの定理が事後分布の式を与えてくれるが，実際の数値計算を行う段階で計算量的困難に直面することが多い．そのようなときに変分法に基づく推論，確率伝搬法，モンテカルロ法など機械学習や統計力学の分野で近年開発された計算手法

&)*が威力を発揮することになる．

とベイズ統計に基づいた画像処理を行う場合，

画像の事前分布を素朴なガウス分布とすると画像中のエッジの表現がどうしても難しくなる．エッジを表現するためには隠れ変数の導入が有効である．たとえば

, らはとにより提案されたベイズ超解像^&-*にエッジを表す隠れ変数を導入することによってすぐれた超解像処理を行うことに成功した^&.*．

画像処理においてエッジを表現するための隠れ変数に

£関西大学システム理工学部大阪府吹田市山手町

丁目番号

! " # $%!

& " ' (

Ý東京大学大学院新領域創成科学研究科 ^)**千葉県柏市柏の葉理化学研究所脳科学総合研究センター埼玉県

和光市広沢⁾ ⁺

,!+ "! !" -$%!

#. #. /0 )** ( 12#3

4!"2 ) 5!. 6 "

(

は境界ベース^&/*と領域ベース^&0^1*の二つの方法がある．境界ベースは画素と画素の間に，そこがエッジであるかどうかを表す隠れ変数を置いてゆく考え方である．

これに対して領域ベースは各画素がどの領域に属するかを示す隠れ変数を画素ごとに貼り付ける方法である．境界ベースの隠れ変数の場合，境界線がなるべく途切れず，

境界線が多くなりすぎず，境界線がクロスすることが起こりにくくなるように多くの拘束条件を設ける必要がある^&/*．これに対して領域ベースの隠れ変数の場合，境界が自然に閉じたループになるなど好ましい性質を多く持つ^&1*．ただし，領域ベースの画像処理は局所解に陥りやすいという欠点があるため，あまり使われていない．

に統計力学的なアプローチを試みる場合，⁽値をとるイジングスピンが変数としてよく用いられる．領域ベースの隠れ変数を用いて画像処理を行う場合，これを値に拡張したポッツスピンを用いることにより表現の自由度があがると期待される．

ところで，画像をある一定の特徴を持つ小領域ごとに分割する問題は領域分割（セグメンテーション）と呼ばれる^&(^'2*．領域分割は画像に含まれる対象物を抽出する手法であると言うことも可能で，その後の画像の認識や理解のための第一次画像処理として重要である．また，

網膜という⁽次元センサーの信号から⁾次元の現実世界を再構成するための第一歩でもあることから視覚の計算論の基礎としても重要である．^"ら^&0*はに領域ベースの隠れ変数を導入し，シミュレーテッドアニーリングを用いたモンテカルロ法により画像領域分割

ドキュメント内 COE SITAIE- ICE IEICE IEICE IEICE IEICE (PRMU) () IEEE Committee Members of IT Society Japan ChapterIEEE Computational Intelligence Society Japan Chap (ページ 104-112)