PDFファイル 3H4OS24b オーガナイズドセッション「OS24 Deep Learning 」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

ープボ

マンマ

ン

動的

ワー

構築手法

関

検

討

A Study on the Dynamic Construction Method of Network for Deep Boltzmann Machine

金盛

克俊

*1

安井

清一

*1

大和田

勇人

*1

KATSUTOSHI KANAMORI SEIICHI YASUI HAYATO OHWADA

*1

東京理科大学理工学部経営工学科

Tokyo University of Science, Faculty of Science and Technology

Deep learning provide a high learning performance, but also has a problem that it takes many time to learn, because of using a complex network. Moreover, finding the best configuration network is not easy, and little attention has been given the methodology. Our purpose is to achieve the dynamic construction method of network for Deep Boltzmann Machine. We propose a method to build a network adaptively and dynamically delete nodes and arcs in Deep Boltzmann Machine. This method is achieved by applying of node delete algorithm and node fusion algorithm. We defined these algorithms, and had the experiment using random data. And, we discussed about the result and future works.

1. じめに

近深層学習ープーニンいうキーワー

多層ニューワー注目集い．ープ

ボマンマン Deep Boltzmann Machine:DBM

[Salakhutdinov 09] 実装一あ．

DBM ，ボマンマン Restricted

Boltzmann Machine: RBM 積構築多層ニュ

ーワーあ．わ，各層ー確率変数

あ，層内確率変数，び，層間確率変数交互作用

含確率生成ー集合

特徴表深層学習あ．入力層観測変数，隠層潜

在変数対応，周辺化ワー教師

学習．，DBM ワー

教師学習行後，ニューワー誤差

逆伝搬法予測識別器構築．こ初教師学

習事前学習呼ば．

DBM 事前学習，DBM 構成各RBM 学習

次行うこ実現さ．RBM 学習用い

RBM 条件付独立性利用 CD Contrastive Divergence

法 [Hinton 02] あ．

，画像認識や音声認識実用的ニュー

ワー通常大規模ワー用い，膨大計算

時間ソー必要あ．必要最小限最適ワー

求こ簡単，方法論い充

議論成さいい．

DropOut [Hinton 12] ーン削除学習

行，複数生成，総合こ過学習

防ベー手法あ，対柔軟，

効率的最適ワー構成求い．

本研究目的，多層ニューワーい

ワー動的構成手法提案，検証行うこ

あ．

本研究ープボマンマンい，事前学習時

ー削除動的行うこ適応的ワー構

築手法提案，影響関検討行う．

こう適応的ワー構成行うこ，事前

学習適ワー自動的構成こ

こ期待さ．

2. 提案手法

本論文提案ワー構成手法，DBM い

事前学習行いワー構造動的更新手法

あ．

本論文，ー統合削除いう2 操作

ワー更新手法提案．ー統合似い

ー同士統合 1 ー操作あ，ー

削除ー関非常小さ他え影

響小さい考えワー取除操作あ

．

こう操作適行わこ，要ー

削除さ，後行わ誤差逆伝搬等ニューワー

学習計算時間短縮や高い精度得ニュー

ワー自動構成実現期待さ．

DBM 多層ニューワーあ，可視層

ー入力変数対応，最層出力対応

本手法以外層いー削減行うこ

適ワー構成手法あ．

2.1 ノード統合

ここ可視層最層以外層い同層存在

ー間距離定義，距離近い類似役

割持ー統合操作定義．

，同層存在ー , 間距離 , 次

う定義．

, =| − |+∑ | − |+∑ | − |

，ーあ，ー，間

ーあ．こ距離，値や同ー

差絶対値総和あ．値同

連絡先：金盛克俊，東京理科大学理工学部経営工学科，千葉

県田市山崎2641，[email protected]

(2)

- 2 -

あ距離小さ，他ー関わ同あ

ー間距離小さいえ．

次，2 ー対統合ー定義．ー ,

統合新いー間ー , 間同層挿

入さ，間値和

え．

ー , 対統合ー

∗, ∗ 以う定義さ．

= +

∗= ∗+ ∗

∗ = ∗ + ∗

2.2 ノード削除

ー削除，事前学習後値各値

あ程度0 近いーいワー取除操作

あ．全 0 あう仮想的ー

考え，あー削除さやさ , 表こ

．

2.3 アゴズム

本論文提案ゴ，事前学習行い

ー統合削除行うゴあ．DBM RBM 積

構成さ多層ニューワーあ，

RBM 列表現こ．

ここ DBM [� , � , ⋯ , � ] 表こ．

DBM 性質，� 隠層 � + 可視層い

．

提案手法ゴ以通あ．

1) =

2) � � + い CD法用い RBM 学習行

う．

3) � 隠層 � + 可視層あ各ー

い，仮想ー距離 , 計算，均

．

4) � 隠層 � + 可視層あ各ー

い，

( , ) < ⁄�ℎ

あば，こ層ー取除．，�ℎ 閾値

ーあ．

5) � 隠層 � + 可視層あ各ー全

組合わ , 調，

, < ⁄�ℎ

あばー , 取除，統合ー挿入．

6) = + ， < あば2. 戻

3. 実験

提案手法動作確認，簡単 DBM 用い実験

行う．ここ Figure 示う 3層 DBM 用い．

ここ用い入力層 6次元，最層 2次元 DBM

あ，中間 10個ー持層 1 存在い．図

，ー線太さ絶対値大さ表，

正あば赤線，負あば青線表現さい．Figure

1 初期状態，ー値全 0 い

，本研究開発こ視覚化ー値

ー大さ変わ．こ例実験結果確認．

こワー用い通常 CD法用い DBM 学習

後ワー，提案手法適用後ワー状

態比較．

実験用ーニンー，入力次元 6次元合わ

ンー生成え．

Figure 2 提案手法用い，ー数変更い

学習行わ結果あ．ー大さ値大

さ表い．ーい，強化さ

こや値変化確認．

Figure 3 提案手法適用結果あ．ゴ

ー th 値 1.5 ．ー削除 1

度，ー統合 2度行わ，第2層ー 10個 7

個減い．

提案手法ー削減こ，こ元

ワー性質損いい検証，学習後

各ワーい，最層値え可視層

期待値求比較．

Figure 1

：初期状態のネットワーク

(3)

- 3 -

Figure 2 ワー結果表2 通あ．

表1：既存手法結果

最層可視層

[0,0] [0.60, 0.63, 0.50, 0.43, 0.54, 0.13] [0,1] [0.59, 0.63, 0.50, 0.43, 0.54, 0.14] [1,0] [0.60, 0.63, 0.50, 0.44, 0.54, 0.14] [1,1] [0.60, 0.63, 0.50, 0.44, 0.54, 0.15]

同様，Figure 3 ワー結果表3 通

あ．

表2：提案手法結果

最層可視層

[0,0] [0.64, 0.66, 0.51, 0.45, 0.56, 0.13] [0,1] [0.63, 0.65, 0.51, 0.46, 0.55, 0.15] [1,0] [0.63, 0.65, 0.51, 0.46, 0.55, 0.14] [1,1] [0.62, 0.65, 0.51, 0.46, 0.55, 0.16]

ワー見目構造大変わい関わ

，検証結果傾向失いい結果．

4. 結論

ープボマンマン最適ワー自動構

築，事前学習時適応的ー統合，削除手法

提案．実験結果こ手法実際ー削除

さ関わ，ワー再現能力関

変わいこ示．

要ー削除こニューワー学習

計算時間削減や，精度向考え

本論文実験用いワー極小さ単純

あ，ーい実用的いいい．

今後大規模ワー適用や，実用的問題

対検討行う必要あ．

参考文献

[Hinton 02] Hinton, G. E.: Training products of experts by minimizing contrastive divergence, Neural Computation, Vol. 8, No. 14, pp. 1771-1800 (2002).

[Hinton 12] Hinton, G. E., Srivastava, N., Krizhevsky, A., Sutskever, I., and Salakhutdinov, R. R. : Improving neural networks by preventing co-adaptation of feature detectors, arXiv preprint arXiv, 1207.0580 (2012)

[Salakhutdinov 09] Salakhutdinov, R. R., and Hinton, G. E. : Deep Boltzmann Machines : Proceedings of the 12th International Conference on Artificial Intelligence and Statistics, pp. 448-455 (2009)