• 検索結果がありません。

複合ネットワーク形成処理

ドキュメント内 時系列情報処理に関する研究 (ページ 64-67)

第 2 章 パルスニューラルネットワークにおけるネットワーク拡張型強化学習則 11

3.3 学習アルゴリズム

3.3.3 複合ネットワーク形成処理

複合ネットワーク形成処理においては、ある時間幅のあいだに発火したH1層のニュー ロンの集合から、出力層ニューロンへと繋がるようにH2層のニューロンを追加する。

これにより、次にこれらのH1層ニューロン群が同じような時間幅で発火した場合、そ れに応じてH2層のニューロンが発火し、この時の入力列に対応した出力が発生する。

単純ネットワーク形成処理で作成されたH1層のニューロンは、ある瞬間の入力集 合を一つの状態として認識し、出力を与えるものである。これに対し複合ネットワー ク形成処理で生成されるH2層ニューロンは、時系列的な入力集合を一つの状態とし て認識し、出力を与えるものとなる。

この処理ではまず、正の強化信号に対する寄与がもっとも少ないH2層ニューロン nH2k を一定時間ごとに選び出す。そして、図3.5に示すように、ニューロンnHk2が発火

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

Input (pulse sequence)

Input Layer

Output Layer

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

Second Hidden Layer (H2)

Output (pulse sequence)

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

First Hidden Layer (H1)

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

X n

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

recently fired neuron the neuron

to be created other neuron H1

j

n

H2k

図 3.4 単純ネットワーク形成処理

Fig. 3.4 Simple network generation process.

するのに必要なそれよりもわずかに多いH1層ニューロンからのパルスを受けて発火 するような、新しいH2層ニューロンnHn2を作成する。正の強化信号に対する寄与が 最も少ない、すなわち学習がうまくいっていないニューロンは、部分観測問題におけ

る曖昧な(不完全知覚)状態を表現している可能性が高い。そこで、より過去の入力情

報を加味して出力を伝搬するような新しい素子を作る。

具体的には、全てのH2層ニューロンについて予め定めた時間間隔ρ毎に、任意の評 価式、たとえば

Ak(t) = Pk(t) (3.11)

を適用する。ここで、Pk(t)は3.3.6にて述べる内部強化信号生成量である。そして、

nH2k = min

nH2m ∈NH2Am(t) (3.12) なるようなニューロンnHk2にマーキングを行う。

マーキングされたニューロンnHk2が発火した際には、nHk2に対して結合を持たない H1層ニューロンの中で最も遅く発火したニューロン、すなわち

nHj 1 = max

nH1m ∈NH1−U(nH2k )Rm(t) (3.13) なるニューロンnHj 1を求める。ここで、

Rj(t)≥θjB (3.14)

でない場合には以下の処理は無視し、次のnHk2の発火を待つ。

次に、

U(nH2n ) =U(nH2k ) +nHj 1 (3.15) を満たすようなH2層ニューロンnHn2が存在するかどうかを調べる。このようなニュー ロンが存在しなかった場合に限り、以下の処理を実行し、nHk2のマーキングを消去する。

式(3.15)を満たすnHn2が存在しなかった場合、これを満たすようなH2層ニューロン nH2n を作成する。nHn2は、U(nHk2) +nHj 1の全要素から結合を受け、NOの全要素に対 して結合を与える。ここで、H1層ニューロン集合{U(nHk2) +nHj 1}に対するインデッ クスmが、Rm(t)が昇順に並ぶようにソートされているものとすると、

wmn =w0·m/S(U(nH2k ) +nHj 1)

p<m

p=1

wpn·(1−dn)(log1−dp(Rp(t))−log1−dp(Rm(t))) (3.16)

として初期結合荷重を設定する。

これにより、次に同じタイミングで入力層ニューロン群が発火した場合、あるいは 類似したタイミングで発火した場合に、それに応じてnH2n が発火し、出力が与えられ ることとなる。

例として、この学習処理の後で全く同じタイミングでニューロン群{U(nH2k ) +nH1j } が発火した場合を考える。m番目のニューロンからの出力パルスがnH2n に届く時刻を tmとすると、tmにおけるnHn2の内部状態In(tm)は、m−1番目のニューロンからの 出力の到達時刻tm−1を用いて、

In(tm) =In(tm−1)·(1−dn)tm−tm−1 +wmn (3.17) と表せる。ここで、m > 1の範囲において、

tm−tm−1 = log1−dm−1(Rm−1(t))log1−dm(Rm(t)) (3.18) であるので、式(3.16)を用いると、

In(tm) =w0·m/S(U(nHk2) +nHj 1) (3.19) となる。t1の直前におけるnH2n の内部状態を0と仮定すると、式(3.19)はm = 1につ いても成り立つ。式(3.19)より、時刻tS(U(nH2k )+nH1j )より前の時刻においてnHn2が発火 することはなく、逆に、時刻tS(U(nH2k )+nH1j )においては必ず発火する。つまり、nH2n は 学習時と同じ入力列が完結した時に限って発火することとなる。

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

Input (pulse sequence)

Input Layer

Output Layer

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123 1234567890123

Second Hidden Layer (H2)

Output (pulse sequence)

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

First Hidden Layer (H1)

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234 12345678901234

recently fired neuron the neuron to be created other neuron

n

jH1

U( ) n

nH2

n

kH2

n

kH2

図 3.5 複合ネットワーク形成処理

Fig. 3.5 Complex network generation process.

ドキュメント内 時系列情報処理に関する研究 (ページ 64-67)