• 検索結果がありません。

-オンライン文字認識を対象として-

N/A
N/A
Protected

Academic year: 2021

シェア "-オンライン文字認識を対象として-"

Copied!
74
0
0

読み込み中.... (全文を見る)

全文

(1)

2004 年度卒業論文

全結合リカレントネットの応用可能性 についての考察

-オンライン文字認識を対象として-

提出日 :2005 年 2 月 2 日

指導 : 山名早人助教授

早稲田大学理工学部情報学科 学籍番号 : 1G01P028-5

糟谷 勇児

(2)

概要

本研究では、全結合リカレントネットを用いた筆跡からの文字認識について報告する。

リカレントネットとはフィードバック結合を持つニューラルネットであり、全結合リカレ ントネットは、入力層へのフィードバックを除くあらゆる結合を許したモデルである。全 結合リカレントネットは、脳のモデルとして信頼を得ており、これを応用すれば人工知能 等の分野に貢献できると考えられる。しかし全結合リカレントネットを応用した研究は少 なく、パラメータの設定法や時系列認識における性能などの応用に関する情報が十分に得 られていない。そこで本研究では、全結合リカレントネットを用いたオンライン文字認識 システムを通して、全結合リカレントネットの応用可能性および応用上の注意点を探るこ とを目的とする。オンライン文字認識というタスクを選択したのは、文字認識という課題 が誰にでもわかりやすく、適度に複雑なので全結合リカレントネットの性能を評価するタ スクとして適しているからである。

筆者の提案する文字認識システムでは、数字0~9の筆跡を学習させた全結合リカレント ネットを用いて、ユーザの入力した筆跡から書かれた数字を判定する。この認識システム を東京農工大学中川研究室オンライン手書きデータベース「TUAT Nakagawa Lab.

HANDS– kuchibue_d-97-06-10」の数字データ300個によって評価したところ、最大認

識率が 91%となる性能を示した。また全結合リカレントネットの様々な学習法やパラメー

タについて、認識率や学習時間の面から実験・評価を行い、これらの設定法に関する考察 を行った。特に全結合リカレントネットの学習法であるBPTT(Back Propagation Through Time)に慣性項を用いることにより、学習を高速化できることを実験データから示した。

これらの成果に加えて本研究では、全結合リカレントネットを並列に用いた場合と単一 に用いた場合の認識性能の差や、同じタスクをパーセプトロンを用いて行った場合の認識 性能など、多角的に全結合リカレントネットの応用可能性についての考察を行った。

これらの実験の結果から、全結合リカレントネットが時系列認識に対して優れた応用可 能性を持つことを示した。また全結合リカレントネットを応用する上で重要となる様々な 情報を示した。

(3)

目次

1. はじめに...4

2. 関連研究...6

222 2....1111 ニューラルネットニューラルネットニューラルネットニューラルネットとはとはとはとは...6

222 2...2.222 ニューラルネットニューラルネットニューラルネットニューラルネットののモデルののモデルモデルとモデルととと学習法学習法学習法学習法...6

2.2.1 マカロックとピッツのモデル...6

2.2.2 パーセプトロン...8

2.2.3 パーセプトロンとパターン認識...10

2.2.4 パーセプトロンの学習...11

2.2.5 慣性項を用いたバックプロパゲーションの改善手法...15

222 2....3333 リカレントネットリカレントネットリカレントネットリカレントネットとはとはとはとは...17

222 2...4.444 リカレントネットリカレントネットリカレントネットリカレントネットのののの研究研究の研究研究ののの歴史歴史歴史歴史とととと現状現状現状現状...18

222 2...5.555 オンラインオンライン文字認識オンラインオンライン文字認識文字認識文字認識とはとはとはとは...20

222 2....6666 関連研究関連研究関連研究のまとめ関連研究のまとめのまとめのまとめ...21

3.リカレントネットのアルゴリズム...23

333 3...1.111 離散時間離散時間リカレントネット離散時間離散時間リカレントネットリカレントネットのリカレントネットのののダイナミクスダイナミクスダイナミクスダイナミクス...23

333 3...2.222 離散時間離散時間リカレントネット離散時間離散時間リカレントネットリカレントネットリカレントネットののの学習の学習学習学習...24

3.2.1 RTRL(Real Time Recurrent Learning)[25]による学習...25

3.2.2 BPTT(Back Propagation Through Time)[27]による学習...27

333 3....3333 連続時間連続時間連続時間連続時間リカレントネットリカレントネットリカレントネットリカレントネット...29

3.3.1 Hodgikin Huxleyのモデル[5]...29

3.3.2 連続型リカレントネットのダイナミクスと学習[3] ...31

4.リカレントネットを用いたオンライン文字認識システム...34

444 4....1111 全結合リカレントネット全結合全結合全結合リカレントネットリカレントネットのリカレントネットのののオンラインオンライン文字認識オンラインオンライン文字認識文字認識文字認識システムシステムシステムへのシステムへの応用へのへの応用応用応用のののの意義意義意義意義....34

444 4...2.222 文字認識文字認識システム文字認識文字認識システムシステムのシステムののの概要概要概要...35 概要 444 4....3333 システムのシステムシステムシステムののインターフェースのインターフェースインターフェースインターフェース...37

444 4....4444 リカレントネット リカレントネットリカレントネットのリカレントネットののの構成構成構成構成...39

4.4.1 リカレントネットへの入力...39

4.4.2 リカレントネットの出力...42

4.4.3 リカレントネットの学習...45

4.4.4 学習マスク関数の設定...46

444 4...5.555 リカレントネットリカレントネットのリカレントネットリカレントネットののの並列化並列化並列化並列化...47

5.実験...49

555 5...1.111 実験項目実験項目とその実験項目実験項目とそのとそのとその方法方法方法...49 方法 555 5...2.222学習法学習法学習法学習法にに関にに関関関するするするする実験実験実験実験...50

(4)

5.2.1 各学習法における重み更新時間の比較...50

5.2.2 慣性項を用いたBPTTと通常のBPTTの比較...52

555 5....3333 パラメータパラメータパラメータパラメータ設定設定に設定設定にに関に関関関するするするする実験実験実験実験...55

5.3.1 学習マスク関数の設定...56

5.3.2 隠れ層ニューロンの数に関する実験...58

5.3.3 サンプルの種類とサンプル数に関する実験...59

555 5...4.444 リカレントネットリカレントネットのリカレントネットリカレントネットののの並列化並列化並列化並列化...61

555 5...5.555 パーセプトロンパーセプトロンとのパーセプトロンパーセプトロンとのとの比較との比較比較比較...64

555 5....6666 実験 実験実験のまとめ実験のまとめのまとめのまとめ...66

6.まとめ...67

666 6....1111 まとめまとめまとめまとめ...67

666 6....2222 考察考察考察考察...67

666 6...3.333 今後今後の今後今後のの目標の目標目標目標...68

参考文献...69

(5)

1. はじめに

人間や他の生物の脳には、ニューロンと呼ばれる神経細胞を、シナプスと呼ばれる結合 でつないだ神経回路網が存在する。ニューラルネットとは、この脳の中の神経回路網を、

コンピュータ上や電子回路上でモデル化したものである。ニューラルネットは脳のモデル として完全とはいえないが、ニューラルネットを用いることでコンピュータでは難しい認 識や制御などの様々なタスクを行うことが可能であることが知られている。ニューラルネ ットに関する研究は1940年代に始まり、1990年代には俗にニューロブームとも呼ばれる 盛り上がりを見せた。しかしその後、目立って新しい改良がなされず、ニューラルネット 研究は沈静化してきた感がある。そして近年、ニューラルネット研究に再び注目が集まり つつある。この理由として

・ 近年計算機の性能が爆発的に増大し、ほぼリアルタイムでニューラルネットの学習が出 来るようになってきたこと

・ ロボット市場の拡大や、高性能なゲーム機の登場によってエンターテイメントの分野で は学習機械としてのニューラルネットに、期待が集まっていること

・ 近年、脳の研究が盛んに行われるようになり、人間の脳に関する様々な発見がなされて いること

等 が あ げ ら れ る 。 特 に 脳 研 究 の 分 野 で 、 ニ ュ ー ラ ル ネ ッ ト が 果 た す 役 割 は 大 き い [5][9][23][33]。

このようなニューラルネットの現状において、ニューラルネットの応用に関する研究を 行うことは重要である。この理由として

(1)応用研究はロボットやゲームなどのより高度な応用への足がかりとなること

(2)応用研究はどのような分野の研究者や、あるいは一般人にとっても目で見てわか りやすく、議論しやすいものであること

等が挙げられる。特に(2)は生物学、物理学、心理学など様々な分野をまたいだニュー ラルネット研究においては、重要である。

現在応用の分野で最も研究されているニューラルネットは、パーセプトロンとリカレン トネットである。パーセプトロンはニューロンを層状に結合したモデルであり、リカレン トネットはフィードバック結合を持つニューラルネットである。パーセプトロンは数学的 取り扱いが容易であり、学習が短時間で行えるため、様々な分野に応用されている。ただ し脳のモデルとして考えたときに、フィードバック結合がないなどの問題があり、実際の 脳を正しく表しているとは言いがたい。そこで脳のモデル化の研究では、リカレントネッ トが主に用いられている[9][33]。またパーセプトロンは時系列データの処理に向いていな いと考えられており、時系列処理の分野ではリカレントネットの応用研究も多数発表され、

成果を残している[4][8][13][28][31][33]。

(6)

リカレントネットには層状のモデルと、全結合のモデルがある。層状のリカレントネッ トはパーセプトロンにフィードバック結合を追加したモデルであり、様々な応用に用いら れている。一方、全結合のリカレントネットは入力層へのフィードバックを除くあらゆる 結合を考慮したモデルであり、しばしば脳のモデル化の分野において用いられている。し かし、全結合のリカレントネットを用いた応用研究は少数であり、しかも応用研究の多く はタスクが専門分野に特化されすぎていて一般性がない。そのため認識や予測などのタス クにどの程度の性能を発揮するのか、パラメータをどのように設定すると性能が向上する のか等の、応用に関する情報が十分に得られていない。全結合リカレントネットは層状リ カレントネットと比較して、より生物の脳に近いモデルであり、人工知能の分野への応用 が期待できるなど、様々な可能性を秘めている。これらの可能性を引き出すためには、よ り一般的で分かりやすいタスクをリカレントネットに行わせ、応用上の注意点や応用可能 性を探っていく必要がある。

そこで本研究では、全結合リカレントネットを筆跡の時系列データからの文字認識(オ ンライン文字認識)に応用することで、全結合リカレントネットの応用可能性について考 察することを提案する。文字認識という課題をタスクとして選んだのは、文字認識が誰に でもわかりやすく、適度に複雑なので、全結合リカレントネットの性能を評価するタスク として適しているからである。本研究の目的は、全結合リカレントネットを用いたオンラ イン文字認識システムを通して、全結合リカレントネットの応用可能性および応用上の注 意点を探ることである。

本稿の2章以下では構成は次の通りである。まず第 2章でニューラルネット全般に関す る基本的な研究の流れについて、大まかに解説する。次に第 3 章でリカレントネットの動 作と、学習のアルゴリズムについて詳しく説明する。第 4 章ではリカレントネットを用い た文字認識システムの構成法について提案する。第5章では第 4章で提案した構成法に関 する実験と、その結果についてまとめる。第6章では第 5章で得た実験結果を含め、リカ レントネットの応用可能性に関する考察を行う。

(7)

2. 関連研究

22

22...1.11 1 ニューラルネットニューラルネットニューラルネットとはニューラルネットとはとはとは

ニューラルネットとは、ニューロンという神経細胞をシナプスという結合で結ぶことに よって作られた、神経回路網である。人間や動物の脳の中には、ニューロンと呼ばれる神 経細胞がシナプスという結合でつながれた回路網が存在していることが知られている。ま た、人間や動物の脳の様々な機能は、この神経回路網によって行われていると考えられて いる。もし、この神経回路網が、コンピュータや電子回路で完全にモデル化できたとした らどうなるだろう。そうなれば、人間の脳の仕組についての解明が進み、人間のような高 度な知的処理を行うコンピュータを作ることが可能になるに違いない。ニューラルネット 研究には、このような壮大な可能性が秘められているのである。

一般に、人間や動物の持つ実際の脳の中のニューラルネットを生体ニューラルネット、

コンピュータや電子回路でモデル化されたニューラルネットを人工ニューラルネットと呼 んで区別する。ただし、本稿では主に人工ニューラルネットに絞って話をすすめるため、

単にニューラルネットというときは、人工ニューラルネットを指すものとする。

人工ニューラルネットは、生体ニューラルネットをモデル化し、あたかも電子回路のよ うに扱ったものである。この人工ニューラルネットを構築する際に問題となるのは、ニュ ーロンとシナプスをどのようにモデル化するのか、回路網をどのように形成するのか、と いうことである。ニューロンやシナプスのモデルとしては、現在までに様々なものが提案 されている。また、一般にニューラルネットの回路網は、アルゴリズムによって自動で生 成される。この生成操作を生物の学習にちなんでニューラルネットの学習と呼び、このア ルゴリズムを学習則、あるいは学習法と呼ぶ。学習則についても、現在までに様々なもの が提案され、その中には実際の脳の学習を意識したものもあれば、完全に工学的な構成と なっているものもある。以下の2.2では歴史に沿って、ニューラルネットのモデルと学 習法について簡単に説明する。

22

22...2.22 2 ニューラルネットニューラルネットニューラルネットニューラルネットののモデルののモデルモデルモデルととと学習法と学習法学習法学習法

2.2.1 マカロックとピッツのモデル

ニューラルネットの歴史は、1943年マカロック(W.S.McCulloch)とピッツ(W.H.Pitts) のモデルによって始まった。生体のニューロンは、刺激を受け、それがある閾値に達する と活動電位という電圧変化を生じる。この電圧変化がシナプスを介して、他のニューロン に伝わることにより、ニューロン同士が通信を行うことが知られている。マカロックとピ ッツは、ニューロンのそのような性質を、単純な回路としてモデル化した。以下の図2.

(8)

2-1は、マカロックとピッツによるニューロンのモデルである。

図2.2-1 マカロックとピッツのモデル

このマカロックとピッツのモデルでは、ニューロンとシナプスの動作を単純な演算でモデ ル化している。生体のシナプスの結合には強さがあり、この結合が強いシナプスからの刺 激にはニューロンは強く反応する。この性質をモデル化するために、マカロックとピッツ のモデルでは結合重みという値を定義している。この結合重みは通常実数値

w

で表され、

これと入力との積をニューロンへの刺激とする。生体のニューロンにはいくつかのシナプ スがつながっていて、それぞれのシナプスから刺激を受けている。これらの刺激の和が、

ある閾値に達するとニューロンは活動電位を生成する(発火するとも言う)。

マカロックとピッツのモデルでは、これらのニューロンの動作を以下の式で定義する。

) (

, y f s

x w

s = ∑

k k

θ =

(2-1) ここでsは刺激の総和から閾値を引いたものであるが、ニューロンの内部状態と呼ぶこと にする。また

w

kは k 番目のシナプスの結合重み、

x

kはニューロンへの k 番目のシナプス からの入力、yはニューロンの出力、θは閾値である。また

f

は出力関数であり、当時はヘ ビサイドの階段関数

 

= >

) 0 ( 0

) 0 ( ) 1

( x

x x

f

(2-2) がよく使われた。

このマカロックとピッツモデルでは、ニューロンへの刺激を、シナプスからの入力にシ ナプスの結合重みを掛け、加算したものと考える。その刺激が閾値を超えていれば 1 を出 力し、そうでなければ 0 を出力する。このニューロンの出力が次のニューロンへと、シナ プスを介して伝達される。マカロックとピッツのモデルを用いたニューラルネットでは、

このような単純な演算がそれぞれのニューロンで次々と行われていく。単純な演算が組み 合わさって、実際に意味のある情報処理がなされていくのは、電子回路の処理と似ている。

ニューロン

シナプス 次のニューロンへ

加算

w

1

w 2

w 3

x

2

x

3

) ( x

1

w

1

+ x

2

w

2

+ x

3

w

3

− θ f

力入

− θ 出力

x

1

(9)

実際、マカロックとピッツによりモデル化されたニューロンは、デジタル回路の一般化 であると考えることが出来る。例えば以下の図2.2-2のように、結合重み

w

1

, w

2と閾 値

θ

を設定することにより、それぞれの回路素子を形成することが出来る。

図2.2-2 マカロックとピッツのモデルによる回路素子の形成

図2.2-2の左上のように

w

1

= 1 , w

2

= 1 , θ = 1 . 5

と設定すると、入力(1,1)に対して出力は

1、どちらかあるいは両方が0ならば出力は0となり、AND 回路を形成していることがわ

かる。同様に、図2.2-2の右上はOR回路を、左下はNOT回路を形成している。よっ てマカロックとピッツのモデルによるニューロンはデジタル回路素子を形成することが出 来、このモデルで作られた回路網は、電子回路で可能なあらゆる処理が可能である。この ようにマカロックとピッツのモデルはニューロンをあたかも電子回路のように扱うことで、

神経回路の工学的な取り扱いを簡便にした。マカロックとピッツのモデルは現在でも多く のニューラルネットにおけるニューロンのモデルとして使われている。

ただしこのモデルは、実際のニューロンの多くの機能を削ぎ落とした、荒いモデルであ るという指摘もある。とはいえ、このマカロックとピッツのモデルよりも高い機能性と、

脳のモデルとしての信頼性を兼ね備えたモデルが、依然存在しないこともまた事実である。

そこでこの章では、ニューロンのモデルとして、マカロックとピッツのモデルを用いるこ ととする。

2.2.2 パーセプトロン

さて、ニューロンのモデルはマカロックとピッツによるモデルを用いるとして、それを どのように結合してニューラルネットを作るべきだろうか。ニューロンを闇雲に結合して も、意味のある回路にはならないであろう。この疑問に対するひとつの答えとして、1958 年アメリカの心理学者ローゼンブラッド(F.Rosenblatt)によりパーセプトロンが提案され

(10)

た。パーセプトロンは以下の図2.2-3のようにニューロンを層状に結合し、左側の第 一層から入力を行い、右側の第 T 層から出力を行う。入力は一方通行で、必ず左から右に 向かって信号が伝達される。

図2.2-3 T層のパーセプトロン

このパーセプトロンの動作(ダイナミクス)を、式で表すと以下のようになる。

) (

1

1 0

1 ,

1 + +

= +

+

= ∑

N it

=

it

k

t k t t ik t

i

w y y f s

s

t

t

=

1 , 2 , 3 ... T

i i

input

y

1

=

(2-3)

ここで

s

itはt番目の層のi番目ニューロンの内部状態、

y

itはt番目の層のi番目のニューロ

ンの出力、

w

ikt,t+1はt層目のi番目のニューロンからt+1層目のk番目のニューロンへの結

合重み、

input

iはi番目のニューロンへの外部入力である。またここでは第t層のニューロ

ンの数を

N

t、最上位層を第T層とした。

またパーセプトロンのダイナミクス(2-3) とマカロックとピッツのモデルの式(2-1)とを 比較すると、閾値 θ がなくなっていることに気づくであろう。パーセプトロンではニュー ロンの扱いを単純化するために、閾値 θ をシナプス結合重みのひとつとして考える。すな わち、各層の0番目のニューロンの出力を、常に1に固定しておけば

1 , 1 1

1 , 0

1 ,

1 +

= +

= +

+

= ∑ = ∑

N

+

itt

k

t k t t ik N

k

t k t t ik t

i

w y w y w

s

t t

(2-4)

となり、この式で

w

it1,t+1 =−

θ

it+1

θ

itti番目のニューロンの閾値)とすればマカロッ クとピッツのモデル(2-1)と同じになることが分かる。

パーセプトロンは、シナプス結合重みを調整することで、第一層の入力に対して、所望

(11)

の出力を最上位層から行うことを目的とする。パーセプトロンは脳の機能が層状になって いること(例えば視覚野は第1次視覚野、第2次視覚野などいくつかの層に分かれている)

をモデル化したものである。とはいえ、もちろん実際の脳はこのように単純なものではな く、フィードバック結合(前の層に戻る結合)や自己結合(自分自身への結合)を持って いることが知られている。しかし逆に、パーセプトロンの単純さが2.2.4に述べる学 習法を単純なものにし、ニューラルネットの研究を促進させたということが出来る。

2.2.3 パーセプトロンとパターン認識

パーセプトロンの主な応用分野はパターン認識である。パターン認識とは、入力された 画像や文字などの情報から特徴を抽出し、その入力が属するクラスに振り分ける作業であ る。パターン認識では、この抽出された特徴を数値化してベクトルにしたものを特徴ベク トルと呼ぶ。例えば「あ」の文字が入力されたら、その線の長さと画数から「あ」のクラ スに振り分け、「い」の文字が入力されたら、線の長さと画数から「い」のクラスに振り分 けるなどである。ここでは特徴ベクトルは線の長さと画数となる。

以下ではパーセプトロンを用いてこのパターン認識を行う方法を説明する。

1. あらかじめどのクラスに属するかが分かっている特長ベクトルをサンプルとして 多数用意する。

2. これらのサンプルの特徴ベクトルをパーセプトロンに入力した際に、そのサンプ ルが属するクラスを表す出力を行うように、結合重みを調整(学習)する。クラスを表 す出力とは、人間(あるいはコンピュータ)が見て、簡単にどのクラスであるか分かる ような出力である。例えば「あ」ならば1、「い」ならば0などである。

3. このようにパーセプトロンを学習しておけば、学習したサンプル以外の入力であ っても、学習したサンプルと近い入力であればそのサンプルと同じクラスに分類される ことが期待できる。十分に多数のサンプルに対して学習を行えば、入力を高い精度でク ラス分けすることが可能になる。

このようにパーセプトロンを用いれば、多数のサンプルとそれが属するクラスから、自動 的に学習によって、パターン認識を行うことが可能になるのである。一般にパーセプトロ ンは、入力を本質的な構造に作り変え、それを基に認識を行う能力(汎化能力)に優れて いるといわれている。

(12)

2.2.4 パーセプトロンの学習

パーセプトロンの学習とは、ある入力に対して所望の出力を行うように、結合重みや閾 値を適切に調整する作業である。所望の出力とは、例えば文字「あ」の特徴を表す入力が あれば1を出力し、そうでなければ 0 を出力するなどである。学習は多数の学習サンプル と、そのサンプルを入力したときの理想の出力(教師信号)を基に行う、教師あり学習で ある。ただし、この学習という作業を人手で行うとしたら、それは電子回路となんら変わ るところがない。学習はアルゴリズム(学習則)によって自動で行いたい。

パーセプトロンが発表された当時、学習はヘブの法則やそれを応用したデルタ則によっ て行われていた。ヘブの法則は、発火したニューロンとその発火に貢献したニューロン(発 火したニューロンに刺激を与えたニューロン)の間のシナプス結合が強まるという、実際 の脳の性質をモデル化した法則である。ヘブの法則は実際の脳において、その存在が確認 されており、脳のモデル化においては重要である。しかし本稿ではこれを直接使用しない ため、説明は割愛させていただく。へブの法則やデルタ則については良書[6][21][32]などを 参考にされたい。

このヘブの法則やデルタ則による学習によって、パーセプトロンは当時、自動で認識が 出来る万能認識機であるとして注目を集めた。しかし1969年ミンスキー(M.Minsky)と パパート(S.Papert)によってパーセプトロンの限界説が指摘された。これはパーセプト ロンでは、EXOR 問題(すなわち入力(1,0),(0,1)に対しては出力 1 を、入力(1,1),(0,0)に対 しては出力 0 を行うように学習する問題)を解くことが出来ないなど、パーセプトロンで は非線形的な問題を解くことができないというものである。

この問題を解決する学習法であるバックプロパゲーションは、パーセプトロンの発表か らおよそ30年後に、ラメルハート(D.E.Rumelhart)によって提案された。バックプロパ ゲーションは、脳の知見から生まれた学習則というよりは、ニューラルネットの学習を数 学的な最適化問題として捉えたものである。以下ではバックプロパゲーションについて、

簡単に説明を行う。

バックプロパゲーションは、微分演算に基づくアルゴリズムであるので、マカロックと ピッツのモデルにおけるニューロンのモデルを、微分可能な関数を用いたものに変更しな ければいけない。一般にバックプロパゲーションにより学習を行う場合、マカロックとピ ッツのモデルにおける出力関数を(2-2)で定義したものから、以下のシグモイド関数に変更 する。

e

x

x

f

= +

1 ) 1

(

(2-5)

シグモイド関数のグラフは以下の図2.2-4のようになる単調増加関数である。

(13)

図2.2-4 シグモイド関数

また、あるサンプルを入力したときの、k番目の出力層ニューロンの教師信号(理想の出力)

d

kとする。このとき二乗誤差Eを、以下の式で定義する。

2 1

) 2 (

1

k T k n

k

d y

E

=

=

(2-6)

ただし、

y

Tkは第T層(最上位層)のk番目のニューロンの出力であり、nは最上位層(第 T層)のニューロンの数とした。つまり、第 T 層には

n

個のニューロンがあるということ である。(2-6)式で表される二乗誤差とは、理想の出力と実際の出力の差を二乗して、全て のニューロンに対して足し合わせたものである。この二乗誤差が小さくなれば、学習サン プルを入力したときの出力は教師信号に近い値であるはずである。また二乗誤差は連続関 数なので、二乗誤差が小さいときに学習サンプルと似たような入力を行うと、その学習サ ンプルの出力と近い出力がなされると考えられる。

よって、パーセプトロンの学習とは、シナプスの結合重みを二乗誤差が十分小さくなる ように調整する事であると捕らえることができる。ここで、二乗誤差を小さくするために 最急行下法を用いる。最急行下法とは、目的の関数の勾配を求め、その勾配の逆方向に変 数を更新することで、関数の値を小さくしていく手法である。

(14)

図2.2-5 最急行下方の概念

ここで言う勾配は、二乗誤差関数 E を偏微分することで得ることが出来る。E は入力と 教師信号、結合重みの関数である。ここで入力と教師信号を固定すると、Eは結合重みの関 数となる。また E は微分可能なシグモイド関数の合成関数なのでやはり微分可能である。

このためEは

w

tkl,t+1により偏微分可能である。よって図2.2-5のように、二乗誤差の偏 微分係数∂ ,+1

t t

w

kl

E

が正ならば、負の方向

1 ,+

− ∂tt

w

kl

α E

に結合重み

w

klt,t+1を更新することにより、

Eの値を小さくすることが出来る。そこで結合重みを、以下の式で勾配の逆方向に更新する。

1 , 1

,

+ +

− ∂

=

tt

kl t

t

kl

w

w α E

(2-7)

1 , 1 , 1

,t+ = tklt+ +∆ tklt+ t

kl

w w

w

(2-8)

ここで∆

w

klt,t+1は重みの更新量を表す。また

α

は学習係数といい、重みの更新量を表す正 の定数である。この α は一般に小さな値であり、大きすぎると更新を行う際に、最小とな る点を飛び越えてしまい、学習が進まない。

この式で結合重みを、勾配の逆方向に更新していくことで、ボールが坂を転がり落ちる ように、関数をその勾配に沿って小さくしていくことが出来る。この更新を全ての学習サ ンプルに対して多数回繰り返すことにより、二乗誤差Eを極小(最小ではないことに注意)

に導くことが出来る。

(15)

ただしここで問題になるのは偏微分

1 ,+

t t

w

kl

E

をどのように計算するかということである。

この偏微分

1 ,+

t t

w

kl

E

をいきなり計算することは出来ない。これを計算するためにまず二乗誤

差Eの、各層でのニューロンの出力

y

tkによる偏微分

t

y

k

E

∂ を求める。連鎖微分則からこの偏

微分は

+

=

+

+

= ∂

1

1

1 1 Nt

l

t k t l t l t

k

y

y y

E y

E

(2-9) となる。ここで(2-3)式より

1 , 1 1

1 , 1

) ( )

(

+ +

= + +

= ′

 

 

= ∂

∂ ∑

N lt tklt

s

t s t t t sl

k t

k t

l

f w y f s w

y y

y

t

(2-10)

と計算できる。また出力関数がシグモイド関数である場合は、出力関数の微分は

( 1 ( ) )

) ( )

( x f x f x

f ′ = −

(2-11) と計算できる。よって

+ + +

=

+ + +

+

=

+ + +

=

+

+

= ∂

∂ ′

= ∂

= ∂

1 1 1

1

1 , 1 1

1 1

1 , 1 1 1

1

1

( ) ( )( 1 ( ))

t t

t N

l

t t kl t l t

t l l N

l

t t kl t t l l N

l

t k t l t l t

k

w s f s

y f w E

s y f

E y

y y

E y

E

+

=

+ + +

+

= 1

1

1 , 1 1

1

( 1 )

Nt

l

t t kl t l t

t l l

w y y y

E

(2-12)

となる。この式からt層での偏微分

t

y

k

E

∂ はt+1層での偏微分 1

1

1 , 2 , ,

+

+ =

t t k

N y k

E

K

t+1層の出力

y

lt+1、t層とt+1層の結合重み

w

klt,t+1によって求めることが出来ることがわかる。

また最上位層における偏微分は

)

(

kT k

T k

d y y

E

= −

∂ (2-13)

と 表 さ れ る 。 よ っ て 実 際 に パ ー セ プ ト ロ ン に サ ン プ ル を 入 力 し 、 観 測 し た 出 力 と (2-12),(2-13)式によって、二乗誤差の出力による偏微分

t

y

k

E

∂ を再帰的に計算することが出来

る。またこの(2-12),(2-13)から計算できる偏微分から、勾配は

t k t t l

l t

t kl

t l t l t

t kl

t m N

m t m t

t kl

y s y f

E w

y y

E w

y y

E w

E

t

) (

1

1 1

, 1 1 1

, 1

1 1 1

,

+ +

+ + + +

+

= +

+

= ∂

= ∂

= ∂

(2-14) と計算できる。この(2-14)式による勾配から式(2-7),(2-8)により多数回更新を行うことで誤 差を極小化できる。以上のように最上位層の誤差を、上位の層から順に微分していき、誤 差を少なくする方向に重みを更新するという一連の手法を、バックプロパゲーション(誤

(16)

差逆伝播法)という。このバックプロパゲーションによる学習は数学的に優れている。へ ブの法則による学習ではパーセプトロンでは、非線形の問題を解くことができなかったが、

バックプロパゲーションにより学習されたパーセプトロンでは、任意の非線形関数を近似 できることが知られている。

ただし、バックプロパゲーションという学習は、実際の脳のモデルとして正しいかとい うことについては疑問が残る。この学習を実際の脳のニューロンが行うためには、上位層 での誤差を下位の層に伝播し、下位の層のニューロンでは伝播された誤差から自己の誤差 を計算し、さらに下位層に伝播するという仕組みが必要である。しかし実際の脳ではその ような仕組みは発見されていない。とはいえ、微分演算などのバックプロパゲーションに 必要な計算を(2-7)~(2-14)式を用いて行うのではなく、ニューラルネットの関数近似能力を 用いて行うという研究[17]も発表されており、一概に脳の仕組みとしてバックプロパゲーシ ョンが存在しないとは言い切れない。

いずれにしても、バックプロパゲーションによる学習は現在ニューラルネットの学習則 として、最もポピュラーなものとなっている。

2.2.5 慣性項を用いたバックプロパゲーションの改善手法

バックプロパゲーションは有効な学習法であるが、学習に時間がかかることや、最適解 に収束するとは限らないことなど、いろいろな問題がある。そこでバックプロパゲーショ ンの発表以来、様々な改善手法が提案されてきた。この流れは現在も続き、様々な研究が なされている。しかし最も有名で効果的な改善手法は、慣性項を用いた学習法である。慣 性項を用いた学習では、最急降下法において(2-7)式すなわち

1 , 1

,

+ +

− ∂

=

tt

kl t

t

kl

w

w α E

によって重みを更新していたところを

( ) ( ) ( ) ( )



 

∂ + ∂ +

∂ − + ∂

∂ − + ∂

− ∂

=

+

+

+ +

+

1 ...

2 1

) (

1 , 1 1

, 2 1

, 1

, 1 ,

t t kl k t

t kl t

t kl t

t kl t t kl

w k E

w k E

w k E

w E k w

λ λ

λ

α

(2-15)

によって重みを更新する。

ここで∆

w

klt,t+1

( k )

k回目の学習における重みの更新量、

( ) k

w E

t t kl

1 ,+

∂ はk回目の学習におけ

る勾配であり、

λ

1より小さい正の定数である。

すなわち(2-15)式による更新は、今までの更新時の勾配を古さにあわせて

λ

を乗じて足し

合わせたものである。以下の図2.2-6で慣性項の効果を簡単に説明する。

(17)

図2.2-6 慣性項を加えた最急行下方の概念

①の点では更新が同じ方向になされており、ここでは勾配が足しあわされていき、学習が 高速に進む。②の点は極小点であり通常のバックプロパゲーションではこの極小点にはま ってしまって学習が進まない。しかし、慣性項を用いると今までの勾配を足し合わせてい るので、この極小点を乗り越えて学習が進む。③の点では関数の値が最小になる。ただし ここで、α の値と λ の値が大き過ぎると、この最小となる点も飛び越してしまい学習が収 束しなくなる可能性がある。

このように慣性項を学習に用いることにより、学習が高速化され、局所的な最小点を抜 けて大域的な最小点に到達することが出来るようになる。ただし α の値や λ の値が大き すぎると、逆に学習が収束しなくなるという欠点もある。また(2-15)式による更新は今まで の全ての更新を記憶しておかなければならないという欠点もある。そこでさらに(2-15)式を 計算すると、

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )





∂ + ∂ +

∂ − + ∂

∂ −

− ∂

− ∂

=





∂ + ∂ +

∂ − + ∂

∂ −

− ∂

− ∂

=

+

+

+ +

+

+

+ +

+

1 ...

2 1

1 ...

2 1

) (

1 , 2 1

, 1

, 1

,

1 , 1 1

, 2 1

, 1

, 1

,

t t kl k t

t kl t

t kl t

t kl

t t kl k t

t kl t

t kl t

t kl t

t kl

w k E

w k E

w k E

w E

w k E

w k E

w k E

w k E

w

λ λ

αλ α

λ λ

λ α α

( ) (

, 1

( 1 ) )

1

, − ∆ −

− ∂

= +

k w

+

k

w

E

tt

t kl t kl

λ

α

(2-16)

となり、(2-15)式での更新を前回の重みの更新だけから計算することが出来る。さらに前回

の重みの更新は、現在の結合重みと更新を一回行う前の結合重みの差分から、以下の(2-17) のように計算することが出来る。

(18)

) 2 ( )

1 ( )

1

(

, 1 , 1

1

, − = − − −

w

kltt+

k w

kltt+

k w

kltt+

k

(2-17) この(2-17)式を(2-16)式に代入することで、前回の更新量を記憶しておく代わりに、更新を 1回行う前の結合重みを覚えておくことでも、この慣性項を用いた学習を実装することが可 能である。

22

22...3.33 3 リカレントネットリカレントネットとはリカレントネットリカレントネットとはとはとは

これまで説明してきたパーセプトロンは、左から右に一方通行に信号の伝達が行われる モデルであった。これと対照的なモデルとしてリカレントニューラルネットがある。リカ レントニューラルネット(以下リカレントネット)とは、フィードバック結合を持つニュ ーラルネットである。通常の層状パーセプトロンでは、1回目に入力した情報は2回目に入 力した情報に影響を与えない。しかしリカレントネットでは、情報をフィードバックする ことで、1回目と2回目の入力を統合して出力を行うことが出来る。これによりリカレント ネットでは、過去の入力と現在の入力を総合した情報解析、つまり時系列情報の解析が可 能である。図2.3-1にパーセプトロンとリカレントネットの違いを示した。

図2.3-1 層状パーセプトロン(左)とリカレントネット(右)

リカレントネットには層状のもの(エルマンネット、ジョーダンネットなど)と全結合 を持つものがある(図2.3-2)。

(19)

図2.3-2 層状リカレントネット(左)と全結合リカレントネット(右)

層状のリカレントネット(以下層状リカレントネットと呼ぶ)は、パーセプトロンにフィ ードバック結合を持たせたモデルであり、全結合を持つリカレントネット(以下全結合リ カレントネットと呼ぶ)は、入力層へのフィードバックを除く全ての結合を持つモデルで ある。よって全結合リカレントネットは、層状のリカレントネットよりも一般化されたモ デルである。層状のリカレントネットは、通常のバックプロパゲーションで学習可能であ るが、全結合リカレントネットは特別な方法が必要である。学習法の詳細については3章 で詳しく説明する。また全結合リカレントネットには、時間を離散的に扱ったもの(以下 離散時間全結合リカレントネットと呼ぶ)と、時間を連続的に扱ったもの(以下連続時間 全結合リカレントネットと呼ぶ)がある。連続時間のリカレントネットは、ニューロンの 入力や出力を連続時間の関数として表現したモデルであり、実際には離散時間のモデルを 細かく差分化したものとなる。よって連続時間のモデルでは計算時間と学習サンプルのデ ータ量が膨大となるという欠点がある。脳の研究という観点からは、連続時間のモデルが 良く用いられるが、応用研究には離散時間のモデルのほうが便利である。連続時間のモデ ルと離散時間のモデルの詳しい関係については3章で詳しく説明する。

22

22...4.44 4 リカレントネットリカレントネットのリカレントネットリカレントネットののの研究研究の研究研究のの歴史の歴史歴史歴史とととと現状現状現状現状

リカレントネットすなわちフィードバックを持ったニューラルネットという発想は、バ ックプロパゲーション以前から存在した。中野馨によるアソシアトロン(1969)、Hopfield によるホップフィールドネットワーク(1982)などはその有名な例である。これらのニューラ ルネットのモデルは歴史的にも重要であり、多くの良書で詳しく解説されている。アソシ アトロンは[21]を、ホップフィールドネットワークは[6] [32][33]等を参照されたい。

バックプロパゲーションが発表されて以降、M.Jordan J.Elman [11] 等により、リカレ ントネットをバックプロパゲーションで学習すると言う発想が生まれた。これらのネット ワークは、層状パーセプトロンに結合重みを固定したフィードバック結合を設けたもので

(20)

ある。これらの層状リカレントネットは、通常のバックプロパゲーションにより学習が可 能であるため、様々な応用に用いられた。また、層状パーセプトロンにフィードバック結 合を用いた様々なモデルが提案された。これらのモデルついては文献[30] にまとめられて いる。

このJordan、Elman等による層状のリカレントからすぐ後、すなわち80年代後期から

90 年代初頭には全結合リカレントネットの学習法である RTRL(Real Time Recurrent Learning)[25]、BPTT (Back Propagation Through Time) [27]がR.WilliamsやD.Zipser 等によって提案された 。また同時期に、カルマンフィルターの理論を応用した学習法であ

るEKF(Extended Kalman Filter)[26]もWilliamsによって提案された。全結合リカレ

ントネットの学習法に関しての基礎はこの時期にほぼ完成したといえる。90 年代前半には 日本でもリカレントネットは注目を集め、様々な応用や学習法に関する提案がなされた。

ただし当時はまだコンピュータの性能が高くなかったことや、リカレントネットが広く普 及していなかったことにより、大規模なリカレントネットを用いた応用は行われなかった。

当時の応用としては、リカレントネットに音声の揺らぎを学習させた研究[28]や、カオス的 力学起動を学習させた研究[19]等がある。

90 年代中番になると、リカレントネットの学習法が広く普及し、より専門的な応用や学 習の改善手法が議論された。全結合リカレントネットを用いた例としては、脳波の解析[8]、

音声の補完[13]などが行われた。さらに同時期には、リカレントネットの学習法の拡張手法 などもいくつか研究された。例えば[2]はリカレントネットの学習にアニーリング(焼きな まし法)を適用した研究である。この時期はニューロブームと重なるため、リカレントネ ットに関するサーベイ論文[3]なども発表されるなど、研究は盛り上がりを見せた。

90年代後半から2000年代には、リカレントネットの文字認識に関する応用もなされた。

文献[30]は層状リカレントネットに静止画を2回入力することにより、認識率を高めた研究 であり、文献[31]は静止画を左からスキャンしていくことで時系列情報とみなし、層状リカ レントネットに文章を認識させる研究である。これらの研究では層状リカレントネットを 認識に用いており、本稿で主に議論する全結合リカレントネットは用いていない。またこ の時期には、顔表情からの特徴抽出[7]、経済予測[29]、ロボットハンドの制御[34]などの多 彩な応用研究がなされたが、いずれの研究も層状リカレントネットを用いていて、全結合 リカレントネットを用いていない。ただしリカレントネットによる電力量予測の研究[33]

など全結合リカレントネットを用いている応用研究も存在する。全結合リカレントネット がよく用いられているのは、脳のモデル化の研究である。例えば、サッケードという反射 的眼球運動のモデル化はその有名な例である[9][33]。これらの脳のモデル化は、主に連続 時間のリカレントネットを用いて行われた。ただし、離散時間のリカレントネットを用い て行われた研究もあり、文献[23]では海馬のモデル化を、離散時間のリカレントネットを用 いて行っている。また近年、リカレントネットの新しい学習法の提案[4]などの基礎的な研 究も行われている。

(21)

このように様々な分野から注目を集めているリカレントネットではあるが、詳しい学習 法を記した日本語の資料がほとんどないため、一般にとっつきが悪く難解なものとして認 識されがちである。特に全結合リカレントネットは、特別な学習法が必要であるため詳細 な資料が少ない。近年リカレントネットに関する確率的な学習法[23]や、リカレントネット を用いた自己組織化マップの研究[24]など、リカレントネットに関する新しい研究がなされ ている。これらの理解を助けるためにも、全結合リカレントネットの動作と学習を理解す ることは重要である。そこで3章では、リカレントネットの動作と学習に関するアルゴリ ズムに関して詳しく説明する。

22

2.2..5.55 5 オンラインオンライン文字認識オンラインオンライン文字認識文字認識文字認識とはとはとはとは

オンライン文字認識とは、時系列筆跡情報から、文字を認識する手法である。一般にオ ンライン文字認識では時系列筆跡情報として、ペンの平面上での速度(方向を含む)、ペン のジャンプ(ペンを紙から放す動作)、筆圧などの情報を組み合わせて用いる。オンライン 文字認識は静止画からの文字認識(オンライン文字認識との対比で、オフライン文字認識 と呼ばれることもある)と比較して、

・ 書き順などの筆跡情報を考慮できること

・ 対象が画像でないため、データサイズが小さく、認識がすばやく出来ること

などの利点がある。近年、オンライン文字認識に関する研究が盛んに行われている [1][14][22]。これは

・ パーソナルコンピュータ用のペンタブレットが安価になり、一般に普及しだしているこ と

・ 携帯ゲームやPDAなどの携帯デバイスが普及し、ユーザインターフェースとしてペン やタッチパッドが採用されるようになってきたこと

等が理由である。現在オンライン文字認識の方法として、隠れマルコフモデルを用いた方 法[1][22]や辞書とのテンプレートマッチングを行う方法[14]など様々な方法が提案されて いる。オンライン文字認識の認識精度はいくつかの研究[1][22]において、90%以上と高精 度ではあるが完璧とはいえない。今後認識率を高めるためには、新たな認識手法を開発す ることや、既存の手法の組み合わせで欠点を補い合うことが必要となる。

(22)

22

22...6.66 6 関連研究 関連研究関連研究関連研究ののののまとめまとめまとめまとめ

2.2では、ニューラルネットのモデルと、学習法に関する基本的な研究の流れについ てまとめた。ニューラルネットのモデルとしては、マカロックとピッツのモデルについて 詳しく説明を行い、学習法については、バックプロパゲーションについて詳しく説明を行 った。これらのモデルは、本稿で考察する、リカレントネットのモデルや学習法の基礎と して重要である。またバックプロパゲーションの改善手法として、慣性項を用いた学習に ついて述べたが、この慣性項を用いた学習はリカレントネットの学習においても有効であ る(5.2を参照)。本稿では、全結合リカレントネットの性質について考察することが目 的であるので、ニューラルネットの基礎研究としては、リカレントネットに関係のあるこ とについてのみをまとめた。その他のより詳しいニューラルネットの研究については、良 書が多数[6][21][32][33]あるので参考にされたい。

2.3ではリカレントネットの基礎的な概念についてまとめた。リカレントネットはフ ィードバックを持つニューラルネットであり、リカレントネットには層状のものと全結合 を持つものがあることを述べた。

2.4ではリカレントネットの研究の流れについて述べた。これらの研究と本研究をリ カレントネットの種類に合わせて分類すると以下の図2.6-1、表2.6-1のように なる。図2.6-1にはリカレントネット研究の全体的な分類と研究例を示し、表2.6

-1には離散時間全結合リカレントネットに関する研究例をまとめた。また現在までに、

リカレントネットについては様々な研究がなされているが、全結合リカレントネットにつ いては研究が比較的少なく、学習法などのアルゴリズムに関して詳細に解説している文献 が少ない。そこで以下3章では全結合リカレントネットのアルゴリズムについては、でき るだけ詳細に解説を行った。また4章、5章ではリカレントネットを応用に関してパラメ ータや学習時間などを出来るだけ具体的に掲載するように心を砕いた。

2.5ではオンライン文字認識についてまとめた。オンライン文字認識は時系列筆跡情報 からの文字認識であり、隠れマルコフモデルなどの手法を用いて行われている。本稿では このオンライン文字認識を、リカレントネットを用いて実装する。

(23)

*学習法などの基礎的な研究については省略 図 2.6-1 リカレントネットの研究の分類

表2.6-1 離散時間全結合リカレントネットの応用研究例 離散時間全結合リカレントネットの応用研究例

文献 提案者/提案年 研究内容 [8] 福田修,辻敏夫

/ (1997)

Long-Linearized Gaussian Mixture Neural Networkとリ カレントネットを組み合わせて用いて脳波を分類する研究 [15] K. Kasper,

H. Reininger H. Wust / (1996)

近傍のみとシナプス結合を持つリカレントネット(Locally Recurrent Neural network)による、発話認識の研究

[23] P. Rodriguez W.B. Levy /(2004)

ヘブの法則により学習した、離散時完全結合リカレントネ ットによる、海馬のモデル化の研究

[33] 須貝康雄/(2002) パーセプトロンとリカレントネットを組み合わせて、翌日

最大電力量を予測する研究

本研究 糟谷勇児/(2005) 離散時間全結合リカレントネットを応用したオンライン文 字認識の研究

リ カ レ ン ト ネ ッ ト 研 究

アソシアトロン

ホップフィールド型

バ ッ ク プ ロ パ ゲ ー シ ョ ン の 利 用

層状 リカレントネット

全結合 リカレントネット

離散時間型 連続時間

新しい研究

エルマンネット ジョーダンネット

など

[21]

[6][32]

[7][11][19][29]

[30][31][34]

[8][15][23][33]

本研究 本研究 本研究 本研究

[9][28][33]

[10][24]

研究例 *

分野

参照

関連したドキュメント

必要量を1日分とし、浸水想定区域の居住者全員を対象とした場合は、54 トンの運搬量 であるが、対象を避難者の 1/4 とした場合(3/4

② 入力にあたっては、氏名カナ(半角、姓と名の間も半角で1マス空け) 、氏名漢 字(全角、姓と名の間も全角で1マス空け)、生年月日(大正は

・1事業所1登録:全てのEPAに対し共通( 有効期限:2年 ) ・登録申請書の作成⇒WEB上での電子申請( 手数料不要 )

部位名 経年劣化事象 健全性評価結果 現状保全

   縮尺は100分の1から3,000分の1とする。この場合において、ダム事業等であって起業地

物的対策 危険箇所の 撲滅・5S ①各安全パトロールでの指摘強化

記録 記録すべき場合 ※1 保存期間 18.安全確保設備等の事故の状況及. び事故に際して採った処置 同上

環境管理棟の測定結果でも、全ベータとス トロンチウムの結果が大きく逆転している ことを確認。全ベータの数え落としの調査