• 検索結果がありません。

ニューラルネットワークと予測

N/A
N/A
Protected

Academic year: 2021

シェア "ニューラルネットワークと予測"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

ニューラノレネットワークと予測

安達雅春,合原一幸

11川11川11川11川11川11川11川11川11川11川11川11川111川11川11川11川11川11川11川11川11川11川11川川11川11川川11川川11川川11川11川l川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川111川11川11川川11川11川11川11川11川11川11川11川1111111川11川11川11川11川11川11川11川11川川11川11川11川11川11川11川11川11川11川11川11川11川11川11川川11川川11川川11川1刊川11川11川11川11川11川11川11川11川11川川11川11川11川11川11川11川11川11川11川11川11川11川11川11川11川川11川11川11川111川11川11川11川11川11川11川11川11川11川11川11川11附川111川11川11川11川11川11川11川11川11川11川l川11川11111川11川11川11川11川11川11川11川11川1111川11川11川11川11川11川11川11川11川11111川11川11川11川11川11川11川11川11川11111川11川11川11川11川11川11川111附111川11川11川11川11川11川11川111附111川11川11川11川11川11川11川11削1111附11川11l

1

.

はじめに

非線形システムにおける時系列データ,特にカオス

[

1

J 的な時系列データに関しては一般に長期予測は不 可能である.しかし,短期の予測に限れば,観測で得ら れた時系列データを用いて,対象システムの同定を行な うことによってかなりの精度の予測が可能である.この ような「決定論的非線形予測」の研究は最近大きく進展 しているが [2 J ,本稿では,システム同定手法として, 階層型人工ニューラルネットワークにパックプロパゲー ション学習則 [3 J を適用したネットワークモデル(以 下, BP ニューラルネットワークと記述)を用いる手法

[4J

[5J について紹介する.

2

.

予測手法および評価法

本章では標準的な BP ニューラルネットワークを用い たカオス的時系列の短期予測について概説する.この手 法は,既知の時系列データの 1 タイムステップごとの写 像を BP ニューラネルットワークに学習させることによ り対象システムの非線形ダイナミックスを推定し,これ をもとに時系列データの短期予測を行なうものである. 2.1 予測手法 一般に , N次元の力学系から観測できるデータの次元 d は , d<N となることが多く, 最悪の場合には d=1 となる. このような場合 fTakens の埋め込み定理」

[6

J にもとづいて,適当な次元 D とラグ L の時間シフ ト座標軸を用いて,もとの N次元相空間上のアトラクタ を位相的に保存したアトラクタを再構成する必要があ る. はじめに,時系列データ学習過程において,与えられ た時系列データ x(t) (t =O , 1 , 2 ,… , n ー 1) を次元 D , ラ グ L の時間シフト空間に埋め込むと , (n ー (D ー I)L) 個 のベクトル あだち まきはる,あいはらかずゆき 東京電機大学工学部電子工学科 千 101 千代田区神田錦町 2-2

3

3

6

IN1(t) INN(t) 中間層 図 1 アトラクタまたは時系列学習用の BP ニューラルネットワ -tl アトラクタ学習: INí(t)=aí(t),

TEACH

(t)=a (t+l)

(i

=I

,

…,

N) 時系列学習: INí( 7: )=x( τ +(i- 1) L) TEACHt( τ )=x (τ + (i ー I)L+l) (i=l

,

,D)

V( 7:)( τ=0 , 1 , 2 ,… , m ;m=n ー (D ー I)L ー 1) すなわち, V( 7: )=[x( 7:), x( 7: +L) , x( τ +2L) , … , x( τ +(D-1)L)J で,この時系列データが表現される(時系列データの埋 め込み). この時系列データの学習に用いるニューラル ネットワークは 3 層構造で,各層のニューロン数は, 入力層および出力層では時系列データの埋め込み次元に 合わせて D とし,中間層については,数理モデルのデー タに関してはそのモデルの写像の分析により決定し,実 データに関しては時系列データ学習を何回か試行し,そ の収束状況に応じて決定する(図 1 ).時系列データ学 習過程においては具体的には{入力,出力}の組として {V( τ) , V(7:+1)

},

{V(7:+1)

,

V( τ+2) },… を順次 BP ネットワークに提示し,このベクトル間の写 像を学習させる(図 1

)

.

(2)

主(ピ +(D-l)L +l+n)

図 2 アトラクタ再生または時系列予測用ニ

ューラルネットワーク

アトラクタ再生:

INITt =O.I

,

OUTt (t)= 向 (t)

(i=l

,

…,

N)

時系列予測(イテレーション n ー 1 固い

INITt

(

t

'

)=x(t'+(i-1 )L) OUTdt'+n ー l) =x(t'+(i ー I)L+1+n) (i=l

,

…,

D)

次に,予測過程では,基本的には,時系列データ学習 終了後のネットワークの出力を入力層にフィードパック した, リカレント型のネットワークを用いる.また,予 測時聞を次のように定義する. 予測時間い フィードフォワード型ネットワークに V (t ')=[x (t'), x(t'+L) , x(t'+2L) , …, x (t '+(D-1 )LJ を 入力し,出力層の D 番目のニューロンの出力値とし て予測値 x (t' ート (D ー I)L+1) を得る (図 1 ). 予浪1時間 2

:

リカレント型ネットワークに V(t')=[x(t'), x (t'+L), x(t'+2L) , ・ , x(t'+(D ー I)L)J を初期 値として入力し,イテレーション 1 回の後に予測値 x(t'+(D-1)L+2) を得る(図 2

)

.

予測時間 n: リカレント型ネットワークに V (t')=[x(t'), x (t '+L), x (t '+2L) , …, x(t'+(D- I) L)J を初期 値として入力し,イテレーション n ー 1 回の後に予 測値 x(t'+(D ー I)L+n) を得る(図 2 ). 1992 年 7 月号

2

.

2

予測値の評価 2.1 で述べたようにして得られた予測値の評価には, 次に示すような 3 種類の指標を用いる. ①相関 N タイムステップ分の実際の時系列データおよびこれ に対する予測値 x (t')(t'=1 , 2 , … , N) の 2 つの系列聞の 相関係数 p:

士L; (x(t') ー x)(x(t')-x)

4V t'

~ぉ(乏仰(μt')一J

引孟

X 刈10∞o (%刻6ρ(1

)

ここで, x および x は,それぞれ x(t')(t'=1 , 2 , …, N), x (t')(t'=1 , 2 , … , N) の平均値である.

(

RMSE (Root Mean Square E

rror)

RMSE=J元(川 )-X(t'))2

( 2 )

(

RRMSE (

R

e

l

a

t

i

v

e

Root Mean Square Error)

RMSE

RRMSE= 一一て一一一 (

3

)

v:r ここで q:r は, 予測対象の時系列データの標準偏差 である.また,この RRMSE は,

RRMSE=O

(4 ) のとき完全な予測が行なわれたことを示し,

RRMSE=1

(5) のときは,単に平均値を予測した場合と等価であり,し たがって平均と偏差が同じオーダーである多くのカオス の場合にはほとんど無意味であることを示す.

3

.

BP.= ューラルネットワークによる

カオスアトラクタの学習・再生

本章では, 2. で述べた時系列データの埋め込みによっ て再構成されたアトラクタの学習およびそれにもとづく 短期予測の実例を示す前に,カオスアトラクタを生み出 すような力学系の写像構造が, BP ユューラルネットワ ークによって同定できることを実例で示す. 3 層 BP ニューラルネットワークを用いて n 次元の 離散時間力学系のアトラクタを以下のように学習・再生 する.アトラクタ学習過程では学習対象アトラクタの各 点、を表わす N 次元ベクトル A(t)=[adt) , a2(t), …, aN(t)J のベクトル聞の遷移を望ましい入出力関係とし てニューラルネットワークに提示する(図 1 ). アトラクタ再生過程では,学留終了後のネットワーク にフィードパック結合を加え,初期値のみを与え,イテ (23)

3

3

7

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(3)

u

a

0.100000 ロ.0∞自由。 -0.100000 -1.3白白白目白

令\

.・-・r d同_.・'

.

.

・・・・­ ~~ ...・"'-0.000白自白 .令、、

ヘ、

f-F

.

1.3目白白0口

b

~. 0 E

c

0.350000 0.000000 -0.350000 ,、 e x -1.20白白目。 白.目白白目。。 1.200000 0.350000 0.000000 -0.350000 -1.2目白白O口 日.口∞白白目 1.2白目。∞ 図 3 エノン写像アトラグタの一例およびその グリッドイメージ特性 a) エノン写像のアトラクタの一例 b) 写像構造を見るための入力格子 c) b) の格子を入力としたエノン写像 の出力

a

b

c U 0.5∞ω。 O.OOODClO -0.5ωω。 旬、.句 、、; ~...、

戸.,...--求:""'.,.ー

一・・ ・-\、

/ j

/

,...If' .~

'‘

-目.5目白000 0.0目。。目白 0.5ω000 矢目 白.500000 O. 目白自由。ロ -0.500000 ,、

c

目 x -0.500000 0.000000 白.5目白目白白 U 0.5000白日 0.00000白 -0.500目。。 x -0. 500日目。 白 .0000目白 口 .50自白自由 図 4 再生されたアトラクタおよびニューラル ネットワークのグリッドイメージ特性 a) 学習終了後のリカレントネットワー クが描いたアトラクタの一例 b) 写像構造を見るための入力格子 c) b) の格子を入力としたネットワー タの出力

(4)

ミ史 100 90 80 70 60 50 40 1 2 3 4 5 6 7 8 9 Pred刷。nT加e 図 S エノ γ 写像のアトラクタに関する時系列 短期予測結果 10 レーショ γ を行なう(図 2

)

.

代表的な 2 次元離散時間力学系であるエノン写像(式 (6-7)) のストレンジアトラクターの一例およびそのグ リッドイメージ特性[7]を図 S に,このアトラグタを 学習した BP ユューラルネットワーク(各層のユユーロ ン数:入力層 2 , 中間層 9, 出力層 2 )が再生したアト ラクタの一例およびそのグリッドイメージ特性を図 4 に それぞれ示す. x(t+1 )=y(t)+1 ー 1.4x2(t) ( 6) y

(

t

+1)=0.3x(t) (7) 図 3 と図 4 を比較することにより, BP ネットワーク が対象となる 2 次元カオス写像のストレンジアトラクタ の構造や変換特性をよく再現していることがわかる.

4

.

BP= ューラルネットワークによる

カオス時系列データの短期予測

本章では,数理モデル,実モデル双方に関して, 2. で 述べた手法による時系列の短期予測の実例を示す. 4.1 ヱノン写像の時系列の短期予測 3. の解析は 2 次元の力学系から 2 次元の観測データ が得られた場合に相当するが,ここで、は次元の観測 データしか得られない場合を想定して,式 (6-7) にお ける z の時系列データのみを用いて, BP ニューラルネ ットワークに学習させ, 短期予測を行なった結果を示 す. 図 5 に埋み込み次元 D=2, ラグ L=I , 2 入力層ニュ ーロン 9 中間層ニューロン 2 出力層エユーロンの BP ニューラルネットワークを用いた場合の予測時間に 対する相関のグラフを示す.この図から予測時間が 5 , 6 程度まで、は,かなり高い精度の予測がなされているとい える.また,埋み込みが保証されるのは,埋め込み次元 D がもとのカ学系の状態空間の次元の 2 倍 +1 以上の場 1992 年 7 月号 100 90 80 ぷ 70 " 60 。

.

.

h

.

.

‘・・‘・・"-司、。・h

-“

‘・.‘・. ‘・. ‘・-白、一 、邑企

g

50 司、、 -v__ ー-号 40 8 3 0 仁 20 ‘c、、、 『圃・h・。 、 、 、 、 10 。 2 3

P

r

e

d

i

c

t

i

o

n

T

i

m

e

ロ Leam

Er

.<0.02

+

L

e

a

r

n Er.=O.020 Learn Er.=O.05 図 S 太陽黒点データに関する時系列短期予測 結果 合 [6J またはアトラクタのボックスカウント次元の 2 倍より大きい場合 [8J であるが,実際にはこれ以下で も(この場合には D=2) 高い精度の予測が場合によっ ては可能であることを示している. 4.2 太陽黒点データの短期予測 太陽黒点データの 145 ポイント分を学習し,その後の 142 ポイント分に関する予測時間 1-4 の短期予測を試 みた.埋め込みは次元 D=3, ラグ L=1 で行な L 、,

BP

ニューラルネットワークの各層のユユーロン数は,入力 層 3,中間層 20,出力膚 3 とした.このときの予測l時間 に対する相関を図 B に示す. この場合は,学習精度が高いものの方が予測精度が低 くなっており,学習データに対する近似がよすぎて未知 データに対する成績が悪、くなってしまうという,いわゆ る「過学習j の状態を示しているものと考えられる.こ れは,中間層ニューロン数が多すぎることが 1 つの原因 であると考えられる.

5

.

その他の手法

上述のような手法のほか,学習則としてはパックプロ パゲーション則を用いているが,ネットワークの構造等 を工夫したモデルを用いる手法が提案されている [9J [12J. そこで,本章では,これらの手法について概説す る.

5

.

1

松葉らによるモデル [9J 本節では,松葉育雄らによって提案された時系列予測l 用ユューラルネットワーク(本稿では,松葉モデルと記 述する)について概説する.このモデルは,図 7 に示す ような構造を持ち,比較的長期の予測を行なうことがで きるようになっている. このモデルは,基本的には階層構造であり,学習則も 基本的には BP 則を用いている.このモデルと 2. や4. で (25)

3

3

9

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(5)

ま ('+11+ 1) 3;(1十町)

x

{t) x (t 十 n)

x

(t 十 η + 1)

x

(t+N) 図 7 松葉モデルのアーキテクチャ(文献 [9

J

)

述べたものとの大きな違いは,学習時に,予測値に対応 するニューロンの出力値と実際の値との差の絶対値を入 力層の一部に提示するようなフィードパックが付加され ている点である.この構成では,予測時には,予測値と 実際の値との差は O に近くなっているため(このように なっていなければ学習が不十分であることになる), 事 実上フィードパック結合は消滅するようになっている. つまり,学習時には,時系列聞の時間相関を利用し,予 測時には,これを必要としないような巧みなネットワー ク構造が実現されたモデルといえる. また,このモデルにおいては, A 1 C を用いた中間層 ニューロンの最適数の決定法や,対象データのフラクタ ル次元にもとづく入出力ニューロン数の決定法 [9J [IOJ が検討され, さらに, このフラクタル次元から予 測の確信度の評価 [IIJ も経験論的に行なわれており, この点では,比較的長期の予測モデルとしては,実用的 なものであるといえる. 5.2 佐藤らによるモデル日 2J

[

1

3

J

本節では,佐藤雅昭らによって提案された連続時間力 学系のストレンジアトラクタを学習するニューラルネッ トワーク(本稿では,佐藤モデルと記述する)について 概説する. このモデルは,ダイナミックユニット,シグモイドユ ニットと呼ばれる 2 種類のニューロンから構成され,図 S に示すようなリカレント型のネットワークになってい る.これらのユユットの動作は,次式 (8-9) で定義さ れる [12J

[

1

3

]

.

ダイナミックユニット

。 1511山命日間h 加の習oid

図 8 佐藤モデルのアーキテクチャ(文献 [12J) M

dXt

(t

)/dt=

L

:

WtmZm

(t)

(i=l

,

,

N) (8)

"‘

=1 ジグモイドユエット

Zm(巾fC~1

V

mtXt(t) 十九)(m=l ,..., M)(

9) ここで,各変数は, Xi (t い i 番目のダイナミックユユットの出力

Zm(t):

m 番目のシグモイドユニットの出力 Wim: m 番目のシグモイドユニットから i 番目の ダイナミックユニットへの結合係数 Vmi : 番目のダイナミッグユニットから m 番目 のシグモイドユニットへの結合係数

8

m : m 番目のシグモイドユニットへのパイアス 入力 f: シグモイド関数 を表わす. このモデんを用いて,代表的な連続時間力学系である ロレンツ系の方程式(式 (10ー 12)} の解軌道を教師信 号として,図 8 に示す Visible

Dynamic

Units に与

え,その誤差が小さくなるように学醤を行なうと,アト ラクタが再構成できるのみならず,アトラクタ近傍では ロレンツ方程式自体をよく近似できたと報告されている

[

1

2

J

[

1

3

J

.

ロレンツ方程式

dx/dt=10(y-x)

dy/dt= -y+(28-z)x

dz/dt= 一 (8/3)z+xy ( 10)

(

1

1

)

(12)

(6)

6

.

おわりに

本稿で、は,時系列予測にニューラノレネットワークを用 いると L 、う手法,特に,対象データがカオス的な場合に ついて述べた.このような問題は, BP ユューラルネッ トワークの研究として重要な汎化能力を実用的な面から 考察するための興味深い例題ともなっている.また,カ オス的な時系列予測の予測値の評価法は, 2.2 で‘述べた ような指標では十分とは言えず,埋め込み [6J の諸パ ラメータの最適化とともに,カオス自体の研究としても 今後の重要な課題である. なお,本稿の内容の一部は,東京電機大学総合研究所 研究 Q89-S64 として行なった研究成果にもとづくもの である. 参宏文献 [ 1

J

合原一幸編: r カオスーカオス理論の基礎と応用 j , サイエンス社 (1990).

[2J

合原一幸: r カオス一応用を目指して J ,数理科学,

No.348

(1

9

9

2

)

.

[3 J D. E

.

Rumelhart

,

G. E

.

Hinton and R. J

.

Williams :

Learning Representations by Backュ

Propagating E

r

r

o

r

s

.

Nature 323

,

pp.533-536

(

1

9

8

6

)

.

[4 J A. S

.

Weigend

,

B

.

A. Huberman

,

D. E.

Rumelhart :

Predicting The Future: Aconnec.

t

i

o

n

i

s

t

Approach

,

I

n

t

e

r

n

a

t

i

o

n

a

l

Journal of

Neuュ

r

a

l

Systems

,

Vo

l.

l

,

No.3

,

pp.193-209

(1

9

9

0

)

.

[5

J

合原一幸,安達雅春:東京電機大学総合研究所年

報,

No.11 (

1

9

9

2

)

.

[6 J F

.

Takens: Detecting Strange Attractores

i

n

turbulence

,

i

n

Dynamical Systems and Tur.

b

u

l

e

n

c

e

.

Lecture Note i

n

Mathematics

,

898

,

pp.366-381

,

Springer (

1

9

8

1

)

.

[

7

J K. Judd

,

A. 1

.

Mees

,

K. Aihara and M.

Toyoda:

Grid Imaging f

o

r

a

Two.Dimensional

Map". I

n

t

e

r

n

a

t

i

o

n

a

l

Journal of Bifurcation and

Chaos. Vo

l.

l

,

No.l

,

1

9

7

(

1

9

9

1

)

.

[8 J T. Sauer

,

J

.

Yorke and M. Casdagli

IUTAM Symposium on I

n

t

e

rr

e

t

a

t

i

o

n

of Time

S

e

r

i

e

s

from Nonlinear Mechanical Systems

(

1

9

9

1

)

.

[9J

松葉育雄: r パックプロパゲーションによる特徴 1992 年 7 月号 抽出 j ,数理科学,

No.338

,

pp.31-37 (

1

9

9

1

)

.

[

I

O

J

増井裕也,蛇島伸吾,松葉育雄: 1992年電子情報 通信学会春季大会講演論文集,

D-59 (

1

9

9

2

)

.

[

I

I

J

蛇島伸吾,増井裕也,松葉育雄: 1992年電子情報 通信学会春季大会講演論文集,

D-58 (

1

9

9

2

)

.

[

1

2

J

佐藤雅昭: r リカレントネットとカオスと情報処 理j ,数理科学,

No.338

,

pp.63-68

(1

9

9

1

)

.

[

1

3

J

M. Sato

,

Y. Murakami and K. Joe :

Learnュ

ing Chaotic Dynamics by Recurrent Neural

Networks

,

Proceedings of t

h

e

I

n

t

e

r

n

a

t

i

o

n

a

l

Conference on Fuzzy Logic & Neural Networks

,

pp.601-604 (

1

9

9

0

)

.

会合記録 5 月 18 日(月) 庶務幹事会 6 名 5 月 19 日(火) 研究普及委員会 9 名 5 月 20 日(水) 編集委員会 6 名 5 月 21 日(木)理事会 15名 第 1 回理事会議題 η4 F吋,, 4 4

1

.

平成 3 年度評議員会議事録の件 2. 平成 3 年度第 7 回理事会議事録の件

3

.

平成 4 年度通常総会議事録の件 4. 入退会の件 5. 各支部総会報告の件 6. 平成 4 年度委員会委員・幹事委嘱の件

7

.

各委員会報告(合,今年度の運営方針)

(

2

7

)

3

4

1

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

図 2 アトラクタ再生または時系列予測用ニ ューラルネットワーク

参照

関連したドキュメント

常時 測定 ※1 可能な状態において常に測定 ※1 することを意味しており,点 検時等の測定 ※1 不能な期間を除く。.

世界的流行である以上、何をもって感染終息と判断するのか、現時点では予測がつかないと思われます。時限的、特例的措置とされても、かなりの長期間にわたり

最後に要望ですが、A 会員と B 会員は基本的にニーズが違うと思います。特に B 会 員は学童クラブと言われているところだと思うので、時間は

第一の場合については︑同院はいわゆる留保付き合憲の手法を使い︑適用領域を限定した︒それに従うと︑将来に

★分割によりその調査手法や評価が全体を対象とした 場合と変わることがないように調査計画を立案する必要 がある。..

大村 その場合に、なぜ成り立たなくなったのか ということ、つまりあの図式でいうと基本的には S1 という 場

予測の対象時点は、陸上競技(マラソン)の競技期間中とした。陸上競技(マラソン)の競 技予定は、 「9.2.1 大気等 (2) 予測 2)

自動車の走行に伴う道路交通騒音(L Aeq )の予測手順は、図 6.4-9に示す手順に従って 行った。. 図 6.4-9 道路交通の騒音レベルの予測手順