白解説〔
,、サ 、警 やユ
最近の GMDH の方法論と応用
田村坦之・近藤正
1
.
まえがき 最近,システム工学は,環境問題,交通問題,資源問 題など現象が複雑で従来の専門科学のみによる取扱いが 困難な問題に対して,その問題解決への貢献が期待され ている.しかしながら,このような実システムでは,非 常に多くの変数やパラメータを含み,しかも,それらが 相互に結合しあっているために,専門分野の知識のみに 依存してシステムのモデリングを行なうことが一般的に いって困難である.ソ連のキエフ学派に属する A.G
.
Ivakhnenko らによって提案された GMDH Il吋 '(GroupMethod o
f
Data
Handling) は,このような複雑な構 造をもった非線形システムに対して,入出力データから 発見的自己組織化 (Heuristic self-organization) の原 理にもとづいてモデリングを行なう方法論を与えてい る. GMDH は,i
)
数少ない入出力デ{タで非線形システムのモデリン グを手軽に行なうことができる,i
i
)
システムの構造に関する先験的な情報を必要とする ことなく,モデル構造の自己選択が!可能で、ある, といった利点をもっているが,その反面いくつかの問題 点も含んでおり, 1968年に基本的 GMDH が提案されて 以来,数々の改良がなされてきた. GMDH の改良は, より適切な複雑さをもっモデ、ノレの構成の方法に関するも のと,モデノレの選択規準に関するものがほとんどであ る. GMDH の基本的概念である自己組織化の原理や基 本的 GMDH の構造に関しては,すでにすぐれた解説5) があるので,ここではこれらについてはふれず,おもに GMDH の実用的な面,つまり,基本的 GMDH のアルゴ リズムとそれに加えられた改良,および, これらの GM DH の実際問題への応用などについて解説する.2
.
基本的 GMDH
システムの入力変数 (X"X2
,
Xm
) と出力変数ゆと の聞に 。 =/(x" X2, ・ Xm)(
-
)
1
0
4
という従属関係があるものとする. (1) 式をシステムの 完全表現式という.システムの完全表現式として,たと えば,多項式, Bayes 関数,周期関数,有理関数などを 用いた GMDH のアルゴリズム叫が,りが考えられている が,ここでは,その中で現在もっとも多く用いられてお り,利用価値の高い Kolmogorov-Gabor の多項式,。 =ao+ 子 aiXi+ I: 子 aげiXj
+
I:I:I: aiikxixiXk+. …・,
(2)
J Ic を用いたアルゴリズム引,')について説明する.この多項 式は,原理的に 2 変数の組合せによる 2 次多項式(これ を部分表現式という), Yk=bo
+b1
x色 +b2
Xj+b3
XiXj+ ん舟 ;2+b5
xlk=I
,
2
,
m(m-l)/2
(3)
を仲介させることによって構成することができる.ここ で仇を中間変数という.以下に基本的 GMDH のアル ゴリズムを示す. 〔ステップ 1J
システムの入出力変数を決定し,必要があればデ{タ の前処理を行なう. 〔ステップ 2J
入出力データを,部分表現式(( 3) 式)のパラメータ推 定に用いる training データと,中間変数 (Yk) の選択 に用いる checking データの 2 組に分割する.分割の 方法は training データと checking データを交互に わける方法,あるいは分散の大きいデータを training データに,分散の小さいデータを checking データに わける方法などがよく用いられている. 〔ステップ 3J
2 変数の組合ぜをつくり training データを用いて, 部分表現式のパラメータ bo
,b
1,
...んを,最小自乗 法によって推定する. 〔ステップ 4J
得られた部分表現式により, checking データに対す る自乗誤差, Nch&Ch=
I
:
( ゆる -Yki)2(4 )
を計算する.そして,この値が小さくなるものから順 に L 個の中間変数を選択(閥値的自己選択)し,残りは 捨てる. (4) 式を regularity criterion とよぶ .
N
Ch は checking デ{タの個数をあらわす. 〔ステップ 5J
Xi=Y
i>Xj=Yj として再びステップ 3 と 4 の操作を繰 返す.このようにして 2 変数の 2 次多項式を多層に 積重ね, checking データに対する自乗誤差が改善さ れなくなったところでこの繰返し操作を打切る. これらの操作により,第 T 層を通過させて計算を終了す ると,出力変数併を,もとの入力変数に関する 2T次の 多項式によって構成したことになる.基本的 GMDH の ブロック図を図 1 に示す.ここで、述べたアルゴリズムで は,部分表現式として(3
)式の 2 次式を用いているが, このほかに部分表現式として提案されているものを以下 に列挙する. (i) 次式の部分表現式Yk=bo+blXi+b2Xj
(5) 部分表現式に l 次式を用いると,システムの完全表現 式もやはり 1 次式になる.(
i
i
)
2 次の部分表現式 双線形の部分表現式として,Yk=bo+b
,
Xi+b2Xj+b3XiXj
,
(6) 推定すべきパラメータの数を減少させる部分表現式と して, Xk
= 初旬 +(l -W)Xj W: 重み (7a)Yk=bo+blXk+b2Xk2
(
7
b
)
が提案されている 8)(
i
i
i
)
2 次よりも高次の部分表現式叫引Xi=bo+blXi+b2Xi2
(8a) Xj=bo
' 十 bt' Xj 十九'Xl(
8
b
)
Yk=CO+C
,
Xi+C2Xj+C3
X.乙 Xj+C. X;"
+c
5X
j 2 (8c) この式を用いると,第 T 層を通過した段階で,もとの 入力変数に関して 4T次の多項式が構成される.
以上の議論から明らかなように,基本的 GMDH のアル 、 i2n E X -n h い 1 原データの分割 ll: 中間変数の自己選択 ill: 閥値の最適化 G: 部分表現式の発生器ー 図 1 基本的 GMDH のブロック図 1978 年 2 月号 ゴリズムには,H
I
.
入出力データの training データと checking デ ータへの分割の仕方を決める,H2.
各層で選択する中間変数の個数を設定する,H3.
部分表現式の形を設定する, といった heuristics を含んでいる.このため,予測精度 のよいモデルを得るためには,これらの heuristics の最 適化を行なう必要があり,かなりの回数の GMDH の繰 返し計算を必要とする.さらに,基本的 GMDH にはつ ぎのような問題点が存在する,L
I
.
同定されるモデルは 3 つの heuristicsHI
,
H2
,
H3 に大きく左右される.L2.
部分表現式として 2 次以上の式を用いる場合,次 数が低くて,数多くの入力変数を含むモデノレは得 られず,入力変数の数の多いモデルは不必要に複 雑になりすぎる.L3.
同定されたモデノレの training データに対するあ てはまりはよいが, checking データに対するあ てはまりは悪い. つぎに,これらの問題点を克服するために考えられて きた GMDH の改良点について述べる.3
.
GMDH の改良 GMDH の方法論的な改良については,問題点 L2 を 克服するために部分表現式の構成の方法に改良を加えた ものと,問題点 L3 を克服するためにモデルの選択規準 に改良を加えたものがほとんどである.まず,部分表現 式の構成の方法のみに改良を加えたものを示す.(
i
)
(
3
)式に,有意性の検定を用いた変数の逐次選択 法を適用して,部分表現式を構成するアルゴリス‘ム 10)• この方法では,h
e
u
r
i
s
t
i
c
s
H3 は不必要になり,ま た,問題点 LI の一部と L2 が改善される.しかし, 部分表現式を構成する際に training データの情報だ けを用いるので,問題点 L3 は改善されていない.(
i
i
)
checking データに対する自乗誤差が最小になる ように部分表現式の形を選択するアルゴリズム 11) この方法でも,h
e
u
r
i
s
t
i
c
s
H
3 は不必要となり,問 題点 LI の一部と L2 が改善される.さらに L3 もか なり改善される.このアルゴリズムのブロック図を図 2 に示す. これらの 2 つのアルゴリズムでは,基本的 GMDH と 比べて完全表現式は非常に簡素化され,予測精度もよく なることが報告されている. つぎに,部分表現式の構成の方法とモデノレの選択規準 の両方に改良を加えたアルゴリズムを示す.(
i
i
i
)
unbiasedness
criterion を用いる組合せ的 GM1
0
5
© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.X
,
Xm 1 原データの分割l II: 最適な部分表現式の自己選択 ill: 中間変数の自己選択G
1 :フィノレター IV: 闘値の最適化 G2
: 単一入力基本関数 図 2 改良形 GMDH(ii) のプロック図 1口 DH のアルゴリズム ω , 18) • この方法は,1
vakhnenko によって提案されたもの である. 組合せの発生による部分表現式の構成法 12): これは(3
)式の 2 次多項式を用いるかわりに, 表 1 に示した変数の組合せを発生し, その中である規準(un b
i
a
s
e
d
n
e
s
s
c
r
i
terion) をもっとも小さくするもの を部分表現式として用いる方法である.unbiasedness c
r
i
t
e
r
i
o
n
18) この規準は問題点 L3 を改善するために考えられた ものである. まず,入出力データを 2 組 A1> A2
に分割し,それ ぞれのデータの個数をRb R2
とする. A1
をtraining データ , A2
を checking データとして, 部分表現式 Yk*=fl(Xio Xj) を求める.つぎに,データの割ふりを 交換して A1
を checking データ , A2
を training データとして,部分表現式Yk料 =f2(Xi , Xj) を求める. 第 T層の h 番目の組合せに対する unbiasednessindex
t土, φ Rl+R2 nTk= 瓦再三 (Ykr*-Ykr**)2(9)
である.第 T 層における unbiasedness criterion は, l F NT
= 云L:n
Tk (10) • k=1 である.ここで , F は第 T 層において選択された中間 変数の個数をあらわす.unbiasedness
criterion を用いる組合せ的 GMDH のアルゴリズムはつぎのようになる. まず第 1 層では,入出力データを 2 組に分割し,各 入力変数の組合せに対して, 表 1 の多項式の unbiasedness
index を計算し,各組合せに対する部分表 現式を決定する,つぎに,unbiasedness
index の値 の小さい中間変数を F 個選択し, (10) 式の unbiasedn
e
s
s
criterion を計算する.第 2 層以下では,第 1 層 と同じ計算を繰返して行なう.多層構造の層の打切り は NT
が改善されなくなったところで行なう. このアルゴリズムでは,問題点Ll の一部と L2 , L3 が改善されている. しかしながらデータを 2 組に 分割しているため, 依然として heuristicsH
1 を必 要とする.また基本的 GMDH に比べて計算量はかな り増加することになる. (i v) 構造安定性とパラメータ安定性を用いるアノレゴリ ズム 14) 構造安定性: データを 2 等分割し,最小自乗法でデータ 1 から求 めた部分表現式のデータ 2 へのあてはまりの程度を自 乗平均誤差で評価し,つぎにデータの役割を交換して 表 1 部分表現式の構成 12)D
I
2
3
4
5
6
襲
│
幻阿=引1
I円
I2
2
2=
4
門
i
幻円一=斗北1“6
2
日一
5
=司叫=
3匁2l
引門…=司叫
a向o
I勾…=司司叩
a向叩
l
X
叫
円……=ヰ司叩
F
勾
a
向附仇
ω2
戸
2
X
句吋z♂
2
勾円一…一=司司叩吋
a向削帆
a戸州♂引1
勾干円……=ヰ叩吋
a附帆
ω
…戸
A
仰
.X
1
戸山
的2
X
3
2
I勾
F
門………=司叫叩吋
a偽附帆
5戸州
Z引1
Z 勾2汁+Z引 勾.+ZZ 引 勾4汁Z +Z引 勾sけZ +Z角 Z勾6+Z引1
部分表現式の右辺
Z.+Z2 Z.+Z2+Z,
Z. 十 Z2 Z5+ Z • Z5+ ね +ZI Z5+Z2 Z6+Z2 Z.+Z2+Z1 Z5+Z2 +Z1 Z6+Z1 +Z2 Z. 十 Z. Z5+ Z • Z6+ Z • Z,
+Z3+ Z,
Z.+Z. 十 Z2 Z.+Z3+ Z 2+Z,
Z5+ Z .+ Z,
Z5+Z. +Z2 Z6+ Z .+ Z,
Z5+ Z .+ Z 2+Z,
1
0
6
ま Tこは,
AIC=NlogeS/+2(k+
1
)
+ C
。 , NSk"= 元EJos-oz)2
k: 変数の個数 を計算し, PSSI71 または AICl引を評価規準にした変 数選択の方法によって自動的に行なう .L は中間変数 の選択個数の最大値を意味するが,この値は heuristic に決めるのではなく,計算機メモリの許される範囲内 でできるだけ大きくとる.層を積重ねるにつれて,中 間変数の個数は次第に減少すると同時に発生器 G4 の 個数が増加する.部分表現式の発生器がすべて G4 に なった層において,層の積重ねを停止する.なぜなら ば,さらに層を重ねても,前層と同ーの中間変数を生 成し, PSS または AIC の値が改善されなし、からであ る.最終的に, システムのモデノレは,最終層に残った 中間変数の(重みつき)平均の形で構成する.このアル ゴリズムで、は, 入出力データを training データと checking データに分割せずに,すべてのデータを用 いてモデノレの予測誤差を推定し, この推定値をできる だけ小さくするように部分表現式の変数選択,中間変 数の選択,多層構造の層の打切りを行なっている.そ の結果,h
e
u
r
i
s
t
i
c
s
H
1
~H 3 を必要としないアルゴ リズムを構成しており, 問題点 L1~L3 を克服して いる.さらに他の GMDH と比べて,より少ない計算 量で,簡単でしかも予測精度のよいモデルを容易に見 つけることが可能である. 以上の GMDH の改良は, 問題点 L1 ~L3 を克服す るために,部分表現式の構成の方法とモデルの選択規準 に対して行なわれたものである.このほかにも実用的な 見地からいくつかの改良が考えられている.以下にこれ らのアルゴリズムについて簡単にふれておく. (vi) 長期予測を目的とした balance-of-variables criterion を用いるアルゴリズム ω , 20) これは Ivakhnenko によって提案された長期予測 を目的としたアルゴリズムであり,balance function
を用いるもの, また direct function と inversefunction を用いるものなどいくつかの方法が提案さ れている.これらのアルゴリズムに関しては紙数の関 係上説明を省略するが長期予測に興味のある方は巻末 の文献を参照されたい. (vii) 新しい入出力データに対して逐次的にパラメータ を更新させるアルゴリズム 9) これは,基本的 GMDH によってすでにモデルの構 造が求まっている時に,さらに新しい入出力データが 得られた場合,モデノレの構造は変化させずに逐次形最 小自乗法を適用してパラメータの値のみを更新してい
(
1
2) 自乗平均誤差を求め,それらの和の小さいものを構造 的に安定な部分表現式であるとする.大きいものほど 不安定な部分表現式であるとする. パラメータ安定性: 各 2 次多項式において,データ 1 , 2 で独自に求め た回帰係数が互いに近い値を示す項をパラメータ的に 安定な項,大きく異なっている項を不安定な項とよぶ. これらの安定性を用いたアルゴリズムはつぎのよう になる.各選択層における部分表現式は, (3)式の 2 次多項式に含まれている項の中でパラメータ的に安定 な項のみによって構成し,中間変数は構造的に安定な ものから順に選択する.そして,構造安定性が改善さ れなくなったところで層の打切りを行なう.構造安定 性は Ivakhnenko が提案した unbiasednessc
r
i
t
e
r
i
o
n
とほとんど同等なものであり,このアルゴリズムにお いても,問題点 L1 の一部と L2 , L3 が改善される が,データを 2 組に分割しているため,h
e
u
r
i
s
t
i
c
s
H 1
はやはり必要である.(
v
)
モデルの選択規準に,予測平方和(Prediction
Sum o
f
Squares) あるいは情報量規準 AIC を用いるアルゴリズム ω , 16) • このアルゴリズムのブロック図を図 3 に示す.図 3 において , Gl~G4 は部分表現式の発生器を意味す る.どの発生器を選択するかは , N個のすべてのデー タを用いて, !!.(仇 -tþi
¥
2
PSS= I; (._m , ~mm t'Si=可 (XTX)-lxJ.__)
(
l -)
世一回一
一巨ト
一回一
一匹ト
. 111 X,
-
X2-
.
.
.
.
.Tm_l-
X m-
νl 1 中間変数の自己選択 (a) プロック図 1 抑 = bo+ b , Xι 十 b, Xj+
b3Xi Xj+
b.X~i
十九 X;ゴヨーイ y,= b刊 X
i
十b, Xj+ b
3X, あ
二回一川 =bo+ 叫十九 Xj
--êト
図器ク
生ツ
発ロ
のプ 式の現村
川釘沼
什却叩
t4hH 司 3一「適引
h最財
-扮改
戸 U 一 S 一図 抑 =bo+b , Xι 十九 X'1
0
7
1978 年 2 月号 © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.くアルゴリズムである.このような方法を時系列デー タに適用すると,安定な予測値が得られることが報告 されている. (viii) システムの中間表現式を構成するアルゴリズム 2 !l いままで述べてきた GMDH のアルゴリズムでは, 各選択層において中間変数を入力変数にした部分表現 式を構成して,これらを多層に積重ねているために, システムの入出力変数聞に存在する物理的意味を明確 に表現した多項式の構造を正確に求めることは,一般
的に困難であった.しかし,各選択層において,部分
表現式のかわりに,もとの入力変数の一部と出力変数 の関係をあらわず中間表現式を構成することによっ て,ある程度の可能性を見い出すことができる.中間 図 5 イギリス経済における入出力変数の動き的 表現式を用いる GMDH のブロック図を図 4 に示す. じめに,傾向変動を重回帰分析により取り除き,残った ここで , fiω , fiω は各選択!習において構成した i 番 変動に対して,基本的 GMDH を適用している.システ 目の中間表現式をあらわず.このアルゴリズムで、は, ムの部分表現式としては, (3) 式を用いている. 情報量規準 AIC を用いて,中間表現式に含まれる変 世界人口のモデリング 8) 数の選択,中間表現式の選択,多層構造の層の打切り GMDH を動的世界人口のモデリングに応用している. を行なっており heuristicsH
1
~H3 を必要とせ モデルとして,ず,問題点 L I~L3 を克服している Pn=f(Pn- l> Pト 2 , P
n
-3
; En , En-bEη_2 , Eη-3 '以上の GMDH の改良のほかにも,
1
vakhnenko らの グループにおいて数多くの研究がなされており,これら は文献22) , 23) に集大成されている.4
.
応用例
4
.
1
基本的 GMDH の応用 ここでは,基本的 GMDH の応用例を紹介する. イギリス経済のモデリング 3) Ivakhnenko は,図 5 に示すイギリス経済のデータに GMDH を適用している.ここで, Vjは住民税,む2
は法人税, V. は失業者に支払う保険料
V. は資本
V5
は政 府支出,伊b ({J 2 は経済指標をあらわし, 1954年 ~1968 年のデータを用いてシステムの同定を行ない, 1969年度 の仰と仰の値を予測している.同定方法としては,は x,
x,
x,
x,
1
0
8
第 l 層第 2 層4iヨ4;;1;1
j{1lイ河主: I コ2
j/-lごjll'j~/-l _
r - ïJ
';;.,)f~l? 草葺4J12
1 最適な中間表現式の自己選択 一ーゆG
hG2,
G3
: 最適な中間表現式の発生器 図 4 改良形 GMDH(viii) のブロック図2日Fn
,
Fn-
l>F
n
-
"
Fη 四 3)(
1
3) を仮定している.ここで, Pη: 第 n 時点、の世界人口, En: 第河時点の l 人当り世界消費エネノレギ「 Fn: 第 n 時点の l 人当り世界食糧生産指数. システムの部分表現式としては, (7)式を用いている. 入出力変数の変動が比較的なめらかな問題に対しては, (7)式のような部分表現式を用いることが有効であるこ とが示されている. 河川の流出量予測日, 91 測定データとして, 日々の鳥川流域(利根川上流)にお ける降水量 (mm) ,水位 (m) ,流出量 (m3/sec) が昭和40 年日月 1 日 ~6 月 30 日までの 2 カ月間にわたって与えら れ,このデータに GMDH アルゴリズムを適用して 1 日 先の流出量の予測を行なっている.部分表現式として は, (6) 式および (8 )式を用いている.同定に用いるデ ータの使用期間は, 予測すべき日の前 30 日聞としてい る.予測期間は, 1965年 6 月 l 日 ~30 日である.従来の 水文学の立場から開発された流量予測モデル(菅原法お よび貯惚関数法)による予測結果との比較を行なってお り,比較結果は図 S のようになっている. その他の応用例: Ivakhnenko らのグループは, 1968年以来基本的 GM DH の応用を数多く行なっており,これらの結果は,雑 誌 rSovietA
u
t
o
m
a
t
i
c
ControlJ に報告されている. また,わが国におけるその他の応用例としては,佐藤氏 © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.リ“ハり Q 打、 loo をリ 4 。 l l JF 丘二 JXl 日)日 H •• q( 1) 真相 • • q
,
*itl(CMD
Il)
' " q3*
(1、(菅原 j'.t\ ローーロ q ,*
i t!(附'WWJ,]数法)h
¥
品A
~ 場」一一一一」ー-6/25
(ì /~O6/15
G
!
2
1l1
9
6
5
河川流出量の予測~9)6/5
j(j 24 :l2 40 4~5
6
li4 72 ~初出, ~)(j 10.1 1970 坦 1971 Sangamon 河における (NO:i"-N) レベルの予測ω(
1970~1971 年)週 Ho
図 7 図 S わめて困難であったが GMDH によって実用的な予測精 度をもっモデノレを構成て、きたことが報告されている. 広域大気汚染濃度パターンの同定 1 1),
15)
図 8 に示すような大気汚染濃度パターンの同定を,ア ルゴリズム (ii) と (v) を用いて行なっている.同定方法 のブロック|苅を図 9 ìこ示す.まず,排出源とモニタリン グステーションにおける汚染濃度を関係づける大気汚染 伝播マトリックスを軍回帰分析により同定し,マトリッ クスを用いて,窓問的な汚染濃度パターンの第 l 近似値 を予測する.そして,この予測値とモニタリングステー ションにおける観測値との差に,改良形 GMDH を適用 し,第 1 近似値を補正することによって広域大気汚染濃 度パターンを同定する.観測データのない地点に対する 予測精度は, による空容器回収量予測への応用 24) ,森田氏らによる製 鉄所プロセスのモデリングへの応用 25) などがある.4
.
2
改良形 GMDH の応用 ここでは,改良形 GMDH(i), (i
i)
,
(v) の環境汚染 問題への応用例を紹介する.他の改良形 GMDH の応用 例については,巻末の文献を参照されたい. 水質汚染濃度の短期および長期予視~10):
これはアノレゴリズム (i) の応用で, Decatur 湖の San gamon 河と, Shelbyvill の Kaskaskia 河流域におけ るトウモロコシ地帯 (Corn Belt) の水質汚染を取扱って いる.汚染物質として,硝酸塩をとっており,表 2 に示 す入出力変数聞の関係を GMDH により求めている.汚 染レベルの予測は,離散時間幅が 1 週間の短期予測と, 1 年間の長期予測の 2 つについて行なっている.短期予 測の結果を図 7 に示す.現象が非常に複雑であるために 従来の現象論的な方法によるシステムのモデリングはき Sangamon 河流域における (NOトN) の短期予測に用いる測定変数 10)
Source
CBNS*
CBNS
CBNS
CBNS
CBNS
CBNS
U. S
.
Dept
.
Int
.
U. S
.
Dept
.
Comm.
Dec. Water Dept.
USDC
USDC
USDC
USDC
USDC
USDC
c
a
l
c
u
l
a
t
e
d
c
a
l
c
u
l
a
t
e
d
Variable
(NOiï)
,
Sangamon River
Cisco
(NOã)
,
Sangamon River
Input t
o
Lake Decatur
(NOã)
,
Sangamon River
Montice
l
1
o
(j
15N
,
Sangamon River
Cisco
(j
15N
,
Sangamon River
Input t
o
Lake Decatur
占15N,Sangamon River
Montice
l
1
o
Discharge o
f
Sangamon River
,
c
f
s
Montice
l
1
o
P
r
e
c
i
p
i
t
a
t
i
o
n
Decatur
P
r
e
c
i
p
i
t
a
t
i
o
n
Decatur
S
o
i
l
temperature 4
"
below surface
Urbana
S
o
i
l
temperature 8
"
below surface
Urbana
Air temperature
,
maximum
Decatur
Air temperature
,
minimum
Decatur
Pan evaporation
Urbana
Wind
,
t
o
t
a
l
/
day
Urbana
NOi load(disch.
(
7
)
times aver
.
o
f
(1
,
2
,
3))
Ava
i
1
able n
i
t
r
a
t
e
Cerro Gordo
Location
V Ae
・ 0 m 一仁乙 14hRA67h&Qh 仏 1hn ,h34UFL ふ 7hu
l
l
1
1
1
1
1
1
N
1
0
9
キCenter
f
o
r
the Biology o
f
Natural Systems
,
Washington University
,
St
.
Louis
,
Mo.
1978 年 2 月号 © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.GMDH に関する種々のアルゴリ ズムとその実際問題への応用につい て述べた. GMDH は原理的には, データさえあれば, どの分野にも応 用が可能であるが,対象分野の理論すなわち現象論とは 無関係に,単に入出力データの統計的な解析だけに頼っ てブラックボックスモデルを導出すると,対象分野を理 論的に研究している人たちからは, I理論なき安易なモデ ノレ」としてひんしゅくを買う結果におちいるので注意を 要する.現時点における応用に関する結論としては,対 象となるシステムの非線形性が顕著で,しかもその分野 の個別理論が未発達であり,利用できるデータ数が少な く,モデリングのシステム的方法論としては GMDH 以 外には考えられないときに手軽に応用してみる,といっ た使い方がもっとも適切な使い方ではないかと考える. 今後,さらに有用な改良形 GMDH が開発されることを 期待したい. 染の短期予測によく使われている線 形モデルとの比較を行なっている. 3 時間先の予測精度の比較を図 11 に 示す.線形モデルと比べてかなり予 測精度が改善されていることがわか る. むすぴ
5
.
「一一一一一争 Y土/\
ヱ2豆 .583.
6
9
5
_
1.120 打主刊 2 .;J仰)J99~ お7 1 迎 l戸戸
I,J)銭 2.20叫L 匂Z 1.5
5
2
1J!盛 3.1ω11M2¥ /
1.1
4
5
J~ 1.6
7
3
1,臼Z2
.
0
2
3
b鎧皇ド 589¥ j
uil 1.6
2
9
1
.
6
7
8
1.7
5
4
1.98生 2.144 ,"~(
b
)
出力値(汚染濃度)0
5
4
.
0
2
7
nU ハUAU ハυ ハU ハりハり 「一一一一一争 Y1 0 0 0 0 0 0
1 0 0 0 0 0
X O O O O O Oo
0 0 0
0
;
1 0 0 0 0 0
0.2 十 0.20 0 0 0 0 0
0
.
5
0 0 0 0 0 0
入力値(排出強度) (a) 複数排出源に対するシミュレーション結果ω 図 8 改良形 GMDH と汚染伝播マトリックスによ る予測システムのプロック図 15) 図 g 献1
)
A. G. Ivakhnenko: The Group Method o
f
Data Handling
,
A Rival o
f
the Method o
f
S
t
o
c
h
a
s
t
i
c
Approximation;
S
o
v
i
e
t
Auto骨zaticControl
,
1-3
,
43/55 (
1
9
6
8
)
.
2
)
A. G. Ivakhnenko :
Heuristic
Self-Organizaーt
i
o
n
i
n
Problems o
f
Engineering Cybernetics;
Automatica
,
6-2
,
207/219 (
1
9
7
0
)
.
1
5
0
0
文 ラ巷 参 基本的 GMDHJ=23.1%
改良形 GMDH (i i)J=19.7%
改良形 GMDH(v)J=16.2%
である.基本的 GMDH に比べて,予測精度が大幅に改 善されていることがわかる. 大気汚染濃度の短期予測 16) アルゴリズム (v) を用いて,汚染質 S02 の 1~3 時間 先の短期予測を行なっている.出力変数としては S02 の 1 時間先の値をとり,入力変数としては S02 の過去 6 時間分の値をとっている.2
,
3 時間先の予測値は, 同定したモデルに 1 , 2 時間先の予測値を代入すること により求めている.同定に用いたデータの使用期間は 10 日間である.同定は 1 日ごとに繰返し行なっている.図 10 に 1 時間先の予測結果を示す.また,従来から大気汚 企一一企重回帰モデ/レ u 一一自己回帰モデル - G M D H E"
"
0. 0. 1刷 1000 縦 玉F 性ト 咲 -JTI三 500
翌三 副 。 ぴコ ー一一・真 前 ら ~T. ;nljfi{{ (GMDH)1
5
0
~1∞ E .c 0. 0. N O Uコ5
0
1
2
2
4
1
2
2
4
1
2
~41
2
2
4
1
2
2
4
6
J
J
8
H 月 9lJ6
J
J
lOII6
1
1
1
1
1
1
6
1
1
1
2
1
1
図 10 改良形 GMDH(v) による S02 濃度の 1 時間先の 予測値 16) 図 113
)
A. G. Ivakhnenko
Polynomial Theory o
f
Complex Systems; IEEE Trans. Syst.
,
Man
,
Cybern.
,
SMC-I-4
,
3
6
4
/
3
7
8
(
1
9
7
1
)
.
4
)
A. G. Ivakhnenko
,
e
t
a
l
.
:
Group Handling
。fData i
n
I
d
e
n
t
i
f
i
c
a
t
i
o
n
o
f
the S
t
a
t
i
c
Charュ
a
c
t
e
r
i
s
t
i
c
o
f
a Mu
1
t
i-Extremal Plant; S
o
v
i
e
t
Automatic Control
,
2-2
,
3
0
/
3
7
(
1
9
6
9
)
.
5
)
池田三郎,植木義一 :GMDH( 発見的自己組織化法)と複雑な系の同定・予測;計調u と制御 14-2 ,
1
8
5
/
1
9
5
(
1
9
7
5
)
.
6
)
A. G. Ivakhnenko and M. M. Todua: Preュ
d
i
c
t
i
o
n
o
f
Random Processes Using S
e
l
f
ュ
Organization o
f
t
h
e
Prediction Equations
,
Part 1 Problems o
f
Simple Medium-Term
P
r
e
d
i
c
t
i
o
n
;
S
o
v
i
e
t
Automatic Control
,
5-3
,
3
5
/
5
2
(
1
9
7
2
)
.
7
)
D. L
.
Dylbokova and I
.
S
.
Dylbokov :
Preーd
i
c
t
i
o
n
o
f
Trends o
f
Development o
f
D
i
g
i
t
a
l
Computers by GMDH
Using Linear-Fraction
P
a
r
t
i
a
l
Descriptions and Balance-of-Variables
C
r
i
t
e
r
i
o
n
;
S
o
v
i
e
t
Automatic Control
,
8-2
,
24/30
(
1
9
7
5
)
.
8
)
井原二郎:改良形 GMDH ー動的世界人口モデルの場合一;システムと制御,
19-4
,
2
0
1
/
2
1
0
(
1
9
7
5
)
.
9
)
S
.
Ikeda
,
M. Ochiai and Y. Sawaragi: Seュ
q
u
e
n
t
i
a
l
GMDH Algorithm and I
t
s
Applicaュ
t
i
o
n
t
o
River Flow Prediction; IEEE Trans
Syst.
,
M仰,Cybern.
,
SMC-6-7
,
473/479
(
1
9
7
6
)
.
1
0
)
J
.
J
.
Duffy and M. A. Franklin: A Learnュ
ing I
d
e
n
t
i
f
i
c
a
t
i
o
n
Algorithm and I
t
s
Appliュ
c
a
t
i
o
n
t
o
Environmental System ;
IEEE Trans.
Syst.
,
Man
,
Cybern.
,
SMC-5-2
,
2
2
6
/
2
4
0
(
1
9
7
5
)
.
1
1
)
田村坦之,近藤正:部分表現式の次数を自己選択する改良形 GMDH とその広域大気汚染濃度パター
ンの同定への応用;計測自動制御学会論文集,
1
3
-4
,
3
9
/
4
5
(
1
9
7
7
)
.
1
2
)
N. A. Ivakhnenko and M. Z
.
Kvasko :
Comュ
bination-Generating GMDH Algorithms i
n
which the Regularity o
f
Both Symmetrical
and Nonsymmetrical Polynomials i
s
Checked ;
S
o
v
i
e
t
Automatic Control
,
5-5
,
3
3
/
3
8
(
1
9
7
2
)
.
1
3
)
A. G. Ivakhnenko
,
e
t
a
l
.
:
Discovery o
f
Physical Laws by GMDH Method with the
Absence-of-Bias Criterion; S
o
v
i
e
t
Automatic
Control
,
6-6
,
3
2
/
4
5
(
1
9
7
3
)
1
4
)
遠藤明男,畑中浩 :GMDH による非線形制御系1978 年 2 月号
の同定;制御理論シンポジウム(計担u 自動制御学会
主催),
93/98 (
1
9
7
4
)
1
5
)
H. Tamura and T. Kondo: Large-Spatial
Pattern I
d
e
n
t
i
f
i
c
a
t
i
o
n
o
f
Air P
o
l
l
u
t
i
o
n
by A
Combined Model o
f
Source-Receptor Matrix
and Revised GMDH;
P
r
o
c
.
IFAC Sympo.
0舟Environmental Systems Planning
,
Design and
Control
,
373/380
,
Kyoto (Aug. 1
9
7
7
)
.
1
6
)
田村坦之,近藤正:改良形 GMDH による大気汚 染濃度の短期予測;第 9 回確率システムシンポジウ ム講演論文集(日本自動制御協会主催),L2
,
1
2
7
/
1
3
0
(
1
9
7
7
)
.
1
7
)
奥野忠ーほか:続多変量解析法;日科技連(1 976).
1
8
)
赤池弘次:情報量規準 AIC とは何かーその意味 と将来への展望一;数理科学,n
o
.
1
5
3
(
1
9
7
6
)
.
1
9
)
A. G. Ivakhnenko
,
e
t
a
l
.
:
Long-Term Preュ
d
i
c
t
i
o
n
o
f
Random Processes by GMDH
Algoュ
rithms Using the Unbiasedness C
r
i
t
e
r
i
o
n
and
Balance-of-Variables Criterion; Part 1
,
S
o
v
i
e
t
Automatic Control
,
7-4
,
4
0
/
4
5
(
1
9
7
4
)
;
Part 2
,
S
.
A.
C.
,
8-4
,
24/38 (
1
9
7
5
)
;
Part 3
,
S
.
A.
C.
,
9-2
,
2
8
/
4
2
(
1
9
7
6
)
;
Part 4
,
S
.
A.
C.
,
9-4
,
1
6
/
2
7
(
1
9
7
6
)
.
2
0
)
A. G. Ivakhnenko and B
.
K. Sveta
l
'
skiy:
Self-Organization o
f
World Dynamics Model
according t
o
F
o
r
r
e
s
t
e
r
'
s
Data and Control
Synthesis by S
e
l
e
c
t
i
n
g
t
h
e
V
e
r
t
i
c
e
s
o
f
the
Hypercube o
f
F
e
a
s
i
b
l
e
Controls; S
o
v
i
e
t
Autoュ
matic Control
,
8-1
,
25/40 (
1
9
7
5
)
.
2
1
)近藤正,田村坦之:情報量規準 AIC を用いた改良形 GMDH; 第 3 回システムシンポジウム講演論文
集(計測自動制御学会主催),