計 測 自 動 制 御 学 会 論 文 集
Vol.35, No.4, 489/495 (1999)
リア プ ノ フ直 接 法 に よ る非 線 形 シ ステ ム の
ニ ュ ー ラル 安 定 化 制 御 器 の 設 計
志
水
清
孝 *・伊
藤
和
幸
Design
of Neural
Stabilizing
Controller
for Nonlinear
Systems
via Lyapunov's
Direct
Method
Kiyotaka SHIMIZU* and Kazuyuki ITO
This paper is concerned with a neural stabilizing controller of general nonlinear systems. The stabilizing state feedback control law is approximated with a multi-layered neural network. Connection weights in the neural controller are determined by a min-max algorithm such that the Lyapunov stability theorem holds via a control Lyapunov function.
Key Words: stabilizing control, Lyapunov's direct method, neural net, min-max algorithm, nondifferentiable optimization 1. は じ め に リア プ ノ フ安 定 定 理 を応 用 し た非 線 形 シ ス テ ム の 安 定 化 制 御 に 関 して は 多 くの 研 究 が あ る.し か し一 般 に は安 定 性 を保 証 す る リア プ ノ フ 関 数 候 補 を見 つ け る こ とが 困 難 で あ る.最 近 の 研 究 に は,ニ ュ ー ラ ル ネ ッ トで コ ン ト ロ ー ラ を 構 成 し そ の フ ィー ドバ ッ ク系(閉 ル ー プ 系)が 安 定 で あ る こ と を 証 明 し よ う と し た もの5),6),10),11)や,制 御 リ ア プ ノ フ 関 数17)の 概 念 を応 用 しバ ッ ク ス テ ッ ピ ン グ 法 で 安 定 化 制 御 器 を 設 計 す る 研 究7)な どが あ る. こ の 論 文 で は 非 線 形 シ ス テ ム の安 定 化 制 御 器 を 多 層 ニ ュ ー ラ ル ネ ッ ト12),13)で 近 似 し,リ ア プ ノ フ の 安 定 定 理8),16)を 満 足 す る よ う に ニ ュ ー ラ ル ネ ッ トの 結 合 重 み の 値 を 決 定 す る 手 法 を研 究 す る.こ れ は,多 層 ニ ュ ー ラ ル ネ ッ トに は 任 意 の 関 数 を 近 似 す る 能 力 が あ る の で,安 定 化 制 御 則 を ニ ュ ー ラル ネ ッ トで 関 数 近 似 す る こ と を 意 味 す る. こ の よ う な方 法 は リ ア プ ノ フ安 定 定 理 の応 用 と して は も っ と も直 接 的 な ア プ ロ ー チ で あ る が 従 来 ほ と ん ど研 究 さ れ て い な か っ た. 本 論 文 で は 以 下 の よ う な 構 成 で 研 究 報 告 を す る.2節 で は ニ ュ ー ラ ル ネ ッ トで 近 似 実 現 を試 み る安 定 化 制 御 則 を 定 式 化 す る.3節 で は そ の よ う な 安 定 化 制 御 則 を ニ ュ ー ラ ル ネ ッ ト で 近 似 実 現 す る た め の 学 習 問 題 は,Min-Max問 題 と い う微 分 不 可 能 最 適 化 問 題 を 解 ぐこ と に よ り解 決 され る こ と を 示 し, さ ら に微 分 不 可 能 最 適 化 ア ル ゴ リズ ム(本 論 文 で はMifflinの ア ル ゴ リズ ム9))に 基 づ い た 学 習 ア ル ゴ リズ ム を提 案 す る.4 節 で は 数 値 例 の シ ミュ レー シ ョン 結 果 を与 え,本 論 文 の ア プ ロ ー チ の 有 効 性 を示 す. 2. 非 線 形 シ ス テ ム の 安 定 化 制 御 則 非 線 形 シ ス テ ム
E(t) = f (x(t), u(t)),
x(to) = xo
(2.1)
を 考 え る.こ こ でx(t)∈Rnは 状 態 ベ ク トル,u(t)∈Rrは 制 御 入 力 ベ ク トル で あ る. こ の シス テ ム の 平 衡 状 態 は
0 = f (xs, us)
(2.2)
を 満 た す.(2.2)はn+T個 の 変 数 とn個 の 式 な の で,r個 の 変 数 を任 意 の 所 望 値 と し て 設 定 で き る.そ の 結 果,残 りの n個 の 変 数 は 従 属 的 に 決 ま る.そ の よ う に し て 決 め ら れ た (xs, us)を(xd, ud)と し よ う. 本 論 文 の 目 的 は所 望 の 平 衡 状 態(xd, ud)へ 漸 近 収 束 させ る 安 定 化 制 御 器 を状 態 フ ィー ド バ ッ ク制 御 則u(t) = a(x(t)),
ud = a(xd)
(2.3)
に よ っ て 構 成 す る こ とで あ る.リ ア プ ノ フ 安 定 定 理 は 与 え ら れ た シ ス テ ム の 安 定 性 を 分 析 す る 方 法 で あ る.所 望 の 平 衡 点 に お い て 閉 ル ー プ 系 を 安 定 化 す る た め に は,制 御 リ ア プ ノ フ 関 数(clf)の 概 念 が 非 常 に強 力 で あ り,わ れ わ れ は 閉 ル ープ 系
x(t) = f (x(t), a(x(t)))
(2.4)
† 第26回 制御 理 論 シ ン ポ ジ ウム で一 部発 表(1997 .5) * 慶 應 義 塾大 学 理 工 学 部 横 浜 市 港北 区 日吉3 -14-1* Faculty
of Science
and Technology
, Keio University,
Yokohama
(Received March 26, 1998)
(Revised October 5, 1998)
490 T. SICE Vol.35 No.4 April 1999 に お け る 所 望 の 平 衡 点xdが 漸 近 安 定 に な る よ う に,状 態 フ ィー ドバ ッ ク制 御 則 α(x(t))を 設 計 す る こ と を試 み る. 文 献1), 2), 17), 18)で 指 摘 さ れ た よ う に,常 に連 続 関 数 の 状 態 フ ィー ドバ ッ ク 制 御 則 が 存 在 す る とは 限 らな い が,こ こで は連 続 な 制 御 則 が 存 在 す る と仮 定 す る. 閉 ル ー プ 系(2.4)の 漸 近 安 定 性 を論 じ る た め,以 下 の 定 理 を 用 意 す る. 《定 理1》 閉 ル ー プ 系
x(t) = f (x(t), a(x(t)))
を 考 え る.xdを 所 望 の 平 衡 点 と し,Ω を そ の 近 傍 と す る. こ の と きつ ぎの 条 件 を 満 た す 連 続 微 分 可 能 な ス カ ラ ー 値 関 数 V(x),ρ(x)が 存 在 す る な らば,所 望 の 平 衡 点xdは 漸 近 安 定 で あ る. (i) V(x)が 正 定(つ ま りV(xd)=0か つx≠xdの と きV(x)>0),ρ(x)が 正 定(つ ま り ρ(xd)=0か つ x≠xdの と き ρ(x)>0)で あ る. (ii)dV (x) _ aV (x)
dt
ax f (x, a(x)) < -p(x(t))
dx E S~
が な りた つ. (証 明) f(x)△=f(x,α(x))と お く と き,x=f(x)に 対 す る リア プ ノ ブ安 定 定 理 よ り明 ら か. ■ (注 意) リ ア プ ノ フ の 意 味 で の 安 定 性 を論 じる と き,通 常 原 点 の安 定 性 を考 え る の で,V(0)=0か つV(x)>0 (x≠0) を 正 定 と定 義 す る.し か し本 論 文 で 吟 味 した い の は 所 望 の 平 衡 状 態xdの 近 傍 で の 安 定 性 な の で,リ ア プ ノ フ 関 数 は 平 衡 点 か らの 偏 差 の 関 数V(x)=V(x-xd)が と ら れ る.そ れ ゆ え 正 定 性 の 定 義 が 通 常 と多 少 異 な っ て い る. こ こで,シ ス テ ム(2.1)が 与 え ら れ た と き,つ ぎの よ う な リ ア プ ノ フ 関 数 候 補 を 考 え る.V (x) = 1(x - xd)T Ql (x - xd)
+ l (u - ud )T Rl (u - ud)
(2.5)
た だ し,Q1>0, R1>0と す る.(2.5)に(2.3)を 代 入 す る とV(x)=(x
1-
xd)T
Q1(x - xd)
+1(a(x) - Ud)TR1(a(x) - ud)
(2.6)
こ こ でV(x)>0 ∀x≠xdが な りた つ こ とか ら,Vは 正 定 値 関 数 で あ る.
さ ら に
p(x) = (x - xd)T Q2(x - xd)
+(a(x) - ud)T R2(a(x) - ud)
(2.7)
た だ し,Q2>0, R2≧0と す る と,こ の ρ(x)はV(x)と 同 様 に 正 定 値 関 数 と い え る.
こ の と き,つ ぎの よ う な不 等 式
dV (x)
_ (x - xd)T Qlf (x, a(x))
+(a(x) - ud)TRI aa(x) f (x, a(x))
c -(x - xd)T Q2(x - xd)
-(a(x) - ud)T R2(a(x) - Ud)
(2.8)
を 満 た す α(x)を 見 つ け れ ば,定 理1を 満 た す.結 局,安 定 化 制 御 器 の設 計 問 題 は
F(x)
(x - xd)T Qlf (x, a(x))
+(a(x) - ud)TRi aa(x) f (x, a(x))
+(x - xd)T Q2(x - xd)
+(a(x) - ud)T R2(a(x) - ud) < 0
(2.9)
と な る よ うな α(x)を 求 め る 問 題 と い う こ と に な る.さ ら に Q2, R2の 選 択 は制 御 成 績 の 調 整 パ ラ メ ー タ と して も利 用 で き る.し か し仮 に そ の よ う な α(x)が 存 在 す る と して もそ れ を 解 析 的 に 求 め る の は 非 常 に 困 難 で あ る.以 下 で は こ の α(x) を ニ ュ ー ラ ル ネ ッ トを用 い て 近 似 的 に 実 現 す る問 題 を 考 え る. 3. 安 定 化 制 御 則 の ニ ュ ー ラ ル ネ ッ ト に よ る 最 良 近 似 (2.9)を 満 たすu(t)=α(x(t))を ニ ュ ー ラ ル ネ ッ トで 近 似 的 に実 現 す る こ と を試 み る.そ の よ う な状 態 フ ィー ド バ ッ ク 型 ニ ュ ー ラ ル 制 御 器 と して は つ ぎ の よ う な3層 ニ ュ ー ラ ル ネ ッ ト を用 い る.
z(t) = W(x(t) - xd)
(3.1)
UN(t) = Vo(z(t)) +ud
(3.2)
た だ し こ こ で,z(t)∈Rqは ニ ュ ー ラ ル ネ ッ トの 内 部 状 態, W∈Rq×n, V∈Rr×qは 結 合 重 み行 列 で あ り,σ: Rq→Rq は シ グ モ イ ド 関数 で あ る.ま た シ グ モ イ ド 関 数 と して は つ ぎ の よ う な双 曲 関 数 を用 い る.
a (z) = [o-1(z1),
a2 (z2 ), ... ,aq (zq
exp(zi)
(3
.
(3.1), (3.2)を ま と め る とUN (t) = a(x(t); W, V)
(3.4)
こ こ で(2.3)よ り(3.4)はud=α(xd; W, V)を 満 た さ な け れ ば な ら な い が,上 記 の ニ ュ ー ラ ル ネ ッ トは 学 習 に 関係 な く, つ ま りW, Vに 関 係 な く,ud=α(xd; W, V)を 満 た して い る こ と に 注 意 され た い. (2.9)に(3.4)を 代 入 した 関 数 を つ ぎ の よ うに お く.F(x;W,V)
(x - xd)T Qlf (x, &(x; W, V))
+ a x•W V -ud TR1aa(x,W,V)
x a x
+(x - xd)T Q2(x - xd)
+(a(x;W,V)-ud)TR2(a(x;W,V)-ud)
(3.5)
われ われ はxd近
傍 の興味 の あ る領 域 Ω 内の任意 のxに
対 して
F(x;W,V) < 0, dx E 1
(3.6)
計 測 自動 制御 学 会 論 文 集 第35巻 第4号 1999年4月 491 に な る よ う に ニ ュ ー ラ ル ネ ッ トの 結 合 重 み 行 列W, Vを 決 定 した い.こ こで つ ぎ の よ う な 最 大 値 関 数J(W, V)を 定 義 す る.
J(W, V) = max F(x; W, V )
XEI1= F(x*(W,V);W,V)
(3.7)
た だ しx*(W, V)は パ ラ メ ト リ ッ ク 最 大 解 を 表 す.こ の と き J(W, V)≦0な ら ば,明 ら か に(3.6)が な り た つ.こ こ で W, Vの 値 に 関係 な くF(xd;W,V)
= 0
が な りた つ こ と に注 意 す る と,J(W, V)は 明 ら か に非 負 関 数 で あ る. 以 上 よ りJ(W, V) = 0
(3.8)
が な りた つ と きの み,(3.6)が な りた つ とい え る.し た が って (3.8)を 満 た すW, Vを 求 め る こ と を考 え る.そ の た め に つ ぎ の よ う なMin-Max問 題 を考 え る.min J(W, V) = min max F(x; W, V)
(3.9)
W,V W,V XE1 問 題(3.9)を 解 くた め に,最 急 降 下 法 を応 用 し て,最 大 値 関 数J(W, V)を パ ラ メー タW, Vに 関 して 逐 次 減 少 させ る.し か し一 般 に 最 大 値 関 数J(W, V)は 微 分 不 可 能 関 数 と な る の で,ふ つ う の最 急 降 下 法 の代 わ りに微 分 不 可 能 最 適 化 手 法 を 用 い な け れ ば な ら な い. そ の た め に は まずJ(W, V)のW, Vに 関 す る 一 般 勾 配 を 求 め る 必 要 が あ る.一 般 勾 配 は以 下 の よ う に して 計 算 す る(微 分 不 可 能 最 適 化 理 論 に つ い て は 文 献14), 15)を 参 照 さ れ た い). 問 題(3.7)の 最 大 解 集 合 をP(W, V)と お く.
P(W, V) = x* E
F(x*; W, V) = J(W, V)
(3.10)
こ の と きつ ぎ の 定 理 が な りた つ. [命題1] (i) J(W, V)は 局 所 リ ップ シ ッ ツ 連 続 で あ る (ii) J(W, V)の 一 般 勾 配(集 合)はawJ(W,V) = co VwF(P(W,V);W,V)
(3.11)
&VJ(W, V) = co VvF(P(W, V); W, V)
(3.12)
た だ し こ こでcoは 凸 包 を 表 す. 一 般 勾 配 は(3 .11), (3.12)で 与 え ら れ る.し た が って maxF(x; W, V)を 適 当 な 非 線 形 計 画 法 で 計 算 し,一 般 勾 配 の 少 な く と も一 つ の 要 素OWF(x*; W, V)EavJ(W, V), x* E P(W,V)(3.13)
VVF(x*; W, V)E3VJ(W,V),
x* E P(W,V) (3.14)
を う る こ とが で き る の で,一 般 勾 配 を用 い た 各 種 の微 分 不 可 能 最 適 化 手 法 を 利 用 で き る.こ こ で はBundle法 の 一 種 で も っ と も有 力 なMifflinの アル ゴ リズ ム9)を 応 用 す るMifflin の ア ル ゴ リ ズ ム は,一 般 勾 配 の 集 合 の 近 似 集 合Zを 生 成 し, 探 索 方 向s=-Nr(co Z)を 計 算 す る 部 分20)と 工 夫 さ れ た 直 線 探 索 の 部 分 か ら構 成 さ れ た 微 分 不 可 能 関 数 に対 す る 最 急 降 下 法 で あ る.た だ し こ こ でNrSは 閉 凸 集 合Sの 要 素 で ノ ル ム が 最 小 の もの を表 す. Mifflinの ア ル ゴ リズ ム に よ る 降 下 法 は 反 復 計 算 と して 実 行 で きる.J(W, V)=0に な る ま で イテ レ ー シ ョ ン を行 え ば, 一 つ の 安 定 化 制 御 器(状 態 フ ィ ー ドバ ッ ク 制 御 則)を う る こ と が で き る. 学 習 ア ル ゴ リズ ム を 以 下 の 通 り ま と め て お く. < ア ル ゴ リズ ム1> ス テ ップ1: 興 味 の あ る 状 態 領 域 Ω,関 数Fの パ ラ メ ー タQi, Ri, i=1, 2, W, Vの 初 期 値 を定 め,イ テ レ ー シ ョ ン番 号k=0と す る. ス テ ッ プ2: 最 大 解 集 合P(Wk, Vk)の 要 素 を 一 つ 求 め x*kと す る.も しJ(Wk, Vk)=F(x*k; Wk, Vk)=0な ら ば計 算 を終 了 し,学 習 終 了 と す る. ス テ ッ プ3: 一 般 勾 配 ∂oWJ(Wk, Vk),∂oVJ(Wk, Vk)の 一 つ の 要 素 で あ るVwF(x*k;Wk,Vk),VVF(x*k;Wk,Vk)
(3.15)
を 用 い て,Mifflinの ア ル ゴ リ ズ ム9)に 従 いWk, Vkを 一 回 更 新 し,k:=k+1と しス テ ップ2に 戻 る. 以 下 で は 学 習 ア ル ゴ リズ ム で 必 要 と な る(3.15)を 計 算 す る.こ れ は(3.5)のW, Vに 関 す る勾 配 を 求 め る こ と を意 味 し,成 分 計 算 に よ り求 め る こ と も可 能 で あ る が,非 常 に繁 雑 な 計 算 と な る.そ こ で わ れ わ れ は ラ グ ラ ン ジ ュ未 定 乗 数 法 を 応 用 す る こ と に よ り,よ り明快 な計 算 法 を 提 案 す る. ま ず,(3.1), (3.2), (3.4)よ りun = &(x; W, V) = Vo(z) + ud
where z = W (x - xd)
これ をxで 微 分 す る と,aa(x;W,V)
= VVo z W
(3.16)
whereVQ(z) = diag[o (zi), o2(z2),
... , aq(z4)]
(3.17)
で あ る.た だ し こ こ で ▽ σ(z)∈Rq×q=Z(×)Z* (Z*は 双 対空 間)で あ る.こ こ で(3.16)を(3.5)に 代 入 す る と 関 数Fは つ ぎ の よ う に書 か れ る.
F(x, W, V) = (x - xd)T Qlf (x, uN)
+(UN - Ud)T
RlVVO(z)Wf (x, UN)
+(x - xd)T Q2(x - xd)
+(UN - ud)T R2(UN - ud)
(3.1$)
た だ しzは(3.1), uNは(3.2)で 与 え ら る. こ の と き,つ ぎ の 命 題 が な りた つ. [命題2] 以 下 の 関係 が な りた つ.
Vw F(x; W, V )
492 T. SICE Vol.35 No.4 April 1999
[V2i(z) . (VT
R1(uN
- ud) (W
f (x,
+V r(z)VT {VuNf (x,UN)Q1(x
- xd) +
VQ(z)Wf(x,
UN) + V UNf (x, uN)WT
R1(UN
- ud) + 2R2(UN
- ud)}] (x -
(3.19
=R1(UN
- ud)f (x, UN)T
WT
VO
{DUN
f (x, UN)Q1(x
- xd) + R1V
W f (x,UN)
+VUNf
(x,UN)WT
R1(UN
- Ud)
+ 2R2(UN
- ud)
(3.
(証 明) ラ グ ラ ン ジ ュ乗 数 ベ ク トル λ ∈Rqと β ∈Rrを 導 入 して ラ グ ラ ン ジ ュ 関 数
L(uN,z,W,V,a,3
-(x - xd)T Qlf (x, UN) + (UN - ud)T Rlvvo
W f (x, UN) + (x _ xd)T Q2(x _ xd) + (UN -
R2 (UN ud) + AT {W (x xd)
-+iT (V c. (z) + ud -
(3.2
を定 義 す る.
ラ グ ラ ンジ ュ関 数Lの 各 変 数 に関 す る偏 導 関数 を 求 め る.微 分 の 連 鎖 律 と勾 配 の 公 式(i) (ii)(注1)な らび にQi, Ri, i=1, 2 と ▽ σ(z)の 対 称 性 よ り以 下 の よ うに な る.
VWL=VO
(z)VT
R1(UN
- ud)f (x, UN)T
+ A(x -
(3.2
VVL=R1(UN
- ud)f(x, uN)T
WT
0O.(z) +/3
(3.
VAL=W(x-xd)-
(3.2
VpL=Vo(z) + Ud - UN
(3.2
VUNL-V
UN
f (x, UN)Q1(x
- x
+R1VVQ(z)W
f (x, U
+VUNf (x, UN)WTVO(z)VT
R1(UN
- u
+2R2
(UN - Ud) - i3
(3.26
VzL=V2Q(z)
. (VT
R1(UN
- ud) (W f (x, UN
-A + Vo(z)VTI3
(3.2
た だ し こ こ で ▽2σ(z)∈Rq×q×q=Z(×)Z(×)Z*は2階 導 関 数 ア レ イ で あ る. (3.26), (3.27)よ り β と λ はf3-QUNf (x, uN)Ql(x - xd) + R1VVQ(z)W f (x, UN)
+VuNf (x, uN)WTVo (z)VTR1(UN - ud)
+2R2
(UN - ud )
A= V2Q(z)
S (vTRl(UN
- ud) (W
f (x, UN))T
)
+Vo(z) VT
p
= V20 (z) • (VT
R1(uN
- ltd) (W
f (x, 21N))T)
+
Vo(z)VT
{VUNf
(x, UN)Ql(x
- xd) +
RiVVQ(z)Wf
(x, UN) + VUNf
(xa UN)WTO
VT
R1(UN
- ltd) + 2R2(UN
- ud)}
こ の よ う に(3.26), (3.27)よ り β と λ を 求 め,(3.22), (3.23) に 代 入 し,さ ら に ▽wF=▽wL, ▽vF=▽vLを 考 慮 す る と,(3.19), (3.20)を う る. ■ この 命 題2に よ りア ル ゴ リズ ム1中 の(3.15)の 計 算 式 が 得 ら れ た. と こ ろ で,(3.19)に は ベ ク トル ー マ ト リ ク ス 表 現 の ほ か に ア レ イ 表 現 が 用 い られ て い る.そ の ア レ イ表 現 の 部 分,つ ま り
V2o(z) . (VTR1(UN
- ud) (Wf (x, uN))T
I
は つ ぎの よ う な行 列
Z = diag[a (zl)yl, o2 (z2)y2, ... , cq,(zq)yq]
y=Wf(x,uN)
を 定 義 す る と,以 下 の よ う にベ ク トル ー マ ト リク ス 表 現 に 書 き換 え る こ と も で きる.
V2u(z). (VT
R1(uN
- ud) (Wf (x,uN))T
)
= ZVT
R1(UN
- ud )
4. シ ミ ュ レ ー シ ョ ン こ の 節 で は,簡 単 な 数 値 例 を 用 い て 本 論 文 で 与 え た ア プ ロ ー チ の 有 効 性 を 示 す. (注 意) ア ル ゴ リズ ム1の ス テ ップ2に お い て,最 大 解 集 合P(Wk, Vk)の 一 つ の 要 素x*kた を 求 め な け れ ば な ら な い. ム つ ま りmaxF(x; Wk, Vk)を 何 らか の 非 線 形 計 画 法 で 解 き, 大 域 的 最 適 解 を求 め ね ば な ら な い.大 域 的 最 適 化 の ア ル ゴ リ ズ ム と して は何 を 使 っ て も よい が,現 在 あ ま り効 率 の よ い ア ル ゴ リ ズ ム は 開 発 さ れ て い な い.そ こ で,こ こ で は 簡 便 に つ ぎ の よ う に し て シ ミュ レ ー シ ョ ン をお こ な っ た.ま ず Ω を 離 散 化 し,そ の 集 合 △={xp│xp∈ Ω,p=1, 2, …, N}の 上 た で 全 点 比 較 してx*Kの 近 似 解 と した. 4.1 Rayleigh Model 状 態 方 程 式 は つ ぎ の よ う に与 え ら れ る.ii(t)=x2(t)
(4.la)
i2(t) =-xi(t) + (1.4 - 0.14x2(t))x2(t)
+ 4u(t) (4.lb)
ま た,所 望 の 平 衡 状 態 は(xd, ud)=(0, 0)と す る.興 味 の あ る 状 態 領 域 Ω={x│-10≦x1, 2≦10}と し,Δ は 原 点 を 含 む0.5間 隔 の1681個 の 格 子 点 と し た.(3.5)の パ ラ メ ー タ はQ1=E, Q2=0.01E, R1=1, R2=0.01 (E (注1)
(i) f(x)=aT●x, x∈X, aT∈Z(×)X*の と き, ▽f(x)=a∈X(×)Z*
(ii) f(D)=xT●D●y, x∈X, y∈Y, D∈X(×)Y*の と き, ▽f(D)=x(×)yT∈X(×)Y*
計測 自動 制 御 学 会論 文集 第35巻 第4号 1999年4月 493 単 位 行 列),ニ ユ ー ラ ル ネ ッ トの 中 間 層 ニ ュ ー ロ ン の 数 は8, 結 合 重 み の 初 期 値W0, V0は0∼1の 乱 数 で(4.2)の よ う に 与 え て ニ ュ ー ラ ル ネ ッ トの 学 習 を 行 っ た.
0.027734
0.696329
0.543553
0.312489
0.394107
0.492375
0.788487
0.826898
0.070021
w _
0.914796
0.850389
v-
0.021475
0.619592
0.992774
0.020410
0.793615
0.953709
0.053873
0.381732
0.438330
0.547065
0.323344
0.281141
0.913086
(4.2)
15回 の イ テ レ ー シ ョ ン 後 のW15, V15は つ ぎ の よ う に な っ た. 0.135414 0.305831 -2.617484 -0 .149626 0.935843 -3.641724 0.920822 0.800825 -3.122351 W- 0.914931 0.853808 V- -3.166511 0.678282 0.826323 -3.144931 1.003078 0.832416 -3.105762 -0 .581259 0.750374 -3.539727 0.057050 -0.900797 0.453772 イ テ レ ー シ ョ ン に 対 す る 最 大 値 関 数J(W, V)の 変 化 を Fig. 1に 示 す.Fig. 1よ り学 習 後 のW, Vに よ りJ(W, V)= 0(最 適 点)が 満 た さ れ て い る.し た が って 学 習 後 のW, Vを 用 い た状 態 フ ィー ド バ ッ ク 型 ニ ュ ー ラル 制 御 器u(t) = Vr (Wx(t))
は シ ス テ ム(4.1)を 原 点 に漸 近 収 束 させ る こ とが で き る.初 期 点x(0)=(9, 9)Tに お け る 閉 ル ープ 系 の 応 答 と リ ア プ ノ フ 関 数V(x(t))の 時 間 変 化 をFig. 2に 示 す.ま た Ω 内 の い ろ い ろ な 初 期 点 に お け る 閉 ル ー プ 系 の 応 答 を状 態 平 面 を 用 い てFig. 3に 示 す.4.2 Single Link Manipulater Model
全 長2l,全 質 量mの 均 質 なLinkの 一 端 に トル ク τ(t)が 制 御 入 力 と して 加 わ っ て い る シス テ ム(Single Link Manip-ulater)は,つ ぎ の よ う に 表 さ れ る.
ii(t) = x2(t)
(4.3a)
x2(t) _ -7x2(t) + mlg sin(xi(t)) + lu(t) (4.3b)
こ こ で,x1(t)はLinkの 角 度,x2(6)はLinkの 角 速 度,u(t) は 制 御 入 力 と し,Linkに 加 え ら れ る ト ル ク と す る.Dは 軸 受 け の 粘 性 摩 擦 係 数,IはLinkの 軸 受 け を 中 心 と す る 慣 性 モ ー メ ン ト,gは 重 力 加 速 度 で あ る.ま たD=0.00198, l= 0.5, m=1.0, I=0.33333, g=9.8と し,所 望 の 平 衡 状 態 は (xd, ud)=(0, 0)と す る. 興 味 の あ る 状 態 領 域 Ω={x│-3≦x1≦3, -5≦x2≦5} と し,Δ は 原 点 を 含 む0.2間 隔 の1581個 の 格 子 点 と し た. (3.5)の パ ラ メ ー タ はQ1=E, Q2=0.1E, R1=1, R2= 0.1,ニ ュ ー ラ ル ネ ッ ト の 中 間 層 ニ ュ ー ロ ン の 数 は8,結 合 重 み の 初 期 値W0, V0は0∼1の 乱 数 で(4.2)式 の よ う に 与 え て ニ ュ ー ラ ル ネ ッ ト の 学 習 を 行 っ た. 29回 の イ テ レ ー シ ョ ン 後 のW29, V29は つ ぎ の よ う に な っ た.-6 .075385
2.713280
-3.007068
-2 .633142
0.996453
-1.815892
-0 .066530
-0.532184
2.198456
W-
2.459074
-0.986062
V_
-1.279865
-1 .130929
0.364276
0.961835
2.773482
0.902580
-3.626733
0.317627
0.273349
-2.491498
5.616085
0.648647
-4.798167
イ テ レ ー シ ョン に 対 す る 最 大 値 関 数J(W, V)の 変 化 を Fig. 4に 示 す.Fig. 4よ り学 習 後 のW, Vに よ りJ(W, V)=0 (最 適 点)が 満 た され て い る.し た が っ て 学 習 後 のW, Vを 用 い た状 態 フ ィー ドバ ッ ク 型 ニ ュ ー ラ ル 制 御 器u(t) = Vu (Wx(t))
は(4.3)を 原 点 に 漸 近 収 束 さ せ る こ と が で き る.初 期 点 x(0)=(2, 4)Tに お け る 閉 ル ー プ 系 の 応 答 と リ ア プ ノ フ 関 数V(x(t))の 時 間 変 化 をFig. 5に 示 す.ま た Ω 内 の い ろ い ろ な 初 期 点 に お け る 閉 ル ー プ 系 の 応 答 を状 態 平 面 を用 い て Fig. 6に 示 す. 5. お わ り に 閉 ル ー プ 系 を漸 近 安 定 化 す る に は,定 理1に お け る 関 数 V(x),ρ(x)を 見 つ け れ ば よ い が,一 般 的 に は 難 しい. 本 論 文 で は 逆 に,は じめ か ら関 数V(x),ρ(x)を 与 え定 理1 を満 た す よ う に,状 態 フ ィ ー ドバ ッ ク 制 御 則 α(x)を ニ ュ ー ラ ル ネ ッ トで 近 似 実 現 す る手 法 を提 案 した.そ の 際 ニ ュ ー ラ ル ネ ッ トの 結 合 重 み 行 列W, VはMin-Max問 題 をMifflin の ア ル ゴ リズ ム を 応 用 し て 解 く こ と に よ り求 め た.シ ミ ュ レ ー シ ョ ン結 果 は 本 論 文 で 提 案 し た ア プ ロ ー チ の 有 効 性 を 示 した. 本 論 文 にお け るV(x),ρ(x)は 目 標 値 か らの2乗 誤 差 関 数 と した が,そ れ 以 外 の 設 計 も可 能 で,命 題2に 相 当 す る勾 配 関 数 を計 算 し な お せ ば,同 様 の ア プ ロ ー チ で フ ィ ー ドバ ッ ク 制 御 則 を近 似 実 現 す る こ とが で き る.関 数V(x)と 関数 ρ(x) の 関 係 は 逆 最 適 制 御 問 題 の 観 点 か ら も論 じ ら れ て お り3),4), 今 後,そ れ ら の 本 論 文 へ の 応 用 を 考 え て い き た い. 謝 辞:シ ミ ュ レ ー シ ョ ン用 プ ロ グ ラ ム の 作 成 に ご協 力 い た だ い た 慶 應 義 塾 大 学 大 学 院 の 新 木 正 一 氏 に 感 謝 の 意 を 表 し ます.494 T. SICE Vol.35 No.4 April 1999
Fig. 1: Rayleigh Model:
Change of Max function J(Wk, Vk)
Fig. 2a: Rayleigh Model:
State and control for x(0)=(9,
9)T
Fig. 2b: Rayleigh Model: Time change of Lyapunov function
Fig. 3: Rayleigh Model:
Trajectories for various initial state x(0)
Fig. 4: Single Link Manipulater Model:
Change of Max function J(Wk, Vk)
Fig. 5a: Single Link Manipulater Model:
State and control for x(0)=(2, 4)T
Fig. 5b: Single Link Manipulater Model: Time change of Lyapunov function
Fig. 6: Single Link Manipulater Model:
Trajectories for various initial state x(0)
計 測 自動 制 御 学 会 論文 集 第35巻 第4号 1999年4月 495
参 考
文
献
1) Z. Artstein: Stalilization with Relaxed Controls, Nonlinear
Analysis, Vol.TMA-7, 1163/1173 (1983)
2) R.W. Brochett: Asymptotic Stability and Feedback
Sta-bilization, in Differential Geometric Control Theory
(R.W. Brochett etal. eds.), Birkhauser, 181/191 (1983)
3) R.A. Freeman and J.A. Primbs: Control Lyapunov
Func-tions -New Ideas From an Old Source-, Proc. of the 35th
Conference on Decision and Control, 3926/3931, Kobe
(1996)
4) R.A. Freeman and P.V. Kokotovic, Robust Nonlinear
Con-trol Design. Boston: Birkhauser, 1996
5) M.M. Gupta and N.K. Sinha(eds.): Intelligent Control
Sys-tems, Chap.12 (M. Saerens, J.M. Renders and N. Bersini:
Neuro Control Based on the Backpropagation Algorithm),
IEEE press (1996)
6) K. Kawamura, T. Ikai and H. Kosako: Backpropagation
Learning of Feedback Neural Networks-Consideration
from a Viewpoint of Dynamical System Optimization,
Trans. IEICE, D-II, Vol.J73-D-II,
No.9 (1990)
7) M. Kristic, I. KanellaKopoulos and P. Kokotovic: Nonlinear
and Adaptive Control Design, J. Wiley & Sons (1995)
8) J. LaSalle and S. Lefschetz: Stability by Liapunov's Direct
Method with Applications. Academic Press (1961)
9) R. Mifflin: An Algorithm for Constrained Optimization
with Semismooth Functions, Mathematics of Operations
Research, Vol.2, 191/207 (1977)
10) K.S. Narendra and K. Parthasarathy:
Identification and
Control of Dynamical Systems Using Neural Networks,
IEEE Trans. Neural Networks, Vol.1, No.1 (1990)
11) D. Psaltis, A. Sideris, A. Yamamura: A Multilayered
Neu-ral Netwark Controller, IEEE Control System Magazine,
Vol.18, No.2 (1988)
12) D.E. Rumelhart, G.E. Hinton and R.J. Williams: Learning
Representation by Back-propagating Errors, NATURE,
Vol.323, No.9, 535/536 (1986)
13) K. Shimizu and M. Ohtani: Optimal Control for
Nolin-ear Systems by a Neural Controller of the State
Feed-back Type, IEEE 35th Conf. on Decision & Control,
Vol.3, 3300/3303 (1996)
14) 志 水,相 吉:数 理 計 画 法,10章,昭 晃 堂 (1984)
15) K. Shimizu, Y. Ishizuka and J.F. Bard: Nondifferentiable
and Two-Level Mathematical Programming, Kluwer
Aca-demic Publishers (1997)
16) J.J.E. Slotine and W. Li: Applied Nonlinear Control,
Pren-tice Hall (1991)
17) E.D. Sontag: Mathematical Control Theory, Deterministic
Finite Dimensional Systems, Springer-Verlag (1990)
18) E.D. Sontag and H.J. Sussmann: Remarks on Continuous
Feedback, Proc. IEEE Conf. Decision and Control, 916/921
(1980)
19) M. Suzuki and K. Shimizu: Analysis of Distributed Systems
by Array Algebra, Int. J. of Systems Science, Vol.21 No.1,
129/155 (1990)
20) P. Wolfe: Finding the Nearest Point in a Polytope,
Math-ematical Programming, 11, 128/149 (1976)
[著
者
紹
介]
志
水
清
孝(正
会員)
1962年 慶 應 義 塾 大 学 理 工 学 部 計 測 工 学 科 卒 業. 1964年 同 大 学 大 学 院 修 士 課 程 修 了.1967年 ケ ー ス 工 科 大 学 博 士 課 程 修 了.Ph.D.現 在 に 至 る.慶 應 義 塾 大 学 理 工 学 部 教 授.専 門 は シ ス テ ム 制 御, 数 理 計 画 法,最 適 制 御,ニ ュ ー ラ ル ネ ッ ト ワ ー クな ど,IEEE, SICE, IEICEな ど の 会 員.