• 検索結果がありません。

Design of Neural Stabilizing Controller for Nonlinear Systems via Lyapunov's Direct Method Kiyotaka SHIMIZU* and Kazuyuki ITO This paper is concerned

N/A
N/A
Protected

Academic year: 2021

シェア "Design of Neural Stabilizing Controller for Nonlinear Systems via Lyapunov's Direct Method Kiyotaka SHIMIZU* and Kazuyuki ITO This paper is concerned"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

計 測 自 動 制 御 学 会 論 文 集

Vol.35, No.4, 489/495 (1999)

リア プ ノ フ直 接 法 に よ る非 線 形 シ ステ ム の

ニ ュ ー ラル 安 定 化 制 御 器 の 設 計

孝 *・伊

Design

of Neural

Stabilizing

Controller

for Nonlinear

Systems

via Lyapunov's

Direct

Method

Kiyotaka SHIMIZU* and Kazuyuki ITO

This paper is concerned with a neural stabilizing controller of general nonlinear systems. The stabilizing state feedback control law is approximated with a multi-layered neural network. Connection weights in the neural controller are determined by a min-max algorithm such that the Lyapunov stability theorem holds via a control Lyapunov function.

Key Words: stabilizing control, Lyapunov's direct method, neural net, min-max algorithm, nondifferentiable optimization 1. は じ め に リア プ ノ フ安 定 定 理 を応 用 し た非 線 形 シ ス テ ム の 安 定 化 制 御 に 関 して は 多 くの 研 究 が あ る.し か し一 般 に は安 定 性 を保 証 す る リア プ ノ フ 関 数 候 補 を見 つ け る こ とが 困 難 で あ る.最 近 の 研 究 に は,ニ ュ ー ラ ル ネ ッ トで コ ン ト ロ ー ラ を 構 成 し そ の フ ィー ドバ ッ ク系(閉 ル ー プ 系)が 安 定 で あ る こ と を 証 明 し よ う と し た もの5),6),10),11)や,制 御 リ ア プ ノ フ 関 数17)の 概 念 を応 用 しバ ッ ク ス テ ッ ピ ン グ 法 で 安 定 化 制 御 器 を 設 計 す る 研 究7)な どが あ る. こ の 論 文 で は 非 線 形 シ ス テ ム の安 定 化 制 御 器 を 多 層 ニ ュ ー ラ ル ネ ッ ト12),13)で 近 似 し,リ ア プ ノ フ の 安 定 定 理8),16)を 満 足 す る よ う に ニ ュ ー ラ ル ネ ッ トの 結 合 重 み の 値 を 決 定 す る 手 法 を研 究 す る.こ れ は,多 層 ニ ュ ー ラ ル ネ ッ トに は 任 意 の 関 数 を 近 似 す る 能 力 が あ る の で,安 定 化 制 御 則 を ニ ュ ー ラル ネ ッ トで 関 数 近 似 す る こ と を 意 味 す る. こ の よ う な方 法 は リ ア プ ノ フ安 定 定 理 の応 用 と して は も っ と も直 接 的 な ア プ ロ ー チ で あ る が 従 来 ほ と ん ど研 究 さ れ て い な か っ た. 本 論 文 で は 以 下 の よ う な 構 成 で 研 究 報 告 を す る.2節 で は ニ ュ ー ラ ル ネ ッ トで 近 似 実 現 を試 み る安 定 化 制 御 則 を 定 式 化 す る.3節 で は そ の よ う な 安 定 化 制 御 則 を ニ ュ ー ラ ル ネ ッ ト で 近 似 実 現 す る た め の 学 習 問 題 は,Min-Max問 題 と い う微 分 不 可 能 最 適 化 問 題 を 解 ぐこ と に よ り解 決 され る こ と を 示 し, さ ら に微 分 不 可 能 最 適 化 ア ル ゴ リズ ム(本 論 文 で はMifflinの ア ル ゴ リズ ム9))に 基 づ い た 学 習 ア ル ゴ リズ ム を提 案 す る.4 節 で は 数 値 例 の シ ミュ レー シ ョン 結 果 を与 え,本 論 文 の ア プ ロ ー チ の 有 効 性 を示 す. 2. 非 線 形 シ ス テ ム の 安 定 化 制 御 則 非 線 形 シ ス テ ム

E(t) = f (x(t), u(t)),

x(to) = xo

(2.1)

を 考 え る.こ こ でx(t)∈Rnは 状 態 ベ ク トル,u(t)∈Rrは 制 御 入 力 ベ ク トル で あ る. こ の シス テ ム の 平 衡 状 態 は

0 = f (xs, us)

(2.2)

を 満 た す.(2.2)はn+T個 の 変 数 とn個 の 式 な の で,r個 の 変 数 を任 意 の 所 望 値 と し て 設 定 で き る.そ の 結 果,残 りの n個 の 変 数 は 従 属 的 に 決 ま る.そ の よ う に し て 決 め ら れ た (xs, us)を(xd, ud)と し よ う. 本 論 文 の 目 的 は所 望 の 平 衡 状 態(xd, ud)へ 漸 近 収 束 させ る 安 定 化 制 御 器 を状 態 フ ィー ド バ ッ ク制 御 則

u(t) = a(x(t)),

ud = a(xd)

(2.3)

に よ っ て 構 成 す る こ とで あ る.リ ア プ ノ フ 安 定 定 理 は 与 え ら れ た シ ス テ ム の 安 定 性 を 分 析 す る 方 法 で あ る.所 望 の 平 衡 点 に お い て 閉 ル ー プ 系 を 安 定 化 す る た め に は,制 御 リ ア プ ノ フ 関 数(clf)の 概 念 が 非 常 に強 力 で あ り,わ れ わ れ は 閉 ル ープ 系

x(t) = f (x(t), a(x(t)))

(2.4)

† 第26回 制御 理 論 シ ン ポ ジ ウム で一 部発 表(1997 .5) * 慶 應 義 塾大 学 理 工 学 部 横 浜 市 港北 区 日吉3 -14-1

* Faculty

of Science

and Technology

, Keio University,

Yokohama

(Received March 26, 1998)

(Revised October 5, 1998)

(2)

490 T. SICE Vol.35 No.4 April 1999 に お け る 所 望 の 平 衡 点xdが 漸 近 安 定 に な る よ う に,状 態 フ ィー ドバ ッ ク制 御 則 α(x(t))を 設 計 す る こ と を試 み る. 文 献1), 2), 17), 18)で 指 摘 さ れ た よ う に,常 に連 続 関 数 の 状 態 フ ィー ドバ ッ ク 制 御 則 が 存 在 す る とは 限 らな い が,こ こで は連 続 な 制 御 則 が 存 在 す る と仮 定 す る. 閉 ル ー プ 系(2.4)の 漸 近 安 定 性 を論 じ る た め,以 下 の 定 理 を 用 意 す る. 《定 理1》 閉 ル ー プ 系

x(t) = f (x(t), a(x(t)))

を 考 え る.xdを 所 望 の 平 衡 点 と し,Ω を そ の 近 傍 と す る. こ の と きつ ぎの 条 件 を 満 た す 連 続 微 分 可 能 な ス カ ラ ー 値 関 数 V(x),ρ(x)が 存 在 す る な らば,所 望 の 平 衡 点xdは 漸 近 安 定 で あ る. (i) V(x)が 正 定(つ ま りV(xd)=0か つx≠xdの と きV(x)>0),ρ(x)が 正 定(つ ま り ρ(xd)=0か つ x≠xdの と き ρ(x)>0)で あ る. (ii)

dV (x) _ aV (x)

dt

ax f (x, a(x)) < -p(x(t))

dx E S~

が な りた つ. (証 明) f(x)△=f(x,α(x))と お く と き,x=f(x)に 対 す る リア プ ノ ブ安 定 定 理 よ り明 ら か. ■ (注 意) リ ア プ ノ フ の 意 味 で の 安 定 性 を論 じる と き,通 常 原 点 の安 定 性 を考 え る の で,V(0)=0か つV(x)>0 (x≠0) を 正 定 と定 義 す る.し か し本 論 文 で 吟 味 した い の は 所 望 の 平 衡 状 態xdの 近 傍 で の 安 定 性 な の で,リ ア プ ノ フ 関 数 は 平 衡 点 か らの 偏 差 の 関 数V(x)=V(x-xd)が と ら れ る.そ れ ゆ え 正 定 性 の 定 義 が 通 常 と多 少 異 な っ て い る. こ こで,シ ス テ ム(2.1)が 与 え ら れ た と き,つ ぎの よ う な リ ア プ ノ フ 関 数 候 補 を 考 え る.

V (x) = 1(x - xd)T Ql (x - xd)

+ l (u - ud )T Rl (u - ud)

(2.5)

た だ し,Q1>0, R1>0と す る.(2.5)に(2.3)を 代 入 す る と

V(x)=(x

1-

xd)T

Q1(x - xd)

+1(a(x) - Ud)TR1(a(x) - ud)

(2.6)

こ こ でV(x)>0 ∀x≠xdが な りた つ こ とか ら,Vは 正 定 値 関 数 で あ る.

さ ら に

p(x) = (x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud)

(2.7)

た だ し,Q2>0, R2≧0と す る と,こ の ρ(x)はV(x)と 同 様 に 正 定 値 関 数 と い え る.

こ の と き,つ ぎの よ う な不 等 式

dV (x)

_ (x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRI aa(x) f (x, a(x))

c -(x - xd)T Q2(x - xd)

-(a(x) - ud)T R2(a(x) - Ud)

(2.8)

を 満 た す α(x)を 見 つ け れ ば,定 理1を 満 た す.結 局,安 定 化 制 御 器 の設 計 問 題 は

F(x)

(x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRi aa(x) f (x, a(x))

+(x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud) < 0

(2.9)

と な る よ うな α(x)を 求 め る 問 題 と い う こ と に な る.さ ら に Q2, R2の 選 択 は制 御 成 績 の 調 整 パ ラ メ ー タ と して も利 用 で き る.し か し仮 に そ の よ う な α(x)が 存 在 す る と して もそ れ を 解 析 的 に 求 め る の は 非 常 に 困 難 で あ る.以 下 で は こ の α(x) を ニ ュ ー ラ ル ネ ッ トを用 い て 近 似 的 に 実 現 す る問 題 を 考 え る. 3. 安 定 化 制 御 則 の ニ ュ ー ラ ル ネ ッ ト に よ る 最 良 近 似 (2.9)を 満 たすu(t)=α(x(t))を ニ ュ ー ラ ル ネ ッ トで 近 似 的 に実 現 す る こ と を試 み る.そ の よ う な状 態 フ ィー ド バ ッ ク 型 ニ ュ ー ラ ル 制 御 器 と して は つ ぎ の よ う な3層 ニ ュ ー ラ ル ネ ッ ト を用 い る.

z(t) = W(x(t) - xd)

(3.1)

UN(t) = Vo(z(t)) +ud

(3.2)

た だ し こ こ で,z(t)∈Rqは ニ ュ ー ラ ル ネ ッ トの 内 部 状 態, W∈Rq×n, V∈Rr×qは 結 合 重 み行 列 で あ り,σ: Rq→Rq は シ グ モ イ ド 関数 で あ る.ま た シ グ モ イ ド 関 数 と して は つ ぎ の よ う な双 曲 関 数 を用 い る.

a (z) = [o-1(z1),

a2 (z2 ), ... ,aq (zq

exp(zi)

(3

.

(3.1), (3.2)を ま と め る と

UN (t) = a(x(t); W, V)

(3.4)

こ こ で(2.3)よ り(3.4)はud=α(xd; W, V)を 満 た さ な け れ ば な ら な い が,上 記 の ニ ュ ー ラ ル ネ ッ トは 学 習 に 関係 な く, つ ま りW, Vに 関 係 な く,ud=α(xd; W, V)を 満 た して い る こ と に 注 意 され た い. (2.9)に(3.4)を 代 入 した 関 数 を つ ぎ の よ うに お く.

F(x;W,V)

(x - xd)T Qlf (x, &(x; W, V))

+ a x•W V -ud TR1aa(x,W,V)

x a x

+(x - xd)T Q2(x - xd)

+(a(x;W,V)-ud)TR2(a(x;W,V)-ud)

(3.5)

われ われ はxd近

傍 の興味 の あ る領 域 Ω 内の任意 のxに

対 して

F(x;W,V) < 0, dx E 1

(3.6)

(3)

計 測 自動 制御 学 会 論 文 集 第35巻 第4号 1999年4月 491 に な る よ う に ニ ュ ー ラ ル ネ ッ トの 結 合 重 み 行 列W, Vを 決 定 した い.こ こで つ ぎ の よ う な 最 大 値 関 数J(W, V)を 定 義 す る.

J(W, V) = max F(x; W, V )

XEI1

= F(x*(W,V);W,V)

(3.7)

た だ しx*(W, V)は パ ラ メ ト リ ッ ク 最 大 解 を 表 す.こ の と き J(W, V)≦0な ら ば,明 ら か に(3.6)が な り た つ.こ こ で W, Vの 値 に 関係 な く

F(xd;W,V)

= 0

が な りた つ こ と に注 意 す る と,J(W, V)は 明 ら か に非 負 関 数 で あ る. 以 上 よ り

J(W, V) = 0

(3.8)

が な りた つ と きの み,(3.6)が な りた つ とい え る.し た が って (3.8)を 満 た すW, Vを 求 め る こ と を考 え る.そ の た め に つ ぎ の よ う なMin-Max問 題 を考 え る.

min J(W, V) = min max F(x; W, V)

(3.9)

W,V W,V XE1 問 題(3.9)を 解 くた め に,最 急 降 下 法 を応 用 し て,最 大 値 関 数J(W, V)を パ ラ メー タW, Vに 関 して 逐 次 減 少 させ る.し か し一 般 に 最 大 値 関 数J(W, V)は 微 分 不 可 能 関 数 と な る の で,ふ つ う の最 急 降 下 法 の代 わ りに微 分 不 可 能 最 適 化 手 法 を 用 い な け れ ば な ら な い. そ の た め に は まずJ(W, V)のW, Vに 関 す る 一 般 勾 配 を 求 め る 必 要 が あ る.一 般 勾 配 は以 下 の よ う に して 計 算 す る(微 分 不 可 能 最 適 化 理 論 に つ い て は 文 献14), 15)を 参 照 さ れ た い). 問 題(3.7)の 最 大 解 集 合 をP(W, V)と お く.

P(W, V) = x* E

F(x*; W, V) = J(W, V)

(3.10)

こ の と きつ ぎ の 定 理 が な りた つ. [命題1] (i) J(W, V)は 局 所 リ ップ シ ッ ツ 連 続 で あ る (ii) J(W, V)の 一 般 勾 配(集 合)は

awJ(W,V) = co VwF(P(W,V);W,V)

(3.11)

&VJ(W, V) = co VvF(P(W, V); W, V)

(3.12)

た だ し こ こでcoは 凸 包 を 表 す. 一 般 勾 配 は(3 .11), (3.12)で 与 え ら れ る.し た が って maxF(x; W, V)を 適 当 な 非 線 形 計 画 法 で 計 算 し,一 般 勾 配 の 少 な く と も一 つ の 要 素

OWF(x*; W, V)EavJ(W, V), x* E P(W,V)(3.13)

VVF(x*; W, V)E3VJ(W,V),

x* E P(W,V) (3.14)

を う る こ とが で き る の で,一 般 勾 配 を用 い た 各 種 の微 分 不 可 能 最 適 化 手 法 を 利 用 で き る.こ こ で はBundle法 の 一 種 で も っ と も有 力 なMifflinの アル ゴ リズ ム9)を 応 用 す るMifflin の ア ル ゴ リ ズ ム は,一 般 勾 配 の 集 合 の 近 似 集 合Zを 生 成 し, 探 索 方 向s=-Nr(co Z)を 計 算 す る 部 分20)と 工 夫 さ れ た 直 線 探 索 の 部 分 か ら構 成 さ れ た 微 分 不 可 能 関 数 に対 す る 最 急 降 下 法 で あ る.た だ し こ こ でNrSは 閉 凸 集 合Sの 要 素 で ノ ル ム が 最 小 の もの を表 す. Mifflinの ア ル ゴ リズ ム に よ る 降 下 法 は 反 復 計 算 と して 実 行 で きる.J(W, V)=0に な る ま で イテ レ ー シ ョ ン を行 え ば, 一 つ の 安 定 化 制 御 器(状 態 フ ィ ー ドバ ッ ク 制 御 則)を う る こ と が で き る. 学 習 ア ル ゴ リズ ム を 以 下 の 通 り ま と め て お く. < ア ル ゴ リズ ム1> ス テ ップ1: 興 味 の あ る 状 態 領 域 Ω,関 数Fの パ ラ メ ー タQi, Ri, i=1, 2, W, Vの 初 期 値 を定 め,イ テ レ ー シ ョ ン番 号k=0と す る. ス テ ッ プ2: 最 大 解 集 合P(Wk, Vk)の 要 素 を 一 つ 求 め x*kと す る.も しJ(Wk, Vk)=F(x*k; Wk, Vk)=0な ら ば計 算 を終 了 し,学 習 終 了 と す る. ス テ ッ プ3: 一 般 勾 配 ∂oWJ(Wk, Vk),∂oVJ(Wk, Vk)の 一 つ の 要 素 で あ る

VwF(x*k;Wk,Vk),VVF(x*k;Wk,Vk)

(3.15)

を 用 い て,Mifflinの ア ル ゴ リ ズ ム9)に 従 いWk, Vkを 一 回 更 新 し,k:=k+1と しス テ ップ2に 戻 る. 以 下 で は 学 習 ア ル ゴ リズ ム で 必 要 と な る(3.15)を 計 算 す る.こ れ は(3.5)のW, Vに 関 す る勾 配 を 求 め る こ と を意 味 し,成 分 計 算 に よ り求 め る こ と も可 能 で あ る が,非 常 に繁 雑 な 計 算 と な る.そ こ で わ れ わ れ は ラ グ ラ ン ジ ュ未 定 乗 数 法 を 応 用 す る こ と に よ り,よ り明快 な計 算 法 を 提 案 す る. ま ず,(3.1), (3.2), (3.4)よ り

un = &(x; W, V) = Vo(z) + ud

where z = W (x - xd)

これ をxで 微 分 す る と,

aa(x;W,V)

= VVo z W

(3.16)

where

VQ(z) = diag[o (zi), o2(z2),

... , aq(z4)]

(3.17)

で あ る.た だ し こ こ で ▽ σ(z)∈Rq×q=Z(×)Z* (Z*は 双 対

空 間)で あ る.こ こ で(3.16)を(3.5)に 代 入 す る と 関 数Fは つ ぎ の よ う に書 か れ る.

F(x, W, V) = (x - xd)T Qlf (x, uN)

+(UN - Ud)T

RlVVO(z)Wf (x, UN)

+(x - xd)T Q2(x - xd)

+(UN - ud)T R2(UN - ud)

(3.1$)

た だ しzは(3.1), uNは(3.2)で 与 え ら る. こ の と き,つ ぎ の 命 題 が な りた つ. [命題2] 以 下 の 関係 が な りた つ.

Vw F(x; W, V )

(4)

492 T. SICE Vol.35 No.4 April 1999

[V2i(z) . (VT

R1(uN

- ud) (W

f (x,

+V r(z)VT {VuNf (x,UN)Q1(x

- xd) +

VQ(z)Wf(x,

UN) + V UNf (x, uN)WT

R1(UN

- ud) + 2R2(UN

- ud)}] (x -

(3.19

=R1(UN

- ud)f (x, UN)T

WT

VO

{DUN

f (x, UN)Q1(x

- xd) + R1V

W f (x,UN)

+VUNf

(x,UN)WT

R1(UN

- Ud)

+ 2R2(UN

- ud)

(3.

(証 明) ラ グ ラ ン ジ ュ乗 数 ベ ク トル λ ∈Rqと β ∈Rrを 導 入 して ラ グ ラ ン ジ ュ 関 数

L(uN,z,W,V,a,3

-(x - xd)T Qlf (x, UN) + (UN - ud)T Rlvvo

W f (x, UN) + (x _ xd)T Q2(x _ xd) + (UN -

R2 (UN ud) + AT {W (x xd)

-+iT (V c. (z) + ud -

(3.2

を定 義 す る.

ラ グ ラ ンジ ュ関 数Lの 各 変 数 に関 す る偏 導 関数 を 求 め る.微 分 の 連 鎖 律 と勾 配 の 公 式(i) (ii)(注1)な らび にQi, Ri, i=1, 2 と ▽ σ(z)の 対 称 性 よ り以 下 の よ うに な る.

VWL=VO

(z)VT

R1(UN

- ud)f (x, UN)T

+ A(x -

(3.2

VVL=R1(UN

- ud)f(x, uN)T

WT

0O.(z) +/3

(3.

VAL=W(x-xd)-

(3.2

VpL=Vo(z) + Ud - UN

(3.2

VUNL-V

UN

f (x, UN)Q1(x

- x

+R1VVQ(z)W

f (x, U

+VUNf (x, UN)WTVO(z)VT

R1(UN

- u

+2R2

(UN - Ud) - i3

(3.26

VzL=V2Q(z)

. (VT

R1(UN

- ud) (W f (x, UN

-A + Vo(z)VTI3

(3.2

た だ し こ こ で ▽2σ(z)∈Rq×q×q=Z(×)Z(×)Z*は2階 導 関 数 ア レ イ で あ る. (3.26), (3.27)よ り β と λ は

f3-QUNf (x, uN)Ql(x - xd) + R1VVQ(z)W f (x, UN)

+VuNf (x, uN)WTVo (z)VTR1(UN - ud)

+2R2

(UN - ud )

A= V2Q(z)

S (vTRl(UN

- ud) (W

f (x, UN))T

)

+Vo(z) VT

p

= V20 (z) • (VT

R1(uN

- ltd) (W

f (x, 21N))T)

+

Vo(z)VT

{VUNf

(x, UN)Ql(x

- xd) +

RiVVQ(z)Wf

(x, UN) + VUNf

(xa UN)WTO

VT

R1(UN

- ltd) + 2R2(UN

- ud)}

こ の よ う に(3.26), (3.27)よ り β と λ を 求 め,(3.22), (3.23) に 代 入 し,さ ら に ▽wF=▽wL, ▽vF=▽vLを 考 慮 す る と,(3.19), (3.20)を う る. ■ この 命 題2に よ りア ル ゴ リズ ム1中 の(3.15)の 計 算 式 が 得 ら れ た. と こ ろ で,(3.19)に は ベ ク トル ー マ ト リ ク ス 表 現 の ほ か に ア レ イ 表 現 が 用 い られ て い る.そ の ア レ イ表 現 の 部 分,つ ま り

V2o(z) . (VTR1(UN

- ud) (Wf (x, uN))T

I

は つ ぎの よ う な行 列

Z = diag[a (zl)yl, o2 (z2)y2, ... , cq,(zq)yq]

y=Wf(x,uN)

を 定 義 す る と,以 下 の よ う にベ ク トル ー マ ト リク ス 表 現 に 書 き換 え る こ と も で きる.

V2u(z). (VT

R1(uN

- ud) (Wf (x,uN))T

)

= ZVT

R1(UN

- ud )

4. シ ミ ュ レ ー シ ョ ン こ の 節 で は,簡 単 な 数 値 例 を 用 い て 本 論 文 で 与 え た ア プ ロ ー チ の 有 効 性 を 示 す. (注 意) ア ル ゴ リズ ム1の ス テ ップ2に お い て,最 大 解 集 合P(Wk, Vk)の 一 つ の 要 素x*kた を 求 め な け れ ば な ら な い. ム つ ま りmaxF(x; Wk, Vk)を 何 らか の 非 線 形 計 画 法 で 解 き, 大 域 的 最 適 解 を求 め ね ば な ら な い.大 域 的 最 適 化 の ア ル ゴ リ ズ ム と して は何 を 使 っ て も よい が,現 在 あ ま り効 率 の よ い ア ル ゴ リ ズ ム は 開 発 さ れ て い な い.そ こ で,こ こ で は 簡 便 に つ ぎ の よ う に し て シ ミュ レ ー シ ョ ン をお こ な っ た.ま ず Ω を 離 散 化 し,そ の 集 合 △={xp│xp∈ Ω,p=1, 2, …, N}の 上 た で 全 点 比 較 してx*Kの 近 似 解 と した. 4.1 Rayleigh Model 状 態 方 程 式 は つ ぎ の よ う に与 え ら れ る.

ii(t)=x2(t)

(4.la)

i2(t) =-xi(t) + (1.4 - 0.14x2(t))x2(t)

+ 4u(t) (4.lb)

ま た,所 望 の 平 衡 状 態 は(xd, ud)=(0, 0)と す る.

興 味 の あ る 状 態 領 域 Ω={x│-10≦x1, 2≦10}と し,Δ は 原 点 を 含 む0.5間 隔 の1681個 の 格 子 点 と し た.(3.5)の パ ラ メ ー タ はQ1=E, Q2=0.01E, R1=1, R2=0.01 (E (注1)

(i) f(x)=aT●x, x∈X, aT∈Z(×)X*の と き, ▽f(x)=a∈X(×)Z*

(ii) f(D)=xT●D●y, x∈X, y∈Y, D∈X(×)Y*の と き, ▽f(D)=x(×)yT∈X(×)Y*

(5)

計測 自動 制 御 学 会論 文集 第35巻 第4号 1999年4月 493 単 位 行 列),ニ ユ ー ラ ル ネ ッ トの 中 間 層 ニ ュ ー ロ ン の 数 は8, 結 合 重 み の 初 期 値W0, V0は0∼1の 乱 数 で(4.2)の よ う に 与 え て ニ ュ ー ラ ル ネ ッ トの 学 習 を 行 っ た.

0.027734

0.696329

0.543553

0.312489

0.394107

0.492375

0.788487

0.826898

0.070021

w _

0.914796

0.850389

v-

0.021475

0.619592

0.992774

0.020410

0.793615

0.953709

0.053873

0.381732

0.438330

0.547065

0.323344

0.281141

0.913086

(4.2)

15回 の イ テ レ ー シ ョ ン 後 のW15, V15は つ ぎ の よ う に な っ た. 0.135414 0.305831 -2.617484 -0 .149626 0.935843 -3.641724 0.920822 0.800825 -3.122351 W- 0.914931 0.853808 V- -3.166511 0.678282 0.826323 -3.144931 1.003078 0.832416 -3.105762 -0 .581259 0.750374 -3.539727 0.057050 -0.900797 0.453772 イ テ レ ー シ ョ ン に 対 す る 最 大 値 関 数J(W, V)の 変 化 を Fig. 1に 示 す.Fig. 1よ り学 習 後 のW, Vに よ りJ(W, V)= 0(最 適 点)が 満 た さ れ て い る.し た が って 学 習 後 のW, Vを 用 い た状 態 フ ィー ド バ ッ ク 型 ニ ュ ー ラル 制 御 器

u(t) = Vr (Wx(t))

は シ ス テ ム(4.1)を 原 点 に漸 近 収 束 させ る こ とが で き る.初 期 点x(0)=(9, 9)Tに お け る 閉 ル ープ 系 の 応 答 と リ ア プ ノ フ 関 数V(x(t))の 時 間 変 化 をFig. 2に 示 す.ま た Ω 内 の い ろ い ろ な 初 期 点 に お け る 閉 ル ー プ 系 の 応 答 を状 態 平 面 を 用 い てFig. 3に 示 す.

4.2 Single Link Manipulater Model

全 長2l,全 質 量mの 均 質 なLinkの 一 端 に トル ク τ(t)が 制 御 入 力 と して 加 わ っ て い る シス テ ム(Single Link Manip-ulater)は,つ ぎ の よ う に 表 さ れ る.

ii(t) = x2(t)

(4.3a)

x2(t) _ -7x2(t) + mlg sin(xi(t)) + lu(t) (4.3b)

こ こ で,x1(t)はLinkの 角 度,x2(6)はLinkの 角 速 度,u(t) は 制 御 入 力 と し,Linkに 加 え ら れ る ト ル ク と す る.Dは 軸 受 け の 粘 性 摩 擦 係 数,IはLinkの 軸 受 け を 中 心 と す る 慣 性 モ ー メ ン ト,gは 重 力 加 速 度 で あ る.ま たD=0.00198, l= 0.5, m=1.0, I=0.33333, g=9.8と し,所 望 の 平 衡 状 態 は (xd, ud)=(0, 0)と す る. 興 味 の あ る 状 態 領 域 Ω={x│-3≦x1≦3, -5≦x2≦5} と し,Δ は 原 点 を 含 む0.2間 隔 の1581個 の 格 子 点 と し た. (3.5)の パ ラ メ ー タ はQ1=E, Q2=0.1E, R1=1, R2= 0.1,ニ ュ ー ラ ル ネ ッ ト の 中 間 層 ニ ュ ー ロ ン の 数 は8,結 合 重 み の 初 期 値W0, V0は0∼1の 乱 数 で(4.2)式 の よ う に 与 え て ニ ュ ー ラ ル ネ ッ ト の 学 習 を 行 っ た. 29回 の イ テ レ ー シ ョ ン 後 のW29, V29は つ ぎ の よ う に な っ た.

-6 .075385

2.713280

-3.007068

-2 .633142

0.996453

-1.815892

-0 .066530

-0.532184

2.198456

W-

2.459074

-0.986062

V_

-1.279865

-1 .130929

0.364276

0.961835

2.773482

0.902580

-3.626733

0.317627

0.273349

-2.491498

5.616085

0.648647

-4.798167

イ テ レ ー シ ョン に 対 す る 最 大 値 関 数J(W, V)の 変 化 を Fig. 4に 示 す.Fig. 4よ り学 習 後 のW, Vに よ りJ(W, V)=0 (最 適 点)が 満 た され て い る.し た が っ て 学 習 後 のW, Vを 用 い た状 態 フ ィー ドバ ッ ク 型 ニ ュ ー ラ ル 制 御 器

u(t) = Vu (Wx(t))

は(4.3)を 原 点 に 漸 近 収 束 さ せ る こ と が で き る.初 期 点 x(0)=(2, 4)Tに お け る 閉 ル ー プ 系 の 応 答 と リ ア プ ノ フ 関 数V(x(t))の 時 間 変 化 をFig. 5に 示 す.ま た Ω 内 の い ろ い ろ な 初 期 点 に お け る 閉 ル ー プ 系 の 応 答 を状 態 平 面 を用 い て Fig. 6に 示 す. 5. お わ り に 閉 ル ー プ 系 を漸 近 安 定 化 す る に は,定 理1に お け る 関 数 V(x),ρ(x)を 見 つ け れ ば よ い が,一 般 的 に は 難 しい. 本 論 文 で は 逆 に,は じめ か ら関 数V(x),ρ(x)を 与 え定 理1 を満 た す よ う に,状 態 フ ィ ー ドバ ッ ク 制 御 則 α(x)を ニ ュ ー ラ ル ネ ッ トで 近 似 実 現 す る手 法 を提 案 した.そ の 際 ニ ュ ー ラ ル ネ ッ トの 結 合 重 み 行 列W, VはMin-Max問 題 をMifflin の ア ル ゴ リズ ム を 応 用 し て 解 く こ と に よ り求 め た.シ ミ ュ レ ー シ ョ ン結 果 は 本 論 文 で 提 案 し た ア プ ロ ー チ の 有 効 性 を 示 した. 本 論 文 にお け るV(x),ρ(x)は 目 標 値 か らの2乗 誤 差 関 数 と した が,そ れ 以 外 の 設 計 も可 能 で,命 題2に 相 当 す る勾 配 関 数 を計 算 し な お せ ば,同 様 の ア プ ロ ー チ で フ ィ ー ドバ ッ ク 制 御 則 を近 似 実 現 す る こ とが で き る.関 数V(x)と 関数 ρ(x) の 関 係 は 逆 最 適 制 御 問 題 の 観 点 か ら も論 じ ら れ て お り3),4), 今 後,そ れ ら の 本 論 文 へ の 応 用 を 考 え て い き た い. 謝 辞:シ ミ ュ レ ー シ ョ ン用 プ ロ グ ラ ム の 作 成 に ご協 力 い た だ い た 慶 應 義 塾 大 学 大 学 院 の 新 木 正 一 氏 に 感 謝 の 意 を 表 し ます.

(6)

494 T. SICE Vol.35 No.4 April 1999

Fig. 1: Rayleigh Model:

Change of Max function J(Wk, Vk)

Fig. 2a: Rayleigh Model:

State and control for x(0)=(9,

9)T

Fig. 2b: Rayleigh Model: Time change of Lyapunov function

Fig. 3: Rayleigh Model:

Trajectories for various initial state x(0)

Fig. 4: Single Link Manipulater Model:

Change of Max function J(Wk, Vk)

Fig. 5a: Single Link Manipulater Model:

State and control for x(0)=(2, 4)T

Fig. 5b: Single Link Manipulater Model: Time change of Lyapunov function

Fig. 6: Single Link Manipulater Model:

Trajectories for various initial state x(0)

(7)

計 測 自動 制 御 学 会 論文 集 第35巻 第4号 1999年4月 495

参 考

1) Z. Artstein: Stalilization with Relaxed Controls, Nonlinear

Analysis, Vol.TMA-7, 1163/1173 (1983)

2) R.W. Brochett: Asymptotic Stability and Feedback

Sta-bilization, in Differential Geometric Control Theory

(R.W. Brochett etal. eds.), Birkhauser, 181/191 (1983)

3) R.A. Freeman and J.A. Primbs: Control Lyapunov

Func-tions -New Ideas From an Old Source-, Proc. of the 35th

Conference on Decision and Control, 3926/3931, Kobe

(1996)

4) R.A. Freeman and P.V. Kokotovic, Robust Nonlinear

Con-trol Design. Boston: Birkhauser, 1996

5) M.M. Gupta and N.K. Sinha(eds.): Intelligent Control

Sys-tems, Chap.12 (M. Saerens, J.M. Renders and N. Bersini:

Neuro Control Based on the Backpropagation Algorithm),

IEEE press (1996)

6) K. Kawamura, T. Ikai and H. Kosako: Backpropagation

Learning of Feedback Neural Networks-Consideration

from a Viewpoint of Dynamical System Optimization,

Trans. IEICE, D-II, Vol.J73-D-II,

No.9 (1990)

7) M. Kristic, I. KanellaKopoulos and P. Kokotovic: Nonlinear

and Adaptive Control Design, J. Wiley & Sons (1995)

8) J. LaSalle and S. Lefschetz: Stability by Liapunov's Direct

Method with Applications. Academic Press (1961)

9) R. Mifflin: An Algorithm for Constrained Optimization

with Semismooth Functions, Mathematics of Operations

Research, Vol.2, 191/207 (1977)

10) K.S. Narendra and K. Parthasarathy:

Identification and

Control of Dynamical Systems Using Neural Networks,

IEEE Trans. Neural Networks, Vol.1, No.1 (1990)

11) D. Psaltis, A. Sideris, A. Yamamura: A Multilayered

Neu-ral Netwark Controller, IEEE Control System Magazine,

Vol.18, No.2 (1988)

12) D.E. Rumelhart, G.E. Hinton and R.J. Williams: Learning

Representation by Back-propagating Errors, NATURE,

Vol.323, No.9, 535/536 (1986)

13) K. Shimizu and M. Ohtani: Optimal Control for

Nolin-ear Systems by a Neural Controller of the State

Feed-back Type, IEEE 35th Conf. on Decision & Control,

Vol.3, 3300/3303 (1996)

14) 志 水,相 吉:数 理 計 画 法,10章,昭 晃 堂 (1984)

15) K. Shimizu, Y. Ishizuka and J.F. Bard: Nondifferentiable

and Two-Level Mathematical Programming, Kluwer

Aca-demic Publishers (1997)

16) J.J.E. Slotine and W. Li: Applied Nonlinear Control,

Pren-tice Hall (1991)

17) E.D. Sontag: Mathematical Control Theory, Deterministic

Finite Dimensional Systems, Springer-Verlag (1990)

18) E.D. Sontag and H.J. Sussmann: Remarks on Continuous

Feedback, Proc. IEEE Conf. Decision and Control, 916/921

(1980)

19) M. Suzuki and K. Shimizu: Analysis of Distributed Systems

by Array Algebra, Int. J. of Systems Science, Vol.21 No.1,

129/155 (1990)

20) P. Wolfe: Finding the Nearest Point in a Polytope,

Math-ematical Programming, 11, 128/149 (1976)

[著

介]

孝(正

会員)

1962年 慶 應 義 塾 大 学 理 工 学 部 計 測 工 学 科 卒 業. 1964年 同 大 学 大 学 院 修 士 課 程 修 了.1967年 ケ ー ス 工 科 大 学 博 士 課 程 修 了.Ph.D.現 在 に 至 る.慶 應 義 塾 大 学 理 工 学 部 教 授.専 門 は シ ス テ ム 制 御, 数 理 計 画 法,最 適 制 御,ニ ュ ー ラ ル ネ ッ ト ワ ー ク

な ど,IEEE, SICE, IEICEな ど の 会 員.

藤 和 幸

1997年 慶應 義 塾 大 学 理 工 学 部 計 測 工 学 科卒 業. 99年 同 大学 大 学院理 工 学研 究 科修 士 課程 計 測工 学 専 攻修 了.同 年横 河 電機(株)入 社.大 学 院 在籍 中 は非線 形 制 御系 の設 計,ニ ュ ー ラ ル ネ ッ トワ ー ク の研 究 に従 事.

参照

関連したドキュメント

This paper deals with the a design of an LPV controller with one scheduling parameter based on a simple nonlinear MR damper model, b design of a free-model controller based on

In this paper, the method of Lyapunov functions is used to derive classes of stable quadratic discrete autonomous systems in a critical case in the presence of a simple eigenvalue λ

In this paper we have investigated the stochastic stability analysis problem for a class of neural networks with both Markovian jump parameters and continuously distributed delays..

Several control schemes for the stability/synchronization/solution problem of nonlinear systems have been studied extensively, such as backstepping design 8, feedback control

Based on Lyapunov stability theory and linear matrix inequality LMI formulation, a simple linear feedback control law is obtained to enforce the prespecified exponential decay

We recall here the de®nition of some basic elements of the (punctured) mapping class group, the Dehn twists, the semitwists and the braid twists, which play an important.. role in

The aim of this work is to prove the uniform boundedness and the existence of global solutions for Gierer-Meinhardt model of three substance described by reaction-diffusion

We shall see below how such Lyapunov functions are related to certain convex cones and how to exploit this relationship to derive results on common diagonal Lyapunov function (CDLF)