Design of Neural Stabilizing Controller for Nonlinear Systems via Lyapunov's Direct Method Kiyotaka SHIMIZU* and Kazuyuki ITO This paper is concerned

(1)

計測自動制御学会論文集

Vol.35, No.4, 489/495 (1999)

リアプノフ直接法による非線形システムの

ニューラル安定化制御器の設計

志

水

清

孝＊・伊

藤

和

幸

Design

of Neural

Stabilizing

Controller

for Nonlinear

Systems

via Lyapunov's

Direct

Method

Kiyotaka SHIMIZU* and Kazuyuki ITO

This paper is concerned with a neural stabilizing controller of general nonlinear systems. The stabilizing state feedback control law is approximated with a multi-layered neural network. Connection weights in the neural controller are determined by a min-max algorithm such that the Lyapunov stability theorem holds via a control Lyapunov function.

Key Words: stabilizing control, Lyapunov's direct method, neural net, min-max algorithm, nondifferentiable optimization 1. はじめにリアプノフ安定定理を応用した非線形システムの安定化制御に関しては多くの研究がある.しかし一般には安定性を保証するリアプノフ関数候補を見つけることが困難である.最近の研究には,ニューラルネットでコントローラを構成しそのフィードバック系(閉ループ系)が安定であることを証明しようとしたもの5),6),10),11)や,制御リアプノフ関数17)の概念を応用しバックステッピング法で安定化制御器を設計する研究7)などがある. この論文では非線形システムの安定化制御器を多層ニューラルネット12),13)で近似し,リアプノフの安定定理8),16)を満足するようにニューラルネットの結合重みの値を決定する手法を研究する.これは,多層ニューラルネットには任意の関数を近似する能力があるので,安定化制御則をニューラルネットで関数近似することを意味する. このような方法はリアプノフ安定定理の応用としてはもっとも直接的なアプローチであるが従来ほとんど研究されていなかった. 本論文では以下のような構成で研究報告をする.2節ではニューラルネットで近似実現を試みる安定化制御則を定式化する.3節ではそのような安定化制御則をニューラルネットで近似実現するための学習問題は,Min-Max問題という微分不可能最適化問題を解ぐことにより解決されることを示し, さらに微分不可能最適化アルゴリズム(本論文ではMifflinのアルゴリズム9))に基づいた学習アルゴリズムを提案する.4 節では数値例のシミュレーション結果を与え,本論文のアプローチの有効性を示す. 2. 非線形システムの安定化制御則非線形システム

E(t) = f (x(t), u(t)),

x(to) = xo

(2.1)

を考える.ここでx(t)∈Rnは状態ベクトル,u(t)∈Rrは制御入力ベクトルである. このシステムの平衡状態は

0 = f (xs, us)

(2.2)

を満たす.(2.2)はn+T個の変数とn個の式なので,r個の変数を任意の所望値として設定できる.その結果,残りの n個の変数は従属的に決まる.そのようにして決められた (xs, us)を(xd, ud)としよう. 本論文の目的は所望の平衡状態(xd, ud)へ漸近収束させる安定化制御器を状態フィードバック制御則

u(t) = a(x(t)),

ud = a(xd)

(2.3)

によって構成することである.リアプノフ安定定理は与えられたシステムの安定性を分析する方法である.所望の平衡点において閉ループ系を安定化するためには,制御リアプノフ関数(clf)の概念が非常に強力であり,われわれは閉ループ系

x(t) = f (x(t), a(x(t)))

(2.4)

† 第26回制御理論シンポジウムで一部発表(1997 _.5) ＊慶應義塾大学理工学部横浜市港北区日吉3 -14-1

* Faculty

of Science

and Technology

, Keio University,

Yokohama

(Received March 26, 1998)

(Revised October 5, 1998)

(2)

490 T. SICE Vol.35 No.4 April 1999 における所望の平衡点xdが漸近安定になるように,状態フィードバック制御則 α(x(t))を設計することを試みる. 文献1), 2), 17), 18)で指摘されたように,常に連続関数の状態フィードバック制御則が存在するとは限らないが,ここでは連続な制御則が存在すると仮定する. 閉ループ系(2.4)の漸近安定性を論じるため,以下の定理を用意する. 《定理1》閉ループ系

x(t) = f (x(t), a(x(t)))

を考える.xdを所望の平衡点とし,Ω をその近傍とする. このときつぎの条件を満たす連続微分可能なスカラー値関数 V(x),ρ(x)が存在するならば,所望の平衡点xdは漸近安定である. (i) V(x)が正定(つまりV(xd)=0かつx≠xdのときV(x)>0),ρ(x)が正定(つまり ρ(xd)=0かつ x≠xdのとき ρ(x)>0)である. (ii)

dV (x) _ aV (x)

dt

ax f (x, a(x)) < -p(x(t))

dx E S~

がなりたつ. (証明) f(x)△=f(x,α(x))とおくとき,x=f(x)に対するリアプノブ安定定理より明らか. ■ (注意) リアプノフの意味での安定性を論じるとき,通常原点の安定性を考えるので,V(0)=0かつV(x)>0 (x≠0) を正定と定義する.しかし本論文で吟味したいのは所望の平衡状態xdの近傍での安定性なので,リアプノフ関数は平衡点からの偏差の関数V(x)=V(x-xd)がとられる.それゆえ正定性の定義が通常と多少異なっている. ここで,システム(2.1)が与えられたとき,つぎのようなリアプノフ関数候補を考える.

V (x) = 1(x - xd)T Ql (x - xd)

+ l (u - ud )T Rl (u - ud)

(2.5)

ただし,Q1>0, R1>0とする.(2.5)に(2.3)を代入すると

V(x)=(x

1-

xd)T

Q1(x - xd)

+1(a(x) - Ud)TR1(a(x) - ud)

(2.6)

ここでV(x)>0 ∀x≠xdがなりたつことから,Vは正定値関数である.

さらに

p(x) = (x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud)

(2.7)

ただし,Q2>0, R2≧0とすると,この ρ(x)はV(x)と同様に正定値関数といえる.

このとき,つぎのような不等式

dV (x)

_ (x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRI aa(x) f (x, a(x))

c -(x - xd)T Q2(x - xd)

-(a(x) - ud)T R2(a(x) - Ud)

_(2.8)

を満たす α(x)を見つければ,定理1を満たす.結局,安定化制御器の設計問題は

F(x)

(x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRi aa(x) f (x, a(x))

+(x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud) < 0

(2.9)

となるような α(x)を求める問題ということになる.さらに Q2, R2の選択は制御成績の調整パラメータとしても利用できる.しかし仮にそのような α(x)が存在するとしてもそれを解析的に求めるのは非常に困難である.以下ではこの α(x) をニューラルネットを用いて近似的に実現する問題を考える. 3. 安定化制御則のニューラルネットによる最良近似 (2.9)を満たすu(t)=α(x(t))をニューラルネットで近似的に実現することを試みる.そのような状態フィードバック型ニューラル制御器としてはつぎのような3層ニューラルネットを用いる.

z(t) = W(x(t) - xd)

(3.1)

UN(t) = Vo(z(t)) +ud

(3.2)

ただしここで,z(t)∈Rqはニューラルネットの内部状態, W∈Rq×n, V∈Rr×qは結合重み行列であり,σ: Rq→Rq はシグモイド関数である.またシグモイド関数としてはつぎのような双曲関数を用いる.

a (z) = [o-1(z1),

a2 (z2 ), ... ,aq (zq

exp(zi)

(3

.

(3.1), (3.2)をまとめると

UN (t) = a(x(t); W, V)

(3.4)

ここで(2.3)より(3.4)はud=α(xd; W, V)を満たさなければならないが,上記のニューラルネットは学習に関係なく, つまりW, Vに関係なく,ud=α(xd; W, V)を満たしていることに注意されたい. (2.9)に(3.4)を代入した関数をつぎのようにおく.

F(x;W,V)

(x - xd)T Qlf (x, &(x; W, V))

+ a x•W V -ud TR1aa(x,W,V)

x a x

+(x - xd)T Q2(x - xd)

+(a(x;W,V)-ud)TR2(a(x;W,V)-ud)

(3.5)

われわれはxd近

傍の興味のある領域 Ω 内の任意のxに

対して

F(x;W,V) < 0, dx E 1

(3.6)

(3)

計測自動制御学会論文集第35巻第4号 1999年4月 491 になるようにニューラルネットの結合重み行列W, Vを決定したい.ここでつぎのような最大値関数J(W, V)を定義する.

J(W, V) = max F(x; W, V )

XEI1

= F(x*(W,V);W,V)

(3.7)

ただしx*(W, V)はパラメトリック最大解を表す.このとき J(W, V)≦0ならば,明らかに(3.6)がなりたつ.ここで W, Vの値に関係なく

F(xd;W,V)

= 0

がなりたつことに注意すると,J(W, V)は明らかに非負関数である. 以上より

J(W, V) = 0

(3.8)

がなりたつときのみ,(3.6)がなりたつといえる.したがって (3.8)を満たすW, Vを求めることを考える.そのためにつぎのようなMin-Max問題を考える.

min J(W, V) = min max F(x; W, V)

(3.9)

W,V W,V XE1 問題(3.9)を解くために,最急降下法を応用して,最大値関数J(W, V)をパラメータW, Vに関して逐次減少させる.しかし一般に最大値関数J(W, V)は微分不可能関数となるので,ふつうの最急降下法の代わりに微分不可能最適化手法を用いなければならない. そのためにはまずJ(W, V)のW, Vに関する一般勾配を求める必要がある.一般勾配は以下のようにして計算する(微分不可能最適化理論については文献14), 15)を参照されたい). 問題(3.7)の最大解集合をP(W, V)とおく.

P(W, V) = x* E

F(x*; W, V) = J(W, V)

(3.10)

このときつぎの定理がなりたつ. [命題1] (i) J(W, V)は局所リップシッツ連続である (ii) J(W, V)の一般勾配(集合)は

awJ(W,V) = co VwF(P(W,V);W,V)

(3.11)

&VJ(W, V) = co VvF(P(W, V); W, V)

(3.12)

ただしここでcoは凸包を表す. 一般勾配は(3 _{.11), (3.12)で} _{与えられる.し} _{たがって} maxF(x; W, V)を適当な非線形計画法で計算し,一般勾配の少なくとも一つの要素

OWF(x; W, V)EavJ(W, V), x E P(W,V)(3.13)

VVF(x*; W, V)E3VJ(W,V),

x* E P(W,V) (3.14)

をうることができるので,一般勾配を用いた各種の微分不可能最適化手法を利用できる.ここではBundle法の一種でもっとも有力なMifflinのアルゴリズム9)を応用するMifflin のアルゴリズムは,一般勾配の集合の近似集合Zを生成し, 探索方向s=-Nr(co Z)を計算する部分20)と工夫された直線探索の部分から構成された微分不可能関数に対する最急降下法である.ただしここでNrSは閉凸集合Sの要素でノルムが最小のものを表す. Mifflinのアルゴリズムによる降下法は反復計算として実行できる.J(W, V)=0になるまでイテレーションを行えば, 一つの安定化制御器(状態フィードバック制御則)をうることができる. 学習アルゴリズムを以下の通りまとめておく. ＜アルゴリズム1＞ステップ1: 興味のある状態領域 Ω,関数FのパラメータQi, Ri, i=1, 2, W, Vの初期値を定め,イテレーション番号k=0とする. ステップ2: 最大解集合P(Wk, Vk)の要素を一つ求め x*kとする.もしJ(Wk, Vk)=F(x*k; Wk, Vk)=0ならば計算を終了し,学習終了とする. ステップ3: 一般勾配 ∂oWJ(Wk, Vk),∂oVJ(Wk, Vk)の一つの要素である

VwF(xk;Wk,Vk),VVF(xk;Wk,Vk)

(3.15)

を用いて,Mifflinのアルゴリズム9)に従いWk, Vkを一回更新し,k:=k+1としステップ2に戻る. 以下では学習アルゴリズムで必要となる(3.15)を計算する.これは(3.5)のW, Vに関する勾配を求めることを意味し,成分計算により求めることも可能であるが,非常に繁雑な計算となる.そこでわれわれはラグランジュ未定乗数法を応用することにより,より明快な計算法を提案する. まず,(3.1), (3.2), (3.4)より

un = &(x; W, V) = Vo(z) + ud

where z = W (x - xd)

これをxで微分すると,

aa(x;W,V)

_{= VVo z W}

_(3.16)

where

VQ(z) = diag[o (zi), o2(z2),

... , aq(z4)]

(3.17)

である.ただしここで ▽ σ(z)∈Rq×q=Z(×)Z* (Z*は双対

空間)である.ここで(3.16)を(3.5)に代入すると関数Fはつぎのように書かれる.

F(x, W, V) = (x - xd)T Qlf (x, uN)

+(UN - Ud)T

RlVVO(z)Wf (x, UN)

+(x - xd)T Q2(x - xd)

+(UN - ud)T R2(UN - ud)

(3.1$)

ただしzは(3.1), uNは(3.2)で与えらる. このとき,つぎの命題がなりたつ. [命題2] 以下の関係がなりたつ.

Vw F(x; W, V )

(4)

492 T. SICE Vol.35 No.4 April 1999

[V2i(z) . (VT

R1(uN

- ud) (W

f (x,

+V r(z)VT {VuNf (x,UN)Q1(x

- xd) +

VQ(z)Wf(x,

UN) + V UNf (x, uN)WT

R1(UN

- ud) + 2R2(UN

- ud)}] (x -

(3.19

=R1(UN

- ud)f (x, UN)T

WT

VO

{DUN

f (x, UN)Q1(x

- xd) + R1V

W f (x,UN)

+VUNf

(x,UN)WT

R1(UN

- Ud)

+ 2R2(UN

- ud)

(3.

(証明) ラグランジュ乗数ベクトル λ ∈Rqと β ∈Rrを導入してラグランジュ関数

L(uN,z,W,V,a,3

-(x - xd)T Qlf (x, UN) + (UN - ud)T Rlvvo

W f (x, UN) + (x _ xd)T Q2(x _ xd) + (UN -

R2 (UN ud) + AT {W (x xd)

-+iT (V c. (z) + ud -

(3.2

を定義する.

ラグランジュ関数Lの各変数に関する偏導関数を求める.微分の連鎖律と勾配の公式(i) (ii)(注1)ならびにQi, Ri, i=1, 2 と ▽ σ(z)の対称性より以下のようになる.

VWL=VO

(z)VT

R1(UN

- ud)f (x, UN)T

+ A(x -

(3.2

VVL=R1(UN

- ud)f(x, uN)T

WT

0O.(z) +/3

(3.

VAL=W(x-xd)-

(3.2

VpL=Vo(z) + Ud - UN

(3.2

VUNL-V

UN

f (x, UN)Q1(x

- x

+R1VVQ(z)W

f (x, U

+VUNf (x, UN)WTVO(z)VT

R1(UN

- u

+2R2

(UN - Ud) - i3

(3.26

VzL=V2Q(z)

. (VT

R1(UN

- ud) (W f (x, UN

-A + Vo(z)VTI3

_(3.2

ただしここで ▽2σ(z)∈Rq×q×q=Z(×)Z(×)Z*は2階導関数アレイである. (3.26), (3.27)より β と λ は

f3-QUNf (x, uN)Ql(x - xd) + R1VVQ(z)W f (x, UN)

+VuNf (x, uN)WTVo (z)VTR1(UN - ud)

+2R2

(UN - ud )

A= V2Q(z)

S (vTRl(UN

- ud) (W

f (x, UN))T

)

+Vo(z) VT

p

= V20 (z) • (VT

R1(uN

- ltd) (W

_{f (x, 21N))T)}

₊

Vo(z)VT

{VUNf

(x, UN)Ql(x

- xd) +

RiVVQ(z)Wf

(x, UN) + VUNf

(xa UN)WTO

VT

R1(UN

- ltd) + 2R2(UN

- ud)}

このように(3.26), (3.27)より β と λ を求め,(3.22), (3.23) に代入し,さらに ▽wF=▽wL, ▽vF=▽vLを考慮すると,(3.19), (3.20)をうる. ■ この命題2によりアルゴリズム1中の(3.15)の計算式が得られた. ところで,(3.19)にはベクトルーマトリクス表現のほかにアレイ表現が用いられている.そのアレイ表現の部分,つまり

V2o(z) . (VTR1(UN

- ud) (Wf (x, uN))T

I

はつぎのような行列

Z = diag[a (zl)yl, o2 (z2)y2, ... , cq,(zq)yq]

y=Wf(x,uN)

を定義すると,以下のようにベクトルーマトリクス表現に書き換えることもできる.

V2u(z). (VT

R1(uN

- ud) (Wf (x,uN))T

)

= ZVT

R1(UN

- ud )

4. シミュレーションこの節では,簡単な数値例を用いて本論文で与えたアプローチの有効性を示す. (注意) アルゴリズム1のステップ2において,最大解集合P(Wk, Vk)の一つの要素x*kたを求めなければならない. ムつまりmaxF(x; Wk, Vk)を何らかの非線形計画法で解き, 大域的最適解を求めねばならない.大域的最適化のアルゴリズムとしては何を使ってもよいが,現在あまり効率のよいアルゴリズムは開発されていない.そこで,ここでは簡便につぎのようにしてシミュレーションをおこなった.まず Ω を離散化し,その集合 △={xp￨xp∈ Ω,p=1, 2, …, N}の上たで全点比較してx*Kの近似解とした. 4.1 Rayleigh Model 状態方程式はつぎのように与えられる.

ii(t)=x2(t)

(4.la)

i2(t) =-xi(t) + (1.4 - 0.14x2(t))x2(t)

+ 4u(t) (4.lb)

また,所望の平衡状態は(xd, ud)=(0, 0)とする.

興味のある状態領域 Ω={x￨-10≦x1, 2≦10}とし,Δ は原点を含む0.5間隔の1681個の格子点とした.(3.5)のパラメータはQ1=E, Q2=0.01E, R1=1, R2=0.01 (E (注1)

(i) f(x)=aT●x, x∈X, aT∈Z(×)X*のとき, ▽f(x)=a∈X(×)Z*

(ii) f(D)=xT●D●y, x∈X, y∈Y, D∈X(×)Y*のとき, ▽f(D)=x(×)yT∈X(×)Y*

(5)

計測自動制御学会論文集第35巻第4号 1999年4月 493 単位行列),ニユーラルネットの中間層ニューロンの数は8, 結合重みの初期値W0, V0は0∼1の乱数で(4.2)のように与えてニューラルネットの学習を行った.

0.027734

0.696329

0.543553

0.312489

0.394107

0.492375

0.788487

0.826898

0.070021

w _

0.914796

0.850389

v-

0.021475

0.619592

0.992774

0.020410

0.793615

0.953709

0.053873

0.381732

0.438330

0.547065

0.323344

0.281141

0.913086

(4.2)

15回のイテレーション後のW15, V15はつぎのようになった. 0.135414 0.305831 -2.617484 -0 .149626 0.935843 -3.641724 0.920822 0.800825 -3.122351 W- 0.914931 0.853808 V- -3.166511 0.678282 0.826323 -3.144931 1.003078 0.832416 -3.105762 -0 .581259 0.750374 -3.539727 0.057050 -0.900797 0.453772 イテレーションに対する最大値関数J(W, V)の変化を Fig. 1に示す.Fig. 1より学習後のW, VによりJ(W, V)= 0(最適点)が満たされている.したがって学習後のW, Vを用いた状態フィードバック型ニューラル制御器

u(t) = Vr (Wx(t))

はシステム(4.1)を原点に漸近収束させることができる.初期点x(0)=(9, 9)Tにおける閉ループ系の応答とリアプノフ関数V(x(t))の時間変化をFig. 2に示す.また Ω 内のいろいろな初期点における閉ループ系の応答を状態平面を用いてFig. 3に示す.

4.2 Single Link Manipulater Model

全長2l,全質量mの均質なLinkの一端にトルク τ(t)が制御入力として加わっているシステム(Single Link Manip-ulater)は,つぎのように表される.

ii(t) = x2(t)

(4.3a)

x2(t) _ -7x2(t) + mlg sin(xi(t)) + lu(t) (4.3b)

ここで,x1(t)はLinkの角度,x2(6)はLinkの角速度,u(t) は制御入力とし,Linkに加えられるトルクとする.Dは軸受けの粘性摩擦係数,IはLinkの軸受けを中心とする慣性モーメント,gは重力加速度である.またD=0.00198, l= 0.5, m=1.0, I=0.33333, g=9.8とし,所望の平衡状態は (xd, ud)=(0, 0)とする. 興味のある状態領域 Ω={x￨-3≦x1≦3, -5≦x2≦5} とし,Δ は原点を含む0.2間隔の1581個の格子点とした. (3.5)のパラメータはQ1=E, Q2=0.1E, R1=1, R2= 0.1,ニューラルネットの中間層ニューロンの数は8,結合重みの初期値W0, V0は0∼1の乱数で(4.2)式のように与えてニューラルネットの学習を行った. 29回のイテレーション後のW29, V29はつぎのようになった.

-6 .075385

2.713280

-3.007068

-2 .633142

0.996453

-1.815892

-0 .066530

-0.532184

2.198456

W-

2.459074

-0.986062

V_

-1.279865

-1 .130929

0.364276

0.961835

2.773482

0.902580

-3.626733

0.317627

0.273349

-2.491498

5.616085

0.648647

-4.798167

イテレーションに対する最大値関数J(W, V)の変化を Fig. 4に示す.Fig. 4より学習後のW, VによりJ(W, V)=0 (最適点)が満たされている.したがって学習後のW, Vを用いた状態フィードバック型ニューラル制御器

u(t) = Vu (Wx(t))

は(4.3)を原点に漸近収束させることができる.初期点 x(0)=(2, 4)Tにおける閉ループ系の応答とリアプノフ関数V(x(t))の時間変化をFig. 5に示す.また Ω 内のいろいろな初期点における閉ループ系の応答を状態平面を用いて Fig. 6に示す. 5. おわりに閉ループ系を漸近安定化するには,定理1における関数 V(x),ρ(x)を見つければよいが,一般的には難しい. 本論文では逆に,はじめから関数V(x),ρ(x)を与え定理1 を満たすように,状態フィードバック制御則 α(x)をニューラルネットで近似実現する手法を提案した.その際ニューラルネットの結合重み行列W, VはMin-Max問題をMifflin のアルゴリズムを応用して解くことにより求めた.シミュレーション結果は本論文で提案したアプローチの有効性を示した. 本論文におけるV(x),ρ(x)は目標値からの2乗誤差関数としたが,それ以外の設計も可能で,命題2に相当する勾配関数を計算しなおせば,同様のアプローチでフィードバック制御則を近似実現することができる.関数V(x)と関数 ρ(x) の関係は逆最適制御問題の観点からも論じられており3),4), 今後,それらの本論文への応用を考えていきたい. 謝辞:シミュレーション用プログラムの作成にご協力いただいた慶應義塾大学大学院の新木正一氏に感謝の意を表します.

(6)

494 T. SICE Vol.35 No.4 April 1999

Fig. 1: Rayleigh Model:

Change of Max function J(Wk, Vk)

Fig. 2a: Rayleigh Model:

State and control for x(0)=(9,

9)T

Fig. 2b: Rayleigh Model: Time change of Lyapunov function

Fig. 3: Rayleigh Model:

Trajectories for various initial state x(0)

Fig. 4: Single Link Manipulater Model:

Change of Max function J(Wk, Vk)

Fig. 5a: Single Link Manipulater Model:

State and control for x(0)=(2, 4)T

Fig. 5b: Single Link Manipulater Model: Time change of Lyapunov function

Fig. 6: Single Link Manipulater Model:

Trajectories for various initial state x(0)

(7)

計測自動制御学会論文集第35巻第4号 1999年4月 495

参考

文

献

1) Z. Artstein: Stalilization with Relaxed Controls, Nonlinear

Analysis, Vol.TMA-7, 1163/1173 (1983)

2) R.W. Brochett: Asymptotic Stability and Feedback

Sta-bilization, in Differential Geometric Control Theory

(R.W. Brochett etal. eds.), Birkhauser, 181/191 (1983)

3) R.A. Freeman and J.A. Primbs: Control Lyapunov

Func-tions -New Ideas From an Old Source-, Proc. of the 35th

Conference on Decision and Control, 3926/3931, Kobe

(1996)

4) R.A. Freeman and P.V. Kokotovic, Robust Nonlinear

Con-trol Design. Boston: Birkhauser, 1996

5) M.M. Gupta and N.K. Sinha(eds.): Intelligent Control

Sys-tems, Chap.12 (M. Saerens, J.M. Renders and N. Bersini:

Neuro Control Based on the Backpropagation Algorithm),

IEEE press (1996)

6) K. Kawamura, T. Ikai and H. Kosako: Backpropagation

Learning of Feedback Neural Networks-Consideration

from a Viewpoint of Dynamical System Optimization,

Trans. IEICE, D-II, Vol.J73-D-II,

No.9 (1990)

7) M. Kristic, I. KanellaKopoulos and P. Kokotovic: Nonlinear

and Adaptive Control Design, J. Wiley & Sons (1995)

8) J. LaSalle and S. Lefschetz: Stability by Liapunov's Direct

Method with Applications. Academic Press (1961)

9) R. Mifflin: An Algorithm for Constrained Optimization

with Semismooth Functions, Mathematics of Operations

Research, Vol.2, 191/207 (1977)

10) K.S. Narendra and K. Parthasarathy:

Identification and

Control of Dynamical Systems Using Neural Networks,

IEEE Trans. Neural Networks, Vol.1, No.1 (1990)

11) D. Psaltis, A. Sideris, A. Yamamura: A Multilayered

Neu-ral Netwark Controller, IEEE Control System Magazine,

Vol.18, No.2 (1988)

12) D.E. Rumelhart, G.E. Hinton and R.J. Williams: Learning

Representation by Back-propagating Errors, NATURE,

Vol.323, No.9, 535/536 (1986)

13) K. Shimizu and M. Ohtani: Optimal Control for

Nolin-ear Systems by a Neural Controller of the State

Feed-back Type, IEEE 35th Conf. on Decision & Control,

Vol.3, 3300/3303 (1996)

14) 志水,相吉:数理計画法,10章,昭晃堂 (1984)

15) K. Shimizu, Y. Ishizuka and J.F. Bard: Nondifferentiable

and Two-Level Mathematical Programming, Kluwer

Aca-demic Publishers (1997)

16) J.J.E. Slotine and W. Li: Applied Nonlinear Control,

Pren-tice Hall (1991)

17) E.D. Sontag: Mathematical Control Theory, Deterministic

Finite Dimensional Systems, Springer-Verlag (1990)

18) E.D. Sontag and H.J. Sussmann: Remarks on Continuous

Feedback, Proc. IEEE Conf. Decision and Control, 916/921

(1980)

19) M. Suzuki and K. Shimizu: Analysis of Distributed Systems

by Array Algebra, Int. J. of Systems Science, Vol.21 No.1,

129/155 (1990)

20) P. Wolfe: Finding the Nearest Point in a Polytope,

Math-ematical Programming, 11, 128/149 (1976)

[著

者

紹

介]

志

水

清

孝(正

会員)

1962年慶應義塾大学理工学部計測工学科卒業. 1964年同大学大学院修士課程修了.1967年ケース工科大学博士課程修了.Ph.D.現在に至る.慶應義塾大学理工学部教授.専門はシステム制御, 数理計画法,最適制御,ニューラルネットワーク

など,IEEE, SICE, IEICEなどの会員.

伊

藤和幸

1997年慶應義塾大学理工学部計測工学科卒業. 99年同大学大学院理工学研究科修士課程計測工学専攻修了.同年横河電機(株)入社.大学院在籍中は非線形制御系の設計,ニューラルネットワークの研究に従事.

Design of Neural Stabilizing Controller for Nonlinear Systems via Lyapunov's Direct Method Kiyotaka SHIMIZU* and Kazuyuki ITO This paper is concerned

計 測 自 動 制 御 学 会 論 文 集

Vol.35, No.4, 489/495 (1999)

リア プ ノ フ直 接 法 に よ る非 線 形 シ ステ ム の

ニ ュ ー ラル 安 定 化 制 御 器 の 設 計

志

水

清

孝 ＊・伊

藤

和

幸

Design

of Neural

Stabilizing

Controller

for Nonlinear

Systems

via Lyapunov's

Direct

Method

Kiyotaka SHIMIZU* and Kazuyuki ITO

E(t) = f (x(t), u(t)),

x(to) = xo

(2.1)

0 = f (xs, us)

(2.2)

u(t) = a(x(t)),

ud = a(xd)

(2.3)

x(t) = f (x(t), a(x(t)))

(2.4)

* Faculty

of Science

and Technology

, Keio University,

Yokohama

(Received March 26, 1998)

(Revised October 5, 1998)

x(t) = f (x(t), a(x(t)))

dV (x) _ aV (x)

dt

ax f (x, a(x)) < -p(x(t))

dx E S~

V (x) = 1(x - xd)T Ql (x - xd)

+ l (u - ud )T Rl (u - ud)

(2.5)

V(x)=(x

1-

xd)T

Q1(x - xd)

+1(a(x) - Ud)TR1(a(x) - ud)

(2.6)

p(x) = (x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud)

(2.7)

dV (x)

_ (x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRI aa(x) f (x, a(x))

c -(x - xd)T Q2(x - xd)

-(a(x) - ud)T R2(a(x) - Ud)

(2.8)

F(x)

(x - xd)T Qlf (x, a(x))

+(a(x) - ud)TRi aa(x) f (x, a(x))

+(x - xd)T Q2(x - xd)

+(a(x) - ud)T R2(a(x) - ud) < 0

(2.9)

z(t) = W(x(t) - xd)

(3.1)

UN(t) = Vo(z(t)) +ud

(3.2)

a (z) = [o-1(z1),

a2 (z2 ), ... ,aq (zq

exp(zi)

(3

.

UN (t) = a(x(t); W, V)

(3.4)

F(x;W,V)

計測自動制御学会論文集

リアプノフ直接法による非線形システムの

ニューラル安定化制御器の設計

孝＊・伊

_(2.8)

われわれはxd近

傍の興味のある領域 Ω 内の任意のxに

対して

OWF(x; W, V)EavJ(W, V), x E P(W,V)(3.13)

VwF(xk;Wk,Vk),VVF(xk;Wk,Vk)

_{= VVo z W}

_(3.16)