• 検索結果がありません。

・ファジィ技術の最適制御問題への応用

N/A
N/A
Protected

Academic year: 2021

シェア "・ファジィ技術の最適制御問題への応用"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

NDC 548.3

二ニュv一・…t口 ・ファジィ技術の最適制御問題への応用

岩城 嵩*

樋口史晃***

石井秀知**

小寺洋一****

An Application of Neuro−Fuzzy Technology    to the Optimum Control Problems

      *

Takashi IWAKI

Fumiaki HIGUCHI*** Hidetomo ISHII**

Yoichi KODERA****

The optimutn contrcl problem i・s one of the most interesting problems to apply AI tecknology, because of its theoretical diffieult.y and its human related characteristics. The minimum time mass movement,

prob!em is one of the classical optimum control problems and many studies have been carried out . In this paper as the first step to c・omplex problems , applicability of neuro−fuzzy technology for the simple problems with and without friction force is clarified in comparison with theoretically knomrn solutions.

As a conclusion, norma}izatioR of state variables and neural net−vgork capabilities in tuning of membership−functions  of fuzzy rules and in reeresent.at.ion of normalized functions are found to play very important roles in solving the・se preblems.

はじめに

 ファジK,ニューロの2つの技術は本来まったく別の領 域にあるものだが、最近ではこの2っの技術のそれぞれの 特徴を活かした融合も見られるようになっている。

 本報告では最近注目されている、この融合技術を制御分 野に適用した学習制御技術について述べる。本研究で扱う 学習制御技術について議論する場合、図1に示すAlbUs の知的フレVム1)を用いるのが適している。すなわち、

学習について扱うレベルをご記号レベル、および、信号レ ベルに分類する。

 ここで、信号レベルの学習とは外部環境に近い定量的な 信号や情報を扱うレベルであり数学的操作が容易に適用で きる。.また、記号レベルの学習とは外部環境から離れてよ

**

***

****

情報工学科

情報工学科平成6年度卒業 現在 九州工業大学 情報工学科平成6年度卒業 現在 長岡技術科学大学 三井造船(株) 玉野研究所

平成7年8月24日受理

り抽象化した高度な人間の言語処理の知識を扱うレベルで あり、数学的な操作を直接適用することは難しい。

 ニューロ技術は、外部環境からより上位レベルに向かう 知識の自己組織化能力を実現しようとするものであり、下 位レベルからのBott。m Up方向の知識の形成をめざしたも のである。

 一方ファジィ技術は、記号レベルの知識を下位方向の実 際の信号レベルの知識にBreak downし、具体的に制御・

認識等を通して外部環境に働きかけようとするものであり Top Down的な流れの実現を目指しているものである。

 ファジィ技術は記号レベルの知識を信号レベルで実際に 応用できるようにするTop Downの知識の流れであるが、

ファジィ制御自体には、ニューロが有するようなBottom Upの学習機能は有していないため、ファジ4制.御において 対象の制御系が目標の仕様どおりに動作するようにするた めには、IF THEN規則や、メンバーシップ関数の形などを 多くの試行錯誤で調整.する必要がある(チューニングとい

う)。さらに、制御機器の入出カデータが多いときなどに は、このチューニングは膨大な費用と時間を必要とする。

そこで、ニューm』の学習.機能がうまく付加できれば、

(2)

津山高専紀要第36号 (1995)

Bσttom Upの機能が付加でき、メンバーシップ関数の自動 チ=k一一ニング等にその効果を発揮することができるdこの ような一方の技術のみでは表現し得ない領域へ互いの長所 をうまく利用する手段として融合技術が考えられる。

 本報告では、多岐にわたる最適制御の一例である最短時 間質点移動問題について、理論解が求められる純慣性系、

および摩擦を考慮した慣性系に対し、ニューロ・ファジィ 融合技術を応用し、その適用における問題点の抽出と解決 策を提案し、理論解との比較においてその有効性を確認す

ることを目的とする。

 本研究の延長線上にある具体的な応用対象としては、車 両の運転制御,クレーンによる運搬制御,船舶の推進制御 などが考えられる。これらの問題においては、外乱、摩擦 力の非線形性、加速度の乗り心地からの制約などが考えら れる。これらの諸因子を考慮した実際的な問題では、もは や理論的考察からは解が得られない領域となり、本研究で 述べるニューロ・ファジィ融合技術が有効な季段となろう。

 本研究はこれらの問題への発展の第一段階として行った ものである。

記号レベル信号レベル

価値判断 機能

  現状野: ごミ騨

       習。・1d陪。d・1、(行嘉面』

信号処理      データベース

囚m

一〇=〉一一一一一一L一一

  F

出発点 位置:a 速度:b

終端点 位置:0 速度:0

図1・1 1次モデル問題の概要  ニュートンの運動方程式は、変位をyとすると、

     F(t) = m>・の   (1・1)

が得られ、制御力を単位質量あたりのカを、

      聖=,t(t)

      m

とすると、u(t)は次式の制約条件を満足するものとする。

     lza(t)IE・!utttax(t) :=:1 〈1 ・  2>

 1次モデルの理論解は最大原理2)より求められ、変位,

速度それぞれの状態変数を、X1, X2とし、制御力の最 適な切替時間をt*,理論解である最短所要時間をtfと すると、初期状態くa,b)によって以下のように、制御 力の切替回数が最大1回,制御力の最適値が制限の最大値 か最小値のどちらかしかとらないバンダバンダ制御となる。

 以下に理論解を示し、図1・2と最適制御軌跡を示す。

期中の太線は制御力uの切替線である。

墾曇∴

    て璽

図1 Albusの知的フレーーム

1 純慣性系の最短二三質点移動悶題{1次モデル)

1・1 問題の定義と理論的考慮

u=一1 (a,b) x2

u=一1

 ノ I

\愚   \     \

u;+1

〆︐・■ 

・=一1嵐

\ \

P

〜︑ o π1

  斗   髄

@  、@  、

@   、 A.+1寒・、

、噛

A

獣・・+1 グ・・一1

、「@、

−、 .

」 、− ㌔

@  ㌔『門』一・一一・● u窯+圭

(a㍉b

 図1・1のように、質量mの物体が点Aから初速度bで aだけ離れた点Bまで移動してそこで停止するとき、この 移動に要する経過時間を最短にするには、物体に加える力 F(t)をどのように選んだらよいか。ただし、物体の大き さによる空気抵抗や摩擦などを一切無視した純慣性系で考 えるものとする。また、制御力の絶対値は1以内の値しか とらないものとし、物体は質点として扱う似下、1次モ デルと称する)。

図1・2 1次モデルの最短時問制御

(a)初期状態において、

         a>一(1/2)blbi を満たすならば、初めu;一1とし、

        X, = 一(1/2)X, i X, 1 カミ成り立二つ時…亥酵、

        t  == b+ Va + 〈1/2)b2

において、u=十1に切換えると最短時間で原点に逮し、

その所要時間は、

(3)

ニューロ・ファジィ技術の最適制御問題への応用  岩城・石井・樋口・小寺

となる。

tf =b+ V4a+2bi

(b)初期状態において、

      a 〈 一(1/2)blbl

を満たすならば、初めu=+1とし、

        X, = 一(1/2)X, IX,1 が成り立つ時刻、

        f=一ゐ+  一a+(1/2)み2

においてu=一1に切換えると最短所要時間、

        tf=一ろ・+一4a+2ろ2 で原点に達する。

(C>初期状態において、

      a=一(1/2)う渉1

ならば、b>0のときはu=一1, b<0のときはu==+

1とすると制御力の切替はなく、最短所要時間、

      tf =ibl で原点に達する。

1●2 ファジィ推論による制御

 前項で定義した1次モデルの制御力u(のをファジィ推 論より求め、シミュレー一一・ションする。ここで推論ルールを 構成するメンバーシップ関数を種々変吏しながら適用性を 検討する。

1・2・1 制御対象のモデリング

 1次モデルの制御対象を、以下のようにモデル化する。

 変数y(t)・y (t),y (t)をそれぞれX1(t),

X2(t), X3(t)と置き換えると(1・1)式は次式と

なる。

     −1ア(り=ni■3(ピ)    (1・3)

 さらに、初期条件t=0で、

      Xi(O) = a       X2(O) == b

を考慮して解くと、△t時間後の変位と速度はそれぞれ、

    Xi(t + At ) = 1 uAt2 + X2(t)At + Xi(t)

      2

       .¥2(i+・Ai)=u△t+x2(り で与えられる。

 これより、制御対象モデルは、図1・3のようになる。

入力

変位X,(t)

速度X2(t}

制御力u(t)

︶  ︸  ︶  制御対象

e(t)=皿鵡(t)

@lu(t)1≦1

次の

氓フ 出力

次の変位 X,(t+ rt)

次の逮度 Xz(t+6t)

図1・3 1次モデルの制御対象モデル

1・2・2 ファジィ部のモデリング

 ファジィ部の推論法として、簡略化ファジィ推論3)を 用いる。この推論法は、後件部(結論部)をファジィ集合で はなく定数で表現し、また、前件部(条件部)の適合度(グ レード)をその論理積で、推論値を前件部適合度と後件部 定数との心寄で求めるものである。

 例えば、2入力(u,v)1出力(y)の場合には次のよ

うに表される。

 Ri : IF u is Ai(u) and v. is Bi(v) theR y = Ci

 ここで、Riはi番目の制御ルール、 Ai, Biはファジィ 変数でメンバーシップ関数によって定義される。また、Ci は簡略化ファジィ推論の定義より定数である。

 最終の推論結果は、

    y=Zwi 一Ci /2wi (1 ・ 4)

       ,vi = min ( Ai(u) , Bi (v) )

で与えられる。ここで、晒はルールRiの前件部適合度であ

る。

 チューニングのための可変パラメータは、前件部Ai(u),

Bi(v)のメンバーシップ関数(以下、 MSFと称する〉の 位置:や形状を表すパラメータ群と後件部の定数Ciである。

 また、ここでのファジィ部では、ある時刻の状態にお ける最適な制御力を出力とする。

 制御対象の変位及び速度と、制御力関係をIF〜THEN...

形式のルールとして次のように記述する。

     IF Xi=.4 and X2=B THEN f:=C

 ここで、前件部のAとBはそれぞれ、NB(Negative

Big). N S (Negative Small), Z R (ZeRo), P S

(Positive Sma11), PB(Positive Big)の5つを考え、

従って25個のルールを用いることにする。

 制御対象のモデリングの結果から、変位,速度の状態 の基準となる範囲として正の定数αを導入し、かっ挙勧 に関する工学的直感から、常識的にファジィ・ルー一一ルを 考え、図1・4のようなファジィ・ルールを作成する。

(4)

津山高専紀要第36号 (1995)

変 位 痘

N:B NS ZR PS PB PB ZR L NB NB NB NB PS PB ZR NS NS NB

速度湿

ZR PB PS ZR NS NB NS PB PS PS ZR NB NB PB PB PB PB ZR

図1・4 常識ファジィ・ルール

 次に、前件部の各MSFを、図1・5に示す。このM SFをチューニングするために、問題が原点について点 対称であることを考慮し、前件部MSFの可変パラメー

タとして、図1・6のようなNS部, PS部の底辺を 変化させるパラメータ(1〈>0)を考える。このように、

dが小さくなると外側のMSF(NB部, PS部〉が、

内側に移動するようにする。

NB NS ZR Ps PB

hX/×

α 2

 また、これをチューニングするために、前偉部の場合 と同様に問題の制御が原点について点対称であることを 考慮し、後件部の可変パラメータとして、図1・8に示 すNS部とPS部の大きさを与える定数を変化させるパ ラメータf〈lfl<1)を考えることにする。

冊鴨怨酪

f

一1.0 o.o 1.0

1.O

f o.o

−f

−1.O

図1・8 後件部定数の可変パラメータ 1。2・3 ファジィ・シミュレーション

   .9雪

一ec    2 o ct

図1・5,前件部MSFの初期状態

NB NS ZR ps PB

xx

一一Zc 一xi li o l21     目    }H

[a

a

図1・6 前件部の可変パラメータ

 後件部についても同檬に、NB,NS, ZR, PS,

PBの5っを考え、図1・7のように定数で表現する。

冊鴨盟略冊 1.O

O.5 0.o

−O.5

・一P.g

rl.O o.o 1.0

図1・7 後件部定数の初期状態

 推論のためのファジィールールを、図1・4に示す常 識ファジ■・ルール、および、その故良常識ルールに任 意に設定してファジィ・シミュレーションを行い、シス テム全体の出力である到達時間が理論解に近づくように

直感的に可変パラメータを手動チPt・一一、ニングする。

 ここでは、時間増分dtごとに変化する制御対象の状 態を追って、シミュレーションを行う。ここで、制御条 件として許容誤差epsを考え、変位と速度のそれぞれ に対して位相面上の原点からの微少の許容誤差を与え、

ともにこの範囲内の値になると原点に達したと判断し、

制御を終了する。このときの時間増分の総和である経過 時間を到達時間Tとして出力する。また、T≦10の範 囲内に原点に到達し得ない場合は、Tは測定不能とする。

 チューニングのためのパラメータd,fを任意に与え、

変化させる全ての組み合わせに対してシミュレーションを 行う。図1・9に、シミュレーション・モデルを示す。

 シミュレーション.のパラメータとして以下の値を採用す

る。

  時間増分二 d t=O 005 秒   許容誤差:eps=・・O.・01   基確量 :α=2

  初期状態:(a,b)= (1,1)

  d:{LOO,0.75,0.50,0. 25,0.Ql}の5種類   f:{G.50,0.25,0.◎O.O.75,1.OO}の5種類    ファジィ・ルL一一・ル:図1・4に示す常識ルール、お        よび、その改良常識ルール

1・2・4 シミzレーション結果

 図1・4の常識ルールの場合の、 (f,d)=(LOO,

O.25)および(Q.5,1.OO)の場合のシミュレーション結

果の位相面軌跡を図1・10(a)および(b)に示す。

(5)

ニューロ・ファジィ技術の最適制御問題への応用  岩城・石井・樋口・小寺

制御力uの遅延効果のため、得られた結果は無限軌道や許 容時間内に原点に回しない軌道となり、理論解の最短所要 時間3.45に近い時間で原点に到遠する結果は得られな

かった。

 また、これらを防止するために数多く作成した改良常識 ルールの場合に得られた執跡の一例として、(f,d>=

(1,1)のときのシミュレーション結果の位相面軌跡を図 1・10(c)に示す。許容時間内に何とか原点に達した ものの、理論解の最短所要時間の3倍近く(T=9.12)の 時間を要し、望ましい結果は得られなかった。

制御条件 幽間増分dt 許容誤差eps

入力 期変位a 期速度b

一fメ︐ラd

4>

ファジィ部

めぬ変速

。・

ファジィ推論      

1 2κκ位度変速

圏⇒

制御対象

F=m・Xs

Iulsl o 次の状態変lXl出力

速度x2

dt時間経遇

データ収集 到達時間T

図1・9 1次モデルのシミュレーション・モデル

      、 s :ユ目.図25       噛 ム=L〔う

aF1.穆       +1ド:L3臼

d:色25

一2 1 +2  変位

一1

         、

s = 9.119      胚y疋

a=1.鰹

b=L@

      +1『d.四

d:1.39

一2    −1 +1 辛2    璽

一1

(a) 制御の軌跡(1)

T =ユ題.四5 a =1.臼 b :1』

f :図.5 +1

d !1.四

一2 一1 ÷1 +2 変位

一1

  (c) 制御の軌跡(3)

図1・10 シミュレーション結果

1・3 入力変数を正規化したファジィ推論による制御

 前項で述べた常識ルール等によるファジィ制御法では最 短時間制御は不可能であることが分かったので、ここでは 理論解の考察から提案された入力変数の正規化手法を提案 し、さらに、ファジィ部とシミュレーション・モデルの再 構成,環境パラメL一一一タの再決定を行い、再び、ファジィ・

シミュレーションを行う。

(b> 制御の軌跡(2>

1・3・1 入力変数の正規化

 位相面上で出発点(a,b)から、終端点(O,0)に 制御対象が移動する場合、図1・2の実線が理論解である 最適な制御の軌跡である。理論解では、図1・2の原点を

(6)

津山高専紀要第36号 (1995)

通過する曲線に関して制御力の正負が異なる。すなわち、

曲線の上か下かによって加える制御力の正負を変化させる ようなファジィ・ルールが、理論解から言える最適とされ

る7fr・・一ルである。

 よって、ある時問の状態における変位と速度の「切替線 からの離れ具合」を入力とし、加えるべき制御力uの大き さ、正負を決定すればよいと考えられる。

 この「切替線からの離れ具合」を、位相面の各象限ごと に、次のような正規化で表現する。

 位相面において、変位:と速度の関係を各象限ごとにそれ ぞれ、

      Xi = f(X2)

      X2 = f i (Xi)

のように表すと.変位,速度の「切替線からの離れ具合」

は次のように表される。

      =. Xt

      .ikri=一;一1.:ii一: .i. (1・5)

        f(X2)

      =r. −2       ×2=.

       (1 ・ 6)

        f−i(Xi)

 ただし、Xiは正規化された変位、 X2ほ正規化された

速度を表す。

 (1・5), 〈1。6)式は、ここで扱っている1次モ デルでは、どの象限でも一意的に次式のように表される。

      =r. X!

      −1=

         lx22   〈1・7)

         2       =. X2

      −Xr2il ixt  (1・8)

 この正規化を位相面上で考察すると正規化前後のそれは、

それぞれ図1・11,図1・12で示される。

2

.___...二.._.

!=

「冒丁−r.『−『『一一『『−「

@     τ

@       …

@      藺   i

﹁⁝「一一 一        ..一幽P・」「「. 一.一..■

@      ;

黶@      i

}・一・..一..._.       B    「 , ,     .曹、甲 A

@_・ジ==」一→・

Ai沁1 ⁝5i /〆そ一ザ

⁝⁝ /         i      p        l     迭   1       脚

⁝冒

       援      ・5邑−塵_.9...7一一」一一F,,.曽圃・.圃..幽r.,■圃r.9−ρ一F幽.7.駒膠●層.曾}

/!!

_…_.,.,._…__…」       払

3

r… …−……』… ….「餉…….… ザ} ……一 一…一『 一  …一

    …

@   …    8

@   …

@   …   Bし、一一・Lμ《∈一一一一一

@   r ……『『

  診   μ

m〆iニン/   ・i 昏i団三3⁝ 「一

      一    i      A

̲ご、      、 一…..__一    く一      一一」・L..■      …

3⁝ B   17      }

︸与

直       1−       1 曹       .,_._一.= LP 曽 ,       ._一一一P..ρr.r匿.π..∠

26・・一一一、c1互i琴⁝  9  ・ 一 ︐   ︐ 一

…  曲線    }

堰@ OA

hr

1 豆『『 一「『

香@  一i ︳︳﹃.....︳︳﹃.﹃.ノ

 」.一「「匿一匿「一.一「一一雫一一一・「,「−開,

ヂ:〜;こヨ o レ……− …@          !ま .1ぞ一一一…r『

曲線 5B・

         五

▽i<濫

登・ 艶ac

図1・12 正規化後の区分

 図1・11の原点を通る曲線(OA, OBなど)は、図 1・12中の矢印で示された各点に、また各領域くA,B など)は曲線に変換されており、どのような軌跡であって も図1・12の曲線上に変換されている。また、制御力u の正負については、図1・11では太線で描かれた切替線 より上か下かによって分けられ、正規化後の位相面図1・

13においては、破線で示す斜線で制御力uの正負が二分

される。

 すなわち、非直線的な物理状態の分割を直線的な分割と して扱えるようになり、図1・14に示すファジィ・ルー ルが、図1・13に示した正規化された入力変数と制御力 との関係にうまく対応して作成できる。また、これより 1・2で導入した入力変数の基準量αが省略可能となる。

\\\   ・

@\・こ\ 3

@\こ\、  こ・監「旦  怠\i:一   主・\\1

ム「……一 ムil.ぐ竺二

ホ1

\\.

  一 『1  0

P盲『 一・ 一;ξ.

  天\ 嚢i

=+1、

 1

^ 弓・ざτ⁝:︑li靴︐

i,;…

V・二∴,.F構祠

誉、 ・.\・

図1・11 正規化前の区分

図1・13 正規化と制御力の関係

(7)

ニューロ・ファジィ技術の最適制御問題への応用  岩城・石井・樋口・ j、寺

変 位 品

NB NS ZR PS PB PB ZR NS NB NB NB PS PS zR NS NB NB

速度淫2

ZR PB PS ZR NS NB NS PB PB PS ZR NS

・NB PB PB PB PS 2:R

図1・14 正.規化によるファジィ・ルール

1−3−2

正窺化を用いたファジィ・シミュレーショ

 前節のシミュレーションと同様にd,f.を変化させ、正 規化を用いたファジィ・シミュレーションを行うため、シ

ミュレー・一ション・モデルを再構成する。

 紙面の都合上、ここでは省略するが、図1・9のシミュ レーション・モデルでのファジィ推論め前処理として正規 化が新たに加わったものとなる。

 シミュレーションのパラメータとして以下の値を採用す

る。

時間増分=dt=0,0G5秒 許容誤差;eps=・O.Ql

初期状態  (A):(a,b)=(1,1)

     (B) : 〈a, b) 一: 〈LO.5,1)

     (C) : (a, b> = 〈O. g.,一L5>

d.:{1.OO,0.75,0.50,0.25,0.Ol}の5種類 f:{O.50.O.25,0.00,0.75.1.00}の5種類

ファジィ・ルール:図1・14 1・3・3 シミュレーシaン結果

御を実現できることが検証された。得られた全ての軌跡 を見ると、最適なパラメータは、d=0,frユとなり このときの最適な前件部MSF,後件部定数は、それぞ れ図1・18,図1・19のようになる。

 このように、正規化を導入したファ.ジィ・シミュレー ションでは、理論解であるバンダバンダ制御に一致する軌 跡を描き、最適な制御が可能であることが分かった。従っ て本節で扱ったような、直接にファジィ・ルールを考える ことは難しい問題に対しても、正規化を行えば、非常に少 ないファジィ・ルールで理論解に近い門門を実現できる。

T=3.449 A

,L

a=1.臼 L「A.A㌔ 、

b=L臼

?<?D四 пF9.臼1

、、

\、刊

@\@、

一2 一1 +1 +2 変存

一1

、覧L d■等亀

eb−

2重−巳臼日L艮2 一 一 皿 ﹇

儲)c  りeT Difi

2ーユ0臼2t歪2     一 一 一 ﹇ 2.

L

1︐

S.5

e,

吻、

nlt

(a) 最適な軌跡

言珪罐ll畿

x

x.N

國』A=..

x x x

一二一:一:一

    勉

y一

ノノ

2ツγ.

 ff

 初期状態(A)のシミュレーション結果として(d,

f>=:(O.001,1)に対する位相面上の軌跡と変位,速 度,制御力の時間変化を、それぞれ図1・15(a>,

(b)に示す。注目の細線は切替線を示し、太線は得られ た軌跡を示す。 (d,f)=(O.◎el,1)を採用するこ

とにより、到達時間は理論解tf=3.45と一致することが 分かる。

 初期状態(B)と(C)の場合についても同様な結果が 得られ、最適なパラメータ(d, f)=(0.OOI,1>に 対する位相面上の軌跡と変位,速度,制御力の時間変化を、

それぞれ図1・16 (a), (b)と図1・17(a),

(b)に示す。図1・16の場合も図1・17の場合も、

それぞれの理論解tf憲Leo, tf漏3.08とよく一致して

いる。 一t

 上述の幾度かの試行錯誤によって、理論解と同一の制

−う﹂一  

1.区 2.臼

(b) 時間変化の様子

3.e T;ne

n.e

図1・15 初期状態(A)でのシミュレーション結果

τ a :臼.995

F一a5

A、 ㌧. ¶

@、  う  、   」

@  玉、

速度.

b =L9 、㍉、

f :L四 +!

d :②.91

一2 一1

ヰ重 +2

一1

\ し\.   ︑

、、胃 髄、㍉

@、r、」、F

(a) 最適な軌跡

(8)

・津山高専紀要第36号 (1995)

触  Lbl

2.日

t.5 盤.9

e.s

e.臼

咽.5

..煤Dg

−1.5

−2.e 2.e

t.5

塾.

e.s

臼.日

一日.5

一!.g

一霊.5

−2.e

8 :一曾.5開  d: 置.四1

Dig b=重.的O  f; Lo2巳

,の

餌ヨ

.7 一      }      一 鳴1

恥。

.5

層噌 﨟@ 醇一  旨 .」r r

,2 @㌧   h■●「

闇LA■、

@  π「「鴇_...

@      r  . . ■  「 .

,2  「..e

p p

   」 F P

」 呼

「「

.5

D7

・9.9 T;冊

3.2 臼.5 臼.7 1.臼

PB

(ps)

ZR

〈NS)[

NB二

f=互

日も咽紹吃

f=1

LO

l.e o.o

−1,e

−1.g

一1. 0 o. e LO

図1・1 9 最適な後件部定数

図1・16

 (b) 時間変化の様子

初期状態・(B>でのシミュレーション結果 1・4 ニューーロ。ファジィ融合技術による制御

T=3.併9

=≠d.5

PL ー層、■幽

@、 、、

b=一1.5

、、、

f:1.四 +1

d=②.創 、

一2 一1 +1 +2 変位

\、 、■

、うb鱒、

駈b A『

ftoc Uel Dig2 一 ユ 日 日 咽 4 ヨ £

2。

│L臼田紹弓或辺

1 0

L匠︒︐匠3.竜斌竜

〈a) 最適な軌跡

・      /

        /、      !  馬      〆  、、      〆

コ剛一}t一一」ttt,一一tt 7「一}

 、        /   電     /   ロ   ノ

  ♪(  /   ㌦.

 ノ     ノ         騨●・一一・一曽㌔,    ノ

忌:9i臨1:望躍

xN x

圏=二冒二 G

ha一一 ラ醇

Tlne

4.e

 前節までに示したように、正規化という手法を用いるこ とで、ファジィ系のみでも十分な制御を実現できた。しか し、制御対象がより複雑になり、扱うパラメータが多くな ると、一般にチューニング作業は非常に困難となる。そこ で、ニューラル・ネットワークの学習性を利用した自動 チューニング手法が考えられる。本節では、この自動 チューニング手法の有効性を検証する。

 本研究では、ニューラル・ネットワークの形態の中でも、

階層結合型のネットワークであるバックプロパゲーショ ン・モデル(誤差逆伝搬学習モデル)を用いる。階層構造 は問題を簡単にするため、図1・20に示すように入力層、

中間層、出力層の3階層構造とする。ここで、学習のため の入力パラメータは、前述のdとfとし、それぞれのパラ メータにおける到逮時間Tをニューラル・ネットワークの 出力の教師信号とする。従って、ニューラル・ネットワー クは2入力1出力の階層型のモデルとなる。また、中間層 の要素数はあまり複雑なモデルにならない程度に、ここで は10とする。なお、三ユー一・ ・シミュレL・一一タはADS製 ニューーロ・シミュレータ4)を使用した。

図1・17

t.e 2.e 3.D

 (b) 時間変化の様子

初期状態、(C)でのシミュレーション結果

NB (NS) ZR (PS) PB

d=0 d=0

入力層

1

中間層

一1 o

  :×

XXL 

××

出力層

図1・20 ニュー ラル・ネットワークのモデル

図1・18 最適な前件部MSF  本研究では、前述の3つの異なる初期状態(A),

(B), (C)についてデータを収集し、それぞれ学習を 行い、学習後のニューラル・ネットウークから最急降下法 によって到逮時間Tが最小となる最適パラメータd,fを

探索する5)。

(9)

ニューロ・ファジィ技術の最:適制御問題への応用  岩城・石井・樋口・小寺

 ファジィ・ニューロ融合型学習制御システムの構成図を 図1・21に示す。

最急降下法

:最適パラメータ: ::

ニユ・一[培β

.、⊆嚢

データ収集

ファジィ部 制御対象

図1・21

       プアソィ系 1次モデルの融合システム構成図

 図1・22(a>, (b>, (c)に初期状態(A),

(B>, (C>の場合の学習の結果を示す。どの初期状態 においても、

        d::1O f 1=1

に収束した。これはファジィ・シミュレーションにおいて 理論解を与えるパラメータであり、1次モデルを用いた

ファジィ・ニューロ融合シミュレーションでは、ニューラ ル・ネットワークの学習によるファジィ・ルールの自動 チューニングは有効であるといえる。

T f

M.5 1

T

 −

f

電.5 t d

(c) 初期状態(C)での補間と探索の様子  図1・22 各書記状態の補間と探索

 なお、探索において採用した最手降下法は、本来、極小 値(極大値)を探索しており、得られた結果が必ずしも最 小値(最大値)であるとは限らない。これを回避するため、

探索の初期値をいくつかとり、それらのうち、出力が最小

(最大〉となるもの、すなわち、到達時間丁が最小になる ものを最適なパラメータとした。

ca.5

d

2.摩擦を有する慣性系の最短時間質点移動制御開題

(2次モデル}

2。1 問題の定義と理論的考察

麟只 1

(a) 初期状態(A)での補間と探索の様子

 図2・1に示すように、質量mの物体が点Aから初速度 bでaだけ離れた点Bまで移動してそこで停止するとき、

この移動に要する経過時間を最短にするには、物体に加え る力F(t)をどのように選んだらよいか。ただし、移動平 面上に速度に比例する摩擦係数kの摩擦が存在する慣性系 で考えるものとする。また、制御力の絶対値は1以内の値 しかとらないものとし、物体は質点として考える(以下、

2次モデルと称する)。

T

t

f

尉.5

m   摩擦k

O [:Z >fv v vnwwv−v.vvNf一. e一一

 F

出発点 位置:a 速度=b

終端点 位置:0 速度=0

d

6,5 1

図2・1 2次モデル問題の概要

(》) 初期状態(B)での補間と探索の様子

(10)

津山高専紀要第36号 (1995)

 与えられた2次モデルの解を数学的に求めるのは多少困 難なので、ここでは篤単に次のような方法で最短所要時間 tfを求める。すなわち》最適な制御の条件を1次モデル の理論解から推察した下記の特徴を考慮し、求める方針と

した。

  ①制御力uは、最大値あるいは、最小値をとる   ②切替回数が最高1回の制御である

 この特徴を利用して、切替時間を求めるためのシミュ レーション・プログラムを作成した。まず、各初期状態の 変位と速度の位相面上の位置において、最初に加えるべき 制御力(最大または最小)を決定し、次に切換時間を少し ずつトラバースしながらシミュレーションを行う。

 ここで、Runge−Kuttaの4次法6)を用いて切替線を表 示しておき、トラバースの間隔を狭めていくことで最適な 切替時間を確定し、そのときの到達時間を理論解(最短所 要時間1とする。 リ替線の一例を、c=0.8(後述)の 場合について、図2・2に示す。

速度

+i

一£ 一1

一1

     +1 +2 裟イ㍉

図2・2 切替線(摩擦係数==0・8)

2・2 制御対象のモデリング

 2次モデルの制御対象は、1次モデルのそれに摩擦項を 考慮し、以下のような運動方程式で表される。ここでkは 摩擦係数を表す。

      F(t) ・ myω+妙(の   (2・1)

制御力を単位質量あたりの力を、

      聖=麗ω        初

とすると、u(t)は(2・2)式の制約条件を満足するも

のとする。

}u(t)1≦Umax(り=1 (2・2)

また、単位質量あたりに作用する摩擦を考え、係数を、

とする。

 kc一一一

 m

 各変数y(t).y (tう, y (t)をそれぞれX1(亡).

X2(t), X3(t)と置き換えると、(2・1)式は、次 のように表される。

      u(り=X3(つ+c・X2(t)    (2・3)

 このように構成された制御対象を、Runge−Kuttaの4次 法を用いて、ある状態から微少時間△t後の変位と速度は、

次式によって与えられる。

       l

   X2(t+At)=X2(t)+1(ki+2・k2+2・k3+k4)

       6        1

   Xi(t+ At)= .2Y i(t) + 1 (li +2−h+ 2−13 + 14)

      6

ここで、ki, l i({灘1〜4)は、 Rtnge−Ktitt.aの4次 法で定めれられる変数である。これより、制御対象モデル は、図2・3のように表される。

入力

変位X,(t)

逮心切(t)

制御力u(t)

︶  ︶  ︶  制御対象

e(t)=【Rτ・+k■ 次の

睡(t)1≦1 氓フ

出力

次の変位Xt(t+ri t)

次の速度−2(t+ti t)

図2・3 2次モデルの制御対象モデル

2・3 入力変数の正規化

 1次モデルでの正規化同様、2次モデルにおいても、

「切替線からの離れ具合」を、位相面の各象限ごとに次の ような正規化で表現する。ある摩擦係数。における変位と 速度の関係を位相面の各象限ごとに、

     Xi=f(C, X2) 〈2・4>

     x2=f−1(・,x・)  (2・5)

のように表すと、正規化された変位・速度は次の式で与 えられる。

      =. Xl      Xl=

        f(c, −2) 〈2  6)

     = X2

     ×2 =:

        f一  (c, Xi) (2   7)

 ただし、Xlは正規化された変位、 X2は正規化された

速度を表す。

 2次モデルにおいてほ、Xl, X2は1次モデルのように 陽な形で表現できないので、2・1で述べた切替線を ニューラル・ネットワークを用いて表現する手法を採用す る。すなわち、ニューラル・ネットワークの入出力関係の 学習能力を利用し、切替線を表現する方法を考える。ここ で、表現すべき切替線の要素は、変位,速度,摩擦係数 であり、これらの入出力の関係を、図2・4に示すように、

ニューーラル・』 lットワークを利用して切替線を表現する。

(11)

ニューロ・ファジィ技術の最適制御問題への応用  岩城・石井・樋ロ・小寺

 切替線ほ各象限ごとに異なり、それぞれの象限について 図2・4のようなニューラル・ネットワークを学習させる 必要があるが、切替線が第1象限と第3象限、また第2象 限と第4象限において原点に対して対称であることを考慮 すれば、最低4っのニューラル・ネットワークを学習させ ればすべての象限についての切替線を表現できる。

1

cX

Neural network 1 f ikr 2

X!      X2

(口.3.0}

  く1.0.3.01

     !

@   /

@  !

@  〆  ,ノ

@!P〆 I

ノ!

9.巧 1.M c

2

cX 一一k2l一一三 図2・5

(b> 第1象現(c, .¥2 一一〉 X!)

ニューラル・ネットワークによる切替線の表現

く1)

図2・4 ニューラル・ネットワークによる切替線の表現

 まず、ニューラル・ネットワークを学習させるためのパ ターンファイルと教師信号ファイルを作成し、学習を行っ た。パターンの組み合わせば最終的には160組を用意し、

学習には6時間以上を要した。

 また、学習させた結果、出力値が0であるべき部分の誤 差が大きくなることから、原点近傍でのデータを多く取り、

教師信号ファイルの値に一定のオフセット値を加えて(底 上げして)学習させることによって、ある程度は誤差を解

消した。

 図2・5および、図2・6に、それぞれ第1象阻および 第2象限についての学習結果を示す。2・1で求めた切替 線と比較すると図2・5(a>はよく一致しているが、図 2・5(b)では、入力XIが大きくなると出力X2の誤 差が大きくなる。しかし、変位・速度の範囲に余裕を持っ

て学習させてあるため、誤差の大きな部分を参照すること はない。よって、多少の誤差を許容したニューラル・ネッ

トワークを用いた切替線により正規化を行う。

X.2

Cfi. 3. fi}

t

X

︐/

1

x2 >r. t

 {1.0. 3.0)

 一

Cn. 3.D}

雌ノ

e,s

ノ/ノ/

F

(a)第2象現(c,t)t P→X2)

図2・6

臼.5 1.U c

(b)第2象現(c,i¥2→X1)

9.巳

ニューラル・ネットワークによる切替線の表現

く2)

      (a} 第1象現(c,Xl 一〉 IYT2)

図2・5 ニューラル・ネットワークによる切替線の表現      (1>

2。4 ファジィ・ニューロ融合シミュレーション 2次モデルに使用するファジィ部,チューニングのため

(12)

津山高専紀要.第36号 (1995)

の可変パラメータd,fおよび、そのニューーラル∴ネット ワーーク部は、1次モデルの場合と同様とした。

 従って、シミュレーション・モデルは、1.次モデルのそ れに、摩擦係数。,正規化のための.二丘一一ラル・ネット

ワークが新たに加わり、図2・7のように構成される。

 シミュレL一・一ションのためのパラメータとして以下の値を 採用する。

時間増分:dt=O.OG5秒 許容誤差:eps=0.Ol

初期状態=(A):(a,b>=(一1.O,⑪)

      〈B) : 〈a, b) == 〈1, r)

      (c) : (a, b) :=: 〈 e.s, 一1.e>

.d二{LOO,0.75,0.50,0.25,0.Ol}の5種類 f:{0.50,0.25,0.00.O.75,1.OO}の5種類

ファジィ・ルール:図1・14

摩擦係数=c鴇O.1, c=O.5, ¢=・O.8

 また、.最適パラメータd, fの探索は図2・8に示す5 カ所を初期値として行い、それらの結果うちの最短時間を 与えるものを最適パラメータとした。

2・5 シミュレーション結果

 ここでは、2・4で示した2次モデルのシミュレーショ ンを行った結果を示し考察する。

 各パラメータでのファジィ。シミュレーションから得ら れたパターンファイル,教師信号ファイルによってニュー ラル・ネットワークを学習させ、降下法によ.って探索を 行った結果を、初期状態(A)について、c=O.1,0.5 0.8に対しそれぞれ図2・9(a), (b), (c)に示

す。

 静脚条件 時間増分dt 許容誤差eps

 入力初期変位a 初期速度b

タf一 ︐メdラ︐パ︒

・ファジィ部

.摩擦係数σ

マ位 x∫

゚度 x2

⇒⇒ 制御対象

e=xナcx2

ヘ≦1

 出力 氓フ状態 マ位 x∫

ャ度 x2 摩擦係数σ

マ位 κ1 ャ度 x2

・癌 \ノノ   ︑ ファジィ推論

二偉2R二二 推論結果

@u

ニユーロ系 コづル・わトワゆ

データ収集 ニューラかネ卦ワゆ

ニェーラノレネ外ワーク

マ,xゴ→x2 パ編ン ユづか勅トワゆ学習

9 ⇔⇔

灘一ラル・拘トワ汐

潤Cκ2 ・x1 最小値探索

最適パラメータ  d, f

図2・7 2次モデルのシミュレーション・モデル

1.0

o.

f      4

Oil;織鰍

1

O. 5 LO d

T f

    ノ     ノ     t     ノ       /    f  t

  ノ  /   ノ t  s i

 ノ ノ

t.臼

Tmin : 2.316

f   t.曜

d    一{}.鋤

e.s d

図2・8 探索の開始点 (a> 補間と探索の様一子(1)

参照

関連したドキュメント

1緒 言 約 25年 前 ,自 己適応制御系の設計 ゆ が提案 されて以来 , 適応制御 に関する研究 は活発 に進 め られているが ,設 計

最適レギュレータとロバスト LQ を用いた ABS の制御 — 最適レギュレータ理論とロバスト LQ 制御の比較 — 2010SE161

 同一の制御系の中に複数個の制御ステーションが存在

また, thermal-to-thermal flightに対しては, 変分 法による解法で解くために,

さらに,多指ハンドロボットによる把持物体の操り問題として対象物と各ロボットフィ

図2 ワンボードマイクロコンピュータモジュール(EDIC-MtA)の構

716 日立評論 VO+.58 No.9(1976-9) 切 マイクロ コンピュータのシーケンス制御への応用 4.1概

形式,あるいはマクロ命令記述形J㌔などの形でj淀供すること