・ファジィ技術の最適制御問題への応用

(1)

NDC 548．3

二ニュv一・…t口・ファジィ技術の最適制御問題への応用

岩城嵩＊

樋口史晃＊＊＊

石井秀知＊＊

小寺洋一＊＊＊＊

An Application of Neuro−Fuzzy Technology to the Optimum Control Problems

＊

Takashi IWAKI

Fumiaki HIGUCHI＊＊＊ Hidetomo ISHII＊＊

Yoichi KODERA＊＊＊＊

The optimutn contrcl problem i・s one of the most interesting problems to apply AI tecknology， because of its theoretical diffieult．y and its human related characteristics． The minimum time mass movement，

prob！em is one of the classical optimum control problems and many studies have been carried out ． In this paper as the first step to c・omplex problems ， applicability of neuro−fuzzy technology for the simple problems with and without friction force is clarified in comparison with theoretically knomrn solutions．

As a conclusion， norma｝izatioR of state variables and neural net−vgork capabilities in tuning of membership−functions of fuzzy rules and in reeresent．at．ion of normalized functions are found to play very important roles in solving the・se preblems．

はじめに

ファジK，ニューロの2つの技術は本来まったく別の領域にあるものだが、最近ではこの2っの技術のそれぞれの特徴を活かした融合も見られるようになっている。

本報告では最近注目されている、この融合技術を制御分野に適用した学習制御技術について述べる。本研究で扱う学習制御技術について議論する場合、図1に示すAlbUs の知的フレVム1）を用いるのが適している。すなわち、

学習について扱うレベルをご記号レベル、および、信号レベルに分類する。

ここで、信号レベルの学習とは外部環境に近い定量的な信号や情報を扱うレベルであり数学的操作が容易に適用できる。．また、記号レベルの学習とは外部環境から離れてよ

＊

＊＊

＊＊＊

＊＊＊＊

情報工学科

情報工学科平成6年度卒業現在九州工業大学情報工学科平成6年度卒業現在長岡技術科学大学三井造船（株）玉野研究所

平成7年8月24日受理

り抽象化した高度な人間の言語処理の知識を扱うレベルであり、数学的な操作を直接適用することは難しい。

ニューロ技術は、外部環境からより上位レベルに向かう知識の自己組織化能力を実現しようとするものであり、下位レベルからのBott。m Up方向の知識の形成をめざしたものである。

一方ファジィ技術は、記号レベルの知識を下位方向の実際の信号レベルの知識にBreak downし、具体的に制御・

認識等を通して外部環境に働きかけようとするものであり Top Down的な流れの実現を目指しているものである。

ファジィ技術は記号レベルの知識を信号レベルで実際に応用できるようにするTop Downの知識の流れであるが、

ファジィ制御自体には、ニューロが有するようなBottom Upの学習機能は有していないため、ファジ4制．御において対象の制御系が目標の仕様どおりに動作するようにするためには、IF THEN規則や、メンバーシップ関数の形などを多くの試行錯誤で調整．する必要がある（チューニングとい

う）。さらに、制御機器の入出カデータが多いときなどには、このチューニングは膨大な費用と時間を必要とする。

そこで、ニューm』の学習．機能がうまく付加できれば、

(2)

津山高専紀要第36号（1995）

Bσttom Upの機能が付加でき、メンバーシップ関数の自動チ＝k一一ニング等にその効果を発揮することができるdこのような一方の技術のみでは表現し得ない領域へ互いの長所をうまく利用する手段として融合技術が考えられる。

本報告では、多岐にわたる最適制御の一例である最短時間質点移動問題について、理論解が求められる純慣性系、

および摩擦を考慮した慣性系に対し、ニューロ・ファジィ融合技術を応用し、その適用における問題点の抽出と解決策を提案し、理論解との比較においてその有効性を確認す

ることを目的とする。

本研究の延長線上にある具体的な応用対象としては、車両の運転制御，クレーンによる運搬制御，船舶の推進制御などが考えられる。これらの問題においては、外乱、摩擦力の非線形性、加速度の乗り心地からの制約などが考えられる。これらの諸因子を考慮した実際的な問題では、もはや理論的考察からは解が得られない領域となり、本研究で述べるニューロ・ファジィ融合技術が有効な季段となろう。

本研究はこれらの問題への発展の第一段階として行ったものである。

記号レベル信号レベル

価値判断機能

現状野：ごミ騨

習。・1d陪。d・1、（行嘉面』

信号処理データベース

囚m 凶

一〇＝〉一一一一一一L一一

F

出発点位置：a 速度：b

終端点位置：0 速度：0

図1・1 1次モデル問題の概要ニュートンの運動方程式は、変位をyとすると、

F（t）＝ m＞・の（1・1）

が得られ、制御力を単位質量あたりのカを、

聖＝，t（t）

m

とすると、u（t）は次式の制約条件を満足するものとする。

lza（t）IE・！utttax（t）：＝：1 〈1 ・ 2＞

1次モデルの理論解は最大原理2）より求められ、変位，

速度それぞれの状態変数を、X1， X2とし、制御力の最適な切替時間をt＊，理論解である最短所要時間をtfとすると、初期状態くa，b）によって以下のように、制御力の切替回数が最大1回，制御力の最適値が制限の最大値か最小値のどちらかしかとらないバンダバンダ制御となる。

以下に理論解を示し、図1・2と最適制御軌跡を示す。

期中の太線は制御力uの切替線である。

墾曇∴

て璽

図1 Albusの知的フレーーム

1 純慣性系の最短二三質点移動悶題｛1次モデル）

1・1 問題の定義と理論的考慮

u＝一1 ^（a，b） x2

u＝一1

ノ I

＼愚＼＼

u；＋1

〆︐・■

・＝一1嵐

＼＼

P

〜︑ o π1

斗髄

@ 、@ 、

@ 、 A．＋1寒・、

、噛

A

獣・・＋1 ^{グ・・一1}

、「@、

−、．

」、− ㌔

@ ㌔『門』一・一一・● u窯＋圭

（a㍉b ）

図1・1のように、質量mの物体が点Aから初速度bで aだけ離れた点Bまで移動してそこで停止するとき、この移動に要する経過時間を最短にするには、物体に加える力 F（t）をどのように選んだらよいか。ただし、物体の大きさによる空気抵抗や摩擦などを一切無視した純慣性系で考えるものとする。また、制御力の絶対値は1以内の値しかとらないものとし、物体は質点として扱う似下、1次モデルと称する）。

図1・2 1次モデルの最短時問制御

（a）初期状態において、

a＞一（1／2）blbi を満たすならば、初めu；一1とし、

X，＝一（1／2）X， i X， 1 カミ成り立二つ時…亥酵、

t ＝＝ b＋ Va ＋〈1／2）b2

において、u＝十1に切換えると最短時間で原点に逮し、

その所要時間は、

(3)

ニューロ・ファジィ技術の最適制御問題への応用岩城・石井・樋口・小寺

となる。

tf ＝b＋ V4a＋2bi

（b）初期状態において、

a 〈一（1／2）blbl

を満たすならば、初めu＝＋1とし、

X，＝一（1／2）X， IX，1 が成り立つ時刻、

f＝一ゐ＋一a＋（1／2）み2

においてu＝一1に切換えると最短所要時間、

tf＝一ろ・＋一4a＋2ろ2 で原点に達する。

（C＞初期状態において、

a＝一（1／2）う渉1

ならば、b＞0のときはu＝一1， b＜0のときはu＝＝＋

1とすると制御力の切替はなく、最短所要時間、

tf ＝ibl で原点に達する。

1●2 ファジィ推論による制御

前項で定義した1次モデルの制御力u（のをファジィ推論より求め、シミュレー一一・ションする。ここで推論ルールを構成するメンバーシップ関数を種々変吏しながら適用性を検討する。

1・2・1 制御対象のモデリング

1次モデルの制御対象を、以下のようにモデル化する。

変数y（t）・y （t），y （t）をそれぞれX1（t），

X2（t）， X3（t）と置き換えると（1・1）式は次式と

なる。

−1ア（り＝ni■3（ピ）（1・3）

さらに、初期条件t＝0で、

Xi（O）＝ a X2（O）＝＝ b

を考慮して解くと、△t時間後の変位と速度はそれぞれ、

Xi（t ＋ At ）＝ 1 uAt2 ＋ X2（t）At ＋ Xi（t）

2

．￥2（i＋・Ai）＝u△t＋x2（りで与えられる。

これより、制御対象モデルは、図1・3のようになる。

入力

変位X，（t）

速度X2（t｝

制御力u（t）

︶︸︶制御対象

e（t）＝皿鵡（t）

@lu（t）1≦1

次の変位 X，（t＋ rt）

次の逮度 Xz（t＋6t）

図1・3 1次モデルの制御対象モデル

1・2・2 ファジィ部のモデリング

ファジィ部の推論法として、簡略化ファジィ推論3）を用いる。この推論法は、後件部（結論部）をファジィ集合ではなく定数で表現し、また、前件部（条件部）の適合度（グレード）をその論理積で、推論値を前件部適合度と後件部定数との心寄で求めるものである。

例えば、2入力（u，v）1出力（y）の場合には次のよ

うに表される。

Ri ： IF u is Ai（u） and v． is Bi（v） theR y ＝ Ci

ここで、Riはi番目の制御ルール、 Ai， Biはファジィ変数でメンバーシップ関数によって定義される。また、Ci は簡略化ファジィ推論の定義より定数である。

最終の推論結果は、

y＝Zwi 一Ci ／2wi （1 ・ 4）

，vi ＝ min （ Ai（u）， Bi （v））

で与えられる。ここで、晒はルールRiの前件部適合度であ

る。

チューニングのための可変パラメータは、前件部Ai（u），

Bi（v）のメンバーシップ関数（以下、 MSFと称する〉の位置：や形状を表すパラメータ群と後件部の定数Ciである。

また、ここでのファジィ部では、ある時刻の状態における最適な制御力を出力とする。

制御対象の変位及び速度と、制御力関係をIF〜THEN．．．

形式のルールとして次のように記述する。

IF Xi＝．4 and X2＝B THEN f：＝C

ここで、前件部のAとBはそれぞれ、NB（Negative

Big）． N S （Negative Small）， Z R （ZeRo）， P S

（Positive Sma11）， PB（Positive Big）の5つを考え、

従って25個のルールを用いることにする。

制御対象のモデリングの結果から、変位，速度の状態の基準となる範囲として正の定数αを導入し、かっ挙勧に関する工学的直感から、常識的にファジィ・ルー一一ルを考え、図1・4のようなファジィ・ルールを作成する。

(4)

曾変位痘

N：B NS ZR PS PB PB ^ZR L NB NB NB NB PS PB ZR NS NS NB

速度湿

ZR ^{PB PS} ZR NS NB NS PB PS PS ZR NB NB PB PB PB PB ZR

図1・4 常識ファジィ・ルール

次に、前件部の各MSFを、図1・5に示す。このM SFをチューニングするために、問題が原点について点対称であることを考慮し、前件部MSFの可変パラメー

タとして、図1・6のようなNS部， PS部の底辺を変化させるパラメータ（1〈＞0）を考える。このように、

dが小さくなると外側のMSF（NB部， PS部〉が、

内側に移動するようにする。

NB NS ZR Ps PB

hX／×

α 2

また、これをチューニングするために、前偉部の場合と同様に問題の制御が原点について点対称であることを考慮し、後件部の可変パラメータとして、図1・8に示すNS部とPS部の大きさを与える定数を変化させるパラメータf〈lfl＜1）を考えることにする。

冊鴨怨酪

f

一1．0 o．o 1．0

1．O

f o．o

−f

−1．O

図1・8 後件部定数の可変パラメータ 1。2・3 ファジィ・シミュレーション

．9雪

一ec 2 ^o ^ct

図1・5，前件部MSFの初期状態

NB NS ZR ps PB

xx

＼

一一Zc 一xi li o l21 目｝H

囚 ^［a

a

図1・6 前件部の可変パラメータ

後件部についても同檬に、NB，NS， ZR， PS，

PBの5っを考え、図1・7のように定数で表現する。

冊鴨盟略冊 _1．O

O．5 0．o

−O．5

・一P．g

rl．O o．o 1．0

図1・7 後件部定数の初期状態

推論のためのファジィールールを、図1・4に示す常識ファジ■・ルール、および、その故良常識ルールに任意に設定してファジィ・シミュレーションを行い、システム全体の出力である到達時間が理論解に近づくように

直感的に可変パラメータを手動チPt・一一、ニングする。

ここでは、時間増分dtごとに変化する制御対象の状態を追って、シミュレーションを行う。ここで、制御条件として許容誤差epsを考え、変位と速度のそれぞれに対して位相面上の原点からの微少の許容誤差を与え、

ともにこの範囲内の値になると原点に達したと判断し、

制御を終了する。このときの時間増分の総和である経過時間を到達時間Tとして出力する。また、T≦10の範囲内に原点に到達し得ない場合は、Tは測定不能とする。

チューニングのためのパラメータd，fを任意に与え、

変化させる全ての組み合わせに対してシミュレーションを行う。図1・9に、シミュレーション・モデルを示す。

シミュレーション．のパラメータとして以下の値を採用す

る。

時間増分二 d t＝O 005 秒許容誤差：eps＝・・O．・01 基確量：α＝2

初期状態：（a，b）＝（1，1）

d：｛LOO，0．75，0．50，0． 25，0．Ql｝の5種類 f：｛G．50，0．25，0．◎O．O．75，1．OO｝の5種類ファジィ・ルL一一・ル：図1・4に示す常識ルール、および、その改良常識ルール

1・2・4 シミzレーション結果

図1・4の常識ルールの場合の、（f，d）＝（LOO，

O．25）および（Q．5，1．OO）の場合のシミュレーション結

果の位相面軌跡を図1・10（a）および（b）に示す。

(5)

ニューロ・ファジィ技術の最適制御問題への応用岩城・石井・樋口・小寺

制御力uの遅延効果のため、得られた結果は無限軌道や許容時間内に原点に回しない軌道となり、理論解の最短所要時間3．45に近い時間で原点に到遠する結果は得られな

かった。

また、これらを防止するために数多く作成した改良常識ルールの場合に得られた執跡の一例として、（f，d＞＝

（1，1）のときのシミュレーション結果の位相面軌跡を図 1・10（c）に示す。許容時間内に何とか原点に達したものの、理論解の最短所要時間の3倍近く（T＝9．12）の時間を要し、望ましい結果は得られなかった。

制御条件幽間増分dt 許容誤差eps

入力期変位a 期速度b

タ一fメ︐ラd

パ

ゆ

4＞

ファジィ部

めぬ変速

。・

ファジィ推論

璽

1 2κκ位度変速

。

圏⇒

制御対象

F＝m・Xs

Iulsl o ^次の状態_変lXl^出力

速度x2

dt時間経遇

データ収集到達時間T

図1・9 1次モデルのシミュレーション・モデル

、 s ：ユ目．図25 噛ﾑ＝L〔う

aF1．穆＋1ド：L3臼

d：色25

一2 1 十＋2 変位

一1

、

s ＝ 9．119 胚y疋

a＝1．鰹

b＝L＠

＋1『d．四

d：1．39

一2 −1 ^＋1 辛2 璽

一1

（a）制御の軌跡（1）

、

T _{＝ユ題．四5} a ＝1．臼 b ：1』

f ：図．5 ^＋1

d ！1．四

一2 一1 ÷1 ＋2 変位

一1

（c）制御の軌跡（3）

図1・10 シミュレーション結果

1・3 入力変数を正規化したファジィ推論による制御

前項で述べた常識ルール等によるファジィ制御法では最短時間制御は不可能であることが分かったので、ここでは理論解の考察から提案された入力変数の正規化手法を提案し、さらに、ファジィ部とシミュレーション・モデルの再構成，環境パラメL一一一タの再決定を行い、再び、ファジィ・

シミュレーションを行う。

（b＞制御の軌跡（2＞

1・3・1 入力変数の正規化

位相面上で出発点（a，b）から、終端点（O，0）に制御対象が移動する場合、図1・2の実線が理論解である最適な制御の軌跡である。理論解では、図1・2の原点を

(6)

通過する曲線に関して制御力の正負が異なる。すなわち、

曲線の上か下かによって加える制御力の正負を変化させるようなファジィ・ルールが、理論解から言える最適とされ

る7fr・・一ルである。

よって、ある時問の状態における変位と速度の「切替線からの離れ具合」を入力とし、加えるべき制御力uの大きさ、正負を決定すればよいと考えられる。

この「切替線からの離れ具合」を、位相面の各象限ごとに、次のような正規化で表現する。

位相面において、変位：と速度の関係を各象限ごとにそれぞれ、

Xi ＝ f（X2）

X2 ＝ f i （Xi）

のように表すと．変位，速度の「切替線からの離れ具合」

は次のように表される。

＝． Xt

．ikri＝一；一1．：ii一：．i．（1・5）

f（X2）

＝r． −2 ×2＝．

（1 ・ 6）

f−i（Xi）

ただし、Xiは正規化された変位、 X2ほ正規化された

速度を表す。

（1・5），〈1。6）式は、ここで扱っている1次モデルでは、どの象限でも一意的に次式のように表される。

＝r． X！

−1＝

lx22 〈1・7）

2 ＝． X2

−Xr2il ixt （1・8）

この正規化を位相面上で考察すると正規化前後のそれは、

それぞれ図1・11，図1・12で示される。

2

．＿＿＿．．．二．．＿．

！＝

「冒丁−r．『−『『一一『『−「

@ τ

@ …

@ 藺 i

﹁⁝「一一一．．一幽P・」「「．一．一．．■

@ ；

黶@ i

今

｝・一・．．一．．．＿． B 「，，．曹、甲 A

@＿・ジ＝＝」一→・

Ai沁1 ^⁝5i ^{／〆そ一ザ}

⁝⁝ ／％／ i p l 迭 1 脚

⁝冒

援・5邑−塵＿．9．．．7一一」一一F，，．曽圃・．圃．．幽r．，■圃r．9−ρ一F幽．7．駒膠●層．曾｝

／！！

＿…＿．，．，．＿…＿＿…」払

3

r… …−一……』… …．「餉……．…刃ザ｝ ……一 …一…一『一 …一

…

@ … 8

@ …

@ … Bし、一一・Lμ《∈一一一一一

@ r ……『『

診 μ

m〆iニン／・i ^{昏i団三3⁝} ^「一

一 i A

̲ご、、一…．．＿＿一く一一一」・L．．■ …

3⁝ ^B 17 ｝

︸与

直 1− 1 曹．，＿．＿一．＝「 LP 曽，．＿一一一P．．ρr．r匿．π．．∠

26・・一一一、c1互i琴⁝ 9 ・一 ︐ ︐ 一

… 曲線｝

堰@ OA

hr

1 豆『『｝一「『

香@ 一i ︳︳﹃．．．．．︳︳﹃．﹃．ノ

」．一「「匿一匿「一．一「一一雫一一一・「，「−開，

ヂ：〜；こヨ o ^{レ……− …}@ ！ま．1ぞ一^{一一…r『}

百

曲線 5B・

五

▽i＜濫

登・艶ac

図1・12 正規化後の区分

■

図1・11の原点を通る曲線（OA， OBなど）は、図 1・12中の矢印で示された各点に、また各領域くA，B など）は曲線に変換されており、どのような軌跡であっても図1・12の曲線上に変換されている。また、制御力u の正負については、図1・11では太線で描かれた切替線より上か下かによって分けられ、正規化後の位相面図1・

13においては、破線で示す斜線で制御力uの正負が二分

される。

すなわち、非直線的な物理状態の分割を直線的な分割として扱えるようになり、図1・14に示すファジィ・ルールが、図1・13に示した正規化された入力変数と制御力との関係にうまく対応して作成できる。また、これより 1・2で導入した入力変数の基準量αが省略可能となる。

＼＼＼・

@＼・こ＼ 3

@＼こ＼、こ・監「旦怠＼i：一主・＼＼1

ム「……一ムil^．ぐ竺二

ﾎ1

＼＼．

一『1 0

P盲『一・一；ξ．

天＼嚢i

＝＋1、

1

^ 弓・ざτ⁝：︑li靴︐

i，；…

V・二∴，．F構祠

誉、・．＼・

図1・11 正規化前の区分

図1・13 正規化と制御力の関係

(7)

ニューロ・ファジィ技術の最適制御問題への応用岩城・石井・樋口・ j、寺

変位品

NB NS ZR PS PB PB ZR NS NB NB NB PS PS zR NS NB NB

速度淫2

ZR PB PS ZR NS NB NS PB PB PS ZR NS

・NB PB PB PB PS ^2：R

図1・14 正．規化によるファジィ・ルール

1−3−2

ン

正窺化を用いたファジィ・シミュレーショ

前節のシミュレーションと同様にd，f．を変化させ、正規化を用いたファジィ・シミュレーションを行うため、シ

ミュレー・一ション・モデルを再構成する。

紙面の都合上、ここでは省略するが、図1・9のシミュレーション・モデルでのファジィ推論め前処理として正規化が新たに加わったものとなる。

シミュレーションのパラメータとして以下の値を採用す

る。

時間増分＝dt＝0，0G5秒許容誤差；eps＝・O．Ql

初期状態（A）：（a，b）＝（1，1）

（B）：〈a， b）一：〈LO．5，1）

（C）：（a， b＞＝〈O． g．，一L5＞

d．：｛1．OO，0．75，0．50，0．25，0．Ol｝の5種類 f：｛O．50．O．25，0．00，0．75．1．00｝の5種類

ファジィ・ルール：図1・14 1・3・3 シミュレーシaン結果

御を実現できることが検証された。得られた全ての軌跡を見ると、最適なパラメータは、d＝0，frユとなりこのときの最適な前件部MSF，後件部定数は、それぞれ図1・18，図1・19のようになる。

このように、正規化を導入したファ．ジィ・シミュレーションでは、理論解であるバンダバンダ制御に一致する軌跡を描き、最適な制御が可能であることが分かった。従って本節で扱ったような、直接にファジィ・ルールを考えることは難しい問題に対しても、正規化を行えば、非常に少ないファジィ・ルールで理論解に近い門門を実現できる。

T＝3．449 A

凍

，L

a＝1．臼 ^L「^A．A㌔、

b＝L臼

?＜?D四 пF9．臼1

、、

＼、刊

@＼@、

一2 一1 ＋1 ＋2 変存

一1

、覧L d■等亀

eb−

2重−巳臼日L艮2 一一皿﹇

儲）c りeT Difi

2ーユ0臼2t歪2 一一一﹇ 2．

L

1︐

S．5

e，

吻、

nlt

（a）最適な軌跡

言珪罐ll畿

x

x．N

國』A＝．．

x x _x

一二一：一：一

勉

y一

ノノ

2ツγ．

ff

一

初期状態（A）のシミュレーション結果として（d，

f＞＝：（O．001，1）に対する位相面上の軌跡と変位，速度，制御力の時間変化を、それぞれ図1・15（a＞，

（b）に示す。注目の細線は切替線を示し、太線は得られた軌跡を示す。（d，f）＝（O．◎el，1）を採用するこ

とにより、到達時間は理論解tf＝3．45と一致することが分かる。

初期状態（B）と（C）の場合についても同様な結果が得られ、最適なパラメータ（d， f）＝（0．OOI，1＞に対する位相面上の軌跡と変位，速度，制御力の時間変化を、

それぞれ図1・16 （a），（b）と図1・17（a），

（b）に示す。図1・16の場合も図1・17の場合も、

それぞれの理論解tf憲Leo， tf漏3．08とよく一致して

いる。一t

上述の幾度かの試行錯誤によって、理論解と同一の制

嘉−う﹂一

1．区 2．臼

（b）時間変化の様子

3．e T；ne

n．e

図1・15 初期状態（A）でのシミュレーション結果

τ a ：臼．995

F一a5

A、㌧． ¶

@、う、」

@ 玉、

速度．

b ＝L9 ^、㍉、

f ：L四 ^＋！

d ：②．91

一2 一1

＼ ^ヰ重 ^＋2 呈

一1

＼し＼． ︑

、、胃髄、㍉

@、r、」、F

（a）最適な軌跡

(8)

・津山高専紀要第36号（1995）

触 Lbl

2．日

t．5 盤．9

e．s

e．臼

咽．5

．．煤Dg

−1．5

−2．e 2．e

t．5

塾．

e．s

臼．日

一日．5

一！．g

一霊．5

−2．e

8 ：一曾．5開 d：置．四1

Dig b_{＝重．的O f；} Lo2巳

，の

餌ヨ

．7 一｝一鳴1

恥。

．5

層噌﨟@ 醇一旨．」r r

，2 ^{@㌧ h■●「}

闇LA■、

@ π「「鴇＿．．．

@ r ．． ■ 「．

，2 「．．_e

p p

」 F P

」呼

「「

．5

D7

・9．9 T；冊

3．2 臼．5 臼．7 1．臼

PB

（ps）

ZR

〈NS）［

NB二

f＝互

日も咽紹吃

f＝1

LO

l．e o．o

−1，e

−1．g

一1． 0 o． e LO

図1・1 9 最適な後件部定数

図1・16

初期状態・（B＞でのシミュレーション結果 1・4 ニューーロ。ファジィ融合技術による制御

T＝3．併9

＝≠d．5

PL ｰ層、■幽

@、、、齢

b＝一1．5

、、、

f：1．四 ^＋1

d＝②．創、

一2 ^一1 ＋1 ＋2 変位

＼、、■

、うb鱒、

駈b A『

ftoc Uel Dig2 一ユ日日咽 4 ヨ￡

2。

￨L臼田紹弓或辺

、

1 0

L匠︒︐匠3．竜斌竜

→

〈a）最適な軌跡

・／

／、！馬〆、、〆

…一ｺ剛一｝t一一」ttt，一一tt 7「一｝鮒

、／電／ロノ

♪（／㌦．

ノノ騨●・一一・一曽㌔，ノ．

／

忌：9i臨1：望躍

xN x

圏＝二冒二 G

ha一一 ^ﾗ醇

Tlne

4．e

前節までに示したように、正規化という手法を用いることで、ファジィ系のみでも十分な制御を実現できた。しかし、制御対象がより複雑になり、扱うパラメータが多くなると、一般にチューニング作業は非常に困難となる。そこで、ニューラル・ネットワークの学習性を利用した自動チューニング手法が考えられる。本節では、この自動チューニング手法の有効性を検証する。

本研究では、ニューラル・ネットワークの形態の中でも、

階層結合型のネットワークであるバックプロパゲーション・モデル（誤差逆伝搬学習モデル）を用いる。階層構造は問題を簡単にするため、図1・20に示すように入力層、

中間層、出力層の3階層構造とする。ここで、学習のための入力パラメータは、前述のdとfとし、それぞれのパラメータにおける到逮時間Tをニューラル・ネットワークの出力の教師信号とする。従って、ニューラル・ネットワークは2入力1出力の階層型のモデルとなる。また、中間層の要素数はあまり複雑なモデルにならない程度に、ここでは10とする。なお、三ユー一・・シミュレL・一一タはADS製ニューーロ・シミュレータ4）を使用した。

図1・17

t．e 2．e 3．D

初期状態、（C）でのシミュレーション結果

NB （NS） ZR （PS） PB

d＝0 ^＼ d＝0

入力層

1

中間層

一1 o

：×

XXL

××

出力層

図1・20 ニューラル・ネットワークのモデル

図1・18 最適な前件部MSF 本研究では、前述の3つの異なる初期状態（A），

（B），（C）についてデータを収集し、それぞれ学習を行い、学習後のニューラル・ネットウークから最急降下法によって到逮時間Tが最小となる最適パラメータd，fを

探索する5）。

(9)

ニューロ・ファジィ技術の最：適制御問題への応用岩城・石井・樋口・小寺

ファジィ・ニューロ融合型学習制御システムの構成図を図1・21に示す。

最急降下法

：最適パラメータ：：：

ニユ・一［培β

．、⊆嚢

データ収集

ファジィ部制御対象

図1・21

プアソィ系 1次モデルの融合システム構成図

図1・22（a＞，（b＞，（c）に初期状態（A），

（B＞，（C＞の場合の学習の結果を示す。どの初期状態においても、

d：：1O f 1＝1

に収束した。これはファジィ・シミュレーションにおいて理論解を与えるパラメータであり、1次モデルを用いた

ファジィ・ニューロ融合シミュレーションでは、ニューラル・ネットワークの学習によるファジィ・ルールの自動チューニングは有効であるといえる。

T ^f

M．5 1

T

−

ﾚ

一

f

電．5 t d

（c）初期状態（C）での補間と探索の様子図1・22 各書記状態の補間と探索

なお、探索において採用した最手降下法は、本来、極小値（極大値）を探索しており、得られた結果が必ずしも最小値（最大値）であるとは限らない。これを回避するため、

探索の初期値をいくつかとり、それらのうち、出力が最小

（最大〉となるもの、すなわち、到達時間丁が最小になるものを最適なパラメータとした。

／ca．5／ノ

d

2．摩擦を有する慣性系の最短時間質点移動制御開題

（2次モデル｝

2。1 問題の定義と理論的考察

麟只 ¹

（a）初期状態（A）での補間と探索の様子

図2・1に示すように、質量mの物体が点Aから初速度 bでaだけ離れた点Bまで移動してそこで停止するとき、

この移動に要する経過時間を最短にするには、物体に加える力F（t）をどのように選んだらよいか。ただし、移動平面上に速度に比例する摩擦係数kの摩擦が存在する慣性系で考えるものとする。また、制御力の絶対値は1以内の値しかとらないものとし、物体は質点として考える（以下、

2次モデルと称する）。

T

t

f

尉．5

囚m 摩擦k

O ［：Z ＞fv v vnwwv−v．vvNf一． e一一

F

出発点位置：a 速度＝b

図

終端点位置：0 速度＝0

d

6，5 ¹

図2・1 2次モデル問題の概要

（》）初期状態（B）での補間と探索の様子

(10)

与えられた2次モデルの解を数学的に求めるのは多少困難なので、ここでは篤単に次のような方法で最短所要時間 tfを求める。すなわち》最適な制御の条件を1次モデルの理論解から推察した下記の特徴を考慮し、求める方針と

した。

①制御力uは、最大値あるいは、最小値をとる ②切替回数が最高1回の制御である

この特徴を利用して、切替時間を求めるためのシミュレーション・プログラムを作成した。まず、各初期状態の変位と速度の位相面上の位置において、最初に加えるべき制御力（最大または最小）を決定し、次に切換時間を少しずつトラバースしながらシミュレーションを行う。

ここで、Runge−Kuttaの4次法6）を用いて切替線を表示しておき、トラバースの間隔を狭めていくことで最適な切替時間を確定し、そのときの到達時間を理論解（最短所要時間1とする。ﾘ替線の一例を、c＝0．8（後述）の場合について、図2・2に示す。

速度

＋i

一￡一1

一1

＋1 ＋2 ^裟イ㍉

図2・2 切替線（摩擦係数＝＝0・8）

2・2 制御対象のモデリング

2次モデルの制御対象は、1次モデルのそれに摩擦項を考慮し、以下のような運動方程式で表される。ここでkは摩擦係数を表す。

F（t）・ myω＋妙（の（2・1）

制御力を単位質量あたりの力を、

聖＝麗ω 初

とすると、u（t）は（2・2）式の制約条件を満足するも

のとする。

｝u（t）1≦Umax（り＝1 （2・2）

また、単位質量あたりに作用する摩擦を考え、係数を、

とする。

kc一一一

m

各変数y（t）．y （tう， y （t）をそれぞれX1（亡）．

X2（t）， X3（t）と置き換えると、（2・1）式は、次のように表される。

u（り＝X3（つ＋c・X2（t）（2・3）

このように構成された制御対象を、Runge−Kuttaの4次法を用いて、ある状態から微少時間△t後の変位と速度は、

次式によって与えられる。

l

X2（t＋At）＝X2（t）＋1（ki＋2・k2＋2・k3＋k4）

6 1

Xi（t＋ At）＝．2Y i（t）＋ 1 （li ＋2−h＋ 2−13 ＋ 14）

6

ここで、ki， l i（｛灘1〜4）は、 Rtnge−Ktitt．aの4次法で定めれられる変数である。これより、制御対象モデルは、図2・3のように表される。

入力

変位X，（t）

逮心切（t）

制御力u（t）

︶︶︶制御対象

e（t）＝【Rτ・＋k■ 次の

睡（t）1≦1 氓ﾌ

出力

次の変位Xt（t＋ri t）

次の速度−2（t＋ti t）

図2・3 2次モデルの制御対象モデル

2・3 入力変数の正規化

1次モデルでの正規化同様、2次モデルにおいても、

「切替線からの離れ具合」を、位相面の各象限ごとに次のような正規化で表現する。ある摩擦係数。における変位と速度の関係を位相面の各象限ごとに、

Xi＝f（C， X2）〈2・4＞

x2＝f−1（・，x・）（2・5）

のように表すと、正規化された変位・速度は次の式で与えられる。

＝． Xl Xl＝

f（c， −2）〈2 6）

＝ X2

×2 ＝：

f一（c， Xi）（2 7）

ただし、Xlは正規化された変位、 X2は正規化された

速度を表す。

2次モデルにおいてほ、Xl， X2は1次モデルのように陽な形で表現できないので、2・1で述べた切替線をニューラル・ネットワークを用いて表現する手法を採用する。すなわち、ニューラル・ネットワークの入出力関係の学習能力を利用し、切替線を表現する方法を考える。ここで、表現すべき切替線の要素は、変位，速度，摩擦係数であり、これらの入出力の関係を、図2・4に示すように、

ニューーラル・』 lットワークを利用して切替線を表現する。

(11)

ニューロ・ファジィ技術の最適制御問題への応用岩城・石井・樋ロ・小寺

切替線ほ各象限ごとに異なり、それぞれの象限について図2・4のようなニューラル・ネットワークを学習させる必要があるが、切替線が第1象限と第3象限、また第2象限と第4象限において原点に対して対称であることを考慮すれば、最低4っのニューラル・ネットワークを学習させればすべての象限についての切替線を表現できる。

1

cX

Neural network 1 f ^ikr 2

X！ X2

（口．3．0｝

く1．0．3．01

！

@ ／

@ ！

@ 〆，ノ

@！_P〆 I

ノ！

♂

9．巧 1．M c

2

cX 一一k2^l一一三図2・5

（b＞第1象現（c，．￥2 一一〉 X！）

ニューラル・ネットワークによる切替線の表現

く1）

図2・4 ニューラル・ネットワークによる切替線の表現

まず、ニューラル・ネットワークを学習させるためのパターンファイルと教師信号ファイルを作成し、学習を行った。パターンの組み合わせば最終的には160組を用意し、

学習には6時間以上を要した。

また、学習させた結果、出力値が0であるべき部分の誤差が大きくなることから、原点近傍でのデータを多く取り、

教師信号ファイルの値に一定のオフセット値を加えて（底上げして）学習させることによって、ある程度は誤差を解

消した。

図2・5および、図2・6に、それぞれ第1象阻および第2象限についての学習結果を示す。2・1で求めた切替線と比較すると図2・5（a＞はよく一致しているが、図 2・5（b）では、入力XIが大きくなると出力X2の誤差が大きくなる。しかし、変位・速度の範囲に余裕を持っ

て学習させてあるため、誤差の大きな部分を参照することはない。よって、多少の誤差を許容したニューラル・ネッ

トワークを用いた切替線により正規化を行う。

X．2

Cfi． 3． fi｝

t

X

／ ︐／

〆！／

／〆晒

1

x2 ^＞r． t

｛1．0． 3．0）

一

ノ

Cn． 3．D｝

ノ

雌ノ

e，s

響

♂ノ〆ノノノ／！ノ／

／！

F

臼

一。

（a）第2象現（c，t）t P→X2）

図2・6

臼．5 1．U c

（b）第2象現（c，i￥2→X1）

9．巳 ^。

ニューラル・ネットワークによる切替線の表現

く2）

（a｝第1象現（c，Xl 一〉 IYT2）

図2・5 ニューラル・ネットワークによる切替線の表現（1＞

2。4 ファジィ・ニューロ融合シミュレーション 2次モデルに使用するファジィ部，チューニングのため

(12)

津山高専紀要．第36号（1995）

の可変パラメータd，fおよび、そのニューーラル∴ネットワーーク部は、1次モデルの場合と同様とした。

従って、シミュレーション・モデルは、1．次モデルのそれに、摩擦係数。，正規化のための．二丘一一ラル・ネット

ワークが新たに加わり、図2・7のように構成される。

シミュレL一・一ションのためのパラメータとして以下の値を採用する。

時間増分：dt＝O．OG5秒許容誤差：eps＝0．Ol

初期状態＝（A）：（a，b＞＝（一1．O，⑪）

〈B）：〈a， b）＝＝〈1， r）

（c）：（a， b）：＝：〈 e．s，一1．e＞

．d二｛LOO，0．75，0．50，0．25，0．Ol｝の5種類 f：｛0．50，0．25，0．00．O．75，1．OO｝の5種類

ファジィ・ルール：図1・14

摩擦係数＝c鴇O．1， c＝O．5，￠＝・O．8

また、．最適パラメータd， fの探索は図2・8に示す5 カ所を初期値として行い、それらの結果うちの最短時間を与えるものを最適パラメータとした。

2・5 シミュレーション結果

ここでは、2・4で示した2次モデルのシミュレーションを行った結果を示し考察する。

各パラメータでのファジィ。シミュレーションから得られたパターンファイル，教師信号ファイルによってニューラル・ネットワークを学習させ、降下法によ．って探索を行った結果を、初期状態（A）について、c＝O．1，0．5 0．8に対しそれぞれ図2・9（a），（b），（c）に示

す。

静脚条件時間増分dt 許容誤差eps

入力初期変位a 初期速度b

タf一 ︐メdラ︐パ︒

・ファジィ部

．摩擦係数σ

ﾏ位 x∫

ﾟ度 x2

⇒ ⇒⇒ _制御対象

e＝xナcx2

ﾍ≦1

⇒

出力氓ﾌ状態ﾏ位 x∫

ｬ度 x2 摩擦係数σ

ﾏ位 κ1 ｬ度 x2

・癌＼ノノ ︑ ファジィ推論

二偉2R二二推論結果

@u

⇒

ニユーロ系コづル・わトワゆ

データ収集 ^{ニューラかネ卦ワゆ}

ニェーラノレネ外ワーク

ﾏ，xゴ→x2 パ編ン ^{ユづか勅トワゆ学習}

9 ⇔⇔

灘一ラル・拘トワ汐

潤Cκ2 ・x1 最小値探索

最適パラメータ d， f

図2・7 2次モデルのシミュレーション・モデル

1．0

o．

f 4

Oil；織鰍

1

O． 5 LO ^d

T ^f

ノノ t ノ／ f t

ノ／ノ t s i

ノノ／

t．臼

Tmin ： 2．316

f t．曜

d 一｛｝．鋤

〜

！ノ

e．s d

図2・8 探索の開始点（a＞補間と探索の様一子（1）