• 検索結果がありません。

九州大学学術情報リポジトリ

N/A
N/A
Protected

Academic year: 2021

シェア "九州大学学術情報リポジトリ"

Copied!
73
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

デッドビート特性を用いるディジタル制御固有の線 形制御則に関する研究

清田, 高徳

https://doi.org/10.11501/3088215

出版情報:Kyushu University, 1991, 博士(工学), 論文博士 バージョン:

権利関係:

(2)
(3)

デッドビート特性を用いる

ディジタル制御固有の線形制御則に関する研究

平成3年1 2月

清田高徳

(4)

目 次

第1章 緒言 1

1.1 本研究の背景と目的 1

1.2 表記上の注意 1 1

第2章 一入力系に対する固定終端LQ型最適レギュレータ 1 3

2. 1 まえがき 1 3

2.2 問題の設定 1 3

2.3 一入力デッドビート原理 1 4

2.4 正則型LQ最適制御 1 8

2.4.1 最適制御 1 8

2.4.2 例題 2 2

2.5 最小エネルギー制御 2 4

2.5.1 最適制御のオープンループ表現 2 4 2.5. 2 最適制御のフィード、バック表現-1 25 2.5.3 最適制御のフィード、バック表現-2 26

2.5.4 例題 2 8

2.6 特異型LQ最適制御 2 9

2.6.1 特異性の解消 2 9

2.6. 2 最適制御 3 1

2.6.3 特異型と正則型との関係 3 6

2.6.4 例題 3 7

2.7 L Q型最適制御の統一的表現 3 9

2.8 あとがき 40

第3章 多入力系に対する固定終端LQ型最適レギュレータ 4 2

3. 1 まえがき 4 2

3.2 問題の設定 4 2

3.3 多入力デッドビート原理 4 4

3.4 正則型LQ最適制御 4 8

3.4.1 最適制御 4 9

3.4.2 例題 5 7

3.5 最小エネルギー制御 5 9

3.5.1 最適制御のオープンループ表現 5 9 3.5. 2 最適制御のフィード、バック表現-1 59 3.5.3 最適制御のフィード、バック表現-2 61

3.6 あとがき 6 6

(5)

第4章 1型サーボ系に対する固定終端LQ型最適制御 6 8

4.1 まえがき 6 8

4. 2 1型サーボ系の一般構成 6 8

4. 3 正則型LQ最適制御 7 3

4.4 偏差入力エネルギーの最小化 7 6

4.5 例題 7 6

4.6 あとがき 8 2

第5章 固定終端レギュレータの新しい最適性の条件 8 3

5. 1 まえがき 8 3

5.2 固定終端最適レギュレータ問題 8 3 5.3 基本構造と新しい最適性の条件 8 4 5.4 正則型LQ最適制御問題の新解法 9 0 5.5 正則型LQ最適制御の十分性 9 3

5.6 一入力系の場合 9 6

5.7 あとがき 9 9

第6章 テ守ッドビートレギュレータの設計法 100

6.1 まえがき 100

6.2 問題の設定 101

6.3 一般形と整定時間 102

6.4 ベキ零ジヨルダン行列の直接的導出法 107

6.5 最適設計法 111

6.6 正準形 113

6.6.1 [系6.2 ]の場合(J = Joの場合) 113 6.6.2 J =f Joで[系6.1 ]の場合 114 6.7 計算遅れがある場合の一般形 117 6.7.1 計算遅れがある状態フィードバック 117

6.7.2 拡大系の可到達指数の族 120

6.7.3 一般形 122

6.8 あとがき 125

第7章 1型デ、ッドビートサーボ系の設計法 127

7.1 まえがき 127

7.2 問題の設定 127

7.3 1型サーボ系の一般構成 128 7.4 偏差系の可到達性と可観測性 129 7.5 1型デ、ッドビートサーボ系の一般形と整定時間 131

7.6 例題 136

7.7 あとがき 138

(6)

第8章 テ。ッドビートオブザーバの設計法 140

8.1 まえがき 140

8. 2 問題の設定 140

8.3 一般形と整定時間 143

8.4 正準形 148

8.5 最適設計法 148

8.6 非再帰形デ、ッドビートオブザーバの一般形 15 0

8.6.1 計算遅れがない場合 15 0

8.6. 2 1サンプルの計算遅れがある場合 15 3

8.6. 3 2-Delayシステムの場合 15 5

8.6.4 例題 15 7

8.7 あとがき 15 9

第9章 結言 160

謝辞 164

参考文献 165

付録(Arv F) 17 0

(7)

第1章 緒

t:::I

1.1 本研究の背景と目的

近年, 演算速度が非常に高速なDSP(Digital Signal Prosessor)などの信頼性が 高く高性能なマイクロプロセッサが登場したことにより, さまざまな分野で 制御装置のディジタル化が急速に進んでいる. 特に, 制御則をソフトウェア で組むサーボ機構のデ、ィジタル化は, ソフトウェアサーボあるいはデ、ィジタル サーボと呼ばれ1)J), 制御則が複雑化しでもソフトウェアの変更で簡単に対 応できるという利点を有している. そのため, 現代制御理論などの高度な制 御手法の適用が進んでおり, サーボ機構の高精度化, 高速化, 高機能化が実 現できるようになってきた. それに伴い, デ、ィジタル制御理論の重要性も増 してきている.

現代制御理論は, 1 950年代後半に計算機の利用を前提として誕生した.

古典制御理論に対し 現代制御理論では主に状態方程式によって系が表現さ れる. この状態空間法は多変数制御系にも適用でき, 1 960年代には各種 の線形制御理論の基礎が体系化された. 線形系では重ね合わせの原理が適用 できるため問題の解析が非常に簡単になり, さらに非線形関数であつでもあ る動作点の近傍で近似展開することによって線形化できる場合が多いため,

線形制御理論は幅広く適用される. 線形制御系の制御装置とその設計理論の 主なものに, 次のようなものがある3)-7)

[ 1]レギ、ュレータ 状態や出力をなるべく速く, しかも振幅が小さくなる ように, 平衡点、(通常は零とする)に戻してやろうとする機構である. 通常,

フィードバックを用いて構成される. 一般に, 制御対象の極を指定された位置 に配置する極配置による設計法と, リカッチ方程式に基づく最適レギュレー タやH∞制御などの設計法に大別される.

[2 ]オフeザーバ 状態の値が直接測定できないような場合に, 入力と測定 可能な出力から状態を推定しようとする機構である. なお, 必要な次元を持 つ動的システムをフィード、バック内にあらかじめ挿入し, フィード、バック系の 安定化および過渡特性の改善を考えて, そのパラメータを決めたものが動的

(8)

補償器である. オブザーバも動的補償器の一種と考えることができる.

[ 3]サーボ系 レギュレータはシステムの状態を常に平衡点(零)に保つ.

これに対し, 与えられた目標値に高速かっ高精度で追従させるような制御系 がサーボ系である. サーボ系の場合は目標値が平衡点ではないため, それを 補正するための構成条件を加えなければならない. 一般に, フィード、バック 系が安定となる内部安定性の条件, 持続外乱が存在しでも出力が目標値に定 常偏差なく追従する出力レギュレーションの条件, およびパラメータに微小 変動があっても内部安定性の条件と出力レギ、ュレーションの条件が達成され るロバスト性(あるいは構造安定性)の条件の三つの条件が要求される.

一般に, 制御は連続時間系で表現されるアナログ制御と, 離散時間系で表 現されるデ、ィジタル制御とに大別することができる. 微分方程式で記述され るアナログ制御系に対し, デ、ィジタル制御系8)-10)は差分方程式で記述され る. 両者の最も大きな違いは, 微分が用いられるアナログ制御系では許容さ れるデルタ関数(インパルス)が, その性質上デ、ィジタル制御系では許容さ れないという点にある.

離散時間系には, 大きく分けて, もともと連続時間系であるものをディジ タル計算機によって解析・制御するためにサンプリングにより離散化した場合 と, 初めから離散時間系で表現される場合がある. 線形制御に限れば, デ、ィジ タル制御系の設計はアナログ制御系の場合と基本的な考え方においてほとん ど差はなく, 多くのテ守ィジタル制御則はアナログ制御則を読み変えることに よって得られているが, 中には先に述べた両者の違いによりアナログ制御で は実現できないデ、ィジタル制御固有の制御則が存在する. その最も代表的な ものが, デ、ッドビート制御11),12)である. デ、ッドビート制御は有限時間整定制 御とも呼ばれ, 有限の時間で状態や推定誤差, 出力誤差などを零に整定させ る制御である. デ、ィジタル制御系においては, 一定ゲインの線形フィード、バッ クによってデッドビート制御が実現できるため, デ、ィジタル制御系の主な設計 法のーっとしてこれまでに多くの研究がなされてきた. デッドビート制御も 伝達関数に基づく手法と状態空間法に基づく手法とがあるが, その基礎を確 立したのは状態空間法である. Kalman 13)は, 可制御性について述べた論文 において初めて状態フィードバックによるデ、ッドビート制御系の設計法を示し た. 以来, 初期の研究は最短時間制御に関するものが多かったが, 7 0年代に

(9)

入ると多入力多出力系に関する研究が盛んになった. 有限時間で状態ベクトル のすべての成分を零に整定させる状態デ、ッドビート制御の設計は, kdmm13),

Leden 14) らによる可制御空間に着目する方法, Sebakhy and Abdel-Moneim 15) らの極配置による方法, Leden 16), Lewis 17) の特異リカッチ方程式による方法 の三つに大別される12) この他に, 出力を有限ステッブで零に整定させる出 力デッドビート制御(西村ら18), AKωhi and Imai 19)他), 出力が目標値に追 従するデ、ッドビートサーボ系(Bradshaw and Porter 20), Kimura and Tanaka 21) 他), 状態の推定値が有限ステップで状態と一致するデ、ッドビートオブザーバ (Ichikawa 22), O'Reilly 23), Adaιhi and Akashi 24)他), 出力フィード、バックに よるデ、ッドビート制御( Porter and Bradshaw 25), Akashi and Imai 26), O'Reilly 27)他), パラメータ変動に対するロバストデ、ッドビート制御(木村28)他)な

どに関する研究が行われている.

このように, ディジタル制御系では, デ、ッドビート特性を利用すれば, アナ ログ制御系では実現できない制御則が実現できる. 本論文では, 一定ゲイン により, あるいは, オブザーバや拡大系などの動的補償器を導入したとして も一定のパラメータにより, 有限の時間で状態や推定誤差や出力誤差などを 零にする制御を狭義のデッドビート制御と呼ぶことにする. しかし, 後で述 べるように, 狭義のデッドビート制御系の可能な構造を陽に示す一般形や最 適設計法は求められていない.

一般に, 最短時間デッドビート制御は, オーバーシュートや入力エネルギー が過大となることが大きな欠点であり, その対策として整定時間を長くする 方法が示されている. しかし, 一入力系の狭義のデ、ッドビート制御は一意的 に定まり 設計の自由度は存在しない. さらに, 多入力系においても最長整定 時聞が存在するため, 一定ゲインの(すなわち, 狭義の)デ、ッドビート制御 による応答波形の改善には限界がある.

狭義のデ、ッドビート制御は, いずれも一定ゲインにより 有限時間でシステ ムの極を零に配置することにより デ、ッドビート制御を実現させるという極配 置による方法である. 前述のように, レギ、ュレータの設計法として, 極配置 による方法の他に最適レギュレータによる方法がある. これは, 与えられた 評価を指定された条件のもとで最小(または最大)にする最適制御を求める 方法 である. 古典制御の代表的な評価として, パラメータ最適化に用いられ る二乗面積評価( ISE : Integral of Squared Error) 5) があるが, 二乗面積評価

(10)

には入力の項が直接陽には含まれないので, 制御装置の構造を前もって定め ない現代制御においては特異制御29) となる. そのため, 現代制御では,状態 だけではなく入力も含んだ二次形式評価がよく用いられる. この最適制御問 題は, 制御対象が線形(Linear )で,評価が二次形式(Quadratic )であると ころから, L Q最適制御問題 と呼ばれている.

一般に,最適制御問題5),30),31)は,終端時刻によって次の三つの場合に大別 される.

[1 ]終端時刻固定(有限制御時間) 終端時刻が有限な値に固定される問題.

[2]終端時刻無限大(無限制御時間) 終端時刻が無限大である問題.

[3]終端時刻自由 最短時間制御などのように,終端時刻を評価に取り入れ た問題.

さらに,有限制御時間問題は,終端条件により次の三つの場合に分けられる.

[1]自由終端 終端の拘束条件が存在しない.

[2]固定終端 終端がある指定される値でなければならない(以後, この 条件を終端状態固定 条件 と呼ぶ).

[3]可動終端 終端がある領域内になければならない.

通常,有限時間最適制御問題は,自由終端のもとで解かれる. その理由は,終 端状態が自由な有限時間LQ最適制御問題が,

(性質1)最適制御が状態フィードバックの形で得られる.

(性質2)最適ゲインが初期状態に依存しない有界な(時変)ゲインとなる.

(性質3)最適ゲインを求めるための明確なアルゴリズムが存在する.

なと、の性質を持つためである. ところが, 高精度レギュレータでは有限の制 御時間で状態を零にすることが,また, 高精度サーボ系では出力を有限時間 で目標値に一致させることが, それぞれ要求される. すなわち,有限時間最 適制御は,自由終端よりも固定終端の方が望ましい特性を持っている. なお,

一般の1型サーボ系が制御対象の初期状態や外乱と目標値の大きさに依存し ないためには, 出力数と同じ数の積分特性を付加した拡大系を考えなければ ならない. このとき,拡大系の偏差系を用いることにより,1型サーボ系の設 計問題はレギ、ュレータの設計問題に帰着させることができる. すなわち, 1

(11)

型サーボ系の終端状態固定条件付最適制御問題は, レギュレータの終端状態 固定条件付最適制御問題(以後, 固定終端最適レギュレータ問題と呼ぶ)に帰 着される. よって, 以後, 終端状態固定条件付最適制御問題に関しては, 固 定終端最適レギュレータ問題を中心に述べる.

固定終端最適レギ、ュレータ問題に最適化の代表的手法であるラグランジュ の未定乗数法を直接適用すると, 最適制御は両端に制約を持つ二点境界値問 題の解となる. 動的計画法を用いても二点境界値問題が得られる. しかし,

このような二点境界値問題を一般的に解いてフィードバック形式の解を求め ることは難しいとされており5), 固定終端最適レギュレータ問題に対し, 終 端状態が自由な場合と同様な(性質1)---(性質3)を持つ状態フィード、バッ ク形式の最適制御は求めらていない5),32) これまでは, 試行錯誤的な方法に よってオープンループ形式の最適制御を求める方法や, 終端状態固定条件は 自由終端問題において終端状態の重みが無限大の場合に相当するので, 自由 終端問題において終端状態の重みを非常に大きく取る近似的な方法, あるい は, オープンループ形式で求められた最適制御をフィードバック形式に読み 変える方法などが例題によって示されているだけである32) なお, アナログ 制御系においては, 固定終端最適レギュレータ問題に対し, 有界なゲインに よる状態フィードバック形式の最適制御は存在しない. また, アナログ最適 制御とディジタル最適制御の比較を行った文献もあるが33), 固定終端最適レ ギュレータ問題に関しては何も触れていない.

自由終端有限制御時間や無限制御時間のLQ最適制御問題は, 通常, 二次 形式評価における状態の重み行列が半正定, 入力の重み行列が正定という条 件のもとで解かれる. これは, 前述のような特異性を避けるためである. 本 論文では, この条件のもとでの最適制御問題を正則型LQ最適制御問題と呼 び, この評価を正則型二次形式評価と呼ぶことにする.

正則型二次形式評価において状態の重み行列を零行列とした場合, すな わち, 入力の二次形式のみを評価とした場合が, 最小エネルギー制御問題で ある. 固定終端の場合に対しては, これまでに可到達性グラミアンを用いた オープンループ形式の最適制御は求められているが34)? フィード、バック形式 の最適制御は求められていない.

一方, 正則型二次形式評価において入力の重み行列を零行列とした場合,

すなわち, 状態の二次形式のみを評価とした場合が特異型LQ最適制御問題

(12)

であり, 古典制御における二乗面積評価を一般化した評価を特異型二次形式 評価と呼ぶことにする. ディジタル制御系においては, アナログ制御系と同 様に, 制御時間が無限大の場合に対してのみ, 正則型LQ最適制御において 入力の重み行列を漸近的に零に近づけたときの極の性質について述べられて いる3) さらに, Kalman 13)は一入力系の無限制御時間問題に対し, 状態の 重み行列が正定という条件のもとでは特異型LQ最適制御が特別なリカッチ 方程式により 求まることを示し, Pearson 35)はその安定性について述べてい る. また, Kuèera 36)は一入力一出力系の無限制御時間最適出力レギ、ュレー ション問題に対し, 評価の特異性を解消する方法を示し, その解について論 じている. しかし, 一般の特異型LQ最適制御問題に対しては, 終端状態固 定条件のもとでの最適制御だけでなく, 自由終端の場合や無限制御時間の場 合に対する最適制御も完全には求められていない.

なお, 本論文では, 正則型LQ最適制御問題, 最小エネルギー制御問題, 特 異型LQ最適制御問題の三つを合わせてLQ型最適制御問題と呼ぶことにす

る(図1. 1参照) .

ところで, 固定終端最適レギ、ュレータ問題は, 数理計画法における等式制 約条件付最適化問題に相当する. この問題の解法としては, 一般に

[解法a] 等式制約条件を解く ことなく, ラグランジュの未定乗数法など で最適性の条件を求め, その最適性の条件を解く 方法.

[解法b] 一部あるいはすべての等式制約条件を満足する一般解を求め,

この一般解を用いて新しい最適化問題を解く方法.

の二つがある. ラグランジュの未定乗数法から直接導かれる両端に制約を持 つ二点境界値問題の解法は[解法a ]に相当するが, 前述のようにこの問題 を直接解いてフィードバック形式の最適制御を求めることは困難とされてい る.[解法bJを固定終端最適レギュレータ問題に適用するには, まず終端状 態固定条件(すなわち, 等式制約条件)を満足する入力の一般形を求めなけ ればならない. その一般形を用いれば, 終端状態固定条件のない新しい自由 終端最適制御問題を誘導することができると考えられる. なお, 狭義のデッ ドビート制御ではゲインは一定であるが, 一般に一定ゲインだけでは固定終 端最適レギュレータ問題の最適解を得ることはできない. しかし, 本論文で 明らかにされるように, 固定終端最適レギュレータでは, 制御の後半におい

(13)

制御対象

評価

x(t + 1) = Ax(t) + Bu(t)

J(T)=

j g

附Qx(t) + u川

(X() ; 自由

日開問題

r 有 限

(

1

x(r) ;固定 固定終端問題

Q三0,恥1 :三o ,R > 0 Q = 0, M = 0 ,R > 0 QどO?M=QFR=0

正則型LQ最適制御問題 最小エネルギー制御問題 特異型LQ最適制御問題

図1.1 L Q型最適制御問題の分類

(14)

て必ず狭義のデッドビート制御を用いなければならない . そ こで, 本論文で は, 終端状態固定条件を満足させる制御を広義のデ、ッドビート制御と呼ぶこ とにする. 本論文の第2章から第5章では広義のデ、ッドビート制御について,

第6章から第8章では狭義のデ、ッドビート制御について述べる.

なお, 線形定常系においては, 制御対象が与えられれば, 可到達指数の族 (reachability indices)と呼ばれる正の整数の組が一意的に定まる. これは 制御 対象の構造を規定する重要な指数である. 自由終端最適制御問題と異なり,

固定終端最適制御問題では可到達指数の族すべての情報が必要となる.

本論文の第2章では, 一入力系に対する固定終端LQ型最適レギ、ュレータ について述べる. まず;終端状態固定条件を満足する入力(デ、ッドビート入力) の一般形が満たすべき一入力デッドビート原理を導く . 次に, 一 入力デッド

ビート原理を用いた正則型LQ最適制御問題の解法を示す. この手法は, そ のまま最小エネルギー制御問題にも適用できる. 特異型LQ最適制御問題に 対しては, 特異型二次形式評価における特異性の解消を行った後, 同じ手法 により最適制御が求まる. さらに, 固定終端の場合にはLQ型最適制御が統 一的に表現できることを示す.

第3章では, 多入力系に対する固定終端LQ型最適レギュレータについて 述べる. まず, 多入力系のデ、ッドビート原理を導出する. 次に, 多入力デッド

ビート原理を用いた正則型LQ最適制御問題の解法を示す. 最小エネルギー 制御問題も同じ手法により 最適制御を求めることができる. さらに, 制御対 象の可到達指数の族がすべて相等しい場合の最小エネルギー制御問題に対し ては, Luenbergerの可到達正準形31)に変換することな く, 可到達性グラミア ンを用いたオーブンループ形式の最適制御34)からフィード、バック形式の最適 制御を直接導く ことができることを示す.

メカトロニクスにおいては, 出力を高速高精度で目標値に追従させたい場 合が多く, 出力を有限時間で目標値に一致させるデ、ッドビートサーボ系は有 効な 制御系の一つである. デッドビートサーボ系に対しては, これまでに多 く の研究がなされてきたが38)~40), それらは 特定の構造の線形系を対象とし たり, 制御装置の構造をあらかじめ定めた上でのパラメータ最適化であり, こ れらの制限を加えない場合の最適制御は求められていない .

第4章では, 1型 サーボ系の 固定終端LQ型最適制御について述べる. 前

(15)

述のように, 1型サーボ系の設計問題はレギ、ュレータの設計問題に帰着させ ることができる. ここでは, 1型サーボ系に対し, 正則型LQ最適制御と偏 差入力エネルギーの最小化について述べる.

一般の加法性評価に対しでも, 固定終端最適レギュレータ問題は自由終端 最適レギ、ュレータ問題より も解くのが難しいとされているが, 第2章と第3 章の正則型LQ最適制御問題と同様に, デ、ッドビート原理を用いることによ り, 固定終端最適レギュレータ問題から新しい自由終端最適レギュレータ問題 を誘導することができる.

第5章では, 一般の加法性評価に対する固定終端レギュレータの基本構造 を明らかにし, 新しい最適性の条件を求める. さらに, その有効性を明らか にするために, 正則型LQ最適制御問題の新解法を示す.

狭義のデ、ッドビート制御に対しては, すでにその最短整定時間や構造を特 定したデ、ッドビートレギ、ュレータが求められている11),12),25),41),42) さらに,

Sebakhyら15)はKleinら43)の方法を用いて, 試行錯誤的にオーバーシュート を小さくしている. しかし, この方法でも, Sebakhyら15)が(注)と(例題) において指摘しているように, デッドビートレギュレータの一般的に可能なす べての構造を示すことはできない. また, 設計の自由度を陽に示していない ので, 最適化も困難である. Fahmyら44)は, デッドビート制御系の一般形を 求めようと試みているが, 最大可到達指数のみを用いているため, 除外すべ きものまで一般形に含めており, その試みは失敗している. さらに, そこで はシステム行列の正則性が仮定されており, デ、ィジタル制御において重要な 計算遅れがある場合には適用できないなどの制限もある. このように, デッ ドビートレギ、ュレータのすべての可能な構造を陽に示す一般形や最適設計法 は未解決である. ところで, Sebakhyら45)は, 2入力3状態の簡単な数値例 において, 最短時間デ、ッドビートレギ、ュレータが互いに独立な設計ノ〈ラメー タの線形結合で表現されることを示した. この表現形式は非常に簡潔である ので, これを正準形と呼ぶことにする. しかし, 一般的に正準形が存在する かどうかは, Sebakhyら45)が指摘しているように未解決である.

第6章では, デ、ッドビートレギュレータの設計法について述べる. まず, デッ ドビートレギ、ュレータの一般形を求め, その一般的な構造と一般的な整定時 間を明らかにし設計の自由度を陽に示す. また, 一般形を用いて, オーバー

(16)

シュートを最小にする最適設計法を示す. 次に, 設計パラメータが線形で独 立となる正準形について述べる. さらに, デ、ィジタル制御で重要な計算遅れ がある場合に対する設計法を求める.

第7章では, 1型デ、ッドビートサーボ系の設計法を示す. まず, 拡大系の偏 差系において, 1型デ、ッドビートサーボ系の一般形を求める. さらに, 偏差 系の可到達指数の族や最短整定時間についての考察を行い, 入力数と出力数 の関係による最短整定時間の相違を明らかにする.

デッドビートオブザーバは, 有限時間で推定誤差を零に整定できるため,

ディジタル制御系の重要な構成要素となり 得る. これまでの多くの研究によ り, その最短整定時間や構造を特定した場合の試行錯誤的設計法が求められ ている11),12) しかし, デ、ッドビートオブザーバのすべての可能な構造を陽に 示す一般形や最適設計法は未解決である. ところで, 通常のオブザーバは差 分方程式を用いて表現されており, このような表現は再帰形表現である. そ こで, 再帰形表現を用いたデ、ッドビートオブザーバを再帰形デッドビートオ ブザーバと呼ぶことにする. デ、ッドビートオブザーバの固有値はすべて零で あるから, 非再帰形表現も可能である32) デ、ィジタル制御系においてはデー タを保持することは容易であり, 利用可能な過去や現在の入出力データを用 いて有限時間で状態を再生する機構がいくつか提案されている46),47) しか し多入力多出力系に対し, 整定時聞が最短以外の場合も含む非再帰形デッ ドビートオブザーバの一般形は求められていない .

第8章では, デッドビートオブザーバの設計法について述べる. まず, その 一般形や正準形を求め, 最適設計法を示す. 次に, 非再帰形デ、ッドビートオブ ザーバの一般形を, 計算遅れがない場合, 1サンプルの計算遅れ 48),49)があ る場合, さらに出力多重サンプル値系50)の一種である2 -Delayシステム51) に対して求める.

最後に, 第9章では, 本研究で得られた結果をまとめ, 今後の課題につい てふれる.

(17)

1.2表記上の注意

1 )本論文で取り扱う 行列とベクトルは, それぞれ実行列と実ベクトル とする.

2) n次元の制御対象

x(t + 1) = Ax(t) + Bu(t)

において, 任意の状態Yに対しである非負の整数kが存在し, x(O) = 0な る初期状態を x(k)=どに移す入力u(t) (t=O,...,k-l)が存在するとき, こ の制御対象は可到達であるという. 制御対象が可到達であるための必要十 分条件は,

ra此[BAB ... An-1B]=n

となることである. 可到達性とよく似た概念に可制御性があるが, 可制御 性は任意の初期状態を有限の時間で零状態に移すような入力列が存在す るかどう かという 概念である. 可到達であれば可制御である. また, Aが 正則ならば, 可到達性と可制御性の条件は一致する. 本論文中に出てくる I Luenbergerの可到達正準形」という言葉は一般には用いられていないが,

これはI L uen bergerの可制御正準形J 31)の定義において「可制御」を「可 到達」に読み変えたものである. また,I可到達指数の族」は「広義の可到 達指数」とも呼ばれており, 原語はreachability indicesである. さらに,I最 大可到達指数」は「狭義の可到達指数J, あるいは「クロネッカ指数Jとも 呼ばれており, 原語はreαchability indexである.

3)任意のnx 1ベクトル xに対し, x'Px三0が成り立っとき, ηxn行 列Pは半正定行列であるという. 本論文において行列Pが半正定行列であ るという とき, Pが零行列の場合は除くとする.

4)記号は原則として各章で独立とし, 各章で最初に出てきたときに定 義する. ただし, 以下の記号は本論文で最初に出てきたときに定義し, 以

後本論文で共通に用いるとする.

(18)

1. 記号" "は, 行列あるいはベクトルの転置を表わす.

2. Inは, n X n 単位行列とする.

(19)

第2章

一入力系に対する固定終端LQ型最適レギュレータ

2. 1 まえがき

本章では, 一入力線形定常デ、ィジタル制御系に対し , 終端状態固定条件の もとで二次形式評価を最小にする固定終端LQ型最適レギュレータ問題につ いて述べる. この問題に対しては, これまでは最小エネルギー制御問題に対 するオーブンループ形式の最適制御が 求められているだけである.

第2.2節では, 問題の設定 を行う. 第2.3節では,終端状態固定条件を満足 するデ、ッドビート入力の一般形が満たすべき一入力デッドビート原理を求める.

第2.4節では,正則型LQ最適制御問題の解法を示す. まず, 一入力デッドビー ト原理を用いて,終端状態固定問題から新し い終端状態が自由な問題を誘導す る. 次に, この誘導さ れたLQ最適制御問題を解いてフィード、バック形式の最 適制御を求める. 第2.5節では, 最小エネルギー制御問題の解法を示す. まず,

可到達性グラミアン を用いたオープンルーフ。形式の最適制御について述べる.

次に, 第2.4節と同様にして求められるフィード、バック形式の最適制御を示す.

さらに, 最小エネルギー制御の場合はその陽なる解(非再帰形表現)が存在す ることを明らかにする. 第2.6節では, 特異型LQ最適制御問題の解法を示 す. まず, 特異型二次形式評価における特異性の解消について述べる. これに よって, 特異型LQ最適制御を求めることができる. 次に, 特異型LQ最適制 御と正則型LQ最適制御との関係を明らかにする. さらに, 自由終端の場合 と無限制御時間の場合についても考察を行う. 最後に, 前節までの結果をもと に, 第2. 7節において, 固定終端LQ型最適レギュレータの統一的表現を示す.

2. 2 問題の設定

制御対象と して, 次の可到達な一入力線形定常デ、ィジタル制御系を考える.

x(t + 1) = Ax(t) + bu(t) (2.1 )

(20)

ここで,

x(t) ;ηx 1状態ベクトル

u(t) ;スカラ入力

A ;η×η定数行列

b ; n x 1定数ベクトル t ,零または正の整数

とする. なお, Aの正則性は仮定しない.

高精度レギ、ュレータでは, 有限の時間で、すべての状態が零になることが要 求される. そこで, 制御対象式(2.1)に対し終端状態固定条件

x(r) = 0 (2.2)

を付加し, この条件のもとで二次形式評価

め)=

i z

[x(t)1剣山U(t)2] (2.3)

を最小にする固定終端LQ型最適レギュレータ問題を考える. ここで, 記号

" "はベクトルまたは行列の転置を表わし,

とする.

Q ; n xη零行列または半正定対称行列

r :零または正の実数

2. 3 一入力デッドビート原理

この固定終端LQ型最適レギュレータ問題にラグランジュの未定乗数法を 直接適用すると, r > 0のとき, 最適制御は両端に制約を持つ二点境界値問題 の解となる. しかしながら, この二点境界値問題を解いてフィード、バック形 式の一般解を求めることは難しいとされている5) そこで, 式(2.2)の終端状 態固定条件を満足する入力の一般形を求めることにより, 終端状態固定条件 を取り除くことを考える. なお, 狭義のデ、ッドビート制御問題11),12)より, 最 短整定時間はηである. よって, 終端時刻Tは

ァ>η (2.4)

(21)

なる正の整数でなければならない.

まず, 最短時間ァ=nの場合について述べる. 式(2.1)より, 状態x(η)は r u(n - 1)

1

x(n) =Anx(O)+[bAb ... An-1b]

I

:

I

(2.5)

l

U(O)

J

となる. そこで, 可到達性の条件と終端状態固定条件x(n)= 0より, 最短整 定時間nのときのオープンループ形式のデ、ッドビート入力は, 一意的に

の-

1)

: 1=一[bAb ... An-1b]-lAnx(0) (2.6)

等価であることが知られている52)

u(t) = �x(t) (2.7)

kd = -[ 0・・・o 1 ][ b Ab ... A n-l b ]-1 A n (2.8)

ここで, �を狭義のデッドビートゲインと呼ぶことにする. このとき, 式(2.1) と式(2.7)より

となるので,

x(t + 1) = (A + b�)x(t)

x(t) = (A + bkd)tX(O) u(t) = kd(A + bkd)tX(O)

を得る. よって, r = nのときの二次形式評価の値J(n)は,

刈抑刷η吋)

=

: E [μ何凶州阿X刈吋刷刷(れω仰tけげ判)'川,可'Qx(t取似X刈均(いt ) +打刊叫ru叫州u叫(

(2.9)

(2.10) (2.11)

=

;

ト例Wx刷

(ρ2叫

W= 玄{(A+ b�)t}'(Q + rkd'kd)(A + bl叫t (2.13) となる. 明らかに, Wはηxn半正定対称行列である.t=O

式(2.4)より, 整定時間ァ は

ァ=n + q (qは零または正の整数 ) (2.14)

(22)

とおける.このとき, デッドビート入力は次の[一入力デッドビート原理]を 満足しなければならない

[一入力デッドビート原理]

任意の初期状態x(O)に対し, 終端状態固定 条件

x(n+q) = 0 (2.15)

噌i ny

一 + q

nu

n

G4

l,、

t

μい 杉V

μい λり

般 )

一 意

的 w m

任レ吋

J {J l

\

1f=

'

)

たり一

ら :

申: . hta ‘ lF』 J ,, 、、I/

。,U

1

~バ

耳な

問 湘

制 叫戸 沼田v h コ 可 FEE-』

(2.16)

I u(η+ q - 1)

1

x(n + q) = An+qx(O) + [b Ab ... An-1b ... An+q-1b]

I

:

I

l

U(O)

J

(2.17)

となる.ここで, 簡単のため

Zl = [b Ab ... Anー1b]

1

Z2 = [Aル・・・An+q-lb]

J

(2.18)

(2.19)

斗JF ヴt ぅ“

川|||」

例 ・:

Q4 u U円

ralll--L 叫勺

=

u 式

件条定

態状

山而

ノt、

ム) 、‘,,/ハU

x

n-

+ n A 一一

司i qa

u u

qa z 唱A

Z

(2.20) となる.このとき, 可到達性の条件より, 次の式(2.21)を満足する[Zl Z2 ]の 右側逆行列[ Zl Z2 ]ーが必ず存在する. なお, InはηXn単位行列とする.

[ Zl Z2 ][ Zl Z2 ]

= In (2.21 )

(23)

したがって, 式(2.20)のオープンループ形式の一般解は,

[ �� 1 1

= = -[ Zl Z2 -[ Zl Z2 r 1一円山いA n+qx(O) + {In+q -- [ [ Zl Z2 Zl Z2 ]-[山]}n Zl Z2 ]}

[出 I � � I

I u2 I (2.22)

となる. ここで, UlとむはそれぞれUl,U2 と同一次元の任意ベクトルであ る. [Zl Z2 ]ーは一意的には定まらないが, 可到達性の条件より Zlは正則で あるから,

[Zl Z2

叶 引

(2.23)

を用いることもできる. そこで, 式(2.23)を式(2.22)に代入すると, 一般解は

可BTB''EBB-ESEEd官A

98

-u-u

rEEEEEEEEEEEEE』 、弘J 9a qμ 唱i ワ山 1IBEBEE--」

一10Z

FSEESEEESEEBEE-- nuz

+ n

YEA rdt

+

、、.,,,nu ,,aE‘、

x

nwa

+ n A

一10Z

一一 、EBEE-EEEEEEEEd

唱i qha

u u

raEEE'''EEBB-E』

[

-Zl-I{An+

0)+恥}

1

(2.24)

となる. よって, U2, すなわち, u(0),... ,u(q-1)は任意となる.さらに, む= U2 であるから, Aqx(O) + [ b Ab ... Aq-1b ]U2は, 任意の入力 u(O),... ,u(q - 1) が加わったときの状態x(q) に等しい. すなわち,

Aqx(O) + [ b Ab ... Aq-1b ]U2 = x(q) (2.25)

より, Ulは

Ul = -Zl-1Anx(q) (2.26)

となる. 式(2.26)は, x(q)を初期状態とみなしたときのオープンループ形式の デ、ッドビート入力である. したがって, フィードバック形式で書けば式(2.7),

(2.8)となる. [証明終]

なお, 式(2.2 1)を満足する [Zl Z2 ]-をどのように選んでも(表現形式は異 なっても) , 式(2.22)は一般解となる. しかし後の展開を考えると, 式(2.23) のように選ぶのが最も効果的である.また, [一入力デ、ッドビート原理]の証 明法には, 多入力系の場合と同様に入力の変換を用いる方法もあるが, ここ では省略する(第3.3節参照) .

すなわち, n+qまでに状態x(t)を零に整定させるデッドビート入力の一般 形は, 最初のqステップは任意の入力, 以後のηステップは狭義のデ、ッドビー トゲインkdによる状態フィードバックとなる. なお, [一入力デ、ッドビート原

(24)

理]はη+qまでに状態x(t)が零に整定する一般的なデッドビート入力の等価 表現であり,

x(t)手0(t=Of-\η+q -1)

1

x(n + q) = 0

J

を意味しない. すなわち,

(2.27)

x(t) = 0 ( 0三tn + q -1) (2.28) なるtが存在しでもよい.

2.4

正則型LQ最適制御

ここでは, 終端状態固定条件式(2.2)のもとで, 正則型二次形式評価

勺4 aTb u rl

+

x

nvv

x

ベヤμ日

1一2

一一 T

N

7Fυ

(2.29)

を最小にする正則型LQ最適制御問題を考える. ここで, Qはnxn半正定 対称行列とし, rは正の実数とする.

2.4.1

最適制御

まず" [一入力デッドビート原理]を用いて, この問題を新しい終端状態が 自由な問題に変換する. [一入力デッドビート原理]と評価の加法性より, 式 (2.13)を用いると式(2.29)は

JN(n + q) =

j器2 h何同同(収肋仰tの)

一 j z [怜削(れ例tけげ)'可'Qx(t似似X刈吋(れt) +打叩叫ru叫叫u叫吋刷川(れ肋附tけげ卯)2

となる. すなわち, 固定終端正則型LQ最適制御問題は, 初期状態がx(O),

終端状態x(q) は自由の境界条件のもとで, 式(2.30)を最小にする問題に変換 された. そこで, この新しい自由終端問題にラグランジュの未定乗数法を適 用する.

(25)

まず, q個の n x 1未定乗数ベクトル入(t)(t=l,"',q)を用いると, ラグラ ンジュ関数Lは

L=JN(n+q)+乞入(t+ l)'[Ax(t) + bu(t) - x(t + 1)] (2.31)

t=O

となる. Lをx(t)およびu(t)で偏微分して零とおくと,

入(t)= Qx(t) + A'入(t+ 1) (t = 1,"', q -

1)

(2.32)

u(t)=-lbス(t+ 1)

(t

= 0, .. . ,q - 1) (2.33) を得る. さら に, Lを終端状態x(q)で偏微分して零とおくと, 終端条件

入(q)= Wx(q) (2.34)

を得る. 式(2.33)より, 式(2.1)は

x(t + 1) = Ax(t)一

;

仙(t+ 1) (2.35)

となる. よって, 式(2.32),(2.35)より新しい終端状態x(q)が自由なLQ最適制 御問題は, 境界条件x(O)と入(q)のもとで

[�

bザ/E1IX(t+

I I

/.

1

.,

I

= I A

I

_ _ 01

I I 1

x(t)_ "

| I

(2.36)

o A'

J

l入(t+ 1)

J l

-Q In

J

l入(t)

J

を解く二点境界値問題に変換される. そこで, n xη対称行列P(t)を用いて,

リカッチ変換

入(t)= P(t)x(t) を行う. 式(2.37)を式(2.35)に代入すると

{In+

;

bVP(t+1)}x(t+1)=AX(t) を得る. ここで, P(t + 1)が半正定と仮定すると,

|い

;

bbIP(t+1)|=|1+

川1州

(2.37)

(2.38)

であるから, In + bb'P(t + l)/rは正則である. このとき, その逆行列 は,

-1 T bb'P(t + 1)

{In +

bb'P(t + 1)} -1 = In一 r + b'P(t + l)b (2.40)

(26)

となる.したがって, 式(2.38)より

X(t+1)={L+

;

bW(t+1)}(t)

bb'P(t + 1)

}Ax(t) n

r + b'P(t + l)b を得る. さらに, 式(2.32),(2.37), (2.41)より

' T"tIll ... \ .. A'P(t + l)bb'P(t + l)A

{P(t) - Q - A'P(t + l)A + �-

� � V " ::�/��,

\:\� .LJ..a. }X(t) = 0 (2.42)

r + b'P(t + l)b

を得る. 式(2.42)が任意のx(t)に対して成立するためには, P(t)はリカッチ 方程式

(2.41)

A'P(t + l)bb'P(t + l)A P(t) = Q + A'P(t + l)A -

r + b'P(t + l)b

を満足しなければならない. 式(2.34)と式(2.37)より,終端条件は P(q) = w

(2.43)

(2.44)

となる. wは半正定であるから, P(t + 1) も半正定となる.

よって, 式(2.33),(2.37) ,(2.41)より, 最適入力u*(t)(t = 0, .・・,q -1)は,

、‘l/ 4L /11

* u bb'P(t + 1)

= 一一b'P(t+ l){In -

_ �:/�n� v4

" :J\L}Ax(t)

r + b'P(t + 1 、 FP(t + l)A

x(t)

r + b'P(t + l)b (2.45)

となる.

さらに, リカッチ方程式の一般的性質より, JN(η+ q)の最小値JIv(n+ q)は,

別+q) =

(阿川) (2.46)

となる.

以上をまとめると, 次の定理を得る.

[定理2. 1 ] (正則型LQ最適制御) 任意の初期状態x(O)に対し,終端 状態固定条件

x(n + q) = 0

のもとで,正則型二次形式評価

「,s ,TLV U VA

+

X Q

X

ヤヤ包

n

-i一月ソ“

一一

n吋・a

+ n N

yd

(2.47)

(27)

を最小にする最適入力は

u*(t) = k:\r(n + q, t)x(t)

( b'P(t+1)A 1, nぃ

k:\r(n + q, t) =

-r +b'P(t+1)b い = U,・・・ , q- 1)

l � (t = q,.・\η+q -1)

(2.48) (2.49)

となる. ここで, kdは式 (2.8)より求まる 狭義のテ守ッドビートゲインであり,

P(t)はリカッチ方程式

A'P(t + l)b b'P(t + l)A

P(t) = Q + A'P(t + l)A _ ..... �

� V ,1 :,';:,:

\:\�

-'-,.... (2.50)

r + b' P (t + l)b

P(q) =

{(A + b�)t}'(Q + rkd'kd)(A + bkd)t (2.5 1) t=O

より求まる. また, 評価の最小値は,

JL(n+q)=

j

x(OYP(0)刷 (2.52)

となる. さらに, 次の性質が成立する.

( 1)最適入力u*(t)は, t = 0,.・. , q -1ではリカッチ方程式より求まる時変 ゲインの状態フィードバック, t = q,.・・?η+q-1では狭義のデ、ッドビートゲイ

ンによる一定 ゲインの状態フィード、バック となる.

( 2) 最適フィード、バックゲインは, 制御対象の初期状態x(O)に依存しない.

(3)時変ゲインkÑ(n + q + 1, t + 1)とkÑ(η+q, t)の聞には次の関係が成り

立つ.

k� (n + q + 1, t + 1) = k� (n + q, t) (2.53)

( 4)整定時間がn+qのときのふ(n+ q)はJN(η+q + 1)の特別な場合であ るから, JN(n+q)はJÑ(n+q + 1)より小さくなる ことはない. すなわち,

J�(n + q)どJ�(n+ q + 1) (2.54)

となる.

(28)

2. 4.2 例題

-EAnHU

--nu X 3

1111111J

kd 1・

0RUqJEZIPO ρ0

1J40 J司JnUQdi、ノハUnU

御 u o

時=

達 LJ

E33 U

4 d

pOヴt-10

8 FDny唱i・4'ーハU00 あ u u

で102

rill-

-一一一nA

て'しム)題伺rl

に対する固定終端正則型LQ最適制御問題を考える. 重み行列は, それぞれ

Q=

[

1

;

: !

?r=1

とする.

このとき, 狭義のデ、ッドビートゲインkdは kd = -[ 110 14.4]

となる. また, q = 5のときの時変ゲインは,

k�(7, 0) =一[13.5 4.14]

k;.r(7, 1)

=

-[ 16.9 4.85]

k�(7, 2) =一[22.8 5.88]

k�(7, 3) =一[33.4 7.43]

k;.r(7,4) = -[ 55.3 9.90]

となる. 明らかに, 式(2.53)よりq = 1,...,4のときの時変ゲインもq=5のと きの時変ゲインの一部として求まる.

次に, q = 0,1,5の場合に対し, u(t)とx(t)の第2成分X2(t)を求め, これら を図2. 1と図2. 2に示す. さらに, JÑ(n + q)の値を表2.1に示す.

これらより, 整定時間を延ばすにしたがって, 評価の最小値, 入力振幅, オー ノくーシュートが減少していることが分かる.

表2. 1 評価の最小値JÑ(η+q)

q

JÑ(n + q)

(29)

u(t) 100

q=O

q =1 ----e q=5 --e 50

10 t

-50

-100

図2. 1 最適入力u*(t)

x2(t) 5 10

-5 t \・ q=O

q=l

q=5 e

-10

図2. 2 X2(t)の応答

(30)

2.5 最小エネルギー制御

ここでは, 終端状態固定条件式(2.2)のもとで, 入力エネルギー

ゐ(ア)=

j g

u(t)2

を最小にする最小エネルギー制御問題を考える.

(2.55)

2.5.1 最適制御のオープンループ表現

最小エネルギー制御問題に対しては, 可到達性グラミアンを用いたオープ ンループ形式の最適制御が既に求められている34)

可到達性の定義より, 可到達性グラミアン

G =玄AT-i-1bb '(AT-iー1)'

,=0

=乞Atbb'(A')'

,=0

= [b Ab ... ATー1b ][ b Ab ... AT-1 b J' (2.56)

は正則である5)次に, 式(2. 2 0)は

Z = [Zl Z2] = [ b Ab ... AT-1b] (2.57)

「EEEEEEEEEEEEEEEEEEEE」、lE/ 唱EA

- -

:川W

T u

u

「E'aEEEEEEEEEEEEEEE'z』 一一 「EEEEEEEEEEEEEEEEE」

唱A qa u u

FEEEEEEEEE『EEBEEEEL 一一

U

(2.58)

とおくと,

ZU = -ATx(O) となる.このとき, 可到達性の条件より,

(2.59)

Z↑= Z'(ZZ')-l = Z'G-1 (2.6 0)

なるZの最短右側逆行列Z↑を用いると, Uは

U = -ZtATx(O) = -Z'G-1 ATx(0) (2.61 ) となる.よって, オープンループ形式の最小エネルギーは,

J;(7") = � U' U = �x(O)'(Z↑AT)'(Z↑AT)X(O)

2 2

(31)

=

j

削川f町刈0) (2.62)

となる. すなわち, 可到達性グラミアンを用いたオープンループ形式の最適 入力ぜい)と最小エネルギーJj(ァ)は,

となる34)

ぜい)= -b'(ATート1)'G-1ATx(O)

J;( ) =

:トX刈刷削(仰例0的町)'句(

AT)'匂Gσ一-lATx例

2.5.2 最適制御のフィードパック表現-1

(2.63) (2.64)

最小エネルギー制御問題に対しでも, 前節と同様に[一入力デッドビート 原理]を用いる手法により, フィード、バック形式の最適制御を求めることがで きる. すなわち, 正則型LQ最適制御問題において,

(2.65)

とおけばよい. このようにおいても, 前節と全く同様に議論できるので, 結 果のみを示すと, 次の定理を得る.

[定理2. 2. 1] (最小エネルギー制御) 任意の初期状態x(O)に対し, 終 端状態固定条件

x(n+q) = 0 のもとで, 入力エネルギー

1 n+q-l J1 (n+q) ="2

時)2

を最小にする最適入力は

ピ(t)= k� (n + q, t)X(t)

( b'P(t+l)A /, ^ぃ

k� (n + q, t) =

- 1 + b' P ( t + 1 ) b \"l = U, .・・,q- 1)

l kd (t = q,.・・,n+q-l)

(2.66)

(2.67) (2.68)

(32)

となる. ここで, kdは式(2.8)より求まる狭義のデ、ッドビートゲインであり,

P(t)は, リカッチ方程式

A'P(t + l)bb'P(t + l)A P(t) = A'P(t + l)A -

1 + b'P(t + l)b P(q) =乞{(A+ bkc.i)t}'kc.i'kd(A + bl叫t

t=O

(2.69) (2.70) より求まる. また, このときの最小エネルギーは,

仰+q)=

;

x附仰) (2.71)

となる. •

なお, 式(2.6)より, リカッチ方程式の終端条件式(2.70)は

P(q) = (An)'{[ b Ab.. .An-1b ]-1}'[ b Ab.. . An-1b ]-lAn (2.72)

とも表わされる. 明らかに, 式(2.70)と式(2.72)は等価である. さらに, [定理

2. 1 ]と同様な性質が成立する.

2.5.3 最適制御のフィードパック表現-2

式(2.69),(2.70)のリカッチ方程式はP(t)の差分方程式による再帰形表現であ るが, その非再帰形表現も可能である. まず,会tを

Zt = [ b Ab .. . A n+qーtーlb ] (2.73)

とおくと, t = 0,'…,qのとき, 可到達性の条件よりZtZ�は正則である. そ こで,

P(t) = (A n+q-t)'(ZtZ�)-l A n+q-t (2.74) とおくと, P(t)は半正定対称行列となる. さらに,

Zt+l = [ b Ab... A n+q-t-2b] (2.75)

Zt = [Zt+l A n+q-t-l b ] (2.76)

P(t + 1) = (A n+q-t-l )'(Z川Z�+l)一lAn+qーt-l (2.77)

(33)

であるから, ZtZ� の漸化式は

合t念;

- 111411111」

円 IU川村 h

AZMAMA

UU LU rill--L I 川b r

一+4vn

r A 叶+AH HAZ A

Z

い門「1LAmb

一 一

(2.78)

となる. これらの式を, 式(2.69)のリカッチ方程式の両辺に代入すると,

左辺 = (A n+q-t)'(ZtZ�)-l A n+q-t (2.79)

右辺 A'P(t + l)bb'P(t + l)A

= A'P(t + l)A -

1 + b'P(t + l)b

= (An+q-t)'{(会川会;+1)-1

(Zt+1Z�+1)一1A n+q-t-1 bb'(A n+q-t-1 )'(Zt+1Z�+1)-11An+q-t 1 + b'(An+qーtー1)'(Z削Z�+l)一1A n+q-t-l b J

= (An+q-t)'{(Z削Z�+l) + A n+q-tー1bb'(An+q-t-l )' }一1An+qーt

ー(An+q-t)'(ZtZ�)一1A n+q-t (2.80)

となる. すなわち,式(2.79)と式(2.80)より式(2.74)のP(t)は式(2.69)のリカッ チ方程式を満足する. さらに,

P(q) = (An)'(ZqZ�)一lAn

= (An)'{[ b Ab... Anーlb ]-l}'[ b Ab.. . An-1b ]-lAn

=

L

{(A + bkdr}'�' kd(A + bkd)t (2.81) t=O

となり,式(2.74)のP(q)は式(2.70)満足するから,解の存在が証明されるとと もに, 解を陽に求めることができた. なお, 式(2.74)を式(2.68)に代入してま とめると, t = 0, . . . ,q

-

1の最適フィードバックゲインは,

k�(n + qt) - -l+ b'P(t+l)b b'P(t+l)A

= -b'(An+q-t-l)'(ZtZ�)-l An+qーt (2.82)

と表わされる. さらに, 狭義のデ、ッドビートゲイン�は,(ZqZ�)を用いると,

次のように表現できる(第3章[定理3.3.2]参照) .

kd = -b'(A n-l)句会q念;)-1An (2.83)

(34)

よって, 簡単のため

G(t) = Zt含;

= [b Ab. ..An+q-t-1b][ b Ab.. . An+q-t-1b

J'

(2.84)

とおくと, 次の定理を得る.

[定理2.2.2J (最小エネルギー制御) [定理2. 2. 1

]において, 最小 エネルギー制御の最適フィード、バックゲインは, 次のように表わすことがで きる.

( _b'(An+q-t-l)'G(t)-lAn+q-t (t = 0,..・,q-1)

k�

(n + q, t) =

< l

-b'(An-l)'G(q)-lAn (t = q,.・・, n+q-1) (2.85)

なお, 多入力形の場合と同様にして, 可到達性グラミアンを用いたオープ ンループ形式の最適制御から直接フィードバック形式の最適制御を導くこと

もできる(3.5. 3参照) .

ところで, 式(2.57)と式(2.73)より

Zo = Z (2.86)

となるので, 式(2.74)より式(2.71)の最小エネルギーJ;(ァ)は

々ヤ)=

j

x(仰T)'(ZOZ�)-lATx(O)

-

j

x(0)f川百山 (2.87)

となる. よって, オープンループ形式の最小エネルギ一式(2.62)は, 式(2.71) の最小エネルギーと一致する.

2.5.4 例題

例題として, = n 3である可到達な制御対象53)

可litliai---ltlJ噌,i

。00

「EIEEEEEEEEEEEEEEL 一一 、、1/nU ,,a,‘、 X 可11111E11111111」nUハU11 FEEEEEEEEEEEBEES-aL 一一 'D 『1111111111titi」噌EA FO qJ -』 v h id a し nu nunU

nu nU 噌inynunU tinunu r's''E'EESEEE』E』EL 一一

A

(35)

に対する最小エネルギー制御問題を考える.

このとき, 狭義のデッドビートゲイン kdは

�=一[94.9 22.0 1. 90]

となる. さらに, q = 5 のときの時変ゲインは,

k�(8, 0) =一[10.2 4.81

k�(8,1) =一[13.6 5.84 0.571]

k�(8, 2) = -[19.0 7.31

k�(8, 3) = -[28.5 9.59 0.902]

k�(8, 4) = -[47.5 13.6

となる. また, 最小エネルギーJj(n+q) の値を表2.2に示す.

表2. 2

最小エネルギーJj(n+ q)

2.6

特異型LQ最適制御

ここでは, 終端状態固定条件式(2.2) のもとで, 特異型二次形式評価

ゐ川肋州(ヤ付作T寸)ト= : 玄 X仰刈吋刷tけ) ρ

を最小にする特異型LQ最適制御問題を考える. ここで, 重み行列Qはnxη 半正定対称行列とする.

2.6.1

特異性の解消

特異型LQ最適制御問題に対して は, 自由終端の場合でさえ も一般的な 最 適制御は求められていない. この問題に直接ラグランジュの未定乗数法を適

(36)

用しでも, 入力に関する条件が得られないので特異制御29)となり, このま までは解を求めることは できないためである. しかし, 特異型二次形式評価 式(2.88)を変形することにより, 特異型LQ最適制御問題を通常の正則型L Q最適制御問題に変換することができる. なお, そのための条件を正則条件 と呼ぶことにする.

まず, 式(2.1)を用いて, 式(2.88)を次のように変形する.

Js(ァ) -

iz

x(判刈)

=

;

x(0)FQX(0)+

;z

x(t+胸中1)

=

j

削QX(0)+

;z

[X(判x(t)+以(t)'SlU(t

ここで\ Qi = (A')'QAI

Si = (A')'QA'-lb fi = b'(A'-1)'QAì-1b

(n x n)

1

(n x 1)

}

(スカラ)

J

(2.90)

と する. このとき,

fl = b'Qb > 0 (2.91)

ならば,

ん作

となり, 特異性は解消される. なお, Qが正定行列のときは, 式(2.91)は自動 的に満足される.

もし, fl = 0ならば, 式(2.89)は

,7b

x Q

X

ベヤμ同 1A一つ“

+

nu

x Q

nu

x -一2

一一 T

s

ytu

(2.93)

となるので, 特異性は解消されない. そこで, この場合は, b'A'QAb> 0か げA'QAb = 0かにより, 前と 同様の議論を行えば よい. もし, b'A'QAb = 0 ならば, さらに同様の手順を繰り返す.

と ころで, 可到達性 の条件 より可到達性 行列 [b Ab ... Anーlb]

(37)

は正則となるので,

p = rnin {j; QAJーlbヂO,QAJ-2b = ・・・=Qb = O} (2.94)

を満足する正の整数p(1三p三n ) が必ず存在し,

rp = b'(APーl)'QAPーlb > 0 (2.95) となる. このとき, 式(2.88)は

ゐ(市

(0)F(

E

1Qi)X(0)+

j Y

lx(t)FQp X(t)+2x(t)FSP11(t)+引(t)2] (2.96) となる. すなわち,特異型LQ最適制御問題は可到達性の条件のもとで特異 性が解消され, 相乗項を含む通常の正則型LQ最適制御問題に変換すること ができる. これは, デ、ィジタル制御系固有の性質によるものである.

なお,この方法は, 行列Aが正則という条件のもとでKucera 36)が一入力 一出力系の無限制御時間出力レギュレーション問題に対して適用した手法を 一般化したものである.

2.6.2 最適制御

式(2.96)の評価は

ゐ(7) =

( 0)f(

h

i)刷+

j

(

E

ht) (2.97)

とおいたとき,

ht =

J

�(t),Q川)+川)'Spu(t)+ fpU(t)2 (t = 0, . .. , 7 - 1ーの

、 (2.98)

l O (t =7-p,. ・・,7ー1)

という特別な形をしている. すなわち, t = 7 -p, . . . , 7 - 1の入力u(t)は式 (2.96)の評価には含まれないが,終端状態固定条件式(2.2)が存在し1三p三n であるから, この部分の最適入力は自動的に決定することができる.

[一入力デッドビート原理]より,7=n+qとおくと, t = q,.・・ ,n+q- 1の とき,

x(t) = (A + bkd)t-q x(q) u(t) = kd(A + bkd)t-q x(q)

(2.99) (2.100)

(38)

となるので,

n+q-l-p

乞[x(t)'Qpx(t) + 2x(t)'S川t) + r川t)2]= x(q)'Ï\x(q) (2.101) t=q

n+q-l-p

pq= 乞 {(A + bkd)t-q}'(Qp + 2Spkd + rpkd'kã)(A + bkd)t-q (2.102) t=q

を得る. なお, 総和記号の上限が下限よりも小さいときは, その和を零とお き, 以後同様とする. ここで, 式(2.90)より

Qp = A'Qp-lA 1 Sp = A'Qpーlb

}

rp = b'Qp-l b

J

(2.103)

であるから,

Qp + 2Spkd + rpkã'kd = (A + bkd)'Qp-l(A + bkd) (2.104)

を得, 式(2.102)は

pq=乞{(A + bkdr}'Qp-l(A + bkã)t (2.105) t=l

と表わすこともできる. よって, 評価の加法性より式(2.96)は

nu

x Q

yd s

n +

nu,a 一一

-一2 x

nu ピL同

+

;老z μ何凶州附(い例仰tけげ拘)'川F司Q仏戸川州X刈吋(れωtけ)

+

2x制川附(れω附tけ)

となり弘, 固定終端最適制御問題が, 最短時間デッドビート制御と新しい終端 状態x(q) が自由な自由終端最適制御問題に変換される.

この相乗項を含む最適制御問題は, 相乗項を含まない通常の最適制御問題 に変換されることが知られており3), 2. 4節と同様にして解を求めることが できる. このとき, 最適入力は 次のようになる.

( b'P(t+1)A+Sp'

♂刊州(い例tけ)

=

l

kdX(れωtの) (いt=q ,...,n+q一1け)

(2.107)

ここで, n x n半正定対称行列P(t)はリカッチ方程式

ー一 一 A'P(t + l)bb'P(t + 1)λ

P(t) = Q + A'Þ(t + l)A一 一 (2.108)

rp + b'P(t + l)b

(39)

-,::

SnSn'

Q= Qp ー

t

L

- bSn'

A=A一一-p fp

(2.109)

(2.110) より求まり, リカッチ方程式の終端条件は

:Þ(q) =乞{(A+ b�)γQp-1(A + b�)'

つ臼〆'a・‘、 噌ai噌,i 、、.E,,,噌,i

ー=1

である. さらに, 評価の最小値は,

与(T)=

;

x(0)?(0)+日i]X(O) (2.1 12)

となる.

ところで, 式(2.103)より, 式(2.107)と式(2. 108)は, それぞれ b'[P(t + 1) + Qp-dA

ザ(t) =一 一 X(t)

b'[P(t + 1) + Qp-1]b (2.113)

'[P(t + 1) + Qpーl]bb'[P(t+ 1) + Qp-1]A :Þ(t) = A'[:Þ(t + 1) + Qpーl]A -

b'[P(t + 1) + Qp-1]b

(2. 1 14)

となる. よって,

P(t) = f>(t) + L Qi (2.1 15)

とおくと, 式(2.93)より

[f>(t + 1) + L Qi]b = [f>(t + 1) + Qpーl]b (2.116)

i=O

となるので, 次の定理を得る.

[定理2. 3] (特異型LQ最適制御) 任意の初期状態X(O) に対し, 終端 状態固定条件

x(n + q) = 0 のもとで, 特異型二次形式評価

x Q

x

tL日

1一2

一一

ηwa

+ n

s yd

(2.1 17)

(40)

を 最小にする最適入力は次のようになる.

u*(t) = ks(n + q, t)x(t) (2.118)

( b'P(t+1)A 1. nぃ

ks(n+ 州 =

- b町+ゆ い = U," ',q- l) (2.119)

l � (t = q,'・1η+ q -1)

ここで, kdは式(2.8)より求まる狭義のデッドビートゲインであり, n xη半 正定対称行列P(t) はリカッチ方程式

A'P(t + 1)bb'P(t + 1)A P(t) = Q + A'P(t + 1)A-

b'P(t + 1)b P(q) =

{(A + b�)γQp-1(A + bl叫'+

Qi

(2.120)

(2.121)

,=1 ,=0

より求まる. なお, 正則条件pは式(2.94)より得られ, Qiは式(2.90)で与えら れる. さらに, 評価の最小値は,

、、l'/ハU〆'a,、、X 、、,,,,nu ,,a・‘、P 、、.E,,,nU 〆,a,、、X 1一2一一、、EE,rT ,,a・‘、-cu FJ (2.122)

となる. •

これまでは完全な解が得られていなかった自由終端問題と無限制御時間問 題に対しでも, 同様の手法により 特異性を解消し, 最適制御を求めることが できる.

自由終端の場合には, 評価の終端と決定できる入力の個数が異なることに 注意しなければならない. すなわち, 評価の終端をe, 決定できる入力の個 数をTとすると,

e=r+p-1 (2.123)

となり, 自由終端特異型LQ最適制御問題は, 決定されるァ個の入力によっ て生じる状態x(r) が自由な問題と考えなければならない. よって, このとき 次の定理を得る.

[定理2.4] (自由終端特異型LQ最適制御) 特異型二次形式評価 ゐ作

参照

関連したドキュメント

専攻の枠を越えて自由な教育と研究を行える よう,教官は自然科学研究科棟に居住して学

また,文献 [7] ではGDPの70%を占めるサービス業に おけるIT化を重点的に支援することについて提言して

ても情報活用の実践力を育てていくことが求められているのである︒

災害に対する自宅での備えでは、4割弱の方が特に備えをしていないと回答していま

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

子どもたちは、全5回のプログラムで学習したこと を思い出しながら、 「昔の人は霧ヶ峰に何をしにきてい

生活のしづらさを抱えている方に対し、 それ らを解決するために活用する各種の 制度・施 設・機関・設備・資金・物質・

をき計測磁については 約機やぞの後の梅線道燦ω @J III 祭賞設けて、滋問の使用!窓織象件後紛えているをのもあ~.正し〈誕lÉをされていない官能筏