九州大学学術情報リポジトリ

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

デッドビート特性を用いるディジタル制御固有の線形制御則に関する研究

清田, 高徳

https://doi.org/10.11501/3088215

出版情報：Kyushu University, 1991, 博士（工学）, 論文博士バージョン：

権利関係：

(2)

(3)

デッドビート特性を用いる

ディジタル制御固有の線形制御則に関する研究

平成3年1 2月

清田高徳

(4)

第1章緒言 1

1.1 本研究の背景と目的 1

1.2 表記上の注意 1 1

第2章一入力系に対する固定終端LQ型最適レギュレータ 1 3

2. 1 まえがき 1 3

2.2 問題の設定 1 3

2.3 一入力デッドビート原理 1 4

2.4 正則型LQ最適制御 1 8

2.4.1 最適制御 1 8

2.4.2 例題 2 2

2.5 最小エネルギー制御 2 4

2.5.1 最適制御のオープンループ表現 2 4 2.5. 2 最適制御のフィード、バック表現-1 25 2.5.3 最適制御のフィード、バック表現-2 26

2.5.4 例題 2 8

2.6 特異型LQ最適制御 2 9

2.6.1 特異性の解消 2 9

2.6. 2 最適制御 3 1

2.6.3 特異型と正則型との関係 3 6

2.6.4 例題 3 7

2.7 L Q型最適制御の統一的表現 3 9

2.8 あとがき 40

第3章多入力系に対する固定終端LQ型最適レギュレータ 4 2

3. ₁ まえがき 4 2

3.2 問題の設定 4 2

3.3 多入力デッドビート原理 4 4

3.4 正則型LQ最適制御 4 8

3.4.1 最適制御 4 9

3.4.2 例題 5 7

3.5 最小エネルギー制御 5 9

3.5.1 最適制御のオープンループ表現 5 9 3.5. 2 最適制御のフィード、バック表現-1 59 3.5.3 最適制御のフィード、バック表現-2 61

3.6 あとがき 6 6

(5)

第4章 1型サーボ系に対する固定終端LQ型最適制御 6 8

4.1 まえがき 6 8

4. 2 1型サーボ系の一般構成 6 8

4. 3 正則型LQ最適制御 7 3

4.4 偏差入力エネルギーの最小化 7 6

4.5 例題 7 6

4.6 あとがき 8 2

第5章固定終端レギュレータの新しい最適性の条件 8 3

5. 1 まえがき 8 3

5.2 固定終端最適レギュレータ問題 8 3 5.3 基本構造と新しい最適性の条件 8 4 5.4 正則型LQ最適制御問題の新解法 9 0 5.5 正則型LQ最適制御の十分性 9 3

5.6 一入力系の場合 9 6

5.7 あとがき 9 9

第6章テ守ッドビートレギュレータの設計法 100

6.1 まえがき 100

6.2 問題の設定 101

6.3 一般形と整定時間 102

6.4 ベキ零ジヨルダン行列の直接的導出法 107

6.5 最適設計法 111

6.6 正準形 113

6.6.1 [系6.2 ]の場合(J = Joの場合) 113 6.6.2 J =f Joで[系6.1 ]の場合 114 6.7 計算遅れがある場合の一般形 117 6.7.1 計算遅れがある状態フィードバック 117

6.7.2 拡大系の可到達指数の族 120

6.7.3 一般形 122

6.8 あとがき 125

第7章 1型デ、ッドビートサーボ系の設計法 127

7.1 まえがき 127

7.2 問題の設定 127

7.3 1型サーボ系の一般構成 128 7.4 偏差系の可到達性と可観測性 129 7.5 1型デ、ッドビートサーボ系の一般形と整定時間 131

7.6 例題 136

7.7 あとがき 138

(6)

第8章テ。ッドビートオブザーバの設計法 140

8.1 まえがき 140

8. 2 問題の設定 140

8.3 一般形と整定時間 143

8.4 正準形 148

8.5 最適設計法 148

8.6 非再帰形デ、ッドビートオブザーバの一般形 15 0

8.6.1 計算遅れがない場合 15 0

8.6. 2 1サンプルの計算遅れがある場合 15 3

8.6. 3 2-Delayシステムの場合 15 5

8.6.4 例題 15 7

8.7 あとがき 15 9

第9章結言 160

謝辞 164

参考文献 165

付録(Arv F) 17 0

(7)

第1章緒

^t:::I

1.1 本研究の背景と目的

近年，演算速度が非常に高速なDSP(Digital Signal Prosessor)などの信頼性が高く高性能なマイクロプロセッサが登場したことにより，さまざまな分野で制御装置のディジタル化が急速に進んでいる. 特に，制御則をソフトウェアで組むサーボ機構のデ、ィジタル化は，ソフトウェアサーボあるいはデ、ィジタルサーボと呼ばれ1)J)，制御則が複雑化しでもソフトウェアの変更で簡単に対応できるという利点を有している. そのため，現代制御理論などの高度な制御手法の適用が進んでおり，サーボ機構の高精度化，高速化，高機能化が実現できるようになってきた. それに伴い，デ、ィジタル制御理論の重要性も増してきている.

現代制御理論は， 1 950年代後半に計算機の利用を前提として誕生した.

古典制御理論に対し現代制御理論では主に状態方程式によって系が表現される. この状態空間法は多変数制御系にも適用でき， 1 960年代には各種の線形制御理論の基礎が体系化された. 線形系では重ね合わせの原理が適用できるため問題の解析が非常に簡単になり，さらに非線形関数であつでもある動作点の近傍で近似展開することによって線形化できる場合が多いため，

線形制御理論は幅広く適用される. 線形制御系の制御装置とその設計理論の主なものに，次のようなものがある3)-7)

[ ^{1]レギ、ュレータ} 状態や出力をなるべく速く，しかも振幅が小さくなるように，平衡点、(通常は零とする)に戻してやろうとする機構である. 通常，

フィードバックを用いて構成される. 一般に，制御対象の極を指定された位置に配置する極配置による設計法と，リカッチ方程式に基づく最適レギュレータやH∞制御などの設計法に大別される.

[2 ^{]オフeザーバ} 状態の値が直接測定できないような場合に，入力と測定可能な出力から状態を推定しようとする機構である. なお，必要な次元を持つ動的システムをフィード、バック内にあらかじめ挿入し，フィード、バック系の安定化および過渡特性の改善を考えて，そのパラメータを決めたものが動的

(8)

補償器である. オブザーバも動的補償器の一種と考えることができる.

[ 3]サーボ系レギュレータはシステムの状態を常に平衡点(零)に保つ.

これに対し，与えられた目標値に高速かっ高精度で追従させるような制御系がサーボ系である. サーボ系の場合は目標値が平衡点ではないため，それを補正するための構成条件を加えなければならない. 一般に，フィード、バック系が安定となる内部安定性の条件，持続外乱が存在しでも出力が目標値に定常偏差なく追従する出力レギュレーションの条件，およびパラメータに微小変動があっても内部安定性の条件と出力レギ、ュレーションの条件が達成されるロバスト性(あるいは構造安定性)の条件の三つの条件が要求される.

一般に，制御は連続時間系で表現されるアナログ制御と，離散時間系で表現されるデ、ィジタル制御とに大別することができる. 微分方程式で記述されるアナログ制御系に対し，デ、ィジタル制御系8)-10)は差分方程式で記述される. 両者の最も大きな違いは，微分が用いられるアナログ制御系では許容されるデルタ関数(インパルス)が，その性質上デ、ィジタル制御系では許容されないという点にある.

離散時間系には，大きく分けて，もともと連続時間系であるものをディジタル計算機によって解析・制御するためにサンプリングにより離散化した場合と，初めから離散時間系で表現される場合がある. 線形制御に限れば，デ、ィジタル制御系の設計はアナログ制御系の場合と基本的な考え方においてほとんど差はなく，多くのテ守ィジタル制御則はアナログ制御則を読み変えることによって得られているが，中には先に述べた両者の違いによりアナログ制御では実現できないデ、ィジタル制御固有の制御則が存在する. その最も代表的なものが，デ、ッドビート制御11)，12)である. デ、ッドビート制御は有限時間整定制御とも呼ばれ，有限の時間で状態や推定誤差，出力誤差などを零に整定させる制御である. デ、ィジタル制御系においては，一定ゲインの線形フィード、バックによってデッドビート制御が実現できるため，デ、ィジタル制御系の主な設計法のーっとしてこれまでに多くの研究がなされてきた. デッドビート制御も伝達関数に基づく手法と状態空間法に基づく手法とがあるが，その基礎を確立したのは状態空間法である. ^Kalman13)は，可制御性について述べた論文において初めて状態フィードバックによるデ、ッドビート制御系の設計法を示した. 以来，初期の研究は最短時間制御に関するものが多かったが， 7 0年代に

(9)

入ると多入力多出力系に関する研究が盛んになった. 有限時間で状態ベクトルのすべての成分を零に整定させる状態デ、ッドビート制御の設計は， kdmm13)，

Leden 14) らによる可制御空間に着目する方法， Sebakhy and Abdel-Moneim 15) らの極配置による方法， Leden 16)， Lewis 17) の特異リカッチ方程式による方法の三つに大別される12) この他に，出力を有限ステッブで零に整定させる出力デッドビート制御(西村ら18)， AKωhi and Imai 19)他)，出力が目標値に追従するデ、ッドビートサーボ系(Bradshaw and Porter 20)， Kimura and Tanaka 21) 他)，状態の推定値が有限ステップで状態と一致するデ、ッドビートオブザーバ (Ichikawa 22)， O'Reilly 23)， Adaιhi and Akashi 24)他)，出力フィード、バックによるデ、ッドビート制御( Porter and Bradshaw 25)， Akashi and Imai 26)， O'Reilly 27)他)，パラメータ変動に対するロバストデ、ッドビート制御(木村28)他)な

どに関する研究が行われている.

このように，ディジタル制御系では，デ、ッドビート特性を利用すれば，アナログ制御系では実現できない制御則が実現できる. 本論文では，一定ゲインにより，あるいは，オブザーバや拡大系などの動的補償器を導入したとしても一定のパラメータにより，有限の時間で状態や推定誤差や出力誤差などを零にする制御を狭義のデッドビート制御と呼ぶことにする. しかし，後で述べるように，狭義のデッドビート制御系の可能な構造を陽に示す一般形や最適設計法は求められていない.

一般に，最短時間デッドビート制御は，オーバーシュートや入力エネルギーが過大となることが大きな欠点であり，その対策として整定時間を長くする方法が示されている. しかし，一入力系の狭義のデ、ッドビート制御は一意的に定まり設計の自由度は存在しない. さらに，多入力系においても最長整定時聞が存在するため，一定ゲインの(すなわち，狭義の)デ、ッドビート制御による応答波形の改善には限界がある.

狭義のデ、ッドビート制御は，いずれも一定ゲインにより有限時間でシステムの極を零に配置することによりデ、ッドビート制御を実現させるという極配置による方法である. 前述のように，レギ、ュレータの設計法として，極配置による方法の他に最適レギュレータによる方法がある. これは，与えられた評価を指定された条件のもとで最小(または最大)にする最適制御を求める方法である. 古典制御の代表的な評価として，パラメータ最適化に用いられる二乗面積評価( ISE : Integral of Squared Error) 5) があるが，二乗面積評価

(10)

には入力の項が直接陽には含まれないので，制御装置の構造を前もって定めない現代制御においては特異制御29) となる. そのため，現代制御では，状態だけではなく入力も含んだ二次形式評価がよく用いられる. この最適制御問題は，制御対象が線形(_Linear)で，評価が二次形式(_Quadratic)であるところから， L Q最適制御問題と呼ばれている.

一般に，最適制御問題5)，30)，31)は，終端時刻によって次の三つの場合に大別される.

[1 ]終端時刻固定(有限制御時間) 終端時刻が有限な値に固定される問題.

[2]終端時刻無限大(無限制御時間) 終端時刻が無限大である問題.

[3]終端時刻自由最短時間制御などのように，終端時刻を評価に取り入れた問題.

さらに，有限制御時間問題は，終端条件により次の三つの場合に分けられる.

[1]自由終端終端の拘束条件が存在しない.

[2]固定終端終端がある指定される値でなければならない(以後，この条件を終端状態固定条件と呼ぶ).

[3]可動終端終端がある領域内になければならない.

通常，有限時間最適制御問題は，自由終端のもとで解かれる. その理由は，終端状態が自由な有限時間LQ最適制御問題が，

(性質1)最適制御が状態フィードバックの形で得られる.

(性質2)最適ゲインが初期状態に依存しない有界な(時変)ゲインとなる.

(性質3)最適ゲインを求めるための明確なアルゴリズムが存在する.

なと、の性質を持つためである. ところが，高精度レギュレータでは有限の制御時間で状態を零にすることが，また，高精度サーボ系では出力を有限時間で目標値に一致させることが，それぞれ要求される. すなわち，有限時間最適制御は，自由終端よりも固定終端の方が望ましい特性を持っている. なお，

一般の1型サーボ系が制御対象の初期状態や外乱と目標値の大きさに依存しないためには，出力数と同じ数の積分特性を付加した拡大系を考えなければならない. このとき，拡大系の偏差系を用いることにより，1型サーボ系の設計問題はレギ、ュレータの設計問題に帰着させることができる. すなわち， 1

(11)

型サーボ系の終端状態固定条件付最適制御問題は，レギュレータの終端状態固定条件付最適制御問題(以後，固定終端最適レギュレータ問題と呼ぶ)に帰着される. よって，以後，終端状態固定条件付最適制御問題に関しては，固定終端最適レギュレータ問題を中心に述べる.

固定終端最適レギ、ュレータ問題に最適化の代表的手法であるラグランジュの未定乗数法を直接適用すると，最適制御は両端に制約を持つ二点境界値問題の解となる. 動的計画法を用いても二点境界値問題が得られる. しかし，

このような二点境界値問題を一般的に解いてフィードバック形式の解を求めることは難しいとされており5)，固定終端最適レギュレータ問題に対し，終端状態が自由な場合と同様な(性質1)---(性質3)を持つ状態フィード、バック形式の最適制御は求めらていない5)，32) これまでは，試行錯誤的な方法によってオープンループ形式の最適制御を求める方法や，終端状態固定条件は自由終端問題において終端状態の重みが無限大の場合に相当するので，自由終端問題において終端状態の重みを非常に大きく取る近似的な方法，あるいは，オープンループ形式で求められた最適制御をフィードバック形式に読み変える方法などが例題によって示されているだけである32) なお，アナログ制御系においては，固定終端最適レギュレータ問題に対し，有界なゲインによる状態フィードバック形式の最適制御は存在しない. また，アナログ最適制御とディジタル最適制御の比較を行った文献もあるが33)，固定終端最適レギュレータ問題に関しては何も触れていない.

自由終端有限制御時間や無限制御時間のLQ最適制御問題は，通常，二次形式評価における状態の重み行列が半正定，入力の重み行列が正定という条件のもとで解かれる. これは，前述のような特異性を避けるためである. 本論文では，この条件のもとでの最適制御問題を正則型LQ最適制御問題と呼び，この評価を正則型二次形式評価と呼ぶことにする.

正則型二次形式評価において状態の重み行列を零行列とした場合，すなわち，入力の二次形式のみを評価とした場合が，最小エネルギー制御問題である. 固定終端の場合に対しては，これまでに可到達性グラミアンを用いたオープンループ形式の最適制御は求められているが34)? フィード、バック形式の最適制御は求められていない.

一方，正則型二次形式評価において入力の重み行列を零行列とした場合，

すなわち，状態の二次形式のみを評価とした場合が特異型LQ最適制御問題

(12)

であり，古典制御における二乗面積評価を一般化した評価を特異型二次形式評価と呼ぶことにする. ディジタル制御系においては，アナログ制御系と同様に，制御時間が無限大の場合に対してのみ，正則型LQ最適制御において入力の重み行列を漸近的に零に近づけたときの極の性質について述べられている3) さらに， Kalman 13)は一入力系の無限制御時間問題に対し，状態の重み行列が正定という条件のもとでは特異型LQ最適制御が特別なリカッチ方程式により求まることを示し， Pearson 35)はその安定性について述べている. また， Kuèera 36)は一入力一出力系の無限制御時間最適出力レギ、ュレーション問題に対し，評価の特異性を解消する方法を示し，その解について論じている. しかし，一般の特異型LQ最適制御問題に対しては，終端状態固定条件のもとでの最適制御だけでなく，自由終端の場合や無限制御時間の場合に対する最適制御も完全には求められていない.

なお，本論文では，正則型LQ最適制御問題，最小エネルギー制御問題，特異型LQ最適制御問題の三つを合わせてLQ型最適制御問題と呼ぶことにす

る(図1. 1参照) .

ところで，固定終端最適レギ、ュレータ問題は，数理計画法における等式制約条件付最適化問題に相当する. この問題の解法としては，一般に

[解法a] 等式制約条件を解くことなく，ラグランジュの未定乗数法などで最適性の条件を求め，その最適性の条件を解く方法.

[解法b] 一部あるいはすべての等式制約条件を満足する一般解を求め，

この一般解を用いて新しい最適化問題を解く方法.

の二つがある. ラグランジュの未定乗数法から直接導かれる両端に制約を持つ二点境界値問題の解法は[解法a ]に相当するが，前述のようにこの問題を直接解いてフィードバック形式の最適制御を求めることは困難とされている.[解法bJを固定終端最適レギュレータ問題に適用するには，まず終端状態固定条件(すなわち，等式制約条件)を満足する入力の一般形を求めなければならない. その一般形を用いれば，終端状態固定条件のない新しい自由終端最適制御問題を誘導することができると考えられる. なお，狭義のデッドビート制御ではゲインは一定であるが，一般に一定ゲインだけでは固定終端最適レギュレータ問題の最適解を得ることはできない. しかし，本論文で明らかにされるように，固定終端最適レギュレータでは，制御の後半におい

(13)

制御対象

評価

x(t + 1) = Ax(t) + Bu(t)

J(T)=

j g

附Qx(t) + u川

(X() ; 自由

^日開問題

r ，有限

(

1

^{x(r) ;固定} ^・ ^・ ^{固定終端問題}

Q三0，恥1 _:三o ，R > 0 Q = 0， M = 0 ，R > 0 QどO?M=QFR=0

正則型LQ最適制御問題最小エネルギー制御問題特異型LQ最適制御問題

図1.1 L Q型最適制御問題の分類

(14)

て必ず狭義のデッドビート制御を用いなければならない . そこで，本論文では，終端状態固定条件を満足させる制御を広義のデ、ッドビート制御と呼ぶことにする. 本論文の第2章から第5章では広義のデ、ッドビート制御について，

第6章から第8章では狭義のデ、ッドビート制御について述べる.

なお，線形定常系においては，制御対象が与えられれば，可到達指数の族 (reachability indices)と呼ばれる正の整数の組が一意的に定まる. これは制御対象の構造を規定する重要な指数である. 自由終端最適制御問題と異なり，

固定終端最適制御問題では可到達指数の族すべての情報が必要となる.

本論文の第2章では，一入力系に対する固定終端LQ型最適レギ、ュレータについて述べる. まず;終端状態固定条件を満足する入力(デ、ッドビート入力) の一般形が満たすべき一入力デッドビート原理を導く . 次に，一入力デッド

ビート原理を用いた正則型LQ最適制御問題の解法を示す. この手法は，そのまま最小エネルギー制御問題にも適用できる. 特異型LQ最適制御問題に対しては，特異型二次形式評価における特異性の解消を行った後，同じ手法により最適制御が求まる. さらに，固定終端の場合にはLQ型最適制御が統一的に表現できることを示す.

第3章では，多入力系に対する固定終端LQ型最適レギュレータについて述べる. まず，多入力系のデ、ッドビート原理を導出する. 次に，多入力デッド

ビート原理を用いた正則型LQ最適制御問題の解法を示す. 最小エネルギー制御問題も同じ手法により最適制御を求めることができる. さらに，制御対象の可到達指数の族がすべて相等しい場合の最小エネルギー制御問題に対しては， Luenbergerの可到達正準形31)に変換することなく，可到達性グラミアンを用いたオーブンループ形式の最適制御34)からフィード、バック形式の最適制御を直接導くことができることを示す.

メカトロニクスにおいては，出力を高速高精度で目標値に追従させたい場合が多く，出力を有限時間で目標値に一致させるデ、ッドビートサーボ系は有効な制御系の一つである. デッドビートサーボ系に対しては，これまでに多くの研究がなされてきたが38)~40)，それらは特定の構造の線形系を対象としたり，制御装置の構造をあらかじめ定めた上でのパラメータ最適化であり，これらの制限を加えない場合の最適制御は求められていない .

第4章では， 1型サーボ系の固定終端LQ型最適制御について述べる. 前

(15)

述のように， 1型サーボ系の設計問題はレギ、ュレータの設計問題に帰着させることができる. ここでは， 1型サーボ系に対し，正則型LQ最適制御と偏差入力エネルギーの最小化について述べる.

一般の加法性評価に対しでも，固定終端最適レギュレータ問題は自由終端最適レギ、ュレータ問題よりも解くのが難しいとされているが，第2章と第3 章の正則型LQ最適制御問題と同様に，デ、ッドビート原理を用いることにより，固定終端最適レギュレータ問題から新しい自由終端最適レギュレータ問題を誘導することができる.

第5章では，一般の加法性評価に対する固定終端レギュレータの基本構造を明らかにし，新しい最適性の条件を求める. さらに，その有効性を明らかにするために，正則型LQ最適制御問題の新解法を示す.

狭義のデ、ッドビート制御に対しては，すでにその最短整定時間や構造を特定したデ、ッドビートレギ、ュレータが求められている11)，12)，25)，41)，42) さらに，

Sebakhyら15)はKleinら43)の方法を用いて，試行錯誤的にオーバーシュートを小さくしている. しかし，この方法でも， Sebakhyら15)が(注)と(例題) において指摘しているように，デッドビートレギュレータの一般的に可能なすべての構造を示すことはできない. また，設計の自由度を陽に示していないので，最適化も困難である. Fahmyら44)は，デッドビート制御系の一般形を求めようと試みているが，最大可到達指数のみを用いているため，除外すべきものまで一般形に含めており，その試みは失敗している. さらに，そこではシステム行列の正則性が仮定されており，デ、ィジタル制御において重要な計算遅れがある場合には適用できないなどの制限もある. このように，デッドビートレギ、ュレータのすべての可能な構造を陽に示す一般形や最適設計法は未解決である. ところで， Sebakhyら45)は， 2入力3状態の簡単な数値例において，最短時間デ、ッドビートレギ、ュレータが互いに独立な設計ノ〈ラメータの線形結合で表現されることを示した. この表現形式は非常に簡潔であるので，これを正準形と呼ぶことにする. しかし，一般的に正準形が存在するかどうかは， Sebakhyら45)が指摘しているように未解決である.

第6章では，デ、ッドビートレギュレータの設計法について述べる. まず，デッドビートレギ、ュレータの一般形を求め，その一般的な構造と一般的な整定時間を明らかにし設計の自由度を陽に示す. また，一般形を用いて，オーバー

(16)

シュートを最小にする最適設計法を示す. 次に，設計パラメータが線形で独立となる正準形について述べる. さらに，デ、ィジタル制御で重要な計算遅れがある場合に対する設計法を求める.

第7章では， 1型デ、ッドビートサーボ系の設計法を示す. まず，拡大系の偏差系において， 1型デ、ッドビートサーボ系の一般形を求める. さらに，偏差系の可到達指数の族や最短整定時間についての考察を行い，入力数と出力数の関係による最短整定時間の相違を明らかにする.

デッドビートオブザーバは，有限時間で推定誤差を零に整定できるため，

ディジタル制御系の重要な構成要素となり得る. これまでの多くの研究により，その最短整定時間や構造を特定した場合の試行錯誤的設計法が求められている11)，12) しかし，デ、ッドビートオブザーバのすべての可能な構造を陽に示す一般形や最適設計法は未解決である. ところで，通常のオブザーバは差分方程式を用いて表現されており，このような表現は再帰形表現である. そこで，再帰形表現を用いたデ、ッドビートオブザーバを再帰形デッドビートオブザーバと呼ぶことにする. デ、ッドビートオブザーバの固有値はすべて零であるから，非再帰形表現も可能である32) デ、ィジタル制御系においてはデータを保持することは容易であり，利用可能な過去や現在の入出力データを用いて有限時間で状態を再生する機構がいくつか提案されている46)，47) しかし多入力多出力系に対し，整定時聞が最短以外の場合も含む非再帰形デッドビートオブザーバの一般形は求められていない .

第8章では，デッドビートオブザーバの設計法について述べる. まず，その一般形や正準形を求め，最適設計法を示す. 次に，非再帰形デ、ッドビートオブザーバの一般形を，計算遅れがない場合， 1サンプルの計算遅れ 48)，49)がある場合，さらに出力多重サンプル値系50)の一種である2 -Delayシステム51) に対して求める.

最後に，第9章では，本研究で得られた結果をまとめ，今後の課題についてふれる.

(17)

1.2表記上の注意

1 )本論文で取り扱う行列とベクトルは，それぞれ実行列と実ベクトルとする.

2) ^{n次元の制御対象}

x(t + 1) ⁼^Ax(t)+ ^Bu(t)

において，任意の状態Yに対しである非負の整数kが存在し， x(O) ^{= 0な} る初期状態を x(k)=どに移す入力u(t) (t=O，...，k-l)が存在するとき，この制御対象は可到達であるという. 制御対象が可到達であるための必要十分条件は，

ra此[BAB ... An-1B]=n

となることである. 可到達性とよく似た概念に可制御性があるが，可制御性は任意の初期状態を有限の時間で零状態に移すような入力列が存在するかどうかという概念である. 可到達であれば可制御である. また， Aが正則ならば，可到達性と可制御性の条件は一致する. 本論文中に出てくる I Luenbergerの可到達正準形」という言葉は一般には用いられていないが，

これはI L uen bergerの可制御正準形J 31)の定義において「可制御」を「可到達」に読み変えたものである. また，I可到達指数の族」は「広義の可到達指数」とも呼ばれており，原語はreachability indicesである. さらに，I最大可到達指数」は「狭義の可到達指数J，あるいは「クロネッカ指数Jとも呼ばれており，原語はreαchability indexである.

3)任意のnx 1ベクトル xに対し， x'Px三0が成り立っとき， ηxn行列Pは半正定行列であるという. 本論文において行列Pが半正定行列であるというとき， Pが零行列の場合は除くとする.

4)記号は原則として各章で独立とし，各章で最初に出てきたときに定義する. ただし，以下の記号は本論文で最初に出てきたときに定義し，以

後本論文で共通に用いるとする.

(18)

1. 記号" ， "は，行列あるいはベクトルの転置を表わす.

2. Inは， n X n 単位行列とする.

(19)

第2章

一入力系に対する固定終端LQ型最適レギュレータ

2. 1 まえがき

本章では，一入力線形定常デ、ィジタル制御系に対し，終端状態固定条件のもとで二次形式評価を最小にする固定終端LQ型最適レギュレータ問題について述べる. この問題に対しては，これまでは最小エネルギー制御問題に対するオーブンループ形式の最適制御が求められているだけである.

第2.2節では，問題の設定を行う. 第2.3節では，終端状態固定条件を満足するデ、ッドビート入力の一般形が満たすべき一入力デッドビート原理を求める.

第2.4節では，正則型LQ最適制御問題の解法を示す. まず，一入力デッドビート原理を用いて，終端状態固定問題から新しい終端状態が自由な問題を誘導する. 次に，この誘導されたLQ最適制御問題を解いてフィード、バック形式の最適制御を求める. 第2.5節では，最小エネルギー制御問題の解法を示す. まず，

可到達性グラミアンを用いたオープンルーフ。形式の最適制御について述べる.

次に，第2.4節と同様にして求められるフィード、バック形式の最適制御を示す.

さらに，最小エネルギー制御の場合はその陽なる解(非再帰形表現)が存在することを明らかにする. 第2.6節では，特異型LQ最適制御問題の解法を示す. まず，特異型二次形式評価における特異性の解消について述べる. これによって，特異型LQ最適制御を求めることができる. 次に，特異型LQ最適制御と正則型LQ最適制御との関係を明らかにする. さらに，自由終端の場合と無限制御時間の場合についても考察を行う. 最後に，前節までの結果をもとに，第2. 7節において，固定終端LQ型最適レギュレータの統一的表現を示す.

2. 2 問題の設定

制御対象として，次の可到達な一入力線形定常デ、ィジタル制御系を考える.

x(t ⁺1) ⁼Ax(t) ⁺bu(t) (2.1 )

(20)

ここで，

x(t) ;ηx 1状態ベクトル

u(t) ^{;スカラ入力}

A ;η×η定数行列

b ; n x 1定数ベクトル t ^{，零または正の整数}

とする. なお， Aの正則性は仮定しない.

高精度レギ、ュレータでは，有限の時間で、すべての状態が零になることが要求される. そこで，制御対象式(2.1)に対し終端状態固定条件

x(r) = ⁰ ^(2.2)

を付加し，この条件のもとで二次形式評価

め)=

i _z

[x(t)1剣山U(t)2] ^(2.3)

を最小にする固定終端LQ型最適レギュレータ問題を考える. ここで，記号

" ， "はベクトルまたは行列の転置を表わし，

とする.

Q _; _nxη零行列または半正定対称行列

r :零または正の実数

2. 3 一入力デッドビート原理

この固定終端LQ型最適レギュレータ問題にラグランジュの未定乗数法を直接適用すると， r > 0のとき，最適制御は両端に制約を持つ二点境界値問題の解となる. しかしながら，この二点境界値問題を解いてフィード、バック形式の一般解を求めることは難しいとされている5) そこで，式(2.2)の終端状態固定条件を満足する入力の一般形を求めることにより，終端状態固定条件を取り除くことを考える. なお，狭義のデ、ッドビート制御問題11)，12)より，最短整定時間はηである. よって，終端時刻Tは

ァ>η (2.4)

(21)

なる正の整数でなければならない.

まず，最短時間ァ=nの場合について述べる. 式(2.1)より，状態x(η)は r u(n - 1)

1

x(n) =Anx(O)+[bAb ... An-1b]

I

_:

I

^(2.5)

l

_U(O)

J

となる. そこで，可到達性の条件と終端状態固定条件x(n)= 0より，最短整定時間nのときのオープンループ形式のデ、ッドビート入力は，一意的に

の-

1)

: 1=一[bAb ... An-1b]-lAnx(0) (2.6)

等価であることが知られている52)

u(t) = �x(t) (2.7)

kd = -[ 0・・・o 1 ][ b Ab ... A n-l b ]-1 A n (2.8)

ここで， �を狭義のデッドビートゲインと呼ぶことにする. このとき，式(2.1) と式(2.7)より

となるので，

x(t + 1) = (A + b�)x(t)

x(t) = (A + bkd)tX(O) u(t) = kd(A + bkd)tX(O)

を得る. よって， r = nのときの二次形式評価の値J(n)は，

刈抑刷η吋)

=

: E [μ何凶州阿X刈吋刷刷(れω仰tけげ判)'川，可'Qx(t取似X刈均(いt ) +打刊叫ru叫州u叫(

(2.9)

(2.10) (2.11)

=

;

^ト例Wx刷

^(ρ2叫

W= 玄{(A+ b�)t}'(Q + rkd'kd)(A + bl叫t (2.13) となる. 明らかに， Wはηxn半正定対称行列である.t=O

式(2.4)より，整定時間ァは

ァ=n + q (qは零または正の整数 ) (2.14)

(22)

とおける.このとき，デッドビート入力は次の[一入力デッドビート原理]を満足しなければならない

[一入力デッドビート原理]

任意の初期状態x(O)に対し，終端状態固定条件

x(n+q) ⁼⁰ (2.15)

噌i ny

一 + q

nu

n

G4

l，、

は

一一一一t

μい杉V

μい λり

般 )

叶

一意

的 w m

任レ吋

態

J {J l

\

状1f=

日

'

ト

)

たり一

時

ら :

申: . hta ‘ lF』 J ，，、、I/

ド

ば

。，U

1

ツ

れ

~バ

デ

け

耳な

す

で

別

問湘

制叫戸沼田v h コ可 FEE-』

を

と

(2.16)

I u(η+ q - 1)

1

x(n + q) ⁼An+qx(O) + [b Ab ... An-1b ... An+q-1b]

I

_:

I

l

_U(O)

J

^(2.17)

となる.ここで，簡単のため

Zl ₌[b Ab ... Anー1b]

1

Z2 ₌[Aル・・・An+q-lb]

J

^(2.18)

(2.19)

斗JF ヴt ぅ“

川|||」

式

一

り

例・:

Q4 u U円

よ

ralll--L 叫勺

=幻

u 式

件条定

固

態状

山而

終

ノt、

お

ム) 、‘，，/ハU

x

n-

+ n A 一一

司i qa

u u

qa z 唱A

Z

(2.20) となる.このとき，可到達性の条件より，次の式(2.21)を満足する[^{Zl Z2}]の右側逆行列[ ^{Zl Z2}]ーが必ず存在する. なお， InはηXn単位行列とする.

[ ^{Zl Z2}][ ^{Zl Z2}]

一

⁼ ^In ^{(2.21 )}

(23)

したがって，式(2.20)のオープンループ形式の一般解は，

[ _�� ^� 1 1

⁼⁼^{-[ Zl Z2}^{-[ Zl Z2}^r^{1一円山い}^{A n+qx(O)}⁺^{I^n+q^-^- ^[^[^{Zl Z2}Zl Z2 ]-[山]}ⁿ ^{Zl Z2 ]}}

[出 I � � I

^I ^u2 I ^(2.22)

となる. ここで， UlとむはそれぞれUl，U2 と同一次元の任意ベクトルである. [Zl Z2 ]ーは一意的には定まらないが，可到達性の条件より Zlは正則であるから，

[Zl Z2

叶引

^(2.23)

を用いることもできる. そこで，式(2.23)を式(2.22)に代入すると，一般解は

可BTB''EBB-ESEEd官A

98

-u-u

rEEEEEEEEEEEEE』、弘J 9a qμ 唱i ワ山 1IBEBEE--」

一10Z

FSEESEEESEEBEE-- nuz

+ n

YEA rdt

+

、、.，，，nu ，，aE‘、

x

nwa

+ n A

一10Z

一一、EBEE-EEEEEEEEd

唱i qha

u u

raEEE'''EEBB-E』

[

^-Zl-I{An+

ご

^0)+恥}

1

^(2.24)

となる. よって， U2，すなわち， u(0)，... ，u(q-1)は任意となる.さらに，む= U2 であるから， Aqx(O) ⁺ [ b Ab ... Aq-1b ]U2は，任意の入力 u(O)，... ，u(q - 1) が加わったときの状態x(q) に等しい. すなわち，

Aqx(O) ⁺ [ b Ab ... Aq-1b ]U2 = x(q) (2.25)

より， Ulは

Ul = -Zl-1Anx(q) (2.26)

となる. 式(2.26)は， x(q)を初期状態とみなしたときのオープンループ形式のデ、ッドビート入力である. したがって，フィードバック形式で書けば式(2.7)，

(2.8)となる. [証明終]

なお，式(2.2 1)を満足する [Zl Z2 ]-をどのように選んでも(表現形式は異なっても) ，式(2.22)は一般解となる. しかし後の展開を考えると，式(2.23) のように選ぶのが最も効果的である.また， [一入力デ、ッドビート原理]の証明法には，多入力系の場合と同様に入力の変換を用いる方法もあるが，ここでは省略する(第3.3節参照) .

すなわち， n+qまでに状態x(t)を零に整定させるデッドビート入力の一般形は，最初のqステップは任意の入力，以後のηステップは狭義のデ、ッドビートゲインkdによる状態フィードバックとなる. なお， [一入力デ、ッドビート原

(24)

理]はη+qまでに状態x(t)が零に整定する一般的なデッドビート入力の等価表現であり，

x(t)手0(t=Of-\η+q -1)

1

x(n + q) ⁼0

J

を意味しない. すなわち，

(2.27)

x(t) = 0 ( 0三t^�n + q -1) (2.28) なるtが存在しでもよい.

2.4

正則型LQ最適制御

ここでは，終端状態固定条件式(2.2)のもとで，正則型二次形式評価

勺4 aTb u rl

+

x

nvv

x

ベヤμ日

1一2

一一 T

N

7Fυ

_(2.29)

を最小にする正則型LQ最適制御問題を考える. ここで， Qはnxn半正定対称行列とし， rは正の実数とする.

2.4.1

最適制御

まず" [一入力デッドビート原理]を用いて，この問題を新しい終端状態が自由な問題に変換する. [一入力デッドビート原理]と評価の加法性より，式 (2.13)を用いると式(2.29)は

JN(n + q) =

j器2 h何同同(収肋仰tの)

一 j _z [怜削(れ例tけげ)'可'Qx(t似似X刈吋(れt) +打叩叫ru叫叫u叫吋刷川(れ肋附tけげ卯)2

となる. すなわち，固定終端正則型LQ最適制御問題は，初期状態がx(O)，

終端状態x(q) は自由の境界条件のもとで，式(2.30)を最小にする問題に変換された. そこで，この新しい自由終端問題にラグランジュの未定乗数法を適用する.

(25)

まず， q個の n x 1未定乗数ベクトル入(t)(t=l，"'，q)を用いると，ラグランジュ関数Lは

L=JN(n+q)+乞入(t+ l)'[Ax(t) + bu(t) - x(t + 1)] (2.31)

t=O

となる. Lをx(t)およびu(t)で偏微分して零とおくと，

入(t)= Qx(t) + A'入(t+ 1) (t = 1，"'， q -

1)

_(2.32)

u(t)=-lbス(t+ 1)

(t

= 0， .. . ，q - 1) (2.33) を得る. さらに， Lを終端状態x(q)で偏微分して零とおくと，終端条件

入(q)= Wx(q) (2.34)

を得る. 式(2.33)より，式(2.1)は

x(t + 1) = Ax(t)一

;

^{仙(t+ 1)} ^(2.35)

となる. よって，式(2.32)，(2.35)より新しい終端状態x(q)が自由なLQ最適制御問題は，境界条件x(O)と入(q)のもとで

[�

^bザ/E1IX(t+

I I

_， _/_.

1

_.，

I

₌^{I A}

I

_{_}_ ⁰¹

I I 1

^x(t)_{_} _"

| I

(2.36)

o A'

J

_{l入(t+ 1)}

J l

-_Q In

J

_l入(t)

J

を解く二点境界値問題に変換される. そこで， n xη対称行列P(t)を用いて，

リカッチ変換

入(t)= P(t)x(t) を行う. 式(2.37)を式(2.35)に代入すると

{In+

;

bVP(t+1)}x(t+1)=AX(t) を得る. ここで， P(t + 1)が半正定と仮定すると，

|い

;

bbIP(t+1)|=|1+

河

^川1州

(2.37)

(2.38)

であるから， In + bb'P(t + l)/rは正則である. このとき，その逆行列は，

-1 T bb'P(t + 1)

{In +

�

bb'P(t + 1)} ^-1= In一 r + b'P(t + l)b (2.40)

(26)

となる.したがって，式(2.38)より

X(t+1)={L+

;

^bW(t+1)}^川^(t)

bb'P(t + 1)

}Ax(t) n

r + b'P(t + l)b を得る. さらに，式(2.32)，(2.37)， (2.41)より

' T"tIll ... \ .. A'P(t + l)bb'P(t + l)A

{P(t) - Q - A'P(t + l)A + �-

� � V " ::�/��，

^{\:\� .L}^J..^a. ^}X(t)⁼⁰ ^(2.42)

r + b'P(t + l)b

を得る. 式(2.42)が任意のx(t)に対して成立するためには， P(t)はリカッチ方程式

(2.41)

A'P(t + l)bb'P(t + l)A P(t) = ^Q+ A'P(t + l)A -

r + b'P(t + l)b

を満足しなければならない. 式(2.34)と式(2.37)より，終端条件は P(q) = w

(2.43)

(2.44)

となる. wは半正定であるから， P(t + 1) も半正定となる.

よって，式(2.33)，(2.37) ，(2.41)より，最適入力u*(t)(t = 0， .・・，q -1)は，

、‘l/ 4L /11

* u bb'P(t + 1)

= 一一b'P(t+ l){In -

_ ^�:/�n� ^v4

^" :J\L}Ax(t)

r + b'P(t + 1 、 FP(t + l)A

x(t)

r + b'P(t + l)b (2.45)

となる.

さらに，リカッチ方程式の一般的性質より， JN(η+ q)の最小値JIv(n+ q)は，

別+q) =

ト

^(阿川) ^(2.46)

となる.

以上をまとめると，次の定理を得る.

[定理2. 1 ] (正則型LQ最適制御) 任意の初期状態x(O)に対し，終端状態固定条件

x(n + q) = 0

のもとで，正則型二次形式評価

「，s ，TLV U VA

+

X Q

X

ヤヤ包

n

-i一月ソ“

一一

n吋・a

+ n N

yd

_(2.47)

(27)

を最小にする最適入力は

u*(t) = k:\r(n + q， t)x(t)

( b'P(t+1)A 1， nぃ

k:\r(n + q， t) =

�

^-r +b'P(t+1)b い = U，・・・， q_{- 1)}

l � (t = q，.・\η+q -1)

(2.48) (2.49)

となる. ここで， kdは式 (2.8)より求まる狭義のテ守ッドビートゲインであり，

P(t)はリカッチ方程式

A'P(t + l)b b'P(t + l)A

P(t) = Q + A'P(t + l)A ^_ ..... �

� V ，1 :，';:，:

^�

\:\�

^-'-，.... ^(2.50)

r + b' P (t + l)b

P(q) =

玄

^{{(A +}^b�)t}'(Q+ rkd'kd)(A + bkd)t (2.5 1) t=O

より求まる. また，評価の最小値は，

JL(n+q)=

j

^x(OYP(0)刷 ^(2.52)

となる. さらに，次の性質が成立する.

( 1)最適入力u*(t)は， t = 0，.・. ， q -1ではリカッチ方程式より求まる時変ゲインの状態フィードバック， t = q，.・・?η+q-1では狭義のデ、ッドビートゲイ

ンによる一定ゲインの状態フィード、バックとなる.

( 2) 最適フィード、バックゲインは，制御対象の初期状態x(O)に依存しない.

(3)時変ゲインkÑ(n + q + 1， t + 1)とkÑ(η+q， t)の聞には次の関係が成り

立つ.

k� (n + q + 1， t + 1) = k� (n + q， t) (2.53)

( 4)整定時間がn+qのときのふ(n+ q)はJN(η+q + 1)の特別な場合であるから， JN(n+q)はJÑ(n+q + 1)より小さくなることはない. すなわち，

J�(n + q)どJ�(n+ q + 1) (2.54)

となる. _•

(28)

2. 4.2 例題

-EAnHU

--nu X 3

1111111J

kd 1・

0RUqJEZIPO ρ0

1J40 J司JnUQdi、ノハUnU

御 u o

時=

達 LJ

E33 U

4 d

pOヴt-10

8 FDny唱i・4'ーハU00 あ u u

で102

rill-

-一一一nA

て'しム)題伺rl

に対する固定終端正則型LQ最適制御問題を考える. 重み行列は，それぞれ

Q=

[

¹

^;

^。

^: !

^?r=1

とする.

このとき，狭義のデ、ッドビートゲインkdは kd = -[ 110 14.4]

となる. また， q = 5のときの時変ゲインは，

k�(7， 0) =一[13.5 4.14]

k;.r(7， 1)

=

^-[16.9 4.85]

k�(7， 2) =一[22.8 5.88]

k�(7， 3) =一[33.4 7.43]

k;.r(7，4) = -[ 55.3 9.90]

となる. 明らかに，式(2.53)よりq = 1，...，4のときの時変ゲインもq=5のときの時変ゲインの一部として求まる.

次に， q = 0，1，5の場合に対し， u(t)とx(t)の第2成分X2(t)を求め，これらを図2. 1と図2. 2に示す. さらに， JÑ(n + q)の値を表2.1に示す.

これらより，整定時間を延ばすにしたがって，評価の最小値，入力振幅，オーノくーシュートが減少していることが分かる.

表2. 1 評価の最小値JÑ(η+q)

q

JÑ(n + q)

(29)

u(t) 100

。

q=O

q =1 ^----e q=5 ^--e 50

10 t

-50

-100

図2. 1 最適入力u*(t)

x2(t) 5 10

。

℃

-5 t \・ ‘ ^q=O

q=l ^•

q=5 ^e

-10

図2. 2 X2(t)の応答

(30)

2.5 最小エネルギー制御

ここでは，終端状態固定条件式(2.2)のもとで，入力エネルギー

ゐ(ア)=

j g

^u(t)2

を最小にする最小エネルギー制御問題を考える.

(2.55)

2.5.1 最適制御のオープンループ表現

最小エネルギー制御問題に対しては，可到達性グラミアンを用いたオープンループ形式の最適制御が既に求められている34)

可到達性の定義より，可到達性グラミアン

G =玄AT-i-1bb '(AT-iー1)'

，=0

=乞Atbb'(A')'

，=0

= [b Ab ... ATー1b ][ b Ab ... AT-1 b J' (2.56)

は正則である5)次に，式(2. 2 0)は

Z = [Zl Z2] = [ b Ab ... AT-1b] (2.57)

「EEEEEEEEEEEEEEEEEEEE」、lE/ 唱EA

- -

:川W

T u

u

「E'aEEEEEEEEEEEEEEE'z』一一「EEEEEEEEEEEEEEEEE」

唱A qa u u

FEEEEEEEEE『EEBEEEEL 一一

U

(2.58)

とおくと，

ZU = -ATx(O) となる.このとき，可到達性の条件より，

(2.59)

Z↑= Z'(ZZ')-l = Z'G-1 (2.6 0)

なるZの最短右側逆行列Z↑を用いると， Uは

U = -ZtATx(O) = -Z'G-1 ATx(0) (2.61 ) となる.よって，オープンループ形式の最小エネルギーは，

J;(7") = � U' U = �x(O)'(Z↑AT)'(Z↑AT)X(O)

2 2

(31)

=

j

^削川f^前^町刈0) ^(2.62)

となる. すなわち，可到達性グラミアンを用いたオープンループ形式の最適入力ぜい)と最小エネルギーJj(ァ)は，

となる34)

ぜい)= -b'(ATート1)'G-1ATx(O)

J;( ^ア) =

:トX刈刷削(仰例0的町)'句(

AT)'匂Gσ一-lATx例

2.5.2 最適制御のフィードパック表現-1

(2.63) (2.64)

最小エネルギー制御問題に対しでも，前節と同様に[一入力デッドビート原理]を用いる手法により，フィード、バック形式の最適制御を求めることができる. すなわち，正則型LQ最適制御問題において，

(2.65)

とおけばよい. このようにおいても，前節と全く同様に議論できるので，結果のみを示すと，次の定理を得る.

[定理2. 2. 1] (最小エネルギー制御) 任意の初期状態x(O)に対し，終端状態固定条件

x(n+q) ⁼⁰ のもとで，入力エネルギー

1 n+q-l J1 (n+q) ="2

玄

^時)2

を最小にする最適入力は

ピ(t)= k� (n + q， t)X(t)

( b'^P(t+l)A /， _^ぃ

k� (n + q， t) =

�

^- ¹^{+ b'}^P⁽^t⁺¹^{) b} ^\"^l⁼ ^U，^.・・，q^{- 1)}

l kd (t = q，.・・，n+q-l)

(2.66)

(2.67) (2.68)

(32)

となる. ここで， kdは式(2.8)より求まる狭義のデ、ッドビートゲインであり，

P(t)は，リカッチ方程式

A'P(t ⁺l)bb'P(t ⁺l)A P(t) ⁼A'P(t ⁺l)A -

1 + b'P(t ⁺l)b P(q) =乞{(A⁺bkc.i)t}'kc.i'kd(A ⁺bl叫t

t=O

(2.69) (2.70) より求まる. また，このときの最小エネルギーは，

仰+q)=

;

^x附仰) ^(2.71)

となる. •

なお，式(2.6)より，リカッチ方程式の終端条件式(2.70)は

P(q) = (An)'{[ b Ab.. .An-1b ]-1}'[ b Ab.. . An-1b ]-lAn _(2.72)

とも表わされる. 明らかに，式(2.70)と式(2.72)は等価である. さらに， [定理

2. 1 ]と同様な性質が成立する.

2.5.3 最適制御のフィードパック表現-2

式(2.69)，(2.70)のリカッチ方程式はP(t)の差分方程式による再帰形表現であるが，その非再帰形表現も可能である. まず，会tを

Zt = [ b Ab .. . A n+qーtーlb ] ^(2.73)

とおくと， t = 0，'…，qのとき，可到達性の条件よりZtZ�は正則である. そこで，

P(t) = (A n+q-t)'(ZtZ�)-l A n+q-t _(2.74) とおくと， P(t)は半正定対称行列となる. さらに，

Zt+l = [ b Ab... A n+q-t-2b] (2.75)

Zt = [Zt+l A n+q-t-l b ] (2.76)

P(t ^{+ 1) =}(A n+q-t-l )'(Z川Z�+l)一lAn+qーt-l _(2.77)

(33)

であるから， ZtZ� の漸化式は

合t念;

- 111411111」

一

円 IU川村 h

AZMAMA

UU LU rill--L I 川b r

一+4vn

r A 叶+AH HAZ A

Z

い門「1LAmb

一

一一

^(2.78)

となる. これらの式を，式(2.69)のリカッチ方程式の両辺に代入すると，

左辺 = (A n+q-t)'(ZtZ�)-l A n+q-t (2.79)

右辺 A'P(t ⁺l)bb'P(t + l)A

= A'P(t + l)A -

1 ⁺b'P(t + l)b

= (An+q-t)'{(会川会;+1)-1

(Zt+1Z�+1)一1A n+q-t-1 bb'(A n+q-t-1 )'(Zt+1Z�+1)-11An+q-t 1 ⁺b'(An+qーtー1)'(Z削Z�+l)一1A n+q-t-l b ^J

= (An+q-t)'{(Z削Z�+l) + A n+q-tー1bb'(An+q-t-l )' }一1An+qーt

ー(An+q-t)'(ZtZ�)一1A _n+q-t _(2.80)

となる. すなわち，式(2.79)と式(2.80)より式(2.74)のP(t)は式(2.69)のリカッチ方程式を満足する. さらに，

P(q) ⁼ (An)'(ZqZ�)一lAn

= (An)'{[ b Ab... Anーlb ]-l}'[ b Ab.. . An-1b ]-lAn

=

L

{(A + bkdr}'�' kd(A + bkd)t (2.81) t=O

となり，式(2.74)のP(q)は式(2.70)満足するから，解の存在が証明されるとともに，解を陽に求めることができた. なお，式(2.74)を式(2.68)に代入してまとめると， t = 0^{， . . . ，}^q

-

1の最適フィードバックゲインは，

k�(n + ^q^，t) - -l+ b'P(t+l)b ^b'P(t+l)A

= -b'(An+q-t-l)'(ZtZ�)-l An+qーt (2.82)

と表わされる. さらに，狭義のデ、ッドビートゲイン�は，(ZqZ�)を用いると，

次のように表現できる(第3章[定理3.3.2]参照) .

kd ⁼-b'(A n-l)句会q念;)-1An (2.83)

(34)

よって，簡単のため

G(t) = Zt含;

= [b Ab. ..An+q-t-1b][ b Ab.. . An+q-t-1b

J'

_(2.84)

とおくと，次の定理を得る.

[定理2.2.2J (最小エネルギー制御) [定理2. 2. 1

]において，最小エネルギー制御の最適フィード、バックゲインは，次のように表わすことができる.

( _b'(An+q-t-l)'G(t)-lAn+q-t (t = 0，..・，q-1)

k�

(n + q， t) =

< _l

-b'(An-l)'G(q)-lAn (t = q，.・・， n+q-1) (2.85)

•

なお，多入力形の場合と同様にして，可到達性グラミアンを用いたオープンループ形式の最適制御から直接フィードバック形式の最適制御を導くこと

もできる(3.5. 3参照) .

ところで，式(2.57)と式(2.73)より

Zo = Z (2.86)

となるので，式(2.74)より式(2.71)の最小エネルギーJ;(ァ)は

々ヤ)=

j

x(仰T)'(ZOZ�)-lATx(O)

-

j

^{x(0)f川百山} ^(2.87)

となる. よって，オープンループ形式の最小エネルギ一式(2.62)は，式(2.71) の最小エネルギーと一致する.

2.5.4 例題

例題として， = n 3である可到達な制御対象53)

可litliai---ltlJ噌，i

。00

「EIEEEEEEEEEEEEEEL 一一、、1/nU ，，a，‘、 X 可11111E11111111」nUハU11 FEEEEEEEEEEEBEES-aL 一一 'D 『1111111111titi」噌EA FO qJ -』 v h id a し nu nunU

nu nU 噌inynunU tinunu r's''E'EESEEE』E』EL 一一

A

(35)

に対する最小エネルギー制御問題を考える.

このとき，狭義のデッドビートゲイン kdは

�=一[94.9 22.0 1. 90]

となる. さらに， q = 5 のときの時変ゲインは，

k�(8， 0) =一[10.2 4.81

k�(8，1) =一[13.6 5.84 0.571]

k�(8， 2) = -[19.0 7.31

k�(8， 3) = -[28.5 9.59 0.902]

k�(8， 4) = -[47.5 13.6

となる. また，最小エネルギーJj(n+q) の値を表2.2に示す.

表2. 2

最小エネルギーJj(n+ q)

2.6

特異型LQ最適制御

ここでは，終端状態固定条件式(2.2) のもとで，特異型二次形式評価

ゐ川肋州(ヤ付作T寸)ト= : ^{玄 X仰刈吋刷tけ)} ^ρ

を最小にする特異型LQ最適制御問題を考える. ここで，重み行列Qはnxη 半正定対称行列とする.

2.6.1

特異性の解消

特異型LQ最適制御問題に対しては，自由終端の場合でさえも一般的な最適制御は求められていない. この問題に直接ラグランジュの未定乗数法を適

(36)

用しでも，入力に関する条件が得られないので特異制御29)となり，このままでは解を求めることはできないためである. しかし，特異型二次形式評価式(2.88)を変形することにより，特異型LQ最適制御問題を通常の正則型L Q最適制御問題に変換することができる. なお，そのための条件を正則条件と呼ぶことにする.

まず，式(2.1)を用いて，式(2.88)を次のように変形する.

Js(ァ) -

iz

^x(判刈)

=

;

x(0)FQX(0)+

;z

^x(t+胸中1)

=

j

^削QX(0)+

;z

[X(判x(t)+以(t)'SlU(t

ここで\ Qi = (A')'QAI

Si = (A')'QA'-lb fi = b'(A'-1)'QAì-1b

(n x n)

1

(_{n x}₁₎

}

(スカラ)

J

(2.90)

とする. このとき，

fl = b'Qb > 0 (2.91)

ならば，

ん作

となり，特異性は解消される. なお， Qが正定行列のときは，式(2.91)は自動的に満足される.

もし， fl = 0ならば，式(2.89)は

，7b

x Q

X

ベヤμ同 1A一つ“

+

nu

x Q

nu

x -一2

一一 T

s

ytu

_(2.93)

となるので，特異性は解消されない. そこで，この場合は， b'A'QAb> 0かげA'QAb = 0かにより，前と同様の議論を行えばよい. もし， b'A'QAb = 0 ならば，さらに同様の手順を繰り返す.

ところで，可到達性の条件より可到達性行列 [b Ab ... Anーlb]

(37)

は正則となるので，

p = ^rnin{j; QAJーlbヂO，QAJ-2b = ・・・=Qb = O} (2.94)

を満足する正の整数p(1三p三n ) が必ず存在し，

rp = b'(APーl)'QAPーlb ^> 0 (2.95) となる. このとき，式(2.88)は

ゐ(市

ト

^(0)F(

_E

^1Qi)X(0)+

j _Y

lx(t)FQp X(t)+2x(t)FSP11(t)+引(t)2] (2.96) となる. すなわち，特異型LQ最適制御問題は可到達性の条件のもとで特異性が解消され，相乗項を含む通常の正則型LQ最適制御問題に変換することができる. これは，デ、ィジタル制御系固有の性質によるものである.

なお，この方法は，行列Aが正則という条件のもとでKucera 36)が一入力一出力系の無限制御時間出力レギュレーション問題に対して適用した手法を一般化したものである.

2.6.2 最適制御

式(2.96)の評価は

ゐ(7) =

ト

^{( 0)f(}

_h

^i)刷+

j

⁽

_E

^ht) ^(2.97)

とおいたとき，

ht =

J

�(t)，Q川)+川)'Spu(t)+ fpU(t)2 (t = 0， . .. ， 7 - 1ーの

、 (2.98)

l O (t =7-p，. ・・，7ー1)

という特別な形をしている. すなわち， t = 7 -p， . . . ， 7 - 1の入力u(t)は式 (2.96)の評価には含まれないが，終端状態固定条件式(2.2)が存在し1三p三n であるから，この部分の最適入力は自動的に決定することができる.

[一入力デッドビート原理]より，7=n+qとおくと， t = q，.・・，n+q- 1のとき，

x(t) = (A + bkd)t-q x(q) u(t) = kd(A + bkd)t-q x(q)

(2.99) (2.100)

(38)

となるので，

n+q-l-p

乞[x(t)'^Qpx(t) + 2x(t)'S川t) + r川t)2]= x(q)'Ï\x(q) (2.101) t=q

n+q-l-p

pq= 乞 {(A + bkd)t-q}'(^Qp + 2Spkd + rpkd'kã)(A + bkd)t-q (2.102) t=q

を得る. なお，総和記号の上限が下限よりも小さいときは，その和を零とおき，以後同様とする. ここで，式(2.90)より

Qp = A'^Qp-lA 1 Sp = A'^Qpーlb

}

rp = b'^Qp-l b

J

(2.103)

であるから，

Qp + 2Spkd + rpkã'kd = (A + bkd)'^Qp-l(A + bkd) (2.104)

を得，式(2.102)は

pq=乞{(A + bkdr}'^Qp-l(A + bkã)t (2.105) t=l

と表わすこともできる. よって，評価の加法性より式(2.96)は

nu

x Q

yd s

n +

nu，a 一一

-一2 x

nu ピL同

+

;老z μ何凶州附(い例仰tけげ拘)'川F司Q仏戸川州X刈吋(れωtけ)

₊

2x制川附(れω附tけ)

となり弘，固定終端最適制御問題が，最短時間デッドビート制御と新しい終端状態x(q) が自由な自由終端最適制御問題に変換される.

この相乗項を含む最適制御問題は，相乗項を含まない通常の最適制御問題に変換されることが知られており3)， ^2.4節と同様にして解を求めることができる. このとき，最適入力は次のようになる.

( b'P(t+1)A+Sp'

♂刊州(い例tけ)

=

� ^一 ^刊

l

_{kdX(れωtの)} _(いt=q _，..._{，n+q一1け}₎

(2.107)

ここで， n ^xn半正定対称行列P(t)はリカッチ方程式

ー一一 A'P(t + l)bb'P(t + 1)λ

P(t) = ^Q+ A'Þ(t + l)A一一 (2.108)

rp + b'P(t + l)b

(39)

-，::

^SnSn'

Q= Qp ー

t

^L

- bSn'

A=A一一-p fp

(2.109)

(2.110) より求まり，リカッチ方程式の終端条件は

:Þ(q) =乞{(A+ b�)γQp-1(A + b�)'

つ臼〆'a・‘、噌ai噌，i 、、.E，，，噌，i

ー=1

である. さらに，評価の最小値は，

与(T)=

;

x(0)?(0)+日i]X(O) (2.1 12)

となる.

ところで，式(2.103)より，式(2.107)と式(2. 108)は，それぞれ b'[P(t + 1) + Qp-dA

ザ(t) =一一 X(t)

b'[P(t + 1) + Qp-1]b (2.113)

'[P(t + 1) + Qpーl]bb'[P(t+ 1) + Qp-1]A :Þ(t) = A'[:Þ(t + 1) + Qpーl]A -

b'[P(t + 1) + Qp-1]b

(2. 1 14)

となる. よって，

P(t) = f>(t) + L Qi (2.1 15)

とおくと，式(2.93)より

[f>(t + 1) + L Qi]b = [f>(t + 1) + Qpーl]b (2.116)

i=O

となるので，次の定理を得る.

[定理2. 3] (特異型LQ最適制御) 任意の初期状態X(O) に対し，終端状態固定条件

x(n + q) = ⁰ のもとで，特異型二次形式評価

x Q

x

tL日

1一2

一一

ηwa

+ n

s yd

_{(2.1 17)}

(40)

を最小にする最適入力は次のようになる.

u*(t) = ks(n + q， t)x(t) (2.118)

( b'P(t+1)A ^1. nぃ

ks(n+ 州 =

�

^- ^b町+ゆ ^{い = U}^{，" '，q}^- ^l) ^(2.119)

l � (t = q，'・1η+ q -1)

ここで， kdは式(2.8)より求まる狭義のデッドビートゲインであり， n xη半正定対称行列P(t) はリカッチ方程式

A'P(t + 1)bb'P(t + 1)A P(t) = Q + A'P(t + 1)A-

b'P(t + 1)b P(q) =

乞

{(A + b�)γQp-1(A + bl叫'+

乞

^Qi

(2.120)

(2.121)

，=1 ，=0

より求まる. なお，正則条件pは式(2.94)より得られ， Qiは式(2.90)で与えられる. さらに，評価の最小値は，

、、l'/ハU〆'a，、、X 、、，，，，nu ，，a・‘、P 、、.E，，，nU 〆，a，、、X 1一2一一、、EE，rT ，，a・‘、-cu FJ _(2.122)

となる. •

これまでは完全な解が得られていなかった自由終端問題と無限制御時間問題に対しでも，同様の手法により特異性を解消し，最適制御を求めることができる.

自由終端の場合には，評価の終端と決定できる入力の個数が異なることに注意しなければならない. すなわち，評価の終端をe，決定できる入力の個数をTとすると，

e=r+p-1 (2.123)

となり，自由終端特異型LQ最適制御問題は，決定されるァ個の入力によって生じる状態x(r) が自由な問題と考えなければならない. よって，このとき次の定理を得る.

[定理2.4] (自由終端特異型LQ最適制御) 特異型二次形式評価ゐ作

九州大学学術情報リポジトリ