Chapter 4

(1)

Chapter 4 可観測性と状態観測器

前章で述べた状態フィードバック制御は，状態量すべてをフィードバック制御に利用することを前提としているが，実際に制御系を構成する場合，観測できるのは状態量の一部のみである。そこで，本章ではこれら観測量を利用して状態量を推定することについて述べる。

4.1 ^可観測性

最初に，状態量の推定にもっとも関わりの深い性質である

可観測性

(observability) ^を定義しよう。

定義

4. 1 ( ^可観測性 )

_

x = Ax

y = Cx (4:1)

において，ある有限時刻 t

_f

^{までの出力} y(t) (0 î t î t

_f

) を観測することによって，初期状態 x(0) = x ₀ を一意に決定できるとき

可観測

(observable) ^{であるという。}

状態方程式 x _ = Ax ^の解は x = e

^At

x(0) で与えられる。したがって，系が可観測であるならば，観測量 y から一意に決定された初期状態 x(0) を利用して，任意の時刻における状態量 x を得ることができる。ところで，式 (4:1) ^{には操作量} u に関する項が含まれていない。これは操作量は既知であり，それによる状態量は

x =

Z

_t

0 e

^A(tÄú)

Bu(ú )dú

から決定できるためである。このように，系の可観測性はシステム行列 A ^{ならびに観測行} 列 C によって定まるので，対 (C; A)

^{が可観測である}

という言い方をすることがある。

次に，系が可観測であるための必要十分条件を以下の定理に示す。

{ 4.1 {

(2)

定理

4. 1

以下に示す条件は互いに等価である。

(1) ^対 (C; A) ^{が可観測。}

(2)

^{可観測行列}

(observability matrix)

W =

2 66 66 66 66 4

C CA CA ² ...

CA

^nÄ1

3 77 77 77 77 5

がフル ( ^列 ) ランクをもつ。すなわち， rank(W ) = n (3)

^{可観測性グラミアン}

(observability grammian)

G

_o

(t) =

Z

_t

0 e

^A^T^ú

C

^T

Ce

^Aú

dú が任意の時刻 t ^{に対して正則}

(4) ^任意の ï 2 C ^に対して rank

2 4 ïI Ä A C

3 5 = n

(5) A Ä HC の固有値を任意に指定できる行列 H ^{が存在する。}

前章で述べた可制御性は，任意の初期状態 x(0) を原点に移動させる操作量の存在性に関するものであり，状態量の将来の振る舞いに関連しているのに対して，可観測性は初期状態 x(0) の推定，すなわち状態量の過去に関連していることに注意してほしい。

定理 4: 1 からもわかるように，対 (C; A) が可観測であることと対 (A

^T

; C

^T

) ^が可制御であることが等価であり，対 (A; B) が可制御であることと対 (B

^T

; A

^T

) ^{が可観測であるこ} とは等価である。このことを

双対性

(duality) と呼ぶ。双対性を利用すると，定理 3:1 ^と同様にして上述の定理を証明することができるので，ここでは省略する。

もし，系が可観測でないならば，可制御性のときと同様の議論から，次式に示すように可観測な部分とそうでない部分に分割する正則変換行列 T ^{が存在する。}

_

z = T

^Ä1

AT z =

2 4 A ^ ₁₁ 0 A ^ ₂₁ A ^ ₂₂

3 5 z y = CT z = [C ₁ 0]z

(4:2)

(3)

4.1. ^可観測性 { 4.3 { このとき，行列 A ^ ₂₂ が漸近安定であるならば，可検出 (detectable) であるという。これは，

ちょうど可安定性に対応した概念である。

例題

4. 1

倒立振子系に対して，振子の角度 í ^{ならびに台車の位置} z が計測できるときの可観測性を調べてみよう。この場合，観測行列は

C =

2 4 1 0 0 0 0 1 0 0

3 5

で与えられるので，これに対して可観測行列 W ^{を計算すると，}

W =

2 66 66 66 66 4

1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ... ... ... ...

3 77 77 77 77 5

となるので，可観測 (rank(W ) = 4) ^{であることがいえる。}

次に，振子の角度 í のみが観測できる場合を検討する。この場合， C = [0 1 0 0] ^であり，可観測行列 W ^は

W =

2 66 66 64

0 1 0 0 0 0 0 1 0 É É É 0 É É É

3 77 77 75

となる ( É ^は非 0 の値が入ることを意味する ) ^{。これより，} rank(W ) = 3(< 4) ^{であり，不可} 観測となる。これは，振子の角度のみの計測では，台車の初期位置を推定できないことから考えても当然の結果といえる。

また，振子の運動が台車に対して影響を与えないものとして倒立振子系の状態空間モデルを構成しているので，台車の位置 z の観測だけでは振子の状態を推定することはできない。実際， C = [1 0 0 0] に対して可観測行列のランクは 2 ^となる。

以上から，倒立振子系に対して可観測性を保証するためには，台車の位置 z ^{と振子の角} 度 í をともに観測する必要があることがわかる。

例題

4. 2

柔軟ビーム振動系においてアクチュエータを振動モードの節におくとそのモードが不可

制御になることを 4 次振動モードを例として示した。同様のことがセンサについてもいえ

る。第 i ^{次振動モードは} sin(iôx

_s

=L) を通して観測されるので，これが 0 ^{になる地点にセン}

サをおくとその振動モードは不可観測となる。本書では，センサの設置点が x

_s

= L=4 ^であ

(4)

るので，アクチュエータと同様に 4 次振動モードが不可観測となる。しかし，柔軟ビーム振動系は漸近安定であるので，センサの位置に無関係に可検出性は保証される。なお， 1 ò 3 次振動モードまで考慮した状態空間モデルは可観測である。

以上の準備の下で，次節以降で

状態観測器

(state observer) の構成について述べる。

4.2 ^{状態観測器}

制御対象の内部記述モデルである状態空間モデルは，状態量を用いて内部の状態を詳細に記述するためのものである。系が可制御である場合，その状態量をフィードバック制御に利用することで，制御した結果の閉ループ系の極の位置を任意に指定することが可能であり (3 ^{章の極配置} ) ^，また， 5 章でも述べるように，ある評価関数値を最小にするという意味で最適な制御系を構成することもできる。しかしながら，一般の制御対象においては，状態量をすべて観測することはできない場合がほとんどである。

たとえば，倒立振子系を考えてみよう。この系に対して，通常，状態量として台車の位置 z ^と速度 z _ ^{，振子の角度} í ^と角速度 í _ が選定される。台車の位置と振子の角度に関しては，ポテンショメータやエンコーダなどのセンサを利用することで比較的容易に計測が可能である。しかし，それらの速度の直接計測はそれほど容易なことではない。したがって，

倒立振子系に対して状態フィードバック制御系を構成するためには，何らかの手段を用いて速度ならびに角速度を推定する必要が生じる。位置から速度を求めるのは微分操作に対応するが，微分は高周波数帯域で高いゲインをもつために観測ノイズを増大して S=N ^比を悪化させる。また，計算機を利用してサンプリング時間中の位置の変化分から速度を推定しようとする場合，変化分が小さいとき有限語長による桁落ちの問題が生じる。

本章で述べる状態観測器は制御対象の内部記述モデルに基づいて観測できる量から状態量を推定するためのものであり，状態フィードバック制御系の構成のためには欠かすことのできないものである。

次節以降で対象とする状態空間モデルを改めて次式に示す。

_

x = Ax + Bu

y = Cx (4:3)

ここで，状態空間モデルは可制御かつ可観測であると仮定する。また，我々が手に入れることのできる情報は，操作量 u ^，観測量 y ならびに状態空間モデルを構成する行列 (A; B; C) である。一方，初期状態 x(0) ^{を含めて状態量} x は未知であり，これを推定するのが状態観測器ということになる。

4.3 ^{全状態観測器}

最初にシステム行列 A が漸近安定であると仮定して，次式を考える ( ^図 4:1 ^参照 ) ^。

(5)

4.3. ^{全状態観測器} { 4.5 {

System2 System2

B

A + 1/s

-

B

A + 1/s

-

u x

^ x

_推定値

図

4.1 ^{状態観測器の基本構成}

_^

x = A x ^ + Bu (4:4)

状態方程式は制御対象を意味しているのでその状態量 x を我々が手にすることはできないが，上式は我々が作成した微分方程式であるので，たとえば計算機上で数値的に状態量 x ^ を手にすることは可能である。

いま， x ^ ^と x ^{の推定誤差を} e = x Ä x ^ ^{と定義して，式} (4:3) ^と式 (4:4) ^{の差を求めると，}

簡単な計算から次式を得る。

_

e = Ae (4:5)

上式において注意すべき点は，操作量 u に関する項がキャンセルされる点である。つまり，

誤差 e ^{の挙動は操作量} u には無関係となる。このことは，誤差 e が不可制御となることを意味している。

一般に初期状態 x(0) が未知であることから， e(0) 6 = 0 であるが，システム行列 A ^が漸近安定であるならば，任意の初期誤差 e(0) 6 = 0 に対して時間の経過とともに誤差 e ^が 0 に向かうことが保証される。このことは， x ^ ^を x の推定値とみなしてよいことを意味して

おり，式 (4:4) は状態観測器と考えることができそうである。

しかし， 2 つの理由からこの状態観測器を利用することはできない。 1 ^{つは，システム行} 列 A の漸近安定性を前提としているために，倒立振子系や磁気浮上系のような不安定な制御対象には使用できないことである。また，たとえ漸近安定な系であったとしても，柔軟ビーム振動系のように安定度が低く応答の収束が非常にゆっくりとしたものである場合，

誤差 e の収束もそれに対応してゆっくりとしたものになる。これが利用できないもう 1 ^つの理由である。状態観測器によって推定された状態量は，あくまでも制御のために使用される。状態量の推定誤差は制御性能の悪化につながるので，できる限り速やかな推定が要求される。

式 (4:4) の状態観測器では，制御対象からの情報である観測量 y を用いていないので，そ

れを利用して上述の問題点を解消する状態観測器の構成を考える。いま，推定される状態

(6)

量を x ^ ^{とすると，} C^ x ^は観測量 y の推定値と考えることができ， y Ä C x ^ ^{により観測量に} 基づいて状態推定の度合いを知ることができる。そこで，

_^

x = A x ^ + Bu + H(y Ä C x) ^ (4:6) を考える。右辺第 3 項目が新たに付加された項である。上式に対する図 4:2 ^{のブロック線} 図と図 4:1 のそれを比較すると，この項がある種のフィードバックを構成していることがわかる。

B

A

1/s C

B

A

1/s C

H u

y x

x ^

y ^ +

+ +

+

+ +

-

図

4.2 ^{全状態観測器}

式 (4:6) が状態観測器として機能するのかどうかを調べるために，式 (4:5) ^{のときと同様}

に推定誤差 e = x Ä x ^ に関する式を求めてみる。簡単な計算から，

_

e = (A Ä HC )e (4:7)

が得られる。ここで， 4:1 節で述べた可観測性に関する定理を思い出してもらいたい。対

(C; A) が可観測である場合，行列 H を適切に選定することにより，行列 A Ä HC ^の固有

値を任意の位置に配置することが可能である。したがって，システム行列 A ^{が不安定で} あっても， A Ä HC を安定にすることが可能である。また，その極を適切な位置に配置することにより，誤差方程式の収束度を自在に操作することが可能となる。以上から，式 (4:6) は状態観測器としての資格をもつことが理解できる。特に，状態量すべてを推定するという意味で，これを

全状態観測器

(full state observer) と呼ぶ。また，以下では，行列 H ^をオブザーバゲイン， A Ä HC の極をオブザーバ極と呼ぶ。

例題

4. 3

磁気浮上系に対して全状態観測器を設計してみよう。

最初に可観測行列 W ^{を計算すると}

(7)

4.4. ^{最小次元観測器} { 4.7 {

W =

2 4 C

CA

3 5 =

2 4 1 0

0 1

3 5

であるので，磁気浮上系が可観測であることがいえる。いま，オブザーバゲインを h = [h ₁ h ₂ ]

^T

^{とすると，}

j sI Ä A + hc j =

å å å å å å

s + h ₁ Ä 1 h ₂ Ä ã s

å å å å

å å = s ² + h ₁ s + (h ₂ Ä ã ) を得る。ここで，希望するオブザーバ極を Ä 50 Ü 30j ^とすると

(s + 50 + 30j)(s + 50 Ä 30j) = s ² + 100s + 3400 であることから，係数比較により

h =

2 4 100

5760

3 5

を得る。

オブザーバ極の実部をより安定側に配置することで，理論上は誤差の収束性をいくらでも高めることができる。しかし，現実の系においては，観測ノイズが必ず存在するので，その影響を考えると必要以上の誤差の収束性を求めることは決して好ましいことではないことに注意が必要である。

4.4 ^{最小次元観測器}

前節で述べた状態観測器は状態量 x すべてを推定するものであった。しかし，それらの一部は観測量 y として手に入れることが可能である。そこで，手に入れることのできない状態量のみを推定する状態観測器の構成を次に考える。

一般性を失うことなく，観測行列 C ^{はフル行ランク} r をもつと仮定する。このとき，次に示す行列 T が正則となるような行列 C ñ 2 R ^(nÄr)Çn ^{が存在する。}

T =

2 4 C

C ñ

3 5 (4:8)

この行列を用いて状態空間モデル (4:3) ^{を正則変換} (ñ x = T x) すると次式が得られる。

_ñ

x = ñ A x ñ + ñ Bu

y = [I

_r

0]ñ x (4:9)

(8)

ここで， A ñ = T AT

^Ä1

; B ñ = T B である。観測方程式から，正則変換した結果得られる状態量 x ñ ^の最初の r 個が直接観測できることを意味していることは明らかである。

以降の記述を容易にするために，正則変換した式 (4:9) ^中の ñ を消去し，直接観測可能な状態量とそうでない状態量に対して次式のようにブロック行列表現する。

2 4 x _ 1

_ x ₂

3 5 =

2 4 A 11 A 12

A ₂₁ A ₂₂

3 5

2 4 x 1

x ₂

3 5 +

2 4 B 1

B ₂

3 5 u y = [I

_r

0]

2 4 x ₁

x 2

3 5

(4:10)

上式をさらに

_

x ₂ = A ₂₂ x ₂ + (A ₂₁ x ₁ + B ₂ u) _

x 1 Ä A 11 x 1 Ä B 1 u = A 12 x 2

(4:11) と変形する。第 1 ^{式を状態方程式，第} 2 式を観測方程式と考えて， x 1 が観測量であることを考慮して， x ₂ に対して前節で述べた全状態観測器を構成すると，

_^

x 2 = A 22 x ^ 2 + (A 21 x 1 + B 2 u)

+H( _ x ₁ Ä A ₁₁ x ₁ Ä B ₁ u Ä A ₁₂ x ^ ₂ ) (4:12) が得られる。このときの誤差 e ₂ = x ₂ Ä x ^ ₂ ^{に対する方程式は，}

_

e ₂ = (A ₂₂ Ä HA ₁₂ )e ₂ (4:13) であるので， A 22 Ä HA 12 が漸近安定であれば時間の経過とともに推定誤差 e 2 が 0 ^に漸近することが保証される。このことに関して次の定理が成り立つ。

定理

4. 2

対 (A ₁₂ ; A ₂₂ ) が可観測であるための必要十分条件は状態空間モデル (4:3) ^{が可観測である} ことである。

【証明】任意の ï 2 C ^に対して

rank

0 B B

@ 2 66 4

ïI

_r

Ä A ₁₁ Ä A ₁₂ Ä A ₂₁ ïI

_nÄr

Ä A ₂₂

I

_r

0 3 77 5

1 C C

A = r + rank

0 @ 2

4 ïI

_nÄ_r

Ä A ₂₂ A ₁₂

3 5

1 A (4:14)

が成り立つことから明らかである。

したがって，系が可観測であれば，適切に H を選定することで，行列 A ₂₂ Ä HA ₁₂ ^の固有

値を任意に指定できることがわかる。

(9)

4.4. ^{最小次元観測器} { 4.9 { ところで，式 (4:12) ^{を実現するためには，} x _ ₁ が必要であり，このままでは実現できない。

そこで， z = ^ x ₂ Ä Hx ₁ と定義して書き直すと次式が得られる。

_

z = (A ₂₂ Ä HA ₁₂ )z + (B ₂ Ä HB ₁ )u

+(A ₂₁ Ä HA ₁₁ + (A ₂₂ Ä HA ₁₂ )H)y u = Ä k 1 x 1 Ä k 2 x ^ 2 = Ä k 2 z Ä (k 1 + k 2 H)y

(4:15) 上式中第 1 ^{式が状態量} x ₂ を推定するための状態観測器となる。特にこの状態観測器のことを

最小次元状態観測器

(minimal order state observer) と呼ぶ。前節で述べた全状態観測器はすべての状態量を推定する構成となっているために n 次であったのに対して，最小次元状態観測器は n Ä r 次となる。したがって，状態観測器を計算機上に実装することを考えたとき，より少ない計算量で状態の推定値 (^ x ₂ ) を得ることができるという利点をもつ。ただし，最小次元観測器を用いて構成した制御器は系の出力をフィードバック制御に直接利用するために，式 (4:15) からもわかるように観測器が直達項をもつ。そのため，観測量がノイズで乱されているような場合，それが操作量に直接影響する。そのような場合には，直接観測できる状態量をあえて推定する構成の全状態観測器を用いることにより，その影響を低減することが可能となる。

例題

4. 4

磁気浮上系に対して最小次元状態観測器を設計してみよう。

_ x =

2 4 0 1

ã 0

3 5 x +

2 4 0

å

3 5 u y = [1 0]x

この系は式 (4:9) の構造をもつので正則変換を行う必要はない。式 (4:10) ^{との対応から} A ₁₁ = 0; A ₁₂ = 1; A ₂₁ = ã; A ₂₂ = 0

B ₁ = 0; B ₂ = å

を得る。対 (A 12 ; A 22 ) ^{は可観測であるので} A 22 Ä hA 12 を漸近安定とする h ^{が存在する。い} ま， A ₂₂ Ä hA ₁₂ ^の極を ç ^とすると

h = Ä ç

を得る。以上を式 (4:15) ^{に代入すると} z を推定する最小次元状態観測器を得る。

_

z = çz + åu + (ã Ä ç ² )y

また，この推定値を用いたとき操作量 u ^は

(10)

u = Ä (k ₁ Ä k ₂ ç )y Ä k ₂ z

で与えられるので，観測量 y = x ₁ ^{から操作量} u ^{までの伝達関数} K(s) ^{を計算すると次式} が得られる。

K(s) = Ä k ₁ + k ₂ çs Ä ã+ åk 1

s Ä ç+ åk ₂

これに対して，オブザーバ極を安定側に移動させていくと ç ! Ä1 ^のとき K(s) = Ä k ₁ Ä k ₂ s

に漸近することがわかる。このことは最小次元観測器が微分器に漸近することを意味する。

磁気浮上系では最小次元観測器で推定するのが鉄球の速度であることを考えると合理的な構造をもつといえる。

4.5 状態観測器を用いたフィードバック制御系

状態観測器を利用することで状態量 x が推定できることをみてきたが，推定誤差 e = x Ä x ^ がほぼ 0 に収束するまでは誤差が存在する。したがって，その誤差によって閉ループ系の安定性が保証されるのかどうかを調べておく必要がある。本節では，状態観測器を用いたときの閉ループ系の特性について検討する。なお，状態観測器は全状態観測器を使用するものとする。

全状態観測器を用いたときの制御器は次式に変形できる。

_^

x = (A Ä BK Ä HC )^ x + Hy + Br

u = Ä K x ^ + r (4:16)

ここで r は目標値を意味する。したがって，閉ループ系の状態空間モデルは次式で与えられる。

2 4 x _

_^

x

3 5 =

2 4 A Ä BK

HC A Ä BK Ä HC

3 5

2 4 x

^ x

3 5 +

2 4 B

B

3 5 r y = [C 0]

2 4 x

^ x

3 5

(4:17)

上式に対して，次の正則行列

T =

2 4 I 0 Ä I I

3 5 (4:18)

(11)

4.5. 状態観測器を用いたフィードバック制御系 { 4.11 { を用いて正則変換を行うと，

2 4 x _

_ e

3 5 =

2 4 A Ä BK BK 0 A Ä HC

3 5

2 4 x

e

3 5 +

2 4 B

0 3 5 r y = [C 0]

2 4 x

e

3 5

(4:19)

が得られる (e = x Ä x) ^ 。上式は閉ループ系の極が A Ä BK ^と A Ä HC ^{によって与えられる} ことを意味している。つまり，状態量が直接手に入ることを前提として状態フィードバックゲイン K を選定し，誤差方程式が漸近安定となるようにオブザーバゲイン H ^を選定すれば閉ループ系の漸近安定性は必ず保証される。

また，上式において誤差 e が不可制御であるので，目標値 r ^から出力 y ^{までの伝達行列} G(s) ^{を求めると，}

G(s) = C(sI Ä (A Ä BK ))

^Ä1

B (4:20) となり，状態フィードバック制御を施したときの閉ループ伝達行列と一致する。伝達行列は，系に対して正弦波を加えたときに十分時間が経過した後の特性を表している。この場合，誤差 e ^は 0 となるので，伝達特性に現れないことは当然の結果といえよう。

例題

4. 5

倒立振子系に対して全状態観測器を構成しよう。台車の位置と振子の角度が計測できる場合，この系は可観測であることは例題 4:2 で確認済みであるので，行列 A Ä HC ^が漸近安定となるようにオブザーバゲイン H を設計することができる。対 (C; A) ^{が可観測であ} ることと対 (A

^T

; C

^T

) が可制御であることは等価であり，行列の固有値は転置に対して不変であることから，行列 (A Ä HC )

^T

= A

^T

Ä C

^T

H

^T

に対して，前章で述べた極配置法を適用すればよい。例題 3:9 ^{では閉ループ極が} Ä 3; Ä 5 Ü 3j; Ä 240 となるように状態フィードバックゲイン k が設計されているので，オブザーバ極はそれよりも安定側に選定すべきである。そこで，オブザーバ極を Ä 10; Ä 12 Ü 3j; Ä 250 と選んだときのオブザーバゲイン H ^{を以下に示す。}

H =

2 66 66 64

10:67 Ä 2:346 Ä 2:690 33:31 Ä 154:1 544:8 569:6 Ä 1827:

3 77 77 75

図 4:3 はフィードバック制御を施した閉ループ系に対する初期値応答を描いたものである。

図中，実線は台車の位置と振子の角度，破線はそれらを全状態観測器で推定した結果である。なお，系の初期状態は，例題 3:9 と同じものとし，観測器中の状態量の初期値はすべて 0 としている。図より状態観測器が良好に状態量を推定していることがわかる。また，

図 4:4 は状態フィードバック制御の結果 ( ^図中点線 ) との初期値応答の比較を行っている。

推定誤差の影響を受けて後者の応答が若干遅れていることがわかる。

(12)

0 1 2 3 -0.05

0 0.05 0.1 0.15

Time[sec]

Cart[m]

Pendulum[rad]

図

4.3 全状態観測器を用いたときの振子系の制御結果

0 1 2 3

Time[sec]

0.1

0 -0.1

Cart[m]

Pendulum[rad]

図

4.4 状態フィードバック制御結果との比較

(13)

4.6. 全状態観測器を用いた状態フィードバック制御器の周波数特性 { 4.13 {

4.6 全状態観測器を用いた状態フィードバック制御器の周波数特性

式 (4:16) ^{において目標値} r ^を 0 ^とおくと _^

x = (A Ä BK Ä HC)^ x + Hy

u = Ä K x ^ (4:21)

を得る。これが，制御対象から観測量 y ^{を受け取って操作量} u を出力する制御器の基本構造となる。たとえば，前節の倒立振子の例に対する制御器を求めると，

ak = A Ä BK Ä HC =

2 66 66 64

Ä 10:67 2:346 1:000 0 2:690 Ä 33:31 0 1:000 826:8 507:1 425:3 182:8 Ä 3065: Ä 2040: Ä 1578: Ä 678:3

3 77 77 75

bk = H =

2 66 66 64

10:67 Ä 2:346 Ä 2:690 33:31 Ä 154:1 544:8 569:6 Ä 1826:

3 77 77 75

ck = Ä K = ^h 7:474 11:70 7:392 2:032 ⁱ を得る。この制御器の極を計算すると，

6:654; Ä 10:05; Ä 47:80; Ä 245:8

となり，得られた制御器が不安定であることがわかる。倒立振子系に対する制御目的は倒立振子を安定化する，つまり閉ループ系を漸近安定にすることであり，必ずしも制御器が安定であることを要求しているわけではない。しかし，制御器の実装を考えた場合，漸近安定な制御器の方が好ましい。このように，閉ループ系を安定化する漸近安定な制御器のことを絶対安定化制御器と呼ぶ。

ところで，上述の制御器に対して BODE 線図を描いたのが次図である。

図より全状態観測器を用いた場合，制御器がローパス特性をもつことがわかる。この特性

は，状態フィードバックゲイン K ならびにオブザーバゲイン H に依存して異なるが，こ

れらが適切に設計されていれば，観測ノイズの影響を低減可能である。一方，最小次元観

測器の場合は制御器が必ず直達項をもつために，ローパス特性が悪化し，観測ノイズの影

響を受けやすくなる可能性がある。

(14)

10 -1

10 0

10 1

10 2

10 3 -40

-20 0 20

Freq.[rad/sec]

-60 -90 -120 -150 -180

Freq.[rad/sec]

10 -1 10 0 10 1 10 2 10 3

Gain[dB]

Phase[deg]

図

4.5 BODE 線図：台車の位置から操作量まで

4.7 ^{汎関数観測器}

全 ( ^最小次元 ) ^{状態観測器は状態量} x を推定するためのものである。これによって推定された状態量 x ^ は状態フィードバック制御を実現するために利用される。もちろん，状態量が正確に推定できれば十分であるが，操作量を作り出すのに状態フィードバックゲイン K が掛けられることを考えると，必ずしも状態量が正確に推定されなくても Kx ^が推定されれば制御の上からは問題がない。このように Kx ^{を推定する観測器を}

^{線形関数観測器}

(linear functional observer) という。この線形関数観測器に関して次の定理が成り立つ。

定理

4. 3

次式に示す p 次元動的システムを考える。ここで z 2 R

^p

^。 _

z = ^ Az + ^ Hy + ^ Bu

v = ^ Cz + ^ Dy (4:22)

このとき，この動的システムが線形関数観測器であるための必要十分条件は， A ^ ^が漸近安定であり，

AU ^ + ^ HC = UA B ^ = U B

CU ^ + ^ DC = Ä K

(4:23)

を満足する行列 U 2 R

^pÇn

が存在することである。

式 (4:23) ^{を満足する} U が存在すると仮定すると，簡単な式変形から

(15)

4.7. ^{汎関数観測器} { 4.15 {

-10 0 10 20 30

-60 -90 -120 -150 -180

Freq.[rad/sec]

10 -1 10 0 10 1 10 2 10 3

Freq.[rad/sec]

10 -1 10 0 10 1 10 2 10 3

Gain[dB]

Phase[deg]

図

4.6 BODE 線図：振子の角度から操作量まで

_

z Ä U x _ = ^ A(z Ä U x) が得られ，行列 A ^ が漸近安定であるならば lim

t!1

z Ä U x = 0 ^{となる。さらに} v = Ä Kx + ^ C(z Ä Ux)

であることから lim

t!1

v = Ä Kx ^{となり，式} (4:22) は線形関数観測器であることがいえる。

全状態観測器 (4:6) ^の場合，

A ^ = A Ä HC; B ^ = B; C ^ = Ä K; H ^ = H; D ^ = 0

であり， U = I ^{に対して式} (4:23) の条件が満たされる。したがって，線形関数観測器であることがいえる。また，状態空間モデル (4:10) に対する最小次元状態観測器 (4:15) ^も同様に線形関数観測器であることを示すことができる。

kx ^{がスカラとなる} 1 入力系に対する線形関数観測器を特に

汎関数観測器

(functional

observer) と呼び，観測器の最小次数や構成法が与えられている。たとえば，メカニカルシ

ステムに対する標準的な状態空間モデル

_ x =

2 4 0 I

_n

Ä A ₂₁ Ä A ₂₂

3 5 x +

2 4 0

b ₂

3 5 u y = [I

_n

0]x

(4:24)

ここで， A ₂₁ ; A ₂₂ 2 R

^nÇn

^。

(16)

に対しては 1 次元の汎関数観測器を構成することが可能である。以下の例でそのことを示そう。

例題

4. 6

式 (4:24) のブロック構造に合わせて U = [U ₁ U ₂ ]; k = [k ₁ k ₂ ] ^{とする。ここで} U ₁ ; U ₂ 2 R

^nÇn

^であり， k ₁ ; k ₂ ^は n 次元横ベクトルである。また， 1 次元汎関数観測器であることから A; ^ B; ^ C ^ はいずれもスカラであり， D; ^ H ^ ^は n 次元の横ベクトルとなる。以下では，

これらを小文字 ^ a; ^ b; ^ c; d; ^ ^ h ^{で表すことにする。式} (4:23) ^中の第 1 ^式

^

a[U 1 U 2 ] + ^ h[I

n

0] = [U 1 U 2 ]

2 4 0 I

_n

Ä A ₂₁ Ä A ₂₂

3 5

より，

^

aU ₁ + ^ h = Ä U ₂ A ₂₁ ; ^ aU ₂ = U ₁ Ä U ₂ A ₂₂ を得る。また，第 2 ^式より

^ b = [U ₁ U ₂ ]

2 4 0

b ₂

3 5 = U ₂ b ₂ さらに第 3 ^式

^

c[U ₁ U ₂ ] + ^ d[I

_n

0] = Ä [k ₁ k ₂ ] より

^

cU ₁ + ^ d = Ä k ₁ ; ^ cU ₂ = Ä k ₂ を得る。

以上から， ^ a < 0 ^{に選び，適当な} ^ c 6 = 0 ^に対して U ₂ = Ä k ₂ =^ c

U ₁ = U ₂ (^ aI Ä A ₂₂ )

^ b = U 2 b 2

h ^ = Ä ^ aU ₁ Ä U ₂ A ₂₁ d ^ = Ä k ₁ Ä cU ^ ₁

とすれば汎関数観測器の条件 (4:23) をすべて満足することになる。なお，この結果を式

(4:22) に代入すると，汎関数観測器の入出力特性は ^ c の選び方には依存しないことを示す

ことができる。したがって， c ^ = 1 として汎関数観測器を計算すると次式を得る。

_

z = ^ az + (^ ak 2 (^ aI Ä A 22 ) + k 2 A 21 )y Ä k 2 b 2 u

u = z + ( Ä k ₁ + k ₂ (^ aI Ä A ₂₂ ))y (4:25)

(17)

4.7. ^{汎関数観測器} { 4.17 { たとえば，倒立振子系の場合

A ₂₁ =

2 4 0 0 0 Ä p ₁ g

3 5 ; A ₂₂ =

2 4 ê 0

Ä p ₁ ê 0

3 5 ; b ₂ =

2 4 ò

Ä p ₁ ò

3 5

であり，例題 3:10 の状態フィードバックゲインを用いたとすると，汎関数観測器を構成する ^ b; ^ h; d ^ ^{は次式となる。}

^ b = ê Ä å ₃

^ h = 1 ò [ Ä å ₁ ^ a ²

p ₁ g + ê a(å ^ ₃ Ä ^ a Ä ê ); ( å ₁

p ₁ + å ₃ g)(1 Ä ^ a ² p ₁ g )]

d ^ = 1 ò [ å ₀ Ä å ₁ ^ a

p ₁ g + ê (å ₃ Ä ^ a Ä ê ); å ⁰ Ä å ₁ ^ a

p ² ₁ g + g + å ₂ Ä å ₃ ^ a p ₁ ]

^

a = Ä 10 として各パラメータ値を代入すると

^

a = Ä 10

^ b = Ä 13

^ h = [ Ä 1085:; Ä 129:2]

d ^ = [116:0; 31:96]

を得る。この汎関数観測器を用いたシミュレーション結果を図 4:7 ^{に示すが，安定に制御} が行われていることが確認できる。

0 1 2 3

-0.4 -0.2 0 0.2 0.4

-0.6

Time[sec]

Pendulum[rad]

Cart[m]

図

4.7 汎関数観測器を用いた倒立振子系のシミュレーション結果

(18)

4-1 ^演習問題 3:2 ^{のシステム行列} A をもつ系において状態量 x ^を

x =

2 66 4

x ₁ x ₂ x ₃

3 77 5

としたとき，可観測性を満たすためには何を観測すべきなのかを é= 0 ^ならびに é= 1 に対して検討しなさい。

4-2 ^対 (C; A) が可観測であることと対 (A

^T

; C

^T

) が可制御であることが等価であることを示しなさい。

4-3 直達項をもつ状態空間モデル

_

x = Ax + Bu y = Cx + Du に対して，全状態観測器を設計しなさい。

4-4 ^演習問題 3:5 の系に対して，可観測性を確認後，全状態観測器と最小次元観測器を設計しなさい。さらに，それらの観測器を用いた制御器の BODE ^{線図を描き，比較し} なさい。

4-5 最小次元状態観測器が線形関数観測器であることを証明しなさい。

4-6 ^演習問題 1:2 中の複合水槽系が可観測となるためには，少なくとも何を観測すべきかを検討しなさい。

4-7 倒立振子系の振子の角度を計測するために利用可能なセンサを列挙し，それぞれの特長を述べなさい。

{ 4.18 {

Chapter 4

Chapter 4

可観測性と状態観測器

4.1 可観測性

最初に，状態量の推定にもっとも関わりの深い性質である

(observability) を定 義しよう。

4. 1 ( 可観測性 )

_

x = Ax

y = Cx (4:1)

において，ある有限時刻 t

までの出力 y(t) (0 î t î t

) を観測することによって，初期 状態 x(0) = x 0 を一意に決定できるとき

(observable) であるという。

状態方程式 x _ = Ax の解は x = e

x =

Z

0 e

Bu(ú )dú

から決定できるためである。このように，系の可観測性はシステム行列 A ならびに観測行 列 C によって定まるので，対 (C; A)

という言い方をすることがある。

次に，系が可観測であるための必要十分条件を以下の定理に示す。

{ 4.1 {

4. 1

以下に示す条件は互いに等価である。

(1) 対 (C; A) が可観測。

(2)

(observability matrix)

W =

2 66 66 66 66 4

C CA CA 2 ...

CA

3 77 77 77 77 5

がフル ( 列 ) ランクをもつ。すなわち， rank(W ) = n (3)

(observability grammian)

G

(t) =

Z

0 e

C

Ce

dú が任意の時刻 t に対して正則

(4) 任意の ï 2 C に対して rank

2

4 ïI Ä A C

3 5 = n

(5) A Ä HC の固有値を任意に指定できる行列 H が存在する。

定理 4: 1 からもわかるように，対 (C; A) が可観測であることと対 (A

; C

) が可制御 であることが等価であり，対 (A; B) が可制御であることと対 (B

; A

) が可観測であるこ とは等価である。このことを

(duality) と呼ぶ。双対性を利用すると，定理 3:1 と同 様にして上述の定理を証明することができるので，ここでは省略する。

もし，系が可観測でないならば，可制御性のときと同様の議論から，次式に示すように 可観測な部分とそうでない部分に分割する正則変換行列 T が存在する。

_

z = T

AT z =

2

4 A ^ 11 0 A ^ 21 A ^ 22

3 5 z y = CT z = [C 1 0]z

(4:2)

4.1. 可観測性 { 4.3 { このとき，行列 A ^ 22 が漸近安定であるならば，可検出 (detectable) であるという。これは，

ちょうど可安定性に対応した概念である。

4. 1

倒立振子系に対して，振子の角度 í ならびに台車の位置 z が計測できるときの可観測性 を調べてみよう。この場合，観測行列は

C =

2

4 1 0 0 0 0 1 0 0

3 5

で与えられるので，これに対して可観測行列 W を計算すると，

W =

2 66 66 66 66 4

1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ... ... ... ...

3 77 77 77 77 5

となるので，可観測 (rank(W ) = 4) であることがいえる。

次に，振子の角度 í のみが観測できる場合を検討する。この場合， C = [0 1 0 0] で あり，可観測行列 W は

W =

2 66 66 64

0 1 0 0 0 0 0 1 0 É É É 0 É É É

3 77 77 75

4.1 ^可観測性

(observability) ^を定義しよう。

4. 1 ( ^可観測性 )

^{までの出力} y(t) (0 î t î t

) を観測することによって，初期状態 x(0) = x ₀ を一意に決定できるとき

(observable) ^{であるという。}

状態方程式 x _ = Ax ^の解は x = e

から決定できるためである。このように，系の可観測性はシステム行列 A ^{ならびに観測行} 列 C によって定まるので，対 (C; A)

(1) ^対 (C; A) ^{が可観測。}

C CA CA ² ...

がフル ( ^列 ) ランクをもつ。すなわち， rank(W ) = n (3)

dú が任意の時刻 t ^{に対して正則}

(4) ^任意の ï 2 C ^に対して rank

(5) A Ä HC の固有値を任意に指定できる行列 H ^{が存在する。}

) ^が可制御であることが等価であり，対 (A; B) が可制御であることと対 (B

) ^{が可観測であるこ} とは等価である。このことを

(duality) と呼ぶ。双対性を利用すると，定理 3:1 ^と同様にして上述の定理を証明することができるので，ここでは省略する。

もし，系が可観測でないならば，可制御性のときと同様の議論から，次式に示すように可観測な部分とそうでない部分に分割する正則変換行列 T ^{が存在する。}

4 A ^ ₁₁ 0 A ^ ₂₁ A ^ ₂₂

3 5 z y = CT z = [C ₁ 0]z

4.1. ^可観測性 { 4.3 { このとき，行列 A ^ ₂₂ が漸近安定であるならば，可検出 (detectable) であるという。これは，

倒立振子系に対して，振子の角度 í ^{ならびに台車の位置} z が計測できるときの可観測性を調べてみよう。この場合，観測行列は

で与えられるので，これに対して可観測行列 W ^{を計算すると，}

となるので，可観測 (rank(W ) = 4) ^{であることがいえる。}

次に，振子の角度 í のみが観測できる場合を検討する。この場合， C = [0 1 0 0] ^であり，可観測行列 W ^は

となる ( É ^は非 0 の値が入ることを意味する ) ^{。これより，} rank(W ) = 3(< 4) ^{であり，不可} 観測となる。これは，振子の角度のみの計測では，台車の初期位置を推定できないことから考えても当然の結果といえる。

以上から，倒立振子系に対して可観測性を保証するためには，台車の位置 z ^{と振子の角} 度 í をともに観測する必要があることがわかる。

る。第 i ^{次振動モードは} sin(iôx

=L) を通して観測されるので，これが 0 ^{になる地点にセン}

= L=4 ^であ

4.2 ^{状態観測器}

本章で述べる状態観測器は制御対象の内部記述モデルに基づいて観測できる量から状態量を推定するためのものであり，状態フィードバック制御系の構成のためには欠かすことのできないものである。

4.3 ^{全状態観測器}

最初にシステム行列 A が漸近安定であると仮定して，次式を考える ( ^図 4:1 ^参照 ) ^。

4.3. ^{全状態観測器} { 4.5 {

4.1 ^{状態観測器の基本構成}

状態方程式は制御対象を意味しているのでその状態量 x を我々が手にすることはできないが，上式は我々が作成した微分方程式であるので，たとえば計算機上で数値的に状態量 x ^ を手にすることは可能である。

いま， x ^ ^と x ^{の推定誤差を} e = x Ä x ^ ^{と定義して，式} (4:3) ^と式 (4:4) ^{の差を求めると，}

誤差 e ^{の挙動は操作量} u には無関係となる。このことは，誤差 e が不可制御となることを意味している。

量を x ^ ^{とすると，} C^ x ^は観測量 y の推定値と考えることができ， y Ä C x ^ ^{により観測量に} 基づいて状態推定の度合いを知ることができる。そこで，

x = A x ^ + Bu + H(y Ä C x) ^ (4:6) を考える。右辺第 3 項目が新たに付加された項である。上式に対する図 4:2 ^{のブロック線} 図と図 4:1 のそれを比較すると，この項がある種のフィードバックを構成していることがわかる。