ばらつき抑制のための確率最適制御

(1)

. . . .

.

ばらつき抑制のための確率最適制御

藤本健治 (名古屋大学)

http://www.haya.nuem.nagoya-u.ac.jp/˜fujimoto/

2011

年 3 月 9–11 日力学系の応用研究集会

(2)

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(3)

. . . .

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(4)

フィードバック制御 (1/2)

フィードバック制御

Plant

Controller

+

-u

y

r

目的

与えられた Plant に対して Controller を設計して

lim

t

→∞

∥y(t) − r(t)∥ = 0

を達成する

Plant:

状態空間モデル

非線形の微分方程式

dx

dt

= f(x(t), u(t))

y(t)

= h(x(t), u(t))

線形の漸化式

x(t

+ 1) = A x(t) + B u(t)

y(t)

= C x(t) + D u(t)

(5)

. . . .

フィードバック制御 (2/2)

フィードバック制御

Plant

Controller

+

-u

y

r

制御するためには...

モデルの同定・推定

x(t

+ 1)

=

A

x(t)

+

B

u(t)

y(t)

=

C

x(t)

+

D

u(t)

モデルに基づく制御 (内部状態

x(t)

の推定は別途)

u(t)

=

K

x(t)

(6)

確定 vs 確率

最尤推定 (

確定

) vs

ベイズ推定 (

確率

)

x

y

o

_x

y

o

(7)

. . . .

確定 vs 確率

最尤推定 (

確定

)

○ もっともあり得そうな値 (

最尤値

)

を推定するが，推定値の確からしさ

は不明

○ 計算量は多くない

×

自由度は少ない

ベイズ推定 (

確率

)

◎

最尤値だけでなく

確率密度関数

が推定できる

×

計算量は多い (積分計算は

近似

するか

数値計算

)

○ 自由度が高い

○ 確定データ以外の

事前情報

を用いることができる

(8)

確定 vs 確率

制御工学では

確定的な推定値

を求める推定法が主流

カルマンフィルタ (⇐

最尤推定

)

最小二乗法 (⇐

最尤推定

)

部分空間法 (⇐ 特異値分解・主成分分析)

機械学習の分野では両方の研究がある

EM

アルゴリズム

(

⇐

最尤推定

+

近似

+

ダイナミックモデル

)

モンテカルロ法 (⇐

ベイズ推定

+

数値計算

)

ラプラス近似 (⇐

ベイズ推定

+

近似

)

変分ベイズ法

(

⇐

ベイズ推定

+

近似

+

ダイナミックモデル

)

(9)

. . . .

ばらつき抑制のための最適制御

ベイズ推定された結果をどう制御に活かすか?

⇒

ばらつき抑制に利用したい!

!"#$%"

&"'()!*)!+!

,"

!"#$%"

&"'()!*)!+!

,"

-.$/0.-!

120/234.!

これまでのロバスト制御は「確定的な」誤差しか扱えなかった

(10)

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(11)

. . . .

ベイズ推定

X

Y

p(Y|X)

見えない入力

X

から

見える出力

Y

が生成されるとして，

Y

が与えら

れたとき

X

の「事後確率」

p(

X

|

Y

)

を推定する問題

å

X

,

Y

の同時分布は次を満たす．

p(

X

,

Y

)

= p(

X

|

Y

) p(

Y

)

= p(

Y

|

X

) p(

X

)

å

これを「事後分布」

p(

X

|

Y

)

について解くと，

事後分布

z }| {

p(

X

|

Y

)

=

尤度 (モデル)

z }| {

p(

Y

|

X

)

事前分布

z}|{

p(

X

)

p(

Y

)

|{z}

=

∫

p(

Y

|

X

) p(

X

)d

X

⇒

ある種の「逆問題」を解いている

(12)

共役事前分布

事後分布

z }| {

p(

X

|

Y

)

=

尤度 (モデル)

z }| {

p(

Y

|

X

)

事前分布

z}|{

p(

X

)

∫

p(

Y

|

X

) p(

X

) d

X

目標:

「事後分布」

p(

X

|

Y

)

の解析解を求めたい!

å

「事前分布」

p(

X

)

および「尤度 (モデル)」

p(

Y

|

X

)

をうまく選ぶ必

要がある．

å

可解となるいくつかの組み合わせが知られているが，変分ベイズで

は「事後分布」と「事前分布」が同様の形になる

共役事前分布

が良

く用いられる．

å

この条件を満たすように，

「事前分布」

p(

X

)

だけでなく制御対象に関

連する「尤度 (モデル)」

p(

Y

|

X

)

にも仮定が必要なことに注意する．

(13)

. . . .

共役事前分布の例

例

y

=

θ

u

+

w

ノイズ

w

∼ N(0, σ

w

)

(

正規分布

)

とすると，尤度関数は...

p(

w

)

= p(

y

−

θ

u

)

=

_√

1

2 πσ

w

exp

(

y

−

θ

u

)

2

2 σ

w

≡ p(

u

,

y

|

θ

)

⇒

事前分布

p(

θ

)

として

正規分布

を選べば良い!

p(

θ

)

=

_√

1

2 πσ

_θ

exp

(

θ

− µ

θ

)

2

2 σ

_θ

よって

p(

u

,

y

|

θ

) p(

θ

)

= (

定数

)

× exp(

θ

の 2 次式

)

となり，積分が可能であり，事後分布も

正規分布

!

(14)

変分ベイズ法の問題設定

状態空間モデル

への適用例

制御対象

{

x

t

+1

=

A

x

t

+

Bu

t

+

w

t

,

w

t

∼ N(0,

Q

)

,

x

0 ∼ N(

µ

0 ,

Σ

0 )

y

t

=

C

x

t

+

Du

t

+

v

t

,

v

t

∼ N(0,

R

)

推定対象

Θ

:

= {

A

,

B

,

C

,

D

,

Q

,

R

}

システムパラメータ

X

:

= {

x

0 ,

x

1 , . . . ,

x

t

,

µ

0 ,

Σ

0 }

状態変数 (隠れ変数)

仮定:

Θ

と

X

が独立!

p(

Θ

,

X

)

≡ p(

Θ

) p(

X

)

⇒

これにより

p(

Θ

)

と

p(

X

)

を交互に推定できる．

(15)

. . . .

変分ベイズ法

目的:

事後分布

p(

Θ

,

X

|

Y

)

の近似値

q(

Θ

,

X

|

Y

)

を求め

たい．

p

と

q

の KL 距離

KL(q

, p) :=

∫

q log

q

_p

dXd

Θ

を最小化する

q

を求める．

次の関係から，関数

F(q)

の部分を最大化する

q

を求める．

log p(

Y

)

| {z }

定数 (対数周辺尤度)

=

F(q)

+ KL(q, p)

å

独立の仮定

q(

Θ

,

X

|

Y

)

= q(

Θ

|

Y

)q(

X

|

Y

)

から，

F(q(

Θ

,

X

|Y))

を最大化する

Θ

,

X

を (変分法に

より) 交互に求めて行く．

(16)

変分ベイズ法のアルゴリズム

具体的な更新則は以下のようになる

VB-E

ステップ

q(

X

)

(new)

∝ p(

X

) exp E

q(

_Θ

)

(old)

[log p(

X

,

Y

|

Θ

)]

VB-M

ステップ

q(

Θ

)

(new)

∝ p(

Θ

) exp E

q(

X

)

(old)

[log p(

Θ

,

Y

|

X

)]

期待値演算

E(

·)

が既知の関数となるように各分布

p(

·)

,

q(

·)

の形を仮

定する必要がある (

共役事前分布

)

(17)

. . . .

変分ベイズ法の特徴

○ 事後分布を解析的に導出するため，計算量が少なく，結果も扱いや

すい．

×

解析解を求めるために問題設定自体を工夫 (近似) する必要がある．

×

近似の方法によっては精度が劣化する．

(18)

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(19)

. . . .

状態空間モデルの変分ベイズ推定

状態空間の変分ベイズ推定 (提案法)

制御対象

{

x

t

+1

=

A

x

t

+

B

u

t

+

w

t

,

w

t

∼ N(0,

Q

)

,

x

0 ∼ N(

µ

0 ,

Σ

0 )

y

t

=

C

x

t

+

D

u

t

+

v

t

,

v

t

∼ N(0,

R

)

推定対象

Θ

I

:

= {

A

,

B

,

Q

}

Θ

O

:

= {

C

,

D

,

R

}

X

:

= {

x

0 ,

x

1 , . . . ,

x

t

,

µ

0 ,

Σ

0 }

p(

Θ

I

,

Θ

O

,

X

)

≡ p(

Θ

I

) p(

Θ

O

) p(

X

)

(20)

共役事前分布

共役事前分布:

事後分布と事前分布がほぼ同じ形となる分布族

p(

X

|

Y

)

=

∫

p(

Y

|

X

) p(

X

)

p(

Y

|

X

) p(

X

)d

X

従来法

[Beal’03, Barber & Chiappa’07]

状態変数

x

t

などに

1 次元正規分布

を仮定

提案法

Q

,

R

は

ウィシャート分布

，それ以外の変数は

多次元正規分布

を仮定

(得られた事後分布を再び事前分布として用いる

繰り返し学習

も可能)

p(vec(

A

,

B

)

|µ

AB

,

Q

,

G

)

= N(vec(

A

,

B

)

|µ

AB

,

G

⊗

Q

)

p(vec(

C

,

D

)

|µ

_{C D}

,

R

,

H

)

= N(vec(

C

,

D

)

|µ

_{C D}

,

H

⊗

R

)

p(

Q

|

ν

,

S

Q

)

∝ |

Q

−1

|

(

ν

−n−1)/2

exp

{

−

1

2 tr(

Q

−1

_S

Q

−1

)

}

p(

R

|

η

,

S

)

∝ |

R

−1

|

(

η

−l−1)/2

exp

{

−

1 tr(

R

−1

S

−1

)

}

(21)

. . . .

状態方程式の同値変換

同値変換によって変換されるシステムは等価のはず

{

˙x

= Ax + Bu

y

= Cx + Du

座標変換

⇓ ¯x =

T

x

{

˙¯x

=

T

A

T

−1

¯x

+

T

Bu

y

= C

T

−1

¯x

+ D

変分ベイズ法は同値変換に対して「

不変

」か?

(22)

不変性

共役事前分布

p(

A,

B,

C,

D|Q

−1

,

R

−1

)

p(

A,

¯

B,

¯

C,

¯

D|

¯

Q

¯

−1

,

R

¯

−1

)

変分ベイズ推定

事後分布

q(

A,

B,

C,

D|Q

−1

,

R

−1

)

q(

A,

¯

B,

¯

C,

¯

D|

¯

Q

¯

−1

,

R

¯

−1

)

f

T

f

T

-?

?

上図の

不変性

が導ける

(23)

. . . .

不変性

共役事前分布

p(

A,

B,

C,

D|Q

−1

,

R

−1

)

p(

A,

¯

B,

¯

C,

¯

D|

¯

Q

¯

−1

,

R

¯

−1

)

変分ベイズ推定

事後分布

q(

A,

B,

C,

D|Q

−1

,

R

−1

)

q(

A,

¯

B,

¯

C,

¯

D|

¯

Q

¯

−1

,

R

¯

−1

)

f

T

f

T

-?

?

上図の

不変性

が導ける

(24)

同値変換に対する同時分布の不変性

システムパラメータの同時分布

p(

Θ

)

として任意の分布を許すなら

ば，座標変換

¯x

=

T

x

に対して同時分布は不変．

p(

A

,

B

,

C

,

D

,

Q

,

R

)

= p(

T

AT

−1

, T

B

,

CT

−1

,

D

,

TQT

T

,

R

)

すなわち同値な状態空間モデルの

尤度

は等しい!

なお，システムパラメータの微小体積も不変．

d(

A

,

B

,

C

,

D

,

Q

,

R

)

= d(

T

AT

−1

, T

B

,

CT

−1

,

D

,

TQT

T

,

R

)

å

提案法の分布は，上記の関係を満たす!

(25)

. . . .

同値変換に対する推定アルゴリズムの不変性

内部状態

X

の推定アルゴリズムは，カルマンフィルタ・スムーサで

あり同値変換に対して不変

(モデルを座標変換すれば，状態推定値も座標変換される)

システムパラメータ

Θ

の推定アルゴリズムは，同値変換に対して不

変か?

(状態の初期分布 (事前情報) を座標変換

¯x

=

T

x

した場合に得られる

事後分布も同様に座標変換されるか?)

å

一般にどうなるかは不明だが，提案法の分布であれば Yes!

(26)

数値例

同定対象

真値

A

=

(

1

0 .3

−0.06 0.94

)

, B =

(

0

0 .06

)

, C = ( 1, 0 ) , D = 0

初期推定値

¯

A

=

(

1

1 )

, ¯B =

(

1

1 )

, ¯C = ( 1, 1 ) , ¯D = 1

同定入力はインパルス入力を用いた

(27)

. . . .

数値例 (ℓ2

ノルム出力誤差の推移)

ℓ

2 ノルム出力誤差の推移

青: 推定の平均値

赤: 推定の平均値

± 2σ

の変動

0

20

40

60

80

100

0

1

2

3

4

5 x 10

5

(28)

数値例 (50 ステップ学習後の推定値)

ボード線図 (50 ステップ学習後の推定値)

緑: 真値

青: 推定の平均値

赤: 推定の平均値

± 2σ

の変動

10

-1

10

0

10

1

-40

-20

0

20 -200

0

200

(29)

. . . .

数値例 (200 ステップ学習後の推定値)

ボード線図 (200 ステップ学習後の推定値)

緑: 真値

青: 推定の平均値

赤: 推定の平均値

± 2σ

の変動

10

-1

10

0

10

1

-40

-20

0

20

40

10

-1

10

0

10

1

-300

-200

-100

0

(30)

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(31)

. . . .

ばらつき抑制のための最適制御

ベイズ推定された結果をどう制御に活かすか?

⇒

ばらつき抑制に利用したい!

!"#$%"

&"'()!*)!+!

,"

!"#$%"

&"'()!*)!+!

,"

-.$/0.-!

120/234.!

これまでのロバスト制御

モデル化誤差

:

確定的

に扱う

ノイズ

:

確定的・確率的

に扱う

(32)

最適制御

制御対象

x

t

+1

= Ax

t

+ Bu

t

評価関数

(有限時間):

J

T

(u)

=

T

−1

∑

t

=0

(

x

T

_t

Q

x

t

+ u

T

_t

R

u

t

)

+ x

T

F

x

T

(無限時間):

J

_∞

(u)

=

∞

∑

t

=0

(

x

T

_t

Q

x

t

+ u

T

_t

R

u

t

)

⇒

評価関数

J

T,

J

_∞

を最小にする入力

u

t

=

u

⋆

_t

(x

t

, t)

を求める!

(33)

. . . .

最適性の原理

評価関数の最小値を

V

(x

0 )

とおくと，次が成立 (

最適性の原理

)．

V(x

t

)

:

= min

u

t

,...,u

T−1

J(

u

|x

t

)

= min

u

t

(

V(x

t

+1

)

+ x

T

_t

Qx

t

+

u

t

T

R

u

t

)

2 次形式の

V(xt

)

= x

T

t

Π

t

x

t

を代入すれば行列

Π

t

に関する漸化式を得る．

x

T

_t

Π

t

x

t

= min

u

t

(

x

T

_t

₊₁

Π

t

+1

x

t

+1

+ x

T

_t

Qx

t

+

u

t

T

R

u

t

)

= min

u

t

(

( Ax

t

+ B

u

t

)

T

Π

t

+1

( Ax

t

+ B

u

t

)

+ x

T

_t

Qx

t

+

u

t

T

R

u

t

)

入力

u

t

は 2 次式なので簡単に最小化できる (

リッカチ方程式

)

u

⋆

t

= − (R + B

T

_Π

t

+1

B)

−1

(B

T

Π

t

+1

A)x

t

Π

t

=Q + A

T

Π

t

+1

A

− (A

T

Π

t

+1

B)(R

+ B

T

Π

t

+1

B)

−1

(B

T

Π

t

+1

A)

有限時間問題:

Π

N

=

F

として漸化式を解く

無限時間問題:

Π

t

+1

=

Π

t

=

Π

として

Π

を求める

(34)

LQG

制御

LQG(Linear Quadratic Gaussian)

制御問題

x

t

+1

= Ax

t

+ Bu

t

+ G

ϵ

t

変数

ϵ

t

は確率変数

評価関数

(有限時間):

J

T

(u)

=

E







T

−1

∑

t

=0

(

x

T

_t

Qx

t

+ u

T

_t

Ru

t

)

+ x

T

Fx

T

x

0 





(無限時間):

J

_∞

(u)

=

E







∞

∑

t

=0

(

x

T

_t

Qx

t

+ u

T

_t

Ru

t

)

x

0 





(35)

. . . .

分散抑制のための制御法

制御対象

x

t

+1

= Ax

t

+ Bu

t

+ G

ϵ

t

MCV(Minimum Cost variance)

制御問題

[Sain’66]

J(u)

=

E

[ ˆ

J]

+

λ

var

[ ˆ

J]

ˆ

J

=

T

−1

∑

t

=0

(x

T

t

Qx

t

+ u

T

t

Ru

t

)

+ x

T

Fx

T

RS(Risk Sensitive)

制御問題

[Whittle’81]

J(u)

= − 2

θ

−1

log

E

[exp(

−

θ

2 ˆ

J)]

=

E

[ ˆ

J]

−

θ

4 var

[ ˆ

J]

+ O(

θ

2 ₎

⇒

システムパラメータ

A

,

B

の変動は扱えない

(36)

分散抑制のための確率最適制御

確率変数を含む最適制御問題

[De Koning’82, F’10]

x

t

+1

=

A

t

x

t

+

B

t

u

t

+

G

t

ϵ

t

変数

A

t

,

B

t

,

G

t

,

ϵ

t

は確率変数

評価関数

(有限時間):

J

T

(u)

=

E







T

−1

∑

t

=0

(

x

T

_t

Qx

t

+ u

T

_t

Ru

t

+

tr (S

cov

[x

t

+1

|x

t

])

)

+ x

T

Fx

T







(無限時間):

J

_∞

(u)

=

E







∞

∑

t

=0

(

x

T

_t

Qx

t

+ u

T

_t

Ru

t

+

tr (S

cov

[x

t

+1

|x

t

])

)



_{}



ただし

tr (S

cov

[x

t

+1

|x

t

])

=

E

[x

T

_t

₊₁

S

x

t

+1

|x

t

]

−

E

[x

t

+1

]

T

S

E

[x

t

+1

|x

t

]

(37)

. . . .

最適性の原理

簡単のため，

S

= 0

とする．評価関数の最小値を

V

とおくと，次が成立

(

最適性の原理

)．

V(x

t

)

:

= min

u

t,...,uT₋₁

J(u

|x

t

)

= min

u

t

(

E

[

V(x

t

+1

)

|x

t

]

+ x

T

_t

Qx

t

+ u

T

_t

Ru

t

)

上式に 2 次形式の

V

を代入すれば行列

Π

t

に関する漸化式を得る．

V(x

t

)

= x

T

_t

Π

t

x

t

+ β

t

.

(38)

確率最適制御の解

リッカチ方程式に類する方程式を解くことで得られる

u

t

= − (R + Σ

BB

+

E

[B

T

Π

t

+1

B])

−1

(

Σ

B A

+

E

[B

T

Π

t

+1

A])x

t

Π

t

=Q + Σ

A A

+

E

[ A

T

Π

t

+1

A]

− (Σ

AB

+

E

[ A

T

Π

t

+1

B])

× (R + Σ

BB

+

E

[B

T

Π

t

+1

B])

−1

(

Σ

B A

+

E

[B

T

Π

t

+1

A])

Π

T

=F

ただし

Σ

XY

:

=

E

[

X

T

SY

]

−

E

[

X

]

T

S

E

[

Y

]

.

(39)

. . . .

従来の最適制御との比較

従来の最適制御における制御則

u

t

= − (R + B

T

ΠB)

−1

B

T

ΠAx

t

Π =Q + A

T

_{ΠA − A}

T

_{ΠB(R + B}

T

_ΠB)

−1

_B

T

_ΠA

リッカチ方程式

提案法における制御則 (

S

= 0

,

T

= ∞

の場合)

u

t

= − (R +

E

[B

T

ΠB])

−1

E

[B

T

ΠA]x

t

Π =Q +

E

[ A

T

ΠA] −

E

[ A

T

ΠB](R +

E

[B

T

ΠB])

−1

E

[B

T

ΠA]

2 次式にはなるが

リッカチ方程式

にはならない

⇒

非線形最適化を用いて求解

(40)

数値例 (1/2)

システムのパラメータ

E

[ A]

=

(

1

0 .1

−0.01 0.99

)

E

[B]

=

(

0

0 .01

)

cov

[vec( A

, B)] =







0

2 .5 × 10

−5

0

0 .245 0

0

2 .5 × 10

−5







設計パラメータ

Q

=

(

10

0

10 )

, R = 1, F =

(

40

0

40 )

(41)

. . . .

数値例 (2/2)

従来法と提案法 (

S

= 100

)

の状態

x

1

0 50 100 150 200 250 −50 −40 −30 −20 −10 0 10 20 30 40 50 time state X1 0 50 100 150 200 250 −5 0 5 10 15 20 25 time state X1

従来法と提案法 (

S

= 100

)

の入力

u

0 50 100 150 200 250 −4000 −3000 −2000 −1000 0 1000 2000 3000 0 50 100 150 200 250 −250 −200 −150 −100 −50 0 50 100 150

(42)

無限時間の確率制御系の安定性

制御対象 (加法的なノイズのない系)

x

k

+1

=

A

t

x

t

平均安定

lim

t

→∞

E

[x

t

|x

0 ]

= 0

平均二乗安定

[De Koning’82]

lim

t

→∞

E

[

∥x

t

∥

2 _|x

0 ]

= 0

(43)

. . . .

確率最適制御系の安定性

.

定理

.

制御系

x

t

+1

=

A

t

x

t

+

B

t

u

t

が

平均二乗可安定

であるとき，前出の制御則は無限時間確率最適制御問

題の解となる．

u

t

= − (R + Σ

BB

+

E

[B

T

Π

B])

−1

(

Σ

B A

+

E

[B

T

Π

A])x

t

Π

=Q + Σ

A A

+

E

[ A

T

Π

A]

− (Σ

AB

+

E

[ A

T

Π

B])

× (R + Σ

BB

+

E

[B

T

Π

B])

−1

(

Σ

B A

+

E

[B

T

Π

A])

⇒

平均二乗可安定性のもとで，最適性の十分条件も示すことができる!

(44)

証明の概略

評価関数:

J

T

(u)

=

E







T

−1

∑

t

=0

(

x

T

_t

Qx

t

+ u

T

_t

Ru

t

+

tr (S

cov

[x

t

+1

|x

t

])

)

+ x

T

Fx

T







ここで，

B

L

を次のように定義すると，

B

L

Π

:

=Q +

L

T

R

L

+

E

[( A

− B

L

)

T

(

Π

+ S)(A − B

L

)]

−

E

[( A

− B

L

)]

T

S

E

[( A

− B

L

)]

B

L

はフィードバックを

u

t

= −

L

x

t

としたときの評価関数の変化率を

表す．

J

t

(u) :

= x

T

₀

B

L

t

Fx

0 この関数

B

L

は単調非減少関数であり

J

の下限を与え、平均二乗可安定

性から

J

の上限が存在し，

J

は有界の値に収束することが示せる．この

ことが定理を導く．

(45)

. . . .

Outline

.

. .

1 背景と目的

.

. .

2 ベイズ推定

.

. .

3 状態空間モデルの変分ベイズ推定

.

. .

4 確率最適制御

.

. .

5 おわりに

(46)

おわりに

本発表では

· · ·

制御工学的に妥当な問題設定の元で

状態空間モデルのベイズ推定

法を

導出

同値変換に対するアルゴリズムの

不変性

を考察

ばらつき

を抑制するための確率最適制御

数値例による検証

課題

推定

扱う分布をどこまで一般化できるか?

変分ベイズ以外の近似 or 数値的推定法

客観確率 vs 主観確率?

制御

制御性能 (2 次モーメント) の評価

状態推定を含めた出力フィードバック設計問題

設計と推定の一体化

(47)

. . . .

参考文献

[1] D. Barber and S. Chiappa.

Unified inference for variational Bayesian linear Gaussian state-space models.

InAdvances in Neural Information Processing Systems 19 (NIPS 20), pp. 81–88. The MIT Press, 2007. [2] M. J. Beal.

Variational Algorithms for Approximate Bayesian inference.

PhD thesis, University of Londong, London, UK, 2003. [3] W. L. De Koning.

Infinite horizon optimal control of linear discrete time systems with stochastic parameters.

Automatica, Vol. 18, No. 4, pp. 443–453, 1982. [4] K. Fujimoto, S. Ogawa, Y. Ota, and M. Nakayama.

Optimal control of linear systems with stochastic parameters for variance suppression: The finite time horizon case.

InProceedings of the 18th IFAC World Congress, 2011. [5] K. Fujimoto, A. Satoh, and S. Fukunaga.

System identification based on variational bayes method and the inavriance under coordinate transformations.

Submitted, 2011. [6] M. K. Sain.

Control of linear systems according to the minimal variance criterion: A new approach to the disturbance problem.

IEEE Trans. Autom. Contr., Vol. 11, No. 1, pp. 118–122, 1966. [7] P. Whittle.

Risk-sensitive Linear/Quadratic/Gaussian control.

Advances in Applied Probability, Vol. 13, pp. 764–777, 1981. [8] 福永, 藤本. 状態空間モデルを用いた非線形独立成分分析. システム制御情報学会論文集, Vol. 20, No. 10, pp. 404–412, 2007. [9] 福永, 藤本. H_∞フィルタを用いた非最小位相系の独立成分分析. 電子情報通信学会論文誌 D, Vol. J91-D, No. 6, pp. 1648–1655, 2008.

ばらつき抑制のための確率最適制御

.

.

.

.

.

.

.