. . . .
.
.
.
.
.
.
.
ばらつき抑制のための確率最適制御
藤本 健治 (名古屋大学)
http://www.haya.nuem.nagoya-u.ac.jp/˜fujimoto/
2011
年 3 月 9–11 日 力学系の応用研究集会
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
. . . .
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
フィードバック制御 (1/2)
フィードバック制御
Plant
Controller
+
-u
y
r
目的
与えられた Plant に対して Controller を設計して
lim
t
→∞
∥y(t) − r(t)∥ = 0
を達成する
Plant:
状態空間モデル
非線形の微分方程式
dx
dt
= f(x(t), u(t))
y(t)
= h(x(t), u(t))
線形の漸化式
x(t
+ 1) = A x(t) + B u(t)
y(t)
= C x(t) + D u(t)
. . . .
フィードバック制御 (2/2)
フィードバック制御
Plant
Controller
+
-u
y
r
制御するためには...
モデルの同定・推定
x(t
+ 1)
=
A
x(t)
+
B
u(t)
y(t)
=
C
x(t)
+
D
u(t)
モデルに基づく制御 (内部状態
x(t)
の推定は別途)
u(t)
=
K
x(t)
確定 vs 確率
最尤推定 (
確定
) vs
ベイズ推定 (
確率
)
x
y
o
x
y
o
. . . .
確定 vs 確率
最尤推定 (
確定
)
○
もっともあり得そうな値 (
最尤値
)
を推定するが,推定値の確からしさ
は不明
○
計算量は多くない
×
自由度は少ない
ベイズ推定 (
確率
)
◎
最尤値だけでなく
確率密度関数
が推定できる
×
計算量は多い (積分計算は
近似
するか
数値計算
)
○
自由度が高い
○
確定データ以外の
事前情報
を用いることができる
確定 vs 確率
制御工学では
確定的な推定値
を求める推定法が主流
カルマンフィルタ (⇐
最尤推定
)
最小二乗法 (⇐
最尤推定
)
部分空間法 (⇐ 特異値分解・主成分分析)
機械学習の分野では両方の研究がある
EM
アルゴリズム
(
⇐
最尤推定
+
近似
+
ダイナミックモデル
)
モンテカルロ法 (⇐
ベイズ推定
+
数値計算
)
ラプラス近似 (⇐
ベイズ推定
+
近似
)
変分ベイズ法
(
⇐
ベイズ推定
+
近似
+
ダイナミックモデル
)
. . . .
ばらつき抑制のための最適制御
ベイズ推定された結果をどう制御に活かすか?
⇒
ばらつき抑制に利用したい!
!"#$%"
&"'()!*)!+!
,"
!"#$%"
&"'()!*)!+!
,"
-.$/0.-!
120/234.!
これまでのロバスト制御は「確定的な」誤差しか扱えなかった
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
. . . .
ベイズ推定
X
Y
p(Y|X)
見えない入力
X
から
見える出力
Y
が生成されるとして,
Y
が与えら
れたとき
X
の「事後確率」
p(
X
|
Y
)
を推定する問題
å
X
,
Y
の同時分布は次を満たす.
p(
X
,
Y
)
= p(
X
|
Y
) p(
Y
)
= p(
Y
|
X
) p(
X
)
å
これを「事後分布」
p(
X
|
Y
)
について解くと,
事後分布
z }| {
p(
X
|
Y
)
=
尤度 (モデル)
z }| {
p(
Y
|
X
)
事前分布
z}|{
p(
X
)
p(
Y
)
|{z}
=
∫
p(
Y
|
X
) p(
X
)d
X
⇒
ある種の「逆問題」を解いている
共役事前分布
事後分布
z }| {
p(
X
|
Y
)
=
尤度 (モデル)
z }| {
p(
Y
|
X
)
事前分布
z}|{
p(
X
)
∫
p(
Y
|
X
) p(
X
) d
X
目標:
「事後分布」
p(
X
|
Y
)
の解析解を求めたい!
å
「事前分布」
p(
X
)
および「尤度 (モデル)」
p(
Y
|
X
)
をうまく選ぶ必
要がある.
å
可解となるいくつかの組み合わせが知られているが,変分ベイズで
は「事後分布」と「事前分布」が同様の形になる
共役事前分布
が良
く用いられる.
å
この条件を満たすように,
「事前分布」
p(
X
)
だけでなく制御対象に関
連する「尤度 (モデル)」
p(
Y
|
X
)
にも仮定が必要なことに注意する.
. . . .
共役事前分布の例
例
y
=
θ
u
+
w
ノイズ
w
∼ N(0, σ
w
)
(
正規分布
)
とすると,尤度関数は...
p(
w
)
= p(
y
−
θ
u
)
=
√
1
2
πσ
w
exp
(
y
−
θ
u
)
2
2
σ
w
≡ p(
u
,
y
|
θ
)
⇒
事前分布
p(
θ
)
として
正規分布
を選べば良い!
p(
θ
)
=
√
1
2
πσ
θ
exp
(
θ
− µ
θ
)
2
2
σ
θ
よって
p(
u
,
y
|
θ
) p(
θ
)
= (
定数
)
× exp(
θ
の 2 次式
)
となり,積分が可能であり,事後分布も
正規分布
!
変分ベイズ法の問題設定
状態空間モデル
への適用例
制御対象
{
x
t
+1
=
A
x
t
+
Bu
t
+
w
t
,
w
t
∼ N(0,
Q
)
,
x
0
∼ N(
µ
0
,
Σ
0
)
y
t
=
C
x
t
+
Du
t
+
v
t
,
v
t
∼ N(0,
R
)
推定対象
Θ
:
= {
A
,
B
,
C
,
D
,
Q
,
R
}
システムパラメータ
X
:
= {
x
0
,
x
1
, . . . ,
x
t
,
µ
0
,
Σ
0
}
状態変数 (隠れ変数)
仮定:
Θ
と
X
が独立!
p(
Θ
,
X
)
≡ p(
Θ
) p(
X
)
⇒
これにより
p(
Θ
)
と
p(
X
)
を交互に推定できる.
. . . .
変分ベイズ法
目的:
事後分布
p(
Θ
,
X
|
Y
)
の近似値
q(
Θ
,
X
|
Y
)
を求め
たい.
p
と
q
の KL 距離
KL(q
, p) :=
∫
q log
q
p
dXd
Θ
を最小化する
q
を求める.
次の関係から,関数
F(q)
の部分を最大化する
q
を求める.
log p(
Y
)
| {z }
定数 (対数周辺尤度)
=
F(q)
+ KL(q, p)
å
独立の仮定
q(
Θ
,
X
|
Y
)
= q(
Θ
|
Y
)q(
X
|
Y
)
から,
F(q(
Θ
,
X
|Y))
を最大化する
Θ
,
X
を (変分法に
より) 交互に求めて行く.
変分ベイズ法のアルゴリズム
具体的な更新則は以下のようになる
VB-E
ステップ
q(
X
)
(new)
∝ p(
X
) exp E
q(
Θ
)
(old)[log p(
X
,
Y
|
Θ
)]
VB-M
ステップ
q(
Θ
)
(new)
∝ p(
Θ
) exp E
q(
X
)
(old)[log p(
Θ
,
Y
|
X
)]
期待値演算
E(
·)
が既知の関数となるように各分布
p(
·)
,
q(
·)
の形を仮
定する必要がある (
共役事前分布
)
. . . .
変分ベイズ法の特徴
○
事後分布を解析的に導出するため,計算量が少なく,結果も扱いや
すい.
×
解析解を求めるために問題設定自体を工夫 (近似) する必要がある.
×
近似の方法によっては精度が劣化する.
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
. . . .
状態空間モデルの変分ベイズ推定
状態空間の変分ベイズ推定 (提案法)
制御対象
{
x
t
+1
=
A
x
t
+
B
u
t
+
w
t
,
w
t
∼ N(0,
Q
)
,
x
0
∼ N(
µ
0
,
Σ
0
)
y
t
=
C
x
t
+
D
u
t
+
v
t
,
v
t
∼ N(0,
R
)
推定対象
Θ
I
:
= {
A
,
B
,
Q
}
Θ
O
:
= {
C
,
D
,
R
}
X
:
= {
x
0
,
x
1
, . . . ,
x
t
,
µ
0
,
Σ
0
}
p(
Θ
I
,
Θ
O
,
X
)
≡ p(
Θ
I
) p(
Θ
O
) p(
X
)
共役事前分布
共役事前分布:
事後分布と事前分布がほぼ同じ形となる分布族
p(
X
|
Y
)
=
∫
p(
Y
|
X
) p(
X
)
p(
Y
|
X
) p(
X
)d
X
従来法
[Beal’03, Barber & Chiappa’07]
状態変数
x
t
などに
1
次元正規分布
を仮定
提案法
Q
,
R
は
ウィシャート分布
,それ以外の変数は
多次元正規分布
を仮定
(得られた事後分布を再び事前分布として用いる
繰り返し学習
も可能)
p(vec(
A
,
B
)
|µ
AB
,
Q
,
G
)
= N(vec(
A
,
B
)
|µ
AB
,
G
⊗
Q
)
p(vec(
C
,
D
)
|µ
C D
,
R
,
H
)
= N(vec(
C
,
D
)
|µ
C D
,
H
⊗
R
)
p(
Q
|
ν
,
S
Q
)
∝ |
Q
−1
|
(
ν
−n−1)/2
exp
{
−
1
2
tr(
Q
−1
S
Q
−1
)
}
p(
R
|
η
,
S
)
∝ |
R
−1
|
(
η
−l−1)/2
exp
{
−
1
tr(
R
−1
S
−1
)
}
. . . .
状態方程式の同値変換
同値変換によって変換されるシステムは等価のはず
{
˙x
= Ax + Bu
y
= Cx + Du
座標変換
⇓ ¯x =
T
x
{
˙¯x
=
T
A
T
−1
¯x
+
T
Bu
y
= C
T
−1
¯x
+ D
変分ベイズ法は同値変換に対して「
不変
」か?
不変性
共役事前分布
p(
A,
B,
C,
D|Q
−1
,
R
−1
)
p(
A,
¯
B,
¯
C,
¯
D|
¯
Q
¯
−1
,
R
¯
−1
)
変分ベイズ推定
事後分布
q(
A,
B,
C,
D|Q
−1
,
R
−1
)
q(
A,
¯
B,
¯
C,
¯
D|
¯
Q
¯
−1
,
R
¯
−1
)
f
T
f
T
-?
?
?
上図の
不変性
が導ける
. . . .
不変性
共役事前分布
p(
A,
B,
C,
D|Q
−1
,
R
−1
)
p(
A,
¯
B,
¯
C,
¯
D|
¯
Q
¯
−1
,
R
¯
−1
)
変分ベイズ推定
事後分布
q(
A,
B,
C,
D|Q
−1
,
R
−1
)
q(
A,
¯
B,
¯
C,
¯
D|
¯
Q
¯
−1
,
R
¯
−1
)
f
T
f
T
-?
?
?
上図の
不変性
が導ける
同値変換に対する同時分布の不変性
システムパラメータの同時分布
p(
Θ
)
として任意の分布を許すなら
ば,座標変換
¯x
=
T
x
に対して同時分布は不変.
p(
A
,
B
,
C
,
D
,
Q
,
R
)
= p(
T
AT
−1
, T
B
,
CT
−1
,
D
,
TQT
T
,
R
)
すなわち同値な状態空間モデルの
尤度
は等しい!
なお,システムパラメータの微小体積も不変.
d(
A
,
B
,
C
,
D
,
Q
,
R
)
= d(
T
AT
−1
, T
B
,
CT
−1
,
D
,
TQT
T
,
R
)
å
提案法の分布は,上記の関係を満たす!
. . . .
同値変換に対する推定アルゴリズムの不変性
内部状態
X
の推定アルゴリズムは,カルマンフィルタ・スムーサで
あり同値変換に対して不変
(モデルを座標変換すれば,状態推定値も座標変換される)
システムパラメータ
Θ
の推定アルゴリズムは,同値変換に対して不
変か?
(状態の初期分布 (事前情報) を座標変換
¯x
=
T
x
した場合に得られる
事後分布も同様に座標変換されるか?)
å
一般にどうなるかは不明だが,提案法の分布であれば Yes!
数値例
同定対象
真値
A
=
(
1
0
.3
−0.06 0.94
)
, B =
(
0
0
.06
)
, C = ( 1, 0 ) , D = 0
初期推定値
¯
A
=
(
1
1
1
1
)
, ¯B =
(
1
1
)
, ¯C = ( 1, 1 ) , ¯D = 1
同定入力はインパルス入力を用いた
. . . .
数値例 (ℓ2
ノルム出力誤差の推移)
ℓ
2
ノルム出力誤差の推移
青: 推定の平均値
赤: 推定の平均値
± 2σ
の変動
0
20
40
60
80
100
0
1
2
3
4
5
x 10
5数値例 (50 ステップ学習後の推定値)
ボード線図 (50 ステップ学習後の推定値)
緑: 真値
青: 推定の平均値
赤: 推定の平均値
± 2σ
の変動
10
-110
010
1-40
-20
0
20
-200
0
200
. . . .
数値例 (200 ステップ学習後の推定値)
ボード線図 (200 ステップ学習後の推定値)
緑: 真値
青: 推定の平均値
赤: 推定の平均値
± 2σ
の変動
10
-110
010
1-40
-20
0
20
40
10
-110
010
1-300
-200
-100
0
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
. . . .
ばらつき抑制のための最適制御
ベイズ推定された結果をどう制御に活かすか?
⇒
ばらつき抑制に利用したい!
!"#$%"
&"'()!*)!+!
,"
!"#$%"
&"'()!*)!+!
,"
-.$/0.-!
120/234.!
これまでのロバスト制御
モデル化誤差
:
確定的
に扱う
ノイズ
:
確定的・確率的
に扱う
最適制御
制御対象
x
t
+1
= Ax
t
+ Bu
t
評価関数
(有限時間):
J
T
(u)
=
T
−1
∑
t
=0
(
x
T
t
Q
x
t
+ u
T
t
R
u
t
)
+ x
T
T
F
x
T
(無限時間):
J
∞
(u)
=
∞
∑
t
=0
(
x
T
t
Q
x
t
+ u
T
t
R
u
t
)
⇒
評価関数
J
T,
J
∞
を最小にする入力
u
t
=
u
⋆
t
(x
t
, t)
を求める!
. . . .
最適性の原理
評価関数の最小値を
V
(x
0
)
とおくと,次が成立 (
最適性の原理
).
V(x
t
)
:
= min
u
t,...,u
T−1J(
u
|x
t
)
= min
u
t(
V(x
t
+1
)
+ x
T
t
Qx
t
+
u
t
T
R
u
t
)
2
次形式の
V(xt
)
= x
T
t
Π
t
x
t
を代入すれば行列
Π
t
に関する漸化式を得る.
x
T
t
Π
t
x
t
= min
u
t(
x
T
t
+1
Π
t
+1
x
t
+1
+ x
T
t
Qx
t
+
u
t
T
R
u
t
)
= min
u
t(
( Ax
t
+ B
u
t
)
T
Π
t
+1
( Ax
t
+ B
u
t
)
+ x
T
t
Qx
t
+
u
t
T
R
u
t
)
入力
u
t
は 2 次式なので簡単に最小化できる (
リッカチ方程式
)
u
⋆
t
= − (R + B
T
Π
t
+1
B)
−1
(B
T
Π
t
+1
A)x
t
Π
t
=Q + A
T
Π
t
+1
A
− (A
T
Π
t
+1
B)(R
+ B
T
Π
t
+1
B)
−1
(B
T
Π
t
+1
A)
有限時間問題:
Π
N
=
F
として漸化式を解く
無限時間問題:
Π
t
+1
=
Π
t
=
Π
として
Π
を求める
LQG
制御
LQG(Linear Quadratic Gaussian)
制御問題
x
t
+1
= Ax
t
+ Bu
t
+ G
ϵ
t
変数
ϵ
t
は確率変数
評価関数
(有限時間):
J
T
(u)
=
E
T
−1
∑
t
=0
(
x
T
t
Qx
t
+ u
T
t
Ru
t
)
+ x
T
T
Fx
T
x
0
(無限時間):
J
∞
(u)
=
E
∞
∑
t
=0
(
x
T
t
Qx
t
+ u
T
t
Ru
t
)
x
0
. . . .
分散抑制のための制御法
制御対象
x
t
+1
= Ax
t
+ Bu
t
+ G
ϵ
t
MCV(Minimum Cost variance)
制御問題
[Sain’66]
J(u)
=
E
[ ˆ
J]
+
λ
var
[ ˆ
J]
ˆ
J
=
T
−1
∑
t
=0
(x
T
t
Qx
t
+ u
T
t
Ru
t
)
+ x
T
T
Fx
T
RS(Risk Sensitive)
制御問題
[Whittle’81]
J(u)
= − 2
θ
−1
log
E
[exp(
−
θ
2
ˆ
J)]
=
E
[ ˆ
J]
−
θ
4
var
[ ˆ
J]
+ O(
θ
2
)
⇒
システムパラメータ
A
,
B
の変動は扱えない
分散抑制のための確率最適制御
確率変数を含む最適制御問題
[De Koning’82, F’10]
x
t
+1
=
A
t
x
t
+
B
t
u
t
+
G
t
ϵ
t
変数
A
t
,
B
t
,
G
t
,
ϵ
t
は確率変数
評価関数
(有限時間):
J
T
(u)
=
E
T
−1
∑
t
=0
(
x
T
t
Qx
t
+ u
T
t
Ru
t
+
tr (S
cov
[x
t
+1
|x
t
])
)
+ x
T
T
Fx
T
(無限時間):
J
∞
(u)
=
E
∞
∑
t
=0
(
x
T
t
Qx
t
+ u
T
t
Ru
t
+
tr (S
cov
[x
t
+1
|x
t
])
)
ただし
tr (S
cov
[x
t
+1
|x
t
])
=
E
[x
T
t
+1
S
x
t
+1
|x
t
]
−
E
[x
t
+1
]
T
S
E
[x
t
+1
|x
t
]
. . . .
最適性の原理
簡単のため,
S
= 0
とする.評価関数の最小値を
V
とおくと,次が成立
(
最適性の原理
).
V(x
t
)
:
= min
u
t,...,uT−1J(u
|x
t
)
= min
u
t(
E
[
V(x
t
+1
)
|x
t
]
+ x
T
t
Qx
t
+ u
T
t
Ru
t
)
上式に 2 次形式の
V
を代入すれば行列
Π
t
に関する漸化式を得る.
V(x
t
)
= x
T
t
Π
t
x
t
+ β
t
.
確率最適制御の解
リッカチ方程式に類する方程式を解くことで得られる
u
t
= − (R + Σ
BB
+
E
[B
T
Π
t
+1
B])
−1
(
Σ
B A
+
E
[B
T
Π
t
+1
A])x
t
Π
t
=Q + Σ
A A
+
E
[ A
T
Π
t
+1
A]
− (Σ
AB
+
E
[ A
T
Π
t
+1
B])
× (R + Σ
BB
+
E
[B
T
Π
t
+1
B])
−1
(
Σ
B A
+
E
[B
T
Π
t
+1
A])
Π
T
=F
ただし
Σ
XY
:
=
E
[
X
T
SY
]
−
E
[
X
]
T
S
E
[
Y
]
.
. . . .
従来の最適制御との比較
従来の最適制御における制御則
u
t
= − (R + B
T
ΠB)
−1
B
T
ΠAx
t
Π =Q + A
T
ΠA − A
T
ΠB(R + B
T
ΠB)
−1
B
T
ΠA
リッカチ方程式
提案法における制御則 (
S
= 0
,
T
= ∞
の場合)
u
t
= − (R +
E
[B
T
ΠB])
−1
E
[B
T
ΠA]x
t
Π =Q +
E
[ A
T
ΠA] −
E
[ A
T
ΠB](R +
E
[B
T
ΠB])
−1
E
[B
T
ΠA]
2
次式にはなるが
リッカチ方程式
にはならない
⇒
非線形最適化を用いて求解
数値例 (1/2)
システムのパラメータ
E
[ A]
=
(
1
0
.1
−0.01 0.99
)
E
[B]
=
(
0
0
.01
)
cov
[vec( A
, B)] =
0
0
0
0
0
0
0
2
.5 × 10
−5
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.245 0
0
0
0
0
0
0
0
0
0
0
0
0
2
.5 × 10
−5
設計パラメータ
Q
=
(
10
0
0
10
)
, R = 1, F =
(
40
0
0
40
)
. . . .
数値例 (2/2)
従来法と提案法 (
S
= 100
)
の状態
x
1
0 50 100 150 200 250 −50 −40 −30 −20 −10 0 10 20 30 40 50 time state X1 0 50 100 150 200 250 −5 0 5 10 15 20 25 time state X1従来法と提案法 (
S
= 100
)
の入力
u
0 50 100 150 200 250 −4000 −3000 −2000 −1000 0 1000 2000 3000 0 50 100 150 200 250 −250 −200 −150 −100 −50 0 50 100 150無限時間の確率制御系の安定性
制御対象 (加法的なノイズのない系)
x
k
+1
=
A
t
x
t
平均安定
lim
t
→∞
E
[x
t
|x
0
]
= 0
平均二乗安定
[De Koning’82]
lim
t
→∞
E
[
∥x
t
∥
2
|x
0
]
= 0
. . . .
確率最適制御系の安定性
.
定理
.
.
.
.
.
.
.
.
制御系
x
t
+1
=
A
t
x
t
+
B
t
u
t
が
平均二乗可安定
であるとき,前出の制御則は無限時間確率最適制御問
題の解となる.
u
t
= − (R + Σ
BB
+
E
[B
T
Π
B])
−1
(
Σ
B A
+
E
[B
T
Π
A])x
t
Π
=Q + Σ
A A
+
E
[ A
T
Π
A]
− (Σ
AB
+
E
[ A
T
Π
B])
× (R + Σ
BB
+
E
[B
T
Π
B])
−1
(
Σ
B A
+
E
[B
T
Π
A])
⇒
平均二乗可安定性のもとで,最適性の十分条件も示すことができる!
証明の概略
評価関数:
J
T
(u)
=
E
T
−1
∑
t
=0
(
x
T
t
Qx
t
+ u
T
t
Ru
t
+
tr (S
cov
[x
t
+1
|x
t
])
)
+ x
T
T
Fx
T
ここで,
B
L
を次のように定義すると,
B
L
Π
:
=Q +
L
T
R
L
+
E
[( A
− B
L
)
T
(
Π
+ S)(A − B
L
)]
−
E
[( A
− B
L
)]
T
S
E
[( A
− B
L
)]
B
L
はフィードバックを
u
t
= −
L
x
t
としたときの評価関数の変化率を
表す.
J
t
(u) :
= x
T
0
B
L
t
Fx
0
この関数
B
L
は単調非減少関数であり
J
の下限を与え、平均二乗可安定
性から
J
の上限が存在し,
J
は有界の値に収束することが示せる.この
ことが定理を導く.
. . . .
Outline
.
. .
1
背景と目的
.
. .
2
ベイズ推定
.
. .
3
状態空間モデルの変分ベイズ推定
.
. .
4
確率最適制御
.
. .
5
おわりに
おわりに
本発表では
· · ·
制御工学的に妥当な問題設定の元で
状態空間モデルのベイズ推定
法を
導出
同値変換に対するアルゴリズムの
不変性
を考察
ばらつき
を抑制するための確率最適制御
数値例による検証
課題
推定
扱う分布をどこまで一般化できるか?
変分ベイズ以外の近似 or 数値的推定法
客観確率 vs 主観確率?
制御
制御性能 (2 次モーメント) の評価
状態推定を含めた出力フィードバック設計問題
設計と推定の一体化
. . . .
参考文献
[1] D. Barber and S. Chiappa.
Unified inference for variational Bayesian linear Gaussian state-space models.
InAdvances in Neural Information Processing Systems 19 (NIPS 20), pp. 81–88. The MIT Press, 2007. [2] M. J. Beal.
Variational Algorithms for Approximate Bayesian inference.
PhD thesis, University of Londong, London, UK, 2003. [3] W. L. De Koning.
Infinite horizon optimal control of linear discrete time systems with stochastic parameters.
Automatica, Vol. 18, No. 4, pp. 443–453, 1982. [4] K. Fujimoto, S. Ogawa, Y. Ota, and M. Nakayama.
Optimal control of linear systems with stochastic parameters for variance suppression: The finite time horizon case.
InProceedings of the 18th IFAC World Congress, 2011. [5] K. Fujimoto, A. Satoh, and S. Fukunaga.
System identification based on variational bayes method and the inavriance under coordinate transformations.
Submitted, 2011. [6] M. K. Sain.
Control of linear systems according to the minimal variance criterion: A new approach to the disturbance problem.
IEEE Trans. Autom. Contr., Vol. 11, No. 1, pp. 118–122, 1966. [7] P. Whittle.
Risk-sensitive Linear/Quadratic/Gaussian control.
Advances in Applied Probability, Vol. 13, pp. 764–777, 1981. [8] 福永, 藤本. 状態空間モデルを用いた非線形独立成分分析. システム制御情報学会論文集, Vol. 20, No. 10, pp. 404–412, 2007. [9] 福永, 藤本. H∞フィルタを用いた非最小位相系の独立成分分析. 電子情報通信学会論文誌 D, Vol. J91-D, No. 6, pp. 1648–1655, 2008.