3.2節で紹介したPWARXモデルは人間の行動を確定的な境界面で分割しているが,
本節ではPWARXと多項ロジスティック回帰の考え方を融合した
PrARX(Probability-weighted ARX)モデルについて説明する.
3.3.1 PrARX モデルの定義
PrARXモデルの出力は次式で与えられる.
yk =
∑s i=1
Pi(xk)θiTxk (3.30)
PrARXモデルはs個のARXモデルが確率Piによって重みづけされる形となっている.
Piはモードiが選択される確率を表し,以下のようなソフトマックス関数によって与えら れる.
Pi(x) = exp(ηTi x)
∑s
j=1exp(ηTj x) (3.31)
ηs= 0 (3.32)
確率Piはパラメータηによって決定され,多項ロジスティック回帰モデルにおける出力 と同じ形式となっている. このように,PrARXモデルは多項ロジスティック回帰モデル
とPWARXモデルを融合した形となっている.
また,PrARXモデルの確率重み関数Piをもとに,次式によって確定的なモード条件
を得ることができる.
x∈Ui i= argmaxPi(x) (3.33)
これにより,PrARXモデルを機械的にPWARXモデルへ変換することができる.
3.3.2 モデル例
PrARXモデルの例として,3モード1変数のPrARXモデルのサンプルを以下に示す.
このモデルのパラメータは, θ1=
[0.5 5
]
, θ2= [−0.1
3 ]
, θ3= [−0.4
15 ]
η1= [−3
45 ]
, η2= [−1.5
30 ]
0 5 10 15 20 25 30 0
5 10
y
0 5 10 15 20 25 30
0 0.5 1
Probability (P i)
u
図3.4 PrARXモデルの例
のように設定した.
図のように,赤の破線で示された3つのARXモデルが確率Pに従って,青の実線のよ うに滑らかに切り替わっていることが確認できる. このことから,PrARXモデルは,ダイ ナミクスを表すパラメータθ,判断を表すパラメータηで決定され,モードの切り替わりを 滑らかにしたハイブリッドシステムとみなすことができる.
3.3.3 PrARX モデルのパラメータ同定法
PrARXモデルのパラメータは,以下の誤差関数を最小にするθ,ηを求めることに
よって得られる.
= 1 N
∑N k=1
kyk−yˆkk2, (3.34)
ˆ yk=
∑s i=1
Pi(xk)θTixk (3.35)
この目的関数はモデルによって推定された出力yˆkと実際に観測された出力yk との誤差 のノルムの二乗和を表している. 本研究ではこの最適化問題を最急降下法を用いて解く. 最急降下法は以下の更新式に従い,得られた最急降下方向にパラメータを更新することに よって最適解を求める手法である.
θi(t+1)=θ(t)i −α ∂
∂θi(t) (3.36)
η(t+1)i =η(t)i −β ∂
∂ηi(t) (3.37)
目的関数のパラメータによる偏微分は,
∂
∂θi
=−1 N
∑N k=1
ekPi(xk)xk (3.38)
∂
∂ηi
=−1 N
∑N k=1
2ekPi(xk)xk(θTi x−yˆk) (3.39) ここで,θi(t),η(t)i はt回更新後のパラメータである. α,βは微小な正の数を任意で使用する. また,初期値依存性の問題から局所最適解を回避するため多くの初期値の組を用意し,検 証を行う必要がある.
PrARXモデルの利点として,この最急降下法というアルゴリズム一つで,ダイナミクス
に関するパラメータθiとモードの境界を決定するパラメータηiが同時に同定できるとい う点がある.
3.3.4 パラメータの逐次更新手法
人間の操作・判断特性は,支援システムの機能やタスクへの慣れなどによって時々刻々 変化していくと考えられる.したがって,PrARXモデルのパラメータθ,η も常にそれ に合わせて最適な値に調整することが望ましい. 前述の最急降下法を用いたパラメータ同 定方法は局所最適解を回避するために大量の初期値が必要となり,結果パラメータ更新に 時間がかかり,実時間でのモデルの最適化が難しいという問題がある.支援システムの機 能やタスクへの慣れに起因する操作・判断特性の変化は,時刻とともに徐々に変化してい くと仮定すると,現時刻のパラメータを何らかの規則に従って修正することで,時刻に対 応した最適パラメータを求めることが可能になると考えられる.そこで,PrARXモデル のパラメータが最急降下法に基づくパラメータ更新によって決定されていることを利用 し,現時刻のパラメータを最急降下法に基づくパラメータ更新の初期値として用いること で計算時間の短縮と,局所最適解の回避を両立させる手法で解析を行う.
逐次更新の手順
1. 取得したデータの内,現時刻から一定のステップ数τ 前までのデータのみを用い,
最急降下法を用いてそのデータ点内で最適なパラメータを計算する.このとき,最 急降下法に用いる初期値は前時刻でのθ,ηを用いる.
2. 前回の開始点から1ステップだけずらし,そこからτ ステップ前の解析区間につい て,現時刻でのモデルパラメータを初期値として,最急降下法を行う.
0 500 1000 1500 2000 0
0.05 0.1 0.15 0.2
θ11
0 500 1000 1500 2000
−0.04
−0.02 0
k
θ12
0 500 1000 1500 2000
−0.1
−0.05 0 0.05 0.1
θ21
0 500 1000 1500 2000
−0.05
−0.03
−0.01 0.01
k
θ22
(a)θ1 (b) θ2
0 500 1000 1500 2000
0 5 10
η11
0 500 1000 1500 2000
−5 0 5
k
η12
(c)η1
図3.5 学習用モデルパラメータの時間変化
3. 2.の手順を繰り返す. 逐次更新の適用例
以下では,パラメータの時間変化が既知であるPrARXモデルに対して,その入出力信 号を学習データとして逐次更新手法により求めたモデルパラメータの時間変化を真値と比 較する.学習データとして,式(3.30),(3.32)の形で表現されるモード数2のデータ2000 点を用意する. 入力信号xは式(3.40),モデルパラメータθ,ηは図3.5のように与える. ま た,この例においてはデータ長τ は200とした.
φk= [uk1]T, uk = sin ( k
50π )
(3.40) 以上の学習データを逐次更新の手順に従い,解析を行った結果,推定されたパラメータ
0 500 1000 1500 2000
−0.04
−0.03
−0.02
−0.01 0
θ12
k
0 500 1000 1500 2000
0 0.05 0.1 0.15 0.2
θ11
0 500 1000 1500 2000
−0.1
−0.05 0 0.05 0.1
θ21
0 500 1000 1500 2000
−0.1
−0.05 0 0.05 0.1
k
θ22
(a) θ1 (b)θ2
0 500 1000 1500 2000
0 5 10
η11
0 500 1000 1500 2000
−5 0 5
k
η12
(c)η1
図3.6 逐次更新により推定されたパラメータの時間変化と真値との比較
図3.6に示された推定パラメータの様子から,正解パラメータの変化に対応したパラ メータ推定が行われていることが確認でき,図3.7で示されるように,実際の出力とほぼ相 違ない形で出力の推定が行われている.