PrARX モデル

3.2節で紹介したPWARXモデルは人間の行動を確定的な境界面で分割しているが,

本節ではPWARXと多項ロジスティック回帰の考え方を融合した

PrARX(Probability-weighted ARX)モデルについて説明する.

3.3.1 PrARX _{モデルの定義}

PrARXモデルの出力は次式で与えられる．

yk =

∑s i=1

Pi(xk)θ_i^Txk (3.30)

PrARXモデルはs個のARXモデルが確率Piによって重みづけされる形となっている．

Piはモードiが選択される確率を表し，以下のようなソフトマックス関数によって与えられる.

Pi(x) = exp(η^T_i x)

∑s

j=1exp(η^T_j x) (3.31)

ηs= 0 (3.32)

確率Piはパラメータηによって決定され,多項ロジスティック回帰モデルにおける出力と同じ形式となっている. このように，PrARXモデルは多項ロジスティック回帰モデル

とPWARXモデルを融合した形となっている．

また，PrARXモデルの確率重み関数Piをもとに，次式によって確定的なモード条件

を得ることができる．

x∈Ui i= argmaxPi(x) (3.33)

これにより，PrARXモデルを機械的にPWARXモデルへ変換することができる.

3.3.2 _モデル例

PrARXモデルの例として,3モード1変数のPrARXモデルのサンプルを以下に示す.

このモデルのパラメータは, θ1=

[0.5 5

]

, θ2= [−0.1

3 ]

, θ3= [−0.4

15 ]

η1= [−3

45 ]

, η2= [−1.5

30 ]

0 5 10 15 20 25 30 0

5 10

0 5 10 15 20 25 30

0 0.5 1

Probability (P i)

図3.4 PrARXモデルの例

のように設定した.

図のように,赤の破線で示された3つのARXモデルが確率Pに従って,青の実線のように滑らかに切り替わっていることが確認できる. このことから,PrARXモデルは,ダイナミクスを表すパラメータθ,判断を表すパラメータηで決定され,モードの切り替わりを滑らかにしたハイブリッドシステムとみなすことができる.

3.3.3 PrARX モデルのパラメータ同定法

PrARXモデルのパラメータは，以下の誤差関数を最小にするθ，ηを求めることに

よって得られる．

= 1 N

∑N k=1

kyk−yˆkk², (3.34)

ˆ yk=

∑s i=1

Pi(xk)θ^T_ixk (3.35)

この目的関数はモデルによって推定された出力yˆkと実際に観測された出力yk との誤差のノルムの二乗和を表している. 本研究ではこの最適化問題を最急降下法を用いて解く. 最急降下法は以下の更新式に従い,得られた最急降下方向にパラメータを更新することによって最適解を求める手法である.

θ_i^(t+1)=θ^(t)_i −α ∂

∂θ_i^(t) (3.36)

η^(t+1)_i =η^(t)_i −β ∂

∂η_i^(t) (3.37)

目的関数のパラメータによる偏微分は,

∂

∂θi

=−1 N

∑N k=1

ekPi(xk)xk (3.38)

∂

∂ηi

=−1 N

∑N k=1

2ekPi(xk)xk(θ^T_i x−yˆk) (3.39) ここで,θ_i^(t),η^(t)_i はt回更新後のパラメータである. α,βは微小な正の数を任意で使用する. また,初期値依存性の問題から局所最適解を回避するため多くの初期値の組を用意し,検証を行う必要がある.

PrARXモデルの利点として,この最急降下法というアルゴリズム一つで,ダイナミクス

に関するパラメータθiとモードの境界を決定するパラメータηiが同時に同定できるという点がある.

3.3.4 パラメータの逐次更新手法

人間の操作・判断特性は，支援システムの機能やタスクへの慣れなどによって時々刻々変化していくと考えられる．したがって，PrARXモデルのパラメータθ，η も常にそれに合わせて最適な値に調整することが望ましい. 前述の最急降下法を用いたパラメータ同定方法は局所最適解を回避するために大量の初期値が必要となり，結果パラメータ更新に時間がかかり，実時間でのモデルの最適化が難しいという問題がある．支援システムの機能やタスクへの慣れに起因する操作・判断特性の変化は,時刻とともに徐々に変化していくと仮定すると，現時刻のパラメータを何らかの規則に従って修正することで，時刻に対応した最適パラメータを求めることが可能になると考えられる．そこで，PrARXモデルのパラメータが最急降下法に基づくパラメータ更新によって決定されていることを利用し，現時刻のパラメータを最急降下法に基づくパラメータ更新の初期値として用いることで計算時間の短縮と，局所最適解の回避を両立させる手法で解析を行う．

逐次更新の手順

1. 取得したデータの内，現時刻から一定のステップ数τ 前までのデータのみを用い，

最急降下法を用いてそのデータ点内で最適なパラメータを計算する．このとき，最急降下法に用いる初期値は前時刻でのθ,ηを用いる.

2. 前回の開始点から1ステップだけずらし,そこからτ ステップ前の解析区間について,現時刻でのモデルパラメータを初期値として,最急降下法を行う.

0 500 1000 1500 2000 0

0.05 0.1 0.15 0.2

θ11

0 500 1000 1500 2000

−0.04

−0.02 0

θ12

0 500 1000 1500 2000

−0.1

−0.05 0 0.05 0.1

θ21

0 500 1000 1500 2000

−0.05

−0.03

−0.01 0.01

θ22

(a)θ1 (b) θ2

0 500 1000 1500 2000

0 5 10

η11

0 500 1000 1500 2000

−5 0 5

η12

(c)η1

図3.5 学習用モデルパラメータの時間変化

3. 2.の手順を繰り返す. 逐次更新の適用例

以下では，パラメータの時間変化が既知であるPrARXモデルに対して，その入出力信号を学習データとして逐次更新手法により求めたモデルパラメータの時間変化を真値と比較する．学習データとして,式(3.30),(3.32)の形で表現されるモード数2のデータ2000 点を用意する. 入力信号xは式(3.40),モデルパラメータθ,ηは図3.5のように与える. また，この例においてはデータ長τ は200とした．

φk= [uk1]^T, uk = sin ( k

50π )

(3.40) 以上の学習データを逐次更新の手順に従い,解析を行った結果,推定されたパラメータ

0 500 1000 1500 2000

−0.04

−0.03

−0.02

−0.01 0

θ12

0 500 1000 1500 2000

0 0.05 0.1 0.15 0.2

θ11

0 500 1000 1500 2000

−0.1

−0.05 0 0.05 0.1

θ21

0 500 1000 1500 2000

−0.1

−0.05 0 0.05 0.1

θ22

(a) θ1 (b)θ2

0 500 1000 1500 2000

0 5 10

η11

0 500 1000 1500 2000

−5 0 5

η12

(c)η1

図3.6 逐次更新により推定されたパラメータの時間変化と真値との比較

図3.6に示された推定パラメータの様子から,正解パラメータの変化に対応したパラメータ推定が行われていることが確認でき,図3.7で示されるように,実際の出力とほぼ相違ない形で出力の推定が行われている.

ドキュメント内判断・操作統合型運転行動モデルに基づく革新的運転行動支援の創出タカタ財団助成研究論文集 ISSN 2185 (ページ 31-35)

3.3.1 PrARX モデルの定義

3.3.2 モデル例

3.3.3 PrARX モデルのパラメータ同定法

3.3.4 パラメータの逐次更新手法

3.3.1 PrARX _{モデルの定義}

3.3.2 _モデル例