1
ISM
統計モデルを用いた大規模データ
の分類,変換,そして知識発見
樋口知之
情報・システム研究機構 統計数理研究所&JST CREST
第10回 情報論的学習理論ワークショップ (IBIS 2007) 2007年11月5日(月),6(火),7日(水) 東京工業大学すずかけ台キャンパスISM
2アウトライン
1.異常値と欠損値処理
2.オンライン処理と時系列モデル
3.非ガウス情報処理
ー数値的に分布を構成
ーModel Averaging
ーConditional Dynamic Linear Model
4.Sequential Monte Carlo (SMC)
3
ISM
大量データは巨大なゴミ箱?
大規模データの実際は、そのまま
だと単なる屑の山
生ゴミ プラスチ ック ビン、ア ルミ缶 新聞・紙分別、整理することで
じゃ、大量データの解析は、
砂金探しのようなもの?
錬金術の話
ではない
4ISM
言葉の使われかた
情報
情報
知識
知識
データ
データ
○○知 Wisdom:英知 取り扱っていない情報科学
(AI,情報処理
、計算機統計)
統計科学
○○抽出
○○抽出
○○発見
○○発見
○○処理
○○処理
センシング
明確には認識さ れていない部分5
ISM
超大量データ(情報)処理関連研究領域
統計科学
機械学習
データマイニング
•パターン列挙(枚挙)
•高速探索
•生成モデル構成 ※
(Generative Model Building)
•伝統と蓄積
•判別モデル構成 ※
(Discriminative Model Building)
(Discriminant Function Builidng)
•最適化
※ 『 』 : Bishop “Pattern Recognition and Machine Learning” (2006), :伊庭による解説(信学技報告NC2006-55 (2006-10) 61—66)中の用語を利用
『データの生成過程を条件付き確 率で表現して,すべての変数の同 時分布を書き下し,あとは必要に 応じてベイズの公式を使う。』 『与えられた目的に必要 な条件付き確率のみを 抜き出してモデル化』 類似度のモデル化 全体のモデル化 → 予測,制御の作業が見通しよくで きる。 新しい学問 領域の創生
)
,
(
i jK
x
x
IBIS
ISM
NSF: Office of Cyberinfractructures
■ Cyber-Enabled Discovery and Innovation
Cyber-Enabled Discovery and Innovation (CDI) is NSF’s bold five-year initiative to create revolutionary science and engineering research outcomes made possible by innovations and advances in computational thinking.
Computational thinking is defined comprehensively to encompass computational concepts, methods, models, algorithms, and tools.
* From Data to Knowledge: enhancing human cognition and generating new knowledge from a wealth of heterogeneous digital data;
* Understanding Complexity in Natural, Built, and Social Systems: deriving fundamental insights on systems comprising multiple interacting elements; and
* Building Virtual Organizations: enhancing discovery and innovation by bringing people and resources together across institutional, geographical and cultural boundaries.
※This program is expected to start at $26M (約30億円)for this fiscal yearand increase significantly in future years.
■ Sustainable Digital Data Preservation and Access Network
Partners
7
ISM
事前のノイズ処理が実は本質的
目が細かいと, 水しか通らない 目が荒いと,小石 まで通ってしまう異常値を含んだデータを次のス
テップへ大量に渡してしまう。
新たな知見を生む可能性が
あるデータも捨ててしまう。
裏ごし ちょうど良い目の大きさ パラパラ さぁ、どうやっ て最初は手を つけようかぁ … 次の解析プロセスへゴミデータをふるいにかける
小麦粉をふるうと、ごみや異物を取り除い たり、粉をほぐしてきめを細かくし、空気を 含ませたりする役目があります。 異常値を除いたり、欠損値を補ったり 、順番を揃え直したり、…. 8ISM
情報縮約(不可逆変換)の加減
煮すぎると栄養も
旨みも流れ出る
ゆでが足りないと
苦みが残る
最適な調理具合
処理が足らなければ,
玉石混淆の情報が溢れる
やりすぎれば,必要な
情報まで捨ててしまう。
いくら素材 がよくとも 、…9
ISM
Chain Structure Graphical Model
0
x
2
y
y
t
2
x
x
t
観測できない
1
y
観測できる
観測モデル
1
x
システムモデル
{
}
{
t N}
N tx
x
x
x
y
y
y
,
,
,
,
,
,
,
,
,
1 0 1K
K
K
K
ベクトル量
過去
& 現在
現在
& 将来
状態
x
t観測値 y
(
|
t)
])
,
,
,
[
|
(
])
,
,
,
[
|
(
])
,
,
,
[
|
(
:
1
:
1
2
1
:
1
2
1
:
1
1
2
1
1
:
1
T
T
T
T
t
t
t
t
t
t
t
p
y
y
y
p
y
y
y
p
y
y
y
p
y
x
y
x
y
x
y
x
K
K
K
≡
≡
≡
−
−
きのうまでのデータに基づく今日の状態 今日までのデータに基づく今日の状態 数年後,データをすべて得たもとで振り返った今日の状態 日次株価データを考えると ---t t t t t te
Hx
y
Gv
Fx
x
+
=
+
=
−1 10ISM
ISM
内挿と外挿
0
x
1
−
t
y
1
−
t
x
観測できない
1
y
観測できる
観測モデル1
x
システムモデルt
y
t
x
T
y
T
x
x
T
+
1
欠測値、異常値⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
=
t
M
t
t
t
x
x
x
,
,
2
,
1
M
x
潜在変数を多数
用意する
データ数11
ISM
賢いアルゴリズムの開発よりモデリングの妙技が肝!
例:季節調整法
(北川,樋口,1998) (月データ) ・前年同月比 ・季調済みデータ(USセンサス) 12ISM
)
,
0
(
,
)
,
0
(
,
)
(
)
,
0
(
,
2
2 2 , , 3 2 1 2 , , 2 1σ
μ
τ
τ
μ
μ
μ
μ
μ
μ
N
e
e
s
y
N
v
v
s
s
s
s
N
v
v
t t t t t s t s t s t t t t t t t t t~
~
~
+
+
=
+
+
+
−
=
+
−
=
− − − − −:
:
:
t t te
s
μ
トレンド成分
季節変動成分
観測ノイズ
季節調整モデル (四半期データの場合)
‘
[
]
[
]
[
1
0
1
0
0
]
,
0
0
0
0
1
0
0
0
0
1
,
1
1
1
1
1
0
1
1
2
,
,
,
, , 2 1 1=
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
−
−
−
−
=
=
=
− − −H
G
F
v
v
v
s
s
s
x
tμ
tμ
t t t t t μt st t t t t t te
Hx
y
Gv
Fx
x
+
=
+
=
− 1‘
季節調整モデルの状態空間表現
13
ISM
2562
0.0321
2506
10
3.21
2556
10
3.21
AIC
4 -6-×
×
2α
Too smooth
Too rough
(Kitagawa, 1994)T
t|
μ
AIC best
)
parameters
-(hyper
#
AIC
=
−
2
log
p y
(
1:T|
α
2,
σ
2)
+
2
)
|
(
)
(
1
:
T
=
Π
T
t
=
1
p
y
t
1
:
t
−
1
p
y
y
経験ベイズ:ハイパーパラメータの決定
各時刻毎のフィルタのステップで求められる 14Fixed-Lag Smoother
T
t
=
'
t
t
=
1
=
t
)
|
(
t' 1:t'p
x
y
フィルタ分布:
固定区間平滑化分布:
p
(
x
t'|
y
1:t')
)
|
(
)
|
(
t
'
1
:
T
⇒
p
t
'
1
:
t
'
+
4
p
x
y
x
y
[
(
)
]
4
'
|
4
'
)
(
,
4
'
|
3
'
)
(
,
4
'
|
2
'
)
(
,
4
'
|
1
'
)
(
,
4
'
'|
)
(
4
'
|
4
'
i
t
t
i
t
t
i
t
t
i
t
t
i
t
t
i
t
t
+
+
=
+
+
+
+
+
+
+
+
+
Ξ
x
x
x
x
x
)
20
(
:
)
|
(
)
|
(
1
:
+
≈
p
:
+
L
L
=
p
x
t
y
t
L
x
t
y
t
t
L
は長くとる
2001年12月 3月 6月 9月 2002年12月15
Gaussian
Non-Gaussian
Smoother
Data
t t n t t tw
y
v
+
=
+
=
−μ
μ
μ
1トレンドモデル
ノイズの分布
正規分布
)
,
0
(
~
N
σ
2w
n~
(
0
,
)
Cauchy
分布
2τ
C
v
tISM
非ガウス情報処理のからくり:非ガウス平滑化
16ISM
(Kitagawa and Gersch, 1996)
ジャンプの自動同定
(
)
(
)
(
)
ガウス分布
)
分布(ローレンツ分布
族:
:
Cauchy
:
1
5
.
0
1
)
2
/
1
(
)
2
/
1
(
)
(
)
,
,
|
(
Pearson
2 2 1 2 2+∞
=
=
+∞
≤
<
−
+
⋅
Γ
−
Γ
Γ
=
−b
b
b
v
b
b
b
v
p
b bβ
τ
τ
τ
β
1
:
model
system
v
t
=
μ
t
−
μ
t
−
tv
1 − tμ
μ
t tμ
tμ
)
|
(
v
⋅
p
17
ISM
異常値の自動同定
t
t
t
y
e
=
−
μ
:
観測モデル
te
tμ
y
t ty
ty
)
|
(
e
t⋅
p
t
e
異常値処理された時系列データ 系列データ 18ISM
異常値の癖をモデル化する
t
t
t
y
e
=
−
μ
:
観測モデル
te
tμ
y
t)
,
(
)
1
(
)
,
0
(
)
|
(
e
t
N
s
2
N
out
out
2
p
⋅
=
α
σ
+
−
α
μ
σ
系列データout
μ
■計測機器の癖をモデル化する
Normal Mixture
異常値処理された時系列データ 1-α:異常値の割合19
スミソニアン博物館内の自走案内ロボット
•Position tracking
•Global localization problem
(初期位置未知)
•Kidnapped robot problem
(予告無しにどこかに連れ去られる)
•Multi-robot localization problem
•館内部の展示域は複雑な 形状 •特別展などでガラスケース の位置などに変更がある •似たような場所が展示域 に複数ある •混雑した中を自走する必 要 •廉価かつ簡単に実装でき るシステムが望ましい
難
ISM
Mobile Robot Localization
(D. Fox et al., “Particle filter for mobile robot localization,” 2001)
Experiences with
Interactive Museum
Tour-Guide Robots
Wolfram Burgard
University of Freiburg
Department of Computer Science
Autonomous Intelligent Systems
http://www.informatik.uni-freiburg.de/~burgard
[email protected]
確率ロボティクス
Sebastian Thrun (著), Wolfram Burgard ( 著), Dieter Fox (著), 上田 隆一 (翻訳)
21
ISM
Motion model
))
,
,
(
(
)
(
))
,
,
(
(
)
,
|
(
)
,
,
|
(
)
,
|
,
(
)
,
|
(
1 1 1 1 1 1 1 1 1 1 1 1 − − ∗ − − − − − − − − − −=
=
⋅
−
=
⋅
=
=
∫
∫
∫
t t t t t t t t t t t t t t t t t t t t t t t t t tu
x
x
f
v
p
dv
v
p
v
u
x
f
x
dv
u
x
v
p
v
u
x
x
p
dv
u
x
v
x
p
u
x
x
p
δ
Convolution of conventional
robot kinematics and two
independent zero-mean
random variable
)
,
(
)
,
,
(
1 1 t t t t t t tw
x
h
y
v
u
x
f
x
=
=
− −Motion model
:パターンを集めシステムモデルを数値的に構成
)
,
|
(
t
t
−
1
t
−
1
p
x
x
u
22ISM
))
,
(
(
)
(
))
,
(
(
)
|
(
)
,
|
(
)
|
,
(
)
|
(
t t t t t t t t t t t t t t t t t t t tx
y
h
w
p
dw
w
p
w
x
h
y
dw
x
w
p
w
x
y
p
dw
x
w
y
p
x
y
p
∗=
=
⋅
−
=
⋅
=
=
∫
∫
∫
δ
observation model
)
,
(
)
,
,
(
1 1 t t t t t t tw
x
h
y
v
u
x
f
x
=
=
− −Perceptual model:
観測誤差モデルも数値的に構成すればいい
センサーが被る観測誤差
普通の観測誤差+普通,異常
値として取り扱うような誤差
Planar 2D laser range finderの場合
)
|
(
t
t
)
,
|
(
)
,
|
(
2
1
1
θ
x
y
θ
x
x
t
t
t
t
p
p
⋅
⋅
−
~
~
23ISM
ISM
自己組織(調整)型時系列モデルのグラフィカルモデル
観測できない
1
y
観測できる
t
y
1
−
t
y
1
θ
θ
t
−
1
θ
t
0
θ
0
x
x
1
x
t
−
1
x
t
(Kitagawa, 1996))
,
|
(
]'
'
,
'
[
1
,
2
1
,
1
ψ
−
−
⋅
≡
t
t
t
t
t
p
θ
θ
θ
θ
θ
~
ロボティクスの分野で応用開発研究が 非常に盛ん。主にオンライン処理。{Ghahramani, Jordan, Hinton} {Shamway&Stoffer}
24
ISM
ISM
状態ベクトルへの埋め込みとオンライン型 Model Averaging
1
−
t
y
1
−
t
x
t
y
t
x
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
t
t
M
t
t
t
x
x
x
θ
x
,
,
2
,
1
M
SOSSM with latent switching variable
⎥
⎦
⎤
⎢
⎣
⎡
=
t
t
t
I
x
α
(Higuchi, 2000, 2001) in Sequential Monte Carlo Methods in Practice(eds. A.Doucet, J.F.G, de Freitas, and N.J.Gordon)
あとは粒子フィルタを適用するだけ!
Evolution of : Markov switching prior
I
tt
I
がどのモデルを使うかを指定する. 異種,多数のモデルを同時に考え,Model Averaging をオンラインで達成する.)
,
(
t
t
i
t
h
x
w
y
=
観測モデル集合: i=1, …., M⎩
⎨
⎧
=
+
=
≠
+
−
=
0
,
log
0
,
/
)
1
(
λ
λ
λ
λ t t t t t tw
x
y
w
x
y
Box-Cox変換を多数用意
25
ISM
)
,
0
(
,
)
,
0
(
,
2
2
2
2
1
σ
μ
τ
μ
μ
μ
N
w
w
y
N
v
v
t
t
t
t
t
t
t
t
t
~
~
+
=
+
−
=
−
−
真のトレンド
Small Dip
線形・
非
ガ
ウ
ス
ト
レ
ン
ド
モ
デ
ル
C
線形
ガ
ウ
ス
ト
レ
ン
ド
モ
デ
ル
ジャンプの自動同定(例)
26ISM
自己組織型状
態空間モ
デ
ル
)
,
0
(
,
log
log
)
,
0
(
,
)
,
0
(
,
2
2 1 10 2 10 2 2 2 1ξ
ε
ε
σ
σ
σ
τ
μ
μ
μ
C
N
w
w
t
y
C
v
v
t t t t t t t t t t t t t t~
~
~
+
=
+
=
+
−
=
− − −分散変動の自動同時推定
ISM
27
Given trend:
μ
t
true
1
=
true tI
2
=
true tI
Local level model with switching
system/observation variance
観測ノイズ小
•Kim and Nelson (1999)
•Fruhwirth-Schnatter (2001)
観測ノイズ大
US/UK real exchange rate
from Jan. 1885 to Nov. 1999
(Grilli and Kaminsky (1991), Engle and Kim (1999))
The real exchange rate is defined as the relative price of UK to US producer goods: US/UK nominal exchange rate times the UK producer price index divided by the US producer price index
ISM
28Simulation Data
1
1
=
+
=
−
t t tI
t
I
t
I
t
H
w
E
x
H
y
( )
⎩
⎨
⎧
=
=
=
=
2
,
1
,
arg
e
t
l
t
small
I
t
t
I
I
E
x
tσ
σ
μ
Model
異常値の同定と同じ.ただ背後に,マルコフ性をもつ時系列構造が潜んでいる29
{
I
l
i
N
}
N
l
I
t
k
|
T
)
1
#
t
i
T
with
t
k
|
1
,
,
r(
Pˆ
,
=
y
1
:
=
z
(
|
1
)
:
,
=
=
K
Points with larger obs. noise
2
=
true tI
=
1
true tI
事後分布: レジームの推定
ISM
t
t
t
t
t
t
w
D
x
H
y
u
G
x
F
x
λ
λ
λ
λ
+
=
+
=
−1
Conditional Dynamic Linear Model (CDLM)
Time-Dependent Gaussian Mixture Model
t
I
=
λ
,
が与えられば定数行列
は
I
tD
H
G
F
λ,
λ,
λ,
λλ
=
)
|
Pr(
I
t
j
I
t
1
i
ij
=
=
−
=
π
:
t
I
latent indicator variable
stationary, discrete, first order homogenous Markov chain 遷移確率
31
Rao-Blackwellization
に相当
の場合:
)
|
,
(
)
,
(
CDLM
:
1
:
1
2
1
x
p
x
t
t
t
x
p
⇒
I
y
[
]
られれば...
がもし,解析的に求め
1 2 1 2 1 2 2 1 2 1 2 1 2 1 2 1 2 1)
|
(
)
,
(
)
(
)
|
(
)
,
(
)
,
(
)
,
(
dx
x
x
p
x
x
g
dx
x
p
dx
x
x
p
x
x
g
dx
dx
x
x
p
x
x
g
∫
∫ ∫
∫
=
{ }
でモンテカルロ積分を
行えばいい
に従うサンプル
~
j mjx
x
p
x
( ) 1 2 2 2(
)
=)
,
(
)
,
|
(
x
t
1
(
:
t
j
)
1
:
t
N
x
t
(
|
t
j
)
V
t
|
(
t
j
)
p
I
y
=
いか?
どうやって求めればい
を
に従うサンプル
(
)
:
1
:
1
:
1
|
)
(
t
t
t
j
p
I
y
I
32Conditioningの表記法:フィルタ分布
)
KF
|
(
)
,
(
)
,
|
(
)
,
(
and
)
,
(
KF
)
(
1
1
)
(
1
|
1
)
(
1
|
1
1
:
1
)
(
1
1
1
:
1
)
(
1
:
1
)
(
1
|
1
)
(
1
|
1
)
(
1
j
t
t
j
t
t
j
t
t
t
j
t
t
t
j
t
j
t
t
j
t
t
j
t
x
p
V
x
N
x
p
V
x
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
=
=
=
y
I
y
I
ISM
33
)
KF
,
|
(
)
'
'
,
(
)
,
,
|
(
)
,
|
(
)
(
1
)
(
)
(
)
(
)
(
1
|
)
(
1
|
1
:
1
)
(
1
:
1
)
(
1
:
1
)
(
:
1
) ( ) ( ) ( ) ( ) (j
t
j
t
t
j
I
j
I
I
j
t
t
I
j
t
t
I
t
j
t
j
t
t
t
j
t
t
I
y
p
D
D
H
V
H
x
H
N
I
y
p
y
p
j t j t j t j t j t−
−
−
−
−
−
=
+
=
=
I
y
y
I
)
KF
,
|
(
)
,
(
)
,
,
|
(
)
,
|
(
)
(
1
)
(
)
(
1
|
)
(
1
|
1
:
1
)
(
1
:
1
)
(
1
:
1
)
(
:
1
j
t
j
t
t
j
t
t
j
t
t
t
j
t
j
t
t
t
j
t
t
I
x
p
V
x
N
I
x
p
x
p
−
−
−
−
−
−
=
=
=
I
y
y
I
) ( ) ( ) ( ) ( ) ('
'
,
) ( 1 | 1 ) ( 1 | ) ( 1 | 1 ) ( 1 | j t j t j t j t j t I I I j t t I j t t j t t I j t tG
G
F
V
F
V
x
F
x
+
=
=
− − − − − −ISM
Conditioningの表記法:予測分布
34)
|
(
)
(
I
1:T=
p
I
1:Ty
1:Tπ
Posterior probability:
SIS framework:
)
(
)
(
)
|
(
)
|
(
)
(
)
(
)
|
(
)
|
(
)
|
(
)
(
)
(
)
(
)
|
(
)
|
(
)
|
(
)
(
)
|
(
)
|
(
)
|
(
)
(
)
(
)
(
1 : 1 1 : 1 1 : 1 : 1 : 1 : 1 : 1 : 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 1 1 : 1 2 2 2 : 1 1 1 1 : 1 1 1 : 1 2 2 : 1 1 1 : 1 : 1 : 1 : 1 − − − − − − − − − − − − − −≈
=
≈
=
=
=
=
t t t t t t T t t t t t t t t t t t t t t t T T T T T T T T T T T T TI
p
p
I
q
I
w
w
I
q
I
q
I
q
I
q
I
I
I
I
q
w
I
I
I
y
I
I
I
y
I
I
I
I
I
I
I
I
I
I
I
I
I
I
π
π
π
π
π
π
π
π
π
π
π
L
L
On line 計算 に不向きfilter dist.
target function
trial function
Importance
weight
Sequential Monte Carlo(SMC)の基礎1.
35
General SIS framework:
)
KF
|
(
)
,
|
(
)
,
|
(
)
|
(
1
)
|
(
)
|
(
)
,
|
(
)
|
(
)
|
(
1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 : 1 1 : 1 t-t t t t t t t t t t t t t t t t t t t ty
p
y
p
y
p
p
y
p
p
y
p
p
p
=
≡
∝
⋅
⋅
=
− − − − − − − − − − − − − −y
I
y
x
y
x
y
y
x
y
x
y
x
y
x
)
|
(
)
KF
,
|
(
)
,
|
(
)
,
,
|
(
)
,
|
(
)
,
|
(
)
,
,
|
(
)
,
,
|
(
)
,
|
(
)
|
(
1 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 : 1 1 : 1 1 : 1 − − − − − − − − − − − − − − − −⋅
≡
⋅
∝
⋅
=
=
=
t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t tI
I
p
I
y
p
x
p
x
y
p
y
p
x
p
x
y
p
y
x
p
x
p
x
y
x
y
x
y
x
y
x
y
x
y
x
y
x
x
π
)
|
(
)
|
(
)
(
)
(
)
|
(
)
|
(
)
|
(
)
(
)
|
(
)
(
)
|
(
)
(
)
,
(
)
|
(
)
(
)
(
)
|
(
)
(
)
(
1 : 1 1 : 1 : 1 1 : 1 1 : 1 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 1 : 1 1 : 1 1 : 1 1 : 1 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 − − − − − − − − − − − − − − − − − − − − − − − −=
=
=
=
=
=
⋅
=
⋅
=
t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t tp
p
x
x
q
x
q
x
x
q
x
x
q
u
x
q
w
u
w
w
y
x
y
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
π
π
π
π
π
π
π
π
π
π
π
π
とすると
SMCの基礎2.
ISM
各粒子あたり、 だけ和をとる必要がある モデルの数 の要素数 : : M K It KM
36粗形粒子フィルタ in SIS framework
(Monte Carlo filter (Kitagawa, 1993), Bootstrap filter (Gordon et al., 1993))
x
x
p
x
y
p
p
x
x
p
x
y
p
p
x
p
x
y
p
x
p
y
p
p
y
p
y
p
p
y
p
y
p
p
t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t)
(
)
|
(
)
|
(
)
|
(
)
|
(
)
|
(
)
|
(
)
,
|
(
)
|
(
)
|
,
(
)
,
|
(
)
|
(
)
,
|
(
)
|
(
)
|
(
)
,
|
(
)
,
|
(
)
|
(
)
(
1 : 1 1 1 1 : 1 1 : 1 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 1 : 1 : 1 1 : 1 : 1 1 : 1 : 1 1 : 1 1 : 1 : 1 1 : 1 : 1 1 : 1 : 1 : 1 : 1 : 1 − − − − − − − − − − − − − − − − − − −=
=
=
=
∝
=
=
=
x
y
x
y
x
y
x
y
x
y
x
y
x
y
x
y
y
x
y
x
y
x
y
x
x
π
π
SMCの基礎3.
x
q
x
x
p
x
y
p
x
q
x
x
p
x
y
p
x
q
u
t t t t t t t t t t t t t t t t t t t t t t t t t t)
|
(
)
|
(
)
|
(
)
|
(
)
(
)
(
)
|
(
)
|
(
)
|
(
)
(
)
(
1 : 1 1 1 : 1 1 : 1 1 1 : 1 1 1 1 : 1 1 : 1 1 : 1 − − − − − − − − − − −=
∝
=
x
x
x
x
x
x
x
π
π
π
π
)
|
(
u
t
∝
p
y
tx
tx
x
p
x
q
t(
t|
x
1:t−1)
=
(
t|
t−1)
システムモデル 観測モデルISM
37)
|
(
)
,
|
(
)
,
,
|
(
)
|
,
(
)
,
,
|
(
)
|
(
)
,
|
(
)
|
,
(
)
|
(
)
|
,
(
)
,
|
(
)
|
(
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
1
:
1
:
1
1
:
1
:
1
1
:
1
:
1
1
:
1
1
:
1
:
1
1
:
1
1
:
1
:
1
:
1
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
−
=
=
=
∝
=
=
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
p
I
p
I
y
p
I
p
I
y
p
p
y
p
y
p
y
p
y
p
y
p
p
y
I
y
I
y
I
y
I
y
I
y
I
y
I
y
I
y
y
I
y
I
y
I
Trial Function に予測分布を使う簡易版
)
|
(
)
,
|
(
)
,
,
|
(
)
|
(
1
(
:
t
j
)
1
:
t
−
1
∝
p
y
t
I
t
(
j
)
1
(
:
t
j
)
−
1
1
:
t
−
1
p
I
t
(
j
)
1
(
:
j
t
−
)
1
1
:
t
−
1
p
1
(
:
t
j
)
−
1
1
:
t
−
1
p
I
y
I
y
I
y
I
y
Samplingへ
Resamplingへ
ISM
382. Constant Velocity Model:
3. Constant Acceleration Model:
cv t x t
w
t
d
v
d
, ,=
ca t x tw
t
d
a
d
. ,=
Target Tracking Problem:複数モデル
1. Constant Position Model:
tcv x tw
t
d
s
d
, ,=
4. Constant Jerk Model:
tcj x tw
t
d
a
d
. ,=
∇
t
x ty
,x
y
ISM
39(
)
⎥
⎦
⎤
⎢
⎣
⎡
=
=
=
=
=
y
I
x
I
I
y
t
y
t
y
t
x
t
x
t
x
t
t
t t tu
u
a
v
s
a
v
s
,
1
,
1
1
,
,
,
,
,
,
,
,
,
,
,
u
x
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
Δ
=
=0
1
1
, 1t
F
I x t⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
Δ
Δ
Δ
=
=1
1
2
/
)
(
1
2 , 2t
t
t
F
I x tt
I
t
I
t
F
tx
G
tu
x
=
−1
+
Constant Velocity Model:
cvConstant Acceleration Model:
t x t
u
t
d
v
d
=
, ca t x tu
t
d
a
d
=
,Target Tracking Problem: 状態ベクトル
位置 速度 加速度
分散の違いは,
Gで表現させれ
ばいい
[
]
'
,
,
,
,
x
,
t
x
,
t
x
,
t
x
t
t
=
s
v
a
∇
a
x
ISM
1)速度0とする
2)初期等速度モデル分布からリサンプリングする
3)一期前の等速度モデル分布からリサンプリングする
次元の異なる状態ベクトル間の情報交換
同位置モデル⇒等速度モデル
)
,
0
(
~
0
,
0
,
2
1
0
,
0
,
0
),
,
0
(
~
,
2
,
,
,
,
1
,
,
,
,
,
1
,
1
,
,
,
,
2
,
,
,
,
1
,
x x x x x x xv
t
v
t
v
t
x
t
x
t
x
t
x
t
v
t
x
t
x
t
x
t
x
t
x
t
x
t
s
t
s
t
s
t
x
t
x
t
N
w
w
v
v
a
a
w
v
s
s
a
a
v
N
w
w
s
s
τ
τ
+
=
=
∇
=
+
+
=
=
∇
=
=
+
=
−
−
−
−
{
}
N j t t j i x tv
I
v
t x t 1| 1 1 ) ( ) ( , 1~
1,| 1|
− − = − − −=
等速度モデル
41
ISM
簡易版オンライン型 Model Averaging の手続き
{
|
1
,
|
1
}
P
t
≡
x
t
t
−
V
t
t
−
) ( 1 | j t tI
− ) ( 1 | 1 j t tI
− − ) ( 1 | j t L tI
− − ) ( 1 )| 1 ( j t L tI
− + − ) ( 1 j t−KF
( j) tKF
j番目の粒子 ) 2 (KF
− + ∧ L t)
1
(
+
− L
t
y
y
t
) 1 (KF
− + ∧ L t ) 1 (P
− + ∧ L t{
}
mの最頻値
j j L t L tI
I
ˆ
−( +1):
(−() +1) =1{
|
1
,
|
1
}
S
t
≡
x
t
t
+
V
t
t
+
) 2 (S
− + ∧ L t 次の時刻までのデータが所与のもとで の状態ベクトルx
の推定j
=1,…,m
Fixed-Lag Smoother with Model Averaging
帰納的
42ISM
TESD: 第4の科学,第4の方法論
T:理論
E:実験
S:シミュレ
ーション
D:大量デ
ータ処理
演繹的
データ同化
科学の駆動力
予測・制御
前には進むが,どちらにい
くのかコントロールが必要
Modeling
43