変化点モデルに対する漸近理論の拡張
〜独立系列から相関のある系列へ〜
九州大学大学院数理学研究院 二宮 嘉行
1. 序
変化点解析のための統計理論は
, 1950
年代から現在に至るまで,
長い間研究されている.
その 理由は,
この解析が応用上重要であることだけではなく,
変化点パラメータがある種の非正則性を もつという理論的興味にもある.
例えば,
一般に変化点モデルの尤度関数は変化点パラメータで微 分できないため,
変化点モデル固有の漸近理論が必要となり,
研究が進んでいる. Ninomiya [3]
やNinomiya [4]
ではその漸近理論を独立系列における複数変化点モデルに対するものに拡張し,
検定あるいは情報量規準に基づいたモデル選択を目指している
.
ここでは,
変化点解析の需要が高い 計量経済への応用を考慮し,
また,
拡散過程さらにはCox
回帰モデルにおける変化点問題を扱う ための準備として,
自己回帰過程における複数変化点モデルを扱う.
2. 変化点推定量の漸近的性質
最も単純なモデルを考える
. t
はN(0, σ 2 )
に従う白色雑音とし, X 1 , . . ., X n
はX t = a (1) X t−1 + t , (2 ≤ t ≤ k ∗ )
= a (2) X t−1 + t , ( k ∗ + 1 ≤ t ≤ n ) (1)
なるモデルに従うとする(X 1
は適当).
ここで, a (1) , a (2) , σ 2 , k ∗
は未知であり,
漸近論(n → ∞)
を考える際にはk ∗ = [ nλ ] ( λ
は0 < λ < 1
なる定数)
を満たすものとする
(
データがそのように増えていくことを想定しているわけではない).
この節 では変化点k ∗
の最尤推定量ˆ k
の漸近的性質を調べていく.
変化点を
k
としたときの(
条件付)
最大対数尤度をT ( k ), ( a (1) , a (2) , σ 2 )
の(
条件付)
最尤推定 量を(ˆ a (1) k , ˆ a (2) k , σ ˆ k 2 )
と記せば, 2{T (k) − T(k ∗ )}
はk
∗t=2
(X t − ˆ a (1) k
∗X t−1 ) 2 + n t=k
∗+1
(X t − ˆ a (2) k
∗X t−1 ) 2
σ ˆ k 2
∗− k
t=2
( X t − ˆ a (1) k X t−1 ) 2 + n t=k+1
( X t − ˆ a (2) k X t−1 ) 2
σ ˆ 2 k + n log(ˆ σ k
∗/ σ ˆ k ) (2)
である. k − k ∗ = O(1)
とする. (ˆ a (1) k
∗, ˆ a (2) k
∗, ˆ σ k 2
∗) = (ˆ a (1) k , ˆ a (2) k , σ ˆ k 2 ) + O P ( n −1 )
であるから,
k
t=2
( X t − ˆ a (1) k X t−1 ) 2 + n t=k+1
( X t − ˆ a (2) k X t−1 ) 2
σ ˆ 2 k + n log ˆ σ k
= k
t=2
( X t − ˆ a (1) k
∗X t−1 ) 2 + n t=k+1
( X t − ˆ a (2) k
∗X t−1 ) 2
σ ˆ 2 k
∗+ n log ˆ σ k
∗+ o P (1) (3)
である.
これより, (2)
はk > k ∗
ならばk t=k
∗+1
{ ( X t − ˆ a (2) k
∗X t−1 ) 2 − ( X t − ˆ a (1) k
∗X t−1 ) 2 }/ σ ˆ k 2
∗+ o P (1)
= k t=k
∗+1
{ ( X t − a (2) X t−1 ) 2 − ( X t − a (1) X t−1 ) 2 }/σ 2 + o P (1) (4)
= k t=k
∗+1
{2X t−1 (a (1) − a (2) ) t − (a (1) − a (2) ) 2 X t−1 2 }/σ 2 + o P (1) (5)
となる
. (4)
は(ˆ a (1) k
∗, ˆ a (2) k
∗, ˆ σ k 2
∗) = ( a (1) , a (2) , σ 2 ) + o P (1)
であることによる. k < k ∗
のときも同様 の式が得られるので,
両側に伸びる負のドリフト付ランダムウォークをQ k ≡ I k<k
∗k
∗t=k+1
{ 2 X t−1 ( a (2) − a (1) ) t − ( a (2) − a (1) ) 2 X t−1 2 }/σ 2
+I k>k
∗k t=k
∗+1
{ 2 X t−1 ( a (1) − a (2) ) t − ( a (2) − a (1) ) 2 X t−1 2 }/σ 2 (6)
と定義すれば, k − k ∗ = O(1)
ならば2{T (k) − T (k ∗ )} − Q k = o P (1)
がいえる. |k − k ∗ | → ∞
なら ばQ k → −∞
となることからも想像できるように, |k − k ∗ | → ∞
ならば2 {T ( k ) − T ( k ∗ ) } → −∞
となる
(
厳密には,
次節の補題1
の証明のような展開が必要となる).
以上より,
最尤推定量k ˆ
に関 してˆ k − k ∗ = O P (1)
かつˆ k − argmax
k Q k = o P (1) (7)
が成り立つ
.
これよりˆ k
は一致性をもつといわれる.
また,
漸近正規性は満たされないこともわか る.
さらにmax k 2 {T ( k ) − T ( k ∗ ) } − max
k Q k = o P (1) (8)
がいえていることもわかる
.
3. 尤度比検定統計量の漸近的性質
この節では変化点数
1
対2
の尤度比検定の漸近論を扱う.
そのために変化点数2
のモデルをX t = a (1) X t−1 + t , (2 ≤ t ≤ k ∗ 1 )
= a (2) X t−1 + t , ( k 1 ∗ + 1 ≤ t ≤ k ∗ 2 )
= a (3) X t−1 + t , ( k 2 ∗ + 1 ≤ t ≤ n ) (9)
と用意する.
また,
変化点をk 1 , k 2
としたときの, (
条件付)
最大対数尤度をT 2 (k 1 , k 2 ), (a (1) , a (2) , a (3) , σ 2 )
の(
条件付)
最尤推定量を(ˆ a (1) k
1,k
2, ˆ a (2) k
1,k
2, ˆ a (3) k
1,k
2, σ ˆ k 2
1,k
2)
と記すことにする.
まず
,
変化点数1
のモデルが真であるという仮説のもとでの, k ∗ 1 , k ∗ 2
の最尤推定量ˆ k 1 , ˆ k 2
に関 する補題を与える.
証明は(7)
の導出を拡張して考えることによって得られる(
付録A
参照).
補題
1
モデル(1)
が真であるという仮説のもとでモデル(9)
を考えると,
少なくとも| ˆ k 1 − k ∗ | = O P (1)
か| ˆ k 2 − k ∗ | = O P (1)
のどちらかが成り立つ.
この補題の結果を用いて
max k
1<k
2T 2 ( k 1 , k 2 ) − T ( k ∗ )
の漸近分布に関する補題を与える(
証明 は付録B
参照).
補題
2
モデル(1)
が真であるという仮説のもと, 2{ max
k
1<k
2T 2 (k 1 , k 2 ) − T (k ∗ )}
− max
sup
1/n≤t≤1−1/n
B 1,n ( t ) 2 t (1 − t )
, sup
1/n≤t≤1−1/n
B 2,n ( t ) 2 t (1 − t )
+ max
k Q k
= o P (1) ,
B j,n (t) dist. = B(t) (j = 1, 2),
なる確率過程の独立な列{B j,n ( t ) } ( j = 1 , 2)
が存在する.
この補題
2
と(8)
を組み合わせると,
変化点数1
対2
の尤度比検定統計量max k
1<k
2T 2 ( k 1 , k 2 ) − max k T ( k )
について以下の結果を得る.
定理
1
モデル(1)
が真であるという仮説のもと, [2 { max
k
1<k
2T 2 ( k 1 , k 2 ) − max
k T ( k ) } ] 1/2
− max
sup
1/n≤t≤1−1/n
B 1,n (t) 2 t (1 − t )
1/2
, sup
1/n≤t≤1−1/n
B 2,n (t) 2 t (1 − t )
1/2
= o P (1) ,
B j,n ( t ) dist. = B ( t ) ( j = 1 , 2) ,
なる確率過程の独立な列{B j,n ( t ) } ( j = 1 , 2)
が存在する.
これは自明に変化点数
m
対m + 1
の尤度比検定の場合に拡張でき,
収束のオーダーも精確に議 論すれば以下が得られる.
命題
1 h j ( n ) ≥ 1 /n , l j ( n ) ≥ 1 /n ( j = 1 , . . ., m + 1)
がある0 < ∗ ≤ 1
に対してlim sup
n→∞ n{h j ( n ) + l j ( n ) } exp {− (log n ) 1−
∗} < ∞
を満たすとする