• 検索結果がありません。

変化点モデルに対する漸近理論の拡張

N/A
N/A
Protected

Academic year: 2021

シェア "変化点モデルに対する漸近理論の拡張"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

変化点モデルに対する漸近理論の拡張

〜独立系列から相関のある系列へ〜

九州大学大学院数理学研究院 二宮 嘉行

1.

変化点解析のための統計理論は

, 1950

年代から現在に至るまで

,

長い間研究されている

.

その 理由は

,

この解析が応用上重要であることだけではなく

,

変化点パラメータがある種の非正則性を もつという理論的興味にもある

.

例えば

,

一般に変化点モデルの尤度関数は変化点パラメータで微 分できないため

,

変化点モデル固有の漸近理論が必要となり

,

研究が進んでいる

. Ninomiya [3]

Ninomiya [4]

ではその漸近理論を独立系列における複数変化点モデルに対するものに拡張し

,

定あるいは情報量規準に基づいたモデル選択を目指している

.

ここでは

,

変化点解析の需要が高い 計量経済への応用を考慮し

,

また

,

拡散過程さらには

Cox

回帰モデルにおける変化点問題を扱う ための準備として

,

自己回帰過程における複数変化点モデルを扱う

.

2. 変化点推定量の漸近的性質

最も単純なモデルを考える

. t

N(0, σ 2 )

に従う白色雑音とし

, X 1 , . . ., X n

X t = a (1) X t−1 + t , (2 t k )

= a (2) X t−1 + t , ( k + 1 t n ) (1)

なるモデルに従うとする

(X 1

は適当

).

ここで

, a (1) , a (2) , σ 2 , k

は未知であり

,

漸近論

(n → ∞)

を考える際には

k = [ ] ( λ

0 < λ < 1

なる定数

)

を満たすものとする

(

データがそのように増えていくことを想定しているわけではない

).

この節 では変化点

k

の最尤推定量

ˆ k

の漸近的性質を調べていく

.

変化点を

k

としたときの

(

条件付

)

最大対数尤度を

T ( k ), ( a (1) , a (2) , σ 2 )

(

条件付

)

最尤推定 量を

a (1) k , ˆ a (2) k , σ ˆ k 2 )

と記せば

, 2{T (k) T(k )}

k

t=2

(X t ˆ a (1) k

X t−1 ) 2 + n t=k

+1

(X t ˆ a (2) k

X t−1 ) 2

σ ˆ k 2

k

t=2

( X t ˆ a (1) k X t−1 ) 2 + n t=k+1

( X t ˆ a (2) k X t−1 ) 2

σ ˆ 2 k + n log(ˆ σ k

/ σ ˆ k ) (2)

である

. k k = O(1)

とする

. (ˆ a (1) k

, ˆ a (2) k

, ˆ σ k 2

) = (ˆ a (1) k , ˆ a (2) k , σ ˆ k 2 ) + O P ( n −1 )

であるから

,

k

t=2

( X t ˆ a (1) k X t−1 ) 2 + n t=k+1

( X t ˆ a (2) k X t−1 ) 2

σ ˆ 2 k + n log ˆ σ k

(2)

= k

t=2

( X t ˆ a (1) k

X t−1 ) 2 + n t=k+1

( X t ˆ a (2) k

X t−1 ) 2

σ ˆ 2 k

+ n log ˆ σ k

+ o P (1) (3)

である

.

これより

, (2)

k > k

ならば

k t=k

+1

{ ( X t ˆ a (2) k

X t−1 ) 2 ( X t ˆ a (1) k

X t−1 ) 2 }/ σ ˆ k 2

+ o P (1)

= k t=k

+1

{ ( X t a (2) X t−1 ) 2 ( X t a (1) X t−1 ) 2 }/σ 2 + o P (1) (4)

= k t=k

+1

{2X t−1 (a (1) a (2) ) t (a (1) a (2) ) 2 X t−1 2 }/σ 2 + o P (1) (5)

となる

. (4)

a (1) k

, ˆ a (2) k

, ˆ σ k 2

) = ( a (1) , a (2) , σ 2 ) + o P (1)

であることによる

. k < k

のときも同様 の式が得られるので

,

両側に伸びる負のドリフト付ランダムウォークを

Q k I k<k

k

t=k+1

{ 2 X t−1 ( a (2) a (1) ) t ( a (2) a (1) ) 2 X t−1 2 }/σ 2

+I k>k

k t=k

+1

{ 2 X t−1 ( a (1) a (2) ) t ( a (2) a (1) ) 2 X t−1 2 }/σ 2 (6)

と定義すれば

, k k = O(1)

ならば

2{T (k) T (k )} − Q k = o P (1)

がいえる

. |k k | → ∞

なら ば

Q k → −∞

となることからも想像できるように

, |k k | → ∞

ならば

2 {T ( k ) T ( k ) } → −∞

となる

(

厳密には

,

次節の補題

1

の証明のような展開が必要となる

).

以上より

,

最尤推定量

k ˆ

に関 して

ˆ k k = O P (1)

かつ

ˆ k argmax

k Q k = o P (1) (7)

が成り立つ

.

これより

ˆ k

は一致性をもつといわれる

.

また

,

漸近正規性は満たされないこともわか る

.

さらに

max k 2 {T ( k ) T ( k ) } − max

k Q k = o P (1) (8)

がいえていることもわかる

.

3. 尤度比検定統計量の漸近的性質

この節では変化点数

1

2

の尤度比検定の漸近論を扱う

.

そのために変化点数

2

のモデルを

X t = a (1) X t−1 + t , (2 t k 1 )

= a (2) X t−1 + t , ( k 1 + 1 t k 2 )

= a (3) X t−1 + t , ( k 2 + 1 t n ) (9)

と用意する

.

また

,

変化点を

k 1 , k 2

としたときの

, (

条件付

)

最大対数尤度を

T 2 (k 1 , k 2 ), (a (1) , a (2) , a (3) , σ 2 )

(

条件付

)

最尤推定量を

a (1) k

1

,k

2

, ˆ a (2) k

1

,k

2

, ˆ a (3) k

1

,k

2

, σ ˆ k 2

1

,k

2

)

と記すことにする

.

(3)

まず

,

変化点数

1

のモデルが真であるという仮説のもとでの

, k 1 , k 2

の最尤推定量

ˆ k 1 , ˆ k 2

に関 する補題を与える

.

証明は

(7)

の導出を拡張して考えることによって得られる

(

付録

A

参照

).

補題

1

モデル

(1)

が真であるという仮説のもとでモデル

(9)

を考えると

,

少なくとも

| ˆ k 1 k | = O P (1)

| ˆ k 2 k | = O P (1)

のどちらかが成り立つ

.

この補題の結果を用いて

max k

1

<k

2

T 2 ( k 1 , k 2 ) T ( k )

の漸近分布に関する補題を与える

(

証明 は付録

B

参照

).

補題

2

モデル

(1)

が真であるという仮説のもと

, 2{ max

k

1

<k

2

T 2 (k 1 , k 2 ) T (k )}

max

sup

1/n≤t≤1−1/n

B 1,n ( t ) 2 t (1 t )

, sup

1/n≤t≤1−1/n

B 2,n ( t ) 2 t (1 t )

+ max

k Q k

= o P (1) ,

B j,n (t) dist. = B(t) (j = 1, 2),

なる確率過程の独立な列

{B j,n ( t ) } ( j = 1 , 2)

が存在する

.

この補題

2

(8)

を組み合わせると

,

変化点数

1

2

の尤度比検定統計量

max k

1

<k

2

T 2 ( k 1 , k 2 ) max k T ( k )

について以下の結果を得る

.

定理

1

モデル

(1)

が真であるという仮説のもと

, [2 { max

k

1

<k

2

T 2 ( k 1 , k 2 ) max

k T ( k ) } ] 1/2

max

sup

1/n≤t≤1−1/n

B 1,n (t) 2 t (1 t )

1/2

, sup

1/n≤t≤1−1/n

B 2,n (t) 2 t (1 t )

1/2

= o P (1) ,

B j,n ( t ) dist. = B ( t ) ( j = 1 , 2) ,

なる確率過程の独立な列

{B j,n ( t ) } ( j = 1 , 2)

が存在する

.

(4)

これは自明に変化点数

m

m + 1

の尤度比検定の場合に拡張でき

,

収束のオーダーも精確に議 論すれば以下が得られる

.

命題

1 h j ( n ) 1 /n , l j ( n ) 1 /n ( j = 1 , . . ., m + 1)

がある

0 < 1

に対して

lim sup

n→∞ n{h j ( n ) + l j ( n ) } exp {− (log n ) 1−

} <

を満たすとする

.

変化点数

m

のモデルが真であるという仮説のもと

,

変化点数

m

m + 1

の対 数尤度比を

T m:m+1

と記せば

,

(2 T m:m+1 ) 1/2 max

1≤j≤m+1

sup

h

j

(n)≤t≤1−l

j

(n)

B j ( t ) 2 t(1 t)

1/2

= o P [exp {− (log n ) 1− } ] ,

B j,n ( t ) dist. = B ( t ) ( j = 1 , . . ., m + 1) ,

なる確率過程の独立な列

{B j,n ( t ) } ( j = 1 , . . ., m + 1)

が存在する

.

付録 A. 補題 1 の証明

For k 1 and k 2 , we consider four kinds of restrictions, k −k 1 > k 2 −k > 0, k 2 −k > k −k 1 > 0, k 1 < k 2 < k and k < k 1 < k 2 . For (conditional) maximum likelihood estimators under each restriction, ˆ k 1 and ˆ k 2 , showing | k ˆ 1 k | = O P (1) or | ˆ k 2 k | = O P (1) means providing the proof of this lemma.

First, we consider the restriction k −k 1 > k 2 −k > 0. Let ˆ θ k

1

,k

2

= (ˆ a (1) k

1

,k

2

, a ˆ (2) k

1

,k

2

, ˆ a (3) k

1

,k

2

, σ ˆ k 2

1

,k

2

) T be the (conditional) maximum likelihood estimator of θ = ( a (1) , a (2) , a (3) , σ 2 ) T when change- points are k 1 and k 2 . The difference between the (conditional) maximum log-likelihood where the change-points are k 1 and k and the (conditional) maximum log-likelihood where the change- points are k 1 and k 2 is written as follows:

2 {T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) } = V k

1

,k

( ˆ θ k

1

,k

) V k

1

,k

2

( ˆ θ k

1

,k

2

) , (10) where V k

1

,k

2

( θ ) is

k

1

t=2

(X t a (1) X t−1 ) 2 +

k

2

t=k

1

+1

(X t a (2) X t−1 ) 2 + n t=k

2

+1

(X t a (3) X t−1 ) 2

σ 2 + n log σ. (11)

If k 2 −k = o( k −k 1 ), then ˆ a (2) k

1

,k

2

= ˆ a (2) k

1

,k

+O P { ( k 2 −k ) / ( k −k 1 ) } and (ˆ a (1) k

1

,k

2

, ˆ a (3) k

1

,k

2

, σ ˆ k 2

1

,k

2

) = (ˆ a (1) k

1

,k

, ˆ a (3) k

1

,k

, ˆ σ k 2

1

,k

) + O P { ( k 2 k ) /n} . Then we have

V k

1

,k

2

( ˆ θ k

1

,k

2

) V k

1

,k

2

( ˆ θ k

1

,k

) = θ k

1

,k

θ ˆ k

1

,k

2

) T 1 2

2 V k

1

,k

2

∂θ 2 ( θ ) ( ˆ θ k

1

,k

θ ˆ k

1

,k

2

) (12)

= O P { ( k 2 k ) 2 / ( k k 1 ) }, (13)

(5)

where θ is some value between ˆ θ k

1

,k

and ˆ θ k

1

,k

2

. Therefore, 2 {T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) }

=

k

2

t=k

+1

{ ( X t ˆ a (3) k

1

,k

X t−1 ) 2 ( X t ˆ a (2) k

1

,k

X t−1 ) 2 }/ σ ˆ 2 k

1

,k

+ O P { ( k 2 k ) 2 / ( k k 1 ) } (14)

=

k

2

t=k

+1

{ ( X t a (2) X t−1 ) 2 ( X t a (1) X t−1 ) 2 }/σ 2 + o P ( k 2 k ) . (15)

If k 2 k = o( k k 1 ) and k 2 k = o( n ), then ˆ a (2) k

1

,k

2

and ˆ σ k 2

1

,k

2

converge to some values not equal to a (1) nor a (2) , and σ 2 , respectively. Let a (1,2) k

1

,k

2

and σ 2 k

1

,k

2

be the values, then we can write

a (2) k

1

,k

2

, ˆ σ k 2

1

,k

2

) = (a (1,2) k

1

,k

2

, σ k 2

1

,k

2

) + O P {(k 2 k ) −1/2+ } (16) for arbitrary > 0. On the other hand, ˆ a (1) k

1

,k

2

= a (1) + O P (k 1 −1/2+ ) and ˆ a (3) k

1

,k

2

= a (3) + O P {(n k 2 ) −1/2+ } . Then we have

2 {T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) }

= V k

1

,k

(a (1) , a (1) , a (2) , σ 2 ) V k

1

,k

2

(a (1) , ˆ a (2) k

1

,k

2

, a (2) , σ ˆ k 2

1

,k

2

) + O P {(k 2 k ) 1/2+ }, (17) similarly as (14). By using (16), this becomes

k

1

t=2

{ log( σ/σ k

1

,k

2

) + ( X t a (1) X t−1 ) 2 (1 1 k

1

,k

2

) }

+

k

t=k

1

+1

{log(σ/σ k

1

,k

2

) + (X t a (1) X t−1 ) 2 2 (X t a (1,2) k

1

,k

2

X t−1 ) 2 k 2

1

,k

2

}

+

k

2

t=k

+1

{log(σ/σ k

1

,k

2

) + (X t a (2) X t−1 ) 2 2 (X t a (1,2) k

1

,k

2

X t−1 ) 2 k 2

1

,k

2

}

+ n t=k

2

+1

{ log( σ/σ k

1

,k

2

) + ( X t a (2) X t−1 ) 2 (1 1 k

1

,k

2

) } + O P { ( k 2 k ) 1/2+ }. (18)

If k 2 k = o( k k 1 ), k 2 k = o( n ) and k 2 k = O(1), then ˆ a (2) k

1

,k

2

converges to some value not equal to a (1) nor a (2) . Let a (1,2) k

1

,k

2

be the value, then we can write

ˆ a (2) k

1

,k

2

= a (1,2) k

1

,k

2

+ O P {(k 2 k ) −1/2+ } (19) for arbitrary > 0. On the other hand, (ˆ a (1) k

1

,k

2

, ˆ a (3) k

1

,k

2

, σ ˆ k 2

1

,k

2

) = (ˆ a (1) k

1

,k

, ˆ a (3) k

1

,k

, ˆ σ 2 k

1

,k

) + O P {(k 2 k )/n}. Then we have

2 {T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) } =

k

t=k

1

+1

( X t ˆ a (2) k

1

,k

X t−1 ) 2 +

k

2

t=k

+1

( X t a ˆ (3) k

1

,k

X t−1 ) 2

k

2

t=k

1

+1

( X t ˆ a (2) k

1

,k

2

X t−1 ) 2

σ ˆ 2 k

1

,k

+ O P { ( k 2 k ) 1/2+ }, (20)

(6)

similarly as (14). By using (19), this becomes

k

t=k

1

+1

{ ( X t a (1) X t−1 ) 2 ( X t a (2) k

1

,k

2

X t−1 ) 2 }/σ 2

+

k

2

t=k

+1

{ ( X t a (2) X t−1 ) 2 ( X t a (2) k

1

,k

2

X t−1 ) 2 }/σ 2 + O P { ( k 2 k ) 1/2+ }. (21)

From (15), (18) and (21), if k 2 −k → ∞ as n → ∞ , we obtain T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) < 0 with probability 1, so that (conditional) maximum likelihood estimator ˆ k 2 satisfies ˆ k 2 k = O P (1).

Similarly for the restriction k 2 k > k k 1 > 0, k 1 < k 2 < k and k < k 1 < k 2 , we can show | ˆ k 1 k | = O P (1), | k ˆ 2 k | = O P (1) and | ˆ k 1 k | = O P (1), respectively.

付録 B. 補題 2 の証明

For k 1 and k 2 , we consider the restrictions O(1) = k k 1 > k 2 k > 0, O(1) = k k 1 >

k 2 k > 0, k 1 < k 2 < k and k 2 k 1 = O(1), k 1 < k 2 < k and k 2 k 1 = O(1), and

|k 2 k | > |k 1 k | . The maximum of the (conditional) log-likelihood ratio statistics under these restrictions is the log-likelihood ratio statistic under no restriction.

First, we consider the restriction O(1) = k k 1 > k 2 k > 0. From Lemma 1, we have only to consider the case k 2 k = O(1). Then by (10) and (15),

2 {T 2 ( k 1 , k 2 ) T 2 ( k 1 , k ) }

=

k

2

t=k

+1

{ ( X t a (2) X t−1 ) 2 ( X t a (1) X t−1 ) 2 }/σ 2 + O P { ( k k 1 ) −1/2+ } (22) for arbitrary > 0, and then

2{T 2 (k 1 , k 2 ) T (k )}

=

k

1

t=2

( X t ˆ a (1) k

1

,k

X t−1 ) 2 / σ ˆ k 2

1

,k

+

k

t=k

1

+1

( X t a ˆ (2) k

1

,k

X t−1 ) 2 / σ ˆ 2 k

1

,k

+ n t=k

+1

( X t ˆ a (3) k

1

,k

X t−1 ) 2 / ˆ σ k 2

1

,k

k

t=2

( X t ˆ a (1) k

X t−1 ) 2 / σ ˆ k 2

n

t=k

+1

(X t ˆ a (2) k

X t−1 ) 2 σ k 2

+ n log(ˆ σ k

1

,k

σ k

) + Q k

2

+ O P {(k k 1 ) −1/2+ } (23)

=

k

1

t=2

( X t ˆ a (1) k

1

,k

X t−1 ) 2 2 +

k

t=k

1

+1

( X t ˆ a (2) k

1

,k

X t−1 ) 2 2 k

t=2

( X t a ˆ (1) k

X t−1 ) 2 2

+ Q k

2

+ O P { ( k k 1 ) −1/2+ }. (24)

If O P (1) = k k 1 > k 2 −k > 0, the convergence of T 2 ( k 1 , k 2 ) T ( k ) is different, and we can

show easily that it is O P (1) and then smaller than (24). Therefore we do not need to consider

this case.

(7)

Next we consider the restriction k 1 < k 2 < k . If k 2 k 1 = O P (1), we can show (24) similarly, and if k 2 k 1 = O P (1), T 2 ( k 1 , k 2 ) T ( k ) is O P (1).

From the above, and by considering the order O P { ( k k 1 ) −1/2+ } , we can define a sequence of Brownian bridge {B 1,n ( t ) } such that

2 { max

k

1

<k

2

T 2 ( k 1 , k 2 ) T ( k ) } − sup

1/n≤t≤1−1/n

B 1,n ( t ) 2 t (1 t )

+ max

k Q k = o P (1) (25)

under the restriction |k 2 k | < |k 1 k | (See Cs¨ org˝ o & Horv´ ath [1] Theorem 1.3.2 and Davis et al. [2]).

Similarly we can treat the restriction |k 2 k | > |k 1 k | . We can show that 2 {T 2 ( k 1 , k 2 ) T ( k ) } becomes

k

2

t=k

+1

( X t a ˆ (2) k

,k

2

X t−1 ) 2 2 + n t=k

2

+1

( X t a ˆ (3) k

,k

2

X t−1 ) 2 2 n

t=k

+1

( X t a ˆ (2) k

X t−1 ) 2 2

+ Q k

1

+ O P { ( k 2 k ) −1/2+ }, (26)

and therefore we can define a sequence of Brownian bridges {B 2,n ( t ) } such that 2 { max

k

1

<k

2

T 2 ( k 1 , k 2 ) T ( k ) } − sup

1/n≤t≤1−1/n

B 2,n (t) 2 t (1 t )

+ max

k Q k = o P (1) . (27) We can see that B 1,n ( t ) and B 2,n ( t ) are independent because of their definitions, and then by (25) and (27) we can complete the proof.

参考文献

[1] M. Cs¨ org˝ o and L. Horv´ ath. Limit Theorems in Change-Point Analysis. John Wiley & Sons, 1996.

[2] R. A. Davis, D. Huang, and Y. C. Yao. Testing for a change in the parameter values and order of an autoregressive model. Ann. Statist., 23:282–304, 1995.

[3] Y. Ninomiya. Asymptotic distributions of likelihood ratio criteria for detecting multiple change-points. Research Memorandum No.797, The Institute of Statistical Mathematics, 2001.

[4] Y. Ninomiya. Information criteria for change-point models. Research Memorandum No.870,

The Institute of Statistical Mathematics, 2003.

参照

関連したドキュメント

Donati G, Lunardini A, Kappeler PM, Borgognini Tarli SM 2001: Nocturnal activity in the cathemeral red-fronted lemur (Eulemur fulvus rufus), with observations during

Kuniya, Global stability of a multi-group SVIR epidemic model, Nonlinear Anal. Enatsu, Threshold dynamics of an SIR epidemic model with

統計数理研究所 東京大学地震研究所 The Institute of Statistical Mathematics Earthquake Research Institute, University

Kako: Solving multivariate algebraic equation by Hensel construction.

Xu, “Implementation of Interior-Point Methods for Large Scale Linear Programs,” Interior Point Methods of Mathematical Programming, ed.. Nemirovski, “Lectures on

Meiji Institute for Advanced Study of Mathematical Sciences, Meiji University.. 明治大学理工学部数学科 / 先端数理科学インスティテュート

1 はじめに 近年 , 反応拡散系にみられるパルスや縞模様の分裂パターン (自己複製パターン) が注目さ れており , CIMA 反応による自己複製パターンの発見

マ ルチェージェントシステムは, 社会現象などの複雑な振る舞いを分析するために, 対象と