!!!!!!!!!! !!!!!!! !!!
“The more I learn, the more I realize I don’t know. The more I
realize I don’t know, the more I want to learn.”―Albert Einstein Abstract 本稿では,長記憶性をもつ時系列に対し,推定に関して最近 の研究を概観する。特に,長記憶性をもつ時系列で典型的な ARFIMAモデルについて,パラメトリックな推定法について 述べる。これらの推定法に対してシミュレーションでパフォー マンスを比較し,日本のファイナンス時系列データに応用する。 1 Introduction 長記憶性をもつ時系列に関しては多くの研究が行われている。長記憶 性を持つ時系列について概観したものには,Beran(1994),Robinson (2003),Doukhan et. al.(2003),Teyssiere and Kirman(2007),Palma (2007)がある。邦文文献としては,矢島(2003)がある。
長記憶性については金融時系列を含む多くの分野で応用されている。 特に,金融時系列における実証的な結果としては,Ding et. al.(1993) によって指摘された通り,金融時系列のリターンそのままでは自己相関 を計算すると相関がないように見えるのに対し,リターンの絶対値およ び2乗の値の自己相関では,ラグを長くとるにつれての減少度合いが非
論 説
長記憶性をもつ時系列について
―ARFIMAモデルに対するパラメトリック推定西 埜 晴 久
(347) 139常にゆっくりとしている。このことは,リターンの絶対値および2乗の 値が長記憶性を持つことを示しているといえる。 他方,長記憶性はHosking(1981)が示しているように,Fractional Difference(実数差分)と関連がある。Fractional Differenceを使って 表現される長記憶性をもつ典型的な時系列モデルとしては,ARFIMA (p,d,q)モデルがある。ARFIMA(p,d,q)モデルはBox=Jenkins 法で用いられるARIMA(p,d,q)の階差パラメータd を整数値以外に も拡張したものである。本稿では,ARFIMA(p,d,q)モデルのパラ メトリックな推定法について解説することを目的とする。さらには,シ ミュレーションによって各推定法のパフォーマンスの比較を行う。 そして,取り上げた推定法を日本のファイナンス・データに実際に応 用する。本稿では,日経株価平均のrealized volatility(実現ボラティリ ティ)に対してARFIMAモデルを推定することを考える。Ding et. al. (1993)によれば,リターンそのものは無相関であるけれども,リター ンの2乗値および絶対値は非常にゆるやかな自己相関があることを示し ていた。このことは,リターンの分散を表している実現ボラティリティ にも長記憶性があることを示している。特に,渡部(2007)では実現ボ ラティリティおよびその対数値に長記憶性があることを示していた。本 稿では,ARFIMAモデルの推定法を実現ボラティリティの対数値に対 して応用することを考える。 本稿は以下の内容で構成される。次の節では長記憶性とARFIMAモ デルについて説明する。3節では推定法について展望する。4節では推 定法に対しシミュレーションを行い,次に日経平均株価指数の実現ボラ ティリティのデータにそれらの推定法を応用する。 2 長記憶性とARFIMAモデル 定常時系列{yt,t=1,2,...,}は自己共分散関数をフーリエ変換 140 (348)
することにより以下のスペクトル密度関数を持つ。 f(λ)= 12π Σ∞ s=−∞e isλγ(s). ¸ ただし,γ(s)=Cov(yt,yt−s)は自己共分散関数である。 長記憶性は以下のようにスペクトル密度関数によって定義される。 f(λ)∼Cλ−2d,λ→+0 (0<d <1 2). ¹ このことはスペクトル密度は原点の近くで発散していることを示してい る。このことは同時に 2πf(0)= Σ∞ s=−∞γ(s)=∞, º を示しており,自己共分散の和が発散していることを示している。長記 憶性の定義として自己共分散の和が発散しているものを採ることもある。 スペクトル密度関数にせよ,自己共分散にせよ,定常過程においてのみ 定義できるものであるので,長記憶性は厳密には定常過程において定義 される概念であることに注意されたい。 次に,Fractional DifferenceをHosking(1981)に従って説明しよう。 まず, (1−L)dy t=εt,−1/2<d<1/2, » と書く。ただし,Lはラグ・オペレータであり,Lyt=yt−1となる。また, {εt}∼WN (0,σ2)は平均0分散σ2のホワイトノイズ過程である。し たがってMA表現を行えば, yt=(1−L)−dεt, ¼ である。さらに二項展開より (1−L)−d=Σ∞ j=0 Γ(j+d ) Γ(j+1)Γ(d )Lj. ½ (349) 141
である。ただし,Γ(x)=
∫
∞0zx−1e−zdzはガンマ関数である。 したがって,{yt}のMA表現は以下のようになる: yt= ∞ Σ j=0 Γ(j+d ) Γ(j+1)Γ(d )εt−j. ¾ Fractional Differenceを用いることによって,以下のARFIMA(p,d, q)(autoregressive fractionally integrated moving average)モデルを 考えることができる。 φ(L)(1−L)dyt=θ(L)εt,t=1,2,.... ¿ ただし,{εt}はホワイトノイズプロセスWN (0,σ2)であり,φ(z)= 0とθ(z)=0の全ての根は単位円外にあるものとする。 なお,0<d <12の時,{yt}は定常な長記憶過程であり,他方d >―1 2 の時,{yt}は非定常な実数和分過程である。 ARFIMA(p,d,q)モデルは以下のスペクトル密度を持つ。 f(λ)= σ2π|1−2 eiλ|−2d|θ(eiλ)|2|φ(eiλ)|2. À
ここで
|1−eiλ|−2d=|2sin(λ/2)|−2d∼λ−2d,λ→+0,
(0<d <12), Á であることに注意すれば,ARFIMA(p,d,q)モデルが長記憶性を持 つことが分かる。なぜなら, f(λ)∼ σ2π2 |θ|φ(1)(1)||22λ−2d,λ→+0. Â となり,原点でのスペクトルが発散するからである。 例として,単純なARFIMA(1,d,1)モデルを考えてみよう。 142 (350)
(1−φL)(1−L)dy
t=(1−θL)εt, Ã
このときのARFIMA(1,d,1)モデルのスペクトル密度関数が原点 で発散することは以下のようにして確かめられる。
f(λ)= σ2π|22 sin(λ2)|−2d|1−θeiλ|2
|1−φeiλ|2 Ä ∼ σ2π2 |1−θ||1−φ|22λ−2d,asλ→+0. Å なお,スペクトル密度を推定するための統計量としてピリオドグラム が良く知られている。ピリオドグラムは以下のように定義される。 I(λ)= 1T 2πT
|
T Σ j=1yje ijλ|
2. Æ スペクトル密度を推定するピリオドグラムを使ったカーネル推定法とし て f ^(λj)= h Σ m=−h[
h+1−|m|2 (h+1)2]
I(λT j+m), Ç がある。ただし,周波数はλj=2πj/T,(j=1,2,...,T )ととるも のとする。 3 推定法 本節ではARFIMA(p,d,q)モデルの推定法について説明する。は じめに,正規分布を仮定した時間領域の最尤法をSowell(1992)にした がい説明する。しかしながら,本推定法は計算にあたり難点がある。つ まり,標本サイズが大きくなるにつれて,自己共分散行列の逆行列を計 算することに多くの時間がかかってしまうのである。 こうした難点を回避するために時間領域の尤度を近似する方法がいく つか提案されている。良く使われているものとして偏自己相関を用いて, 一定の長さをとったあとは近似式を使うHaslett and Raftery(1989)がある。この方法は統計ソフトRのパッケージにも使われているものであ る。その他に有力な方法として,AR近似を使ったBeran(1995)によ る推定法がある。
さらには,周波数領域の観点からはWhittle推定を使うことができる。 Whittle推定量に関しては,すでにFox and Taqqu(1986),Dahlhaus (1989)により長記憶性をもつ時系列においても,漸近正規性など漸近 的に良い性質を持つことが確かめられている。つまり,時間領域の厳密 な最尤推定量とWhittle推定量が漸近的には同等であることが分かって いる。
他には,d だけを推定するセミパラメトリックな方法が広く用いられ ている。例えば,Geweke et. al.(1983)によるGPH推定法およびRobin-son(1995)によるlocal Whittle推定法が代表的なものである。しかし, 本稿ではセミパラメトリックな推定法については扱わない。
3.1 時間領域における最尤推定
ここでは,Sowell(1992)による厳密な最尤推定について述べる。ま
ず,y=(y1,y2,...,yT)′が正規分布であると仮定する。すると,(y1,
y2,...,yT)の同時密度は,
f(y1,y2,...,yT|d,φ,θ,σ2)=
(2π)−T/2|σ2Σ|−1/2exp
{
− 12σ2y′Σ−1y
}
, Èとなる。よって,対数尤度は
logL(d,φ,θ,σ2)=−T
2log2π−12log|σ2Σ|− 12σ2y′Σ−1y, É
となる。ただし,自己共分散行列は
σ2Σi,j=γ(|i−j|) Ê
σ2Σ= ! % % % % % % % % % % % # γ(0) γ(1) … γ(T −1) γ(1) γ(0) … … … … … … γ(T −1) …… γ(0) " % % % % % % % % % % % $ となっている。 Sowell(1992)は¿式のARFIMA(p,d,q)モデルの自己共分散γ(s) を以下のように示している。 γ(s)=σ2Σq l =−q p Σ j=1ψ(l )ζjC(d,p+l −s,ρj). Ë なお,ψ(l ),ρj,ζj,C(d,h,ρ)は以下のように定義されている。 ψ(l )=min[q,q−l ]Σ s=max[0,l ]θsθs−l, Ì φ(x)=Πp j=1(1−ρjx), Í ζj=
[
ρj p Π i=1(1−ρiρj)Πm≠j(ρj−ρm)]
−1 , Î C(d,h,ρ)=Γ(1−d +h)Γ(1−2d )Γ(1−d )ΓΓ(d +h)(d ) ×[ρ2p 2F(d +h,1;1−d +h;ρ)1 −2F1(d −h,1;1−d −h;ρ)−1]. Ï ただし,2F(a,b;c;x)は超幾何関数であり,以下の式で定義される。1 2F(a,b;c;x)=1 ∞ Σ n=0 (a)(b)n n (c)n xn n! =1+1!cab x+a(a+1)b(b+1)2!c(c+1) x2 +a(a+1)3!c(c+1)(a+2)b(b+1)(c+2)(b+2)x3+…. Ð (353) 145なお,( )nはPochhammerの記号と呼ばれ,(a)n=a(a+1)…(a+n−
1)と定義される。また,超幾何関数の性質についてはAbramowitz and Stegun(1965)あるいはGradshteyn and Ryzhik(2000)を参照の こと。
本推定法の難点は,Σの逆行列を計算するためにはCholesky分解を用 いることになるので計算量が非常に多くなり,標本サイズが大きくなる と計算に時間がかかることである。
3.2 Haslett-Raftery法
Haslett-Raftery法は,Haslett and Raftery(1989)によって提案され たものである。本推定法では,偏自己相関を使い全ての過去の値から一 期先予測値を計算する。ただし,計算量が増えることを防ぐため,用い る過去の値は一定の長さに制限する。実用上はM=100程度で良いよう である。 まず,以下の簡単なARFIMA(0,d,0)モデルを例としてHaslett-Raftery法を説明しよう。次のARFIMA(0,d,0)モデル: (1−L)dy t=εt,t=1,2,...,T, Ñ を考える。ただし,εtはN(0,σ2ε)の正規変数とする。このARFIMA (0,d,0)にしたがうytに対し,一期先予測を考えると y ^t= t−1 Σ j=1φt,jyt−j, Ò となる。この時の予測誤差分散は, vt=Var(yt−y^t)=σ2y t−1 Π j=1(1−φ 2j,j), Ó となる。ただし, σ2y=Var(yt)=Γ(1−2d ) Γ(1−d )2σ2ε. Ô 146 (354)
である。そこで,標準化された予測誤差分散rtは, rt= vt σ2 ε=Γ (1−2d ) Γ(1−d )2 t−1 Π j=1(1−φ 2j,j), Õ r1=Γ(1−2d )Γ(1−d )2, Ö rt=(1−φ2t−1,t−1)rt−1. × となる。 近似的な対数尤度は以下の通りである。 L=−2Tlog2π−2Tlogσ^2 ε−1 2 T Σ t=1logrt− T 2. Ø ただし, σ ^2 ε=1T T Σ t=1 (yt−y^t)2 rt . Ù となる。 あるいは以下のl を最大化すれば良い。 l =−12log
(
1T ΣT t=1 (yt−y^t)2 rt)
. Ú 次に,Òで用いる最良線形予測の係数{φt,j}を説明する。{φt,j}は偏 自己相関でもあり, φt,j=−tCjΓ(j−d )Γ(t−d −j+1) Γ(−d )Γ(t−d +1) =−Πj k=1(
(t−k+1)(k−d −1) k(t−d −k+1))
,j=1,2,...,t. Û と求められる。{φt,j;t=1,...,T ,j=1,...,M }を具体的に求 めるには,以下の再帰式を使って計算することになる。 φt,1=t−d,td Ü (355) 147φt,j=φt,j−1
{
(t−j+1)(j−1−d ) j(t−d −j+1)}
,j=2,...t. Ý また, φj,j= d j−d, φt,t= d t−d, Þ である。 Òの最後の項は以下のように近似する。 t−1 Σ j=1φtjyt−j∼∼ M Σ j=1φtjyt−j− t−1 Σ j=M +1πjyt−j ß ∼ ∼ΣM j=1φtjyt−j− MπM d[
1−(
M t)
d]
y―M+1,t−1−M, à ただし。y―M +1,t−1−M=t−1−2MΣ1 t−1−Mj=M+1yjとおいており,打ち切り数 はM=100が望ましいとされている。 ßの近似式で用いられる係数πjは,二項展開 (1−L)d=Σ∞ k=0πjL j á で得られるものである。そして,πjは以下の近似式を用いて計算する。 πj= Γ(j−d ) Γ(j+1)Γ(−d )∼∼ j−d−1 Γ(−d ) as j→∞, â πM= Γ(M −d ) Γ(M +1)Γ(−d )∼∼ M−d−1 Γ(−d ) M is large. ã さらに,àの近似式は以下のように求められる。 t−1 Σ j=M +1πj∼∼ t−1 Σ j=M +1 j−d−1 Γ(−d )∼∼Γ(−d )1∫
t M u −d−1du =Γ(−d )1(−d )[t−d−M−d] 148 (356)=Γ(−d )M−d(d )
[
1−(
Mt)
d]
∼ ∼MπdM[
1−(
Mt)
d]
. ä 次に,ARFIMA(1,d,1)の場合のHaslett-Raftery法を説明しよ う。 ARFIMA(1,d,1): (1−φL)(1−L)dy t=(1−θL)εt,t=1,2,...,T. å ただし,εtはN (0,σ2εの正規変数である。ytの一期先予測は以下のよ うに計算され,そして近似される。 y ^t=(1−θL)−1(1−φL) t−1 Σ k=1φtkyt−k ∼ ∼(1−θL)−1(1−φL){
ΣM k=1φtkyt−k− MπM d[
1−(
M t)
d]
y―M+1,t−1−M}
=(1−θL)−1min(M,t−2)Σ k=1 φ(ytk t−k−φyt−1−k) −(
1−φ1−θ)
MπdM[
1−(
Mt)
d]
y―M+1,t−1−M =min(M,t−1)Σ j=1 φtj min(M,t−j−2) Σ k=0 θ k {yt−j−k−φyt−j−k−1} −(
1−φ1−θ)
MπdM[
1−(
Mt)
d]
y―M+1,t−1−M. æ そして予測誤差分散は vt=Var(yt−y^t)=σ2yκ t−1 Π j=1(1−φjj) 2, ç となる。ただし, σ2y=Var(yt)=Γ(1−2d ) Γ(1−d )2σ2ε, è (357) 149κ=1+θ1−φ2−2φθ.2 é である。なおκはARMA(1,1)モデルのイノベーションの分散と ARMA(1,1)自体の分散との比である。 よって標準化された予測誤差分散rtは以下のようになる。 rt=vt σ2 ε=κΓ (1−2d ) Γ(1−d )2 t−1 Π j=1(1−φjj) 2, ê r1=
(
1−φ 2 1+θ2−2φθ)
Γ(1−2d )Γ(1−d )2 , ë rt=(1−φ2t−1,t−1)rt−1. ì したがって, σ ^2 ε=1T T Σ t=1 (yt−y^t)2 rt . í を最小化することで,d,φ,θを推定できる。あるいは, l =−logσ^2 ε. î を最大化して推定する。 最後に一般のARFIMA(p,d,q)の場合のHaslett-Raftery法を説明 しよう。 ARFIMA(p,d,q)モデル: φ(L)(1−L)dy t=θ(L)εt,t=1,2,...,T. ï を考えると,ytの一期先予測は次のように計算される。 y ^t=θ(L)−1φ(L) t−1 Σ k=1φtkyt−k. ð よって,これをM で打ち切って近似してy^tを求めてやればよい。そして 予測誤差分散は vt=Var(yt−y^t)=σ2yκ t−1 Π j=1(1−φjj) 2, ñ 150 (358)となる。ただし, σ2y=Var(yt)=Γ(1−2d ) Γ(1−d )2σ2ε, ò であり,κはARMA(p,q)モデルのイノベーションの分散とARMA (p,q)自体の分散との比である。よって標準化された予測誤差分散rt は以下のようになる。 rt= vt σ2 ε=κΓ (1−2d ) Γ(1−d )2 t−1 Π j=1(1−φjj) ó したがって,ytの一期先予測y^tおよび予測誤差分散rtを使って, σ ^2 ε=1T T Σ t=1 (yt−y^t)2 rt . ô が計算される。このσ^2 εを最小化することでパラメータを推定できる。 あるいは, l =−logσ^2 ε. õ を最大化して推定する。 3.3 BeranのAR近似法 Beran(1995)はARFIMAモデルをAR近似することで推定する方法 を提案した。まずは,ARFIMA(0,d,0)を例として推定法を説明 する。 次のARFIMA(0,d,0)モデル: (1−L)dy t=εt,t=1,2,...,T. ö を考える。ただし,εtはN (0,σ2ε)の正規変数である。 ここで二項展開より (1−L)d=Σ∞ k=0πkL k ÷ であり,その係数は (359) 151
πk= (k−d −)! k!(−d −1)!=Γ(k+1)ΓΓ(k−d )(−d ) =Πk j=1 j−1−d j . ø と求められる。よって, π0=1 ù π1=−d ú π2=(1−d )2(−d ) û πk−1= k−1 Π j=1 j−1−d j ü πk=
(
k−1−dk)
πk−1. @ とすることで再帰的に計算することができる。 したがって,öは εt= ∞ Σ k=0πkyt−k,t=1,2,...,T, A (ただしπ0=1)と計算することができる。 この時の残差は et= t−1 Σ k=0πkyt−k=yt+ t−1 Σ k=1πkyt−k,t=1,2,...,T. B と計算することができる。すなわち, e1=y1 C e2=y2+π1y1 D e3=y3+π1y2++π2y1 E et=yt+ t−1 Σ k=1πkyt−k F 152 (360)eT=yT+ T −1 Σ k=1πkyT−k. G と計算される。もし,期待値E(yt)が未知ならば, et=yt−y―+ t−1 Σ k=1π(yk t−k−y―),t=1,2,...,T. H と平均を引いて計算すればよい。 残差{et}によって近似対数尤度が計算できる。したがって Lberan=−T 2log2π− T 2logσ2ε−12 T Σ t=2
{
et σε}
2 I を最大化すれば良い。 もし,以下のARFIMA(1,d,0): (1−φL)(1−L)dy t=εt,t=1,2,...,T. J を推定するならば, (1−φL)(1−L)d=(1−φL)Σ∞ k=0πkL k =Σ∞ k=0πkL k−Σ∞ k=0φπkL k+1 =1+Σ∞ k=0(πk−φπk−1)L k K の式を用いれば良い。つまり,π∼ k=πk−φπk−1とおけば, π∼ k=(k−d −1)! k!(−d −1)!−φ(k−1)!(−d −1)!(k−d −2)! =(
k−d −1k −φ)
(k−1)!(−d −1)!(k−d −2)! =(
1−d +1k −φ)
ΓΓ(k−d −1)(k)Γ(−d ) (361) 153=
(
1−d +1k −φ)
k−1Π j=1 j−1−d j , L となるので,残差を et=yt+ t−1 Σ k=1π ∼ kyt−k,t=1,2,...,T. M と計算する。後は,Iによって計算すれば良い。 次に,ARFIMA(0,d,1): (1−L)dy t=(1−θL)εt,t=1,2,...,T, N の場合を説明する。 (1−θL)−1(1−L)d=(
Σ∞ j=0θ jLj)(
Σ∞ k=0πkL k)
=Σ∞ k=0{
k Σ j=0πjθ k−j}
Lk =1+Σ∞ k=1{
k Σ j=0πjθ k−j}
Lk O であるから,π∼k=Σkj=0πk−jとおくことで,残差{et}が et=yt+ t−1 Σ k=1π ∼ kyt−k,t=1,2,...,T. P と計算できる。後は,Iを使えば良い。 そして,ARFIMA(1,d,1): (1−φL)(1−L)dy t=(1−θL)εt,t=1,2,...,T Q の場合には, (1−θL)−1(1−φL)(1−L)d =(
Σ∞ j=0θ jLj)
(1−φL)(
Σ∞ k=0π0L k)
=(
Σ∞ j=0θ jLj)[
∞ Σ k=0πkL k−φΣ∞ k=0πkL k+1]
154 (362)=Σ∞ k=0
{
k Σ j=0πjθ k−j}
Lk−φΣ∞ k=0{
k Σ j=0πjθ k−j}
Lk+1 =1+Σ∞ k=1{
k Σ j=0πjθ k−j−φk−1Σ j=0πjθ k−1−j}
Lk. R を使って計算する。つまり, π∼k= k Σ j=0πjθ k−j−φk−1Σ j=0πjθ k−1−j S とおくことで,残差{et} et=yt+ t−1 Σ k=1π ∼ kyt−k,t=1,2,...,T. T を計算して,Iを使えば良い。 最後に一般のARFIMA(p,d,q)の場合を説明しよう。ARFIMA (p,d,q)モデル: φ(L)(1−L)dy t=θ(L)εt,t=1,2,...,T. U を考える。この場合も, θ(L)−1φ(L)(1−L)d=Σ∞ j=0π ∼ jLj V の展開式を使って,残差{et} et=yt+ t−1 Σ k=1π ∼ kyt−k,t=1,2,...,T. W を求める。そして, Lberan=−T 2log2π− T 2logσ2ε−12 T Σ t=2{
et σε}
2 X を最大化すれば良い。 3.4 Whittle推定(周波数領域) Whittle推定は時間領域の尤度を周波数領域で表現することで求めら (363) 155れる。詳しくはBrockwell and Davis(1991)あるいは谷口(2003)を 参考にしていただきたい。 まず,ARFIMA(p,d,q)のパラメータをτ=(φ,θ,d,σ2)′とし, 周波数をλj=2πT ,j j=1,...,T −1ととる。そして,I(λT j)をピリオ ドグラムとすると,Whittle推定量τ∼Wは, LW(τ)= 1 2T T −1 Σ j=1
{
logf(λτ j)+ I(λT j) fτ(λj)}
, Y を最小化することで得られる。 Dahlhaus(1989)は長記憶性を持つ時系列の場合にも一致性と漸近 正規性を示している。そして,Whittle推定は以下の式より時間領域の 最尤推定の近似になっていることが分かる。 −TLW(τ)=−1 2 T −1 Σ j=1logfτ(λj)−12 T −1 Σ j=1 I(λT j) fτ(λj) Z ∼ ∼const−12log|σ2Σ|− 1 2σ2y′Σ−1y. [Chueng and Diebold(1994)は3.2節で述べた時間領域の最尤法と Whittle推定のパフォーマンスをシミュレーションによって比較してい る。そこでは,標本サイズがある程度大きい場合にWhittle推定は時間 領域の最尤法と同程度のパフォーマンスであるとしている。また平均が 未知の場合には,平均を推定する必要のないWhittle推定が有用であろ うとしている。 最後にARFIMA(p,d,q)をWhittle法で推定する際のreparametri-zationについて述べておこう。ARFIMA(p,d,q)のスペクトル密度 は
f(λ)= σ2π|1−2 eiλ|−2d|θ(eiλ)|2
|φ(eiλ)|2. \
であるから,θ(z)とφ(z)を θ(z)=Πq j=1(1−θjz)and φ(z)= p Π i=1(1−φiz), ] と分解できる形に表現してやると,|φi|<1および|θj|<1が定常性 および反転可能性を示すので扱いやすくなる。そこで |θ(eiλ)|2=Πq j=1|1−θje
iλ)|2and|φ(eiλ)|2=Πp
i=1|1−φie iλ|2 ^ を使ってスペクトル密度を計算してやればよいことになる。 4 シミュレーションとファイナンス・データへの応用 本節では前節でとりあげた推定法について,まずシミュレーションで そのパフォーマンスを確認する。次にファイナンス・データである日経 平均株価指数のrealized volatilityに対して,実際に応用する。 4.1 シミュレーション 本 節 で は 前 節 で 取 り 上 げ た4つ の 推 定 法:exact MLE,Haslett-Raftery法,BeranのAR近似法,Whittle推定について,モンテカルロ実 験によってそのパフォーマンスを比較する。本実験では,ARFIMA(0, d,0)モデルにしたがう時系列データを発生させる。d の値はd =0.2 およびd =0.4とする。d =0.4の方が長記憶性の程度が強いといえよう。 また,標本サイズはT =200,T =500,T =1,000の三つを用いた。複数 の標本サイズを比較することで,標本が大きくなるときの漸近的な特性 を見ることができるだろう。また,実際の値としては,推定値のバイア スおよび平均2乗誤差の平方根(Root Mean square error,RMSE)を 計算した。バイアスおよびRMSEが小さいものが良い推定量となる。
Table1にモンテカルロ実験の結果がまとめてある。左の列からexact ML,Haslett-Raftery法,Beran(1995)のAR近似法,Whittle推定法の
4つである。なお,Haslett-Raftery法ではM =100で打ち切って計算し, Beran(1995)のAR近似法ではm=50で打ち切って計算している。上段 にはバイアスが下段にはRMSEが記されている. まず,exact MLはT =200では最適化に失敗してしまうことがあった。 さらに,T =1,000の時のexact MLは非常に計算時間がかかってしまう。 exact MLは自己共分散行列の逆行列を得ることに時間がかかるのが難 点であるためであろう。しかしながら,RMSEで判断すると,exact MLが一番良い。その次はHaslett-Raftery法が全体的には良いであろう。 しかし,d =0.4と非定常な領域に近づく時およびT =1,000のように標 本サイズが大きいときには,Whittle推定法のRMSEが小さく,良いパ
Table 1 Estimates ofd of ARFIMA(0,d,0)
Exact H-R AR approx Whittle T =200 d =0.2 −0.0074061 −0.0024696 −0.0036699 −0.0043498 0.055132 0.057723 0.058243 0.061787 d =0.4 −0.011457 0.013775 0.015123 −0.00089269 0.049199 0.059637 0.060488 0.060050 T =500 d =0.2 −0.0027069 −0.00024102 0.00063016 −0.0017889 0.035295 0.035878 0.036561 0.037737 d =0.4 −0.0035158 0.0090175 0.019303 0.0011663 0.032797 0.038515 0.046085 0.037966 T =1,000 d =0.2 −0.0018733 −0.00041742 0.0014493 −0.0016432 0.025405 0.025683 0.026516 0.026463 d =0.4 −0.0018730 0.0056487 0.020532 0.00059128 0.024237 0.026986 0.039836 0.026596 upper: Bias, lower: RMSE
フォーマンスを示している。また,Whittle推定法のバイアスも全体的 に小さいといえるだろう。BeranのAR近似法はd =0.20の時および標本 サイズが小さいときには,Haslett-Raftery法についでRMSEが小さい。 一方,BeranのAR近似法標本サイズが大きくなってもHaslett-Raftery 法あるいはWhittle推定法ほどにはRMSEが小さくはならない。 4.2 ファイナンス・データへの応用 これまで述べてきた推定法を日本のファイナンス時系列にデータに応 用する。ここで利用する日経平均株価指数は日本の株式市場で最も典型 的な株価指数である。本稿では日経平均の5秒毎のデータからrealized volatility(実現ボラティリティ)を計算して,その対数値に対してAR-FIMAモデルを推定することを目指す。 まず,日次realized volatility,RVtは以下のように定義されるもので ある。 RVt=c n Σ i=1r 2i,t, 101½ c=ΣTt=1(Rt−R―)2 ΣT t=1Σni=1r2i,t ½ 102 なお,Rtは日次リターンであり,R―は日次リターンの平均である。そし て,ri,tはt日における5秒毎の対数収益率であり,cは½102で定義される調
整定数である。(例えば,Hansen and Lunde(2005),渡部(2007)を 参照のこと)。
なお,本稿で用いる日 経 平 均 株 価 指 数 の デ ー タ は,標 本 期 間 が
2001.7.2―2008.6.30であり,標本サイズはT =1,707,調整定数は
c=2.022である。
Table2はrealized volatility RVt,realized volatilityの対数値 log(RVt),
日次リターンRt,日次リターンの2乗値R2tの要約統計量を示している。
RtのLjung-Box統計量は小さく,そのp値は0.5934である。このことは,
Rt自体には系列相関がないという帰無仮説を棄却することはできない。
一方,log(RVt)のLjung-Box統計量は非常に大きく,高い系列相関が
あることが考えられる.
Figure1は日経平均株価指数から計算されたrealized volatilityをグラ Table2 Summary statistics, Nikkei
RVt log(RVt) Rt Rt2 mean 1.97180 0.39297 0.00227 1.97181 stdev 1.61817 0.78078 1.40462 3.69633 skewness 2.68289 −0.23149 −0.31166 5.21421 kurtosis 16.66436 2.85184 4.50877 46.68171 LB(10) 4,565.54 7,457.28 8.3635 256.455 Rt: Daily Return.
LB(10):Ljung-Box test statistic with lag10.
Figure1 RV of Nikkei225,2July2001―30June2008
フにしたものである。一方,Figure2はrealized volatilitiyとその対数値 の自己相関をグラフにしたものである。このグラフからは,realized volatilityの対数値の自己相関の減衰が非常に遅いことが分かる。つまり, realized volatilityの対数値系列は長記憶性を持っていると考えられるの である。
次にFigure3でrealized volatilityの対数値系列 log(RVt)とその推定
されたスペクトル密度をグラフにしている。この推定されたスペクトル 密度は原点で発散している。このことは log(RVt)が長記憶時系列か非 定常時系列であることを示している。すなわち,log(RVt)に対して何 らかの階差をとることが必要と考えられるのである。 一方,Figure4はrealized volatilityの対数の1階の階差系列とその推 定されたスペクトル密度をグラフにしている。この推定されたスペクト ル密度は,1階の階差をとることは過剰階差であることを示している。 したがって,Figure3,4を合わせて考えれば,realized volatilityの対
Figure2 Autocorrelations of RV and log(RV),Nikkei
Figure3 RVの対数値系列とその推定されたスペクトル密度
Figure4 RVの対数値の階差系列とその推定されたスペクトル密度
数値に対しては実数差分をとることが望ましいと考えられるのである。 Table3にはHaslett-Raftery法,AR近 似 法,Whittleの3つ の 推 定 法 で推定した結果を表にしてある。RFIMA(0,d,0)以外のモデルで は,数値的最適化がうまくいかなかったので,ARFIMA(0,d,0) の推定結果のみを表に記してある。またexact MLでは標本サイズが大 きいためARFIMA(0,d,0)の推定の計算ができなかった。Table3 には推定値と標準誤差(S.E.)そしてt値が記されている。d の推定値は d =0.458―0.484であり,極めて0.5に近い値である。また,t値が大き いので十分に有意と判断できるだろう。 なお,3つの推定法の中で中間の値をとったHaslett-Raftery法での推 定値d =0.460によって,realized volatilityの対数値系列に対してフィル ターをかける。フィルターをかけた後の推定されたスペクトル密度は Figure5に描かれている。このスペクトルは原点で発散していないので,
Table3 Estimates of ARFIMA(0,d,0),Nikkei
Haslett-Raftery AR approximation Whittle estimates of d 0.46013 0.48414 0.45805 S.E.s 0.011770 0.016038 0.012095 t-values 39.092 30.187 37.871
Figure5 d=0.460でフィルターをかけたあとの推定されたスペクトル密度
長記憶時系列ではなく,また,過剰階差でもないであろう。つまり,短 記憶定常時系列になっていると考えられる。 謝辞 本研究は,財団法人日本証券奨学財団および財団法人野村財団,そし て科学研究費補助金#21530194の助成を受けた。また,プログラムの一 部の作成において各務和彦氏の協力を得た。記して感謝申し上げる。も ちろん,本稿のありうべき誤りの責任は全て著者にある。 References [1] 谷口正信(2003)「時系列解析入門」,竹内啓編『統計学の基礎―線形モデルからの出 発』岩波書店所収。 [2] 矢島美寛(2003)「長期記憶をもつ時系列モデル」,竹内啓編『経済時系列の統計―そ の数理的方法』岩波書店所収。 [3] 渡部敏明(2007)「Realized Volatility――サーベイと日本の株式市場への応用――」, 『経済研究』,58,352―373。
[4] Abramowitz, M. and Stegun, I.A.(1965)(eds)Handbook of Mathematical Functions: with Formulas, Graphs, and Mathematical Tables, Dover, New York.
[5] Beran, J.(1994)Statistics for Long-Memory Processes, Chapman & Hall, London. [6] Beran, J.(1995)“Maximum Likelihood Estimation of the Differencing Parameter for
Invertible Short and Long Memory Autoregressive Integrated Moving Average Mod-els”,Journal of the Royal Statistical Society. Ser. B 57659―672.
[7] Brockwell, P.J. and Davis, R.A.(1991)Time Series: Theory and Methods, 2nd ed., Springer, New York.
[8] Chan, N.H. and Palma, W.(1998)“State Space Modeling of Long-Memory Processes”, Annals of Statistics 26719―740.
[9] Cheung, Y.-W. and Diebold, F.X.(1994)“On maximum likelihood estimation of the differencing parameter of fractionally-integrated noise with unknown mean”,Journal of Econometrics 62,301―316.
[10] Dahlhaus, R.(1989)“Efficient parameter estimation for self-similar processes”,
nals of Statistics 17,1749―1766.
[11] Ding, Z., Granger, C.W.J. and Engle, R.F.(1993)“A long memory property of stock market returns and a new model”,Journal of Empirical Finance 1,83―106.
[12] Doukhan, P., Oppenheim, G. and Taqqu, M.S.(eds.)(2003)Long-Range Dependence: Theory and Applications, Birkhauser, Boston.
[13] Fox, R and Taqqu, M.S.(1986)“Large-sample properties of parameter estimates for strongly dependent stationary Gaussian time series”,Annals of Statistics 14,517―532. [14] Geweke, J. and Poter-Hudak, S.(1983)“The estimation and application of long
mem-ory time series models”,Journal of Time Series Analysis 4,221―238.
[15] Gradshteyn, I.S. and Ryzhik, I.M.(1994)Tables of Integrals, Series, and Products, 5th ed., Academic Press, New York.
[16] Granger, C.W.J. and Joyeux, R.(1980)“An introduction to long memory time series model and fractional differencing”,Journal of Time Series Analysis 1,15―39.
[17] Hansen, P.R. and Lunde, A.(2005)“A Comparison of Volatility Models: Does Any-thing Beat a GARCH(1,1)?”,Journal of Applied Econometrics 20,873―889.
[18] Haslett, J. and Raftery, A.E.(1989)“Space-Time Modelling with Long-Memory De-pendence: Assessing Ireland’s Wind Power Resource”,Journal of the Royal Statistical So-ciety. Ser. C 38,1―50.
[19] Hosking, R.M.J.(1981)“Fractional differencing”,Biometrika 68,165―176. [20] Palma, W.(2007)Long-Memory Time Series: Theory and Methods, Wiley, New York. [21] Robinson, P.M.(1995)“Gaussian semiparametric estimation of long range
depend-ence”,Annals of Statistics,23,1630―1661.
[22] Robinson, P.M.(ed.)(2003)Time Series with Long Memory, Oxford, Oxford.
[23] Sowell, F.(1992)“Maximum likelihood estimation of stationary univariate fraction-ally integrated time series models”,Journal of Econometrics,53,165―188.
[24] Teyssiere, G. and Kirman, A.P.(eds.)(2007)Long Memory in Economics, Springer, New York.
(2010年9月13日受理)
Summary
On Time Series with Long Memory
―Parametric Estimation of ARFIMA Model
Haruhisa NISHINO
This paper surveys the recent research on estimation methods for long memory time series. It focuses on parametric estimations for the ARFIMA model, which is typical among time series models with long memory. The paper moreover conducts a simulation study to compare the performance of the estimation methods, which are also applied for Japanese financial time series data.