【論 説】
数値シミュレーションが困難な 非定常確率過程に関する一考察
石 山 健 一
1.はじめに
時系列分析の研究は 20 世紀初頭に始まったといわれている1)。時系列デ ータを分析する方法に劇的な変化が起きたのは 20 世紀の終盤である。この 百年の間に時系列分析に関する様々な研究が行われ、その結果として得られ た知見は多くのテキストにまとめられてきた2)。本研究では、時系列分析の 本格的な研究が始まった頃に
Pearson(1905)によって提起されたランダ
ム・ウォークに関する問題に関連するテーマに焦点を当てる。ランダム・ウォークモデルは文字通り、動物の移動の軌跡をモデル化した ものとして、Marsh and Jones(1988)等によって研究されてきた。一方で、
ランダム・ウォークは単位根モデルともよばれ、田中(2006, 151 頁)が述 べているように、経済学においては、さまざまな経済現象の公平性や効率性 を表すモデルとして使用され、現在なお、経済やファイナンスの分野で重要 な役割を果たしている。
ところで、森崎(2012, 237─239 頁)等でも指摘されているように、時系 目 次
1.はじめに
2.標本相関係数の確率分布
3.時系列データにみられる見せかけの回帰 4.特殊な非定常確率過程と標本相関係数 5.おわりに
列回帰モデルの説明変数と攪乱項が共に非定常過程であれば、回帰係数は過 大推定され、決定係数が大きくなり、説明変数と被説明変数の間に因果関係 があると錯覚してしまうという問題が発生する。この錯覚は、「非定常回帰 モデルにおける見せかけの回帰」とよばれる、時系列データを分析する際に 注意すべき現象である。ランダム・ウォークは、非定常確率過程の一種であ るので、ランダム・ウォークにしたがう独立な確率変数の一方を説明変数、
他方を被説明変数として回帰式にあてはめると、見せかけの回帰の問題が起 きることになる。このとき、両変数の間には見せかけの相関がみられる。本 研究は、数値シミュレーションを行うことが困難なランダム・ウォークにし たがう確率変数間の標本相関係数の確率分布について分析を行い、見せかけ の相関、見せかけの回帰に対する理解を深めることをその目的とする。
この論文の構成は次の通りである。次節では、準備的考察として、2 変量 正規分布から無作為抽出した小標本の相関係数がしたがう確率分布について
考察した
Fisher(1915)、Fisher(1928)について概括する。第 3 節では、
本研究の主題である時系列データにみられる見せかけの回帰に関する先駆的 な研究として有名な
Granger and Newbold(1974)について簡単に概括す
る。第 4 節において、本研究独自の確率分布を定義し、この分布にしたがう 独立なランダム・ウォーク間の相関について分析を行う。その結果は最終節 でまとめられる。2.標本相関係数の確率分布
歴史的に見れば、相関係数(correlation coefficient)は、Galtonが導入 し、Pearsonが発展させた概念である3)。今日では、記述統計学において、
相関係数は数量データの間の関連の強さを特徴づける無次元の指標として、
よく知られている。
量的なペアデータ(
x
1, y
1),
(x
2, y
2), …,
(x
n, y
n)を、このデータから計算さ れる平均をとしよう。このとき、2 つの幾何ベクトルx
=(x
1−x ─ , x
2−x ─ , …, x
n−x ─
) (1)y=(y
1−y─ , y
2−y─ , …, y
n−y─
) (2)のなす角を θ
とすると、このデータの相関係数は
r
xy=cos θ (3)として定義される。これが量的データ、
x
とy
の相関の強さを表す代表的な 指標となる4)。定義域 0≤ θ ≤ π に対するこの関数の値域は−1 ≤ r
xy≤
1 であ る。また、r
x= (4)r
y= (5)とすると、ベクトルの内積の定義より、
cos
θ=x
・y
r
xr
y= Σni=1(xi−x─
)(yi−y─
)Σni=1(
x
i−x ─
)2 Σni=1(y
i−y ─
)2 (6)となる。したがって、よく知られていることではあるが、相関係数は、共分 散をそれぞれの標準偏差で割ったものとして再定義することもできる。
推測統計学の観点からみれば、母集団の相関係数、すなわち母相関係数 は、標本データから推測する母数(パラメータ)である。母集団からの無作 為抽出によって標本を得るならば、標本相関係数は確率変数とみなされる。
確率変数の従う確率分布を知ることができれば、われわれは、母数に関する 区間推定や仮説検定に進むことができるようになる。Pearsonに続くいくつ かの研究を経て、標本相関係数の確率分布について考察したのが
Student
(1908)である。本論文においては、混乱を避けるための慣例により、これ 以降、母集団を対象に計算された母相関係数は、rxyではなく ρ
で表し、母
集団から無作為抽出した標本サイズn
の標本相関係数r
xyと区別することに しよう。Student(1908)は、Sheppard(1899)の結果を適用し、有限母集団の相 関係数が ρ=0 の場合と ρ=0.66 の場合について、この母集団から抽出した
(
x
i−x ─
)2Σ
i=1n(
y
i−y ─
)2Σ
i=1nサイズ
n
=4 およびn
=8 の標本の相関係数r
xyのヒストグラムを実験によっ て確認した。Soper(1913)は、Student(1908)の結果について論理的に再 考し、標本相関係数の分布について、理論値と実測値の比較を行った。結果 的に、Soper(1913)は小標本の標本相関係数の確率密度関数が、次の式で 近似されることを示唆した。(r)=r
f
(1−r)0 m(1+r)1 m2 for −1<r<1 (7)ただし、
n
=4, ρ=0 またはn
=4, ρ=0.66 に対し、パラメータの値は、それ ぞれr
0=0.386192−0.113808(
ρ−0.330.33)
(8)m
1=0.23422+0.23422(
ρ−0.330.33)
(9)m
2=0.541215+0.541215(
ρ−0.330.33)
(10)となる5)。
さらに、Soper(1913)に触発された
Fisher(1915)は、母集団分布が 2
変量正規分布である場合について、標本サイズ 4 の標本相関係数の確率分布 および標本サイズが無限大に近づいたときの標本相関係数の確率分布を、積 分の置き換え法則と幾何学的アプローチを用いて考察した6)。2 変量正規分 布から無作為抽出した場合の標本空間はΩ={ω=(
x
1, x
2, …, x
n, y
1, y
2, …, y
n)|ω∈R2n}
であり、同時密度関数は次の式で表される。1
(2πσxσy
1−ρ)n
exp
− 11−ρ2 −(xi−μx)2
2σx2 −(xi−μx)(yi−μy)
σxσy −(yi−μy)2
2σx2
(11)
ただし、μxと σxは
x
の母平均、母分散をそれぞれ表し、μyと σyはy
の母 平均、母分散をそれぞれ表す。また、ρは x
とy
の間の母相関係数である。Σ
i=1n2 変量正規分布から無作為抽出した標本に関しては、
n
=4, ρ=0 のときのr
xyの確率分布が一様分布になることは、Fisher(1915)の結果から確認さ れたことの一つである。続くFisher(1928)には、様々な標本サイズ n
に 対して ρ=0 の場合のr
xyの確率密度関数が(r)=
f
Γ( n
−12)
Γ
( n
−22)
π(1−r2)n−4
2 (12)
であることが記されている。この関数のグラフを
Mathematica
7)で描写する と、図 1 のようになる。図中のグラフが示すように、標本サイズが十分大き ければ、標本相関係数の分布は母数である ρ=0 に近い値をとる可能性はか なり高い。図 1:Mathematica で描写した Fisher (1928) の f(r) のグラフ (n=120 の場合)
in[1]:= f[r_, n_]:= ( Factorial Factorial n−4 2 n−3 2 π ) (1−r
2)
n−42;
Plot[f[x, 120], {x, −1, 1}, PlotRange → ALL]
Out[1]=
4
−1.0 −0.5 0.5
1 2 3
1.0
本研究では、上で述べた
n
=4, ρ=0 の場合の特殊性に再注目し、無相関 な母集団から得られた小標本のr
xyの確率分布に焦点を当てた考察を試み る。ただし、後述する時系列革命よりも遥か以前の研究であるStudent
(1908)、Soper(1913)、Fisher(1915)、Fisher(1928)とは異なり、我々 は、確率過程の生み出す時系列データの標本相関係数について議論する。時 系列データには見せかけの相関、見せかけの回帰がしばしば潜んでいる。次 節では、時系列データにみられる見せかけの回帰に関する先駆的な研究につ いて概括しよう。
3.時系列データにみられる見せかけの回帰
Hamilton(1994)がその冒頭でも述べているように、1980 年代から 1990 年代にかけて、われわれが時系列データを分析する方法には劇的な変化が起 きた。いわゆる「時系列革命」である。この期間には、たとえば、ベクトル 自己回帰モデルの分析、モーメント法の一般化、非定常な時系列データの統 計的仮説検定において、大きな前進があった8)。本研究に関連のある「見せ かけの回帰」に関する理解が深まったのもこの時期である。
著者の知る限り、Yule(1926)は、なぜ、時系列データ間に見せかけの相 関がみられるかについて論じた最初の論文である。時系列データにみられる 見 せ か け の 相 関(non─sense correlation)、 見 せ か け の 回 帰(spurious
regression)は、のちに Granger and Newbold(1974)のモンテカルロ実験
によって広く知られるようになり、やがて、Phillips(1986)によって解析 的に裏付けられた。本節では、Granger and Newbold(1974)の示した結果 について簡単に概括しよう。
Granger and Newbold(1974)が述べている通り、応用計量経済学の文献 において、DW統計量はゼロに近いのに、決定係数の値は極めて高く、経済 時系列データによくあてはまる回帰式についての報告は多い9)。誤差の自己 相関は、仮説検定に悪影響を与えることがある。このような現象は、独立な
確率変数の一方を説明変数、他方を被説明変数として回帰式に当てはめよう とすることから起こると考え、それをシミュレートするために、Granger
and Newbold(1974)は次の単回帰モデルを想定した。
y
t=α+βx
t+ut (t=1, 2, …, 50) (13)ただし、
y
tとx
tは以下の確率過程によって生成されるものとする10)。y
t=yt−1+vt (14)x
t=x
t−1+w
t (15)ここで、vtは互いに独立に平均 0, 分散 σ2vの同一確率分布に従い、wtは互い に独立に平均 0, 分散 σw2の同一確率分布に従う。このような非定常な確率過 程はランダム・ウォークあるいは酔歩とよばれる11)。Granger and Newbold
(1974)は、
v
t〜iidN(0, 1),
(16)w
t〜iidN
(0, 1),
(17)y
0=100, x0=100として数値実験を行った。その結果は図 2 の通り。図 2 に示されたヒストグ ラムの横軸は母回帰係数の最小 2 乗推定量の標準化の絶対値をとった
|
z
|= |β|s.e.
(β)を各区間に分けたときの階級値を表し、グラフの面積はその階級の度数を表 す。(13)式を古典的線形回帰モデルとして推定しているなら、β=0 のとき に |
z
|>t
となる確率が 5%であるt
は自由度 49 のt
分布上側 2.5%点として 求められるが、自由度が十分高いので、その数値はおよそ 2 となる。したが って、この図から、両側検定した場合、H0:
β=0 という帰無仮説を棄却する 第 1 種の過誤の確率は本来の有意水準をはるかに上回ることがわかる。Granger and Newbold(1974)は、さらに、説明変数が複数の重回帰モデ ルについても同様のシミュレーションを行った。その結果、ランダム・ウォ ークを含む回帰においては、説明変数が増えると、H0
:
β=0 という帰無仮説 を受容する確率が低下することが示された。多重回帰モデルを分析することによって、われわれが重要と考える変量に対して影響を与える変量を見抜く ことが期待されるが、Granger and Newbold(1974)の結果は、時系列デー タの場合には、通常の最小 2 乗推定(OLS)では影響しないはずの要因を適 切に除外することはできないということを意味する。そういう意味では、
(14)式および(15)式における攪乱項が正規分布に従う場合以外についても考 察しておくことには一定の価値があると考えられる。
次節では、誤差がある特別な確率分布に従う場合のランダム・ウォークに ついて、議論を行う。Granger and Newbold(1974)は長さ
T
=50 の時系列 を対象としたが、本研究ではPearson(1905)の提起した問題に立ち戻り、
小標本、具体的には
T
=4 の場合について考察する。4.特殊な非定常確率過程と標本相関係数
前節では、時系列データにみられる見せかけの回帰について概括した。
(13)式のような回帰モデルでは、決定係数は、標本相関係数の 2 乗に一致す 図 2:Granger and Newbold(1974)のシミュレーション結果
0 0.5 2 4 6 8 10 12 14 16 18 20
1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 14.5 15.5
る。したがって、見せかけの回帰と見せかけの相関はほぼ同一視できると考 えられる。ここでは、独立なランダム・ウォークが生み出す時系列データの 標本相関係数の確率分布について議論しよう。
まずは、ペアデータ
(
x
1, y
1),
(x
2, y
2),
(x
3, y
3),
(x
4, y
4) に対し、x ─
=14
x
i,
(18)y ─
=14
y
i,
(19)r
x= (20)r
y= (21)r
xy= 1r
xr
y (xi−x─
)(yi−y─
)=cos θ (22)とする。なお、三角関数の微分の公式より、
dr
xy=d cos
θ=−sin θd
θ (23)である。
次に、標本空間
Ω={ω=(x1
, x
2, x
3, x
4, y
1, y
2, y
3, y
4)|ω∈R8}上の体積要素について考えよう。高次元空間を紙面で表現することは非常に 困難であるため、ここでは空間を 3 つの部分に分けて体積要素を組み立てる ことを試みる。
x ─
およびr
xを所与とする Ω 上の部分集合をR
4に射影すれ ば、それは図 3(左)に示されたようなベクトル(x─ , x ─ , x ─ , x ─
)と直交する 3 次 元空間上の球表面となる。この球表面の面積は 4πr
x2である。y ─
およびr
yを 所与とする部分集合についても同様にして、図 3(右)のような面積 4πr
y2Σ
i=14Σ
i=144(
x
i−x ─
)2,
Σ
i=14(
y
i−y ─
)2,
Σ
i=1Σ
i=14の球表面を描くことができる。
r
xyは 2 つの球表面のなす角の余弦を意味す るため、(23)式より、Ω 上の体積要素は1
2×4π
r
x2×4πr
y2× 1−rxy2×drxdr
ydx ─ dy ─
(−dθ)=8π2r
x2r
y2dr
xdr
ydx ─ dy ─ dr
xy(24)
となることが分かる。したがって、標本相関係数の確率密度関数は、周辺確 率
g
(r
xy)=8π∫
2 −∞+∞∫
−∞+∞∫
0+∞∫
0+∞r
x2r
y2j
(x
1, x
2, x
3, x
4, y
1, y
2, y
3, y
4)dr
xdr
ydx ─ dy ─
(25)
として求められる。もし、関数
j
をr
x, r
y, x ─ , y ─
の関数として書き表すことが できるならば、そのとき、標本相関係数の確率分布は一様分布である。しか しながら、それを示すことは非常に困難であると予想される。そこで、本研 究では、特別な確率分布を想定して、議論を先に進めることを試みる。任意の実数
x
、y
、σx2に対し、次の条件が成り立つ関数f
を考えよう。(
f x , y ,
σx2)≥
0 (26)図 3:所与の rx, ry, x─, y─, rxyに対応するΩの部分集合のイメージ
∫
−∞+∞(x, y,f
σx2)dx=1
(27)∫
−∞+∞xf
(x, y, σx2)dx=y
(28)∫
−∞+∞x
2(x, y,f
σx2)dx=σ
2x+y2 (29)これは、平均
y
、分散 σ2xである連続型確率分布の確率密度関数の一般的な 定義である。(26),(27),(28),(29)式の条件に加えて、(x, y,
f
σx2)(y, z,f
σy2)= 1n ( f x+y, z,
σx2+σy2−12) e
−y2 (30)が、任意の実数
x
、y
、z
、および正の実数 σx2、σy2に対して成り立つような 関数f
が存在するか否かについて議論しよう。(30)式の左辺に関しては、定 義により、∫
−∞+∞∫
−∞+∞(f x , y ,
σx2)(f y , z ,
σy2)dxdy
=1 (31)∫
−∞+∞∫
−∞+∞xf
(x , y ,
σx2)(f y , z ,
σy2)dxdy
=z
(32)∫
−∞+∞∫
−∞+∞x
2(f x , y ,
σx2)(f y , z ,
σy2)dxdy
=σx2+σy2+z
2 (33)となる。他方、(31)式に対応する(30)式の右辺の積分は、
∫
−∞+∞∫
−∞+∞1
n ( f x
+y, z,
σx2+σy2−12) e
−y2dxdy
(34)であるが、
a
=x
+y
、y
= 12
b
とおくと、ガウス積分により∫
−∞+∞∫
−∞+∞1
n ( f x
+y, z,
σx2+σy2−12) e
−y2dxdy
=
∫
−∞+∞∫
−∞+∞12π
( f a, z,
σ2x+σy2−12) e
−b22dadb
= ∫
−∞+∞1
2π
e
−b22
db=1
(35)となることがわかる。同様にして、(32)式に対応する(30)式の右辺の積分 は、
∫
−∞+∞∫
−∞+∞x n ( f x+y, z,
σx2+σy2−12) e
−y2dxdy
=
∫
−∞+∞∫
−∞+∞a
− 12π
2
b ( f a, z,
σ2x+σy2−12) e
−b22dadb=z
(36)となる。最後に、(33)式に対応する(30)式の右辺の積分は、
∫
−∞+∞∫
−∞+∞x
2n ( f x
+y , z ,
σx2+σy2−12) e
−y2dxdy
=
∫
−∞+∞∫
−∞+∞a
2− 2ab+ 1
2b
22π
( f a , z ,
σx2+σy2−12) e
−b22dadb
=σ2x+σy2+z2 (37)
となることが確認される。したがって、われわれは、関数の積が(30)式にな るような特別な関数
f
が存在すると仮定して、先に進むことにする。なお、( f x+y, z,
σx2+σy2−12)
(38)については、σx2+σy2−1
2
がゼロ以下になる場合もあるため、これを確率密
度関数とみなす際は注意が必要である。
(14)式および(15)式のような互いに独立な 2 つの確率過程について、その 確率密度関数が、(30)式を常に満たす特別な関数によってそれぞれ表される ならば、そのとき同時密度関数は、
j
(x
1, x
2, x
3, x
4, y
1, y
2, y
3, y
4)= f(x
t, x
t−1,
σx2)(f y
t, y
t−1,
σy2)=
e
−r2x−r2y−4x─2−4y─2+x24+y24π3
( f
4x ─ , x
0, 4σ
x2−32) ( f
4y ─ , y
0, 4σ
y2−32)
(39)Π
t=14となる。この結果からただちに明らかになることは、この特別なランダム・
ウォークに関する(x0
, y
0)という条件の下でのe
4x─2+4y─2−x24−y24の期待値である。それを求めると、
8π
∫
2 −1+1∫
−∞+∞∫
−∞+∞∫
0+∞∫
0+∞e
4x─2+4y─2−x24−y24r
x2r
y2jdr
xdr
ydx ─ dy ─ dr
xy=8
π
∫
−1+1∫
−∞+∞∫
−∞+∞∫
0+∞∫
0+∞r
x2r
y2e
−r2x−r2y( f
4x ─ , x
0, 4σ
x2−32) ( f
4y ─ , y
0, 4σ
y2−3
2
) dr
xdr
ydx ─ dy ─ dr
xy=π8∫
−1+1∫
0+∞∫
0+∞r
x2r
y2e
−r2x−r2ydr
xdr
ydr
xy=4
∫
−1+1dr
xy=8 (40)となる。残念ながら、この計算には殆ど意味がないかもしれない。しかしな がら、ランダム・ウォークで 4 歩進んだ先に関する期待値がこれほど簡単に 表されたことは、関数の条件を見直すことによって、興味深い結果をわれわ れが得ることもできることを示唆している。
5.おわりに
本研究では、Pearson(1905)に端を発したランダム・ウォークの問題に ついて、基本的には
Fisher(1915)を踏襲しながらも、独自のアプローチか
ら分析を試みた。独立なランダム・ウォークが生み出す時系列データの標本 相関係数の確率分布に焦点を当て、ランダム・ウォークを支配する確率分布 を特定化することによって、小標本の場合の標本相関係数について、ある種 の期待値を得ることには成功したが、残念ながら、標本相関係数そのものの 確率分布は得られなかった。ただ、本研究で新たに定義した関数は特別な性 質を持つものであり、これをモデルに組み込んだことは、正規分布とは全く 異なるルーツの確率分布を理解する上での数学的にある程度の価値ある試み であったのかもしれない。小標本における統計量の確率的振る舞いを対象とする本研究は、IT技術 が発達し、容易にデータが入手できるようになった現代の実証分析への応用 に対してただちに役立つ可能性は殆どないかもしれないが、理論研究として は、時代の流れに埋没しつつある論理展開を掘り起こして再考するという点 において、また、挑戦的萌芽的研究の一つとして一定の価値があると考えら れる。
注
1) たとえば、田中(2006)を参照。
2) たとえば、Hamilton(1994)や
Maddala and Kim(1998)などが挙げられる。
3) この一例として、Pearson(1895)が挙げられる。
4) 本研究では時系列データ間の関連性に注目するが、このようなデータ間の関連の強 さを表す方法として、データサイズが十分であれば、例えば、石山(2013)が挙げ ているように、コヒーレンスやコヒーレンシーのほか、クロスウェーブレットコヒ ーレンシーといった概念もある。
5) パラメータの数値は、Soper(1913)に基づき筆者が求めた近似値である。
6) 本論文で行う解析は、基本的に
Fisher(1915)に依拠している。
7) Mathematica(正式名称は
Wolfram Mathematica)はウルフラム・リサーチ社が提
供する数式処理システムである。2019 年時点での最新バージョンは 12.0.0 となっ ている。8) Hamilton(1994)を参照。
9) Granger and Newbold(1974)は具体的に、R2=0.99, d=0.093 という極端な例を挙 げている。
10) もし、yt=vt
, x
t=wtで、かつ、標本サイズが大きければ、(12)式の示す通り、標標 本相関係数の分布は−0.3<rxy<+0.3 の範囲に集中するため、xtとy
tが無相関で あることを見抜くことは容易いと考えられる。11) ランダム・ウォークに関する初歩の研究としては、歩数が少ない場合について考察
した
Pearson(1905)が挙げられる
参考文献