• 検索結果がありません。

5 教育 OKUI, Ryo

N/A
N/A
Protected

Academic year: 2018

シェア "5 教育 OKUI, Ryo"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

平成28年度 上級計量経済学 講義ノート5: パネルデータ分析

時系列方向とクロスセクション方向の両方に広がりをもつデータをパネルデータという。 パネルデータを利用することにより、ある種の欠落変数のバイアスを回避することができ る。具体的には、欠落変数バイアスをもたらす変数が、時間を通じて一定であれば、その変 数を観測することなしにモデルから除去できるため、欠落変数バイアスを避けることができ るのである。この手法を固定効果推定という。さらにこのノートでは、変量効果推定量も紹 介する。変量効果推定量はGLS推定量であり、誤差項の分散構造をパネルデータモデルに 特徴的な形で仮定することで、FGLS推定を可能にしている。

5.1 パネルデータ

パネルデータとは、多くの観測個体を複数時点に渡って観測したデータである。よく知られた パネルデータとしては、NLS (National Longitudinal Survey of Labor Market Experience) やPSID (Michigan Panel Study of Income Dynamics)があり,日本では慶應大学が収集し ている日本家計パネル調査などがある。同一個体を時系列的に追跡しながらデータを集める 必要があるため、データ収集にはコストがかかる。

収集が少し簡易なものに、繰り返しクロスセクションデータと呼ばれるものがあるが、 これはクロスセクションデータを繰り返しとったものである。観測される個体が毎年変わる 点がパネルデータと根本的に異なる。

また、パネルデータの中には期間の途中でサンプルから脱落したり、途中からサンプ ルに入ってくる個体もある。そのようなパネルデータを、区別して不揃いなパネルデータ (unbalanced panel data)という。また、対応して普通のパネルデータを揃っているパネル データ(balanced panel data)と呼ぶ。このノートでは、揃っているパネルデータを対象と する。

5.2 パネルモデル

パネルデータ分析の際にも、通常と同じように回帰モデルを考えることができる。

yit= xitβ + uit (1)

ただし、i、tをそれぞれ個体、時点を表わす添え字とする。なお、大文字のXは後ほど別 に使用するため、小文字のxで説明変数を表すことにする。もし、xitとuitが相関がなけれ ば、OLSによってβを推定することができる。

5.2.1 固定効果推定

しかし、パネルデータモデルの場合は、xitとuitに相関があったとしても、操作変数を用い ずに、一致推定することができる。仮に、uit= αi+ ϵitのように、uitが時間によって変化 しないαiと変化するϵitの二つに分かれているとする。

yit= αi+ xitβ + ϵit, i = 1, · · · , n, t = 1, · · · , T (2) もし、ϵitにxitとの相関がないのであれば、たとえ、αiの方がxitと相関しているにしても、 βのOLS推定をすることができる。

なぜ、パネルデータでは一致推定が可能なのかというと、αiをモデルから消す変数変換 が存在するからである。個体ごとの平均は、

¯

yi = αi+ ¯xiβ + ¯ϵi (3)

(2)

という式で表現でき、これを、(2)から引いてαiを消去したモデル

yit− ¯yi= (xit− ¯xi)β + ϵit− ¯ϵi (4) をたてることができる。この式からは、αiがなく、回帰変数と誤差項は相関していないた め、OLSを適用できる。

上でみたような変換を固定効果変換と呼び、それにOLSを適用した推定量を、固定効果 推定量(fixed effects estimator, FE推定量)と呼ぶ。推定量の式は、

βˆF E = [ n

i=1

T t=1

(xit− ¯xi)(xit− ¯xi) ]1 n

i=1

T t=1

(xit− ¯xi)(yit− ¯yi) (5) となる。

5.2.2 LSDV

固定効果推定量は、各個人を表すダミー変数を加えたモデルのOLS推定量としてもかける。 以下の行列を定義する。

yi =





 yi1 yi2

yi3 ... yiT





 , i =





 1 1 1 ... 1







T ×1

, Xi=





 xi1 xi2 xi3 ... xiT







T ×k

, ϵi =





 ϵi1 ϵi2

ϵi3 ... ϵiT







(6)

として、

Y =





 y1 y2 y3

... yn







nT ×1

, D =







i 0 0 · · · 0 0 i 0 · · · 0 0 0 i · · · 0 ... ... ... . .. ... 0 0 0 · · · i







nT ×n

, X =





 X1 X2 X3

... Xn







nT ×k

, ϵ =





 ϵ1 ϵ2 ϵ3

... ϵn





 (7)

とする。なお、iはT ×1の全ての要素が1のベクトルである。Z = [D X], α = (α1, · · · , αn) とすると、データに関して

Y = Dα + Xβ + ϵ (8)

と書ける。これをLSDV (Least squares dummy variables)モデルと呼ぶ。OLS推定量は [ αˆ

βˆ ]

= (ZZ)1ZY =

[ DD DX XD XX

]1[ DY ZY

]

(9) で与えられる。分割行列の逆行列の公式を用いると、MD = I − D(DD)1Dとして

β = (Xˆ MDX)1XMDY (10)

= [ n

i=1

T t=1

(xit− ¯xi)(xit− ¯xi) ]1 n

i=1

T t=1

(xit− ¯xi)yit = ˆβF E (11) ˆ

αF E = (DD)1D(y − X ˆβF E) (12) となり、固定効果推定量が得られることがわかる。

(3)

LSDVとFEの同値性への行列表記を使用しない証明も与える。LSDVは

N i=1

T t=1

(yit− x

itβ − αi)2 (13)

を最小化することで求められる。ここで、βを固定してαiに関して最小化する問題を考え ると、各αi

T t=1

(yit− xitβ − αi)2 (14) を最小化することで求まる。標本平均が最小二乗推定量であることを使うと、βを固定した ときのαiの最小解は、

αi= 1 T

T t=1

(yit− xitβ) = ¯yi− ¯xitβ (15) である。この最小解をもとの目的関数に代入することで、βの最小解は求まる。αiの最小解 を代入した目的関数は

N i=1

T t=1

(yit− x

itβ − ¯yi+ ¯xitβ)2 =

N i=1

T t=1

[(yit− ¯yi) − (xit− ¯xit)β]2 (16)

である。これは、FE推定量の最小化問題と同じである。従って、LSDVとFEは同値になる。

5.2.3 固定効果推定量の漸近的性質

次の定理でFE推定量の性質を述べる。パネル推定の漸近理論を構築する場合、nを大きく する漸近理論とT を大きくする漸近理論、両方を大きくする漸近理論が考えられる。多く のパネルデータはT方向よりもn方向に長いため、以下ではT は固定、n → ∞の漸近論を 考える。

定理 1. FE 推定量の漸近的性質

(a) モデル(2)が正しい特定化で、{yit, xit}Tt=1, i = 1, · · · , ni.i.d.であるとする。 (b) rank{E[∑Tt=1(xit− ¯xi)(xit− ¯xi)]}= k

(c) E(ϵi| Xi) = 0

(d) ϵitとxitは4次までのモーメントを持つ 以上の仮定の下で、n → ∞のとき、 (i) ˆβF E p β0

(ii) n( ˆβF E − β0) →dN (0, A1ΣA1), なお、A = E[∑Tt=1(xit− ¯xi)(xit− ¯xi)]かつ Σ = E[∑Tt=1Ts=1(xit− ¯xi)(xis− ¯xiitϵis

]である。

証明は、OLS推定量の理論のものと同一なので、省略する。ただし、ϵitが時間を通じ て、相関している可能性を考慮する必要がある。

仮定もOLSのための理論のものに近いが、いくつか注意しておいた方がよい点もある。 仮定(b)は、多重共線性を避ける仮定であるが、パネルモデルの場合、この仮定は、時間を 通じて一定な回帰変数を排除する。例えば、定数項は、推定できない。これらの変数は固定 効果変換によって消えてしまうので、その係数も推定できないのである。仮定(c)は、ϵと xがすべての時間の組みあわせに対して相関がないことを意味している。ϵitとxitの間の無 相関だけでは不十分で、ϵitとxisがすべてのt, sについて相関がないことが必要になる。こ れは、xit− ¯xiとϵit− ¯ϵiが無相関になることが、固定効果推定の条件だが、x¯iや¯ϵiはすべ ての期の情報を含むためである。

(4)

5.3 変量効果モデル

変量効果モデルとは、誤差項uitと回帰変数xitは無相関であると仮定しているが、それで もなお、誤差項uitはuit = αi+ ϵitとなっているモデルである。固定効果モデルとの違い は、αiがxitとは無相関であると仮定していることである。また変量効果モデルでは、ϵitは 系列無相関と仮定することが多い。つまり、uitの系列相関をすべてαiと言う項に帰着させ ることが、変量効果モデルの主な動機となる。

5.3.1 変量効果推定量

変量効果モデルにおいては、分散均一を仮定することで、GLS推定を行うことができる。こ うして得られた推定量は固定効果推定量よりも有効である。

まず、変量効果モデルを以下のように定義する。

yit= wit γ0+ αi+ ϵit, i = 1, · · · , n, t = 1, · · · , T (17) ただし、wit = (1, xit), γ0 = (α0, β0)である。固定効果モデルの場合と回帰変数の表記を 変えたのは、数学的な理由は特になく、単に、固定効果モデルでは、時間を通じて一定の変 数は許されていないが、変量効果モデルでは、そのような変数を含めることができるという ことを強調するためである。

αiがxitと無相関なので、OLSによって一致推定は可能である。OLS推定量は、

ˆ γOLS =

(1 n

n i=1

T t=1

witwit )1

1 n

n i=1

T t=1

wityit (18)

であるから、E(∑Tt=1witwit )= Q1、E(∑t=1T Ts=1wituituiswis ) = Q2とすると、適当 な条件のもとで

ˆ

γOLS p γ0 (19)

√n(ˆγOLS− γ0) →dN (0, Q11Q2Q11) (20) を得る。これをプールされたOLS推定量 (pooled OLS estimator)という。

変量効果モデルでは構造上誤差項uit= αi+ ϵitは分散均一のもとで以下のような自己相 関をもつため、GLSによって効率的な推定が可能である。αiとϵitはXを条件づけたとき 無相関であると仮定して、

E(u2it | Xi) = σ2α+ σ2ϵ (21) E(uituis | Xi) = σ2α (t ̸= s) (22) E(uitujs| Xi, Xj) = 0 (i ̸= j) (23) となる。よって、ui = (ui1, · · · , uiT)として、

Σ = E(uiui|Xi) =







σ2α+ σ2ϵ σα2 σ2α · · · σ2α σα2 σ2α+ σϵ2 σ2α · · · σ2α σα2 σα2 σα2 + σϵ2 . .. ...

... ... . .. . .. σ2α σα2 σα2 · · · σα2 σα2 + σϵ2







T ×T

(24)

となる。

(5)

変量効果推定量(Random effects estimator, RE推定量)と呼ばれるのは、上のモデルに 対するGLS推定量である。それは、以下で定義される。まず、Wi = (wi1, wi2, · · · , wiT)

W =





 W1 W2 W3

... Wn







nT ×(k+1)

, Ω =







Σ 0 0 · · · 0 0 Σ 0 · · · 0 0 0 Σ . .. ... ... ... . .. ... 0 0 0 · · · 0 Σ







(25)

と表記する。変量効果推定量は ˆ

γRE = (W1W )1W1Y (26) である。

定理 2. RE 推定量の漸近的性質

(a)モデル(17)が正しい特定化で、αiは観測されない確率変数である。また、{yit, wit}Tt=1 i = 1, · · · , ni.i.d.であるとする。

(b) rank[E(WiΣ1Wi)]= k + 1 (c) E(ϵi| Wi, ui) = 0

(d) E(ϵiϵi | Wi, ui) = σ2ϵIT (e) E(ui | Wi) = 0

(f ) E(u2i | Wi) = σu2 (g) E(uiϵi | Wi) = 0

以上の仮定の下で、n → ∞のとき、 (i) ˆγRE p γ0

(ii) n(ˆγRE− γ0) →dN (0, T1V1), V = E(T1WiΣ1Wi) である。

実際にはΣは未知なので、この推定量は実行可能でない。Σに含まれる未知パラメータ はσα2, σ2ϵ のみであるから、これらの一致推定量が得られればよい。そこで、以下のような 2段階推定法が提案されている。

1)yit = wit γ + uitをOLS推定し、ˆγOLS と残差uˆitを得る。それを用いてE(u2it) = σ2u = σα2 + σϵ2の推定量

ˆ

σ2u= 1 nT − k − 1

n i=1

T t=1

ˆ

u2it (27)

を構成することができる。また、E(uituis) = σα2(t ̸= s)なので、t ̸= sなるuˆit, ˆuisの積和を 集めて

ˆ

σ2α= 2 nT (T − 1)

n i=1

T −1 t=1

T s=t+1

ˆ

uitis (28)

によってσα2 の推定値を得ることができる。これらから、 ˆ

σ2ϵ = ˆσ2η− ˆσ2α (29)

によってσϵ2の推定値を得る。

2)上でえたσˆα2, ˆσ2ϵ を(24)に代入してΣˆ、更にそれを対角に並べてΩˆを作り、そこか ら実行可能な変量効果推定量(Feasible random effect estimator)

ˆ

γF RE= (Wˆ1W )1Wˆ1Y (30) を計算する。

この推定量は定理2と同じ漸近特性を持つ。

(6)

旧定義 推定法 新定義 FEモデル αi:固定された定数 FE推定

REモデル αi :確率変数、Cov(αi, xit) ̸= 0 FEモデル αi :確率変数、Cov(αi, xit) = 0 RE推定 REモデル

Table 1: 固定効果モデル・変量効果モデルの定義

5.3.2 固定効果モデルと変動効果モデルの再定義

ここまででは、変量効果モデルと固定効果モデルをαiが回帰変数と相関しているかどうか によって、定義してきた。この定義は、「変量」や、「固定」といった単語の意味とはそぐわ ないので、奇妙に感じられるかも知れない。歴史的には、歴史的にはαiが確率的かどうか で、二つのモデルを区別してきた。そのため、この二つの名前が用いられるようになったの である。しかし、その後の研究の進展から、回帰変数との相関の有無がより重要な問題であ るとの認識が進み、これまでに紹介したような分類になったのである。

つまり、現在では、元の単語の意味にとらわれることなく、

固定効果モデル:αiとxitに相関があるパネルモデル

変動効果モデル:αixitに相関がないパネルモデル というモデル名を使用する。

しかし、現在の計量経済学の教科書でも、旧定義、新定義共に用いられているように見 受けられる(もちろん新定義を採用する方が多いようであるが)。また、実際にはαiが非確 率的な定数という状況は個人について、無作為標本を取るという状況とはそぐわない。した がって、αiも確率変数として、単にCov(αi, xit) = 0が成立するか否かのみで固定効果モデ ルと変量効果モデルが定義されているのが普通である。なお、αiが確率変数のときに固定効 果という単語を使うと混乱が起こるので、個人効果という言葉を使用する場合もよくある。

5.3.3 固定効果モデルvs変量効果モデルーハウスマン検定

実際のデータについてパネル分析を行う際には固定効果モデルと変量効果モデルのどちらが 良いか(FE推定とRE推定のどちらが適切か)を定めなければならない。FE推定はパラ メータ数が多いために一般に効率性において劣るため、REが適切ならそちらを使うのが望 ましい。帰無仮説と対立仮説を

H0 : Cov(αi, xit) = 0 (31)

H1 : Cov(αi, xit) ̸= 0 (32) として、二つの推定量は下の表のような性質をもつ。

H0 H1

βˆRE 一致性& 有効 有効でない βˆF E 一致性 &有効でない 一致性

Table 2: RE vs FEのハウスマン検定

これは操作変数の妥当性の検定と同様の構造になっており、この場合ハウスマン検定が 適用できる。分散均一を仮定して、検定統計量は

n( ˆβF E− ˆβRE){ dV ar( ˆβF E) − dV ar( ˆβRE)}1( ˆβF E− ˆβRE) →dχ2(k) (33) である。ただし、ハウスマン検定を行い、棄却されないならRE推定量を用いるというやり 方は推奨できない。特に、RE推定量の標準誤差を用いて検定を行う場合には検定のサイズ がおかしくなる可能性が高い。この問題については、Guggenberger (2010)を参照のこと。

(7)

5.4 動学パネルデータモデル

非説明変数のラグが回帰変数に入ったモデルは、動学パネルデータモデルと呼ばれる。この モデルは、時系列が十分に長くないかぎり、固定効果推定できず、操作変数推定することに なる。次のような、動学モデルを考える。

yit = γ0yi,t−1+ αi+ ϵit (34)

このモデルでは、αiとyi,t−1の相関は避け得ないものとなっているので、固定効果モデルで ある。

しかし、固定効果推定の条件の一つ、E(ϵi|Xi) = 0は満たされていない。Xiには、yit

も含まれることになるが、これは、ϵitと相関しているためである。実際、固定効果変換を 施すと、

yit− ¯yi= γ0(yi,t−1− ¯yi,−1) + ϵit− ¯ϵi (35) (ただし、y¯i =t=2T yit/(T − 1)かつy¯i,−1 =T −1t=1 yit/(T − 1)かつ¯ϵi =Tt=2ϵit/(T − 1)

である)となる。yi,t−1− ¯yiとϵit− ¯ϵiは相関している。

そのため、推定には、固定効果推定量は使えず、操作変数推定を行うことになる。しか し、動学パネルデータモデルの操作変数推定は、この講義では取り扱わない。

References

[1] P. Guggenberger. The impact of a hausman pretest on the size of a hypothesis test: The panel data case. Journal of Econometrics, 156:337–343, 2010.

参照

関連したドキュメント

Let X be a smooth projective variety defined over an algebraically closed field k of positive characteristic.. By our assumption the image of f contains

Keywords and Phrases: moduli of vector bundles on curves, modular compactification, general linear

She reviews the status of a number of interrelated problems on diameters of graphs, including: (i) degree/diameter problem, (ii) order/degree problem, (iii) given n, D, D 0 ,

Reynolds, “Sharp conditions for boundedness in linear discrete Volterra equations,” Journal of Difference Equations and Applications, vol.. Kolmanovskii, “Asymptotic properties of

It turns out that the symbol which is defined in a probabilistic way coincides with the analytic (in the sense of pseudo-differential operators) symbol for the class of Feller

We give a Dehn–Nielsen type theorem for the homology cobordism group of homol- ogy cylinders by considering its action on the acyclic closure, which was defined by Levine in [12]

Applying the representation theory of the supergroupGL(m | n) and the supergroup analogue of Schur-Weyl Duality it becomes straightforward to calculate the combinatorial effect

Our method of proof can also be used to recover the rational homotopy of L K(2) S 0 as well as the chromatic splitting conjecture at primes p > 3 [16]; we only need to use the