pdf 教育 OKUI, Ryo

(1)

ファクターモデルの近年の研究展望

奥井亮

京都大学経済研究所平成²⁴年³月⁵日改訂版

(2)

このスライドについて

• _{このスライドは、平成}25_年3月に日本統計学会春季集会⁽学習院大学⁾での講演で使用したスライドを改訂したものです。学会参加者の皆様、また赤司健太郎先生にはお世話になりました。記して感謝します。

• スライドの使用は自由ですし、適宜、修正して自分用のスライドに作りかえていただいて、かまいませんが、私は、一切の責任をおいません。

• このスライドは、今後とも私のホームページ http://www.kier.kyoto-u.ac.jp/~okui/

に掲載を続ける予定です。また、参考文献の一覧も別ファイルとしてホームページに掲載しています。

(3)

はじめに

• 近年のファクターモデルに関する計量経済学での研究成果を紹介させていただきます。

• 証明などは追わず、研究成果の概観と、基本的な考え方を中心に紹介します。従いまして、より詳しい理論や計算方法などは、参考文献にあげました論文などで調べていただければと思います。

(4)

設定

データとして、^{y_it}, i = 1, . . . , N , t = 1, . . . , T を観測するとします。各観測値^y_itはスカラーとします。

• N _もT _{も大きいと押します。}

• 横断面も時系列も長いパネルデータが利用可能な場合や、

(例えば、多くの企業を長期にわたって観測したデータなどが該当します。⁾

• 多くの変数についての、多くの観測値が得られる場合、を想定しています。

(5)

ファクターモデル

y_itが次のように、少ない数のファクターによって、その分布の重要な部分が記述できるとします。

y_it = λ^′_iF_t + w_it (1)

• λ_iとF_tの次元はrとし、rは小さいとします。

• F_tはファクター、

• λ_iはファクターローディングと呼びます。

(6)

ファクターモデルの背景

• ファクター構造は、これまでも、因子分析や主成分分析といった手法で、多くの分野で使用されてきました。

• 近年では、経済学でのファクターモデルの応用が進み、それに並行する形で計量経済学での理論的研究も進んできました。

• 計量経済学の研究によって、N とT が両者とも大きい漸近理論の構築や、ランダム行列理論の応用をすることで、主成分分析法などの統計理論的な性質などが明らかになってきています。

(7)

ファクターモデルの経済学における位置づけ

• ある一つの経済指標を表すのに多くの変数が利用可能な場合、小さい次元のベクトルであるF_tを推定し、それを目的とする経済指標として使用するということが考えられます。

–例えば、実体経済の状況を表すのに、失業率や資本稼働率などの多く変数を y_itとして観測する場合などです。

–これは、ファクターによる次元圧縮法であり、他の分野でも使われているものです。

• パネルデータ分析における、個人の異質性や時点ごとのマクロ経済状態が結果に影響を与えないように制御する方法として使われています。

(8)

ファクターの経済学における使用例

Stock and Watson (1999)においては、インフレ率の予測をするために、ファクターを使用した、著名な論文です。

• インフレ率の予測には実体経済の状況を使用することが効果的であると知られています。⁽フィリップス曲線という。因果関係は諸説様々でわかっていない。⁾

• しかし、実体経済の状況を表す経済変数は非常に多くの候補があり、どれが良い変数なのか自明ではありません。

• そこで、多くの経済変数にファクター構造を仮定し、ファクターを推定して、そのファクターをインフレ予測に使用することで、より精度の高いインフレ予測を行えることを示しました。

(9)

ファクターの推定

まず、

y_it = λ^′_iF_t + w_it (2) というモデルを考え、ファクターとファクターローディングを推定する方法を紹介します。

おそらく最もよく使われている推定法は、Stock and Watson (2002)_による、主成分分析による方法です。Y をy_itを並べたT × N の行列とします。λ_iとF_t の次元をrとし、それらを並べた行列として^ΛとF を定義します。^ΛはN × rでF は T × rの行列です。

(10)

主成分分析法

• ˜F をY Y ^′の固有値が大きいものからrまでの固有ベクトルとします。

• ˜Λ = ˜F^′Y /T _{とします。}

• これは、

N

∑

i=1 T

∑

t=1

(y_it − λ^′_iF_t⁾² ⁽³⁾ を^F^′^{F/T = I} という標準化の下で、^Λと^F について最小した解と同じになります。

(11)

漸近理論

• 漸近理論は、N とT の両者が無限に行く、²重漸近分析を使用します。

• Stock and Watson (2002) は、一致性を証明しました。

• 漸近分布は^{Bai (2003)}によって導出されています。

• 漸近理論は、w_itに弱い相関を、時系列方向にも横断面方向にも許容しています。

(12)

漸近理論の難しい点

• 2重漸近分析を使用するため、漸近理論の適用に注意が必要です。

• _{推定する母数は、}F_t_やλ_iであり、無限次元の母数のある一部になっています。極値推定量の議論は、そのまま使えません。証明は、推定量の式を具体的に評価して行い、また母数の標準化の仕方が重要になっています。

• さらに、相関構造を時系列方向にも横断面方向にも許容しているため、やはり漸近理論の適用に注意が必要になります。

(13)

識別問題

• 追加的な条件なしでは、^Λと^F は識別不能です。これは、^{Y = F Λ}^′ ^{+ w}というモデルのため、任意の正則行列AをとってF^∗ = F Aかつ^Λ^∗ = ΛA⁻¹としても観測上同値なモデルが得られるためです。

• 良く使われる識別条件は、F^′F/T = I かつ^Λ^′^Λが対角行列というものです。この条件は、主成分分析による推定と整合的です。

• 他にもさまざまな識別条件を考えることができます。それらは、^{Bai and Ng} (2011)_{で議論されています。}

(14)

ファクターの数の選び方

推定にあたっては、ファクターの数rを決める必要があります。

• Bai and Ng (2002)はファクターの数を選ぶための情報量基準を提唱しました。今のところ、この方法が最もよく使われているのではないでしょうか。

• Onatski (2010)と、Ahn and Horenstein (2012)_{は、データ行列の固有} 値の分布に基づく方法を開発しました。

(15)

ファクターの数に関する情報量基準

Bai and Ng (2002)による、情報量基準は、 P C(k) = min

λ_i,F_t

1 N T

N

∑

i=1 T

∑

t=1

(y_it − λ^′_iF_t)² + kg(N, T ) (4) あるいは、第一項に対数を取ったものです。P C(k)を最小化するようにファクターの数を選びます。

• g(N, T )はペナルティー関数で、var(w_it)^{N + T} N T ^ln

(_{N + T}

N T

)などが、使えます。なお通常の^AICや^BICとは異なることに注意してください。

• 少し計算すると、実は、この情報量基準による選び方は、^Y ^′^{Y (Y} は^y_itを要素

(16)

ファクターの数を固有値に基づいて選ぶ方法

直接、Y ^′Y /(N T )の固有値を計算して、そのうち巨大と言えるものの数をファクターの数として選ぶ方法も開発されてきました。固有値を大きい方から順にµ₁, µ₂, . . . とします。

• Onatski (2010)は固有値の差µ_k − µ_k+1を基にrを選ぶ方法を開発しました。具体的には、r = max{k ≤ kmax, µ_k − µ_k+1 > δ} (δ _{の決め方は論文} を参照⁾としてファクターの数を選びます。

• Ahn and Horenstein (2012)は差でなく、比を使うことを提唱しました。つまり、r = arg max_k(µ_k/µ_k+1)としてファクターの数を選びます。

(17)

有効な推定量

• w_itがi方向にもt方向にも^i.i.d.である場合のみ、主成分分析推定量は、有効になります。

• それ以外の場合では、Breitung and Tenhofen (2011)_、Choi (2012)_や Bai and Li (2012)などにより、主成分分析法よりも、有効な推定量が提唱されています。基本的な考え方は、主成分分析法は^OLSのようにかけるので、効率性をあげるためには^GLSのような推定をすれば良いということです。

• Iwakura and Okui (2012)では、ファクターの有効性限界を導出し、それらの推定量が有効になる条件を導いています。

(18)

動学ファクターモデル

ファクターのラグが入るモデルも、計量経済学の応用上は、重要であると考えられます。つまり、

y_it ⁼

p

∑

s=0

λ^(s)′_i F_t−s + w_it (5) と言ったモデルです。こうしたモデルでは、周波数領域での分析が有用になります。

• 推定法は、Forni, Hallin, Lippi and Reichlin (2000)_{などがあります。}

• ファクターの数の決め方は、Hallin and Liska (2007)_やOnatski (2009) などがあります。

(19)

昔のファクターモデル

• ファクターモデルやそれに類するモデルは、ここで紹介した方法が開発されるより以前にも、経済学でこれまでも多く使用されてきました。

• しかし、昔のファクターモデルでは、N が小さいモデルを考え、F_tの動学構造を仮定するものが主流でした。

• その場合の推定は、モデルを状態空間モデルに書いてKalman filter_を適用するものが主流でした。

(20)

パネルデータ分析におけるファクター構造の利用法

パネルデータとして、(y_it, x_it)が観測できるとします。我々が、興味があるのは、 x_itのy_itに与える影響であるとします。

y_itとx_itは

y_it = x^′_itβ + λ^′_iF_t + w_it (6) という関係があるとモデル化します。

では、なぜ、このようなモデルが有用なのでしょうか。

(21)

パネルデータモデルの有用性

なぜファクターモデルが有用なのかをみるために、まず、教科書的なパネルデータの有用性の議論から見ていきましょう。

パネルデータは、観測できないが説明変数と相関のある変数が、ある構造をもっている場合、その変数を観測することなしに、欠落変数のバイアスを避けることができるのが、重要な利点です。

(22)

個人効果の入ったモデル

例えば、そのような観測できない変数が時間を通して一定であれば、固定効果モデル

y_it = x^′_itβ + µ_i + w_it (7) としてモデル化します。そして、y^˙_it = y_it − ¯y_iなどと変数変換をすると、

y˙_it = ˙x^′_itβ + ˙w_it (8) としµ_iを消すことができるので、µ_iを観測できないことから来る欠落変数のバイアスを避けることができます。

(23)

個人効果と時間効果

さらに、欠落変数のうち、各個人への影響は同じだが、時間とともに変化するものがあれば、時間効果としてη_tを

y_it = x^′_itβ + µ_i + η_t + w_it (9) のように、モデルに加えます。推定においては、y^¨_it = y_it − ¯y_i − ¯y_t + ¯yというように変換をすると、

y¨_it = ¨x^′_itβ + ¨w_it (10) となり、µ_iもη_tも消え、欠落変数のバイアスを避けることができます。

(24)

ファクターモデルの有用性

• ファクターモデルは、

y_it = x^′_itβ + λ^′_iF_t + w_it (11) ですので、個人効果や時間効果を入れたモデルのさらなる一般化であり、かなり広い範囲のバイアスをもたらすような欠落変数の影響を取り除くのに有用であると考えられます。

• また、横断面での相関や自己相関を表現するモデルとしても有用です。

• また、問題によっては、ファクターの値自体に興味があるが、x_itの影響を取り除いておきたい場合もあります。

(25)

回帰モデルへの応用

ファクター構造をもつ回帰モデルの推定へ主成分分析を応用することができます。初めに紹介した

y_it = x^′_itβ + λ^′_iF_t + w_it (12) というモデルを考えます。

Bai (2009)が推定法を提唱しています。方法は、

N

∑

i=1 T

∑

t=1

(y_it − x^′_itβ − λ^′_iF_t)² (13) をβと^Λ、それにF について最小化することで行います。

(26)

推定法に関する注意

• 実際の推定は数値計算上のトリックが必要となります。^{Bai (2009)}を参照して下さい。

• また推定量は、漸近的にバイアスがでることがありますので、バイアス修正推定量を考えたほうがよいでしょう。

(27)

動学パネルデータモデル

Bai (2009)_はx_itが強外生であると仮定しています。つまり、x_itとw_itはどの時点の組でみても相関していないということです。この仮定が成り立たない状況も経済学の応用上は重要になります。

先決変数^(x_it と過去のw_itとは相関している場合、y_i,t−1などがx_itに含まれる場合など⁾の場合も取り扱ったものとして、Moon and Weidner (2010)_があります。

• バイアスの項が変わり、バイアス修正推定量も違ったものを使用する必要があります。

• w_itの自己共分散構造の推定を扱ったものとして、Okui (2013)_{があります。}

(28)

他の推定法

• Pesaran (2006)_{は、モデルに}(¯y_t, ¯x_t)を追加的な回帰変数として入れ、 y_it = x^′_itβ + ¯y_tρ + ¯x^′_tη + v_it ⁽¹⁴⁾ というモデルを推定することで、ファクターの影響を取り除ける場合があることを示しました。必要となる条件は強いですが、簡便な方法であるため、実用上非常に便利です。

• Sarafidis and Yamagata (2010)はファクターを推定し、M = I−F (F^′F )F⁻¹ という行列をかけてファクターとの相関をなくした操作変数を用いた操作変数

推定量を提唱しました。

(29)

時系列が短い場合

時系列が短い場合には、ある種の変換を行うことで、モデルから^λ_iを消し去り、^β の推定を行うことが可能になります。

F_tはモデルに残りますが、T が小さいとF_tを母数として推定することはそれほど難しくありません。

ただし、変換がF_t に依存しているため、T が大きい状況に適用するのは注意が必要かもしれません。

• 文献としては、Hotz-Eakin, Newey and Rosen (1988)_、Ahn, Lee and Schmidt (2010)_やHayakawa (2012)_{などがあります。}

(30)

ファクターモデルのまとめ

• ファクターモデルは、多くの変数の情報を、少ない変数でまとめることができるため、色々な実証研究で有用でしょう。

• また、ファクターモデルは、欠落変数のバイアスをパネルデータによって回避するのに有用なモデルです。

• また推定法は、主成分分析など、簡便な方法も多く提唱されており、十分に実用に耐えるものです。

• 近年は計量経済学の分野で理論研究が進み、統計理論の面からみても新しく面白い問題が多く、これからも発展の期待される分野です。