ファクターモデルの近年の研究展望
奥井 亮
京都大学経済研究所 平成24年3月5日改訂版
このスライドについて
• このスライドは、平成25年3月に日本統計学会春季集会(学習院大学)での講 演で使用したスライドを改訂したものです。学会参加者の皆様、また赤司健太 郎先生にはお世話になりました。記して感謝します。
• スライドの使用は自由ですし、適宜、修正して自分用のスライドに作りかえて いただいて、かまいませんが、私は、一切の責任をおいません。
• このスライドは、今後とも私のホームページ http://www.kier.kyoto-u.ac.jp/~okui/
に掲載を続ける予定です。また、参考文献の一覧も別ファイルとしてホームペー ジに掲載しています。
はじめに
• 近年のファクターモデルに関する計量経済学での研究成果を紹介させていただ きます。
• 証明などは追わず、研究成果の概観と、基本的な考え方を中心に紹介します。 従いまして、より詳しい理論や計算方法などは、参考文献にあげました論文な どで調べていただければと思います。
設定
データとして、{yit}, i = 1, . . . , N , t = 1, . . . , T を観測するとします。各観測 値yitはスカラーとします。
• N もT も大きいと押します。
• 横断面も時系列も長いパネルデータが利用可能な場合や、
(例えば、多くの企業を長期にわたって観測したデータなどが該当します。)
• 多くの変数についての、多くの観測値が得られる場合、を想定しています。
ファクターモデル
yitが次のように、少ない数のファクターによって、その分布の重要な部分が記述 できるとします。
yit = λ′iFt + wit (1)
• λiとFtの次元はrとし、rは小さいとします。
• Ftはファクター、
• λiはファクターローディングと呼びます。
ファクターモデルの背景
• ファクター構造は、これまでも、因子分析や主成分分析といった手法で、多く の分野で使用されてきました。
• 近年では、経済学でのファクターモデルの応用が進み、それに並行する形で計 量経済学での理論的研究も進んできました。
• 計量経済学の研究によって、N とT が両者とも大きい漸近理論の構築や、ラン ダム行列理論の応用をすることで、主成分分析法などの統計理論的な性質など が明らかになってきています。
ファクターモデルの経済学における位置づけ
• ある一つの経済指標を表すのに多くの変数が利用可能な場合、小さい次元のベ クトルであるFtを推定し、それを目的とする経済指標として使用するという ことが考えられます。
–例えば、実体経済の状況を表すのに、失業率や資本稼働率などの多く変数を yitとして観測する場合などです。
–これは、ファクターによる次元圧縮法であり、他の分野でも使われているも のです。
• パネルデータ分析における、個人の異質性や時点ごとのマクロ経済状態が結果 に影響を与えないように制御する方法として使われています。
ファクターの経済学における使用例
Stock and Watson (1999)においては、インフレ率の予測をするために、ファ クターを使用した、著名な論文です。
• インフレ率の予測には実体経済の状況を使用することが効果的であると知られ ています。(フィリップス曲線という。因果関係は諸説様々でわかっていない。)
• しかし、実体経済の状況を表す経済変数は非常に多くの候補があり、どれが良 い変数なのか自明ではありません。
• そこで、多くの経済変数にファクター構造を仮定し、ファクターを推定して、 そのファクターをインフレ予測に使用することで、より精度の高いインフレ予 測を行えることを示しました。
ファクターの推定
まず、
yit = λ′iFt + wit (2) というモデルを考え、ファクターとファクターローディングを推定する方法を紹介 します。
おそらく最もよく使われている推定法は、Stock and Watson (2002)による、 主成分分析による方法です。Y をyitを並べたT × N の行列とします。λiとFt の 次元をrとし、それらを並べた行列としてΛとF を定義します。ΛはN × rでF は T × rの行列です。
主成分分析法
• ˜F をY Y ′の固有値が大きいものからrまでの固有ベクトルとします。
• ˜Λ = ˜F′Y /T とします。
• これは、
N
∑
i=1 T
∑
t=1
(yit − λ′iFt)2 (3) をF′F/T = I という標準化の下で、ΛとF について最小した解と同じになり ます。
漸近理論
• 漸近理論は、N とT の両者が無限に行く、2重漸近分析を使用します。
• Stock and Watson (2002) は、一致性を証明しました。
• 漸近分布はBai (2003)によって導出されています。
• 漸近理論は、witに弱い相関を、時系列方向にも横断面方向にも許容していま す。
漸近理論の難しい点
• 2重漸近分析を使用するため、漸近理論の適用に注意が必要です。
• 推定する母数は、Ftやλiであり、無限次元の母数のある一部になっています。 極値推定量の議論は、そのまま使えません。証明は、推定量の式を具体的に評 価して行い、また母数の標準化の仕方が重要になっています。
• さらに、相関構造を時系列方向にも横断面方向にも許容しているため、やはり 漸近理論の適用に注意が必要になります。
識別問題
• 追加的な条件なしでは、ΛとF は識別不能です。これは、Y = F Λ′ + wとい うモデルのため、任意の正則行列AをとってF∗ = F AかつΛ∗ = ΛA−1と しても観測上同値なモデルが得られるためです。
• 良く使われる識別条件は、F′F/T = I かつΛ′Λが対角行列というものです。 この条件は、主成分分析による推定と整合的です。
• 他にもさまざまな識別条件を考えることができます。それらは、Bai and Ng (2011)で議論されています。
ファクターの数の選び方
推定にあたっては、ファクターの数rを決める必要があります。
• Bai and Ng (2002)はファクターの数を選ぶための情報量基準を提唱しま した。今のところ、この方法が最もよく使われているのではないでしょうか。
• Onatski (2010)と、Ahn and Horenstein (2012)は、データ行列の固有 値の分布に基づく方法を開発しました。
ファクターの数に関する情報量基準
Bai and Ng (2002)による、情報量基準は、 P C(k) = min
λi,Ft
1 N T
N
∑
i=1 T
∑
t=1
(yit − λ′iFt)2 + kg(N, T ) (4) あるいは、第一項に対数を取ったものです。P C(k)を最小化するようにファクター の数を選びます。
• g(N, T )はペナルティー関数で、var(wit)N + T N T ln
(N + T
N T
)などが、使え ます。なお通常のAICやBICとは異なることに注意してください。
• 少し計算すると、実は、この情報量基準による選び方は、Y ′Y (Y はyitを要素
ファクターの数を固有値に基づいて選ぶ方法
直接、Y ′Y /(N T )の固有値を計算して、そのうち巨大と言えるものの数をファク ターの数として選ぶ方法も開発されてきました。固有値を大きい方から順にµ1, µ2, . . . とします。
• Onatski (2010)は固有値の差µk − µk+1を基にrを選ぶ方法を開発しまし た。具体的には、r = max{k ≤ kmax, µk − µk+1 > δ} (δ の決め方は論文 を参照)としてファクターの数を選びます。
• Ahn and Horenstein (2012)は差でなく、比を使うことを提唱しました。 つまり、r = arg maxk(µk/µk+1)としてファクターの数を選びます。
有効な推定量
• witがi方向にもt方向にもi.i.d.である場合のみ、主成分分析推定量は、有効 になります。
• それ以外の場合では、Breitung and Tenhofen (2011)、Choi (2012)や Bai and Li (2012)などにより、主成分分析法よりも、有効な推定量が提唱 されています。基本的な考え方は、主成分分析法はOLSのようにかけるので、 効率性をあげるためにはGLSのような推定をすれば良いということです。
• Iwakura and Okui (2012)では、ファクターの有効性限界を導出し、それ らの推定量が有効になる条件を導いています。
動学ファクターモデル
ファクターのラグが入るモデルも、計量経済学の応用上は、重要であると考えられ ます。つまり、
yit =
p
∑
s=0
λ(s)′i Ft−s + wit (5) と言ったモデルです。こうしたモデルでは、周波数領域での分析が有用になります。
• 推定法は、Forni, Hallin, Lippi and Reichlin (2000)などがあります。
• ファクターの数の決め方は、Hallin and Liska (2007)やOnatski (2009) などがあります。
昔のファクターモデル
• ファクターモデルやそれに類するモデルは、ここで紹介した方法が開発される より以前にも、経済学でこれまでも多く使用されてきました。
• しかし、昔のファクターモデルでは、N が小さいモデルを考え、Ftの動学構造 を仮定するものが主流でした。
• その場合の推定は、モデルを状態空間モデルに書いてKalman filterを適用 するものが主流でした。
パネルデータ分析におけるファクター構造の利用法
パネルデータとして、(yit, xit)が観測できるとします。我々が、興味があるのは、 xitのyitに与える影響であるとします。
yitとxitは
yit = x′itβ + λ′iFt + wit (6) という関係があるとモデル化します。
では、なぜ、このようなモデルが有用なのでしょうか。
パネルデータモデルの有用性
なぜファクターモデルが有用なのかをみるために、まず、教科書的なパネルデータ の有用性の議論から見ていきましょう。
パネルデータは、観測できないが説明変数と相関のある変数が、ある構造をもって いる場合、その変数を観測することなしに、欠落変数のバイアスを避けることがで きるのが、重要な利点です。
個人効果の入ったモデル
例えば、そのような観測できない変数が時間を通して一定であれば、固定効果モ デル
yit = x′itβ + µi + wit (7) としてモデル化します。そして、y˙it = yit − ¯yiなどと変数変換をすると、
y˙it = ˙x′itβ + ˙wit (8) としµiを消すことができるので、µiを観測できないことから来る欠落変数のバイ アスを避けることができます。
個人効果と時間効果
さらに、欠落変数のうち、各個人への影響は同じだが、時間とともに変化するもの があれば、時間効果としてηtを
yit = x′itβ + µi + ηt + wit (9) のように、モデルに加えます。推定においては、y¨it = yit − ¯yi − ¯yt + ¯yというよ うに変換をすると、
y¨it = ¨x′itβ + ¨wit (10) となり、µiもηtも消え、欠落変数のバイアスを避けることができます。
ファクターモデルの有用性
• ファクターモデルは、
yit = x′itβ + λ′iFt + wit (11) ですので、個人効果や時間効果を入れたモデルのさらなる一般化であり、かな り広い範囲のバイアスをもたらすような欠落変数の影響を取り除くのに有用で あると考えられます。
• また、横断面での相関や自己相関を表現するモデルとしても有用です。
• また、問題によっては、ファクターの値自体に興味があるが、xitの影響を取 り除いておきたい場合もあります。
回帰モデルへの応用
ファクター構造をもつ回帰モデルの推定へ主成分分析を応用することができます。 初めに紹介した
yit = x′itβ + λ′iFt + wit (12) というモデルを考えます。
Bai (2009)が推定法を提唱しています。方法は、
N
∑
i=1 T
∑
t=1
(yit − x′itβ − λ′iFt)2 (13) をβとΛ、それにF について最小化することで行います。
推定法に関する注意
• 実際の推定は数値計算上のトリックが必要となります。Bai (2009)を参照し て下さい。
• また推定量は、漸近的にバイアスがでることがありますので、バイアス修正推 定量を考えたほうがよいでしょう。
動学パネルデータモデル
Bai (2009)はxitが強外生であると仮定しています。つまり、xitとwitはどの時 点の組でみても相関していないということです。この仮定が成り立たない状況も経 済学の応用上は重要になります。
先決変数(xit と過去のwitとは相関している場合、yi,t−1などがxitに含まれる場 合など)の場合も取り扱ったものとして、Moon and Weidner (2010)があり ます。
• バイアスの項が変わり、バイアス修正推定量も違ったものを使用する必要があ ります。
• witの自己共分散構造の推定を扱ったものとして、Okui (2013)があります。
他の推定法
• Pesaran (2006)は、モデルに(¯yt, ¯xt)を追加的な回帰変数として入れ、 yit = x′itβ + ¯ytρ + ¯x′tη + vit (14) というモデルを推定することで、ファクターの影響を取り除ける場合があるこ とを示しました。必要となる条件は強いですが、簡便な方法であるため、実用 上非常に便利です。
• Sarafidis and Yamagata (2010)はファクターを推定し、M = I−F (F′F )F−1 という行列をかけてファクターとの相関をなくした操作変数を用いた操作変数
推定量を提唱しました。
時系列が短い場合
時系列が短い場合には、ある種の変換を行うことで、モデルからλiを消し去り、β の推定を行うことが可能になります。
Ftはモデルに残りますが、T が小さいとFtを母数として推定することはそれほど 難しくありません。
ただし、変換がFt に依存しているため、T が大きい状況に適用するのは注意が必 要かもしれません。
• 文献としては、Hotz-Eakin, Newey and Rosen (1988)、Ahn, Lee and Schmidt (2010)やHayakawa (2012)などがあります。
ファクターモデルのまとめ
• ファクターモデルは、多くの変数の情報を、少ない変数でまとめることができ るため、色々な実証研究で有用でしょう。
• また、ファクターモデルは、欠落変数のバイアスをパネルデータによって回避 するのに有用なモデルです。
• また推定法は、主成分分析など、簡便な方法も多く提唱されており、十分に実 用に耐えるものです。
• 近年は計量経済学の分野で理論研究が進み、統計理論の面からみても新しく面 白い問題が多く、これからも発展の期待される分野です。