計量経済分析特論 実際的課題
¿
推定にまつわる実際的課題
¿º½
制約付推定
係数間に何らかの線形的な関係がある場合を考えて見ましょう。関数の関係は
Ê
で示されるものとします。なお、
Êは係数間の関係を示す行列、
はその関係の値
を示す実数ベクトルとしましょう。この推定方法はそのままでは難しいので、最
小二乗法に立ち返って、
¼
Ê
を考えて見ましょう。この問題はラグランジュ関数で考えて、
¼
¼
Ê
にして見ます。最適解の一階条件より、
¼
Ê
¼
¸
¼
Ê
¼
¼
Ê
¸Ê
が得られます。逆行列をとって解を求めることもできませんので、一般的な扱い
の中で議論できる分割行列を作って計算してみましょう。分割行列が
¼
Ê
¼
Ê
¼
になりますから、
¼
が非特異
逆行列がある として、その逆行列の公式で計算
して、解を求めると、
¼
¼
¼
¼
℄
¼
¼
℄
となります。
期待値は
¼
¼
¼
¼
℄
£
¼
¼
¼
¼
℄
£
£
計量経済分析特論 実際的課題
となって問題ありません。
仮説検定等に使う分散は
が非確率的なので、
£
¼
½
¼
¼
½
¼
℄ ½
£
¡
£
¼
½
¼
¼
½
¼
℄ ½
£
¼
¾
¼
½
¾
¼
½
¼
¼
½
¼
℄ ½
¼
½
と求めることができます。
¿º¾
変数の数の多少とその影響
変数が少なすぎたり、多すぎたりしたら何が起きるでしょうか。それを見てみ
ることにします。
¿º¾º½
真のモデルが正しくモデル化されている場合の特性
まず、説明変数を
½
½
¾
¾
½
¾
½
¾
のように分割します。推定量は
¼
½
¼
½
¾
¼
½
½
¼
½
¾
¼
¾
½
¼
¾
¾
½
½
¾
となります。このまま力技でブロック行列を解く方法もありますが、
½
¾
¼
½
½
¼
½
¾
¼
¾
½
¼
¾
¾
½
¾
として、代数的にといてしまうのが楽そうです。
½
¼
½
½
½
¼
½
¼
½
½
½
¼
½
¾
¾
¼
½
½
½
¼
½
¾
¾
計量経済分析特論 実際的課題
この式を見ると、
½
の推定にあたって、
が
¾
¾
となって、他の変数部分の
修正されていることがわかります
½
。同時に、
¾
は
¾
¼
¾
¾
½
¼
¾
¼
¾
¾
½
¼
¾
½
½
¼
¾
¾
½
¼
¾
½
½
になります。
式および
式を見ると、
¼
½
¾
¼
¾
½
であれば、分
割された変数の影響はないことがわかります。
½
についてとけば、
½
¼
½
½
½
¼
½
¼
½
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
½
¼
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
となります。そして、右辺をよく見ると、
右辺
¼
½
¾
¼
¾
¾
½
¼
¾
½
£
½
¾
£
¾
£
¼
½
¾
¼
¾
¾
½
¼
¾
½
£
½
£
¼
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
£
½
¼
½
¾
¼
¾
¾
½
¼
¾
£
ですから、これを使って計算を進めて、
½
£
½
¼
½
¾
¼
¾
¾
½
¼
¾
℄
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
¢
½
と置く
£
£
½
#
½
£
とわかります。
¾
も同様に計算可能です。不偏性については
½
£
½
#
½
£
£
½
#
½
£
£
½
で確認できます。
式をもう少し進めて考えると、
¼
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
¼
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
¼
½
¾
¼
¾
¾
½
¼
¾
℄
½
½
¼
½
¾
¼
¾
¾
½
¼
¾
¼
½
¾
½
½
¼
½
¾
と書くことができます。なお、
¾
¾
¼
¾
¾
½
¼
¾
はべき等行列であること
がわかります。
½
修正というのも を
¾で回帰した残差になっています。これは
定理と呼ばれ
ます。また、
¾の要因を取り除いて推定するということで純化するともいいます。この詳しい構
造は
節で学びます。
計量経済分析特論 実際的課題
¿º¾º¾
真のモデルよりも変数が少なかったら
上記のモデルが真のモデルにもかかわらず、変数を少なくした
½ ½
を推定していたらどうなっていたでしょう。過少な場合の推定量は
½
¼
½
½
½
¼
½
となります。ちなみに、真のモデルは
½
£
½
¾
£
¾
£
です。推定していた場合の推定量を
½
とおけば、その推定量は
式と同じ
です。そのときの正しく推定された場合と過少に推定された場合の推定量の差は
½
½
¼
½
½
½
¼
½
¾
¾
¼
½
½
½
¼
½
¼
½
½
½
¼
½
¾
¾
になります。
式の類推から
¾
を考えて代入すれば、その期待値は
½
½
¼
½
½
½
¼
½
¾
£
¾
#
¾
£
¼
½
½
½
¼
½
¾
£
¾
となって、差があることが確認できます。したがって、変数が不足した場合、その
他の推定にも悪い影響を与えていることがわかります
¾ ¿
。
¿º¾º¿
真のモデルから見て変数が過大な場合
真のモデルから見て、余分な変数を入れてしまっていた場合はどうなるのでしょ
うか。誤ったモデルは
½
½
¾
¾
として、真のモデルは
£
¾
となる
½
£
½
£
¾
一致性は
¼
½
½
½
¼
½
¾
£
¾
¼
½
½
½
¼
½
¾
£
¾
であり、十分
が大きい場合に
¼
½
½
がある行列に収束するという通常の条件に加え、
¼
½
¾
が
に収束すれば一致性がい
えます。しかし、
¼
½
¾
が
に収束する
つまり
½
と
¾
が直行関係にある
ことは滅多にな
いといえるでしょう。
¿
ただ、この事実が示すことは、説明変数間の相関が
もっと強くいえば独立
であると保証で
きれば、その説明変数は誤差項と見なして推定しても、推定には問題ないことになります。この考
え方は説明変数を誤差項扱いできるので、後の分析に利用されます。
計量経済分析特論 実際的課題
としたとき、その影響を見て見ましょう。余分な変数を入れて推定した推定量に
式を代入して、再び
式の類推を用いると、
#
#
で
あることに注意して、
#
℄
#
となり、不偏性を維持できても、誤差項の影響がいくらかありそうです
。
¿º¿
偏相関係数と多重共線性
¿º¿º½
回帰係数の構造と偏相関係数
つのグループに分けた際の推定量は
です。これは
にあるように、
で説明される変動
を取り除く形で
得たものです。ところで詳しく見るために、
を消して、
℄
℄
のように演算すると、
℄
℄
℄
なお、効率生と一致性は
¼
¼
¼
¼
℄
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
℄
¼
で、効率性は
¼
¼
¼
¼
分悪化し、
¼
が
で、ある
行列に収束すれば満たされることになります。
計量経済分析特論 実際的課題
が得られます。ところで、行列を注意深く見ると、グループ分けした説明変数間の
回帰係数として、
¼
¼
¼
¼
や、グループ分け
した説明変数
と被説明変数
の回帰係数
¼
¼
が得られるので、
¼
¼
℄
¼
½
を
¾で回帰した際の残差行列
¼
℄
を
¾
で回帰した際の残差ベクトル
¼
¼
℄
のように得られます
。これを見れば、各回帰係数にそれぞれの変数間の推定が行
われる部分があることがわかります。
¿º¿º¾
多重共線性
ところで、説明変数間の回帰係数が得られるということは、説明変数間の相関
が高い場合に起きる現象である多重共線性についても見ておくことがよいと思い
ます。多重共線性は分析の実際上避けられない部分があります。それらを理解で
きればいいと思います。
まず、最初の確認として、古典的仮定の元で、正しいモデルで正しく推定され
た場合の回帰係数の分布は
¼
です。特に、ある変数
にかかる分布は
¼
です。したがって、推定量の分散
¼
を見てみましょう
。まずは、
¼
¼
¼
¼
¼
¼
¼
と考えて見ましょう。すると、分割行列の逆行列から、
¼
¼
¼
¼
¼
¼
¼
¼
℄
式から、
¼
¼
¼
¼
¼
で、説明変数の集
まりである行列
を
で回帰したときの残差ベクトルの集まりがそれぞれ一次独立であること
仮定することは無理がなく、そうすれば
は列フルランクとなり、転置行列との積は列ラン
クです。したがって、逆行列を計算できることがいえます。
当然のことながら、多重共線性が不偏性に影響を与えることはありません。
計量経済分析特論 実際的課題
です。ところで、
¼
を思い出せば、
¼
¼
¼
¼
¼
¼
¼
¼
¼
が得られます。そこで、今回は説明変数同士の回帰だったことに気をつけて、
¼
℄
℄
¼
℄
¼
を得ます。ここまでくれば、データ行列に定数項が含まれる場合に限って、被説
明変数
の全変動
を利用することで、
¼
¼
¼
¼
となります。ここでの決定係数
はとある説明変数
とその他の説明変数の回帰
による決定係数です。このとき、もし、とある説明変数
がその他の説明変数に
ほとんど説明されてしまう、すなわち説明変数
がたの説明変数の線形結合でほ
とんど示せてしまう場合にはどうなってしまうでしょう。
このとき、
¾
となり、求めていたのが、
¼
の分散だったということを考えると、
¼
となってしまうことになることがわかります。したがって、モデル上必要な変数
であっても、説明変数が他の変数ときわめて高い相関があるならば、結果的に分
散が大きい
いろいろな値がでやすい 不安定な推定になってしまいます。
¿º¿º¿
多重共線性の問題
多重共線性は、説明変数間の相関という意味で、推定上避けられないものです。
しかしその程度が強すぎると、
係数の分散が拡大する
係数の推定が不安定
誤差に大きく影響されやすくなる
符号条件が合わない
計量経済分析特論 実際的課題
$
理論的に想定される値からかけ離れた結果になる
データの標本追加で推定値が大きく変わる
"
決定係数が高いのに個別の係数の標準誤差が高くなってしまうことで、
検定等で帰無仮説を棄却しにくくなってしまう
説明変数の変更で結果が可変的となり、精度が突然変化する
という大変苦しい問題がでてきてしまいます。
多重共線性への対処
しかし、この変数をはずしてしまっていいかというと、先に学んだように必要
な変数をはずすことが他の係数にゆがみを与えることが障害になります。したがっ
て、前門の虎後門の狼という状況に置かれてしまいます。そこからは実際の分析
上の判断のしどころですが、できる対策は
あきらめる
標本数を増やす
¸一致性を利用する
係数のゆがみを覚悟の上で、変数をはずす
分散拡大要因
%&' %()*)& *)
¾
¾
が大きなものをはず
すことになります。
モデルを再検討する
データの種類や性質、モデルについて正しい範囲で代替案がないかを検
討する
$
変数間の関係を規定する
¸何らかの係数制約を課すことで、ある程度
の説明変数間の相関を抑える
リッジ回帰を行う
リッジ回帰は推定量にある対角行列を計算に加えるため、推定する係数の不
偏性が崩れてしまいます。
くらいです。これらには一長一短があり、限界という部分もあります。
¼
¼
において、
¼
の 行目の要素ベクトルを
¼
、また
¼
と置くと、
¼
となります。このとき
¼
と置けますが、この中で、
¾
となります。したがって、データの追加により、
が変化した場合、
が十分大きければ、推
定値を大きく変化させることになるのです。
計量経済分析特論 実際的課題
一過性変化と構造変化
戦争や政治的なショ ックなどの一過性変化や経済体制の変更などの長期的な構造
変化はそのまま推定すると推定結果が望ましいものになりません。そこで、いく
つかの例とその対応についてみておきましょう。
データが加わる効果
影響度分析
変数ではなく、データが加わる効果を見ておくことにしましょう。他のデータ
の傾向とは大きく異なるようなデータが説明変数に加わるとどのような影響を与
えるのでしょうか。まず、非常に大きな影響を与えるデータとして、
を考えま
しょう。なお、データ行列
に含まれる
要素です。このときデータ行列
から
を除いた行列
を考えます。
このとき、
¼
¼
¼
¼
¼
となります。したがって、
¼
も同様に考えると、この行列の関係は
¼
¼
¼
¼
¼
です。このときの推定量を演算すると、
¼
¼
¼
¼
¼
¼
¼
展開後、
¼
で割る
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
℄
¼
が得られます。この意味は、推定値を求めるのに重要度の高いと考えられる観測
値
とそれを除いた際に回帰した係数
から求められた残差が大きいと、すな
わち
と
の関係が十分説明できていないと、その分推定される係数が大きく振
れることがわかります。なお、
¼
¼
と置いて、
より大きい場
合などは(すべての係数の)推定を左右している大きな結果として考えることも
あります。
計量経済分析特論 実際的課題
定数の特性を示す効果
定数項ダミー
たとえば、賃金などの関数の推定に学歴の影響を考慮するケースを考えましょ
う。推定する関数は
Æ
Æ
になります。
Æ
高卒以下
それ以上
として表現できるでしょう。また、これを拡張して、
Æ
中卒まで
高卒まで
Æ
大学卒業まで
大学院修了以上
として行列を作ったり、これに業種や企業規模を示す変数をそれぞれ
として
加えてもいいでしょう。このような分析の推定は
Æ
Æ
として、ダミーを表す変数を一つのデータ変数として扱うことができます。
ただし、注意しなければいけない点があります。必ずダミーに用いるデータに
は対象となるケースに必ずひとつすべてが
をとるケースを準備しなければなら
ないということです。今回では、学歴と業種、企業規模といくつかのケースを考え
ました。学歴で言えば、中卒までが
ÆÆ
ともに、
となります。これが無い場
合には定数項があると定数項とダミー変数の完全な多重共線性を引き起こし、推
定ができなくなります。
傾きの変化を示す効果
係数ダミー
では、係数ダミーはどう入れたらいいでしょうか。定数項もある時点から変化
するような構造変化として考えて見ましょう。このような場合の表現方法は
!
! !
"
"
になります。すなわち、ダミーとして扱う係数とそこに与えるデータをダミー期
間にあわせて入れればいいということになります。
計量経済分析特論 実際的課題
時間ごとに断絶無く変化するときの分析
スプライン推定
ダミー変数は通常断絶をもって変化しますが、断絶無く急激に傾きが変化するよ
うな推定を行いたいこともあると思います。その場合、傾きの変化だけではなく、
定数項
切片
も同じく変化する必要がありますから、その点で注意が必要です。
傾きが急に変わるということはその変化する点では変化前と変化後の直線が交
わっている必要があります。
式を例に取れば、ある変化点
において
"
"
¸"
"
になりますから、ところで、
+
+
!
¼
と表記できるとすれば、
"
+
"
+
"
+
"
+
+
"
となりますので、
!
!
!
¼
"
を計算すればよいことがわかります。