計量経済学#16
線形制約の仮説検定 (2)
鹿野繁樹
大阪府立大学
2017 年 12 月更新
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 1 / 29
Outline
1 カイ2 乗検定と F 検定
2 応用:回帰係数の均一性検定
テキスト:鹿野繁樹 [2015]、第 8.3 章・第 8.4 章。
前回の復習
1 回帰係数への線形制約
2 線形制約の残差2 乗和への影響
Section 1
カイ 2 乗検定と F 検定
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 3 / 29
カイ 2 乗統計量による検定
線形制約を検定するアイディア(講義ノート#15)
線形制約のもとでのOLS 残差 2 乗和を QR = ˆvi2、制約のな いOLS 残差 2 乗和を Q = ˆu2i と置くと、
QR > Q. (1) 制約は、モデルのデータへの当てはまりを悪化させる。
∴ 差QR−Q が十分大きければ、制約がデータに適合しない とみなし、棄却すればよい。
残された問題:差QR−Q を適当な検定統計量に変換。
差QR−Q を次のように変換すると、カイ2 乗統計量を得る。 χ2 = QR−Q
Q
m, m = n − (k + 1). (2)
(χ はギリシア文字の「カイ」。)
制約による残差2 乗和の増加率 (QR−Q)/Q に、t 検定の自由 度m を乗じた統計量。
χ2は、サンプル数n が十分大きいとき、自由度 G のカイ2 乗 分布に従う。
χ2 ∼Chi(G). (3) G は制約の数、回帰係数の数 (k + 1) より小さい。(通常あま り大きな数にならない。)
通常n は十分大きいので、カイ 2 乗統計量を使っても問題な い。⇒n が少ない場合は F 統計量(後述)を使う。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 5 / 29
0.000.050.100.15
χ2
f
0 χ2(5)=11.07
α=0.05
図 1 : 自由度G = 5のカイ2乗分布と5%臨界値
図1:自由度 G = 5 のカイ 2 乗分布 左右対称の歪んだ分布。
χ2 > 0 の領域だけをカバー。(QR−Q > 0、Q > 0 なので χ2 は負の値をとらない。)
自由度G = 5 のとき、右端 5%臨界値は χ2(5) = 11.07。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 7 / 29
線形制約のカイ2 乗検定の手順(t 検定と同様)。
Remark 1
線形制約H0のカイ2 乗検定の手順
1 制約なしのモデル、制約付きのモデルをそれぞれOLS 推定し Q と QRを求め、差QR−Q をカイ 2 乗値に変換。
χ2∗ = QR−Q Q
m. (4)
2 カイ2 乗分布表から自由度 G(= 制約の数)の 5%臨界値、 χ20.05(G) を求め、χ2∗ > χ20.05(G) ならば H0を棄却。
分布表から求める臨界値が右片側5%である点に注意。 標本から計算したカイ2 乗値 χ
2
∗が(QR−Q が)十分大きいか
否かが問題。⇒ 右片側だけで5%になるように臨界値を置く。
Example 1
コブ・ダグラス型生産関数の規模に関する収穫一定の仮定(講義 ノート#15)で、二つの残差 2 乗和からカイ 2 乗値を求めると
χ20 = 0.82 − 0.66
0.66 ×(89 − 3) = 20.85. (5) 自由度G = 1 の 5%臨界値は、分布表より χ2(1) = 3.841。
∴χ20 = 20.85 > 3.841 より、H0は棄却される。収穫一定の仮定は、 データで支持されない。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 9 / 29
サンプル数が少ないケース: F 検定
カイ2 乗検定は、サンプル数 n が十分ことが前提。⇒ n が少ない ならば、カイ2 乗ではなくF 統計量を使う。
F = (QR−Q) Q
m
G. (6)
F は、n の大小にかかわらず、自由度が G と m のF 分布に 従う。
F ∼ F(G, m). (7) F 統計量は自由度を二つ持つのため、使いづらい。
各自由度の組み合わせに対する臨界値の表は膨大⇒ 松原 望 et al. [1991] を参照。
カイ2 乗統計量と F 統計量の定義 (3) 式、(6) 式より F = 1
Gχ
2 ⇔ χ2 = GF. (8)
また両定義式から
χ2 = Q の増加率 × 自由度 (9) F = 制約当たりの Q の増加率 × 自由度 (10) いずれの検定統計量も、線形制約による残差2 乗和の悪化に 着目している点(尤度比原理)は同じ。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 11 / 29
Section 2
応用:回帰係数の均一性検定
サブ・サンプル:標本の分割と統合
一つの標本を、何らかの基準で複数グループに区分できるとき、 それらをサブ・サンプル(sub-sample)と呼ぶ。
逆に、複数のサブ・サンプルを一つの標本にまとめ用いるこ とを、「標本をプールする」と言う。
例:企業向けのアンケートの回答に製造業・非製造業が混合。
⇒ 二つのサブ・サンプルが存在。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 13 / 29
Example 2
表1:マンション価格の分析で使った標本を、ワンルームとそれ以 外のサブ・サンプルに分けOLS 推定。
両サブ・サンプルの係数推定値を比較。面積を除き顕著な差。 標本をプールした推定値は、前述二つの推定結果の中間的 な値。
ワンルーム以外 ワンルーム 全サンプル
係数 t 値 係数 t 値 係数 t 値
定数項 1933.77 12.17 798.12 1.67 1496.51 9.88 最寄駅時間 -38.05 -4.08 5.36 0.24 -32.68 -3.20 築年数 -63.02 -15.16 -43.92 -4.53 -58.45 -12.61 面積 60.16 22.48 63.39 3.57 64.18 33.58
修正済みR¯2 0.85 0.82 0.88
サンプル数n 157 37 194
残差2 乗和/10 万 918 38 1020
表1 : サブ・サンプルに分けたマンション価格の分析結果
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 15 / 29
係数推定値は、属性による差異があることが多い。⇒ サンプル数 が十分多いならば、サブ・サンプルに分けた分析がよい。
例:労働者の賃金Yiを子ども数Xiに回帰すると、男性サン プルでは係数が正に、女性サンプルでは負。
∴男女をプール⇒両者の係数が平準化・相殺され、係数が統 計的に有意に推定されない。
労働経済学では、標本を男女に分割して分析を進めるのが 常識。
サブ・サンプル OLS の利点と欠点
サブ・サンプルOLS とプールした OLS の、理論的な対応関係は? ダミー変数Di = 0, 1 で、グループ 0 を Di = 0(サンプル数 n0)、グループ1 を Di = 1(サンプル数 n1)と表記すれば、
Di = 0 : Yi = α + β1X1i+ β2X2i+ · · · + βkXki+ u0i, i = 1, 2, . . . , n0, (11) Di = 1 : Yi = α′ + β1′X1i+ β2′X2i+ · · · + βk′Xki+ u1i,
i = 1, 2, . . . , n1. (12) Di = 0, 1 でモデルがスイッチするイメージ。
βj = βj′ に注意。Di = 0 グループの YiとDi = 1 グループの Yi
は、それぞれ異なる回帰モデルに従って変動している、と考 える!
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 17 / 29
しかし、もし係数が両サブサンプルで均一ならば、分析を2 回に 分けるのはムダ。⇒ 線形制約で言えば、係数均一性の仮定
H0 : α = α′, β1 = β1′, . . . , βk= βk′. (13)
上式が真ならば標本のプールが許され、推定すべきモデルは Yi = α + β1X1i+ β2X2i+ · · · + βkXki+ vi, i = 1, 2, . . . , n
(14) の一本のみ。
∴(14) 式は、(11) 式および (12) 式の係数に線形制約 (13) を課 すことによって得られる、制約下のモデル。
(14) 式は制約付きのモデルなので、誤差項は viと表記。
Remark 2
標本をプール(統合)した回帰モデルは、サブ・サンプルによる 回帰モデルの特殊ケース。
モデル(11),(12)
係数の制約なし
係数の均一性
−−−−−−−→ モデル(14)
制約付き
(15)
図2 A:サブ・サンプル毎に異なる傾きを持った散布図に、そ れぞれ異なる直線を当てはめたOLS 回帰。
+印のグループに比べ○ 印のグループは急な傾き。
二つの直線を当てはめれば、この特徴(差異)をよく反映。 図2 B:まとめて一本の直線を当てはめる。
一つの係数を無理やり使いまわす。
どちらにもフィットしない中途半端な直線。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 19 / 29
4 6 8 10
5101520
A
Xi Yi
4 6 8 10
5101520
B
Xi Yi
図2 : サブ・サンプル毎の回帰(A)vs. プールした回帰(B)
残差2 乗和の比較
(11) 式、(12) 式を別個に OLS 推定した残差 2 乗和を Q0、Q1 と置き、その和を以下とする。
Q0 =
n0
i=1
ˆ
u20i, Q1 =
n1
i=1
ˆ
u21i ⇒ Q = Q0 + Q1. (16)
標本をプールした(14) 式の OLS 残差 2 乗和を、以下とする。 QR =
n
i=1
ˆ
vi2. (17)
図2から、QR > Q0は明らか!
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 21 / 29
公式 1 ( 標本プールによる当てはまりの悪化 )
標本をプールしてOLS 推定を行うと、サブ・サンプルに分けた場 合と比べ、残差2 乗和が大きくなる。
QR =
n
i=1
ˆ
vi > Q =
n0
i=1
ˆ u0i+
n1
i=1
ˆ
u1i. (18)
証明:図2を見れば明らか。
サブ・サンプル分析の欠点:係数の数は、プールすれば(k + 1)。
⇒ サブ・サンプル毎だと2(k + 1)。
推定すべきパラメータの増加⇒ 自由度の減少、推定の効率性 が落ちる。
∴ グループ間の係数の異質性がなければ(線形制約が正しけ れば)、標本をプールしたほうがよい。
両グループの係数の違いが無視できる範囲内か否か、仮説 検定。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 23 / 29
回帰係数の均一性の検定
回帰係数の均一性(13) の検定は、カイ 2 乗統計量を使えば容易。 (18) の制約付き・制約なしの OLS 残差 2 乗和をカイ 2 乗統計量
χ2 = QR−Q Q
m, m = n − 2(k + 1) (19)
に変換。
χ2は、自由度がG = (k + 1) のカイ 2 乗分布に従う。
χ2 ∼Chi(k). (20) 注意:(13) 式は、計 G = (k + 1) 個の制約。
Remark 3
係数の均一性:OLS 推定およびカイ 2 乗検定の手順
1 カイ2 乗値 χ2
∗の計算。
1 サブ・サンプルに分けてOLS推定を行い、制約なしの残差2 乗和Q = Q0+Q1を得る。
2 標本をプールしてOLS推定を行い、制約付きのQRを得る。
3 QR− Qを、カイ2乗値に変換。
2 カイ2 乗分布表から 5%臨界値 χ20.05(k) を求め、χ2∗ > χ20.05(k) ならばH0を棄却。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 25 / 29
Example 3
表(1) より、制約なしの残差 2 乗和は Q = 918 + 38 = 956、制約付 きの残差2 乗和は QR = 1020。よってカイ 2 乗値は
χ2∗ = 1020 − 956
956 ×(194 − 2 × 4) = 12.45. (21) 一方自由度m1 = (K + 1) = 4 の 5%臨界値は χ2(4) = 9.488。 χ2∗ = 1245 > 9.488 なので、「ワンルーム以外・ワンルームの回帰 係数が等しい」とする帰無仮説は棄却される。
時系列データ(講義ノート#01)では、構造変化=「ある時点 n∗ の前後で回帰係数が変化したか否か」が議論となる。
観測の前半i = 1, 2, . . . , n∗をDi = 0 グループ、後半
i = n∗+ 1, n∗+ 2, . . . , n を Di = 1 グループと置けば、係数均 一性のカイ2 乗検定を構造変化の検定に使える!
詳しくは拓 [1995] を参照。
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 27 / 29
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 制約数がG = 2 の線形制約 H0の下でQR = 120、制約なしで Q = 100 を得た。係数の数は k + 1 = 10、サンプル数は n = 50 である。H0をカイ2 乗検定せよ。(テキスト第 8 章復 習問題8.4 の類題。)
2 復習問題8.4 の訂正、第 1 刷:(誤)「説明変数はk = 8」⇒
(正)「説明変数はk = 7」。
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.
松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.
山. 拓. 計量経済学. 新世社, 1995.
鹿野繁樹 (大阪府立大学) 計量経済学#16 2017 年 12 月更新 29 / 29