• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide09

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide09"

Copied!
25
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#09

古典的回帰モデル (2)

鹿野繁樹

大阪府立大学

2017 年 11 月更新

(2)

Outline

1 OLS 推定量の分布

2 回帰係数の仮説検定

テキスト:鹿野繁樹 [2015]、第 5.3 章・第 5.4 章。

前回の復習

1 回帰分析の古典的仮定 2 回帰係数のOLS 推定

(3)

Section 1

OLS 推定量の分布

(4)

OLS 推定量の正規性

前回の復習:回帰モデル

Yi = α + βXi+ ui, ui ∼ N(0, σ2) (1) のパラメータ、α と β を OLS で推定。

仮定 1 ( 回帰分析の古典的仮定(再掲) )

非確率的な説明変数: X1, X2, . . . , Xnn 個の定数, (CA1) 期待値はゼロ: E(ui) = 0, (CA2) 母分散の均一性: Var(ui) = E(u2i) = σ2, (CA3) 独立標本⇒ 無相関: Cov(ui, uj) = E(uiuj) = 0, (CA4) 正規性: ui ∼ N(0, σ2). (CA5)

(5)

OLS 推定量 ˆβ を OLS ウェイト wiの表現に変形すると

β =ˆ wiYi = β +wiui, wi = (Xi− ¯X) SXX

. (2)

古典的仮定(CA1) から (CA4) が成立すれば、以下が成立。 β の期待値・分散はˆ

E( ˆβ) = β, Var( ˆβ) = σ

2

SXX

. (3)

∴ ˆβ は β の不偏推定量。

さらに最小分散(ガウス・マルコフの定理)。

(6)

誤差項の正規性(CA5) は何のためにある?

正規分布の再生性(講義ノート#03)および OLS ウェイトの 性質(講義ノート#08)より

wiui ∼ N

0, σ2wi2

=1/SXX

 ⇒ wiui ∼ N

 0, σ

2

SXX

 . (4) β はˆ  wiuiを定数β だけ横滑りさせた確率変数なので、

β ∼ Nˆ

 β, σ

2

SXX



. (5)

uiの正規性から、 ˆβ は正規分布に従う!

(7)

公式 1

仮定(CA1) ∼ 仮定 (CA5) のもとで、OLS 推定量 ˆβ の分布は β ∼ Nˆ

 β, σ

2

SXX



, E( ˆβ) = β, Var( ˆβ) = σ

2

SXX

. (6)

証明:前段で証明済み.

公式(6) を標準化(期待値を引き,その後標準偏差で割る)

⇒ ˆβ に関するZ 統計量 β ∼ Nˆ

 β, σ

2

SXX



−−−→標準化 Z = β − βˆ

σ/SXX ∼ N(0, 1). (7)

⇒ 回帰係数 β に対する仮説検定(講義ノート#05)が可能に。

(8)

Remark 1

表1:古典的仮定の各仮定と、 ˆβ の確率論上の性質・性能。 仮定の追加で、 ˆβ の性質がより具体的に。

仮定(CA5) によってはじめて、 ˆβ の分布型が正規分布に特定 される。

(CA1) と (CA2) (CA1) ∼ (CA4) (CA1) ∼ (CA5)

E( ˆβ) = β β β

Var( ˆβ) = Sσ2

XX

σ2 SXX

β ∼ˆ Nβ,SσXX2



1 : 古典的仮定(CA1) ∼ (CA5)OLS推定量βˆの性質

(9)

母分散の不偏推定と OLS の標準誤差

(7) 式の Z 統計量の分母、 ˆβ の標準偏差



Var( ˆβ) =

σ2 SXX

= σ SXX

(8)

は、未知の母数・誤差項の母分散σ2(の平方根)に依存。 σ2を、次の推定量で推定。

s2 = 1 n − 2Q

= 1

n − 2

uˆ2i

= 1 n − 2

(Yi− ˆYi)2. (9)

Q = ˆu2i =(Yi− ˆYi)2OLS で最適化された残差 2 乗和。

(10)

公式 2 ( 不偏分散 )

誤差項の母分散σ2は、s2で不偏推定できる。 s2 = 1

n − 2

(Yi− ˆYi)2, E(s2) = σ2. (10)

証明:テキストp93 ∼ 95 参照。

この性質から、s2を不偏分散と呼ぶ。

s2の分母n − 2 は自由度と呼ばれ、一定のルールに基づき定 まる。

(11)

自由度の考え方:自由度は、ある統計量を求める際の「実質的な サンプル数」と解釈するとわかりやすい。

通常のYiの標本分散を考える。 s2Y = 1

n − 1

(Yi − ¯Y )2. (11)

s2Y を求めるには、事前にY¯ が必要。

∴ ¯Y の計算のために、燃料(サンプル)を1だけ消費!⇒ s2

Y

を求める段階で、実質的なサンプル数・自由度はn− 1 回帰モデルの不偏分散s2も同様。

(10)式のs2を求めるには、事前にαˆβˆが必要。

αˆβˆの計算のために、燃料(サンプル)を2だけ消費!

⇒ s2Y を求める段階で、実質的なサンプル数・自由度はn− 2 統計量を何か1 つ計算する毎に、標本の自由度は 1 失われる。

(12)

(8) 式の σ2s2で置き換えるた、 ˆβ の標準偏差の推定値

s.e.( ˆβ) =

s2 SXX

= s SXX

(12)

を、 ˆβ の標準誤差(standard error)と呼ぶ。 s.e.( ˆβ) は ˆβ の確率的なブレを測る統計量。

s.e.( ˆβ)が小さい⇔ ˆβの精度が高い。

∴OLS を行った際は、推定値 ˆβ と共に必ず s.e.( ˆβ) を確認。

(統計ソフトを使えば自動出力。)

(13)

Section 2

回帰係数の仮説検定

(14)

回帰係数の t 検定

(7) 式分母の σ を (10) 式で求めた s で置き換え、t 統計量 Z = β − βˆ

σ/SXX

σ を s で置換

−−−−−−−→ t = β − βˆ s/SXX を得る(講義ノート#05)。

上式の分母は標準誤差(12) と同値なので、以下のように表記。 t = β − βˆ

s.e.( ˆβ). (13) t 統計量の確率は、t 分布(標準正規分布 N(0, 1) のニセモノ) で与えられる。

t ∼ T(m), m = n − 2.

(15)

回帰係数のt 検定:仮説検定の一般論(講義ノート#05)に従う。 分析者が未知のβ に関しあらかじめ仮説値βを置く。帰無仮 説として表現すれば

H0 : β = β H0 : β − β = 0. (14) アイディア:β を推定値 ˆβ に置き換え、差 ˆβ − βが「十分」 大きければH0 : を棄却。

具体的には、 ˆβ − β

t 値

β − βˆ 推定値と仮説値のズレ

t =

β − βˆ

s.e.( ˆβ) (15)

に換算し、|t| が t 分布の臨界値 t(m) を超えれば H0 : を棄却。 tは、 ˆβ と βのギャップを測る「ものさし」。

(16)

Remark 2

回帰係数β の t 検定の手順。

1 帰無仮説H

0 : β = βを設定⇒ 差 ˆβ − βを、t 値に換算。 t = β − βˆ

s.e.( ˆβ). (16)

2 t 分布表から自由度 m = n − 2 の 2.5%臨界値、t0.025(m) を求 め、|t| > t0.025(m) ならば H0 : β = β

を棄却。

(17)

Example 1

あるモデルの係数に関し、H0 : β = 100 を検定。サンプル数 n = 20 の標本による分析結果として、 ˆβ = 120、s.e.( ˆβ) = 20。

帰無仮説H0のもとでのt 値は 120 − 100 = 20 ⇒ t =

120 − 100 20 =

20

20 = 1. (17) 一方、自由度m = n − 2 = 18 の t 分布の臨界値は

t0.025(18) = 2.101。

|t| < 2.101 より、H0は棄却されない。β = 100 とみなして も問題ない。)

推定値と仮説値の差が20 で,何となく大きなズレに見える。 ... 推定のブレを考慮すれば、このズレは誤差の範囲内!

(18)

回帰係数の有意性検定

実証分析では、次の検定を必ず行う。

H0 : β = 0. (18) これを回帰係数β の(or 説明変数 Xiの)有意性検定と呼ぶ。

この仮説が正しければ、モデルはYi = α + ui。∴XiYiに 影響しない。

有意性検定の意図:検定により、H0 : β = 0(Xiは効果がな い)という「疑い」が棄却されることを示せば、XiYiの統 計的な関係性を裏付ける強力な証拠に。

(19)

有意性検定では仮説値がβ = 0 ⇒ この場合 t 値は自動的に t = β − 0ˆ

s.e.( ˆβ) = βˆ s.e.( ˆβ) =

OLS 推定値 標準誤差

.

|t| > t0.025(m) ならば H0 : β = 0 を棄却。

この検定手順でH0が棄却された場合、「β は(Xiは)統計的 に有意である」「β は有意にゼロと異なる」などと表現。 統計ソフトでOLS 推定を実行すると、仮説値を設定していな いのに推定値β と共に t 値が自動出力。コレは有意性検定の tˆ 値。

(20)

Example 2

生活保護受給率welfareiと失業率unempiのOLS 回帰(再掲)。 welfare i = − 1.07

(−1.07)+ 0.46(3.18)unempi, n = 19, R

2 = 0.37. (19)

カッコ内は有意性検定のt 値。

自由度m = 19 − 2 = 17 の t 分布の臨界値は、t 分布表より t0.025(17) = 2.110。

|3.18| > 2.11 ⇒ 失業率の係数 β は統計的に有意。

| − 1.07| < 2.11 ⇒ 定数項 α は有意でない。

(21)

t 検定のショートカット

t 分布の性質:m が十分大きい(m → ∞)とき、t 分布 t ∼ T (m) は標準正規分布z ∼ N(0, 1) に収束する。

m = n − 2 → ∞ ⇒ T (m) → N(0, 1). (20)

∴ 自由度m が(= サンプル数 n が)十分大きいならば、t 分布 の臨界値をt0.025(m) ≈ 2.00 ≈ 1.96 = z0,025と置いてよい! 実際、t 分布表より

m = 30 t0.025(30) = 2.042, m = 40 t0.025(40) = 2.021, m = 60 t0.025(60) = 2.000.

通常、t 分布表にあまり大きな自由度の臨界値が載っていない

(22)

Remark 2

t 検定のショートカット:だいたい m = n − 2 ≥ 30 なら、t 分布の 右端2.5%臨界値を t0.025(m) ≈ 2.00 と置いてよい。

∴ サンプル数n が多いなら、t 分布表は不要。 例:回帰係数β の有意性検定

|t| =

βˆ s.e.( ˆβ)

≥ (<) 2 ⇒ β は有意(有意でない) (21)

t 分布表にあまり大きな自由度の臨界値が載っていないのは、 このため。

(23)

統計ソフトで回帰分析を行うと、たくさんの数値が!⇒ 何をレ ポートすべき?

Remark 3

回帰分析を行ったらレポートすべき数値.

1 回帰係数のOLS 推定値 ˆα, ˆβ.

2 サンプル数n と,モデルの当てはまりを測る決定係数 R2

3 標準誤差か,有意性のt 値のうち,どちらか一方. Example 2 を参照。

(24)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 OLS 推定の結果, ˆβ = 70,s.e.( ˆβ) = 10 を得た.サンプル数は n = 25.帰無仮説 H0 : β = 40 を t 検定したい.

1 H0 : β = 40t値を求めよ.

2 t分布表から,自由度m= 25 − 2 = 23の右端2.5%臨界値を求 め,H0 : β = 40が棄却されるか否か判断せよ.

(テキスト第5 章復習問題 5.4 の類題。)

2 テキスト第5 章復習問題 5.5。

(25)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

参照

関連したドキュメント

内的効果 生産性の向上 欠勤率の低下、プレゼンティーイズムの解消 休業率 内的効果 モチベーションUP 家族も含め忠誠心と士気があがる

 当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文

URL http://doi.org/10.20561/00041066.. も,並行市場プレミアムの高さが目立つ (注3) 。

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC

都市計画分野において余暇活動を扱った既存研究とし て,椎野ら 2)

荒神衣美(こうじんえみ) アジア経済研究所 地域研究センター研究員。ベトナム の農業・農村発展について研究しており、

脚注 [1] 一橋大学イノベーション研究センター(編) “イノベーション・マネジメント入門”, 日本経済新聞出版社 [2] Henry Chesbrough