• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide08

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide08"

Copied!
32
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#08

古典的回帰モデル (1)

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 回帰分析の古典的仮定

2 回帰係数のOLS 推定

テキスト:鹿野繁樹 [2015]、第 5.1 章・第 5.2 章。

前回の復習

1 OLS 回帰と OLS 残差

2 決定係数

(3)

Section 1

回帰分析の古典的仮定

(4)

線形回帰モデル:回帰直線と確率誤差の出会い

前回までの復習:二次元データ(Xi, Yi) の関係を、OLS 回帰 Yˆi = a+ bXi. (1)

で分析。

回帰直線の散布図へのフィット(残差2 乗和 = 予測誤差の最 小化)でOLS 係数 a, bを決定。

a = ¯Y − bX,¯ b = SXY SXX =

(Xi− ¯X)(Yi − ¯Y)

(Xi− ¯X)2 . (2) ... いくら努力しても、OLS 残差 ˆui = Yi− ˆYiが残る。⇒ 説明 変数Xiだけで被説明変数Yiの変動を説明するのは、ムリ!

(5)

あらかじめ誤差を認め、Yiは線形回帰モデルに従って変動すると 仮定。

仮定 1 ( 線形回帰モデル )

Yi = α + βXi+ ui, i= 1, 2, . . . , n. (CA0) uiは誤差項。説明変数Xiで説明できないYiのバラつきをと らえた確率変数。(誤差項ui =OLS 残差 ˆui。)

∴Yiの変動・個体差の要因:

データとして観測できるXiの違い。 観測不能な確率的ノイズui

改めて、切片α(アルファ)、傾き β(ベータ)を回帰係数と 呼ぶ。

(6)

統計的推測(講義ノート#04・#05)の立場で考えると?

母集団モデル= 回帰モデル (CA0):標本 (Xi, Yi) の観測プロセ スを表現。

未知の母数= 回帰係数 α と β:推定・検定の対象。

(CA0) 式に従って変動する標本 (Xi, Yi) を収集・分析 ⇒ さか のぼってα, β の値を推測することができるはず!

(7)

Remark 1

回帰係数α, β の統計的推測。

Yi = α + βXi+ ui 母集団(母数α, β)

↓ ↑

標本を観測 ↑ α, β の推定・仮説検定

↓ ↑

(X1, Y1), (X2, Y2), . . . , (Xn, Yn)

標本

(8)

古典的回帰モデル

以降、古典的仮定(classical assumption,CA)を満たす標本を 想定。

仮定 2 ( 回帰分析の古典的仮定 )

非確率的な説明変数: X1, X2, . . . , Xnn 個の定数, (CA1) 期待値はゼロ: E(ui) = 0, (CA2) 母分散の均一性: Var(ui) = E(u

2 i) = σ

2, (CA3) 独立標本⇒ 無相関: Cov(ui, uj) = E(uiuj) = 0, (CA4)

正規性: ui ∼ N(0, σ

2). (CA5)

これらの仮定を満たすとき、(CA0) 式は古典的回帰モデルと 呼ばれる。

(9)

仮定(CA2) から仮定 (CA5) は誤差項 uiに関する仮定。標本の誤差 モデル(講義ノート#04)とほぼ同様。

仮定(CA2) と (CA5):uiは、ゼロの周りに分布する確率的ノ イズ。

仮定(CA3) と仮定 (CA5) の σ2は、uiの母分散。

注意:仮定(CA2)よりE(ui) = 0なので,uiの分散は

σ2 = Var(ui) = E(ui− E(ui))2 = E(u2i). (3)

単にu

2

i の期待値。

仮定(CA4):同様の理由で、仮定 (CA2) の誤差項の共分散は Cov(ui, uj) = E(uiuj) = 0。

(10)

仮定(CA1) について:なぜ Xiを非確率変数とする?⇒ 回帰分析 が、実験データ(講義ノート#01)の解析で発展したことに由来。

実験で、分析者がn 通りの Xiの値{x1, x2, . . . , xn}(例えば薬 品投与量)を被験者i に与え、それを受けて Yi(例えば血圧) の個体差が生じた状況を想定。

Yiを観測する前からXiの値は確定。⇒ Xiは非確率変数! ... 経済学で使う非実験データには、合わない仮定。あくまで 分析の簡単化のための仮定。

(11)

古典的仮定のもとで、Yiの振る舞いは?

期待値:(CA0) 式の期待値は、仮定 (CA1) と仮定 (CA2) より E(Yi) = Eα + βXi+ ui = α + βXi+ E(ui)

=0

= α + βXi.

(仮定(CA1) より Xiは定数なので、E(Xi) = Xi。)

分散:Yi− E(Yi) = α + βXi+ ui− (α + βXi) = uiなので、仮 定(CA3) より

Var(Yi) = E(Yi− E(Yi))2 = E(u2i)

=σ2

= σ2.

Xiに依存せず、母分散σ2で一定。 分布型:仮定(CA5) の ui ∼ N(0, σ

2) の中心を定数(母平均) E(Yi) = α + βXiだけシフト⇒ 正規分布に関する公式(講義 ノート#03)より

Yi ∼ N(α + βXi, σ 2).

(12)

古典的回帰モデルは結局、「Xiに依存して期待値がシフトするYi の正規母集団」!

公式 1

古典的回帰モデルは、次式の構造を持つ正規母集団である。 Yi ∼ N(α + βXi, σ2), E(Yi) = α + βXi

期待値(Xiに依存)

, Var(Yi) = σ2

母分散(一定)

. (4)

証明:前段で証明済み。

図1:β > 0 の古典的回帰モデルを、(Xi, Yi) 平面上に描いた イメージ。

Xiの値で期待値E(Yi) の位置が決まり、次いで誤差 uiが加わ

ることでE(Yi) を中心に Yiの正規分布が形成。

同じXiの値を持つ個体でも、uiの違いでYiの観測に差異が 生じる。

(13)

0.0 0.2 0.4 0.6 0.8 1.0

01234

Xi

Yi

α + βXi

ui~N(0,σ2)

1 : 古典的回帰モデルYi = α + βXi+ uiui∼ N(0, σ

2)

(14)

発想の転換

OLS 回帰:まず散布図に n 個の観測点 (Xi, Yi) があり、そこに 回帰直線Yˆi = a + bXiをフィットさせる。

古典的回帰モデル:まずモデル(CA0) があり、モデルから n 組の(Xi, Yi) が発生する。⇒ いかにして (Xi, Yi) から α と β をリカバーするか?∴ 回帰係数の推定。

Remark 2

OLS 回帰(前回まで)と古典的回帰モデル(今回から)の違い。 OLS 回帰:はじめにデータありき。所与の散布図 (Xi, Yi) に、 回帰式Yˆi = a + bXiを当てはめ。∴ 記述統計の一種。

古典的回帰モデル:はじめにモデルありき。モデル(CA0) か(Xi, Yi) が発生。⇒ (Xi, Yi) から α と β を推定するには?

(15)

Section 2

回帰係数の OLS 推定

(16)

OLS 推定量

回帰係数α, β の推定量として、何がふさわしいか?⇒OLS 係数 a, bを「とりあえず」採用してみる。

ˆ

α= ¯Y − ˆβ ¯X, βˆ= SXY

SXX. (5) このときα, ˆˆ β(OLS)を、α, β のOLS 推定量と呼ぶ。

根拠:回帰直線と線形回帰モデルは見た目が良く似ている!

⇒OLS 係数を使うとうまく行きそう?

... OLS は、望ましい推定量の採用基準(不偏性と有効性、講 義ノート#05)を満たすか?⇒ コレを調べるには、いくつか の準備が必要。

(17)

公式 2 ( 偏差 2 乗和・偏差積和の別表現:その 2)

SXX =(Xi− ¯X)Xi, SXY =(Xi− ¯X)Yi. (6) 証明:講義ノート#07 より(Xi− ¯X) = 0 なので、

SXY =(Xi− ¯X)(Yi− ¯Y)

= (Xi− ¯X)Yi− (Xi− ¯X) ¯Y

=(Xi− ¯X)Yi− ¯Y (Xi − ¯X)

=0

=(Xi− ¯X)Yi.

SXXに関しては復習問題。

(18)

(5) 式の ˆβ の分子 SXY (6) 式を代入し変形すると、 βˆ= 1

SXX

(Xi− ¯X)Yi = Xi− ¯X SXX

Yi

=wiYi, wi = Xi− ¯X

SXX . (7) 上式のw1, w2, . . . , wnOLS ウェイトと呼ぶ。

(19)

公式 3 (OLS 推定量の線形性 )

β は、ˆ OLS ウェイト wiによるYiの加重和。

βˆ=wiYi = w1Y1+ w2Y2+ · · · + wnYn, wi = Xi− ¯X SXX . (8) 証明:前段で証明済み.

∴ ˆβ は、wiをウェイトとするYiの一次式。一般に線形推定 量と呼ばれる。

標本平均も Y¯ = 1

n

Yi = 1 nY1+

1

nY2+ · · · + 1 nYn と書けば、均等なウェイト

1

nの線形推定量と解釈できる。

(20)

OLS ウェイト wiの三つの性質⇒ 今後頻繁に利用。

公式 4 (OLS ウェイトの性質 )

和はゼロ:

wi = 0, (9) Xiとの積和は1 : wiXi = 1, (10) 2 乗和は SXXの逆数: w2i = 1

SXX. (11)

(21)

証明:前回の(Xi− ¯X) = 0、SXX =(Xi− ¯X)

2

(定義式)、お よび公式(6) を使えば

wi =Xi− ¯X SXX =

1 SXX

(Xi− ¯X)

=0

= 0.

wiXi =(Xi− ¯X) SXX Xi =

1 SXX

(Xi− ¯X)Xi

=SX X

= 1.

w2i =(Xi− ¯X)

2

SXX2 = 1 SXX2

(Xi− ¯X)2

=SX X

= 1 SXX.

(22)

OLS 推定量の期待値と分散

公式(8) の Yiに回帰モデル(CA0) を代入し、展開・整理すると βˆ=wiYi =wi(α + βXi + ui)

= αwi

=0

wiXi

=1

+wiui

= β +wiui. (12) ただし公式(9) と公式 (10) を利用。

OLS 推定量 ˆβ は、真の β の周りを誤差の加重和 wiuiだけ バラつく確率変数。一般にβˆ= β。

標本平均の誤差表現(講義ノート#04)と本質的に同じ!

(23)

Remark 3

推定量の誤差表現:多くの推定問題において、未知の母数θ とそ の推定量 ˆθ は正確に、または近似的に

θˆ= θ + 推定の誤差.

∴ ˆθ の性質を調べる際に便利。

例:標本Xiによるµ の推定で、 ¯X = µ +

 1 nui

例:二次元標本(Xi, Yi) による β の OLS 推定で、 βˆ= β + wiui

(24)

(12) 式の推定誤差 wiuiの期待値:仮定(CA1) より wiは非確率、

仮定(CA2) より E(ui) = 0 なので Ewiui = w1E(u1)

=0

+w2E(u2) + · · · + wnE(un) = 0. (13)

(25)

 wiuiの分散:仮定(CA4)(独立標本)および仮定 (CA3) により、 Varwiui = Var (w1u1+ w2u2+ · · · + wnun)

= Var(w1u1) + Var(w2u2) + · · · + Var(wnun)

= w12Var(u1)

=σ2

+w22Var(u2) + · · · + wn2Var(un)

= w12σ2 + w22σ2+ · · · + w2nσ2 = σ2w2i. (14)

(講義ノート#02:定数を分散記号の外に出すときは、2 乗で。) さらに公式(11) を使えば

Varwiui = σ2wi2 = σ

2

SXX. (15)

(26)

よって(12) 式から、 ˆβ の期待値・分散は E( ˆβ) = Eβ+wiui = E(β)

β

+ Ewiui

=0

= β, (16)

Var( ˆβ) = Varβ+wiui

= Var(β)

=0

+ Varwiui

=σ2/SX X

= σ

2

SXX. (17)

(27)

公式 5 (OLS 推定量 β ˆ の期待値・分散 )

古典的仮定(CA1) ∼ (CA4) を満たす標本ならば、 E( ˆβ) = β, Var( ˆβ) = σ

2

SXX =

σ2

(Xi− ¯X)2. (18) 証明:前段で証明済み。

E( ˆβ) = β より、OLS ˆβ は回帰係数 β の不偏推定量。

(n − 1)s2X = SXX =(Xi− ¯X)2を利用して分散Var( ˆβ) の分 母を変形すると

Var( ˆβ) = σ

2

(n − 1)s2X. (19)

∴ サンプル数n が大きいほどVar( ˆβ) が減少 =OLS 推定の精度 が向上!

α のOLS ˆα も、同様の性質を持つ。テキストp81 参照。

(28)

ガウス・マルコフの定理: OLS の有効性

回帰係数の不偏推定量は、実はOLS 以外にも存在。

不偏性の基準E( ˜β) = β を満たす推定量 ˜β を設計する方法は、 無限にある。(詳細はテキストp81∼p82 参照。)

不偏性の意味で同性能の推定量が複数ある場合、第二の基準・ 有効性(最小分散、講義ノート#05)を問う。

OLS ˆβ は、最小分散の不偏推定量か?

(29)

答え:OLS よりも分散(ブレ)の小さい不偏推定量を作ることは、 不可能!

公式 6 ( ガウス・マルコフの定理 )

古典的仮定(CA1) ∼ (CA4) が成立するならば、OLS 推定量 ˆβ の分 散は、β の線形不偏推定量の中で最小となる。

E( ˆβ) = β, Var( ˆβ) = σ2wi2 = σ

2

SXX <Var( ˜β). (20) ただしβ は任意の線形不偏推定量。˜

証明:テキストp93 参照。

OLS が統計ソフトに実装されている理由:有効性(最小分散)

(30)

Remark 4

OLS 推定量が採用される理由 = ガウス・マルコフの定理。 OLS 推定量 ˆα, ˆβ は、回帰係数 α, β の最小分散の線形不偏推 定量。

単なる不偏推定量ではない。有効性(分散)の基準で優れて いる。

ガウス・マルコフの定理(OLS の有効性・最小分散)は、 データが古典的仮定を満たすことを前提とする。

古典的仮定に従わないデータでは、OLS 以外の推定法が最適 になるかも?

(31)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 公式2、(6) 式の、S

XX に関するパートを証明せよ。

2 テキスト第5 章復習問題 5.1。

(32)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

参照

関連したドキュメント

2021年9月以降受験のTOEFL iBTまたはIELTS(Academicモジュール)にて希望大学の要件を 満たしていること。ただし、協定校が要件を設定していない場合はTOEFL

ると思いたい との願望 外部事象のリ スクの不確か さを過小評価. 安全性は 日々向上す べきものとの

基準の電力は,原則として次のいずれかを基準として決定するも

を基に設定するが,敷地で最大層厚 35cm が確認されていることも踏まえ,堆積量評価結果

学側からより、たくさんの情報 提供してほしいなあと感じて います。講議 まま に関して、うるさ すぎる学生、講議 まま

基準の電力は,原則として次のいずれかを基準として各時間帯別

運営費交付金収益の計上基準については、前事業年度まで費用進行基準を採用していたが、当

それらのデータについて作成した散布図を図 15.16 に、マルチビームソナー測深を基準に した場合の精度に関する統計量を表 15.2 に示した。決定係数は 0.977