• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide18

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide18"

Copied!
27
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#18

回帰分析の再構築 (1)

鹿野繁樹

大阪府立大学

2017 年 12 月更新

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 1 / 27

(2)

Outline

1 条件付き期待値関数

2 母回帰

テキスト:鹿野繁樹 [2015]、第 10.1 章・第 10.2 章。

前回の復習

1 漸近理論

2 推定量の漸近的性質

(3)

Section 1

条件付き期待値関数

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 3 / 27

(4)

条件付きの確率分布と期待値

今回以降の目的:新しい回帰分析。

経済学で使うデータ(= 非実験データ)は、古典的仮定と合 わない。⇒OLS 推定がうまく機能しない可能性。

より現実的な、新しい前提条件のもとで、OLS の性質を検証。

(5)

「二つの確率変数X と Y の関係性をモデル化する」ことからス タート。

二次元確率変数(X, Y ) に確率を与える、結合確率分布 Pr(X = x, Y = y) = h(X, Y )。(講義ノート#03。)

X,Y 単体の確率は、それぞれの周辺分布Pr(X = x) = f (x), Pr(Y = y) = g(y) が与える。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 5 / 27

(6)

新たな確率概念:「X = x」が確定した(それを見た・知らされた) という前提のもとで、「Y = y」が起こる確率

Pr(Y = y|X = x) = g(y|x). (1) を条件付き確率分布と呼ぶ。

縦棒“|” のあとは「○ ○ が起こったとき」という条件。(割り 算ではない!)

条件付き確率は、X の結果に応じてアップデートされる Y の 確率。⇒ X = x 次第で何通りも存在。

一方周辺分布Pr(Y = y) = g(y) は、X の結果を見ずに・知ら ずに考えたY = y の確率。∴ X が Y の予測に有益である限 り、条件付き分布= 周辺分布。

(7)

Remark 1

周辺分布(普通の確率分布)と条件付き分布の違い。

周辺分布Pr(Y = y) = g(y):X = x を考慮せずに与えた Y = y の確率。

条件付き分布Pr(Y = y|X = x) = g(y|x):X = x を考慮して 与えたY = y の確率。∴ X = x に依存して、何通りも存在し うる。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 7 / 27

(8)

Example 1

箱に100 枚のくじ、うち当たりが 40 枚。外れを Y = 0、当たりを Y = 1 と置く。いま、すでに 10 人がくじを引いている。彼らのう ちX = 3, 5 人が当たりを引いたとき、Y = 1 の条件付き確率は

Pr(Y = 1|X = 3) = 40 − 3 100 − 10 =

37

90, Pr(Y = 1|X = 5) = 7 18.

(2) 同様に、もしX = 10 ならば Pr(Y = 1|X = 10) = 13

(9)

Y の条件付き分布の数学的定義は、周辺分布と同時分布の比 g(y|x) = h(x, y)

f(x) , (3)

すなわち

Pr(Y = y|X = x) = Pr(X = x, Y = y)

Pr(X = x) . (4) 確率変数の独立性の定義(講義ノート#03)は

h(x, y) = f (x)g(y). (5)

∴X と Y が独立ならば

g(y|x) = f(x)g(y)

f(x) = g(y). (6)

X = x を見て決めた Y の確率」と「X = x を見ずに決めた Y の確率」が一致。

独立とは「Y の予測に関し X を見ても意味がない」状況。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 9 / 27

(10)

通常の周辺分布g(y) ではなく g(y|x) = Pr(Y = y|X = x) でウェイ ト付けしたY の期待値

m(x) = E(Y |X = x) =yg(y|x) (7) を、条件付き期待値と呼ぶ。

通常のE(Y ) = yg(y):X を無視した、Y の無条件期待値。 条件付き期待値:X = x に応じて変化する Y の期待値。 同様に、条件付き分散は

v(x) = Var(Y |X = x) = E(Y − E(Y |X = x))2|X = x

=(y − m(x))2g(y|x). (8) m(x) = E(Y |X = x)、v(x) = Var(Y |X = x) ともに、X の結 果x に依存。

(11)

条件付き期待値関数

条件付き期待値m(x) = E(Y |X = x) は、X = x を固定したもとで のY の期待値であり、定数。⇒ X が確定する事前の段階では、

m(X) = E(Y |X) (9) はX に依存して確率的に変動。これを条件付き期待値関数

(conditional expectation function、CEF)と呼ぶ。

実現値X = x が確定した m(x) は定数、X が未決定の m(X) は確率変数。

両者の区別は、中級レベルの計量経済学を理解する上で重要。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 11 / 27

(12)

Example 2

サイコロを振って出た目の2 乗 ×100 円だけお金がもらえるゲーム を考える。X をサイコロの目(実現値 x= {1, 2, 3, 4, 5, 6})、もら えるお金をY と置けば、Y のCEF は

m(X) = E(Y |X) = 100X2. (10)

X = 3 が出たなら、E(Y |X = 3) = m(3) = 100 · 32 = 900 は明 らかに定数。

しかしX は事前に不確定⇒ m(X) は X 次第で確率的に変動。

(13)

Remark 2

期待値のいろいろ。

通常の期待値E(Y ):確率変数 Y の代表値。X を見ていない。 条件付き期待値m(x) = E(Y |X = x):特定の X = x を見たう えでの、Y の期待値。x に応じて多数存在するが、そのひと つひとつは定数。

条件付き期待値関数m(X) = E(Y |X):X を不定の確率変数 ととらえた場合の、条件付き期待値。X が確率変数なので、 m(X) も確率変数。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 13 / 27

(14)

計量経済学でよく使われるCEF の性質。

公式 1 (CEF の演算公式 )

定数a, b について、

E(a + bY |X) = a + bE(Y |X), (11) E [s(X)Y |X] = s(X)E(Y |X). (12) ただしs(X) は X の関数。

証明:章末付録参照.

公式(11) は、通常の期待値 E(a + bX) = a + bE(X) と同様。 公式(12):Y = 1、s(X) = X ならば、E(1|X) = 1 なので

E(X|X) = X. (13) 常にX を確認できるならば、X の期待値として X そのもの

(15)

m(X) = E(Y |X) は確率変数、期待値は?⇒ m(X) の不確実性の 源泉である、X の分布 f(x) で期待値をとれば

EX[E(Y |X)] = EX [m(X)] =

x

m(x)f (x). (14) f(x) をウェイトにした期待値なので、EX(·) と表記。

m(x) = E(Y |X = x) の定義に注意して上式を展開すると

EX[E(Y |X)] = 

x

=m(x)



y

y g(y|x)

=h(x,y)/f (x)

f(x)

=

x



y

yh(x, y) =

y

y

x

h(x, y) (15)



xh(x, y) = g(y) なので、結局上式は EX[E(Y |X)] =

y

yg(y) = E(Y ). (16)

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 15 / 27

(16)

この性質を繰り返し期待値の法則と呼ぶ。

公式 2 ( 繰り返し期待値の法則 )

条件付き期待値関数m(X) = E(Y |X) に関し、f(x) をウェイトに 期待値をとると、

E(Y ) = EX[E(Y |X)] . (17) 証明:前段で証明済み。

上式右辺:X = x のすべての場合について、m(X) = E(Y |X) の加重平均をとる。

「(条件付き)期待値の期待値をとると、期待値になる」!... 無条件のE(Y ) と条件付きの E(Y |X) を関係づける、重要な 性質。

(17)

Example 3

サイコロのゲーム・再考:もらえるお金Y の条件付き期待値関数 は(10) 式の通り。

Y の分布 g(y) が不明なので、直接期待値 E(Y ) = yg(y) 計算できない。

しかし繰り返し期待値の法則を使えば E(Y ) = EX[E(Y |X)] = EX(100X2)

= 100 6 1

2+ 100

6 2

2 + · · · +1006 62

≈ 1516.17. (18) ただし等確率f(x) = 1

6 で各目がでることが前提。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 17 / 27

(18)

Section 2

母回帰

(19)

条件付き期待値から回帰分析へ

いま、二次元の母集団分布h(x, y) から抽出されたサンプル数 n の 標本(Xi, Yi) があり、これに基づく YiCEF

E(Yi|Xi) (19) の推定を考える。このとき上式を母回帰関数と呼ぶ。

上式は抽象的なので、具体的な線形回帰モデルを仮定。 E(Yi|Xi) = α + βXi (20) 多次元の母回帰関数として、線形の重回帰モデルでもよい。

E(Yi|X1i, X2i, . . . , Xki) = α + β1X1i+ β1X1i+ · · · + βkXki

(21) 線形性の仮定母回帰係数の推定に目標が集約される。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 19 / 27

(20)

(20) 式は E(Yi|Xi) と Xiの関係。YiXiの依存関係を直接表すも のではない。

YiXiの関係は、誤差項uiを用い次式で表す。

Yi = α + βXi+ ui. (22) おなじみの回帰モデルが、ようやく登場。

注意:古典的仮定と異なり、説明変数Xiは確率変数。∴ 上式 右辺に、二つの確率変数Xiuiが存在。

(21)

(22) 式が (20) 式と矛盾しないためには、uiXiが外生性の仮定

E(ui|Xi) = 0. (23) を満たさなければならない。

この条件下で(22) 式の条件付き期待値をとれば E(Yi|Xi) = E (α + βXi+ ui|Xi)

= α + β E(Xi|Xi)

=Xi

+ E(ui|Xi)

=0

= α + βXi (24)

となり,(20) 式と同値。

外生性が成立せず、例えばE(ui|Xi) =

√Xi = 0 ならば、

E(Yi|Xi) = α + βXi+Xi. (25) (20) 式と矛盾!

外生性は重要な仮定。⇒ 次回以降、詳しく議論。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 21 / 27

(22)

ノンパラメトリック推定

少しだけ寄り道:線形回帰以外の方法による条件付き期待値関数 の推定は?

事前に関数型(一次関数など)の仮定を置かずに、データだ けを頼りにE(Yi|Xi) の推定。

このアプローチをノンパラメトリック推定と呼ぶ。

(23)

Xiが有限の実現値x= {x1, x2, . . . , xp} しかとらず、各実現値につ いて十分サンプル数が多いケース。

この場合、Yiの個々の条件付き期待値m(xs) = E(Yi|Xi = xs)

s= 1, 2, . . . , p)を、グループの標本平均 ˆ

m(xs) = ¯Ys= 1 ns



Xi=xs

Yi, s= 1, 2, . . . , p (26)

で推定可能。(



Xi=xs は、Xi = xsに該当する観測の和をと る、という意味。)

例:Xi = 1, 2, 3, . . . が子どもの数、Yiが母親の労働時間。

子どもの数毎にYiの平均を求めればよい。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 23 / 27

(24)

Xiが区間x= [xmin, xmax] の任意の点を連続的にとるケース。 グループが無数にできる⇒ グループに分けて平均をとるのは

(該当サンプルが少ないので)難しい。 次の方法でm(X) を推定。

1 Xiの最大値・最小値の間に、適当な点

xmin < x1 < x2< . . . < xp< xmaxを定める。

2 以下のように、xsの近傍の平均値を求める。 ˆ

mh(xs) = 1 ns



Xi=xs±h

Yi, s= 1, 2, . . . , p. (27)

定数h だけ幅を持たせてグループを作るので、厳密に Xi = xs

に該当する個体でグループ分けするよりも観測が増える! このh をバンド幅(bandwidth)と呼ぶ。

(25)

ノンパラメトリック推定は重要なテクニックだが、線形回帰ほど の人気はない。

ノンパラメトリックの難点

最適なバンド幅hの決定に、高度な技術。

重回帰に拡張すると、説明変数の実現値の組み合わせ(グルー プ)が大幅増グループあたりのサンプル数が激減。

得られた回帰関数をどう解釈すればよいのか? 線形回帰のメリット

重回帰であっても、高々(k + 1)のパラメータを推定するだけ。

2次関数モデルで曲線の描写も可能。 推定結果の解釈も明確。

∴ このコースでは、線形回帰モデルに集中。

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 25 / 27

(26)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 テキスト第10 章復習問 10.1。

2 テキスト第10 章復習問 10.2。

(27)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

鹿野繁樹 (大阪府立大学) 計量経済学#18 2017 年 12 月更新 27 / 27

参照

関連したドキュメント

(2013) “Expertise differences in a video decision- making task: Speed influences on performance”, Psychology of Sport and Exercise. 293

不明点がある場合は、「質問」機能を使って買い手へ確認してください。

(2011)

データなし データなし データなし データなし

学識経験者 品川 明 (しながわ あきら) 学習院女子大学 環境教育センター 教授 学識経験者 柳井 重人 (やない しげと) 千葉大学大学院

経済学研究科は、経済学の高等教育機関として研究者を

本稿で取り上げる関西社会経済研究所の自治 体評価では、 以上のような観点を踏まえて評価 を試みている。 関西社会経済研究所は、 年

現在まで地域経済統合、域内の平和と秩序という目的と、武力放棄、紛争の平和的解