• 検索結果がありません。

Cov(Xi,ui)=0(7.4.1節) (2b) Xi はui は相関あり

N/A
N/A
Protected

Academic year: 2021

シェア "Cov(Xi,ui)=0(7.4.1節) (2b) Xi はui は相関あり"

Copied!
23
0
0

読み込み中.... (全文を見る)

全文

(1)

7.4 説明変数:確率変数のケース

本節では,簡単化のために,単回帰Yi =α+βXi+ui を考える。

(1) Xi は非確率変数 −→ 今までの最小二乗推定量

(2) Xi は確率変数

(2a) Xi ui は相関なし −→ Cov(Xi,ui)=07.4.1節)

(2b) Xi ui は相関あり −→ Cov(Xi,ui),0(7.4.2節)

(2)

7.4.1 説明変数と誤差項に相関がない場合

最小二乗法による推定量:

βˆ =

P(XiX)(YiY)

P(XiX)2 =β+X ωiui

ただし,ωi = XiX

P(XjX)2 とする。

X= (X1, X2, · · ·, Xn)とする。

(3)

—————————–

(*復習) 2つの確率変数(XY)の独立について:

X Y の同時密度関数 fxy(x,y) X の周辺密度関数 fx(x)

Y の周辺密度関数 fy(y)

Y を与えたもとでXの条件付き密度関数 fx|y(x|y)

fxy(x,y)= fx|y(x|y)fy(y)は必ず成り立つ。

fxy(x,y)= fx(x)fy(y) ⇐⇒ X Y は独立

fx|y(x|y)= fx(x) ⇐⇒ X Y は独立

—————————–

(4)

—————————–

(*復習) 2つの確率変数(XY)の独立について(その2

X Y が独立のとき,

Cov(X,Y)=0

E(X|Y)=E(X),V(X|Y)=V(X) となる。

—————————–

条件付き期待値を取ると,

E( ˆβ|X)=E(β+X

i

ωiui|X)= β+X

i

ωiE(ui|X)= β

となり,βˆ βの不偏推定量となる。

(5)

ωiX1X2· · ·Xnの関数となっている。

X= (X1, X2, · · ·, Xn)uiに相関がない場合,すなわち,j=1,2,· · ·,nについてCov(Xj,ui)= 0の場合,E(ui|X)= E(ui)=0となる。

条件付き分散については,

V( ˆβ|X)= V(β+X

i

ωiui|X)=V(X

i

ωiui|X)= X

i

ω2iV(ui|X)= σ2X

i

ω2i = σ2 P

i(XiX)2

となる。

すなわち,説明変数が確率変数であっても,誤差項と相関がなければ,何も変更せずに,

最小二乗法を適用することができる。

(6)

7.4.2 説明変数と誤差項に相関がある場合

Xuiに相関がある場合,E(ui|X), E(ui)=0となるので,

E( ˆβ|X)=E(β+X

i

ωiui|X)= β+X

i

ωiE(ui|X), β

となる。

したがって,βˆβの不偏推定量とはならない。

βˆ βの一致推定量かどうか?

βˆ =β+X

i

ωiui =β+ P

i(XiX)ui

P

j(XjX)2

(7)

=β+

1 n

P

i(XiX)ui

1 n

P

j(XjX)2 −→ β+ Mxu

Mxx ,β ただし,n −→ ∞ のとき,1nP

i(Xi X)ui −→ Mxu , 0,1nP

i(Xi X)2 −→ Mxx とする。

n −→ ∞のときは,分子・分母は別々に計算することができる(証明略)。

Mxuは,n −→ ∞のとき,Xi ui の共分散に相当する。Mxxは,n −→ ∞のとき,Xi 分散に相当する。

以上から,βˆβの不偏推定量でも一致推定量でもない。

ˆ

αも同様に不偏推定量でも一致推定量でもない。

(8)

なぜなら,αˆ は,

ˆ

α=YβXˆ =α+X

i

λiui

と書き換えられる(5.3.2節参照)。

ただし,λi = 1

n iとする。

λi Xの関数である。

● 例:Xに観測誤差(measurement error)が含まれる場合: 真のモデルを

Yi =α+βXi

とする。(YiXi)は非確率変数とする。

(9)

しかし,(YiXi)は観測されず,代わりに,(YiXi)が観測されるものとする。

(YiXi)(YiXi)との関係は以下の通りとする。

Yi =Yi+ui, Xi = Xi+vi

ui,vi は観測誤差と呼ばれるもので,

E(ui)= 0, V(ui)=σ2u E(vi)= 0, V(vi)=σ2v

を仮定する。

さらに,ui,viは互いに独立と仮定する。

(10)

すなわち,i, jとなるすべてのijについてCov(ui,uj)= Cov(vi,vj)=0,かつ,すべて ijについてCov(ui,vj)=0とする。

Yi=α+βXiYi = Yi+uiXi =Xi+viを代入する。

Yi =α+βXi+(uiβvi)

観測されるのは(Yi,Xi)なので,(ui βvi)を誤差項として,最小二乗法でβˆを求める。

まずは,Xiuiβvi の共分散を求める(共分散がゼロかどうかを確認する)。

(11)

—————————–

(*復習)共分散について:

2つの確率変数(X,Y)を考える。

E(X)=µx,E(Y)= µy とする。

共分散の定義は,Cov(X,Y)=E

(Xµx)(Y µy)

書き換えると,

Cov(X,Y)=E(XY yµxY +µxµy)=E(XY)E(X)µyµxE(Y)+µxµy = E(XY)µxµy となる。

—————————–

(12)

この場合,

Cov(Xi, uiβvi)= Cov(Xi +vi, uiβvi)

= E

(Xi+vi)(uiβvi)

E(Xi+vi)E(uiβvi)

= E(Xiui+viuiXiβviβv2i)

= E(Xiui)+E(viui)E(Xiβvi)E(βv2i)

= XiE(ui)+E(viui)XiβE(vi)βE(v2i)

= −βσ2v ,0

となる。

したがって,観測できる(YiXi)を用いて,βの最小二乗推定量βˆ は不偏推定量にはなら ない。

(13)

特に,

βˆ =

P(XiX)(YiY)

P(XiX)2 =β+X

ωi(uiβvi)

=β+

P(XiX)(uiβvi) P(XiX)2

=β+

1 n

P(XiX)(uiβvi)

1 n

P(XiX)2

と書き換えられ,右辺第2項の分母はXiの分散に対応し,分子はXi (uiβvi)との共分散

−βσ2v に対応する。

したがって,n −→ ∞のとき,

βˆ −→ β+ −βσ2v Mxx

(14)

となる。右辺第2項の分母は必ず正,分子はβが正(負)の場合は負(正)となる。

すなわち,

β >0のとき,βˆ −→ β βσ2v Mxx < β

β <0のとき,βˆ −→ β βσ2v Mxx > β となる。

(15)

X uiに相関がある場合の対処法: Yi = α+βXi+uiについて,Cov(Xi,ui), 0のとき を考える。

βˆ = P

i(XiX)(YiY)

P

i(XiX)2 =β+

P

i(XiX)ui P

j(XjX)2

=β+

1 n

P

i(XiX)ui

1 n

P

j(XjX)2 −→ β+ Mxu

Mxx ,β

右辺第2項の分母は Xi の分散に相当し,分子はXi uiの共分散に相当する(n −→ ∞ ときは,分子・分母を別々に計算することができる)。

Cov(Xi,ui),0が問題となって,E( ˆβ),βとなる。

よって,第2項の分子がゼロになるような修正を加えればよい。

(16)

Cov(Zi,ui)= 0となるZiが存在するとする。

このとき,下記のような推定量

eβ= P

i(ZiZ)(YiY) P

i(ZiZ)(XiX)

を考えてみよう。ただし,Z = 1 n

X

i

Ziとする。

(*) Zi Xiで置き換えると,eβは最小二乗推定量βˆ = P

i(XiX)(YiY)

P

i(XiX)2 に等しくなる。

eβを変形していく。

(17)

eβ= P

i(ZiZ)(YiY)

P

i(ZiZ)(XiX)

= P

i(ZiZ)YiYP

i(ZiZ) P

i(ZiZ)(XiX)

= P

i(ZiZ)Yi P

i(ZiZ)(XiX)

=X

i

ωiYi, ただし,ωi = ZiZ P

j(ZjZ)(XjX)

= P

i(ZiZ)(α+βXi+ui)

P

i(ZiZ)(XiX)

= αP

i(ZiZ)+βP

i(ZiZ)Xi+P

i(ZiZ)ui P

i(ZiZ)(XiX)

=β+ P

i(ZiZ)ui P

i(ZiZ)(XiX)

=β+X

i

ωiui

=β+

1 n

P

i(ZiZ)ui

1 n

P

i(ZiZ)(XiX) −→ β+ 0

Mzx =β

(18)

2行目の右辺の分子の第2項目はP

i(ZiZ)=P

iZinZ = 0に注意。

3行目では,eβ = P

i(ZiZ)Yi P

i(ZiZ)(XiX) =X

i

ωiYiと書き換えることができ,eβYi の線形推 定量と言える。

ただし,ωi = ZiZ P

j(ZjZ)(XjX) である(分母の添字をiから jに変更)。

4行目の右辺分子の第1項目はゼロ,第2項目はP

i(ZiZ)Xi = P

i(ZiZ)XiP

i(ZiZ)X =

P

i(ZiZ)(XiX)となるので分母と同じになる。このようにして,5行目が得られる。

6行目右辺第2項の分子は Zi ui の共分散に対応し,分母はZi Xiの共分散に対応し,

nを大きくするとそれぞれゼロ,Mzxに収束するものとする。

すなわち,eββの一致推定量となる。

(19)

nが大きければ,E(ωiui)−→0となる(分子・分母を別々に計算することができる)。

しかし,一般的には,E(ωiui) ,0なので(ωi の分母はXi に依存していて,Xi uiは共 分散がゼロでないと仮定),E(eβ), βとなり,eβは不偏推定量にはならない。

Zi を操作変数(instrumental variable)と呼ぶ。操作変数を用いた推定方法を操作変数法 という。

Zi の選択について,(i)Zi ui は相関がない,(ii)ZiXi は強い相関がある,という2 の条件が必要になる。

(ii)については,Ziはもともと Xi の代わりに使うものなので,Xi と相関の強いZi が望ま しい。

(20)

Ziの選択について(その1 iが時間を表す場合(時系列データの場合),Zi = Xi−1 用いることが可能である。

Cov(Xi,ui),0としても,X を一期ずらしてCov(Xi−1,ui)=0となるのは不自然ではない。

Ziの選択について(その2) Xiの予測値Xˆi Xiの代わりに用いる。

ei を誤差項として,

Xi = γ0+γ1W1i+γ2W2i + · · · +γmWmi+ei

を最小二乗法で推定して,γˆ0γˆ1,· · ·,γˆmを求める。

ただし,W1i,W2i,· · ·,Wmi ui と相関のない変数でなければならない。

(21)

W1iW2i· · ·Wmiには,Xi−1Xi−2· · ·のようにXi のラグ変数を用いてもよい。理由は,

前述の通りで,Xiuiに相関かあったとしても,Xiのラグ変数Xi−1Xi−2· · ·uiとに相 関があるとは考えにくいからである。

Xiの予測値Xˆi を求める。

Xˆi = γˆ0+γˆ1W1i+γˆ2W2i + · · · +γˆmWmi

Ziとして用いる。

Zi ui と相関のない変数でなければならない。

ˆ

γj γjの一致推定量なので,n −→ ∞のとき,

Xˆi = γˆ0+γˆ1W1i+γˆ2W2i + · · · +γˆmWmi −→ γ0+γ1W1i+γ2W2i+ · · · +γmWmi

(22)

となる。

操作変数法による推定量eββの一致推定量になる理由は,

eβ=β+

1 n

P

i(ZiZ)ui

1 n

P

i(ZiZ)(XiX) −→ β+ 0

Mzx =β

から,操作変数Zi と誤差項ui との相関がゼロという条件(2項目の分子)が重要なポイン トとなっている。

Zi Xˆiを用いると,n −→ ∞のとき,Xˆi −→ γ0+γ1W1i+γ2W2i+ · · · +γmWmiとなるこ とから,W1i,W2i,· · ·,Wmi ui と相関がなければ,1nP

i( ˆXi X)ui −→ 0となる(Xˆ = X

に注意)。

この方法は,二段階最小二乗法(two-stage least squares method)と呼ばれる。1段階目

(23)

Xˆi を求める。2段階目でeβを得る。

参照

関連したドキュメント

浸透圧調節系は抗利尿ホルモンが水分の出納により血

ISSUE

(See Section 4 for the obstruction.) For principally polarized abelian varieties in general, 1 Flach [Fl] proved that the pairing is antisymmetric, by which we mean hx, yi = −hy, xi

Ngoc; Exponential decay and blow-up results for a nonlinear heat equation with a viscoelastic term and Robin conditions, Annales Polonici Mathematici 119 (2017), 121-145..

We prove a continuous embedding that allows us to obtain a boundary trace imbedding result for anisotropic Musielak-Orlicz spaces, which we then apply to obtain an existence result

This concludes the proof that the Riemann problem (1.6) admits a weak solution satisfying the boundary condition in the relaxed sense (1.6c).... The two manifolds are transverse and

補助上限額 (1日あたり) 7時間 約26.9万円 4時間 約15.4万円.

the fairy godmother, pigeon or other intermediary helps Cinderella), XI (departure: she goes to the ball), XVII (marking: she loses her glass slipper the palace steps), XX (return: