計量経済学 ( 講義ノート 1999 年度作成，

(1)

計量経済学 ⁽ ^{講義ノート} ¹⁹⁹⁹ ^{年度作成，}

2005 年度改訂， 2006 年度改訂， 2010 年度改訂 )

谷﨑久志神戸大学・経済学部

1

計量経済学について

1

1.1

例

1：マクロの消費関数 . . . . 1

1.2

例

2：日本酒の需要関数 . . . . 1

2

行列について

2 3

最小二乗法について

5 3.1

最小二乗法と回帰直線

. . . . 5

3.2

切片

α

と傾き

β

の推定

. . . . 5

3.3

残差

u b

i の性質について

. . . . 7

3.4

決定係数

R

²について

. . . . 7

3.5

まとめ

. . . . 8

4

統計学の復習

9 4.1

連続型確率変数

. . . . 9

4.2

多変数確率変数

. . . . 10

4.3 f (x)

の関数型，密度関数の種類

. . . . . 10

4.4

統計的推測

. . . . 12

4.4.1

統計量，推定量，推定値

. . . . 12

4.4.2

推定量の望ましい性質

. . . . 17

4.4.3

標本平均

X

の分布

. . . . 19

4.4.4

区間推定

(信頼区間) . . . . 19

4.4.5

仮説検定

. . . . 20

5

統計学の回帰分析への応用

20 5.1

回帰モデルの仮定

. . . . 21

5.2

誤差項

(攪乱項)

の経済学的意味

. . . . 22

5.3 α， b β b

の統計的性質

. . . . 22

5.3.1 β b

について

. . . . 22

5.3.2 α b

について

. . . . 22

5.3.3 α， b β b

の平均

. . . . 22

5.3.4 α， b β b

の分散

. . . . 23

5.3.5 α， b β b

の分布

(σ

²が既知の場合)

. 25 5.3.6 α， b β b

の性質：最良線型不偏性と一致性

. . . . 26

5.4

誤差項

(または，攪乱項) u

_i の分散

σ

² について

. . . . 28

5.4.1 α， b β b

の分散の不偏推定量

. . . . . 30

5.5 α， b β b

の分布

. . . . 31

5.5.1

統計学の復習

(t

分布)

. . . . 31

5.5.2 β b

について：

. . . . 31

5.5.3 α b

について：

. . . . 32

5.5.4

まとめ：

. . . . 32

5.6 α，β

の区間推定

(信頼区間) . . . . 32

5.6.1

統計学の復習：区間推定

(信頼区間) 32 5.6.2 α，β

の区間推定

(信頼区間) . . . . 33

5.7 α，β

の仮説検定

. . . . 33

5.7.1

統計学の復習：仮説検定

. . . . . 33

5.7.2 α，β

の仮説検定

. . . . 34

(2)

5.7.3 t

値について

. . . . 35

6

多重回帰

36 6.1

推定量の性質

. . . . 37

6.2

ダミー変数について

. . . . 38

6.2.1

異常値

. . . . 38

6.2.2

構造変化

. . . . 39

7

関数型について

40 8

系列相関：

DW

について

41 8.1 DW

について

. . . . 41

8.2

系列相関のもとで回帰式の推定

. . . . 43

9

応用例

44 9.1

マクロの消費関数

. . . . 44

9.2

ミクロの消費関数（需要関数）

. . . . 48

9.3

株価，金利，為替レート

. . . . 50

(3)

教科書

『計量経済学』(山本拓著，1995，新世社)

『基本統計学

(第 2

版)』(豊田他著，東洋経済新報社，2002 年)

1 計量経済学について

•

経済理論

(ミクロ，マクロ，財政，金融，国際経済，

・・・

)

•

データ

(GNP，消費，投資，金利，為替レート，・

・・)

計量経済学

= ⇒

経済理論が現実に成り立つものかどうかを，データを用いて，統計的に検証する。

1.1

例

1：マクロの消費関数

C = f (Y )

ただし，C は消費，Y は所得。

1. Y % = ⇒ C % 2. dC

dY =

限界消費性向

=

所得

1

円増加で消費が何円増加するか

3.

すなわち，

dC dY > 0

モデルの定式化

1. C = a + bY 2. b = dC

dY =

限界消費性向

3. a =

基礎消費

(Y = 0

のときに必要な消費)

4.

符号条件：

a > 0，b > 0 (しかも，1 > b)

図

1：消費 (C

_t

)

と所得

(Y

_t

)

0 500 1000 1500 2000 2500 3000

Ct

0 1000 2000 3000 4000

Yt

×

90 91

92 93 94 95

96 97

98

1.

×

−→

実際のデータ

2. (Y

t

, C

t

) = ⇒ t

期のデータ, i.e.,

t = 1, 2, · · · , 9 3. t = 1 = ⇒ 1990

年，

t = 2 = ⇒ 1991

年，

· · ·

，

t = 9 = ⇒ 1998

年，

1.

実際のデータを用いて，a,

b

を求める。

2. a, b

を求める

≡

現実の経済構造を求める

3.

その結果，もし

a > 0，1 > b > 0

なら，経済理論は現実経済を説明していると言える。

1.2

例

2：日本酒の需要関数

Q = f (Y, P

₁

, P

₂

)

ただし，Qは日本酒の需要量，Y は所得，P1 は日本酒の価格，P2 は洋酒の価格。

1. Y % = ⇒ Q % , P

₁

% = ⇒ Q & , P

₂

% = ⇒ Q % 2. ∂Q

∂Y > 0, ∂Q

∂P

1

< 0, ∂Q

∂P

2

> 0

3.

日本酒と洋酒は代替財

(4)

4. (A)

Q = a + b

1

Y + b

2

P

1

+ b

3

P

2

5. Q, Y , P

₁

, P

₂ を用いて，a,

b

₁

, b

₂

, b

₃ を求める

(日本

酒の需要構造を求める)。

6.

符号条件：

b

₁

> 0, b

₂

< 0, b

₃

> 0, a ? 7. t

期のデータ

(Q

t

, Y

t

, P

1t

, P

2t

)

8. T

組のデータ, i.e.,

t = 1, 2, · · · , T 9.

(B)

Q = a + b

1

Y + b

2

P

1

P

₂ 符号条件：

b

1

> 0, b

2

< 0 10.

(C)

log(Q) = a + b

1

log(Y ) + b

2

log( P

1

P

2

)

符号条件：

b

₁

> 0, b

₂

< 0

11.

モデル

(A), (B), (C)

のどれが最も現実的かを得られた結果から判断する。

2 行列について

A

を

2 × 2

行列とすると，

A =

( a

11

a

12

a

₂₁

a

₂₂

)

と表される。

a

ij

= A

の第

i

行，第

j

列の要素

a

を

2 × 1

行列

(縦ベクトル)

とすると，

a = ( a

1

a

2

)

と表される。

a

_i

= a

の第

i

要素

a

を

1 × 2

行列

(横ベクトル)

とすると，

a = ( a

₁

a

₂

)

と表される。

a

i

= a

の第

i

要素

A

を

n × k

行列とすると，

A =



 

a

11

· · · a

1k

.. . . . . .. . a

n1

· · · a

nk



 

と表される。

a

ij

= A

の第

i

行，第

j

列の要素

(ij

要素)

a

を

n × 1

行列

(縦ベクトル)

とすると，

a =



  a

1

.. . a

_n



 

と表される。

a

i

= a

の第

i

要素

a

を

1 × k

行列

(横ベクトル)

とすると，

a = ( a

₁

· · · a

_k

)

と表される。

a

_i

= a

の第

i

要素

行列の等号：

A，B

を

n × k

行列とする。A

= B

は，すべての

i = 1, · · · , n, j = 1, · · · , k

について，aij

= b

ij を意味する。ただし，aij

, b

_ij は，それぞれ，A,

B

の

ij

要素とする。

x = 3, y = 2

の２つの等式を行列で表す。

( x y

)

= ( 3

2 )

または

( x y ) = ( 3 2 )

行列の和と差：

A, B

を

n × k

行列とする。

A + B =



 

a

₁₁

· · · a

_1k

.. . . . . .. . a

n1

· · · a

nk



  +



 

b

₁₁

· · · b

_1k

.. . . . . .. . b

n1

· · · b

nk



 

=



 

a

11

+ b

11

· · · a

1k

+ b

1k

.. . . . . .. . a

_n1

+ b

_n1

· · · a

_nk

+ b

_nk



 

すなわち，A

+ B

の

ij

要素は，aij

+ b

_ij となる。

A = ( 1 2

3 4 )

B = ( 5 6

7 8

)

(5)

A + B =

( 1 + 5 2 + 6 3 + 7 4 + 8

)

=

( 6 8 10 12

)

A − B =

( 1 − 5 2 − 6 3 − 7 4 − 8

)

=

( − 4 − 4

− 4 − 4 )

要素と行列の積：

A

を

n × k

行列とする。cをスカラー

(1 × 1

行列のこと)とする。

cA = c



 

a

₁₁

· · · a

_1k

.. . . . . .. . a

n1

· · · a

nk



  =



 

ca

₁₁

· · · ca

_1k

.. . . . . .. . ca

n1

· · · ca

nk



 

A = ( 1 2

3 4 )

c = 5

のとき

cA = 5 ( 1 2

3 4 )

=

( 5 × 1 5 × 2 5 × 3 5 × 4

)

=

( 5 10 15 20

)

行列と行列の積：

A, B

を

n × k，k × n

行列とする。

AB =



 

a

11

· · · a

1k

.. . . . . .. . a

n1

· · · a

nk



 



 

b

11

· · · b

1n

.. . . . . .. . b

k1

· · · b

kn



 

=



 

∑

k

m=1

a

1m

b

m1

· · · ∑

k

m=1

a

1m

b

mn

.. . . . . .. .

∑

k

m=1

a

_nm

b

_m1

· · · ∑

k

m=1

a

_1m

b

_mn



 

すなわち，ABは

n × n

行列で，ABの

ij

要素は，

a

i1

b

1j

+ a

_i2

b

_2j

+ · · · + a

_ik

b

_kj

= ∑

k

m=1

a

_ik

b

_kj となる。

BA =



 

b

11

· · · b

1n

.. . . . . .. . b

_k1

· · · b

_kn



 



 

a

11

· · · a

1k

.. . . . . .. . a

_n1

· · · a

_nk



 

=



 

∑

n

m=1

b

_1m

a

_m1

· · · ∑

n

m=1

b

_1m

a

_mk

.. . . . . .. .

∑

n

m=1

b

_km

a

_m1

· · · ∑

n

m=1

b

_1m

a

_mk



 

すなわち，BAは

k × k

行列で，

BA

の

ij

要素は，bi1

a

_1j

+ b

i2

a

2j

+ · · · + b

ik

a

kj

= ∑

k

m=1

a

ik

b

kj となる。

このように，ABと

BA

の次元は異なる。

A = ( 1 2

3 4 )

B = ( 5 6

7 8 )

AB = ( 1 2

3 4

) ( 5 6 7 8

)

=

( 1 × 5 + 2 × 7 1 × 6 + 2 × 8 3 × 5 + 4 × 7 3 × 6 + 4 × 8

)

=

( 19 22 43 50

)

BA = ( 5 6

7 8

) ( 1 2 3 4

)

=

( 5 × 1 + 6 × 3 5 × 2 + 6 × 4 7 × 1 + 8 × 3 7 × 2 + 8 × 4

)

=

( 23 34 31 46

)

一般的に，AB

6 = BA

となる。

c

をスカラーとする。

cAB = AcB = (Ac)B = A(cB) = ABc c

をどこで掛けても値は変わらない。

連立方程式：

{

x + 2y = 3 4x + 5y = 6

行列表示すると，

( 1 2 4 5

) ( x y

)

= ( 3

6 )

となる。

また，

 



 

x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12

行列表示すると，



 

1 2 3

5 6 7

9 10 11



 



  x y z



  =



  4 8 12



 

となる。

(6)

単位行列：単位行列とは，対角要素

1，その他 0

となる行列であり，I で表す。

I =



 



1 0 · · · 0 0 1

.. . . . . .. . 1 0 0 · · · 0 1



 



I

が

n × n

行列のとき，In と書くことも多い。

A

を

n × n

行列，xを

n × 1

行列

(ベクトル)

とする。

I

_n

A = AI

_n

= A I

_n

x = x



 

1 0

. . .

0 1



 



 

a

₁₁

· · · a

_1n

.. . . . . .. . a

n1

· · · a

nn



 

=



 

a

11

· · · a

1n

.. . . . . .. . a

n1

· · · a

nn



 



 

1 0

. . .

0 1



 

=



 

a

₁₁

· · · a

_1n

.. . . . . .. . a

n1

· · · a

nn



 



 

1 0

. . .

0 1



 



  x

₁

.. . x

n



  =



  x

₁

.. . x

n



 

逆行列：

A

を

n × n

とする。Aの逆行列とは，AB

= I

n

または

BA = I

n となる

B

を指す。Aも

B

も次元は同じ。

B

を

A

⁻¹ と表す。

すなわち，Aの逆行列は

A

⁻¹であり，A⁻¹の逆行列は

A

である。

A = ( a b

c d )

のとき，

A

⁻¹

= 1 ad − bc

( d − b

− c a )

となる。

A

⁻¹

A = 1 ad − bc

( d − b

− c a

) ( a b c d

)

= 1

ad − bc

( da − bc db − bd

− ca + ac − bc + ad )

= ( 1 0

0 1 )

= I

2

AA

⁻¹

= ( a b

c d )

× 1 ad − bc

( d − b

− c a )

= 1

ad − bc

( ad − bc − ab + ba cd − dc − cb + da

)

= ( 1 0

0 1 )

= I

2

連立方程式の解：

A

を

n × n

行列，xと

b

を

n × 1

行列

(ベクトル)

とする。

Ax = b

両辺に

A

⁻¹を左から掛ける。

A

⁻¹

Ax = A

⁻¹

b A

⁻¹

A = I

n なので，

I

_n

x = A

⁻¹

b

となる。また，

I

n

x = x

なので，xを

A, b

で表すと，

x = A

⁻¹

b

となる。

例

{

x + 2y = 3 4x + 5y = 6

の行列表示は，

( 1 2 4 5

) ( x y

)

= ( 3

6 )

となる。

x, y

の解は，

( 1 2 4 5

)

−1

( 1 2 4 5

) ( x y

)

= ( 1 2

4 5

)

−1

( 3 6

)

なので，

( 1 0 0 1

) ( x y

)

= ( 1 2

4 5 )

₋1

(

3 6

)

(7)

すなわち，

( x y

)

= ( 1 2

4 5 )

₋1

(

3 6

)

= 1

1 × 5 − 2 × 4

( 5 − 2

− 4 1 ) ( 3

6 )

= − 1 1 × 3

( 5 × 3 − 2 × 6

− 4 × 3 + 1 × 6 )

= ( − 1

2 )

例



 

 

x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12

の行列表示は，



 

1 2 3

5 6 7

9 10 11



 



  x y z



  =



  4 8 12



 

となる。x,

y, z

の解は，



  x y z



  =



 

1 2 3

5 6 7

9 10 11



 

−1



  4 8 12



 

となる。

転置行列：

A

を

n × k

行列とする。

A

の

ij

要素を

a

ij とする。

A

の転置行列

(A

⁰ または^t

A)

の

ij

要素は，ajiとなる。

A =



 

a

₁₁

· · · a

_1k

.. . . . . .. . a

n1

· · · a

nk



 

A

⁰

=



 

a

₁₁

· · · a

_n1

.. . . . . .. . a

1k

· · · a

nk



 

A

⁰ は

k × n

となる。

(A

⁰

)

⁰

= A

x =



 

  x

₁

x

2

.. . x

n



 

  x

⁰

= ( x

1

x

2

· · · x

n

)

3 最小二乗法について

経済理論に基づいた線型モデルの係数の値をデータから求める時に用いられる手法

= ⇒

最小二乗法

3.1

最小二乗法と回帰直線

(X

1

, Y

1

), (X

2

, Y

2

), · · · , (X

n

, Y

n

)

のように

n

組のデータがあり，Xi と

Y

i との間に以下の線型関係を想定する。

Y

i

= α + βX

i

,

X

iは説明変数，Yi は被説明変数，α,

β

はパラメータとそれぞれ呼ばれる。

上の式は回帰モデル

(または，回帰式)

と呼ばれる。目的は，切片

α

と傾き

β

をデータ

{ (X

_i

, Y

_i

), i = 1, 2, · · · , n }

から推定すること，

データについて：

1.

タイム・シリーズ

(時系列)・データ： i

が時間を表す

(第 i

期)。

2.

クロス・セクション

(横断面)・データ： i

が個人や企業を表す

(第 i

番目の家計，第

i

番目の企業)。

3.2

切片

α

と傾き

β

の推定

次のような関数

S(α, β)

を定義する。

S(α, β) =

∑

n i=1

u

²_i

=

∑

n i=1

(Y

_i

− α − βX

_i

)

² このとき，

min

α,β

S(α, β)

となるような

α, β

を求める

(最小自乗法)。このときの解

を

α, b β b

とする。

最小化のためには，

∂S(α, β)

∂α = 0

∂S(α, β)

∂β = 0

を満たす

α, β

が

α, b β b

となる。

(8)

すなわち，b

α, β b

は，

∑

n i=1

(Y

_i

− α b − βX b

_i

) = 0, (1)

∑

n i=1

X

i

(Y

i

− α b − βX b

i

) = 0, (2)

を満たす。

さらに，

∑

n i=1

Y

_i

= n α b + β b

∑

n i=1

X

_i

, (3)

∑

n i=1

X

_i

Y

_i

= α b

∑

n i=1

X

_i

+ β b

∑

n i=1

X

_i²

,

行列表示によって，

( ∑

n i=1

Y

i

∑

n i=1

X

i

Y

i

)

=

( n ∑

n i=1

X

i

∑

n i=1

X

i

∑

n i=1

X

_i²

) ( α b β b

) ,

逆行列の公式：

( a b c d

)

₋1

= 1

ad − bc

( d − b

− c a )

b

α, β b

について，まとめて，

( α b β b

)

=

( n ∑

n i=1

X

i

∑

n

i=1

X

_i

∑

n i=1

X

_i²

)

₋1

( ∑

n i=1

Y

i

∑

n i=1

X

_i

Y

_i

)

= 1

n ∑

n

i=1

X

_i²

− ( ∑

n i=1

X

_i

)

²

× ( ∑

n

i=1

X

_i²

− ∑

n i=1

X

i

− ∑

n

i=1

X

_i

n

) ( ∑

n i=1

Y

i

∑

n i=1

X

_i

Y

_i

)

さらに，

β b

について解くと，

β b = n ∑

n

i=1

X

i

Y

i

− ( ∑

n

i=1

X

i

)( ∑

n i=1

Y

i

) n ∑

n

i=1

X

_i²

− ( ∑

n i=1

X

i

)

²

=

∑

n

i=1

X

_i

Y

_i

− nXY

∑

n

i=1

X

_i²

− nX

²

=

∑

n

i=1

(X

i

− X )(Y

i

− Y )

∑

n

i=1

(X

i

− X)

² 連立方程式の

(3)

式から，

b

α = Y − βX b

となる。ただし，

X = 1 n

∑

n i=1

X

_i

, Y = 1 n

∑

n i=1

Y

_i

,

とする。

数値例：以下の数値例を使って，回帰式

Y

_i

= α + βX

_i の

α，β

の推定値

α， b β b

を求める。

i Y

_i

X

_i

1 6 10

2 9 12

3 10 14 4 10 16 b

α， β b

を求めるための公式は

β b =

∑

n

i=1

X

_i

Y

_i

− nXY

∑

n

i=1

X

_i²

− nX

²

b

α = Y − βX b

なので，必要なものは

X，Y

，

∑

n i=1

X

_i²，

∑

n i=1

X

i

Y

i である。

i Y

i

X

i

X

i

Y

i

X

_i²

1 6 10 60 100

2 9 12 108 144

3 10 14 140 196

4 10 16 160 256

合計

∑ Y

i

∑ X

i

∑ X

i

Y

i

∑ X

_i²

35 52 468 696

平均

Y X

8.75 13

よって，

β b = 468 − 4 × 13 × 8.75 696 − 4 × 13

²

= 13

20 = 0.65 b

α = 8.75 − 0.65 × 13 = 0.3

となる。

注意事項：

1. α, β

は真の値で未知

2. α, b β b

は

α, β

の推定値でデータから計算される回帰直線は

Y b

i

= α b + βX b

i

,

として与えられる。

上の数値例では，

Y b

_i

= 0.3 + 0.65X

_i となる。

(9)

i Y

i

X

i

X

i

Y

i

X

_i²

Y b

i

1 6 10 60 100 6.8

2 9 12 108 144 8.1

3 10 14 140 196 9.4

4 10 16 160 256 10.7

合計

∑

Y

_i

∑

X

_i

∑

X

_i

Y

_i

∑

X

_i²

∑ b Y

_i

35 52 468 696 35.0

平均

Y X

8.75 13

図

2： Y

_i，Xi，

Y b

_i

0 5 10

Yi

0 5 10 15 20

Xi

×

× ×

b

Yi→

Y b

i を実績値

Y

i の予測値または理論値と呼ぶ。

b

u

i

= Y

i

− Y b

i

, b

u

_i を残差と呼ぶ。

Y

_i

= Y b

_i

+ u b

_i

= α b + βX b

_i

+ u b

_i

,

さらに，Y を両辺から引いて，

(Y

_i

− Y ) = ( Y b

_i

− Y ) + b u

_i

,

3.3

残差

u ^b

_i の性質について

b

u

i

= Y

i

− α b − βX b

i に注意して，(1)式から，

∑

n i=1

b u

_i

= 0,

を得る。

(2)

式から，

∑

n i=1

X

i

u b

i

= 0,

を得る。

Y b

i

= α b + βX b

i から，

∑

n i=1

Y b

_i

u b

_i

= 0,

を得る。なぜなら，

∑

n i=1

Y b

i

u b

i

=

∑

n i=1

( α b + βX b

i

) b u

i

= α b

∑

n i=1

b u

i

+ β b

∑

n i=1

X

i

u b

i

= 0

である。

i Yi Xi Y

b

i ^u

b

i Xi

b

^ui Y

b

i

b

^ui

1 6 10 6.8

−

0.8

−

8.0

−

5.44 2 9 12 8.1 0.9 10.8 7.29

3 10 14 9.4 0.6 8.4 5.64

4 10 16 10.7

−

0.7

−

11.2

−

7.49

合計

∑

Yi

∑

Xi

∑ b

Yi

∑

^u

b

ⁱ

∑

Xi

b

^uⁱ

∑ b

Yi

b

^uⁱ

35 52 35.0 0.0 0.0 0.00

3.4

決定係数

R

² について

次の式

(Y

_i

− Y ) = ( Y b

_i

− Y ) + b u

_i

,

の両辺を二乗して，総和すると，

∑

n i=1

(Y

i

− Y )

²

=

∑

n i=1

(

( Y b

i

− Y ) + u b

i

)

2

=

∑

n i=1

( Y b

i

− Y )

²

+ 2

∑

n i=1

( Y b

i

− Y ) u b

i

+

∑

n i=1

b u

²_i

=

∑

n i=1

( Y b

_i

− Y )

²

+

∑

n i=1

b u

²_i となる。まとめると，

∑

n i=1

(Y

i

− Y )

²

=

∑

n i=1

( Y b

i

− Y )

²

+

∑

n i=1

b u

²_i を得る。さらに，

1 =

∑

n

i=1

( Y b

_i

− Y )

²

∑

n

i=1

(Y

_i

− Y )

²

+

∑

n i=1

b u

²_i

∑

n

i=1

(Y

_i

− Y )

² それぞれの項は，

(10)

1. ∑

n i=1

(Y

_i

− Y )

²

= ⇒ y

の全変動

2. ∑

n i=1

( Y b

i

− Y )

²

= ⇒ Y b

i

(回帰直線)

で説明される部分

3. ∑

n i=1

b

u

²_i

= ⇒ Y b

i

(回帰直線)

で説明されない部分となる。

回帰式の当てはまりの良さを示す指標として，決定係数

R

² を以下の通りに定義する。

R

²

=

∑

n

i=1

( Y b

i

− Y )

²

∑

n

i=1

(Y

i

− Y )

² または，

R

²

= 1 −

∑

n i=1

b u

²_i

∑

n

i=1

(Y

_i

− Y )

²

,

として書き換えられる。

または，Yi

= Y b

i

+ u b

i と

∑

n i=1

( Y b

i

− Y )

²

=

∑

n i=1

( Y b

i

− Y )(Y

i

− Y − u b

i

)

=

∑

n i=1

(b Y

_i

− Y )(Y

_i

− Y ) −

∑

n i=1

(b Y

_i

− Y ) u b

_i

=

∑

n i=1

(b Y

_i

− Y )(Y

_i

− Y )

を用いて，

R

²

=

∑

n

i=1

( Y b

i

− Y )

²

∑

n

i=1

(Y

i

− Y )

²

=

(∑

n

i=1

(b Y

_i

− Y )

²

)

2

∑

n

i=1

(Y

i

− Y )

²

∑

n

i=1

( Y b

i

− Y )

²

=



 ∑

n

i=1

( Y b

i

− Y )(Y

i

− Y )

√∑

n

i=1

(Y

i

− Y )

²

∑

n

i=1

( Y b

i

− Y )

²





2

と書き換えられる。すなわち，R²は

Y

_i と

Y b

_i の相関係数の二乗と解釈される。

∑

n i=1

(Y

i

− Y )

²

=

∑

n i=1

(b Y

i

− Y )

²

+

∑

n i=1

b

u

²_i から，明らかに，

0 ≤ R

²

≤ 1,

となる。R² が

1

に近づけば回帰式の当てはまりは良いと言える。しかし，t分布のような数表は存在しない。したがって，「どの値よりも大きくなるべき」というような基準はない。

慣習的には，メドとして

0.9

以上を判断基準にする。

数値例：決定係数の計算には以下の公式を用いる。

R

²

= 1 −

∑

n i=1

b u

²_i

∑

n

i=1

(Y

_i

− Y )

²

= 1 −

∑

n i=1

b u

²_i

∑

n

i=1

Y

_i²

− nY

² 計算に必要なものは，b

u

_i

= Y

_i

− ( α b + βX b

_i

)，Y

，

∑

n i=1

Y

_i² である。

i Yi Xi Y

b

i

b

^ui

b

^ui Y_i²

1 6 10 6.8

−

0.8 0.64 36

2 9 12 8.1 0.9 0.81 81

3 10 14 9.4 0.6 0.36 100

4 10 16 10.7

−

0.7 0.49 100

合計

∑

Yi

∑

Xi

∑ b

Yi

∑ b

^ui

∑

^u

b

²i

∑

Y_i²

35 52 35.0 0.0 2.30 317

∑ u b

²_i

= 2.30，X = 13，Y = 8.75，

∑

n i=1

Y

_i²

= 317

なので，

R

²

= 1 − 2.30

317 − 4 × 8.75

²

= 1 − 2.30

10.75 = 0.786

3.5

まとめ

b

α， β b

を求めるための公式は

β b =

∑

n

i=1

X

i

Y

i

− nXY

∑

n

i=1

X

_i²

− nX

²

b

α = Y − βX b

なので，必要なものは

X，Y

，

∑

n i=1

X

_i²，

∑

n i=1

X

i

Y

i である。

決定係数の計算には以下の公式を用いる。

R

²

= 1 −

∑

n i=1

b u

²_i

∑

n

i=1

(Y

_i

− Y )

²

= 1 −

∑

n i=1

b u

²_i

∑

n

i=1

Y

_i²

− nY

² 計算に必要なものは，

∑

b u

²_i，Y，

∑

n i=1

Y

_i² である。

(11)

4 統計学の復習

4.1

連続型確率変数

1.

確率変数：

X (離散型と連続型) 2.

実現値：

x

3.

変数

X

の実現値

x

に対応して，次の

3

つの条件を満たす関数

f (x)

を定義する。

f(x) ≥ 0,

∫

_∞

−∞

f (x)dx = 1, Prob(a < X < b) =

∫

b a

f (x)dx,

ただし，a < bとする。

このとき，X を連続型確率変数，f

(x)

を確率密度関

数

(単に，密度関数)

と呼ぶ。

4.

連続型確率変数において，確率変数が

2

つの実数値

(a, b)

に含まれる確率を

Prob(a < X < b)

として表現する。

5.

連続型確率変数の期待値は，

E(X ) =

∫

_∞

−∞

xf (x)dx

で与えられる。

6.

期待値の公式：

E(aX ) = aE(X ), E(aX + b) = aE(X ) + b,

ただし，a,

b

は定数とする。

7.

また，分散は，

V(X ) =

∫

_∞

−∞

( x − E(X) )

2

f(x)dx

で与えられる。

8.

分散の公式：

V(aX ) = a

²

V(X ), V(aX + b) = a

²

V(X),

9.

分散と期待値：

V(X ) = E (

X − E(X ) )

2

,

= E(X

²

) − ( E(X ) )

2

,

10.

一般的に，g(X

)

の期待値は，

E ( g(X) )

=

∫

_∞

−∞

g(x)f (x)dx,

として得られる。

11. g(X) = X

のとき，X の期待値，

g(X) = (

X − E(X ) )

2

のとき，X の分散となる。

(12)

4.2

多変数確率変数

1. 2

変数確率変数

X

と

Y

の密度関数：

(a)

結合密度関数：

f (x, y) (b)

周辺密度関数：

f (x) =

∫

f (x, y)dy, f (y) =

∫

f (x, y)dx (c)

条件付き密度関数：

f (x | y) = f (x, y)

f (y) = ∫ f (x, y) f (x, y)dx , f (y | x) = f (x, y)

f (x) = ∫ f (x, y) f (x, y)dy (d) X

と

Y

の独立性：f

(x, y) = f (x)f (y)

すなわち，f

(x | y) = f (x), f (y | x) = f (y) 2. 2

変数確率変数

X

と

Y

の期待値，分散，共分散につ

いて：

(a) E(X ) =

∫ ∫

xf(x, y)dxdy E(Y ) =

∫ ∫

yf (x, y)dxdy (b) V(X ) = ∫ ∫ (

x − E(X ) )

2

f (x, y)dxdy V(Y ) = ∫ ∫ (

y − E(Y ) )

2

f (x, y)dxdy (c) Cov(X, Y )

= ∫ ∫ (

x − E(X) )(

y − E(Y ) )

f (x, y)dxdy (d) E(X | Y ) =

∫

xf(x | y)dx E(Y | X ) =

∫

yf (y | x)dy (e) V(X | Y ) =

∫

(x − E(X | Y ) )

2

f (x | y)dx V(Y | X ) =

∫

(y − E(Y | X) )

2

f (y | x)dy (f) Cov(X, Y ) = E(XY ) − E(X )E(Y )

(g) X

と

Y

が独立であれば，Cov(X, Y

) = 0

となる。(逆は言えない)

(h) E(aX + bY ) = aE(X) + bE(Y )

ただし，a,

b

は定数とする。

(i) V(aX +bY ) = a

²

V(X)+2abCov(X, Y )+b

²

V(Y )

(j) X

と

Y

が独立であれば，

V(aX + bY ) = a

²

V(X ) + b

²

V(Y ) 3.

多変数への拡張：

X

1

, X

2

, · · · , X

n の

n

個の確率変数を考える。c1

, c

2

,

· · · , c

n を定数とする。

(a) E(

∑

n i=1

c

i

X

i

) =

∑

n i=1

c

i

E(X

i

)

(b) V(

∑

n i=1

c

i

X

i

) =

∑

n i=1

∑

n j=1

c

i

c

j

Cov(X

i

, X

j

)

i = j

のときは，Cov(Xi

, X

j

) = V(X

i

)

となることに，注意すると，

V(

∑

n i=1

c

_i

X

_i

)

=

∑

n i=1

c

²_i

V(X

i

)

+

∑

n i=1

∑

n j=1 i6=j

c

i

c

j

Cov(X

i

, X

j

)

を得る。

(c)

特に，X1

, X

2

, · · · , X

n が互いに独立の場合は，

V(

∑

n i=1

c

i

X

i

) =

∑

n i=1

c

²_i

V(X

i

)

となる。

4.3 f (x)

の関数型，密度関数の種類

1.

正規分布：

f (x) = 1

√ 2πσ

²

e

⁻^2σ¹²^(x⁻^µ)²

,

ただし，πは円周率

(3.141592...)，e

は自然対数の底

(2.71828...)

である。

(a) µ

について，左右対称

(b) E(X) = µ

(c) V(X) = σ

²

(標準偏差は σ)

(d)

確率変数

X

は平均

µ，分散 σ

² の正規分布に従う。=

⇒ X ∼ N (µ, σ

²

)

(13)

(e) X ∼ N(µ, σ

²

)

のとき，

Prob(µ − σ < X < µ + σ) = 0.683 Prob(µ − 2σ < X < µ + 2σ) = 0.954 Prob(µ − 3σ < X < µ + 3σ) = 0.997

なる。

(f) µ

の大きさによる

N(µ, σ

²

)

の違い。

(g) σ

² の大きさによる

N (µ, σ

²

)

の違い。

2.

標準正規分布：

f(x) = 1

√ 2π e

⁻¹²^x²

,

すなわち，X

∼ N(0, 1) (a) E(X ) = 0

(b) V(X ) = 1

(c) X ∼ N(0, 1)

のとき，

Prob( − 1 < X < 1) = 0.683 Prob( − 2 < X < 2) = 0.954 Prob( − 3 < X < 3) = 0.997

なる。他に，よく使われるパーセント点は，

Prob( − 1.645 < X < 1.645) = 0.90 Prob( − 1.960 < X < 1.960) = 0.95 Prob( − 2.326 < X < 2.326) = 0.99

である。

(d)

正規分布と標準正規分布との関係：

X ∼ N(µ, σ

²

)

のとき，Z

= X − µ

σ

を定義する。

このとき，Z

∼ N (0, 1)

となる。

(e)

正規分布表から確率の計算を行う。

3.

正規分布の特徴：

(a) n

個の独立な確率変数

X

1

, X

2

, · · · , X

nが同一の正規分布

N (µ, σ

²

)

に従うものとする。このとき，

∑

n i=1

c

i

X

i

∼ N (µ

∑

n i=1

c

i

, σ

²

∑

n i=1

c

²_i

)

となる。

(b)

特に，標本平均

X = 1 n

∑

n i=1

X

_iを考えると，

X ∼ N(µ, σ

²

n )

となる。(すべての

i

について，ci

= 1

n

の場合を考えればよい。)

(c) n

X

₁

, X

₂

, · · · , X

_n が同一の平均

µ，分散 σ

² の分布に従うものとする。(正規分布を仮定しない)

このとき，nが大きくなるにつれて，

X − µ σ/ √

n

は，

標準正規分布に近づく。すなわち，

X − µ σ/ √

n −→ N (0, 1)

となる。

= ⇒

中心極限定理

4. χ

²

(カイ二乗)

分布：

m

個の確率変数

Z

1

, Z

2

, · · · , Z

mは，互いに独立な標準正規分布に従うものとする。このとき，Y

=

∑

m i=1

Z

_i² は，自由度

m

の

χ

²分布に従う。

Y ∼ χ

²

(m)，または，Y ∼ χ

²_mと表記する。

χ

²

(カイ二乗)

分布表から確率を求める。

Y ∼ χ

²

(m)

のとき，

E(Y ) = m，V(Y ) = 2m

となる。

(証明略)

(a) 2

つの独立な

χ

² 分布からの確率変数

X , Y

を考える。X

∼ χ

²

(n)，Y ∼ χ

²

(m)

とする。このとき，Z

= X + Y ∼ χ

²

(n + m)

となる。(証明略)

(b) n

X

₁

, X

₂

, · · · , X

_n が同一の

正規分布

N (µ, σ

²

)

に従うものとする。

(c) X

i

− µ

σ ∼ N (0, 1)

なので，

( X

i

− µ σ

)

2

∼ χ

²

(1)

となる。

X

₁

− µ

σ , X

₂

− µ

σ , · · · , X

_n

− µ

σ

はそれぞれ独立なので，

∑

n i=1

( X

i

− µ σ

)

2

∼ χ

²

(n)

となる。

計量経済学 ( 講義ノート 1999 年度作成，