計量経済学 ( 講義ノート 1999 年度作成,
2005 年度改訂, 2006 年度改訂, 2010 年度改訂 )
谷﨑 久志 神戸大学・経済学部
目 次
1
計量経済学について1
1.1
例1: マクロの消費関数 . . . . 1
1.2
例2: 日本酒の需要関数 . . . . 1
2
行列について2 3
最小二乗法について5 3.1
最小二乗法と回帰直線. . . . 5
3.2
切片α
と傾きβ
の推定. . . . 5
3.3
残差u b
i の性質について. . . . 7
3.4
決定係数R
2について. . . . 7
3.5
まとめ. . . . 8
4
統計学の復習9 4.1
連続型確率変数. . . . 9
4.2
多変数確率変数. . . . 10
4.3 f (x)
の関数型,密度関数の種類. . . . . 10
4.4
統計的推測. . . . 12
4.4.1
統計量,推定量,推定値. . . . 12
4.4.2
推定量の望ましい性質. . . . 17
4.4.3
標本平均X
の分布. . . . 19
4.4.4
区間推定(信頼区間) . . . . 19
4.4.5
仮説検定. . . . 20
5
統計学の回帰分析への応用20 5.1
回帰モデルの仮定. . . . 21
5.2
誤差項(攪乱項)
の経済学的意味. . . . 22
5.3 α, b β b
の統計的性質. . . . 22
5.3.1 β b
について. . . . 22
5.3.2 α b
について. . . . 22
5.3.3 α, b β b
の平均. . . . 22
5.3.4 α, b β b
の分散. . . . 23
5.3.5 α, b β b
の分布(σ
2が既知の場合). 25 5.3.6 α, b β b
の性質:最良線型不偏性と一 致性. . . . 26
5.4
誤差項(または,攪乱項) u
i の分散σ
2 に ついて. . . . 28
5.4.1 α, b β b
の分散の不偏推定量. . . . . 30
5.5 α, b β b
の分布. . . . 31
5.5.1
統計学の復習(t
分布). . . . 31
5.5.2 β b
について:. . . . 31
5.5.3 α b
について:. . . . 32
5.5.4
まとめ:. . . . 32
5.6 α,β
の区間推定(信頼区間) . . . . 32
5.6.1
統計学の復習: 区間推定(信頼区間) 32 5.6.2 α,β
の区間推定(信頼区間) . . . . 33
5.7 α,β
の仮説検定. . . . 33
5.7.1
統計学の復習: 仮説検定. . . . . 33
5.7.2 α,β
の仮説検定. . . . 34
5.7.3 t
値について. . . . 35
6
多重回帰36 6.1
推定量の性質. . . . 37
6.2
ダミー変数について. . . . 38
6.2.1
異常値. . . . 38
6.2.2
構造変化. . . . 39
7
関数型について40 8
系列相関:DW
について41 8.1 DW
について. . . . 41
8.2
系列相関のもとで回帰式の推定. . . . 43
9
応用例44 9.1
マクロの消費関数. . . . 44
9.2
ミクロの消費関数(需要関数). . . . 48
9.3
株価,金利,為替レート. . . . 50
教科書
『計量経済学』(山本拓著,1995,新世社)
『基本統計学
(第 2
版)』(豊田他著,東洋経済新報社,2002 年)1 計量経済学について
•
経済理論(ミクロ,マクロ,財政,金融,国際経済,
・・・)
•
データ(GNP,消費,投資,金利,為替レート,・
・・)計量経済学
= ⇒
経済理論が現実に成り立つものかどうか を,データを用いて,統計的に検証する。1.1
例1: マクロの消費関数
C = f (Y )
ただし,C は消費,Y は所得。
1. Y % = ⇒ C % 2. dC
dY =
限界消費性向=
所得1
円増加で消費が何円増 加するか3.
すなわち,dC dY > 0
モデルの定式化
1. C = a + bY 2. b = dC
dY =
限界消費性向3. a =
基礎消費(Y = 0
のときに必要な消費)4.
符号条件:a > 0,b > 0 (しかも,1 > b)
図
1: 消費 (C
t)
と所得(Y
t)
0 500 1000 1500 2000 2500 3000
Ct
0 1000 2000 3000 4000
Yt
×
×
×
×
×
×
×
×
×
90 91
92 93 94 95
96 97
98
1.
×−→
実際のデータ2. (Y
t, C
t) = ⇒ t
期のデータ, i.e.,t = 1, 2, · · · , 9 3. t = 1 = ⇒ 1990
年,t = 2 = ⇒ 1991
年,· · ·
,t = 9 = ⇒ 1998
年,1.
実際のデータを用いて,a,b
を求める。2. a, b
を求める≡
現実の経済構造を求める3.
その結果,もしa > 0,1 > b > 0
なら,経済理論は 現実経済を説明していると言える。1.2
例2: 日本酒の需要関数
Q = f (Y, P
1, P
2)
ただし,Qは日本酒の需要量,Y は所得,P1 は日本酒の 価格,P2 は洋酒の価格。
1. Y % = ⇒ Q % , P
1% = ⇒ Q & , P
2% = ⇒ Q % 2. ∂Q
∂Y > 0, ∂Q
∂P
1< 0, ∂Q
∂P
2> 0
3.
日本酒と洋酒は代替財4.
モデルの定式化(A)
Q = a + b
1Y + b
2P
1+ b
3P
25. Q, Y , P
1, P
2 を用いて,a,b
1, b
2, b
3 を求める(日本
酒の需要構造を求める)。6.
符号条件:b
1> 0, b
2< 0, b
3> 0, a ? 7. t
期のデータ(Q
t, Y
t, P
1t, P
2t)
8. T
組のデータ, i.e.,t = 1, 2, · · · , T 9.
モデルの定式化(B)
Q = a + b
1Y + b
2P
1P
2 符号条件:b
1> 0, b
2< 0 10.
モデルの定式化(C)
log(Q) = a + b
1log(Y ) + b
2log( P
1P
2)
符号条件:b
1> 0, b
2< 0
11.
モデル(A), (B), (C)
のどれが最も現実的かを得られ た結果から判断する。2 行列について
A
を2 × 2
行列とすると,A =
( a
11a
12a
21a
22)
と表される。
a
ij= A
の第i
行,第j
列の要素a
を2 × 1
行列(縦ベクトル)
とすると,a = ( a
1a
2)
と表される。
a
i= a
の第i
要素a
を1 × 2
行列(横ベクトル)
とすると,a = ( a
1a
2)
と表される。
a
i= a
の第i
要素A
をn × k
行列とすると,A =
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
と表される。
a
ij= A
の第i
行,第j
列の要素(ij
要素)a
をn × 1
行列(縦ベクトル)
とすると,a =
a
1.. . a
n
と表される。
a
i= a
の第i
要素a
を1 × k
行列(横ベクトル)
とすると,a = ( a
1· · · a
k)
と表される。a
i= a
の第i
要素行列の等号:
A,B
をn × k
行列とする。A= B
は,す べてのi = 1, · · · , n, j = 1, · · · , k
について,aij= b
ij を意 味する。ただし,aij, b
ij は,それぞれ,A,B
のij
要素 とする。x = 3, y = 2
の2つの等式を行列で表す。( x y
)
= ( 3
2 )
または
( x y ) = ( 3 2 )
行列の和と差:A, B
をn × k
行列とする。A + B =
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
+
b
11· · · b
1k.. . . . . .. . b
n1· · · b
nk
=
a
11+ b
11· · · a
1k+ b
1k.. . . . . .. . a
n1+ b
n1· · · a
nk+ b
nk
すなわち,A
+ B
のij
要素は,aij+ b
ij となる。A = ( 1 2
3 4 )
B = ( 5 6
7 8
)
A + B =
( 1 + 5 2 + 6 3 + 7 4 + 8
)
=
( 6 8 10 12
)
A − B =
( 1 − 5 2 − 6 3 − 7 4 − 8
)
=
( − 4 − 4
− 4 − 4 )
要素と行列の積:
A
をn × k
行列とする。cを スカラー(1 × 1
行列のこと)とする。cA = c
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
=
ca
11· · · ca
1k.. . . . . .. . ca
n1· · · ca
nk
A = ( 1 2
3 4 )
c = 5
のときcA = 5 ( 1 2
3 4 )
=
( 5 × 1 5 × 2 5 × 3 5 × 4
)
=
( 5 10 15 20
)
行列と行列の積:
A, B
をn × k,k × n
行列とする。AB =
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
b
11· · · b
1n.. . . . . .. . b
k1· · · b
kn
=
∑
km=1
a
1mb
m1· · · ∑
km=1
a
1mb
mn.. . . . . .. .
∑
km=1
a
nmb
m1· · · ∑
km=1
a
1mb
mn
すなわち,ABは
n × n
行列で,ABのij
要素は,a
i1b
1j+ a
i2b
2j+ · · · + a
ikb
kj= ∑
km=1
a
ikb
kj となる。BA =
b
11· · · b
1n.. . . . . .. . b
k1· · · b
kn
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
=
∑
nm=1
b
1ma
m1· · · ∑
nm=1
b
1ma
mk.. . . . . .. .
∑
nm=1
b
kma
m1· · · ∑
nm=1
b
1ma
mk
すなわち,BAは
k × k
行列で,BA
のij
要素は,bi1a
1j+ b
i2a
2j+ · · · + b
ika
kj= ∑
km=1
a
ikb
kj となる。このように,ABと
BA
の次元は異なる。A = ( 1 2
3 4 )
B = ( 5 6
7 8 )
AB = ( 1 2
3 4
) ( 5 6 7 8
)
=
( 1 × 5 + 2 × 7 1 × 6 + 2 × 8 3 × 5 + 4 × 7 3 × 6 + 4 × 8
)
=
( 19 22 43 50
)
BA = ( 5 6
7 8
) ( 1 2 3 4
)
=
( 5 × 1 + 6 × 3 5 × 2 + 6 × 4 7 × 1 + 8 × 3 7 × 2 + 8 × 4
)
=
( 23 34 31 46
)
一般的に,AB
6 = BA
となる。c
をスカラーとする。cAB = AcB = (Ac)B = A(cB) = ABc c
をどこで掛けても値は変わらない。連立方程式:
{
x + 2y = 3 4x + 5y = 6
行列表示すると,( 1 2 4 5
) ( x y
)
= ( 3
6 )
となる。
また,
x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12
行列表示すると,
1 2 3
5 6 7
9 10 11
x y z
=
4 8 12
となる。
単位行列: 単位行列とは,対角要素
1,その他 0
となる 行列であり,I で表す。I =
1 0 · · · 0 0 1
.. . . . . .. . 1 0 0 · · · 0 1
I
がn × n
行列のとき,In と書くことも多い。A
をn × n
行列,xをn × 1
行列(ベクトル)
とする。I
nA = AI
n= A I
nx = x
1 0
. . .
0 1
a
11· · · a
1n.. . . . . .. . a
n1· · · a
nn
=
a
11· · · a
1n.. . . . . .. . a
n1· · · a
nn
1 0
. . .
0 1
=
a
11· · · a
1n.. . . . . .. . a
n1· · · a
nn
1 0
. . .
0 1
x
1.. . x
n
=
x
1.. . x
n
逆行列:
A
をn × n
とする。Aの逆行列とは,AB= I
nまたは
BA = I
n となるB
を指す。AもB
も次元は同じ。B
をA
−1 と表す。すなわち,Aの逆行列は
A
−1であり,A−1の逆行列はA
である。A = ( a b
c d )
のとき,
A
−1= 1 ad − bc
( d − b
− c a )
となる。
A
−1A = 1 ad − bc
( d − b
− c a
) ( a b c d
)
= 1
ad − bc
( da − bc db − bd
− ca + ac − bc + ad )
= ( 1 0
0 1 )
= I
2AA
−1= ( a b
c d )
× 1 ad − bc
( d − b
− c a )
= 1
ad − bc
( ad − bc − ab + ba cd − dc − cb + da
)
= ( 1 0
0 1 )
= I
2連立方程式の解:
A
をn × n
行列,xとb
をn × 1
行列(ベクトル)
とする。Ax = b
両辺に
A
−1を左から掛ける。A
−1Ax = A
−1b A
−1A = I
n なので,I
nx = A
−1b
となる。また,I
nx = x
なので,xを
A, b
で表すと,x = A
−1b
となる。例
{
x + 2y = 3 4x + 5y = 6
の行列表示は,( 1 2 4 5
) ( x y
)
= ( 3
6 )
となる。
x, y
の解は,( 1 2 4 5
)
−1( 1 2 4 5
) ( x y
)
= ( 1 2
4 5
)
−1( 3 6
)
なので,
( 1 0 0 1
) ( x y
)
= ( 1 2
4 5 )
−1(
3 6
)
すなわち,
( x y
)
= ( 1 2
4 5 )
−1(
3 6
)
= 1
1 × 5 − 2 × 4
( 5 − 2
− 4 1 ) ( 3
6 )
= − 1 1 × 3
( 5 × 3 − 2 × 6
− 4 × 3 + 1 × 6 )
= ( − 1
2 )
例
x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12
の行列表示は,
1 2 3
5 6 7
9 10 11
x y z
=
4 8 12
となる。x,
y, z
の解は,
x y z
=
1 2 3
5 6 7
9 10 11
−1
4 8 12
となる。
転置行列:
A
をn × k
行列とする。A
のij
要素をa
ij とする。A
の転置行列(A
0 またはtA)
のij
要素は,ajiとなる。A =
a
11· · · a
1k.. . . . . .. . a
n1· · · a
nk
A
0=
a
11· · · a
n1.. . . . . .. . a
1k· · · a
nk
A
0 はk × n
となる。(A
0)
0= A
x =
x
1x
2.. . x
n
x
0= ( x
1x
2· · · x
n)
3 最小二乗法について
経済理論に基づいた線型モデルの係数の値をデータから求 める時に用いられる手法
= ⇒
最小二乗法3.1
最小二乗法と回帰直線(X
1, Y
1), (X
2, Y
2), · · · , (X
n, Y
n)
のようにn
組のデータが あり,Xi とY
i との間に以下の線型関係を想定する。Y
i= α + βX
i,
X
iは説明変数,Yi は被説明変数,α,β
はパラメータとそ れぞれ呼ばれる。上の式は回帰モデル
(または,回帰式)
と呼ばれる。目的 は,切片α
と傾きβ
をデータ{ (X
i, Y
i), i = 1, 2, · · · , n }
から推定すること,データについて:
1.
タイム・シリーズ(時系列)・データ: i
が時間を表す(第 i
期)。2.
クロス・セクション(横断面)・データ: i
が個人や企 業を表す(第 i
番目の家計,第i
番目の企業)。3.2
切片α
と傾きβ
の推定次のような関数
S(α, β)
を定義する。S(α, β) =
∑
n i=1u
2i=
∑
n i=1(Y
i− α − βX
i)
2 このとき,min
α,β
S(α, β)
となるような
α, β
を求める(最小自乗法)。このときの解
をα, b β b
とする。最小化のためには,
∂S(α, β)
∂α = 0
∂S(α, β)
∂β = 0
を満たす
α, β
がα, b β b
となる。すなわち,b
α, β b
は,∑
n i=1(Y
i− α b − βX b
i) = 0, (1)
∑
n i=1X
i(Y
i− α b − βX b
i) = 0, (2)
を満たす。さらに,
∑
n i=1Y
i= n α b + β b
∑
n i=1X
i, (3)
∑
n i=1X
iY
i= α b
∑
n i=1X
i+ β b
∑
n i=1X
i2,
行列表示によって,( ∑
n i=1Y
i∑
n i=1X
iY
i)
=
( n ∑
n i=1X
i∑
n i=1X
i∑
n i=1X
i2) ( α b β b
) ,
逆行列の公式:( a b c d
)
−1= 1
ad − bc
( d − b
− c a )
b
α, β b
について,まとめて,( α b β b
)
=
( n ∑
n i=1X
i∑
ni=1
X
i∑
n i=1X
i2)
−1( ∑
n i=1Y
i∑
n i=1X
iY
i)
= 1
n ∑
ni=1
X
i2− ( ∑
n i=1X
i)
2× ( ∑
ni=1
X
i2− ∑
n i=1X
i− ∑
ni=1
X
in
) ( ∑
n i=1Y
i∑
n i=1X
iY
i)
さらに,
β b
について解くと,β b = n ∑
ni=1
X
iY
i− ( ∑
ni=1
X
i)( ∑
n i=1Y
i) n ∑
ni=1
X
i2− ( ∑
n i=1X
i)
2=
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2=
∑
ni=1
(X
i− X )(Y
i− Y )
∑
ni=1
(X
i− X)
2 連立方程式の(3)
式から,b
α = Y − βX b
となる。ただし,X = 1 n
∑
n i=1X
i, Y = 1 n
∑
n i=1Y
i,
とする。数値例: 以下の数値例を使って,回帰式
Y
i= α + βX
i のα,β
の推定値α, b β b
を求める。i Y
iX
i1 6 10
2 9 12
3 10 14 4 10 16 b
α, β b
を求めるための公式はβ b =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2b
α = Y − βX b
なので,必要なものは
X,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。i Y
iX
iX
iY
iX
i21 6 10 60 100
2 9 12 108 144
3 10 14 140 196
4 10 16 160 256
合計
∑ Y
i∑ X
i∑ X
iY
i∑ X
i235 52 468 696
平均
Y X
8.75 13
よって,
β b = 468 − 4 × 13 × 8.75 696 − 4 × 13
2= 13
20 = 0.65 b
α = 8.75 − 0.65 × 13 = 0.3
となる。注意事項:
1. α, β
は真の値で未知2. α, b β b
はα, β
の推定値でデータから計算される 回帰直線はY b
i= α b + βX b
i,
として与えられる。上の数値例では,
Y b
i= 0.3 + 0.65X
i となる。i Y
iX
iX
iY
iX
i2Y b
i1 6 10 60 100 6.8
2 9 12 108 144 8.1
3 10 14 140 196 9.4
4 10 16 160 256 10.7
合計
∑
Y
i∑
X
i∑
X
iY
i∑
X
i2∑ b Y
i35 52 468 696 35.0
平均
Y X
8.75 13
図
2: Y
i,Xi,Y b
i0 5 10
Yi
0 5 10 15 20
Xi
×
×
× ×
b
Yi→
Y b
i を実績値Y
i の予測値または理論値と呼ぶ。b
u
i= Y
i− Y b
i, b
u
i を残差と呼ぶ。Y
i= Y b
i+ u b
i= α b + βX b
i+ u b
i,
さらに,Y を両辺から引いて,(Y
i− Y ) = ( Y b
i− Y ) + b u
i,
3.3
残差u b
i の性質についてb
u
i= Y
i− α b − βX b
i に注意して,(1)式から,∑
n i=1b u
i= 0,
を得る。(2)
式から,∑
n i=1X
iu b
i= 0,
を得る。
Y b
i= α b + βX b
i から,∑
n i=1Y b
iu b
i= 0,
を得る。なぜなら,
∑
n i=1Y b
iu b
i=
∑
n i=1( α b + βX b
i) b u
i= α b
∑
n i=1b u
i+ β b
∑
n i=1X
iu b
i= 0
である。i Yi Xi Y
b
i ub
i Xib
ui Yb
ib
ui1 6 10 6.8
−0.8
−8.0
−5.44
2 9 12 8.1 0.9 10.8 7.29
3 10 14 9.4 0.6 8.4 5.64
4 10 16 10.7
−0.7
−11.2
−7.49
合計
∑
Yi∑
Xi∑ b
Yi∑
ub
i∑
Xi
b
ui∑ b
Yib
ui35 52 35.0 0.0 0.0 0.00
3.4
決定係数R
2 について次の式
(Y
i− Y ) = ( Y b
i− Y ) + b u
i,
の両辺を二乗して,総和すると,∑
n i=1(Y
i− Y )
2=
∑
n i=1(
( Y b
i− Y ) + u b
i)
2=
∑
n i=1( Y b
i− Y )
2+ 2
∑
n i=1( Y b
i− Y ) u b
i+
∑
n i=1b u
2i=
∑
n i=1( Y b
i− Y )
2+
∑
n i=1b u
2i となる。まとめると,∑
n i=1(Y
i− Y )
2=
∑
n i=1( Y b
i− Y )
2+
∑
n i=1b u
2i を得る。さらに,1 =
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2+
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2 それぞれの項は,1.
∑
n i=1(Y
i− Y )
2= ⇒ y
の全変動2.
∑
n i=1( Y b
i− Y )
2= ⇒ Y b
i(回帰直線)
で説明される部分3.
∑
n i=1b
u
2i= ⇒ Y b
i(回帰直線)
で説明されない部分 となる。回帰式の当てはまりの良さを示す指標として,決定係数
R
2 を以下の通りに定義する。R
2=
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2 または,R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2,
として書き換えられる。または,Yi
= Y b
i+ u b
i と∑
n i=1( Y b
i− Y )
2=
∑
n i=1( Y b
i− Y )(Y
i− Y − u b
i)
=
∑
n i=1(b Y
i− Y )(Y
i− Y ) −
∑
n i=1(b Y
i− Y ) u b
i=
∑
n i=1(b Y
i− Y )(Y
i− Y )
を用いて,
R
2=
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2=
(∑
ni=1
(b Y
i− Y )
2)
2∑
ni=1
(Y
i− Y )
2∑
ni=1
( Y b
i− Y )
2=
∑
ni=1
( Y b
i− Y )(Y
i− Y )
√∑
ni=1
(Y
i− Y )
2∑
ni=1
( Y b
i− Y )
2
2
と書き換えられる。すなわち,R2は
Y
i とY b
i の相関係数 の二乗と解釈される。∑
n i=1(Y
i− Y )
2=
∑
n i=1(b Y
i− Y )
2+
∑
n i=1b
u
2i から,明らかに,0 ≤ R
2≤ 1,
となる。R2 が
1
に近づけば回帰式の当てはまりは良いと 言える。しかし,t分布のような数表は存在しない。した がって,「どの値よりも大きくなるべき」というような基準 はない。慣習的には,メドとして
0.9
以上を判断基準にする。数値例: 決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
n i=1b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,bu
i= Y
i− ( α b + βX b
i),Y
,∑
n i=1Y
i2 で ある。i Yi Xi Y
b
ib
uib
ui Yi21 6 10 6.8
−0.8 0.64 36
2 9 12 8.1 0.9 0.81 81
3 10 14 9.4 0.6 0.36 100
4 10 16 10.7
−0.7 0.49 100
合計
∑
Yi∑
Xi∑ b
Yi∑ b
ui∑
ub
2i∑
Yi235 52 35.0 0.0 2.30 317
∑ u b
2i= 2.30,X = 13,Y = 8.75,
∑
n i=1Y
i2= 317
なので,R
2= 1 − 2.30
317 − 4 × 8.75
2= 1 − 2.30
10.75 = 0.786
3.5
まとめb
α, β b
を求めるための公式はβ b =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2b
α = Y − βX b
なので,必要なものは
X,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
n i=1b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,∑
b u
2i,Y,∑
n i=1Y
i2 である。4 統計学の復習
4.1
連続型確率変数1.
確率変数:X (離散型と連続型) 2.
実現値:x
3.
変数X
の実現値x
に対応して,次の3
つの条件を満 たす関数f (x)
を定義する。f(x) ≥ 0,
∫
∞−∞
f (x)dx = 1, Prob(a < X < b) =
∫
b af (x)dx,
ただし,a < bとする。このとき,X を連続型確率変数,f
(x)
を確率密度関数
(単に,密度関数)
と呼ぶ。4.
連続型確率変数において,確率変数が2
つの実数値(a, b)
に含まれる確率をProb(a < X < b)
として表 現する。5.
連続型確率変数の期待値は,E(X ) =
∫
∞−∞
xf (x)dx
で与えられる。6.
期待値の公式:E(aX ) = aE(X ), E(aX + b) = aE(X ) + b,
ただし,a,b
は定数とする。7.
また,分散は,V(X ) =
∫
∞−∞
( x − E(X) )
2f(x)dx
で与えられる。8.
分散の公式:V(aX ) = a
2V(X ), V(aX + b) = a
2V(X),
9.
分散と期待値:V(X ) = E (
X − E(X ) )
2,
= E(X
2) − ( E(X ) )
2,
10.
一般的に,g(X)
の期待値は,E ( g(X) )
=
∫
∞−∞
g(x)f (x)dx,
として得られる。11. g(X) = X
のとき,X の期待値,g(X) = (
X − E(X ) )
2のとき,X の分散 となる。
4.2
多変数確率変数1. 2
変数確率変数X
とY
の密度関数:(a)
結合密度関数:f (x, y) (b)
周辺密度関数:f (x) =
∫
f (x, y)dy, f (y) =
∫
f (x, y)dx (c)
条件付き密度関数:f (x | y) = f (x, y)
f (y) = ∫ f (x, y) f (x, y)dx , f (y | x) = f (x, y)
f (x) = ∫ f (x, y) f (x, y)dy (d) X
とY
の独立性:f(x, y) = f (x)f (y)
すなわち,f
(x | y) = f (x), f (y | x) = f (y) 2. 2
変数確率変数X
とY
の期待値,分散,共分散について:
(a) E(X ) =
∫ ∫
xf(x, y)dxdy E(Y ) =
∫ ∫
yf (x, y)dxdy (b) V(X ) = ∫ ∫ (
x − E(X ) )
2f (x, y)dxdy V(Y ) = ∫ ∫ (
y − E(Y ) )
2f (x, y)dxdy (c) Cov(X, Y )
= ∫ ∫ (
x − E(X) )(
y − E(Y ) )
f (x, y)dxdy (d) E(X | Y ) =
∫
xf(x | y)dx E(Y | X ) =
∫
yf (y | x)dy (e) V(X | Y ) =
∫
(x − E(X | Y ) )
2f (x | y)dx V(Y | X ) =
∫
(y − E(Y | X) )
2f (y | x)dy (f) Cov(X, Y ) = E(XY ) − E(X )E(Y )
(g) X
とY
が独立であれば,Cov(X, Y) = 0
とな る。(逆は言えない)(h) E(aX + bY ) = aE(X) + bE(Y )
ただし,a,b
は定数とする。(i) V(aX +bY ) = a
2V(X)+2abCov(X, Y )+b
2V(Y )
(j) X
とY
が独立であれば,V(aX + bY ) = a
2V(X ) + b
2V(Y ) 3.
多変数への拡張:X
1, X
2, · · · , X
n のn
個の確率変数を考える。c1, c
2,
· · · , c
n を定数とする。(a) E(
∑
n i=1c
iX
i) =
∑
n i=1c
iE(X
i)
(b) V(
∑
n i=1c
iX
i) =
∑
n i=1∑
n j=1c
ic
jCov(X
i, X
j)
i = j
のときは,Cov(Xi, X
j) = V(X
i)
となるこ とに,注意すると,V(
∑
n i=1c
iX
i)
=
∑
n i=1c
2iV(X
i)
+
∑
n i=1∑
n j=1 i6=jc
ic
jCov(X
i, X
j)
を得る。
(c)
特に,X1, X
2, · · · , X
n が互いに独立の場合は,V(
∑
n i=1c
iX
i) =
∑
n i=1c
2iV(X
i)
となる。4.3 f (x)
の関数型,密度関数の種類1.
正規分布:f (x) = 1
√ 2πσ
2e
−2σ12(x−µ)2,
ただし,πは円周率
(3.141592...),e
は自然対数の底(2.71828...)
である。(a) µ
について,左右対称(b) E(X) = µ
(c) V(X) = σ
2(標準偏差は σ)
(d)
確率変数X
は平均µ,分散 σ
2 の正規分布に従 う。=⇒ X ∼ N (µ, σ
2)
(e) X ∼ N(µ, σ
2)
のとき,Prob(µ − σ < X < µ + σ) = 0.683 Prob(µ − 2σ < X < µ + 2σ) = 0.954 Prob(µ − 3σ < X < µ + 3σ) = 0.997
なる。(f) µ
の大きさによるN(µ, σ
2)
の違い。(g) σ
2 の大きさによるN (µ, σ
2)
の違い。2.
標準正規分布:f(x) = 1
√ 2π e
−12x2,
すなわち,X
∼ N(0, 1) (a) E(X ) = 0
(b) V(X ) = 1
(c) X ∼ N(0, 1)
のとき,Prob( − 1 < X < 1) = 0.683 Prob( − 2 < X < 2) = 0.954 Prob( − 3 < X < 3) = 0.997
なる。他に,よく使われるパーセント点は,
Prob( − 1.645 < X < 1.645) = 0.90 Prob( − 1.960 < X < 1.960) = 0.95 Prob( − 2.326 < X < 2.326) = 0.99
である。(d)
正規分布と標準正規分布との関係:X ∼ N(µ, σ
2)
のとき,Z= X − µ
σ
を定義する。このとき,Z
∼ N (0, 1)
となる。(e)
正規分布表から確率の計算を行う。3.
正規分布の特徴:(a) n
個の独立な確率変数X
1, X
2, · · · , X
nが同一の 正規分布N (µ, σ
2)
に従うものとする。このとき,∑
n i=1c
iX
i∼ N (µ
∑
n i=1c
i, σ
2∑
n i=1c
2i)
となる。(b)
特に,標本平均X = 1 n
∑
n i=1X
iを考えると,X ∼ N(µ, σ
2n )
となる。(すべての
i
について,ci= 1
n
の場合を 考えればよい。)(c) n
個の独立な確率変数X
1, X
2, · · · , X
n が同一の 平均µ,分散 σ
2 の分布に従うものとする。(正 規分布を仮定しない)このとき,nが大きくなるにつれて,
X − µ σ/ √
n
は,標準正規分布に近づく。すなわち,
X − µ σ/ √
n −→ N (0, 1)
となる。= ⇒
中心極限定理4. χ
2(カイ二乗)
分布:m
個の確率変数Z
1, Z
2, · · · , Z
mは,互いに独立な標 準正規分布に従うものとする。このとき,Y=
∑
m i=1Z
i2 は,自由度m
のχ
2分布に従う。Y ∼ χ
2(m),または,Y ∼ χ
2mと表記する。χ
2(カイ二乗)
分布表から確率を求める。Y ∼ χ
2(m)
のとき,E(Y ) = m,V(Y ) = 2m
となる。(証明略)
(a) 2
つの独立なχ
2 分布からの確率変数X , Y
を考 える。X∼ χ
2(n),Y ∼ χ
2(m)
とする。このと き,Z= X + Y ∼ χ
2(n + m)
となる。(証明略)(b) n
個の独立な確率変数X
1, X
2, · · · , X
n が同一の正規分布