『新しい計量経済学』鹿野研究室 slide03

(1)

計量経済学_#03

確率論：確率変数と確率分布 ₍₂₎

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 正規分布

2 二次元の確率変数

テキスト・参考書。

テキスト：鹿野繁樹 [2015]、第 2.3 章・第 2.4 章。参考書：松原望 et al. [1991]。

前回の復習

1 _{確率変数とその分布} 2 _{期待値と分散}

(3)

Section 1 正規分布

(4)

正規分布の特徴

連続型確率変数_{X の確率}Pr(a ≤ X ≤ b) =_a^bf(x)dx が密度関数 f(x) = _√ ¹

2πσ²^e

− ¹

2σ2^(x−µ)

2, −∞ < x < ∞ ⁽¹⁾

で与えられるとき、この_f_{(x) を}正規分布と呼ぶ。統計学で最も重要な確率分布のひとつ。

π≈ 3.14 は円周率、e ≈ 2.72 は自然対数の低（ネイピア数）。いずれも定数。

µ（ミュー）と σ²^（シグマ2 乗）は、期待値と分散。

(5)

公式 _{1 (} 正規確率変数の期待値・分散 ₎

X が正規分布に従うならば、その期待値・分散は

E(X) = µ, Var(X) = σ². (2) 証明：松原望 et al. [1991] 参照．

正規分布（normal distribution）の姿は µ と σ²^{の値で決まる} ので、

X _{∼ N(µ, σ}²) と略記。

図1：異なる正規分布 N(−3, 1.5²^{)、N(5, 2}²^{)、N(15, 1}²^)。

(6)

−10 −5 0 5 10 15 20

0.00.10.20.30.4

f(x)

N(−3, 1.5²)

N(5, 2²)

N(15, 1²)

図 1 : 期待値_µ・分散_σ²が異なるさまざまな正規分布_{N(µ, σ}²₎

(7)

(1) 式を暗記するより、次の点をグラフで確認することが重要！

Remark 1

正規分布_{N(µ, σ}²) は、期待値 µ を中心に左右対称の釣鐘型。期待値µ が大きいほど，分布の中心は右にシフト。分散_σ²が大きいほど，分布の散らばりが拡大。

(8)

正規分布の基本性質。

公式 ₂

X _{∼ N(µ, σ}²) ならば、その一次式 Y = a + bX の分布は

Y ∼ N(a + bµ, b²^σ²^). ⁽³⁾ 証明：松原望 et al. [1991] 参照．

∴_X _{∼ N(µ, σ}²) を一次変換すると、

期待値は_µ_{→ a + bµ}、分散は_σ²_{→ b}²_σ²に変換。一方、分布型は正規分布（左右対称・釣鐘型）のまま！

例：_X _{∼ N(0, 2}²) を Y = 3 + X に変換 ⇒3 だけ分布の中心が右にシフトし_Y _{∼ N(3, 2}²_)。

注意：X が正規分布でなくとも、一般的にE(Y ) = a + bµ、 Var(Y ) = b²σ²^{（講義ノート}#02）。

(9)

標準正規分布と「 _±2 の壁」

正規確率変数_X _{∼ N(µ, σ}²_{) を}標準化：

Z = ^X^{− E(X)}

Var(X) ⁼

X_{− µ} σ ^.

標準化=「まず期待値を引き、次いで標準偏差で割る」。

標準化によりX は、期待値がゼロ、分散が1 の特殊な正規分布、標準正規分布_Z ∼ N(0, 1) となる。

(10)

公式 _{3 (} 正規分布の標準化 ₎

X _{∼ N(µ, σ}²) _−−−→^標準化 Z = ^X^{− µ}

σ ^{∼ N(0, 1).} ⁽⁴⁾ 証明：_Z _{= −}^µ

σ ⁺ 1

σ^X = a + bX と置けば，X の一次式なので，公式_{(3) より}

Z _{∼ N}

−^µ_σ ⁺_σ¹^µ

=0

, ¹ σ²^σ

2

=1

−−→整理 ^Z ∼ N(0, 1).

X から期待値 µ を引くと，正規分布の重心がゼロに横滑り。次いで標準偏差（分散の平方根）σ で割り、分布の広がり具合を丁度_{1 に調整。}

(11)

標準正規分の密度関数は，(1) 式で µ = 0，σ² = 1 と置いた φ(z) = _√¹

2π^e

−1

2^z²_. ₍₅₎

⇒ Z ∼ N(0, 1)，Z ∼ φ(z) などと略記。（φ は「ファイ」または

「フィー」。）

図2 A：N(0, 1) のグラフ。

Z が−2 を下回る確率、+2 を上回る確率は、非常に小さい。

∴_{Z の尺度で見れば、}±2 は大きな「壁」！

Remark 2

±2 の壁：Z ∼ N(0, 1) は，およそ ±2 の範囲までの確率をカバー。

∴Z のスケールで考えると、−2 以下・+2 以上という実現値は極端に小さな・大きな値。めったに起こらない。

(12)

−3 −2 −1 0 1 2 3

0.00.10.20.30.4

z

f(x)

A: Z ~ N(0,1)

0.00.10.20.30.4

z

f(x)

0 z=1.96 α=0.025 1−α

α B: α=Pr(Z>1.96)=0.025

図2 : 標準正規分布_Z _{∼ N(0, 1)}

(13)

Pr(Z < z) Pr(Z > z) 確率 _0.01 _0.025 _0.05 _0.05 _0.025 _0.01 臨界値_z −2.326 −1.960 −1.645 1.645 1.960 2.326

分布の左端_← _{→ 分布の右端}

表 1 : _Z _{∼ N(0, 1)}の臨界値

表1：Z が定数 z を下回る確率 Pr(Z < z)・上回る確率 Pr(Z > z) を、正確に計算⇒ Z の 5%、2.5%、１%^臨界値。

図2 B：Z の右端 2.5%臨界値、z = 1.960 ≈ 2 を図示。斜線部 α の面積が確率Pr(Z > 1.960) = 0.025 に相当。

Z の対称性⇒ Pr(Z < −1.960) = Pr(Z > 1.960) = 0.025。

(14)

標準正規分布の使い方

X を Z に標準化する理由：X の実現値 x^∗^{を観測したとき、その} x^∗が「十分大きいか、それともありふれた値か」を客観的に判断。

Example 1

ある湖に住む魚の体長（cm）の分布は X ∼ N(20, 5²^{)。A さんは} 32cm の魚を釣り上げた。⇒ X = 32 を標準化し、Z ∼ N(0, 1) のスケールに直せば

z^∗ = ^{32 − 20}

5 ^{= 2.4.}

一方表1の Z の臨界値より Pr(Z > 2.326) = 0.01。∴ この魚は 1%以下の確率でしかお目にかかれない、非常に大きな魚。

(15)

このコースでは、図2 B で見た Z の 2.5%臨界値 z = 1.960 ≈ 2 を

「十分大きな値」と置く。（この値は、成人男性の身長_{187cm ぐら} いに相当。）

Remark 3

X _{∼ N(µ, σ}²) を標準化する目的：実現値 X = x^∗^を、Z = z^∗^のスケールに換算して「大小」の判断。

1 _|z^∗| > 1.960 → x^∗は極端に大きい（極端に小さい）。

2 _|z^∗| < 1.960 → x^∗は大きくも小さくもない。

(16)

Section 2 二次元の確率変数

(17)

結合分布

複数の確率変数を、同時に扱うには？_⇒結合分布（同時分布）。表2：ある二つの確率変数 X と Y は、実現値 x = {1, 3, 5} と y= {2, 4, 6} が起こり得るとする。

さらに実現値のペアの確率が、表2で与えられるものと仮定。例えば「_X _{= 1}で、かつ_Y _{= 6}」の確率（結合確率）は、表よりPr(X = 1, Y = 6) = 0.1^。

h(x, y) Y = 2 Y = 4 Y = 6 X = 1 0.2 0.1 0.1 X = 3 0.1 0.15 0.1 X = 5 0 0.1 0.15

表2 : 結合分布の例

(18)

二つの確率変数(X, Y ) について、実現値のペアを (xj^{, y}s) と表せば、その結合分布は一般的に

Pr(X = xj, Y = ys) = h(xj, ys). (6)

一次元の確率分布f(x) 同様、h(xj, ys) が確率であるためには、 h(xj, ys_{) ≥ 0,}

j

s

h(xj, ys) = 1. (7)

表2はこれらの性質を満たす。注意：二重和「

j

s^」は，表2の全セル（全組み合わせ）の和をとる作業の、数式表現。

(19)

X と Y の和・積の期待値は、 E(X + Y ) =

j

s

(xj + ys)h(xj^{, y}s), (8) E(XY ) =

j

s

xjysh(xj, ys). (9)

X+ Y や XY をひとつの確率変数と考えれば、一次元の期待値と同じこと。

Example 2

表2の結合分布について，和の期待値 E(X + Y ) は E(X + Y ) = (1 + 2)h(1, 2) + (1 + 4)h(1, 4) + · · ·

+ (5 + 6)h(5, 6) = 6.8.

(20)

結合分布_h(x, y) と、X 単体の分布 f (x) との関係は？⇒ 表 2から、

「_{Y が}2 だろうが 4 だろうが 6 だろうが，とにかく Pr(X = x) となる確率」を求めると、

f(x) =

⎧

⎪⎨

⎪⎩

0.2 + 0.1 + 0.1 = 0.4 (x = 1) 0.1 + 0.15 + 0.1 = 0.35 (x = 3) 0 + 0.1 + 0.15 = 0.25 (x = 5) .

これを_{X の}周辺分布と呼ぶ。 Y の周辺分布も同様に、

g(y) =

⎧

⎪⎨

⎪⎩

0.3 (y = 2) 0.35 (y = 4) 0.35 (y = 6) .

f(x)、g(y) から、X と Y それぞれの期待値 E(X)、E(Y ) が定義できる。

(21)

E(X + Y ) や E(XY ) と、E(X)、E(Y ) の関係は？

公式 _{4 (} 確率変数の和・積の期待値 ₎

E(X + Y ) = E(X) + E(Y ), (10) 特殊ケースを除きE(XY ) = E(X)E(Y ). ⁽¹¹⁾ 証明：テキスト_{p35 参照。}

(10) 式は期待値演算の「分配法則」。

(11) 式に注意。一般に、「積の期待値」と「期待値の積」は異なる。

(22)

共分散と和の分散

二つの確率変数_{(X, Y ) の}共分散（covariance）

Cov(X, Y ) = E [(X − E(X))(Y − E(Y ))] ⁽¹²⁾ は、(X, Y ) の共変動を測る指標。

期待値E(X)、E(Y ) を軸に、実現値 (xj, ys) が同方向に動けば_(x_j _{− E(X))(y}_s− E(Y )) > 0^。逆方向に動けば_(x_j _{− E(X))(y}_s− E(Y )) < 0^。

⇒ 期待値をとり Cov(X, Y ) > 0 なら正、Cov(X, Y ) < 0 なら負の相関。

∴ データの共分散_s_XY（講義ノート#01）と同じ考え方。

(23)

公式 _{5 (} 分散の別表現 ₎

Cov(X, Y ) = E(XY ) − E(X)E(Y ). ⁽¹³⁾ 証明：分散の別表現（講義ノート#02）の証明手順を参照．

定義(12) と比較し、扱いやすい方を用いればよい。

(24)

確率変数の和_X+ Y の分散は、次式で定義される。

Var(X + Y ) = E[(X + Y ) − E(X + Y )]²^. ⁽¹⁴⁾ X+ Y をひとつの確率変数と考えれば、一変数の分散と同じこと。

公式 _{6 (} 確率変数の和の分散 ₎

Var(X + Y ) = Var(X) + 2Cov(X, Y ) + Var(Y )

= Var(X) + Var(Y ). ⁽¹⁵⁾

∴ 和の分散は、共分散と密接な関係。

Cov(X, Y ) = 0 という特殊な状況でない限り、「和の分散」と

「分散の和」は異なる。

(25)

証明：(14) 式右辺を展開・整理すれば Var(X + Y )

= E(X − E(X) + Y − E(Y ))²

= E(X − E(X))²+ 2(X − E(X))(Y − E(Y )) + (Y − E(Y ))²

= E(X − E(X))²

=Var(X)

+2 E [(X − E(X))(Y − E(Y ))]

=Cov(X,Y )

+ E(Y − E(Y ))²

=Var(Y )

= Var(X) + 2Cov(X, Y ) + Var(Y ).

(26)

確率変数の独立性

二つの確率変数(X, Y ) の全ての実現値に関し h(x, y)

=Pr(X=x,Y =y)

= f_{(x) × g(y)}

=Pr(X=x)×Pr(Y =y)

(16)

が成立するとき、_{X と Y は互いに}独立。

より一般的には、二つの事象A と B の結合確率が Pr(A, B) = Pr(A) Pr(B) のとき、両者は互いに独立。

(27)

確率変数が独立な場合だけ成立する，非常に重要な性質！

公式 _{7 (} 独立な確率変数の性質 ₎

(X, Y ) が独立ならば、

E(XY ) = E(X)E(Y ), (17) Cov(X, Y ) = 0 (∴ 無相関), (18) Var(X + Y ) = Var(X) + Var(Y ). (19) 証明：(17) 式の証明はテキスト p35 参照。(17) 式を (13) 式に代入して(18) 式を、(18) 式を (15) 式に代入して (19) 式を得る。

(X, Y ) が独立ならば、E(XY ) や Var(X + Y ) の計算がとても簡単に。

(28)

Remark 4

表3：(X, Y ) が独立でないケースと、独立なケースを比較。

独立でない独立

定義 _h(x, y) = f(x)g(y) h(x, y) = f (x)g(y)

⇓ ⇓

積_XY の期待値 E(XY ) = E(X)E(Y ) E(XY ) = E(X)E(Y )

⇓ ⇓

共分散 Cov(X, Y ) = E(XY ) Cov(X, Y ) = 0

−E(X)E(Y ) = 0

⇓ ⇓

和_X_{+ Y} の分散 Var(X + Y ) = Var(X) Var(X + Y ) +2Cov(X, Y ) + Var(Y ) = Var(X) + Var(Y ) 和_X_{+ Y} の期待値いつでもE(X + Y ) = E(X) + E(Y )

表3 : 確率変数_{(X, Y )}の独立性

(29)

最後に、独立な正規確率変数に関し成立する重要な性質、正規分布の再生性。

公式 _{8 (} 正規分布の再生性 ₎

二つの確率変数(X, Y ) が互いに独立で、かつ X ∼ N(µ^X^{, σ}²X^)、

Y _{∼ N(µ}Y, σ_Y²) ならば、和 X + Y の分布は

X_{+ Y ∼ N(µ}_X + µY^{, σ}²X ^{+ σ}Y²^). ⁽²⁰⁾

証明：松原望 et al. [1991] 参照．

∴ 正規確率変数を足し合わせると、その和もやはり正規分布に従う。

(30)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _{テキスト第}2 章復習問題 2.5。

2 _確率変数(X, Y ) について、次の結合分布を考える。 h(x, y) Y = 0 Y = 1

X = 0 0.2 0.2 X = 1 0.2 0.4

和の期待値E(X + Y ) と、積の期待値 E(XY ) をそれぞれ求めよ。（テキスト第2 章復習問題 2.6 の類題。）

(31)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

松原望, 縄田和満, and 中井検裕. 統計学入門. 東京大学出版会, 1991.

『新しい計量経済学』 鹿野研究室 slide03

確率論：確率変数と確率分布 (2)

Outline

前回の復習

Section 1

正規分布

正規分布の特徴

公式 1 ( 正規確率変数の期待値・分散 )

Remark 1

公式 2

標準正規分布と「 ±2 の壁」

公式 3 ( 正規分布の標準化 )

Remark 2

標準正規分布の使い方

Example 1

Remark 3

Section 2

二次元の確率変数

結合分布

Example 2

公式 4 ( 確率変数の和・積の期待値 )

共分散と和の分散

公式 5 ( 分散の別表現 )

公式 6 ( 確率変数の和の分散 )

確率変数の独立性

公式 7 ( 独立な確率変数の性質 )

Remark 4

公式 8 ( 正規分布の再生性 )

今回の復習問題

References

『新しい計量経済学』鹿野研究室 slide03

確率論：確率変数と確率分布 ₍₂₎

公式 _{1 (} 正規確率変数の期待値・分散 ₎

公式 ₂

標準正規分布と「 _±2 の壁」

公式 _{3 (} 正規分布の標準化 ₎

公式 _{4 (} 確率変数の和・積の期待値 ₎

公式 _{5 (} 分散の別表現 ₎

公式 _{6 (} 確率変数の和の分散 ₎

公式 _{7 (} 独立な確率変数の性質 ₎

公式 _{8 (} 正規分布の再生性 ₎