確率論計量経済学鹿野研究室 note03

(1)

担当：鹿野（大阪府立大学） 2013 年度後期

はじめに

前回の復習

確率変数と確率分布。離散型・連続型。

期待値（確率変数の代表値）、分散（散らばり具合）と確率変数の標準化。

今回学ぶこと

正規分布と標準正規分布。

二次元の確率変数：同時分布、共分散と独立性。

テキスト該当箇所：付録_A4∼A6章。鳥居（₁₉₉₄）、東大出版会（₁₉₉₁）も参照。

1 正規分布と標準正規分布

1.1 正規分布

確率分布には多くの「型」が存在。パソコンで分布を描いたり、確率計算が可能。

⊲ 最も重要な連続型の分布＝正規分布。

⊲ その他（二項分布、ポアソン分布、_etc）_⇒東大出版会（₁₉₉₁、₆章）を参照。

正規分布：連続型の確率変数_Xの密度関数が f_{(x) =} _√¹

2πσ² exp

− ¹

2σ²^{(x − µ)}

2

, −∞ < x < ∞ ⁽¹⁾

で与えられるとき、_f_(x)をと呼ぶ。

⊲ µ^{（ミュー）}^、σ²^（シグマ2乗）は正規分布を特徴づけるパラメータ。

⊲ 正規分布の期待値と分散は、

E(X) = µ, Var(X) = σ²^. ⁽²⁾

∴密度関数のパラメータ_{µ, σ}²と期待値・分散に、₁対₁の対応関係。

注意：_exp(a)という表現は、_e^aと同じ。e = 2.718...は自然対数の底（ネイピア定数）。 1

(2)

−10 −5 0 5 10 15 20

0.00.10.20.30.4

f(x)

N(−3, 1.5²)

N₍5, 2²₎

N(15, 1²)

図_1:正規分布_{N(−3, 1.5}²₎、_{N(5, 2}²₎、_{N(15, 1}²₎

_Remark：正規分布で重要なのは_{µ, σ}²の値。∴正規分布に従う確率変数_Xを

X ∼ N(µ, σ²⁾ ⁽³⁾

と表記。（_Nはnormal distribution^の略。^）(1)式は暗記しなくて良い！

⊲ ^図1^{：正規分布}_{N(−3, 1.5}²)^、N(5, 2²)^、N(15, 1²)。左右対称の釣り鐘型。

正規分布の一次変換の分布：_{X ∼ N(µ, σ}²₎ならば、その一次式_{Y = a + bX}の分布は、 X ∼ N(µ, σ²⁾ −−−−−−−−−−−−→^変換^{Y = a + bX} Y ∼ ^. ⁽⁴⁾

⊲ ∴正規確率変数を一次変換_⇒期待値は_µ_{→ a + bµ}、分散は_σ² _{→ b}²_σ²に置き換わるが、分布型は正規分布（左右対称・釣り鐘型）のまま。

⊲ 注意：期待値の公式・分散の公式（講義ノート_#02）より、どんな確率変数でも一次変換の期待値・分散は

E(Y) = a + bE(X), Var(Y) = b²^Var(X). ⁽⁵⁾ ただし、分布が一次変換前と同じである保障はない。

1.2 標準正規分布

標準正規分布（図₂）：_µ_{= 0}、_σ² _{= 1}の特殊な正規分布_{N(0, 1)}を、と呼ぶ。

⊲ ^{任意の正規分布}_{X ∼ N(µ, σ}²)^{を標準化（講義ノート}#02^{）し、変形すると} Z = ^{X − E(X)}_√

Var(X) ⁼ X − µ

σ ⁼⁻ µ σ ⁺

1

σ^X. ⁽⁶⁾

a = −_σ^µ^、b = _σ¹ ^{と置けば、}⁽⁴⁾^{式の性質より} Z ∼ N

−^µ σ⁺

1 σ^µ,

1 σ²^σ

2

整理

−−−→ Z ∼ N(0, 1). ⁽⁷⁾

(3)

−3 −2 −1 0 1 2 3

0.00.10.20.30.4

z

f(x)

A: Z ~ N(0,1)

0.00.10.20.30.4

z

f(x)

0 z=1.96 α=0.025 1−α

α B: α=Pr(Z>1.96)=0.025

図_2:標準正規分布Z ∼ N(0, 1)^{と臨界値を上回る確率}^α= Pr(Z > z)

⊲ ∴ Z _{∼ N(0, 1)}^は、_{X ∼ N(µ, σ}²)を標準化すると得られる。

_Zの臨界値：Z ∼ N(0, 1)^{が特定の値}^z^{を超える確率を}^α= Pr(Z > z)^と置くと z Pr(Z > z)

右端_5% _1.645 _0.050

右端_2.5% _1.960 _0.025

右端_1% _2.326 _0.010

これら_zを、_Zのと呼ぶ。（より細かい確率計算_⇒テキスト_p351の表。）

⊲ ^確率Pr(Z > z)^はZ ∼ N(0, 1)の右端面積（講義ノート_#02の図_2B参照）。

⊲ ^図2B^：Z^が1.96^{を上回る確率は}Pr(Z > 1.96) = 0.025^。

_Remark：Z ∼ N(0, 1)^が²^{を超える（}or −2^{を下回る）確率は、} ^。

⊲ ^図2^：N(0, 1)^は、−2 < z < 2ぐらいの確率をカバー。臨界値の表からも明らか。

⊲ ∴^「Z^{目線」で考えると、}_±2を超える値は非常に大きな、まれにしか出ない値。

2 二次元の確率変数と同時確率分布

2.1 同時確率分布

_Remark：二次元の確率変数とその確率分布

⊲ ^{確率分布＝確率変数}X^の実現値x^{とその確率}_{Pr(X = x)}^{の対応関係を、関数}or^グラフで表したもの。例：正規分布。

⊲ ^{二つの確率変数のペア}(X, Y)について同じことをするには？_⇒同時確率分布。

同時確率分布：二つの離散型確率変数_{(X, Y)}について、実現値のペア(X = x, Y = y)^とその確率Pr(X = x, Y = y)の対応関係を与える関数

Pr(X = x, Y = y) = h(x, y) ⁽⁸⁾

を、二次元のと呼ぶ。

(4)

⊲ X^とY^{の実現値を} x1, x2, . . . , xK^、y1, y2, . . . , yLと置くと、確率の自然な性質より h(x_k, y_l_{) ≥ 0,}

K k=1

L l=1

h(x_k, y_l_{) = 1.} (9)

一次元の確率分布（講義ノート_#02）と比較せよ。

例：_X、_Yの実現値がx = 1, 3, 5^、y = 2, 4, 6^（3 × 3 = 9通りのペア）であり、確率_{Pr(X =}

x, Y = y)が下表で与えられるとする。

h(x, y) _{Y = 2} _{Y = 4} _{Y = 6}

X = 1 ^0.2 ^0.1 ^0.1

X = 3 ^0.1 ^0.15 ^0.1

X = 5 ⁰ ^0.1 ^0.15

∴実現値のペアとその確率を表にすれば、それが同時分布_{h(x, y)}。

⊲ ^{表中の確率が、}(9)式の性質を満たすことを確認せよ。

連続型の同時分布：同時密度関数。_⇒今回の補足資料。

周辺分布：同時分布_{h(x, y)}に対し、_X、_Y単体に確率を与える分布 _f_(x)、_g(y)を、_X、_Yのと呼ぶ。∴周辺分布＝一次元の分布のこと。

⊲ ^{講義ノート}#02^と同様、f(x)^でX^の期待値E(X)^、g(y)^でY^の期待値E(Y)^を定義。

⊲ ^周辺分布 f(x)^、g(y)^{と同時分布}h(x, y)^の関係_⇒^{今回の補足資料。}

確率変数の和と積の期待値：（証明_⇒今回の補足資料。）

1. ^{。分配法則。}

2. ^要注意： ^。

2.2 共分散

二つの確率変数_X、_Yの連動性・相関を測る_⇒共分散。

⊲ データ中の相関関係を標本共分散（講義ノート_#01）でまとめるのと、同じ発想。

共分散：確率変数のペア_{(X, Y)}について、

Cov(X, Y) = E [(X − E(X))(Y − E(Y))] ⁽¹⁰⁾ を、_Xと_Yのと呼ぶ。（_Covは_covarianceの略。）

⊲ E(X)^、E(Y)^を軸に、(X, Y)^{が同方向に動く}_{⇒ (x}_k_{− E(X))(y}_l− E(Y)) > 0^。

⊲ (X, Y)^{が逆方向に動く}_{⇒ (x}_k_{− E(X))(y}_l− E(Y)) < 0^。

⊲ ∴平均的に前者の傾向が強ければCov(X, Y) > 0^（ ^）^{、後者の傾向が強け}

ればCov(X, Y) < 0^（ ^）^{、打ち消し合えば}Cov(X, Y) ≈ 0^（ ^）^。

(5)

共分散の別表現：共分散の定義₍₁₀₎を書き換えると

Cov(X, Y) = E(XY) − E(X)E(Y). ⁽¹¹⁾

⊲ ∴(10)^式と(11)式、使いやすい方を使う。

⊲ ^証明_⇒今回の復習問題。講義ノート_#02、₍₁₆₎式の展開とほぼ同じ。

確率変数の和の分散：_Xと_Yの和の分散は、_{X + Y}をひとつの確率変数と見れば Var(X + Y) = E(X + Y − E(X + Y))²

= E(X − E(X) + Y − E(Y))²

= E(X − E(X))²+ 2(X− E(X))(Y − E(Y)) + (Y − E(Y))²

= Var(X) + + Var(Y). ⁽¹²⁾

∴一般にVar(X + Y) Var(X) + Var(Y)^{なので注意。}

⊲ (X, Y)^{の共分散と}_{X + Y}の分散には、密接な関係。

⊲ ^例：Cov(X, Y) > 0^の株式X^、Y^{を同時に保有}⇒ Var(X) + Var(Y)^{以上にリスクが増幅。} 2.3 確率変数の独立性

独立性：同時分布_{h(x, y)}が周辺分布 _f_(x)、_g(y)の積 h(x, y)

=Pr(X=x,Y=y)

= ^f^(x)g(y)

=Pr(X=x) Pr(Y=y)

(13)

で得られるとき、_Xと_Yはである、と言う。

⊲ 一般に、二つのイベント _{A, B}について、_Pr(Aかつ_B) = Pr(A) Pr(B)^ならば、^A^と^B は互いに独立である、と言う。

⊲ ^例：_{A =}^{「今夜雨が降る」}^、_{B =}^{「夕食が唐揚げ」}^。Pr(A^かつB) = Pr(A) Pr(B) ⇒ A^と

B^は独立。

独立な確率変数の性質：_Xと_Yが独立である場合に限り、積_XYの期待値は

E(XY) = ^. ⁽¹⁴⁾

（証明_⇒今回の補足資料。）

1. ∴ (10)^{式より、独立}⇒ Cov(X, Y) = ^{（無相関）}^。

2. ∴ (11)^{式より、独立}⇒ Var(X + Y) = ^。

_Remark：_Xと_Yが独立のケース・独立でないケースを整理。

(X, Y)^が独立 (X, Y)^{が独立でない}

定義 _h(x, y) = f (x)g(x) h(x, y) f (x)g(x) 積の期待値 E(XY) = E(X)E(Y) E(XY) E(X)E(Y)

共分散 Cov(X, Y) = 0^{（無相関）} Cov(X, Y) 0

和の分散 Var(X + Y) = Var(X) + Var(Y) Var(X + Y) Var(X) + Var(Y)

(6)

_n次元の独立性：_n個の確率変数_X₁_{, X}₂, . . . , Xnの同時分布が、各周辺分布 _f_i_(x_i₎の積 h(x1, x2, . . . , x_n_{) = f}1(x1) f2(x2_{) · · · f}n^(xn) =

n i=1

f_i(x_i) (15)

で得られるとき、_X₁_{, X}₂, . . . , X_nは互いに独立である、と言う。

⊲ ^独立_⇒^{任意のペア}(X_i, X_j)^についてCov(X_i, X_j_{) = 0}^。

⊲ ^独立_⇒^和X₁_{+ X}₂₊_{· · · + X}_n^の分散が

Var(X1+ X2+· · · + Xⁿ) = Var(X1) + Var(X2) + · · · + Var(Xⁿ) =

n i=1

Var(Xi). (16)

⊲ 注意：独立であろうがなかろうが、和の期待値は（分配法則より） E(X₁_{+ X}₂₊_{· · · + X}_n_{) = E(X}₁_{) + E(X}₂) + · · · + E(Xn) =

n i=1

E(X_i). (17)

まとめと復習問題

今回のまとめ

正規分布と標準正規分布。

二次元（多次元）の確率変数：同時分布、共分散と独立性。

⊲ 多次元の確率変数は、この講義の後半で再考する。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^{講義ノート}#02^、(16)式のやり方を参考に、分散の別表現₍₁₁₎式が成立することを示せ。ヒント：確率変数の和の期待値（分配法則）、および期待値公式（講義ノート_#02）に注意。 2. 独立性の定義に即し、互いに独立なイベント（と思われるもの）の例を挙げよ。

確率論 計量経済学 鹿野研究室 note03

はじめに

1 正規分布と標準正規分布

2 二次元の確率変数と同時確率分布

まとめと復習問題

確率論計量経済学鹿野研究室 note03