多次元の確率分布経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

正規分布_{X ∼ N(µ, σ}²₎。

標準正規分布_{Z ∼ N(0, 1}²₎と、確率の計算。

今回学ぶこと

多次元の確率分布。

多次元分布と期待値。

テキスト該当箇所：_7.1章。

1 ^{多次元の確率分布}

1.1

多次元の確率変数とその確率分布

ここまで（講義ノート_{#07 ∼ #11}）のまとめ：の確率変数_Xと、確率分布 _{f (x)}。

⊲ ^離散型：Pr(X = x) = f (x)。二項分布、ポアソン分布など。

⊲ ^連続型：Pr(a < X < b) =_a^b ^{f (x)dx}。指数分布、正規分布など。

これから（講義ノート_{#12 ∼ #14}）の目標：確率変数の、_{(X, Y)}の確率。

⊲ Pr(X = x, Y = y)^や、Pr(a < X < b, c < Y < d)^。

⊲ ^{注意：簡略化のため、}^「_{X = x}^で、 _{Y = y}^」の確率_{Pr({X = x}} {_{Y = y})}^を、単にPr(X = x, Y = y)^と表記。

⊲ どうやって確率を割り振る？_⇒同時確率分布。

1.2

^{同時確率分布}

同時確率分布：複数の確率変数_{(X, Y)}について、実現値のペア_{(x, y)}に確率を与える確率

分布を、と呼ぶ。

⊲ 同時分布、結合分布、多次元分布_...呼び方はさまざま。

1

(2)

Pr(X = x, Y = y) = h(x, y) ⁽¹⁾

で得られるとき、_{h(x, y)}をと呼ぶ。

⊲ h(x, y)^{の満たすべき性質：}h(x, y)^{は確率なので}

確率は非負： Pr(X = x, Y = y) = h(x, y) ≥ ^, ⁽²⁾ 確率の総和は₁：

x

y

Pr(X = x, Y = y) =

x

y

h(x, y) = ^. ⁽³⁾

例：_{(X, Y)}の実現値が、それぞれx = 1, 3, 5^、y = 2, 4, 6^{であるとする。}

⊲ ^{実現値のペア}(x, y)^は_{3 × 3 = 9}^通り。

⊲ ^各(x, y)^{について、確率}Pr(X = x, Y = y)が次表で与えられている。

h(x, y) _{Y = 2} _{Y = 4} _{Y = 6}

X = 1 ^0.2 ^0.1 ^0.1

X = 3 ^0.1 ^0.15 ^0.1

X = 5 ⁰ ^0.1 ^0.15

⇒この表の任意のセルを数式で一般的に表したのが、₍₁₎式。例えば

Pr(X = 1, Y = 4) = = 0.1. ⁽⁴⁾

⊲ 全てのセルは非負で、合計すると₁。∴確率関数の性質₍₂₎式、₍₃₎式を満たす。

_Remark：_{... (1)}式の_{h(x, y)}は、単に実現値のペア_{(x, y)}の確率Pr(X = x, Y = y)^を列挙しているだけ。

⊲ ∴^{一次元の確率関数}Pr(X = x) = f (x)^{と、同じこと。}

⊲ ^{上の数値例のような、}Pr(X = x, Y = y) = h(x, y)の表を理解できれば十分。

同時確率密度関数：連続型の_{(X, Y)}について、a < X < b^かつc < Y < d^{の確率が二重積分}

Pr(a < X < b, c < Y < d) =

b x=a

d y=c

h(x, y)dxdy (5)

で得られるとき、_{h(x, y)}を（同時密度）と呼ぶ。

⊲ h(x, y)の満たすべき性質：離散型と同様、

確率は非負： h(x, y) ≥ 0 ⇒ Pr(a < X < b, c < Y < d) ≥ (6)

確率の総和は₁： Pr(−∞ < X < ∞, −∞ < Y < ∞) =

∞ x=−∞

∞

y=−∞h(x, y)dxdy = ^. (7)

⊲ 注意：一次元の密度関数（講義ノート_#07）と同様、連続型の確率では_“≤”と_“<”を区別しない。

例：二次元の標準正規分布（図₁）。

⊲ ^グラフの ^（横×^縦×^{高さ）で、確率}Pr(a < X < b, c < Y < d)^を表現。(7)^式

で、_{h(x, y)}が作るグラフ全体の体積を₁に基準化。

⊲ ...おおよそのイメージがつかめれば、十分。

(3)

x

y h(x,y)

図_1:二次元の標準正規分布_{h(x, y)}

1.3

^{周辺確率分布}

周辺確率分布：同時分布_{h(x, y)}が与えられたとき、 Pr(X = x) = f (x) =

y

h(x, y), Pr(Y = y) = g(y) =

x

h(x, y) (8)

を、_X、_Yのと呼ぶ。（連続型なら上式のを

で置き換え。）

⊲ h(x, y)^の、の側を足し合わせて潰す_⇒ の周辺分布_{f (x)}。

⊲ h(x, y)^の、の側を足し合わせて潰す_⇒ の周辺分布_g(y)。

⊲ ... コレも、数値例で理解するのが一番。

例：次の同時分布の、_Xと_Yそれぞれの周辺分布は？

h(x, y) _{Y = 8} _{Y = 9} f (x)

X = 1 ^0.1 ^0.1 ^0.2

X = 2 ^0.2 ^0.3 ^0.5

X = 3 ^0.1 ^0.2 ^0.3

g(y) 0.4 0.6

⊲ X^{の周辺分布} f (x)^を、(8)式の定義通り機械的に求めると

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

Pr(X = 1) = f (1) = + = 0.2

Pr(X = 2) = f (2) = + = 0.5

Pr(X = 3) = f (3) = + = 0.3

⇒ Pr(X = x) = f (x) =

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

0.2 _{for x = 1} 0.5 _{for x = 2} 0.3 _{for x = 3} .

(9)

∴「_Yが₈だろうが₉だろうが、とにかく_{X = 1}となる確率」が、Pr(X = 1) = f (1)^。

⇒ x = 1, 2, 3全てについて並べると、_Xの周辺分布Pr(X = x) = f (x)^{の出来上がり！}

(4)

Pr(Y = y) = g(y) =

⎧⎪

⎪⎨

⎪⎪

⎩

0.4 _{for y = 8}

0.6 _{for y = 9}^. ⁽¹⁰⁾

⊲ ^同時分布h(x, y)の表を作るとその「周辺」に現れるから、周辺分布。

_Remark：簡単に言えば、周辺分布は前回まで登場したのこと。そ

れぞれ_X単体、_Y単体の確率だけ与える。

⊲ h(x, y)^：(X, Y)^{の実現値ペア}(X = x, Y = y)^{の確率を与える。}

⊲ f (x)^：Yの結果は何でも良いから、とにかく_{X = x}である確率を与える。（上の数値

例から明らか。）_g(y)も同様。

⊲ Pr(X = x) = f (x)をウェイトに期待値をとれば、おなじみの_{E(X) =}

x^{x f (x)}^。

2 ^{多次元分布と期待値}

2.1

確率変数の関数の期待値

確率変数の関数：二つの確率変数_X、_Yの関数をW = s(X, Y)^と置く。

⊲ (X, Y)^{が確率的に動けば、}W^も動く→W^{の期待値は？}

確率変数の関数の期待値：_{(X, Y)}に依存する関数W = s(X, Y)^{の期待値を}

E(W) = E [s(X, Y)] =

⎧⎪

⎪⎨

⎪⎪

⎩

xys(x, y)h(x, y) ^{（離散型）}

x

ys(x, y)h(x, y)dxdy ^{（連続型）} ⁽¹¹⁾

と定義する。

⊲ ^確率Pr(X = x, Y = y) = h(x, y)^{をウェイトに、}^W^の実現値w = s(x, y)^を ^。

⊲ ∴一次元の関数の期待値（講義ノート_#08）と、全く同じ発想。

例（再掲）：周辺分布の数値例で使った_{(X, Y)}について、W = s(X, Y) = X + Y^と置く。

h(x, y) _{Y = 8} _{Y = 9} f (x)

X = 1 ^0.1 ^0.1 ^0.2

X = 2 ^0.2 ^0.3 ^0.5

X = 3 ^0.1 ^0.2 ^0.3

g(y) 0.4 0.6

⊲ ^例えば_{X = 1}^、_{Y = 8}^が出るとW^はw = 1 + 8 = ^⇒その確率は、上の表から

Pr(X = 1, Y = 8) = h(1, 8) = ^。

⊲ ∴^全ての_{w = x + y}^{を、各々の確率}h(x, y)^{で加重平均すると}

E(W) = (1 + 8)h(1, 8) + (1 + 9)h(1, 9) + · · · + (3 + 9)h(3, 9)

= 9 · 0.1 + 10 · 0.1 + · · · + 12 · 0.2 = ^. ⁽¹²⁾

(5)

_Remark：W = s(X, Y) = Xと置くと、その期待値は（周辺分布の定義₍₈₎式に注意）、

E(W) = E(X) =

x

y

xh(x, y) =

x

y

h(x, y)

=周辺分布 f (x)

= ^. (13)

X^の分布 f (x)をウェイトにした、単なる_Xの期待値。_Yも同様に、_{E(Y) =}_y_yg(y)。

⊲ ∴(11)^{式の同時分布}h(x, y)による期待値は、一次元の期待値の定義（講義ノート_#08）とも「つじつま」が合う！

2.2

^{確率変数の和の期待値}

和の期待値：W = s(X, Y) = aX + bY^{と置くと（}^a^、^b^は定数）^{、その期待値は}

E(aX + bY) = ^. ⁽¹⁴⁾

∴形式上、分配法則が成立。ただし、 E(aX + bY) =

x

y

(ax + by)h(x, y), E(X) =

x

x f (x), _{E(Y) =}

y

yg(y). (15)

それぞれ確率分布_{h(x, y)}、_{f (x)}、_g(y)による期待値。（連続型も同様。）

⊲ ^周辺分布 f (x)^、g(y)^{が分かる場合は、}(14)式右辺で和の期待値を求める方がラク。

⊲ 証明：離散型のみ示す。周辺分布の定義₍₈₎式に注意すると、 E(aX + bY) =

x

y

(ax + by)h(x, y) =

x

y

(ax)h(x, y) +

x

y

(by)h(x, y)

= a

x

y

h(x, y)

=X の周辺分布 f (x)

+b

y

x

h(x, y)

=Y の周辺分布 g(y)

= a

x

x f (x) + b

y

yg(y) = aE(X) + bE(Y). (16)

⊲ 注意：分布の違いを明確にするために、₍₁₄₎式を

E_X,Y(aX + bY) = aEX(X) + bEY^(Y) ⁽¹⁷⁾

と表記することも。

例（再掲）：上の数値例で既に求めた_{W = X + Y}の期待値₍₁₂₎式を、₍₁₄₎式を利用して求める。

⊲ ^{周辺分布は}(9)^式、(10)^式。⇒X^、Y^{の期待値は}

E(X) = 1 · 0.2 + 2 · 0.5 + 3 · 0.3 = ^. ⁽¹⁸⁾

E(Y) = 8 · 0.4 + 9 · 0.6 = ^. ⁽¹⁹⁾

(6)

E(X + Y) = E(X) + E(Y) = 2.1 + 8.6 = ^. ⁽²⁰⁾

同時分布_{h(x, y)}から求めた_Wの期待値₍₁₂₎式と、全く同じ。（計算はコチラの方が

はるかに簡単。）

_Remark：₍₁₄₎式からE(X + Y) = E(X) + E(Y)^だが、^{「特別な場合」を除き}

. (21)

間違いやすいので、要注意！

⊲ ^{「特別な場合」とは？}⇒X^とYが独立な場合（詳しくは講義ノート_#13、_#14。）

まとめと復習問題

今回のまとめ

多次元の確率変数と確率分布：同時分布_{h(x, y)}。

多次元分布_{h(x, y)}、周辺分布 _{f (x)}、_g(y)による期待値。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^同時分布h(x, y)^{と周辺分布} f (x)^、g(y)の違い（役割）を、簡潔に述べよ。

2. ^{次の同時分布}h(x, y)^{に従う確率変数}(X, Y)^{を考える。}X^{の実現値は}_{x = 0, 1}^、Y^の実現値も_{y = 0, 1}。

h(x, y) _{Y = 0} _{Y = 1} f (x)

X = 0 ^0.4 ^0.3

X = 1 ^0.2 ^0.1

g(y)

(a) X^、Y^{の周辺分布} f (x)^、g(y)^{を求めよ。}

(b) W = X + Y^と置く。^W^の期待値E(W) = E(X + Y)^{を求めよ。}^{h(x, y)}^{から求めても、周} 辺分布から求めても、どちらでも良い。

多次元の確率分布 経済統計 鹿野研究室

担当：鹿野（大阪府立大学）

はじめに

前回の復習

今回学ぶこと

1 多次元の確率分布

多次元の確率変数とその確率分布

同時確率分布

周辺確率分布

2 多次元分布と期待値

確率変数の関数の期待値

確率変数の和の期待値

まとめと復習問題

今回のまとめ

復習問題

多次元の確率分布経済統計鹿野研究室

1 ^{多次元の確率分布}

^{同時確率分布}

^{周辺確率分布}

2 ^{多次元分布と期待値}

^{確率変数の和の期待値}