確率変数の期待値と分散経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

確率変数

確率分布：確率関数（離散型）、確率密度関数（連続）。

今回学ぶこと

確率変数の期待値。

確率変数の分散・標準偏差と標準化。

テキスト該当箇所：_5.2章。

1 ^期待値

1.1

モーメント：確率変数の特徴

確率変数_Xの実現値_xの、出やすさ・出にくさ_→確率分布 _{f (x)}を描けば分かる。

⊲ データのヒストグラム（講義ノート_#02）のようなもの。

⊲ ... データは、統計量（平均や分散・標準偏差）で要約することもできたはず。

モーメント：確率変数_Xの特徴を測るパラメータを一般に、と呼ぶ。記述統計で出てきた、統計量のようなもの。

⊲ 確率変数の位置の尺度：期待値。別名一次のモーメント。

⊲ 確率変数の散らばりの尺度：分散と標準偏差。別名二次のモーメント。

1.2

^期待値

期待値（離散型）：実現値_x₁_,_x₂_{, . . . ,}_x_Kをとる離散型の確率変数_Xについて、実現値の確率分布_{Pr(X = x}_k_{) = f (x}_k₎による加重平均

E(X) = x1Pr(X = x1) + x2Pr(X = x2) + · · · + xKPr(X = xK⁾

= x1f (x1) + x2f (x2) + · · · + x^K^{f (x}^K) =

K k=1

xkf (xk) (1)

1

(2)

0.00.10.20.30.4

f(x),g(y)

E( X) E( Y)

f ( x) g( y)

A¡§˚‹

0 20 40 60 80 100

X,Y E(X)E(Y)

B:‡˛˛¤˚ ¿ ⁄˛˘ ⁄›

図_1:期待値の異なる確率変数_X、_Yの比較

を、_Xのと呼ぶ。（_Eはexpectation^の略。^）

⊲ ^各実現値xk^{を、その確率}Pr(X = xk) = f (xk)でウェイト付けして加重平均。出やすい_x_kに大きなウェイト。∴_E(X)は、さまざまな値をとり得る_Xの代表的な値。

⊲ _E(X)が大きい_{⇔ X}は大きな値が出やすい。

⊲ ^注意：X^{は確率変数だが、}E(X)^{は定数扱い。}^（実現値xk^、確率Pr(X = xk)^{ともに定数} だから。）

例：歪みの無いサイコロ_Xの期待値。

⊲ ^確率分布_{Pr(X = x}_k_{) = f (x}_k_{) =} ¹₆^で一定。^∴^期待値は

E(X) = 1 · f (1) + 2 · f (2) + · · · + 6 · f (6) = ¹₆ · 21 = ^. ⁽²⁾

期待値（連続型）：連続型の確率変数_Xについて、 E(X) =

_∞

−∞

x f (x)dx (3)

を、_Xのと呼ぶ。

⊲ E(X)^は、Xの代表的な値。意味は離散型と同じ。（積分＝精密な足し算。）

⊲ ^{実現値の下限}x1^、上限xKが分かる場合は、その区間で定積分。

_Remark：期待値の違いと、確率分布、確率変数の動きの対応関係。

⊲ 図₁：期待値の異なる確率変数_Xと_Yの分布 _{f (x)}、_g(y)。

⊲ ^図1A^：E(X) < E(Y) ⇔ g(y)^の方が、 ^{に位置する。}

⊲ ^図1B^（100^{回の試行結果）}^：E(X) < E(Y) ⇔ Y^の方が、 ^{が出やすい。}

(3)

1.3

期待値演算の重要な性質

確率変数の関数：関数_s(·)で、確率変数_Xを_{Y = s(X)}に変換_{→ Y}もまた、確率変数。

⊲ ^例：Y = s(X) = X²^。^X^{の結果に応じて、}^Y^{もランダムに変動。}

⊲ _{Y = s(X)}^{の期待値は？}

関数の期待値：_Xに依存する関数_{Y = s(X)}の期待値の定義は E(Y) = E [s(X)] =

⎧

⎪⎪

⎨

⎪⎪

⎩

xk^s(x^k^{) f (x}^k⁾ ^{（離散型）}

xs(x) f (x)dx ^{（連続型）}.

(4)

⊲ 各実現値を変換した_s(x_k₎を、_x_kの確率_{f (x}_k₎でウェイト付けして加重平均。_→出やすい_s(x_k₎を強く反映した、_Yの代表値の出来上がり。

例：₃₀₀₀円を払えば、サイコロの出た目_×1000円がもらえるゲーム。参加すべき？

⊲ _... 大げさに言えば、収益に不確実性を伴う投資の意思決定問題。

⊲ ^{参加者の収益は関数}_{Y = s(X) =} ^。確率は _{f (x}_k_{) =} ¹₆^{で一定なので、期} 待収益は

E(Y) = s(1) f (1) + s(2) f (2) + · · · + s(6) f (6)

= ¹

6· (−2000 − 1000 + · · · + 3000) = ^. ⁽⁵⁾

∴期待収益で判断すると、参加する価値あり。

一次式の期待値：確率変数_Xと任意の定数_{a, b}について、_{Y = a + bX}と置く。このとき

E(Y) = E(a + bX) = ^. ⁽⁶⁾

∴ _Xと_Yが一次式_⇒期待値も一次式。

⊲ 上のサイコロ投資（？）の収益Y = −3000 + 1000X^{は、サイコロの期待値}E(X) = 3.5 とこの公式を使えばE(Y) = −3000 + 1000E(X) = 500^。

⊲ 証明：離散型のみ示す。（連続型も同様。） E(a + bX) =

xk

(a + bxk^{) f (x}k) =

xk

a f (x_k_{) +}

xk

bx_kf (x_k)

= a

xk

f (x_k)

=1（確率の和は 1）

+b

xk

x_kf (x_k)

=E(X)←(1) 式

= a + bE(X). ⁽⁷⁾

_Remark：上式を期待値の演算公式としてまとめると（_cは定数）

1. ^。^（確率1^でc^{が起こる、と考えれば}E(c) = c·1 = c^{で期待値の定義通り。}^）

2. ^。

3. ^。

...コレを一度に証明したのが、₍₇₎式。

(4)

2 分散と標準偏差、標準化

2.1

^分散

分散：確率変数_Xについて、

Var(X) = E(X − E(X))²=

⎧

⎪⎪

⎨

⎪⎪

⎩

xk^(x^k− E(X))²^{f (x}k⁾ ^{（離散型）}

x^{(x − E(X))}

2_{f (x)dx}

（連続型）

(8)

を、_Xのと呼ぶ。（_Varは_varianceの略。）

⊲ ^各実現値x_k^{の、期待値}E(X)^{からのズレを}(x_k_{− E(X))}²^で評価。_→^確率 f (x_k)^で加重

平均。∴_Var(X)は、_E(X)を軸にした_Xの散らばり具合を測る。

⊲ Var(X)^が大きい_{⇔ X}は変動が大きく、不安定。

⊲ s(X) = (X − E(X))²と見れば、分散は確率変数の関数の期待値E[s(X)] = Var(X)^。

標準偏差：分散の正の平方根

√V(X)^を、 ^と呼ぶ。

⊲ V(X)は、単位が元の測定単位の₂乗になる。_→平方根で元の単位に。

⊲ ∴データの分散・標準偏差の関係（講義ノート_#02）と同じ。

例：サイコロの分散・標準偏差

⊲ _{E(X) = 3.5}^{なので、分散は}

Var(X) = (1 − 3.5)²·¹₆+ (2− 3.5)²·¹₆ +· · · + (6 − 3.5)²·¹₆

=¹₆ · (6.25 + 2.25 + · · · + 6.25)

=^17.5

6 ^≈ ^. ⁽⁹⁾

⊲ ∴^{標準偏差は} ^√_{Var(X) =}

17.5

6 ^{≈ 1.71}^。

_Remark：分散の違いと、確率分布、確率変数の動きの対応関係。

⊲ ^図2：分散の異なる確率変数_Xと_Yの分布 _{f (x)}、_g(y)。（期待値は同じ。）

⊲ ^図2A^：Var(X) < Var(Y) ⇔ g(y)^{の方が、左右に} ^。

⊲ ^図2B^（100^{回の試行結果）}^：Var(X) < Var(Y) ⇔ Y^{の方が、期待値から} が出やすい。

2.2

^{分散演算の重要な性質}

分散の別表現：分散の定義₍₈₎式を展開し、期待値演算の公式（注：_E(X)は定数）を使うと Var(X) = E^X²− 2XE(X) + E(X)²

= E(X²) − 2E(X)E(X) + E(X)²= ^. ⁽¹⁰⁾

⊲ ∴(8)^式or (10)式、計算しやすい方を使えば良い。

(5)

0.00.10.20.30.4

f(x),g(y)

E( X) =E( Y) f ( x)

g( y) A¡§˚‹

0 20 40 60 80 100

X,Y E(X)=E(Y)

B:‡˛˛¤˚ ¿ ⁄˛˘ ⁄›

図_2:分散の異なる確率変数_X、_Yの比較

一次式の分散：確率変数_Xと任意の定数_{a, b}について、_{Y = a + bX}と置く。このとき

Var(Y) = ^. ⁽¹¹⁾

∴_aは消え、_Xの係数_bは_b²として残る。

⊲ ^証明：E(Y) = a + bE(X)^なので、

(Y − E(Y))² = (a + bX− a − bE(X))² = [b(X− E(X))]² = ^. ⁽¹²⁾ よって

Var(Y) = E(Y − E(Y))²= E^b²(X − E(X))²= b²^E(X − E(X))²

=Var(X)

= b²^Var(X). ⁽¹³⁾

_Remark：上式を分散の演算公式としてまとめると（_cは定数）

1. ^。（定数の変動は、ゼロ。）

2. ^。

3. ^（注意！^！） ^。

...コレを一度に証明したのが、₍₁₃₎式。

2.3

^{確率変数の標準化}

確率変数の標準化：_Xから期待値_E(X)を引き、標準偏差

√Var(X)^{で割ることで作られる}

新たな確率変数

Z = ^{X − E(X)}√

Var(X) ⁽¹⁴⁾

を、された確率変数と呼ぶ。

(6)

⊲ ^{上式を書き換えれば}

Z = ^, a = −√^E(X)

Var(X)^, ^{b =}

√ 1

Var(X)^. ⁽¹⁵⁾

∴_Zは_Xの一次式。（_a、_bは定数。）

_Zの重要な性質：元の_Xがどんな確率変数であっても、標準化すると期待値・分散は

E(Z) = ^, Var(Z) = ^. ⁽¹⁶⁾

⊲ 統計学で頻繁に使われる、とても重要な性質！

⊲ _{E(Z) = 0}の証明：期待値の演算公式を₍₁₅₎式に適用すると、_Zの期待値は

E(Z) = =−√^E(X)

Var(X)⁺ 1

√Var(X)^{E(X) = 0.} ⁽¹⁷⁾

⊲ _{Var(Z) = 1}^の証明：_⇒^{今回の復習問題。}

まとめと復習問題

今回のまとめ

期待値：確率変数_Xの代表値。位置の尺度。

分散・標準偏差：確率変数_Xの散らばりの尺度。期待値と標準偏差で_Xの標準化。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^{実現値として}x = 3, 6, 9をとる離散型の確率変数_Xの確率関数が、等確率 Pr(X = x) = f (x) = ¹

3 ^{for all x} ⁽¹⁸⁾

であるとする。期待値_E(X)と分散_Var(X)を求めよ。 2. (16)^式の_{Var(Z) = 1}^{を証明せよ。}

確率変数の期待値と分散 経済統計 鹿野研究室