統計学(第5週) : 確率変数
高木 真吾
北海道大学
http://sites.google.com/site/hustat2017/
October 27, 2017
2変数確率変数
2変数確率変数
例示
確率変数に関する条 件付き確率
2変数確率変数の特 性値
確率変数間の独立性 まとめ
解答編
導入例:取り出される球のうち,赤と青の数
■ 例)壺の中に7個のボールが入っている
◆ 内訳:赤2球,青3球,白2球
■ 無作為に3個同時にとりだすとき,赤球の数を X,青球の数を Y
◆ 必然的に白球の数は 3 − X − Y
■ このとき,
◆ X の取りうる値: {0, 1, 2}
◆ Y の取りうる値: {0, 1, 2, 3}
■ その実現パターンは表の通り
導入例:取り出される球のうち,赤と青の数
Table 1: 2変数の確率分布表: Pr[X = x, Y = y]
X / Y 0 1 2 3 Pr[X = •]
2 2/35 3/35 0 0 5/35
1 2/35 12/35 6/35 0 20/35
0 0 3/35 6/35 1/35 10/35
Pr[Y = •] 4/35 18/35 12/35 1/35 1
導入例:取り出される球のうち,赤と青の数
■ 同時確率分布(表):二つの確率変数 X,Y がどのように実現するか上 の表.
■ 周辺確率分布(表):他方の出方とは関係なく,一方の確率変数がどのよ
うな実現の仕方をするか
◆ Y に注目:X の出方を無視し,Pr[Y = 0] は 0 + 2/35 + 2/35 = 4/35 と求められる.これらは表の下段.
◆ X についても,表の左欄にまとめられている.
◆ 一般に,起きうる値が X:{xi}ni=1,Y :{yj}mj=1 のとき,同時確率が Pr[X = xi, Y = yj] などと与えられるとき,それぞれの周辺確率は Pr[X = xi] =
Xm j=1
Pr[X = xi, Y = yj], Pr[Y = yj] =
Xn i=1
Pr[X = xi, Y = yj]
導入例:取り出される球のうち,赤と青の数
Table 2: X の周辺確率分布: Pr[X = x]
X 0 1 2
Pr[X = •] 5/35 20/35 10/35
Table 3: Y の周辺確率分布: Pr[Y = y]
Y 0 1 2 3
Pr[Y = •] 4/35 18/35 12/35 1/35
確率変数に関する条件付き確率
■ 起きうる値が X:{xi}ni=1,Y :{yj}mj=1 のとき,同時確率が
Pr[X = xi, Y = yj] などと与えられているとする.
■ 二つの事象 A,B について,事象 A が与えられた下での,事象 B の条件 付き確率
Pr[B|A] = Pr[A ∩ B] Pr[A]
■ 事象 A:X が xi となる事象,B:Y が yj となる事象,X が xi であると いう条件の下で,Y が yj となるという条件付き確率:
Pr[Y = yj|X = xi] = Pr[X = xi, Y = yj]
Pr[X = xi] (1)
確率変数に関する条件付き確率
■ 事象 A:X が xi となる事象,B:Y が yj となる事象,X が xi であると いう条件の下で,Y が yj となるという条件付き確率:
Pr[Y = yj|X = xi] = Pr[X = xi, Y = yj] Pr[X = xi]
■ 乗法公式:
Pr[X = xi, Y = yj] = Pr[Y = yj|X = xi] × Pr[X = xi]
= Pr[X = xi|Y = yj] × Pr[Y = yi]
条件付き期待値: E [Y |X] ( X が与えられた下での Y の条
件付き期待値)
■ X がある特定の値 xi を取るという条件の下での条件付き期待値は,条件 付き確率を用いて,
E[Y |X = xi] =
Xm j=1
yj · Pr[Y = yj|X = xi] (2)
と定期議され,E[Y |X = xi] は xi という水準に依存している.
■ (発展)一般に,E[Y |X] は(Y については和を取ることで消しているの で)確率変数 X の水準に依存する関数であり,それ自身が確率変数.
■ (発展) 確率変数 E[Y |X] の確率分布は,X が {x1, x2, . . . , xn} の値を取 りうることを考えて,
E[Y |X] E[Y |X = x1] E[Y |X = x2] · · · E[Y |X = xn]
(X) (x1) (x2) · · · (xn)
確率 Pr[X = x1] Pr[X = x2] · · · Pr[X = xn]
条件付分布と条件付期待値
■ 練習問題1:下の地震に関するマグニチュード X と最大震度 Y の同時分 布表を用いて,震度が4と知らされた場合のマグニチュードについての条 件付分布と条件付期待値,およびマグニチュードが8と知らされた場合の 震度に関する条件付分布と条件付期待値を求めてください.
Table 4: マグニチュード X と最大震度 Y の同時分布表
X/Y 3 4 5 6 7 total
6 0.125 0.200 0.175 0.500
7 0.050 0.200 0.100 0.350
8 0.075 0.050 0.025 0.150
total 0.125 0.250 0.450 0.150 0.025 1.000
条件付分布および条件付期待値に関する計算例
■ 震度5 (Y = 5) と知らされた場合のマグニチュード (X) に関する条件付
分布と条件付期待マグニチュード
◆ 条件付分布表の作成
Table 5: マグニチュード X の条件付分布表(最大震度 Y = 5 )
X 6 7 8 total
Pr[X = •|Y = 5] 7/18 8/18 3/18 1
Pr[ X = 6 | Y = 5 ] = Pr[X = 6, Y = 5] Pr[Y = 5] =
0.175 0.450 =
7 18 Pr[ X = 7 | Y = 5 ] = 0.200
0.450, Pr[ X = 8 | Y = 5 ] = 0.075 0.450
条件付分布および条件付期待値に関する計算例
■ 震度5 (Y = 5) と知らされた場合のマグニチュード (X) に関する条件付
分布と条件付期待マグニチュード
◆ 条件付期待値の計算 E[X | Y = 5] =
X8 x=6
x×Pr[X = x | Y = 5] = 6· 7
18+7· 8
18+8· 3 18 =
122 18 つまり,最大震度が5であるとき,およそ起きうるマグニチュードの 中心(条件付平均)は 6.8 程度と考えられる.
条件付分布および条件付期待値に関する計算例
■ マグニチュード7 (X = 7) と知らされた場合の最大震度 (Y ) に関する条 件付分布と条件付期待最大震度
◆ 条件付分布表の作成
Table 6: 最大震度 Y の条件付分布表(マグニチュード X = 7 )
Y 3 4 5 6 7 total
Pr[Y = •|X = 7] 0 1/7 4/7 2/7 0 1
Pr[ Y = 4 | X = 7 ] = Pr[X = 7, Y = 4] Pr[X = 7] =
0.050 0.350 =
1 7 Pr[ Y = 5 | X = 7 ] = 0.200
0.350, Pr[ Y = 6 | X = 7 ] = 0.100 0.350
条件付分布および条件付期待値に関する計算例
■ マグニチュード7 (X = 7) と知らされた場合の最大震度 (Y ) に関する条 件付分布と条件付期待最大震度
■ 条件付期待値の計算
E[Y | X = 7] =
X7 y=3
y×Pr[Y = y | X = 7] = 3·0
7+4· 1
7+5· 4
7+6· 2
7+7· 0 7 =
36 7 つまり,マグニチュードが 7 であるとき,およそ起きうる最大震度の中心
(条件付平均)は 5.1 程度と考えられる.
2変数確率変数の特性値
2変数確率変数 2変数確率変数の特 性値
2変数確率変数の平 均・分散など
確認
確認問題:平均・分 散・標準偏差
相関と共分散
共分散・相関係数の 性質
確認問題:相関と共 分散
確率変数間の独立性 まとめ
解答編
2変数確率変数の平均・分散など
■ 性質1 X,Y それぞれの平均・分散は周辺確率のみから求めることがで きる
■ 性質2 分散について,
V[X] = E[(X − E[X])2] = E[X2] − {E[X]}2
■ 性質3 二つの確率変数の和について,
E[X + Y ] = E[X] + E[Y ]
E[a + b · X + c · Y ] = a + b · E[X] + c · E[Y ]
■ 性質4 E[XY ] = E[X · E[Y |X]](この性質については今のところ理解しな くても良い)
2変数確率変数の平均・分散など
■ 性質4 E[XY ] = E[X · E[Y |X]]
◆ ただし,E[Y |X] は,X が与えられた下での Y の条件付き期待値と呼
ばれ,
E[Y |X = xi] =
Xm j=1
yj · Pr[Y = yj|X = xi] (3)
であり,
E[X · E[Y |X]] =
Xn i=1
{ xi · E[Y |X = xi] } · Pr[X = xi] (4)
と定義される.
2変数確率変数の期待値演算
■ 確認1− 1:E[X] を求める.
◆ 起きうる値が X:{xi}ni=1,Y :{yj}mj=1 のとき,同時確率が Pr[X = xi, Y = yj] などと与えられているとする.
◆ 期待値(平均)は,『起きうる値 × その確率』なので E[X] =
Xn i=1
Xm j=1
xi · Pr[X = xi, Y = yj]
=
Xn i=1
xi ·
Xm j=1
Pr[X = xi, Y = yj]
=
Xn i=1
xi · Pr[X = xi]
2変数確率変数の期待値演算
■ 確認1− 2:分散 V[X] を求める.
◆ 分散は,散らばりの尺度で,「平均からの乖離の二乗」についての平均
V[X] = E[(X − E[X])2]
=
Xn i=1
Xm j=1
(xi − E[X])2 · Pr[X = xi, Y = yj]
=
Xn i=1
(xi − E[X])2 ·
Xm j=1
Pr[X = xi, Y = yj]
=
Xn i=1
(xi − E[X])2 · Pr[X = xi]
2変数確率変数の期待値演算
■ 確認2:
V[X] = E[(X −E[X])2] = E[X2−2X·E[X]+{E[X]}2] = E[X2]−2{E[X]}2
■ 確認3:E[X + Y ] を求める.
◆ 期待値(平均)は,『起きうる値 × その確率』なので
E[X + Y ] =
Xn i=1
Xm j=1
(xi + yj) · Pr[X = xi, Y = yj]
=
Xn i=1
Xm j=1
xi · Pr[X = xi, Y = yj]
+ Xn
i=1
Xm j=1
yj · Pr[X = xi, Y = yj]
2変数確率変数の期待値演算
■ 確認3:E[X + Y ] を求める.
E[X + Y ] =
Xn i=1
Xm j=1
xi · Pr[X = xi, Y = yj]
+ Xn
i=1
Xm j=1
yj · Pr[X = xi, Y = yj]
=
Xn i=1
xi ·
Xm j=1
Pr[X = xi, Y = yj]
+ Xm j=1
yj ·
Xn i=1
Pr[X = xi, Y = yj]
!
=
Xn i=1
xi · Pr[X = xi] + Xm j=1
yj · Pr[Y = yj] = E[X] + E[Y ]
2変数確率変数の期待値演算
■ 確認4:E[XY ] = E[X · E[Y |X]] を求める.
◆ 期待値(平均)は,『起きうる値 × その確率』なので
E[XY ] =
Xn i=1
Xm j=1
(xi · yj) · Pr[X = xi, Y = yj]
=
Xn i=1
Xm j=1
(xi · yj) · Pr[Y = yj|X = xi] · Pr[X = xi]
=
Xn i=1
xi ·
Xm j=1
yj · Pr[Y = yj|X = xi]
· Pr[X = xi]
=
Xn i=1
xi · E[Y |X = xi] · Pr[X = xi] = E[X · E[Y |X]]
確認問題:平均・分散・標準偏差
■ Table 1 を用いて以下の問いに答えてください.
◆ 確率変数 X,Y それぞれの平均と分散・標準偏差を求めてください.
◆ E[6 · X + 10 · Y ] を求めてください.
◆ E[XY ] を求めてください
確認問題:平均・分散・標準偏差
■ 解答
◆ E[X] = 6/7,E[Y ] = 9/7 E[X] = 0 · 10
35 + 1 · 20
35 + 2 · 5 35 =
30 35 E[Y ] = 0 · 4
35 + 1 · 18
35 + 2 · 12
35 + 3 · 1 35 =
45 35
確認問題:平均・分散・標準偏差
■ 解答
◆ V[X] = 20/49,V[Y ] = 24/49. E[X2] = 02 · 10
35 + 1
2 · 20
35 + 2
2 · 5 35 =
40 35 E[Y 2] = 02 · 4
35 + 1
2 · 18
35 + 2
2 · 12
35 + 3
2 · 1 35 =
75 35 V[X] = 40
35 − 30 35 ·
30 35 =
500 1225 =
20 49 V[Y ] = 75
35 − 45 35 ·
45 35 =
600 1225 =
24 49
確認問題:平均・分散・標準偏差
■ 解答
◆ E[6 · X + 10 · Y ] を求めてください.(答え:18)
E[6X + 10Y ] = 6 · E[X] + 10 · E[Y ] = 6 · 30 + 10 · 45
35 = 18
確認問題:平均・分散・標準偏差
■ 解答
◆ E[XY ] を求めてください.(答え:30/35)
E[XY ] = (2)(0) · 2
35 + (2)(1) · 3
35 + (2)(2) · 0
35 + (2)(3) · 0 35 + (1)(0) · 2
35 + (1)(1) · 12
35 + (1)(2) · 6
35 + (1)(3) · 0 35 + (0)(0) · 0
35 + (0)(1) · 3
35 + (0)(2) · 6
35 + (0)(3) · 1 35
= (1)(1) · 12
35 + (1)(2) · 6
35 + (2)(1) · 3 35
= 12 35 +
12 35 +
6 35 =
30 35
相関と共分散
■ 1変数確率変数の特性
◆ (起こりやすさの)中心を示す尺度:平均 E[X]
◆ 中心からの散らばり具合を示す尺度:分散 V[X] = E[(X − E[X])]2
(標準偏差 σX =
pV[X])
■ 2変数確率変数の関係
◆ 共分散 σXY = cov(X, Y ) = E[ (X − E[X])(Y − E[Y ]) ]
符号 それぞれの確率変数の起きやすさの中心 (E[X], E[Y ]) から見て,
(X − E[X], Y − E[Y ]) が同符号(異符号)の方向で実現しやすい
とき,共分散は正の値(負の値)をとる.
程度 また中心から遠い点が実現する確率が高いほど共分散は大きく なる.
相関と共分散
■ 1変数確率変数の特性
◆ (起こりやすさの)中心を示す尺度:平均 E[X]
◆ 中心からの散らばり具合を示す尺度:分散 V[X] = E[(X − E[X])]2
(標準偏差 σX =
pV[X])
■ 2変数確率変数の関係
◆ 相関係数 corr(X, Y ) = σXY /(σXσY )
■ 相関係数は −1 から 1 の間の値をとる.
■ −1 に近いほど (X − E[X], Y − E[Y ]) が互いに異符号で,負の傾 きをもつ直線関係に近い.
■ 1 に近いほど (X − E[X], Y − E[Y ]) が互いに同符号で,正の傾き をもつ直線関係に近い.
■ 0 に近いほど (X − E[X], Y − E[Y ]) に直線関係がみられない.
共分散・相関係数の性質
■ 性質5 共分散 E[ (X − E[X])(Y − E[Y ]) ] = E[XY ] − E[X]E[Y ]
■ 性質6 V[X + Y ] = V[X] + V[Y ] + 2cov(X, Y ) 証明は下段1.
1
分散の定義に従って,
V[X + Y ] = E[{(X + Y ) − E[X + Y ]}2]
= E[{(X − E[X]) + (Y − E[Y ])}2]
= E[(X − E[X])2] + E[(Y − E[Y ])2] + 2 · E[(X − E[X])(Y − E[Y ])]
= V[X] + V[Y ] + 2cov(X, Y )
確認問題:相関と共分散
Table 7: 相関係数が0
X/Y -2 -1 0 1 2 Pr[X = •]
2 .025 .025 .050
1 .050 .100 .050 .200
0 .150 .200 .150 .500
-1 .050 .100 .050 .200
-2 .025 .025 .050
Pr[Y = •] .000 .300 .400 .300 .000
図解:実現点と生じやすさ
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が0のケース
確率変数 X
確認問題:相関と共分散
■ E[X] = E[Y ] = 0,
E[X] = (−2) · 0.05 + (−1) · 0.2 + (0) · 0.5 + (1) · 0.2 + (2) · 0.05 = 0
■ V[X] = 0.8, V[Y ] = 0.6
V[X] = E[X2] − {E[X]}2
= (−2)2 · 0.05 + (−1)2 · 0.2 + (0)2 · 0.5 +(1)2 · 0.2 + (2)2 · 0.05 − 02
= 0.8
確認問題:相関と共分散
■ E[XY ] = 0(Y = ±2 になる確率は0なので最初から除外して計算する)
E[XY ]
= (2)(−1) · 0.025 + (2)(0) · 0.000 + (2)(1) · 0.025 + (1)(−1) · 0.050 + (1)(0) · 0.100 + (1)(1) · 0.050 + (0)(−1) · 0.150 + (0)(0) · 0.200 + (0)(1) · 0.150
+ (−1)(−1) · 0.050 + (−1)(0) · 0.100 + (−1)(1) · 0.050 + (−2)(−1) · 0.025 + (−2)(0) · 0.000 + (−2)(1) · 0.025
= 0
■ cov(X, Y ) = E[XY ] − E[X] · E[Y ] = 0 − 0 · 0 = 0
■ corr(X, Y ) = cov(X, Y )/pV[X] · V[Y ] = 0
図解:共分散と相関係数
Figure 1: 相関係数は0
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が0のケース
確率変数 Y
確率変数 X
■ 相関係数は0
■ しかしながら X と Y は『無関 係』には見えない
■ 相関係数は線形関係の強さを示 す尺度
確認問題:相関と共分散
Table 8: 負の相関係数:共分散小
X/Y -2 -1 0 1 2 Pr[X = •]
2 .05 .05
1 .10 .10 .20
0 .15 .20 .15 .50
-1 .10 .10 .20
-2 .05 .05
Pr[Y = •] .00 .30 .40 .30 .00
図解:実現点と生じやすさ
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は小
確率変数 Y
確率変数 X
図解:共分散と相関係数
Figure 2: 相関係数は負
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は小
確率変数 Y
確率変数 X
■ E[X] = E[Y ] = 0,
■ V[Y ] = 0.6,
■ V[X] = 0.8,
■ E[XY ] = −0.40
■ cov(X, Y ) = −0.40, corr(X, Y ) ≈ −0.577
◆ X に大きな正値が実現なら, 同時に起きる Y は負値とな る傾向
確認問題:相関と共分散
Table 9: 負の相関係数:共分散大
X/Y -2 -1 0 1 2 Pr[X = •]
2 .05 .05
1 .02 .08 .10 .20
0 .15 .20 .15 .50
-1 .10 .08 .02 .20
-2 .05 .05
Pr[Y = •] .07 .23 .40 .23 .07
図解:実現点と生じやすさ
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は大
確率変数 X
図解:共分散と相関係数
Figure 3: 相関係数は負
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は大
確率変数 Y
確率変数 X
■ E[X] = E[Y ] = 0,
■ V[Y ] =?, V[X] =?, E[XY ] =?
■ cov(X, Y ) =?, corr(X, Y ) ≈?
◆ X に大きな正値が実現なら, 同時に起きる Y は負値とな る傾向
◆ 先の例に比べて,中心(平 均)からの乖離が大きいと ころでも実現する可能性
図解:共分散と相関係数
Figure 4: 相関係数は負 : 共分散は小
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は小
確率変数 Y
確率変数 X
Figure 5: 相関係数は負 : 共分散は大
-3 -2 -1 0 1 2 3
-3-2-10123
相関係数が負値:共分散は大
確率変数 Y
確率変数 X
確率変数間の独立性
2変数確率変数 2変数確率変数の特 性値
確率変数間の独立性 確率変数同士の独 立性
独立と相関 独立と相関 まとめ 解答編
確率変数同士の独立性
■ 確率変数 X と Y が独立:互いの実現の仕方が無関係
◆ X が xi となる事象と,Y が yj となる事象が独立であるということを 用いて定義する.
■ 定義1:任意の (xi, yj) に対して,
Pr[Y = yj|X = xi] = Pr[Y = yj]
■ 定義2:任意の (xi, yj) に対して,
Pr[Y = yj, X = xi] = Pr[X = xi] · Pr[Y = yj]
Table 7 の場合
■ 定義1:任意の
(x
i, y
j) に対して, Pr[Y = y
j|X = x
i] = Pr[Y = y
j]
Pr[Y = 0|X = 0] = Pr[Y = 0, X = 0]
Pr[X = 0] =
0.2
0.5 = 0.4
Pr[Y = 0] = 0.4
Pr[Y = 1|X = −2] = Pr[Y = 1, X = −2]
Pr[X = −2] =
0.025
0.05 = 0.5
Pr[Y = 1] = 0.3
◆
任意の点について条件付き確率と周辺確率が等しいとは言え
ない
Table 7 の場合
■ 定義2:任意の
(x
i, y
j) に対して,
Pr[Y = y
j, X = x
i] = Pr[X = x
i] · Pr[Y = y
j]
Pr[Y = 0, X = 0] = 0.2
Pr[X = 0] = 0.5, Pr[Y = 0] = 0.4
Pr[Y = 1, X = −2] = 0.025
Pr[X = −2] = 0.05, Pr[Y = 1] = 0.3
◆
任意の点について「同時確率」と「周辺確率同士の積」が等し
いとは言えない
◆
同様に Table 8 でも X と Y は独立でないことを示すことがで
きる.
確率変数同士の独立性
■ 確率変数 X と Y が独立:互いの実現の仕方が無関係
◆ 性質7 X と Y が独立であるとき,E[Y |X] = E[Y ]
■ 確認:Pr[Y = yj|X = xi] = Pr[Y = yj] なので,どの xi に対し
ても,
E[Y |X = xi] =
Xm j=1
yj · Pr[Y = yj|X = xi]
=
Xm j=1
yj · Pr[Y = yj]
= E[Y ]
確率変数同士の独立性
■ 確率変数 X と Y が独立:互いの実現の仕方が無関係
◆ 性質8 X と Y が独立であるとき,E[XY ] = E[X] · E[Y ]
■ 性質7:E[Y |X] = E[Y ] を用いて,
E[XY ] = E[X · E[Y |X]] = E[X · E[Y ]] = E[X] · E[Y ]
ただし,最後の等号は,E[Y ] は確率変数ではない普通の数字であ ることを利用した.
独立と相関
■ 確率変数 X,Y が独立であるとき,
■ 性質9 共分散は0,相関係数も0(cov(X, Y ) = corr(X, Y ) = 0)
■ 確認
◆ 独立であるとき,E[XY ] = E[X] · E[Y ] なので性質5より cov(X, Y ) = E[XY ] − E[X] · E[Y ] = 0
独立と相関
■ 確率変数 X,Y が独立であるとき,
■ 性質 10 V[a + b · X + c · Y ] = b2 · V[X] + c2 · V[Y ]
◆ 一般に V[a + b · X + c · Y ] は以下のように共分散を用いて表現できる
V[a + b · X + c · Y ]
= E[{(a + b · X + c · Y ) − E[a + b · X + c · Y ]}2]
= E[{b · (X − E[X]) + c · (Y − E[Y ])}2]
= b2 · E[(X − E[X])2] + c2 · E[(Y − E[Y ])2] +2bc · E[(X − E[X])(Y − E[Y ])]
= b2 · V[X] + c2 · V[Y ] + 2bc · cov(X, Y ) 性質9より,共分散が0なので性質 10 も成り立つ.
まとめ
2変数確率変数 2変数確率変数の特 性値
確率変数間の独立性 まとめ
まとめ(非常に重要) 演習問題
演習問題 演習問題 演習問題 演習問題 解答編
まとめ(非常に重要)
二つの確率変数 X1, X2 を用いて,Y = β0 + β1 · X1 + β2 · X2 とする.
■ 平均
E[Y ] = β0 + β1 · E[X1] + β2 · E[X2]
■ 分散
V[Y ] = β2
1 · V[X1] + β22 · V[X2] + 2β1β2 · cov(X1, X2)
■ 二つの確率変数 X1, X2 が独立であるとき,
V[Y ] = β2
1 · V[X1] + β22 · V[X2]
まとめ(非常に重要)
n個の確率変数 {X1, X2, . . . , Xn} を用いて,以下の Y を定める. Y = β0 +
Xn i=1
βi · Xi
■ 平均
E[Y ] = β0 + Xn
i=1
βi · E[Xi]
■ 分散
V[Y ] =
Xn i=1
βi2 · V[Xi] + 2
n−1X
i=1
Xn j=i+1
βiβj · cov(Xi, Xj)
■ n個の確率変数 X1, X2, . . . , Xn が互いに独立であるとき, V[Y ] =
Xn i=1
βi2V[Xi]
まとめ(非常に重要)
■ 以上の結果はすべて離散型確率変数について説明してきた
■ 連続型確率変数についても性質1∼ 10が同様に成り立つ
◆ ただし,説明には同時密度関数に関する多重積分を利用する必要があ りここでは省略する
◆ 参考図書か講義用ウェブサイト掲載資料を参照
演習問題
1. ある製品の年間故障発生率は 25 %とする.故障時給付額が 4(万円)であ るとすると,保険会社の給付額を X として確率分布を求めてください. また公平な保険料(保険会社の利益は0)はいくらか.
2. 毎年,故障しなければ給付額0だが,初めて故障したとき給付される保険 を考える(年間故障発生率は 25 %).給付額は,1年目に故障すれば, 4/30 = 4(万円),二年目に初めて故障すれば 42/31 ≈ 5.3(万円),...k 年後に故障すれば 4k/3k−1(万円)となる.故障率は毎年一定で劣化はな いものとし,故障しない限り永遠に使い続けられるものとする.
◆ 4 年目で終了する(4 年目までに故障しなければそのまま給付なしで 終了)の保険を考えたとき,保険料が 4 万円なら加入することが合理 的か否かについて考えを述べてください.
◆ 故障するまで永遠に続く契約を考えるとき,この保険の公平な保険料
(加入時一括払い)はいくらと設定できるか.またあなたはその保険 に加入したいか否かについても考えを述べてください.
演習問題
3. 一様分布,および指数分布に従う確率変数について,累積分布関数をそれ ぞれ求めてください.またそれぞれの確率変数の平均と分散を求めてくだ さい.
4. 離散型確率変数について以下の関係が成り立つことを示してください E[α + βX] = α + βE[X], V[α + βX] = β2V[X]
Table 1 のような一般的な離散型確率分布にしたがう確率分布について示
してください
演習問題
5. Table 10 を用いて,確率変数 X の平均・分散を µX・σX2 ,確率変数 Y に ついても µY ・σ2
Y とし,相関係数を ρXY とする.
◆ ZX = (X − µX)/σX とするとき,E[ZX] = 0 と V[ZX] = 1 となるこ とを示してください.
◆ Y についても,ZY = (Y − µY )/σY とするとき, cov(ZX, ZY ) = corr(ZX, ZY ) = ρXY
ただし,cov(X, Y ) は ZX と ZY の共分散,corr(X, Y ) は ZX と ZY
の相関係数を表す.
◆ zX,i = (xi − µX)/σX, zY,j = (yj − µY )/σY とするとき,
2zX,izY,i ≤ zX,i2 + zY,i2 および −2zX,izY,i ≤ zX,i2 + zY,i2 がともに成り 立つことを用いて,相関係数が絶対値にして1以下であること
(|ρXY | ≤ 1)を示してください.
◆ 相関係数が 1 または-1 になるのはどのような条件が満たされる場合で あるかを指摘してください.
演習問題
6. Table 11 を用いて,確率変数 X,Y が独立であるとき,α, β, γ が満たす条 件を求めてください.
X/Y 2 4 6 Pr[X = •]
2 α β γ
1 β γ α
0 γ α γ
Pr[Y = •]
Table 10: 確率変数 X , Y の
同時分布表
X/Y y1 y2 · · · yj · · · y x1 p11 p12 · · · p1j · · · p x2 p21 p22 · · · p2j · · · p
... ... ... . .. ... · · ·
xi pi1 pi2 · · · pij · · · p ... ... ... . .. ... · · ·
xI pI1 pI2 · · · pIj · · · p
Table 11: 確率変数 X , Y の同時
分布表
演習問題
7. 同時刻の二つの番組の視聴率を確率変数として表現するとき,その同時密 度が次のように与えられたとする.二つの番組の視聴率は独立といえるか.
f (x, y) = 120 · xy(1 − x − y) (0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x + y ≤ 1) ただし上記以外の点での密度の高さは0とする.
8. 75ページの Table 15 を用いて,練習問題1に回答してください.
9. Table ?? を用いて,確率変数 X,Y それぞれの平均・分散,および共分散・
相関係数を求めてください.さらに X と Y が独立であるか否かを示して ください.
解答編
2変数確率変数 2変数確率変数の特 性値
確率変数間の独立性 まとめ
解答編
問題1 問題2
問題3(第4週の宿 題と同じ)
問題4 問題5
問題6 問題7
問題1
■ 給付額を X とすると,その確率分布は,
X 0 4
確率 3/4 1/4
■ このとき,期待給付額は E[X] = 0 · (3/4) + 4 · (1/4) = 1(万円)なので問 題の意味で公平な保険金は1万円となる.
問題2
■ 初めて故障するまでかかる年数 Y に関する確率分布は以下の通り
Y 1 2 3 4 · · · n
確率 p p(1 − p) p(1 − p)2 p(1 − p)3 · · · p(1 − p)n−1 給付金 1/p 1/p(1 − p) 1/p(1 − p)2 1/p(1 − p)3 · · · 1/p(1 − p)n−
■ 本文の例では p = 1/4 に相当する.
■ 4 年までの場合,
Y 1 2 3 4
確率 .2500 .1875 .1406 .1055 4 5.3333 7.1111 9.4815
■ うまくいけば(4 年目に故障すれば)10 万円近くもらえるが,期待給付 金は
E[Y ] = 1
p·p+
1
p(1 − p)·p(1−p)+
1
p(1 − p)2 ·p(1−p)
2+ 1
p(1 − p)3·p(1−p)
3 = 4
3 割以上の確率で給付 0 であり,掛け金が4万円なら「公平な保険」かも しれないし,危険回避的な人なら喜んで購入する可能性も高い
■ 永続的に続く保証であるとき,期待給付額は E[Y ] = 1
p·p+
1
p(1 − p)·p(1−p)+
1
p(1 − p)2·p(1−p)
2+· · ·+ 1
p(1 − p)k·p(1−p)
3+· · · →
つまり公平な保険料を支払うには莫大な金額を支払わなければならない.
問題3(第4週の宿題と同じ)
■ 一様分布: 累積分布関数は,
F (x) = Pr[X ≤ x] =
Z x a
1
b − adt =
1 b − a
x a
= x − a b − a 平均:
E[X] = Z b
a
t · f(t)dt = Z b
a
t · 1
b − adt =
1 2
t2 b − a
b
a
= b + a 2 分散:
E[X2] = Z b
a
t2 · f(t)dt = Z b
a
t2 · 1
b − adt =
1 3
t3 b − a
b
a
= b
2 + ab + a2
3 V[X] = E[X2] − {E[X]}2b
2 + ab + a2
3 −
b2 + 2ab + a2
4 =
(b − a)2 12
■ 指数分布: 累積分布関数は,
F (x) = Pr[X ≤ x] =
Z x
−∞
λe−λtdt = −e−λtx−∞ = 1 − e−λx
平均(ヒント:部分積分の公式, 積分の計算がわからないときは以下の問 題は省略してよい).
■ 密度関数:f (x) = λe−λx, x ≥ 0
E[X] =
Z ∞
0 t · λe
−λt
dt =
Z ∞
0
e−λtdt − t · e−λt∞0
=
−1 λe
−λt
∞
0
− 0 = 1 λ
二番目の等号は部分積分の公式を用いた2.
2
{t · e−λt}′ = e−λt − t · λe−λt
■ 分散は 1/λ2 になる.
V[X] = E[X2] − {E[X]}2 =
Z ∞
0
t2 · λe−λtdt − λ−2
= 2 ·
Z ∞
0 t · e
−λt
dt − t2 · e−λt∞0 − λ−2
= 2 ·
Z ∞
0 t · e
−λt
dt − 0 − λ−2
= 2
λ
Z ∞
0
e−λt − 2t λ · e
−λt
∞
0
− λ−2 = 2
λ2 − λ
−2
= 1 λ2 二行目と四行目3 の等号には部分積分を用いた.
3
{t2 · e−λt}′ = 2t · e−λt − t2 · λe−λt
2t ′ 2
問題4
■ K 種類の値を持つ離散型確率変数について考える
Table 12: 離散型確率変数の確率分布表
X x1 x2 · · · xk · · · xK 確率 p1 p2 · · · pk · · · pKこのとき,
E[α + βX] =
XK k=1
(α + βxk) · pk = α ·
XK k=1
pk
| {z }
=1
+β · XK k=1
xk · pk
| {z }
=E[X]
= α + β · E[X
V[α + βX] = E[{(α + βX) − E[α + βX]}2] = E[{β · (X − E[βX])}2]
= β2 · E[(X − E[βX])2]
問題5
■ zX,i ≡ (xi − µX)/σX とすると,
E[ZX] =
XI i=1
XJ j=1
xi − µX
σX ·p
ij =
XI i=1
xi − µX
σX ·
XJ j=1
pij
| {z } 周辺確率:pi•
=
XI i=1
xi − µX
σX ·p
i• = 0
分散については平均が0であることを用いて,
V[ZX] =
XI i=1
XJ j=1
xi − µX σX
2
· pij = 1 σX2
XI i=1
(xi − µX)2 · pi•
| {z }
=V[X]=σX2
= 1
■ 相関係数 ρXY = cov(X,Y )
σXσY
について,
ρXY = 1
σXσY
XI i=1
XJ j=1
(xi − µX)(yj − µY ) · pij
=
XI i=1
XJ j=1
xi − µX
σX
yj − µY
σY · pij
=
XI i=1
XJ j=1
zX,izY,j · pij
ZX, ZY の平均・分散がそれぞれ0,1なので最後の等号の右辺は共分散 であり,相関係数でもある.したがって
ρXY = cov(ZX, ZY ) = corr(ZX, ZY ).
■ 2zX,izY,j ≤ zX,i2 + zY,j2 は任意の i, j の組み合わせについて成り立つので, 非負の値 pij を掛けて,総和を求めても不等号関係は変化しない.
Xn i=1
XJ j=1
2zX,izY,j · pij ≤
Xn i=1
XJ j=1
(zX,i2 + zY,j2 ) · pij
左辺は X と Y の相関係数 ρXY であり,右辺は Xn
i=1
XJ j=1
(zX,i2 + zY,j2 ) · pij =
Xn i=1
zX,i2 · pi•
| {z }
=V[ZX]=1
+ XJ j=1
zY,j2 · p•j
| {z }
=V[ZY ]=1
= 2
以上より 2ρXY ≤ 2 すなわち ρXY ≤ 1 また,−2zX,izY,j ≤ z2
X,i + zY,j2 から −2ρXY ≤ 2 が導かれるため ρXY ≥ −1.
■ 上記不等式の等号が成り立つのは(相関係数が ±1 のとき), zY,j = ±zX,i ⇔
yj − µY
σY ±
xi − µX
σX
という関係が任意の i, j で成立する場合なので,すべての観測点の組み合 わせ (xi, yj) が
y − µY
σY = ±
x − µX
σX ⇔ y = µY ± σY
σX · (x − µX)
という直線に乗っている必要がある.逆にこの直線状であれば必ず X と Y の相関係数が ±1 となることから,X と Y の相関係数が ±1 となることと 上記の直線状にすべての実現値が乗っていることは同値である.
問題6
■ 周辺確率:
Pr[X = 0] = Pr[X = 1] Pr[X = 2] = α + β + γ Pr[Y = 2] = Pr[Y = 4] Pr[Y = 6] = α + β + γ
■ 同時確率=周辺確率の積:
Pr[X = i, Y = j] = Pr[X = i] · Pr[Y = j]
⇔ α = (α + β + γ)2 and β = (α + β + γ)2 and γ = (α + β + γ)2 ゆえに α = β = γ, α = (3α)2 → α = 1/9
問題7
■ 二変数同時密度を用いて周辺密度を求めるには,同時密度から,一方の変 数をその値域全体で積分することで消去する必要がある.確率変数 X の周 辺密度を求めるには,同時密度
f (x, y) = 120 · xy(1 − x − y) (0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x + y ≤ 1) より,X が x の水準にあるとき,Y の取りうる範囲が 0 ≤ y ≤ 1 − x とな ることを考慮して,
fX(x) =
Z 1−x 0
f (x, y)dy = 120
2 x(1 − x)y
2 − 120 3 xy
3
1−x 0
= 20x(1−x)3
同様に Y = y のとき,取りうる範囲が 0 ≤ x ≤ 1 − y fY (y) =
Z 1−y 0
f (x, y)dx = 120
2 y(1 − y)x
2 − 120 3 yx
3
1−y 0
= 20y(1−y)3
■ したがって X と Y が独立であるなら,f (x, y) = fX(x) · fY (y) という関係 が任意の値域で成立するが,
fX(x) · fY (y) = 400xy(1 − x)3(1 − y)3 6= f(x, y) となり独立でないことが分かる