担当:鹿野(大阪府立大学)
2014 年度前期
はじめに
前回の復習
確率変数
確率分布:確率関数(離散型)、確率密度関数(連続)。
今回学ぶこと
確率変数の期待値。
確率変数の分散・標準偏差と標準化。
テキスト該当箇所:5.2章。
1 期待値
1.1
モーメント:確率変数の特徴
確率変数Xの実現値xの、出やすさ・出にくさ→確率分布 f (x)を描けば分かる。
⊲ データのヒストグラム(講義ノート#02)のようなもの。
⊲ ... データは、統計量(平均や分散・標準偏差)で要約することもできたはず。
モーメント:確率変数Xの特徴を測るパラメータを一般に、 と呼 ぶ。記述統計で出てきた、統計量のようなもの。
⊲ 確率変数の位置の尺度:期待値。別名一次のモーメント。
⊲ 確率変数の散らばりの尺度:分散と標準偏差。別名二次のモーメント。
1.2
期待値
期待値(離散型):実現値x1,x2, . . . ,xKをとる離散型の確率変数Xについて、実現値の確 率分布Pr(X = xk) = f (xk)による加重平均
E(X) = x1Pr(X = x1) + x2Pr(X = x2) + · · · + xKPr(X = xK)
= x1f (x1) + x2f (x2) + · · · + xKf (xK) =
K k=1
xkf (xk) (1)
1
0.00.10.20.30.4
f(x),g(y)
E( X) E( Y)
f ( x) g( y)
A¡§˚‹
0 20 40 60 80 100
X,Y E(X)E(Y)
B:‡˛˛¤˚ ¿ ⁄˛˘ ⁄›
図1:期待値の異なる確率変数X、Yの比較
を、Xの と呼ぶ。(Eはexpectationの略。)
⊲ 各実現値xkを、その確率Pr(X = xk) = f (xk)でウェイト付けして加重平均。出やす いxkに大きなウェイト。∴E(X)は、さまざまな値をとり得るXの代表的な値。
⊲ E(X)が大きい⇔ Xは大きな値が出やすい。
⊲ 注意:Xは確率変数だが、E(X)は定数扱い。(実現値xk、確率Pr(X = xk)ともに定数 だから。)
例:歪みの無いサイコロXの期待値。
⊲ 確率分布Pr(X = xk) = f (xk) = 16で一定。∴期待値は
E(X) = 1 · f (1) + 2 · f (2) + · · · + 6 · f (6) = 16 · 21 = . (2)
期待値(連続型):連続型の確率変数Xについて、 E(X) =
∞
−∞
x f (x)dx (3)
を、Xの と呼ぶ。
⊲ E(X)は、Xの代表的な値。意味は離散型と同じ。(積分=精密な足し算。)
⊲ 実現値の下限x1、上限xKが分かる場合は、その区間で定積分。
Remark:期待値の違いと、確率分布、確率変数の動きの対応関係。
⊲ 図1:期待値の異なる確率変数XとYの分布 f (x)、g(y)。
⊲ 図1A:E(X) < E(Y) ⇔ g(y)の方が、 に位置する。
⊲ 図1B(100回の試行結果):E(X) < E(Y) ⇔ Yの方が、 が出やすい。
1.3
期待値演算の重要な性質
確率変数の関数:関数s(·)で、確率変数XをY = s(X)に変換→ Yもまた、確率変数。
⊲ 例:Y = s(X) = X2。Xの結果に応じて、Yもランダムに変動。
⊲ Y = s(X)の期待値は?
関数の期待値:Xに依存する関数Y = s(X)の期待値の定義は E(Y) = E [s(X)] =
⎧
⎪⎪
⎨
⎪⎪
⎩
xks(xk) f (xk) (離散型)
xs(x) f (x)dx (連続型).
(4)
⊲ 各実現値を変換したs(xk)を、xkの確率f (xk)でウェイト付けして加重平均。→出や すいs(xk)を強く反映した、Yの代表値の出来上がり。
例:3000円を払えば、サイコロの出た目×1000円がもらえるゲーム。参加すべき?
⊲ ... 大げさに言えば、収益に不確実性を伴う投資の意思決定問題。
⊲ 参加者の収益は関数Y = s(X) = 。確率は f (xk) = 16で一定なので、期 待収益は
E(Y) = s(1) f (1) + s(2) f (2) + · · · + s(6) f (6)
= 1
6· (−2000 − 1000 + · · · + 3000) = . (5)
∴期待収益で判断すると、参加する価値あり。
一次式の期待値:確率変数Xと任意の定数a, bについて、Y = a + bXと置く。このとき
E(Y) = E(a + bX) = . (6)
∴ XとYが一次式⇒期待値も一次式。
⊲ 上のサイコロ投資(?)の収益Y = −3000 + 1000Xは、サイコロの期待値E(X) = 3.5 とこの公式を使えばE(Y) = −3000 + 1000E(X) = 500。
⊲ 証明:離散型のみ示す。(連続型も同様。) E(a + bX) =
xk
(a + bxk) f (xk) =
xk
a f (xk) +
xk
bxkf (xk)
= a
xk
f (xk)
=1(確率の和は 1)
+b
xk
xkf (xk)
=E(X)←(1) 式
= a + bE(X). (7)
Remark:上式を期待値の演算公式としてまとめると(cは定数)
1. 。(確率1でcが起こる、と考えればE(c) = c·1 = cで期待値の定義通り。)
2. 。
3. 。
...コレを一度に証明したのが、(7)式。
2 分散と標準偏差、標準化
2.1
分散
分散:確率変数Xについて、
Var(X) = E(X − E(X))2=
⎧
⎪⎪
⎨
⎪⎪
⎩
xk(xk− E(X))2f (xk) (離散型)
x(x − E(X))
2f (x)dx
(連続型)
(8)
を、Xの と呼ぶ。(Varはvarianceの略。)
⊲ 各実現値xkの、期待値E(X)からのズレを(xk− E(X))2で評価。→確率 f (xk)で加重
平均。∴Var(X)は、E(X)を軸にしたXの散らばり具合を測る。
⊲ Var(X)が大きい⇔ Xは変動が大きく、不安定。
⊲ s(X) = (X − E(X))2と見れば、分散は確率変数の関数の期待値E[s(X)] = Var(X)。
標準偏差:分散の正の平方根
√V(X)を、 と呼ぶ。
⊲ V(X)は、単位が元の測定単位の2乗になる。→平方根で元の単位に。
⊲ ∴データの分散・標準偏差の関係(講義ノート#02)と同じ。
例:サイコロの分散・標準偏差
⊲ E(X) = 3.5なので、分散は
Var(X) = (1 − 3.5)2·16+ (2− 3.5)2·16 +· · · + (6 − 3.5)2·16
=16 · (6.25 + 2.25 + · · · + 6.25)
=17.5
6 ≈ . (9)
⊲ ∴標準偏差は √Var(X) =
17.5
6 ≈ 1.71。
Remark:分散の違いと、確率分布、確率変数の動きの対応関係。
⊲ 図2:分散の異なる確率変数XとYの分布 f (x)、g(y)。(期待値は同じ。)
⊲ 図2A:Var(X) < Var(Y) ⇔ g(y)の方が、左右に 。
⊲ 図2B(100回の試行結果):Var(X) < Var(Y) ⇔ Yの方が、期待値から が出やすい。
2.2
分散演算の重要な性質
分散の別表現:分散の定義(8)式を展開し、期待値演算の公式(注:E(X)は定数)を使うと Var(X) = EX2− 2XE(X) + E(X)2
= E(X2) − 2E(X)E(X) + E(X)2= . (10)
⊲ ∴(8)式or (10)式、計算しやすい方を使えば良い。
0.00.10.20.30.4
f(x),g(y)
E( X) =E( Y) f ( x)
g( y) A¡§˚‹
0 20 40 60 80 100
X,Y E(X)=E(Y)
B:‡˛˛¤˚ ¿ ⁄˛˘ ⁄›
図2:分散の異なる確率変数X、Yの比較
一次式の分散:確率変数Xと任意の定数a, bについて、Y = a + bXと置く。このとき
Var(Y) = . (11)
∴aは消え、Xの係数bはb2として残る。
⊲ 証明:E(Y) = a + bE(X)なので、
(Y − E(Y))2 = (a + bX− a − bE(X))2 = [b(X− E(X))]2 = . (12) よって
Var(Y) = E(Y − E(Y))2= Eb2(X − E(X))2= b2E(X − E(X))2
=Var(X)
= b2Var(X). (13)
Remark:上式を分散の演算公式としてまとめると(cは定数)
1. 。(定数の変動は、ゼロ。)
2. 。
3. (注意!!) 。
...コレを一度に証明したのが、(13)式。
2.3
確率変数の標準化
確率変数の標準化:Xから期待値E(X)を引き、標準偏差
√Var(X)で割ることで作られる
新たな確率変数
Z = X − E(X)√
Var(X) (14)
を、 された確率変数と呼ぶ。
⊲ 上式を書き換えれば
Z = , a = −√E(X)
Var(X), b =
√ 1
Var(X). (15)
∴ZはXの一次式。(a、bは定数。)
Zの重要な性質:元のXがどんな確率変数であっても、標準化すると期待値・分散は
E(Z) = , Var(Z) = . (16)
⊲ 統計学で頻繁に使われる、とても重要な性質!
⊲ E(Z) = 0の証明:期待値の演算公式を(15)式に適用すると、Zの期待値は
E(Z) = =−√E(X)
Var(X)+ 1
√Var(X)E(X) = 0. (17)
⊲ Var(Z) = 1の証明:⇒今回の復習問題。
まとめと復習問題
今回のまとめ
期待値:確率変数Xの代表値。位置の尺度。
分散・標準偏差:確率変数Xの散らばりの尺度。期待値と標準偏差でXの標準化。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。
1. 実現値としてx = 3, 6, 9をとる離散型の確率変数Xの確率関数が、等確率 Pr(X = x) = f (x) = 1
3 for all x (18)
であるとする。期待値E(X)と分散Var(X)を求めよ。 2. (16)式のVar(Z) = 1を証明せよ。