統計学 第 6 回 様々な確率変数
高木 真吾
北海道大学
URL: http://sites.google.com/site/hustat2017/
質問等は担当者( [email protected]) までご連絡ください
November 10, 2017
まとめ(非常に重要)
. . . 2
本日の内容
. . . 3
ベルヌーイ分布
4
ベルヌーイ分布. . . 5
二項分布
6
二項分布. . . 7
二項分布の性質
. . . 8
応用問題
. . . 9
補論:離散型確率変数に従う確率変数の平均・分散について
. . . 10
正規分布
11
正規分布. . . 12
正規分布の性質(1)
. . . 13
正規分布の確率計算
. . . 14
練習問題1
. . . 15
正規分布の性質(2)
. . . 16
練習問題2
. . . 17
解説:練習問題1
. . . 18
解説:練習問題2
. . . 19
まとめ(非常に重要)
二つの確率変数X1, X2を用いて,Y = β0+ β1· X1+ β2· X2 とする.
■ 平均
E[Y ] = β0+ β1· E[X1] + β2· E[X2]
■ 分散
V[Y ] = β12· V[X1] + β22· V[X2] + 2β1β2· cov(X1, X2)
■ 二つの確率変数X1, X2が独立であるとき, V[Y ] = β12· V[X1] + β22· V[X2]
一般に確率変数がn個の場合でも,上の結果は成立する
n個の確率変数{X1, X2, . . . , Xn} を用いて,以下の Y を定める. Y = β0+
n
X
i=1
βi· Xi
■ 平均
E[Y ] = β0+
n
X
i=1
βi· E[Xi]
■ 分散
V[Y ] =
n
X
i=1
βi2· V[Xi] + 2
n−1
X
i=1 n
X
j=i+1
βiβj· cov(Xi, Xj)
■ n個の確率変数X1, X2, . . . , Xnが互いに独立であるとき,
V[Y ] =
n
X
i=1
βi2V[Xi]
以上の結果はすべて離散型確率変数についても,連続型確率変数についても成り立つ
■ 確率変数の基準化(平均を0,分散を1に変換):以下の結果は期待値演算の性質から明らか Z = X − E[X]
pE[X] , E[Z] = 0, V[Z] = 1
それ自身の平均を引き,標準偏差(分散の平方根)で除した確率変数Zは,必ず平均0,分散1となる.
統計学第
6
回– 2 / 19
本日の内容
■ 確率変数の実例について議論する
◆ 以下の二項分布,正規分布以外にも,たくさんの現象をモデルとした確率変数が存在するが,この講 義ではこの先t分布とカイ二乗分布しか新たに登場しない.
◆ 参考図書などに多数の例がある.
■ 離散型確率変数:
◆ 取り得る値ごとに実現確率が定義されている
◆ 例)ベルヌーイ分布,二項分布,
■ 連続型確率変数:
◆ 実現の仕方が密度関数によって特徴付けられている.
◆ 正規分布
統計学第
6
回– 3 / 19
ベルヌーイ分布 4 / 19
ベルヌーイ分布
■ ベルヌーイ試行:起こりうる事柄は2種類だけ
■ 一方の結果が実現する確率はp(他方は1 − p)
◆ コインの表・裏/計画の失敗・成功/YES・NO
■ 確率変数Xとして,1となる確率をp,0となる確率を1 − p とする.
◆ 一方の結果を1に対応させ,他方の結果を0に対応させるモデル化
■ 例1)日本全体では約20%がB型と言われている(A : O : B : AB = 0.4 : 0.3 : 0.2 : 0.1,赤十字).
◆ 適当に選んだある人に血液型を聞く(正直に答える)
◆ その人が「B型である」と答える確率は
◆ その人が「B型以外である」と答える確率は
■ ベルヌーイ分布に従う確率変数Xの確率分布 X =
1 確率:p 0 確率:1-p
■ 上記の確率分布を持つ確率変数Xは,パラメータpのベルヌーイ分布に従うという(X ∼ Bernoulli(p) と 表記する)
■ ベルヌーイ分布に従う確率変数Xの平均・分散
◆ 平均:E[X] = 1 · p + 0 · (1 − p)p
◆ 分散:V[X] = E[X2] − {E[X]}2= 12· p + 02· (1 − p) − p2= p(1 − p)
統計学第
6
回– 5 / 19
二項分布 6 / 19
二項分布
■ 二つの結果しか実現しないベルヌーイ試行を考える.
■ 確率pで一方の事柄(仮に「成功」と呼ぶ)が生じ,確率1 − p で他方の結果(仮に「失敗」と呼ぶ)が 生じる
■ ベルヌーイ試行がn回繰り返され,それぞれの試行は独立に行われているものとする.
■ このときn回の試行の中で「成功」の回数を確率変数Y で表すとする
■ 確率変数Y の確率分布は以下の通り
Pr[Y = y] =nCy· py(1 − p)n−y, y = 0, 1, 2, . . . , n. (1)
■ 上記の確率分布を持つ確率変数Y は,パラメータ(p, n)の二項分布に従うという(Y ∼ Bi(p, n) と表記 する)
■ 各ベルヌーイ試行の結果を示す確率変数Xiを考える.
◆ 「成功」を1に対応させ,「失敗」を0に対応させる.このとき Xi=
1 確率:p
0 確率:1-p i = 1, 2, . . . , n. となり,各Xiは互いに独立.
◆ このとき明らかに成功回数はXiの合計となるので,Y との間に次の関係が成り立つ
Y =
n
X
i=1
Xi (2)
■ 二項分布に従う確率変数の平均・分散
◆ 平均:(確率分布(1)式から直接計算することもできるが)上の(2)式より
E[Y ] = E
" n X
i=1
Xi
#
=
n
X
i=1
E[Xi] = np
◆ 分散:
V[Y ] = V
" n X
i=1
Xi
#
=
n
X
i=1
V[Xi] = np(1 − p)
■ 例2)日本全体では約20%がB型と言われている(A : O : B : AB = 0.4 : 0.3 : 0.2 : 0.1,赤十字).
◆ 適当に選んだある人に血液型を聞くことを10回繰り返した
◆ 3人が「B型である」と答える確率は
◆ 全員「B型以外である」と答える確率は
◆ 3人以上「B型である」と答える確率は
統計学第
6
回– 7 / 19
二項分布の性質
■ Y ∼ Bi(p, n):確率変数 Y は,パラメータ (p, n) の二項分布に従う
■ Xi∼ Bernoulli(p) (i = 1, 2, . . . , n)
◆ 各Xi (i = 1, 2, . . . , n)は,互いに独立にパラメータpのベルヌーイ分布に従う
■ このとき次の関係が成り立つY = Pn
i=1Xi
■ Y = Y /n¯ として,「成功割合」という確率変数を考えると次のように書ける Y =¯ 1
n
n
X
i=1
Xi, E[ ¯Y ] = , V[ ¯Y ] =
■ 基準化:Y, ¯Y は以下のように平均0,分散1となるように基準化することができる Zn= Y − np
pnp(1 − p) =
Y − p¯
pp(1 − p)/n (3)
■ 発展的話題)Znはnが十分大きいとき,標準正規分布(平均0,分散1の正規分布)で近似することが できる
統計学第
6
回– 8 / 19
応用問題
■ あるテレビ番組の視聴率について,適当に選んだ100人に聞いてみた.100人から得られるであろう視聴 率(「見た」と回答する割合)について,実際の視聴率=100 · p %(視聴割合 p)と比べ,誤差が ± 5
%(±0.05)以内となる確率はどのように表現できるか.
◆ 確率変数Xi(i = 1, 2, . . . , 100)を以下のように定義する
■ 「見た」という回答を得る事象を1,「見てない」という回答を得る事象を0
◆ このとき,各確率変数Xiは1を確率p,0を確率1 − p でとる
◆ 「見た」と回答するであろう人数,および視聴割合は,Xiを用いて
Y =
100
X
i=1
Xi, ¯Y = 1 100
100
X
i=1
Xi
◆ このY とY¯ について,平均・分散は以下の通り,
E[Y ] = 100 · p, V[Y ] = 100 · p(1 − p), E[ ¯Y ] = p, V[ ¯Y ] = p(1 − p) 100
◆ このとき求めるものは,調査から得られるであろう視聴割合Y¯ と真の視聴率pの誤差が±0.05 とな る確率
◆ この誤差は, ¯Y − p と表現できる.したがって求める確率は次の通り.
Pr[| ¯Y − p| ≤ 0.05] = Pr
"
| ¯Y − p| pp(1 − p)/100 ≤
0.05 pp(1 − p)/100
#
◆ 左辺は前項の通り,標準正規分布で近似できるので上の確率を(大雑把に)計算できる
a
.
◆ こうして求めたものが100人を対象とした視聴率調査についての誤差の情報を与える.
a
さらにp(1 − p) ≤ 0.25より,0.05/pp(1 − p)/100 ≥ 0.05/0.05 = 1という下限を与えることができるため,この確 率が約0.683つまり68.3%以上であると評価できる.この点については次週.
統計学第
6
回– 9 / 19
補論:離散型確率変数に従う確率変数の平均・分散について
■ ベルヌーイ分布(パラメータ=成功確率(p)): X = 1, or 0 with probability p or 1 − p p(x) = Pr[X = x] = px(1 − p)1−x, x = 0, 1, 0 ≤ p ≤ 1
E[X] = p V[X] = p(1 − p)
■ 二項分布(パラメータ(n, p)): n回の独立なベルヌーイ試行での成功回数(成功確率p) p(y) = Pr[Y = y] =n
y
· py(1 − p)n−y, x = 0, 1, 2, . . . , n. 0 ≤ p ≤ 1 E[Y ] = n · p
V[Y ] = n · p(1 − p)
パラメータ(n, p)の二項分布に従う確率変数Y は,独立なn個のベルヌーイ分布に従う確率変数の和で表 現可:Y = X1+ X2+ · · · + Xn,ただし{Xi}ni=1 は独立にBernoulli分布に従う確率変数(成功確率p).
■ ポアソン分布(パラメータλ): ごく稀にしか起きない現象のモデル化に用いられる(例:馬に蹴られて死 亡した軍人数/年)
p(x) = Pr[X = x] = exp{−λ} · λx
x! , x = 0, 1, 2, . . . . λ > 0 E[X] = λ
V[X] = λ
■ 計算について(数学的な側面に興味がなければ飛ばしてください)
◆ 前提: 二項定理,指数関数のMaclaurin展開
(x + y)n=
n
X
k=0
n k
xkyn−k, ex=
∞
X
k=0
xk k!
◆ 二項分布に従う確率変数の平均:E[Y ](分散については,E[X(X − 1)] を求めると効率的に求めら れる)
E[Y ] =
n
X
y=0
n y
y · py(1 − p)n−y=
n
X
y=1
n!
(n − y)!y!y · p
y(1 − p)n−y
=
n
X
y=1
np · (n − 1)!
{(n − 1) − (y − 1)}!(y − 1)!p
y−1(1 − p)(n−1)−(y−1)
=
n−1
X
k=0
np · (n − 1)! {(n − 1) − k}!k!p
k(1 − p)(n−1)−k, k ≡ y − 1
= np · {p + (1 − p)}(n−1)= np
◆ ポアソン分布に従う確率変数の平均:E[X](分散については,E[X(X − 1)] を求めると効率的に求め られる)
E[X] =
∞
X
x=0
x ·exp{−λ} · λx x! =
exp{−λ} ·P∞x=1x · λx x!
= λ · exp{−λ} ·
∞
X
x=1
λx−1
(x − 1)! = λ · exp{−λ} ·
∞
X
y=0
λy
y!, y ≡ x − 1
= λ · exp{−λ} · exp{λ} = λ
統計学 第
6
回– 10 / 19
正規分布 11 / 19
正規分布
■ 代表的な連続型確率変数
■ 実現の仕方についての特徴は,密度関数を見ることで分かる
■ 正規分布に従う確率変数Xは以下のような密度関数を持つ. φ(x; µ, σ2) =√ 1
2πσ2exp
−(x − µ)
2
2σ2
(4)
■ これを図示すると
-5 0 5
0.00.20.40.60.8
正規分布の密度関数
x
density
µ =0 , σ2=1 µ =3 , σ2=2 µ = −3 , σ2=1 2
-4 -2 0 2 4
0.00.10.20.30.4
確率の表示
x
density
µ =0 , σ2=1
Pr[ X < -1.50 ] Pr[ -1.00 < X < 1.00 ]
Pr[ X > 1.50 ]
◆ 形状:釣鐘型,x = µを中心として左右対称
◆ x = µのところでピークを迎え,そこから離れるほど高さは低くなる(中心はµ)
◆ σが大きくなるほど中心から離れたところでも実現しやすくなる(ばらつきがσに依存)
■ ここから平均 E[X] = µ,分散 V[X] = σ2が予想できる.
◆ 確率変数Xの実現パターンの特徴は,µ近辺がもっとも実現しやすく,µから離れるほど実現確率は 低くなる.
■ 確率Pr[X < a]などは,対応する区間において,密度関数とx軸で囲まれる面積として求められる.
◆ Pr[X < −1.5], Pr[−1 ≤ X ≤ 1], Pr[X > 1.5] が右側の図に書き込まれている.
◆ この面積の大きさは手計算では計算できないことが多い(Pr[−∞ < X < ∞] = 1.00, Pr[X ≥ 0] = 0.50,Pr[X ≤ 0] = 0.50)
◆ 数表を利用することで計算可能
統計学 第
6
回– 12 / 19
正規分布の性質(1)
■ (4)式のような密度関数を持つ確率変数X について
◆ 平均: E[X] = µ
◆ 分散: V[X] = σ2
◆ これらの証明は与えないが,興味のある人は講義用のウェブサイトに証明を掲載しておく
a
.
■ 上記のような確率変数XをX ∼ N(µ, σ2)と表記する.
■ 任意の平均・分散を持つ確率変数X ∼ N(µ, σ2)は次のような基準化で平均0,分散1に基準化できる Z = Y − µ√
σ2 ∼ N(0, 1)
■ 平均0,分散1の正規分布は特に,標準正規分布と呼ばれる.
afが密度関数であることを前提として, R∞
−∞f (x; µ, σ
2)dx = 1
という性質を用いる.もちろんこれ自体も証明可能.
E[X] = Z ∞
−∞
xf (x; µ, σ2)dx
= Z ∞
−∞
x√1 2πσ2 exp
−(x − µ)
2
2σ2
dx
= Z ∞
−∞
(µ + σ · z)√1 2πexp
−z
2
2
dz, z ≡x − µσ
= µ + σ · Z ∞
−∞
z ·√1 2πexp
−z
2
2
dz
= µ + σ ·
−√1 2πexp
−z
2
2
∞
−∞
= µ + σ · (−0 − (−0))
V[X] = Z ∞
−∞
(x − µ)2f (x; µ, σ2)dx
= Z ∞
−∞
(x − µ)2√1 2πσ2exp
−(x − µ)
2
2σ2
dx
= Z ∞
−∞
σ2· z2√1 2πexp
−z
2
2
dz, z ≡x − µσ
= σ2·
[(−z) · f(z; 0, 1)]∞−∞+ Z ∞
−∞
√1 2πexp
−z
2
2
dz
= σ2
統計学 第
6
回– 13 / 19
正規分布の確率計算
■ 正規分布に従う確率変数ついて確率計算を行うときは数表を利用する.
■ ある点xについて,Pr[X ≥ x] の確率の値が表中に記入されている
◆ 表の行ラベルと列ラベルの数字の合計が点xに対応している.
◆ 例えばx = 1.25について,Pr[X ≥ 1.25] を求めるとき,行ラベル(縦)1.2,列ラベル(横).05 の結 び目の数値.10565が求めるもの
■ Pr[X ≤ 1.25] = 1.0000 − 0.10565 = 0.89435,Pr[0 ≤ X ≤ 1.25] = .5000 − 0.10565 = 0.39435
■ Pr[X ≤ −1.25] = Pr[X ≥ 1.25] = 0.10565(対称性を利用)
Table 1: X ∼ N(0, 1)
のとき,Pr[X ≥ x]
の数表(
上側確率)
u .00 .01 · · · .04 .05 .06 · · · .0 .50000 .49601 · · · .48405 .48006 .47608 · · · .1 .46017 .45620 · · · .44433 .44038 .43644 · · · ... ... ... · · · ... ... ... · · · 1.2 .11507 .11314 · · · .10749 .10565 .10383 · · ·
■ 上の表は標準正規分布(平均0,分散1)についてかかれたものであることに注意する
■ 標準正規分布以外の場合に確率計算するには,標準化を行った後,上の表を用いる
◆ 問)Y ∼ N(1, 4) のとき,Pr[Y < 3] を求める
◆ 答)Z = (Y − 1)/√4とするとZは標準正規分布.したがって Pr[Y < 3] = Pr Y − 1√
4 < 3 − 1
√4
= Pr [Z < 1]
とした後,上の数表を用いればよい.Pr[Z > 1] = 0.15866なので
Pr[Z ≤ 1] = 1 − Pr[Z > 1] = 1 − 0.15866 = 0.84134, つまり Pr[Y < 3] = 0.84134.
統計学 第
6
回– 14 / 19
練習問題1
■ 以下の確率を求めてください
1. X ∼ N(0, 1) のとき,Pr[0 ≤ X ≤ 2] 2. X ∼ N(0, 1) のとき,Pr[−2 ≤ X ≤ 0] 3. X ∼ N(0, 1) のとき,Pr[X ≥ 1.5]
4. X ∼ N(0, 1) のとき,Pr[1.65 ≤ X ≤ 1.96] 5. X ∼ N(1, 0.25) のとき,Pr[X ≥ 1.5] 6. X ∼ N(−1, 4) のとき,Pr[−2 ≤ X ≤ 0]
統計学 第
6
回– 15 / 19
正規分布の性質(2)
■ 正規分布に従う2つの確率変数:X1∼ N(µ1, σ12),X2∼ N(µ2, σ22), cov(X1, X2) = σ12.
■ これらの和Y = β0+ β1· X1+ β2· X2について考える
◆ 平均: E[Y ] = β0+ β1µ1+ β2µ2≡ µY
◆ 分散: V[Y ] = β12σ21+ β22σ22+ 2β1β2σ12≡ ˜σ2Y
◆ 分布: Y ∼ N(µY, ˜σY2)
■ X1とX2が互いに独立であるとき,
◆ 平均: E[Y ] = β0+ β1µ1+ β2µ2≡ µY
◆ 分散: V[Y ] = β12σ21+ β22σ22≡ σ2Y
◆ 分布: Y ∼ N(µY, σY2)
■ 正規分布に従うn個の確率変数:{Xi∼ N(µi, σi2),cov(Xi, Xj) = σij.
■ これらの和Y = β0+ Pn
i=1βi· Xiについて考える
◆ 平均: E[Y ] = β0+Pni=1βiµi≡ µY
◆ 分散: V[Y ] = Pn
i=1βi2σi2+ 2
Pn−1 i=1
Pn
j=j+1βiβjσij≡ ˜σ2Y
◆ 分布: Y ∼ N(µY, ˜σ
2 Y)
■ X1とX2が互いに独立であるとき,
◆ 平均: E[Y ] = β0+Pni=1βiµi≡ µY
◆ 分散: V[Y ] = Pn
i=1βi2σi2≡ σY2
◆ 分布: Y ∼ N(µY, σY2)
統計学 第
6
回– 16 / 19
練習問題2
■ 株価の変動について考える
■ 時点tの株価をSt,前日からの変化量をXtとする Xt= St− St−1
■ 昨年1年間の日経平均株価の動向を見ると,変化量Xtは,平均−10 円,標準偏差 220 円の正規分布に 従っているように見える.
Xt∼ N(−10, 2202)
■ ある時点0の日の株価をs0とし,s0= 14000のとき, 1. 1日後の株価S1をs0とX1を用いて表現してください 2. 2日後の株価S2をs0とX1とX2を用いて表現してください 3. h日後の株価Shをs0と{Xt}ht=1を用いて表現してください
4. 変化量Xtが Xt∼ N(−10, 2202)という確率変数であるとき,Shはどのような分布に従いますか
(Xtは異なる時点で互いに独立であるとする).
5. 20日後に現在よりも5%以上株価が下がっている確率はいくらですか.
6. 20 ±2.5 %以内に収まっている確率はいくらですか.
解説:練習問題1
■ 以下の確率を求めてください
1. X ∼ N(0, 1) のとき,Pr[0 ≤ X ≤ 2]
■ 数表をそのまま用いればよい 2. X ∼ N(0, 1) のとき,Pr[−2 ≤ X ≤ 0]
■ 正規分布は原点に関して左右対称であることを用いる 3. X ∼ N(0, 1) のとき,Pr[X ≥ 1.5]
■ Pr[X ≥ 0] = 0.5 であることを用いる 4. X ∼ N(0, 1) のとき,Pr[1.65 ≤ X ≤ 1.96]
■ Pr[1.65 ≤ X ≤ 1.96] = Pr[X ≤ 1.96] − Pr[X ≤ 1.65] であることを用いる 5. X ∼ N(1, 0.25) のとき,Pr[X ≥ 1.5]
■ 基準化Z = (X − 1)/√0.25 ∼ N(0, 1) を用いる 6. X ∼ N(−1, 4) のとき,Pr[−2 ≤ X ≤ 0]
■ 基準化Z = (X − (−1))/√4 ∼ N(0, 1) を用いる
統計学 第
6
回– 18 / 19
解説:練習問題2
■ 株価の変動について考える
■ 時点tの株価をSt,前日からの変化量をXtとする Xt= St− St−1
■ 昨年1年間の日経平均株価の動向を見ると,変化量Xtは,平均−10 円,標準偏差 220 円の正規分布に 従っているように見える.
Xt∼ N(−10, 2202)
■ ある時点0の日の株価をs0とし,s0= 14000のとき, 1. 1日後の株価S1をs0とX1を用いて表現してください
S1= s0+ X1 ( X1= S1− s0)
2. 2日後の株価S2をs0とX1とX2を用いて表現してください S2= S1+ X2= s0+ X1+ X2
3. h日後の株価Shをs0と{Xt}ht=1を用いて表現してください
Sh= s0+
h
X
t=1
Xt
4. 変化量Xtが Xt∼ N(−10, 2202)という確率変数であるとき,Shはどのような分布に従いますか
(Xtは異なる時点で互いに独立であるとする).
■ 正規分布に従う確率変数の和もまた正規分布に従うことを利用する.
■ このとき上の問題からShが正規分布に従う
E[Sh] = , V[Sh] = 5. 20日後に現在よりも5%以上株価が下がっている確率はいくらですか.
■ s0= 14000,5%以上下がるとは,株価が0.95 · 14000 = 13300 円以下になっていること
■ つまりPr[Sh≤ 13300] となる確率を h = 20 について求める
■ 確率計算には基準化を用いる
6. 20日後に現在の水準に対して,±2.5 %以内に収まっている確率はいくらですか.
■ Pr[|Sh− s0| ≤ 0.025 · s0] となる確率をh = 20について求める
■ 確率計算には基準化を用いる
7. n日後に現在の水準に対して,13,000円以下となっている確率を90%にするにはnをいくらすれば よいか.
■ Pr[Sn≤ 13000] = 0.9 を満たす n を求める
■ 確率計算には基準化を用いる
統計学 第