資料置き場 hustat2017 20171020

(1)

統計学第４週 _{– 1 / 70}

統計学：確率変数

高木真吾

北海道大学

October 20, 2017

(2)

確率変数

確率変数確率変数

離散型確率変数離散型確率変数の例連続型確率変数連続型確率変数連続型確率変数の例累積分布関数

確率変数の特性２変数確率変数２変数確率変数の特性値

(3)

確率変数

統計学第４週 _{– 3 / 70}

■

確率変数：偶然的要素を伴う現象を表現するための量的表現，

■

それが実現するまではどのような値をとるのかはわからない

■

ある値がどのような確率で実現するのかが定められている変量

◆

偶然的要素を伴う現象が量的変量として表現されることが多い

◆

_ex. 電球が切れるまでの時間はどの程度か？など

(4)

確率変数

■

^{確率変数のタイプ}

◆

離散型確率変数：とりうる値が可算集合（いくつかの特定の点）

．確率関数による特徴づけ

■ 確率が一個一個の点について定義されている

■

各点ごとにその値の実現しやすさが確率関数として与えら

れる．

◆

連続型確率変数：とりうる値が非可算集合（ある区間のどこで

も）．確率密度関数による特徴づけ

■ 確率が（点ではなく）区間について定義されている

■

ある領域の実現しやすさが確率密度関数として与えられる．

(5)

離散型確率変数

統計学第４週 _{– 5 / 70}

■

離散型確率変数：確率が１個１個の点について定義

■

離散型確率変数の個々の点の起きやすさは，以下のような表で集約

Table 1: 離散型確率変数の確率分布表

X x₁ x₂ · · · x_k · · · 確率 _p₁ _p₂ _{· · ·} _p_k _{· · ·}

(6)

離散型確率変数

■

^{実現値：とりうる値を} _{x

₁

_{, x}

₂

_{, x}

₃

_{, . . .}} ^{と表記する．}

■

とりうる値の要素数は有限個であっても，無限個であってもよい．

確率関数の定義各点 _x

_k

(k = 1, 2, . . .) ^{について，}

p

k

≡ Pr[X = x

k

] k = 1, 2, . . .

(7)

離散型確率変数

統計学第４週 _{– 7 / 70}

確率関数の性質各点 _x

_k

における確率関数の性質．

1. p

k

≥ 0 ^， k = 1, 2, . . .

2. ^実現値が x

¹

, x

²

, . . . という形で無限個あるとき，

∞

X

k=1

p

k

= 1

また実現値が _x

₁

_x

₂

, . . . , x

K

という形で有限個あるとき，

K

X

k=1

p

k

= 1

(8)

離散型確率変数

■ 逆に，何らかの実数値の（可算）集合に対して，下の二つの性質を持つ確率関数を与えたとき，そこに実現値をもつ離散型確率変数を定義したことになる．

確率関数の性質各点 _x_k における確率関数の性質． 1. pk ≥ 0 ^， k = 1, 2, . . .

2. ^実現値が x₁, x₂, . . . という形で無限個あるとき，

∞

X

k=1

p_k = 1

また実現値が _x₁_x₂, . . . , x_K という形で有限個あるとき，

K

X

k=1

pk = 1

(9)

離散型確率変数の例

統計学第４週 _{– 9 / 70}

■ 例１）コインを２枚投げる試行を考える．

◆ 表が出ると１，裏が出ると０

◆ ^{その合計を確率変数} _X ^{で表現する}

このときの確率分布は次の表のようにまとめることができる．

Table 2: コイン投げの確率分布表

X 0 1 2

確率 _1/4 _1/2 _1/4

(10)

離散型確率変数の例

■ 例２）販売されている宝くじの中から一枚を無作為にもらうという試行について考える（宝くじを買う，とも言い換えられる）．このくじは次のような表のような当選確率を持っていることが公表されてる．つまりこのくじは当選賞金を実現値とする確率変数と考えることができ，その確率分布は次の表のようにまとめることができる¹．

Table 3: ^{宝くじの確率分布}

名称一等二等三等四等五等六等はずれ賞金額 _X ２億１億 ₁₀₀ 万 ₁ 万 ₃ 千 ₃₀₀ ₀

確率 _1/10⁷ _2/10⁷ _1/10⁶ _1/10⁵ _1/10² _1/10 _0.8870

1

「一等のくじが出る」という事象と「確率変数 _X が ₂ 億という実現値を持つ」という表現が関連付けられている．

(11)

連続型確率変数

統計学第４週 _{– 11 / 70}

■

連続型確率変数：確率が区間について定義されている

■

^{実現する値は} { x | − ∞ < x < ∞ } のような区間のどこか一点．

確率密度関数：ある連続関数 _{f (x)} を用いて，確率変数 _X がある

区間 { x | a < x < b } のどこかで実現する確率を以下のように

表現できるとき，関数 _{f (x)} を確率密度関数とよぶ．

Pr[a < X < b] =

Z

b a

f (x)dx

(12)

連続型確率変数

確率密度関数の性質：実現値は { x | − ∞ < x < ∞ } ^{のような区間の}

どこか

1. f (x) ≥ 0 ^， x ∈ (−∞, ∞) ：任意の点において非負．

2. ^確率変数 X ^が区間 { x | − ∞ < x < ∞ } ^{のどこかで実現する}

とき，

Z

^∞

−∞

f (x)dx = 1

また確率変数 _X が区間 { x | α < x < β } ^{のどこかでしか実現}

しないとき，

Z

β α

f (x)dx = 1

(13)

連続型確率変数

統計学第４週 _{– 13 / 70}

■

逆に，何らかの実数値の（非可算）集合に対して，上の二つの性質

を持つ密度関数を与えたとき，そこに実現値をもつ連続型確率変数

を定義したことになる．

1. f (x) ≥ 0 ^， x ∈ (−∞, ∞)：任意の点において非負．

2. ^確率変数 X ^が区間 { x | − ∞ < x < ∞ } のどこかで実現するとき， Z ^∞

−∞

f (x)dx = 1

また確率変数 _X が区間 { x | α < x < β } のどこかでしか実現しないとき，

Z β α

f (x)dx = 1

(14)

区間ごとにまとめた密度関数：ヒストグラム

dx

f (x)

x

¹

x

²

x

³

x

⁴

■

^{曲線は密度関数}

■

^{区間の幅：} _dx

■

それぞれの区間ごとの高さ

（相対度数）： _{f (x)}

■

それぞれの区間ごとの確率＝

面積の大きさ： _{f (x)dx}

■

_x

₁

^， _x

₂

^， _x

₃

^， _x

₄

^{を含む区間}

の確率：

f (x

¹

)dx+f (x

²

)dx+f (x

³

)dx+f (x

⁴

)dx

(15)

幅 dx を小さくすると

統計学第４週 _{– 15 / 70}

dx

f (x)

x

¹

x

²

x

³

x

⁴

■

次第に背後の曲線＝密度関数

に近づいていく

(16)

幅 dx を極限まで小さくすると

dx

f (x)

x

¹

x

²

x

³

x

⁴

■ ヒストグラムと密度関数を同一視できる

■ ^{このとき区間} _(x₁_{, x}₄₎ ^のどこかで実現する確率：対応する区間の縦棒の和

X

x∈(x₁,x₄)

f (x)dx

(17)

幅 dx を極限まで小さくすると

統計学第４週 _{– 17 / 70}

dx

f (x)

x

⁴

x

¹

x

²

x

³

■ ヒストグラムと密度関数を同一視できる

■ _dx^{が十分小さいとき，}^以下のような積分表現

X

x∈(x₁,x₄)

f (x)dx ^dx→0−→

Z x₄ x₁

f (x)dx

■ ^区間 _(x₁_{, x}₄₎ ^{のどこかで実現す} る確率

Pr[x₁ ≤ X ≤ x₄] =

Z x₄ x₁

f (x)dx

(18)

連続型確率変数の例

■

^例 ₃ ^{（一様分布）} ^{：確率変数} _X ^は区間 _{(a, b)} ^{で均等な実現パターン}

を考える

◆

^{密度関数：} f (x) = 1/(b − a) for a < x < b, = 0 for x ≤ a, x ≥ b.

◆

^{確率：１．} Pr[ a < X < b ] ^，２． Pr[ a < X < (b + a)/2 ]

■

^{図示してみると左端が} _a ^，右端が _b ^で高さが _{1/(b − a)} ^の長方形

◆

１．の確率は定義から１であるが，面積を求めても１

◆

２．の確率は面積を求めると０．５である

(19)

連続型確率変数の例

統計学第４週 _{– 19 / 70}

■

^例 ₄ （正規分布）正規分布に従う確率変数 _X は，ある区間 _{(a, b)}

で _, どういう確率で実現するか

◆

^確率１． Pr[ −2 < X < 0 ] ^，２． Pr[ X > 2 ]

■

つまり図の面積で表現される．

-4 -2 0 2 4

0.00.10.20.30.4

正規分布に従う確率変数の密度関数

x

y1

密度関数による表現は後述．

(20)

連続型確率変数の例

■

^例 ₅ ^{（指数分布）} ^ある正数 _λ ^{を用いて，確率変数} _X ^{の密度関数が}

次の通りに与えられるものとする．

f (x) =

0 x ≤ 0

λe

⁻^λx

x > 0 e = 2.7182 . . .

このとき

Pr[a < X < b] =

Z

b a

λe

⁻^λx

dx = ^h −e

⁻^λx

ⁱ

^b

a

^{= e}

−_λa

− e

⁻^λb

この密度関数は上の性質を満たしていることも容易に確認できる．

²

2

この確率変数の取りうる範囲は _{[0, ∞)} の区間である．密度関数の非負性は自明であるし，

Z ^∞

0

λe^−λxdx = [ −e^−λx ]^∞₀ = 0 − (−1) = 1

より積分して１という性質も満たされている．

(21)

無記憶性による指数分布の特徴づけ

統計学第４週 _{– 21 / 70}

■ ^無記憶性_:^次の期間 _x の間に起きることは，過去の履歴に関係なくいつも同じ確率

◆ 何かイベントが生じるまでの時間 _X

◆ ^ある時点 _x₀ ^{を超えてから，次の} _x までにイベント発生する確率 Pr[ X ≤ x₀ + x | X > x₀ ]

◆ 無記憶性：上記確率が，単純に「_x までの間に生じる確率と等しい Pr[ X ≤ x₀ + x | X > x₀ ] = Pr[ X ≤ x ]

■ 無記憶という特徴を持つ確率変数の分布関数は次の微分方程式を満たさなければならない

dF (x)

dx = C · {1 − F (x)}, F (0) = 0, ⇒ 1 − F (x) = e⁻^C·x.

(22)

累積分布関数

確率変数累積分布関数

累積分布関数確率変数の特性２変数確率変数２変数確率変数の特性値

(23)

累積分布関数

統計学第４週 _{– 23 / 70}

■ ^{累積分布関数（}cumulative distribution function; CDF^{）は次のように定義} される．

F (x) = Pr[X ≤ x] · · · ¹

■ 例１（ベルヌーイ分布：つづき）このとき累積密度関数（_CDF）は

F (x) =











0 x < 0 1/4 0 ≤ x < 1 3/4 1 ≤ x < 2

1 x ≥ 2

(24)

累積分布関数

■ ^{累積分布関数：}F (x) = Pr[X ≤ x]

■ ^例 ₃（一様分布：つづき）累積分布関数は， F (x) = Pr[X ≤ x] =

Z x a

1

b − a^{dt =}

■ ^例 ₅（指数分布：つづき）累積分布関数は， F (x) = Pr[X ≤ x] =

Z x

−∞

λe⁻^λtdt =

(25)

累積分布関数

統計学第４週 _{– 25 / 70}

■ ^{累積分布関数：}F (x) = Pr[X ≤ x]

■ ^例 ₃（一様分布：つづき）累積分布関数は， F (x) = Pr[X ≤ x] =

Z x a

1

b − a^{dt =}

1 b − a

x a

= ^{x − a} b − a

■ ^例 ₅（指数分布：つづき）累積分布関数は， F (x) = Pr[X ≤ x] =

Z x

−∞

λe⁻^λtdt = −e⁻^λt^x_−∞ = 1 − e⁻^λx

(26)

確率変数の特性

確率変数累積分布関数確率変数の特性確率変数の特性確率変数の特性期待値演算 _{E[•] の} 性質

確認

練習問題１

確率変数の基準化確率変数の基準化の例：偏差値と５段階 10 ^段階評価

５段階 ₁₀ 段階評価偏差値と５段階評価偏差値と ₁₀ 段階評価２変数確率変数２変数確率変数の特性値

(27)

確率変数の特性

統計学第４週 _{– 27 / 70}

■ データの特性を知るために「平均値」や「分散（標準偏差）値」を求めた．

■ 確率変数についてもその特性を知るために「期待値」演算を考える

■ ^{期待値の演算}

◆ 『確率変数の取りうる値』に，その起きやすさである『確率』というウェイトをかけてその総和を求めたもの．

■ 『どういう値が起きやすいか』の一つの表現．

(28)

確率変数の特性

■ ^{期待値の演算}

◆ 『確率変数の取りうる値』に，その起きやすさである『確率』というウェイトをかけてその総和を求めたもの．

■ 『どういう値が起きやすいか』の一つの表現．

◆ ^確率変数 _X ^{そのものや，関数} _g(•) ^{によって変換した} _g(X) ^に対して定義する

E_[X] ₌

P^∞

k=1 ^x^k ^{· p}^k ^{離散型確率変数}

R ^∞

−∞ x · f (x)dx ^{連続型確率変数} E_{[ g(X) ]} ₌

P^∞

k=1 ^g(x^k^{) · p}^k ^{離散型確率変数}

R ^∞

−∞ g(x) · f (x)dx ^{連続型確率変数}

■ _{g(X) = X}^k_{: k} 次の積率（モーメント）と呼ばれる．

(29)

確率変数の特性

統計学第４週 _{– 29 / 70}

■ ^平均 ^E_[X]^{：１次のモーメント}

■ ^分散 ^E[{X − E[X]}²]：２次の中心モーメント（平均からの乖離の二乗）

■ 離散型確率変数のモーメント（とりうる値：_{x₁_{, x}₂_{, x}₃ _{. . . , }}）

◆ ^平均：^E_{[X] =} ^P^∞_j₌₁ _x_j _{· p(x}_j_{) ≡ µ}

◆ ^分散：^V[X] = E[{X − E[X]}²] = ^P^∞_j=1(xj − µ)² · p(xj)

◆ ^{標準偏差：}_{ST D[X] =} _pV[X]

(30)

期待値演算 E _[•] の性質

■ 以下の結果は離散型，連続型を問わず成り立つ性質である．

■ ^{任意の実数} _α^，_β ^{に対して，}

E[ α + β · X ] = α + β · E[ X ] V[ α + β · X ] = β² · V[ X ] ST D[α + β · X] = β · ST D[X]

V_{[ X ]} ₌ E_{[ X}² ] − { E[ X ] }²

ただし V_[•] は，V[Y ] = E[ (Y − E[Y ])² ] と定義される分散を表す演算である．

(31)

確認

統計学第４週 _{– 31 / 70}

■ 連続型確率変数の場合， E[α + β · X] =

Z ^∞

−∞

(α + βx) · f (x)dx

= α ·

Z ^∞

−∞

f (x)dx + β ·

Z ^∞

−∞

x · f (x)dx

= α · 1 + βE[X] = α + βE[X] となる．離散型の場合は各自確認して欲しい．

(32)

確認

■ ^{分散についても}

V[α + β · X] = ^E[ {α + βX − E[α + βX]}² ]

= ^E[ {β · X − β · E[X]}² ]

= ^E[ β² · {X − E[X]}² ]

= β² · E[ {X − E[X]}² ] = β² · V[X] V_[X] ₌ E[ {X − E[X]}² ]

= ^E[ X² − 2X · E[X] + E[X]}² ]

= ^E[ X² ] − 2 · E[ X ] · E[X] + {E[X]}²

= ^E[ X² ] − {E[X]}²

(33)

練習問題１

統計学第４週 _{– 33 / 70}

■ 例１（ベルヌーイ分布：つづき）

◆ ^平均：^E_{[X] =} ₌ ，

◆ ^分散：^V_{[X] = E[X}²_{] − {E[X]}}² ₌

₋ ₌

(34)

練習問題１

■ 例１（ベルヌーイ分布：つづき）

平均：E_{[X] = 0 ·} ¹

4 ^{+ 1 ·} 1

2 ^{+ 2 ·} 1

4 ^{= 1} 分散：V_{[X] = E[X}²_{] − {E[X]}}² _{= 0}² _· ¹

4 ^{+ 1}

2 _· ¹

2 ^{+ 2}

2 _· ¹

4 ^{− 1}

2 _{= 0.5}

(35)

練習問題１

統計学第４週 _{– 35 / 70}

■ ^{例３（つづき）}

◆ ^平均：

E_{[X] =} Z b

a

t·f (t)dt = Z b

a

t· ¹

b − a^{dt =}

◆ ^分散_:

E_[X²_{] =} Z b

a

t²·f (t)dt = Z b

a

t²· ¹

b − a^{dt =}

1 3

t³ b − a

^b

a

= ^b

2 _{+ ab + a}2

3 V_{[X] = E[X}²_{] − {E[X]}}² ₌

(36)

練習問題

■ 例３（一様分布：つづき）平均： E_{[X] =}

Z b a

t · f (t)dt = Z b

a

t · ¹

b − a^{dt = [} 1 2

t² b − a^]

b a ⁼

b + a 2 分散_:

E_[X²_{] =} Z b

a

t² · f (t)dt = Z b

a

t² · ¹

b − a^{dt = [} 1 3

t³ b − a^]

b a ⁼

b² + ab + a² 3

V_{[X] = E[X}²_{] − {E[X]}}² ₌ ^b

2 _{+ ab + a}2

3 ⁻

b² + 2ab + a²

4 ⁼

(b − a)² 12

(37)

練習問題１

統計学第４週 _{– 37 / 70}

■ 例５：指数分布（つづき），積分の計算がわからないときは以下の問題は省略してよい

1. 平均を求めてください（ヒント：部分積分の公式）． E_{[X] =}

Z ^∞

0

x·f (x)dx =

Z ^∞

0

x·λe⁻^λxdx =

2. ^分散は 1/λ² になることを確認して下さい．

(38)

練習（手元資料未記載）

■ 例２（つづき）下の表を用いて，このくじの平均値を求めると円となる（このくじは ₂₀₀ 円）．

◆ この宝くじの標準偏差の値はいくらになるか（約 _80,632 円）

◆ ^{このくじを「}₁ ^ドル₌₁₀₀ 円のドル表示する」と平均，標準偏差は何ドルか

ヒント：_{Y = X/100} として平均・標準偏差を計算する

(39)

練習問題２− １

統計学第４週 _{– 39 / 70}

Table 4: 宝くじ：１千万本が１ユニット

賞金額 ₍円₎ あたり本数確率

一等 200,000,000 1 0.00001%

前後賞 _50,000,000 ₂ _0.00002%

組違い _100,000 ₉₉ _0.00099%

二等 100,000,000 2 0.00002%

... ^... ^... ^...

年末ラッキー賞 _10,000 _30,000 _0.30% あたり枚数 _1,130,214 _11.30214% はずれ枚数 _8,869,786 88.6978600%

販売枚数 _10,000,000 _100.00000%

(40)

練習（手元資料未記載）

Table 5: 宝くじ：１千万本が１ユニット

賞金額 ₍円₎ 賞金額 _× 確率

一等 200,000,000 20

前後賞 _50,000,000 ₁₀

組違い _100,000 _0.99

二等 100,000,000 20

... ^... ^...

年末ラッキー賞 _10,000 ₃₀ あたり枚数

はずれ枚数

販売枚数合計： _142.99 円

(41)

練習問題１

統計学第４週 _{– 41 / 70}

■ ^例 ₅（指数分布：つづき）平均： E_[X] ₌

Z ^∞

0

x · f (x)dx

=

Z ^∞

0

λx · e⁻^λ·xdx

= −[x · e⁻^λ·x]^∞₀ +

Z ^∞

0

e⁻^λ·xdx

= ¹

λ

分散については各自確認してください（答え：_1/λ²）．

(42)

練習問題１ _, 例 ₅ （指数分布：つづき）

■ ^分散は _1/λ² ^になる．

V_[X] ₌ E_[X²_{] − {E[X]}}² ₌

Z ^∞

0

t² · λe⁻^λtdt − λ⁻²

= 2 ·

Z ^∞

0

t · e⁻^λtdt − t² · e⁻^λt^∞₀ − λ⁻²

= 2 ·

Z ^∞

0

t · e⁻^λtdt − 0 − λ⁻²

= ²

λ

Z ^∞

0

e⁻^λt − ^2t λ ^{· e}

−_λt

^∞

0

− λ⁻² = ²

λ² ^{− λ}

−₂

= ¹ λ² 二行目と四行目³ の等号には部分積分を用いた．

3

{t² · e^−λt}^′ = 2t · e^−λt − t² · λe^−λt

2t λ ^{· e}

−λt

^′

= ² λ^e

−λt − 2t · e^−λt

(43)

確率変数の基準化

統計学第４週 _{– 43 / 70}

■ ^{ある確率変数} _X について考える．また新しい確率変数 _Z を以下のように定義する．

Z = µ + σ · ^{X − E[X]} pV[X]

■ ^もとの _X がどのような平均と分散であったとしても，変換された確率変数 _Z について

E[Z] = µ, V[Z] = E[(Z − E[Z])²] = σ² となる

■ 問題）上の結果を確認してください

■ 問題）試験受験者得点が正規分布に従うという条件のもとで，偏差値と５段階評価，１０段階評価の関係について考察を行ってください

(44)

確率変数の基準化の例：偏差値と５段階 ₁₀ 段階評価

■ ^{テストの得点} _X ^が平均 _µ ^{と標準偏差} _σ であり，受験者間で正規分布に従っているとする．

■ 偏差値換算したときどのような偏差値にどの程度の人がいるか

■ ^{偏差値：平均} ₅₀^{，標準偏差} ₁₀ ^に基準化

Z = 50 + 10 · ^{X − µ} σ

◆ ^もとの _X がどのような平均と分散であったとしても，偏差値 _Z は平均 ₅₀，標準偏差 ₁₀．

■ 正規分布に従うとき，以下の図のように散布することを確認できる

■ 問題）偏差値と５段階，１０段階評価（相対評価）の関係は？

(45)

５段階 ₁₀ 段階評価

統計学第４週 _{– 45 / 70}

■ 通常，５段階で相対評価を行うとき，それぞれの割合を 7% : 24% : 38% : 24% : 7%

■ ^通常，₁₀ 段階で相対評価を行うとき，それぞれの割合を 3% : 4% : 9% : 15% : 19% :

19% : 15% : 9% : 4% : 3%

(46)

偏差値と５段階評価

0 20 40 60 80 100

0.000.010.020.030.040.05

正規分布（平均50，標準偏差10）

x

y

0.07 0.24

0.38 0.24

0.07

(47)

偏差値と５段階評価

統計学第４週 _{– 47 / 70}

Table 6:

偏差値 _{∼ 35} _{35 ∼ 45} _{45 ∼ 55} _{55 ∼ 65} _{65 ∼} 確率 _0.07 _0.24 _0.38 _0.24 _0.07

５段階１２３４５

(48)

偏差値と ₁₀ 段階評価

0 20 40 60 80 100

0.000.010.020.030.040.05

正規分布（平均50，標準偏差10）

x

y

0.03 0.04 0.09 0.15 0.19 0.19 0.15 0.09 0.04 0.03

(49)

偏差値と ₁₀ 段階評価

統計学第４週 _{– 49 / 70}

Table 7:

偏差値 _{∼ 30} _{30 ∼ 35} _{35 ∼ 40} _{40 ∼ 45} _{45 ∼ 50}

確率 _0.023 _0.044 _0.092 _0.150 _0.191

10 ^段階 ^１ ^２ ^３ ^４ ^５

偏差値 _{50 ∼ 55} _{55 ∼ 60} _{60 ∼ 65} _{65 ∼ 70} _{70 ∼}

確率 _0.191 _0.150 _0.092 _0.044 _0.023

５段階６７８９１０

(50)

２変数確率変数

確率変数累積分布関数確率変数の特性２変数確率変数

例示

確率変数に関する条件付き確率

２変数確率変数の特性値

(51)

導入例：取り出される球のうち，赤と青の数

統計学第４週 _{– 51 / 70}

■ 例）壺の中に７個のボールが入っている

◆ 内訳：赤２球，青３球，白２球

■ 無作為に３個同時にとりだすとき，赤球の数を _X，青球の数を _Y

◆ ^{必然的に白球の数は} _{3 − X − Y}

■ ^{このとき，}

◆ _X ^{の取りうる値：} _{{0, 1, 2}}

◆ _Y ^{の取りうる値：} {0, 1, 2, 3}

■ その実現パターンは表の通り

(52)

導入例：取り出される球のうち，赤と青の数

Table 8: ^{２変数の確率分布表：} Pr[X = x, Y = y]

X / Y 0 1 2 3 Pr[X = •]

2 2/35 3/35 0 0 5/35

1 2/35 12/35 6/35 0 20/35

0 0 3/35 6/35 1/35 10/35

Pr[Y = •] 4/35 18/35 12/35 1/35 1

(53)

導入例：取り出される球のうち，赤と青の数

統計学第４週 _{– 53 / 70}

■ ^{同時確率分布（表）}^{：二つの確率変数} _X^，_Y がどのように実現するか上の表．

■ ^{周辺確率分布（表）}：他方の出方とは関係なく，一方の確率変数がどのような実現の仕方をするか

◆ _Y ^に注目：_X ^{の出方を無視し，}_{Pr[Y = 0]} ^は 0 + 2/35 + 2/35 = 4/35 と求められる．これらは表の下段．

◆ _X についても，表の左欄にまとめられている．

◆ ^{一般に，起きうる値が} _X^：_{x_i_}ⁿ_i=1^，_Y ^：_{y_j_}^m_j=1 ^{のとき，同時確率が} Pr[X = xi, Y = yj] などと与えられるとき，それぞれの周辺確率は Pr[X = xi] =

m

X

j=1

Pr[X = xi, Y = yj], Pr[Y = yj] =

n

X

i=1

Pr[X = xi, Y = yj]

(54)

導入例：取り出される球のうち，赤と青の数

Table 9: X ^{の周辺確率分布：} Pr[X = x]

X 0 1 2

Pr[X = •] 5/35 20/35 10/35

Table 10: Y ^{の周辺確率分布：} Pr[Y = y]

Y 0 1 2 3

Pr[Y = •] 4/35 18/35 12/35 1/35

(55)

確率変数に関する条件付き確率

統計学第４週 _{– 55 / 70}

■ ^{起きうる値が} _X^：_{x_i_}ⁿ_i=1^，_Y ^：_{y_j_}^m_j=1 ^{のとき，同時確率が}

Pr[X = xi, Y = yj] などと与えられているとする．

■ ^{二つの事象} _A^，_B ^{について，事象} _A が与えられた下での，事象 _B の条件付き確率

Pr[B|A] = ^{Pr[A ∩ B]} Pr[A]

■ ^事象 _A^：_X ^が _x_i ^{となる事象，}_B^：_Y ^が _y_j ^{となる事象，}_X ^が _x_i ^であるという条件の下で，_Y が _y_j となるという条件付き確率：

Pr[Y = yj|X = xi] = ^{Pr[X = x}ⁱ^{, Y = y}^j^]

Pr[X = xi] · · · ²

(56)

確率変数に関する条件付き確率

■ ^事象 _A^：_X ^が _x_i ^{となる事象，}_B^：_Y ^が _y_j ^{となる事象，}_X ^が _x_i ^であるという条件の下で，_Y が _y_j となるという条件付き確率：

Pr[Y = yj|X = xi] = ^{Pr[X = x}ⁱ^{, Y = y}^j^] Pr[X = x_i]

■ ^{乗法公式：}

Pr[X = xi, Y = yj] = Pr[Y = yj|X = xi] × Pr[X = xi]

= Pr[X = xi|Y = yj] × Pr[Y = yi]

(57)

条件付き期待値： E _{[Y |X]} （ X が与えられた下での Y の条

件付き期待値）

統計学第４週 _{– 57 / 70}

■ _X ^{がある特定の値} _x_i を取るという条件の下での条件付き期待値は，条件付き確率を用いて，

E_{[Y |X = x}_i_{] =}

m

X

j=1

y_j · Pr[Y = y_j|X = x_i] · · · ³

と定期議され，E_{[Y |X = x}_i_] は _x_i という水準に依存している．

■ ^一般に，^E_{[Y |X]} ^は（_Y については和を取ることで消しているので）確率

変数 _X の水準に依存する関数であり，それ自身が確率変数となっている．

■ ^確率変数 ^E_{[Y |X]} ^{の確率分布は，}_X ^が _{x₁_{, x}₂, . . . , xn} ^{の値を取りうるこ} とを考えて，

E_{[Y |X]} E_{[Y |X = x}₁_] E_{[Y |X = x}₂_] _{· · ·} E_{[Y |X = x}_n_]

(X) (x₁) (x₂) · · · (xn)

確率 _{Pr[X = x}₁_] _{Pr[X = x}₂_] _{· · ·} _{Pr[X = x}_n_]

問題）_Table ₈ を用いて，_{Y = 1} を条件とする _X の条件付き分布を求めてく

ださい．

(58)

２変数確率変数の特性値

確率変数累積分布関数確率変数の特性２変数確率変数２変数確率変数の特性値

２変数確率変数の平均・分散など

確認

確認問題：平均・分散・標準偏差

(59)

２変数確率変数の平均・分散など

統計学第４週 _{– 59 / 70}

■ ^性質１ _X^，_Y それぞれの平均・分散は周辺確率のみから求めることができる

■ ^性質２ ^{分散について，}

V[X] = E[(X − E[X])²] = E[X²] − {E[X]}²

■ ^性質３二つの確率変数の和について，

E_{[X + Y ]} ₌ E[X] + E[Y ]

E[a + b · X + c · Y ] = a + b · E[X] + c · E[Y ]

■ ^性質４ ^E[XY ] = E[X · E[Y |X]]（この性質については今のところ理解しなくても良い）

(60)

２変数確率変数の平均・分散など

■ ^性質４ ^E[XY ] = E[X · E[Y |X]]

◆ ^ただし，^E_{[Y |X]} ^は，_X ^{が与えられた下での} _Y ^{の条件付き期待値と呼}

ばれ，

E_{[Y |X = x}_i_{] =}

m

X

j=1

yj · Pr[Y = yj|X = xi] · · · ⁴

であり，

E[X · E[Y |X]] =

n

X

i=1

{ xi · E[Y |X = xi] } · Pr[X = xi]

· · · ⁵ と定義される．

(61)

２変数確率変数の期待値演算

統計学第４週 _{– 61 / 70}

■ ^確認１− ^１：^E_[X] ^{を求める．}

◆ ^{起きうる値が} _X^：_{x_i_}ⁿ_i=1^，_Y ^：_{y_j_}^m_j=1 ^{のとき，同時確率が} Pr[X = xi, Y = yj] などと与えられているとする．

◆ ^{期待値（平均）は，}^{『起きうる値} _× ^{その確率』なので} E_[X] ₌

n

X

i=1 m

X

j=1

xi · Pr[X = xi, Y = yj]

=

n

X

i=1

x_i ·





m

X

j=1

Pr[X = x_i, Y = y_j]





=

n

X

i=1

xi · Pr[X = xi]

(62)

２変数確率変数の期待値演算

■ ^確認１− ^２：分散 ^V_[X] ^{を求める．}

◆ 分散は，散らばりの尺度で，「平均からの乖離の二乗」についての平均

V_[X] ₌ E[(X − E[X])²]

=

n

X

i=1 m

X

j=1

(xi − E[X])² · Pr[X = xi, Y = yj]

=

n

X

i=1

(xi − E[X])² ·





m

X

j=1

Pr[X = xi, Y = yj]





=

n

X

i=1

(x_i − E[X])² · Pr[X = x_i]

(63)

２変数確率変数の期待値演算

統計学第４週 _{– 63 / 70}

■ ^確認２：

V[X] = E[(X −E[X])²] = E[X²−2X ·E[X]+{E[X]}²] = E[X²]−2{E[X]}²

■ ^確認３：^E_{[X + Y ]} ^{を求める．}

◆ ^{期待値（平均）は，}^{『起きうる値} _× ^{その確率』なので}

E_{[X + Y ]} ₌

n

X

i=1 m

X

j=1

(x_i + y_j) · Pr[X = x_i, Y = y_j]

=

n

X

i=1 m

X

j=1

+

n

X

i=1 m

X

j=1

yj · Pr[X = xi, Y = yj]

(64)

２変数確率変数の期待値演算

■ ^確認３：^E_{[X + Y ]} ^{を求める．}

E_{[X + Y ]} ₌

n

X

i=1 m

X

j=1

+

n

X

i=1 m

X

j=1

yj · Pr[X = xi, Y = yj]

=

n

X

i=1

xi ·





m

X

j=1

Pr[X = xi, Y = yj]





+

m

X

j=1

y_j ·

n

X

i=1

Pr[X = x_i, Y = y_j]

!

=

n

X

i=1

xi · Pr[X = xi] +

m

X

j=1

yj · Pr[Y = yj] = E[X] + E[Y ]

(65)

２変数確率変数の期待値演算

統計学第４週 _{– 65 / 70}

■ ^確認４：^E[XY ] = E[X · E[Y |X]] ^{を求める．}

◆ ^{期待値（平均）は，}^{『起きうる値} _× ^{その確率』なので}

E_{[XY ]} ₌

n

X

i=1 m

X

j=1

(xi · yj) · Pr[X = xi, Y = yj]

=

n

X

i=1 m

X

j=1

(xi · yj) · Pr[Y = yj|X = xi] · Pr[X = xi]

=

n

X

i=1

xi ·





m

X

j=1

yj · Pr[Y = yj|X = xi]



 _{· Pr[X = x}_i_]

=

n

X

i=1

xi · E[Y |X = xi] · Pr[X = xi] = E[X · E[Y |X]]

(66)

確認問題：平均・分散・標準偏差

■ _Table ₈ を用いて以下の問いに答えてください．

◆ ^確率変数 _X^，_Y それぞれの平均と分散・標準偏差を求めてください．

◆ ^E[6 · X + 10 · Y ] ^{を求めてください．}

◆ ^E_{[XY ]} ^{を求めてください}

(67)

確認問題：平均・分散・標準偏差

統計学第４週 _{– 67 / 70}

■ ^解答

◆ ^E_{[X] = 6/7}^，^E_{[Y ] = 9/7} E_[X] ₌ _{0 ·} ¹⁰

35 ^{+ 1 ·} 20

35 ^{+ 2 ·} 5 35 ⁼

30 35 E_{[Y ]} ₌ _{0 ·} ⁴

35 ^{+ 1 ·} 18

35 ^{+ 2 ·} 12

35 ^{+ 3 ·} 1 35 ⁼

45 35

(68)

確認問題：平均・分散・標準偏差

■ ^解答

◆ ^V[X] = 20/49^，^V[Y ] = 24/49^． E_[X²_] ₌ ₀² _· ¹⁰

35 ^{+ 1}

2 _· ²⁰

35 ^{+ 2}

2 _· ⁵

35 ⁼ 40 35 E_[Y ²_] ₌ ₀² _· ⁴

35 ^{+ 1}

2 _· ¹⁸

35 ^{+ 2}

2 _· ¹²

35 ^{+ 3}

2 _· ¹

35 ⁼ 75 35 V_[X] ₌ ⁴⁰

35 ⁻ 30 35 ^·

30 35 ⁼

500 1225 ⁼

20 49 V_{[Y ]} ₌ ⁷⁵

35 ⁻ 45 35 ^·

45 35 ⁼

600 1225 ⁼

24 49

(69)

確認問題：平均・分散・標準偏差

統計学第４週 _{– 69 / 70}

■ ^解答

◆ ^E[6 · X + 10 · Y ] ^{を求めてください．}(^答え：18)

E[6X + 10Y ] = 6 · E[X] + 10 · E[Y ] = 6 · 30 + 10 · 45

35 ^{= 18}

(70)

確認問題：平均・分散・標準偏差

■ ^解答

◆ ^E_{[XY ]} ^{を求めてください．}₍^答え：_30/35)

E_{[XY ]} ₌ _{(2)(0) ·} ²

35 ⁺ ^{(2)(1) ·} 3

35 ^{+ (2)(2) ·} 0

35 ^{+ (2)(3) ·} 0 35 + (1)(0) · ²

35 ⁺ ^{(1)(1) ·} 12

35 ⁺ ^{(1)(2) ·} 6

35 ^{+ (1)(3) ·} 0 35 + (0)(0) · ⁰

35 ^{+ (0)(1) ·} 3

35 ^{+ (0)(2) ·} 6

35 ^{+ (0)(3) ·} 1 35

= (1)(1) · ¹²

35 ^{+ (1)(2) ·} 6

35 ^{+ (2)(1) ·} 3 35

= ¹² 35 ⁺

12 35 ⁺

6 35 ⁼

30 35

資料置き場 hustat2017 20171020

統計学： 確率変数

高木 真吾

北海道大学

確率変数

確率変数

確率変数：偶然的要素を伴う現象を表現するための量的表現，

それが実現するまではどのような値をとるのかはわからない

ある値がどのような確率で実現するのかが定められている変量

偶然的要素を伴う現象が量的変量として表現されることが多い

ex. 電球が切れるまでの時間は どの程度 か？など

確率変数

確率変数のタイプ

離散型確率変数：とりうる値が可算集合（いくつかの特定の点）

．確率関数による特徴づけ

各点ごとにその値の実現しやすさが確率関数として与えら

れる．

連続型確率変数：とりうる値が非可算集合（ある区間のどこで

ある領域の実現しやすさが確率密度関数として与えられる．

離散型確率変数

離散型確率変数：確率が１個１個の点について定義

離散型確率変数の個々の点の起きやすさは，以下のような表で集約

Table 1: 離散型確率変数の確率分布表

離散型確率変数

実現値：とりうる値を {x

, x

, x

, . . .} と表記する．

とりうる値の要素数は有限個であっても，無限個であってもよい．

確率関数の定義 各点 x

(k = 1, 2, . . .) について，

p

≡ Pr[X = x

] k = 1, 2, . . .

離散型確率変数

確率関数の性質 各点 x

における確率関数の性質．

1. p

≥ 0 ， k = 1, 2, . . .

2. 実現値が x

, x

, . . . という形で無限個あるとき，

X

p

= 1

また実現値が x

x

, . . . , x

という形で有限個あるとき，

X

p

= 1

離散型確率変数

離散型確率変数の例

Table 2: コイン投げの確率分布表

離散型確率変数の例

Table 3: 宝くじの確率分布

連続型確率変数

連続型確率変数：確率が区間について定義されている

実現する値は { x | − ∞ < x < ∞ } のような区間のどこか一点．

確率密度関数： ある連続関数 f (x) を用いて，確率変数 X がある

区間 { x | a < x < b } のどこかで実現する確率を以下のように

表現できるとき，関数 f (x) を確率密度関数とよぶ．

Pr[a < X < b] =

Z

f (x)dx

連続型確率変数

確率密度関数の性質：実現値は { x | − ∞ < x < ∞ } のような区間の

どこか

1. f (x) ≥ 0 ， x ∈ (−∞, ∞) ：任意の点において非負．

2. 確率変数 X が区間 { x | − ∞ < x < ∞ } のどこかで実現する

とき，

Z

f (x)dx = 1

また確率変数 X が区間 { x | α < x < β } のどこかでしか実現

しないとき，

Z

f (x)dx = 1

連続型確率変数

逆に，何らかの実数値の（非可算）集合に対して，上の二つの性質

統計学：確率変数

高木真吾

_ex. 電球が切れるまでの時間はどの程度か？など

^{確率変数のタイプ}

^{実現値：とりうる値を} _{x

_{, x}

_{, x}

_{, . . .}} ^{と表記する．}

確率関数の定義各点 _x

(k = 1, 2, . . .) ^{について，}

確率関数の性質各点 _x

≥ 0 ^， k = 1, 2, . . .

2. ^実現値が x

また実現値が _x

_x

Table 3: ^{宝くじの確率分布}

^{実現する値は} { x | − ∞ < x < ∞ } のような区間のどこか一点．

確率密度関数：ある連続関数 _{f (x)} を用いて，確率変数 _X がある

表現できるとき，関数 _{f (x)} を確率密度関数とよぶ．

確率密度関数の性質：実現値は { x | − ∞ < x < ∞ } ^{のような区間の}

1. f (x) ≥ 0 ^， x ∈ (−∞, ∞) ：任意の点において非負．

2. ^確率変数 X ^が区間 { x | − ∞ < x < ∞ } ^{のどこかで実現する}

また確率変数 _X が区間 { x | α < x < β } ^{のどこかでしか実現}

^{曲線は密度関数}

^{区間の幅：} _dx

それぞれの区間ごとの高さ

（相対度数）： _{f (x)}

面積の大きさ： _{f (x)dx}

_x

^， _x

^， _x

^， _x

^{を含む区間}

^例 ₃ ^{（一様分布）} ^{：確率変数} _X ^は区間 _{(a, b)} ^{で均等な実現パターン}

^{密度関数：} f (x) = 1/(b − a) for a < x < b, = 0 for x ≤ a, x ≥ b.

^{確率：１．} Pr[ a < X < b ] ^，２． Pr[ a < X < (b + a)/2 ]

^{図示してみると左端が} _a ^，右端が _b ^で高さが _{1/(b − a)} ^の長方形

^例 ₄ （正規分布）正規分布に従う確率変数 _X は，ある区間 _{(a, b)}

で _, どういう確率で実現するか

^確率１． Pr[ −2 < X < 0 ] ^，２． Pr[ X > 2 ]

^例 ₅ ^{（指数分布）} ^ある正数 _λ ^{を用いて，確率変数} _X ^{の密度関数が}

0 x ≤ 0