は『2018 年度確率統計及び演習

(1)

2019

確統

II.0.1

確率統計及び演習 II

数理情報学科・3年次配当・前期・学科固有科目・選択・２単位

(2)

2019

確統

II.0.2

講義計画

No. 回数

【入力属性:◎】

【学外公開】

【入力属性:◎】担当者

【学外公開】

【入力属性:◎】学修内容

【学外公開】

キーワード

【入力属性:△】

1 L01

飯田晋司

多変数の確率分布１：同時確率,周辺確率,条件付き確率(離散型確率変数の場合)

2 L02

飯田晋司

多変数の確率分布２：同時確率,周辺確率,条件付き確率(連続型確率変数の場合)，確率変数の独立性

3 L03

飯田晋司

多変数の確率分布３：独立な確率変数の性質，ベイズの定理，モーメント母関数１：モーメント母関数の定義

4 L04

飯田晋司

モーメント母関数２：正規分布のモーメント母関数，キュミュラント母関数

5 L05

飯田晋司

モーメント母関数３：2項分布とポアソン分布のモーメント母関数，確率変数の和の確率分布，大数の弱法則

6 L06

飯田晋司

モーメント母関数４：中心極限定理，２つの確率変数に対するモーメント母関数，正規母集団１：２次元正規分布の確率密度関数

7 L07

飯田晋司

正規母集団２：２次元正規分布の母共分散行列とモーメント母関数

8 L08

飯田晋司

正規母集団３：標本平均の従う確率分布，標準化された標本の2乗和の従う確率分布，カイ2乗分布

9 T01

飯田晋司

小テスト１

10 L09

飯田晋司

正規母集団４：t分布，F分布，母数の推定１：不偏推定量，母比率の区間推定

11 L10

飯田晋司

母数の推定2：正規母集団の母平均，母分散の区間推定

12 L11

飯田晋司

母数の推定3：２つの正規母集団の母平均の差，母分散の比の区間推定

13 L12

飯田晋司

母数の推定3：対応のある2標本の母平均の差の区間推定，仮説検定１：手順と用語の紹介

14 T02

飯田晋司

小テスト２

15 L13

飯田晋司

仮説検定２：適合度の検定，独立性の検定

プリント中の

^確統^I

は『2018 年度確率統計及び演習

I』の講義を示します。

^前園

は参考文献，“

概説

確率統計

(サイエンス社) ”を示します。

^前園演習

は参考文献，

“詳解演習

確率統計

(

サイエンス社

) ”

を示します。

^西川

は参考文献，

“

確率統計

(

サイエンス社

) ”

を示します。

^統計学

は参考文献，“統計学入門

(東京大学出版会) ”を示します。

^数理統計

は参考文献，“数理統計学

(裳華房) ”を示します。

また，以下は

1

年の科目「微積分及び演習

I,II」や「線形代数及び演習I,II」での参考文献を示します：

^桑村

は参考文献，

“

桑村『微分積分入門』

(

裳華房

) ”

を示します。

^川薩四

は参考文献，“川野，薩摩，四ツ谷『微分積分＋微分方程式』(裳華房) ”を示します。

^三宅線形

は参考文献，“三宅『線形代数学』(培風館) ”を示します。

オフィスアワー：月曜

6

講時

(1-513)，木曜6

講時

(1-513) url: http://www.math.ryukoku.ac.jp/ iida/lecture/lecture.html

(3)

2019

確統

II.0.3

★ 成績評価の方法

・予定されている

2

回の小テストの両方に

60

点以上をとるか，あるいは定期試験に

60

点以上をとることで合格とします。最終成績は，合格の場合は小テストの平均点

(

小数点以下切り上げ

)

と定期試験の点数の高い方，

不合格の場合は定期試験の点数，となります。

・小テストと定期試験で参考文献は持込不可です。電子機器

(

電卓，携帯電話，

PC

等

)

の使用はできません。

・公式や数表等をまとめた，まとめのプリントを試験問題とともに配布します。

・解答で分数や

√

は少数になおす必要はありません。答に加減乗除が現れていてもかまいません。

【例】次の確率密度関数

f(x)，

f(x) =







0 x <0 6x(1−x) 0≤x <1

0 1< x

, (0.3.1)

に従う確率変数

X

について，

0≤X <1/3

となる確率

P

を求めなさい。

【答】

P =

∫ 1/3 0

f(x)dx= 6

∫ 1/3 0

( x−x²

) dx= 6

[x² 2 −x³

3 ]x=1/3

x=0

(0.3.2)

= 6 (1

18− 1 81

)

(0.3.3)

= 7

27. (0.3.4)

上の例の場合は，解答は

(0.3.3)

まででかまいません。

(4)

2019

確統

II.1

.

1 多変数の確率分布

^確統^{I L06}

前園§2.4

数理統計§4.1

1.1 2 変数の離散型確率分布

同時確率分布

確率変数

X

のとる値が

{x1, x2,· · · }

，確率変数

Y

のとる値が

{y1, y2,· · · }

，とする。

『X

=x_i

かつ

Y =y_j

となる確率』を同時確率あるいは結合確率と呼ぶ。この確率分布を記号

f_XY(x, y)

で表す：

P(X =x, Y =y) =fXY(x, y).

^{西川定義}^2.2

統計学(7.1) (1.1)

【例

1.1

】２枚のコイン

A,B

を無作為に投げて表裏を見る。コイン

A

が表

(

裏

)

の場合

X = 1 (X = 0)

，コイン

B

が表

(裏)

の場合

Y = 1 (Y = 0)，とする。同時確率 fXY(x, y)

の値は次の表のようになる：

y

＼

x 0 1

計

0 fXY(0,0) =1

4 fXY(1,0) =1

4 P(Y = 0) =fY(0) =1 2

1 fXY(0,1) =1

4 fXY(1,1) =1

4 P(Y = 1) =fY(1) =1 2

計

P(X= 0) =fX(0) =1

2 P(X= 1) =fX(1) =1

2 1

表

1-1 2

つのコインの同時確率分布

【例

1.2】次の6

枚のカードから無作為に

1

枚のカードを引く:

♡7 ♡8 ♡9 ⋄8 ♠9 ♣9

X =

数，Y

= 0(赤札)，1(黒札)

とすると，同時確率

f_XY(x, y)

の値は次の表のようになる：

y

＼

x 7 8 9

計

0 fXY(7,0) =1

6 fXY(8,0) =1

3 fXY(9,0) =1

6 P(Y = 0) =fY(0) =2 3

1 fXY(7,1) = 0 fXY(8,1) = 0 fXY(9,1) =1

3 P(Y = 1) =fY(1) =1 3

計

P(X= 7) =f_X(7) =1

6 P(X= 8) =f_X(8) =1

3 P(X= 9) =f_X(9) =1

2 1

表

1-2 6

枚のカードの同時確率分布周辺確率分布

'

&

$

%

同時確率分布

f_XY(x, y)

から，X や

Y

の単独の確率分布が求められる：

fX(x) =∑

y_j

fXY(x, yj), fY(y) =∑

x_i

fXY(xi, y).

統計学(7.7) (1.2)

表の周辺にあるので，それぞれ

X

，

Y

の周辺確率分布と呼ばれる。

(5)

2019

確統

II.2

条件付き確率

西川§1.5.1

前園§1.2’

'

&

$

% Y =y_j

が起きているという条件の下での，事象

X=x_i

が起きる確率

(

条件付き確率

)

を

P(X =x_i|Y =y_j)

と表す。このとき，以下が成り立つ

P(X =xi, Y =yj) =P(X=xi|Y =yj)P(Y =yj) =P(Y =yj|X =xi)P(X =xi). (2.1)

また，この確率分布を記号

f_X_|_Y(x|y)

で表す：

前園§1.2では条件付き確率P(X=xi|Y =yj)はP_{Y_=y_j_}({X=xi})の様に表されている。

条件付き確率の性質

'

&

$

%

∑

x_i

f_X_|_Y(xi|yj) = 1, ∑

y_j

f_Y_|_X(yj|xi) = 1.

統計学(7.19) (2.3)

・同時確率との関係

fXY(xi, yj) =f_X_|_Y(xi|yj)fY(yj) =f_Y_|_X(yj|xi)fX(xi).

統計学(7.24) (2.4)

f_X_|_Y(xi|yj) = fXY(xi, yj)

fY(yj) , f_Y_|_X(yj|xi) =fXY(xi, yj) fX(xi) .

統計学(7.18) (2.5)

・周辺確率との関係

fX(xi) =∑

y_j

f_X_|_Y(xi|yj)fY(yj), fY(yj) =∑

x_i

f_Y_|_X(yj|xi)fX(xi).

統計学(7.9) (2.6)

【問

2.1

】【例

1.2

】の確率分布について以下の問いに答えなさい。

(1) E[(9Y + 1)X]

を求めなさい。

(2) 9

の札が出る

(X = 9)

という条件のもとで赤札が出る

(Y = 0)

条件付き確率，f

_Y_|_X(0|9)，を求めなさい。

(3)

赤札が出る

(Y = 0)

という条件のもとで

9

の札が出る

(X = 9)

条件付き確率，f

_X_|_Y(9|0)，を求めなさい。

【答

2.1】

(1)

E[(9Y + 1)X] = 1

6×(0 + 1)×7 + 1

3×(0 + 1)×8 + 1

6×(0 + 1)×9 +1

3 ×(9 + 1)×9 = 106

3 . (2.7) (2) (2.5)

より

f_Y_|_X(0|9) = fXY(9,0) fX(9) = 1/6

1/2 = 1

3. (2.8)

(3) (2.5)

より

f_X_|_Y(9|0) = f_XY(9,0) fY(0) = 1/6

2/3 = 1

4. (2.9)

(6)

2019

確統

II.3

.

σ[sigma]シグマ，θ [theta]シータ

1.2 2 変数の連続型確率分布

X，Y

が連続型確率変数の場合は，f

_XY(x, y)

は同時確率密度関数を意味する。『(X, Y

)

が領域

A

に属する

確率』が

(和の代わりに)

以下のような積分で表される：

P((X, Y)∈A) =

∫ ∫

A

fXY(x, y)dxdy .

統計学(7.5)

前園p.31’

^{西川定義}^3.2’ (3.1)

【例

3.1】ダーツを的に向かって投げる場合を考える。(X, Y)

をダーツが的に当たった場所の座標，同時確率密度

関数を

fXY(x, y) = 1

2πσ² e⁻^{x2 +y}

2

2σ2 (3.2)

とする。このとき，ダーツが的の中心，(X

= 0, Y = 0)，から半径R

の円内に当たる確率

P

は次となる：

P =

∫ ∫

x²+y²≤R²

f_XY(x, y)dxdy= 1 2πσ²

∫ ∫

x²+y²≤R²

e⁻^{x2 +y}

2

2σ2 = 1

2πσ²

∫ 2π 0

dθ

∫ R 0

dr r e⁻^r

2 2σ2

= 2π

2πσ²

[−σ²e⁻^r

2 2σ2

]^r=R

r=0

= 1−e⁻^R

2

2σ2. (3.3)

上の

3

つ目の等式では，積分変数を

(x, y)

から

(r, θ)

に変換した

桑村p.223

川薩四§8.3

：

x=rcos(θ), y=rsin(θ), dxdy⇒rdrdθ . (3.4)

離散型確率変数の場合の式で，和を積分に置き換えた式が成り立つ：

'

&

$

%

・X ，Y の周辺確率密度関数

fX(x) =

∫ _∞

−∞

fXY(x, y)dy , fY(y) =

∫ _∞

−∞

fXY(x, y)dx .

統計学(7.8) (3.5)

・Y

=y

を与えたときの

X

の条件付き確率密度関数

f_X_|_Y(x|y) =fXY(x, y)

fY(y) = fXY(x, y)

∫_∞

−∞fXY(x, y)dx.

統計学(7.18) (3.6)

・条件付き確率密度関数と周辺確率密度関数の関係

f_X(x) =

∫ _∞

−∞

f_X_|_Y(x|y)f_Y(y)dy , f_Y(y) =

∫ _∞

−∞

f_Y_|_X(y|x)f_X(x)dx . (3.7)

【問

3.1】次の同時確率密度関数

fXY(x, y) =

√3

π e⁻^x²^+4xy⁻^7y² (3.8)

について，周辺確率密度関数

fX(x)，f_Y(y)

を求めなさい。

(7)

2019

確統

II.4

.

【答

3.1】(3.5)

より次が得られる：

fY(y) =

∫ _∞

−∞

fXY(x, y)dx=

√3 π e⁻^7y²

∫ _∞

−∞

e⁻^x²^+4xydx=

√3 π e⁻^7y²

∫ _∞

−∞

e⁻^(x⁻^2y)²^+4y²dx

=

√3 π e⁻^3y²

∫ _∞

−∞

e⁻^z²dz=

√3

π e⁻^3y². (4.1)

上式の

4

つ目の等式では，積分変数を

x

から

z=x−2y

に変換し，5 つ目の等式では以下の公式を用いた：

∫ _∞

−∞

e⁻^z²dz=√

π .

桑村p.225

川薩四(8.7) (4.2)

同様に

fX(x) =

∫ _∞

−∞

fXY(x, y)dy=

√3 π e⁻^x²

∫ _∞

−∞

e⁻^7y²^+4xydy=

√3 π e⁻^x²

∫ _∞

−∞

e⁻⁷(^y−²7x)²⁺⁴7x²dy

=

√3 π√

7e⁻³⁷^x²

∫ _∞

−∞

e⁻^z²dz=

√ 3

7π e⁻³⁷^x². (4.3)

となる。上の式の

4

つ目の等式では，積分変数を

y

から

z=√ 7

( y−2

7x )

に変換した。

確率変数の独立性

前園p.9’

『確率変数

X

と

Y

が独立』

⇔

『同時確率

(

密度

)

関数が周辺確率

(

密度

)

関数の積になる』，つまり次が成り立つ：

f_XY(x, y) =f_X(x)f_Y(y)

統計学(7.22)

前園(1.4)’ (4.4)

【例

4.1】

・

X

と

Y

が独立な場合：【例

1.1

】【例

3.1

】，・

X

と

Y

が独立でない場合：【例

1.2

】【問

3.1

】

X

と

Y

が独立な確率変数の場合に成り立つ性質

前園p.55 '

&

$

%

E[ϕ₁(X)ϕ₂(Y)] = E[ϕ₁(X)]E[ϕ₂(Y)], (4.5)

E[X Y] = E[X]E[Y],

統計学(7.26)(7.35) (4.6)

V[aX+bY] = a²V[X] +b²V[Y],

統計学(7.36)’ (4.7)

Cov[X, Y] = 0,

統計学(7.27) (4.8)

fX|Y(x|y) = fX(x), fY|X(y|x) =fY(y).

統計学(7.23) (4.9)

(4.9)

は

X(Y)

が起きる確率に

Y(X)

の影響がないことを示す。

注意 ! X

と

Y

が独立でない場合にも成り立つ性質：

E[aϕ₁(X, Y) +bϕ₂(X, Y)] = a E[ϕ₁(X, Y)] +b E[ϕ₂(X, Y)], (4.10) V[aX+bY] = a² V[X] +b²V[Y] + 2ab Cov[X, Y],

統計学(7.37a)’ (4.11)

Cov[X, Y] = E[(X−µX)(Y −µY)] =E[XY]−E[X]E[Y].

統計学(7.14)(4.12)

ここで，

µX=E[X]

，

µY =E[Y]

。

Cov[X, Y]

は

X

と

Y

の

(

母

)

共分散

(covariance)

と呼ばれる。

前園p.55

^{西川定義}^2.9

統計学(7.11)

数理統計§4.2

(8)

2019

確統

II.5

1.3 ベイズの定理

前園§1.4

西川§1.5.2

統計学§4.5.3

数理統計p.6

(2.4)，(2.5)，(2.6)

を組み合わせると

Y

についての条件付き確率

f_X_|_Y(x|y)

と

X

についての条件付き確率

f_Y_|_X(y|x)

の間の関係が得られる。この関係式をベイズの定理

(公式)

と呼ぶ。

ベイズ

(Bayes)

の定理

'

&

$

%

・X と

Y

が離散型確率変数の場合

f_X_|_Y(x|y) = fY|X(y|x)fX(x)

∑

xif_Y_|_X(y|xi)fX(xi).

統計学(4.17)

^{前園定理}^1.7’ (5.1)

・X と

Y

が連続型確率変数の場合

f_X_|_Y(x|y) = f_Y_|_X(y|x)fX(x)

∫_∞

−∞f_Y_|_X(y|x^′)f_X(x^′)dx^′ . (5.2)

【問

5.1】(2013

年度統計検定

2

級問

9

を一部変更)

ある病気の発生率が７パーセントであることが知られている。この病気のある診断法の性能が次の表のようになっている。ある人がこの検査を受けたところ陽性であった。この人が実際に病気にかかっている確率を求めなさい。

病気の有無＼診断結果陽性陰性計罹病している

0.82 0.18 1.00

罹病していない

0.13 0.87 1.00

表

5-1

【答

5.1】確率変数X

と

Y

を考え，診断結果が陽性

(陰性)

の場合は

X = 0 (X = 1)

とし，病気に罹患している

(していない)

場合を

Y = 0 (Y = 1)

とすると，表の内容は以下のようになる；

fX|Y(0|0) = 0.82, fX|Y(1|0) = 0.18, fX|Y(0|1) = 0.13, fX|Y(1|1) = 0.87. (5.3)

また，f

_Y(0) = 0.07

である。これらのデータから確率

f_Y_|_X(0|0)

を求める問題である。

f_Y_|_X(0|0) = fXY(0,0)

f_X(0) = f_X_|_Y(0|0)fY(0)

f_XY(0,0) +f_XY(0,1) = f_X_|_Y(0|0)fY(0)

f_X_|_Y(0|0)f_Y(0) +f_X_|_Y(0|1)f_Y(1)

= 0.82×0.07

0.82×0.07 + 0.13×(1−0.07) ≈0.32 (5.4)

となる。

(9)

2019

確統

II.6 (参考)

ベイズの定理を用いた母数の推定

統計学p.79

例として，コインを

n

回投げて

k

回表が出たというデータがある場合を考えよう。このコインの表が出る確率

θ

を推定する。標本数

n

が十分大きく，二項分布が正規分布で近似できる場合に確率

0.95

で成り立つ次の不等式

θˆ−1.96

√

θ(1ˆ −θ)ˆ

n < θ < θˆ+ 1.96

√

θ(1ˆ −θ)ˆ

n , θˆ= k n

統計学(11.59) (6.1)

から，母比率

θ

の

(信頼係数0.95

の) 信頼区間を得た。

^確統^{I L12}

前園§5.4

西川§8.4

数理統計§9.3

この場合，θ の値は定まっていて，

θˆ

が確率変数と考えた。

一方，

θ

が確率変数で，確率密度

fΘ(θ)

に従い，いろいろな値をとるとする考え方があり，ベイズ統計学と呼ばれている。

このとき，ベイズの定理，

f_Θ_|_D(θ|D) = f_D_|_Θ(D|θ)fΘ(θ)

∫f_D_|_Θ(D|θ^′)f_Θ(θ^′)dθ^′ , (6.2)

は，観測データがないときに予想した

θ

の確率密度，

fΘ(θ)

，に

(n

回のうち

k

回表が出たという

)

データ

D

を付け加えて，“より良い” 確率密度，f

_Θ_|_D(θ|D)，を得るための道具として使われる。ここで，f_Θ(θ)

を

(データを得る

前の確率分布という意味で) 事前分布，f

_Θ_|_D(θ|D)

を

(データを得た後の確率分布という意味で)

事後分布と呼ぶ。また，

f_D_|_Θ(D|θ) = _nC_k θ^k (1−θ)ⁿ⁻^k (6.3)

は，仮定された確率モデルに含まれるパラメータ

(

母数

)

，

θ

，が特定の値をとる場合に，観測データ

D

が生じる確率で，尤度関数と呼ばれる。例えば

fΘ(θ)

が区間

(0,1)

の一様分布で，n

= 20，k= 5

の場合の事後分布は

f_Θ_|_D(θ|D) = 325584θ⁵(1−θ)¹⁵ (6.4)

となる

(図6-1)。

0.2 0.4 0.6 0.8 1

1 2 3 4 5

95%

|_D( | )D

fΘ ^θ

θ2

θ1

θ

0.2 0.4 0.6 0.8 1

1 2 3 4 5

θ fΘ( )^θ

࠺࡯࠲

図

6-1

事前分布

fΘ(θ)

と事後分布

f_Θ_|_D(θ|D)

この場合について，

fΘ|D(θ|D)

から確率

0.95

となる区間を求めると

0.101 < θ < 0.456 (6.5)

となる。このような区間は

(信頼区間と区別して)

信用区間と呼ばれる。( なお，n

= 20

は十分大きな標本数ではないが，この場合の

(24.6)

による信頼区間は

(0.060,0.440)

である。

)

ここでは説明を簡単にするためパラメータが

1

個の場合を考えたが，上の手順が実際に用いられるのは，複雑

な現象を説明するための多数のパラメータを含む確率モデルを作る場合である。

(10)

2019

確統

II.7

.

階乗(factorial) n! =n·(n−1)· · · ·2·1，0! = 1

nC_k= n!

k!(n−k)!= n(n−1)· · ·(n−k+ 1)

k! n個のものからk個を取り出す組み合わせの数

2 モーメント母関数

期待値

E[e^tX]

をモーメント母関数あるいは積率母関数と呼ぶ。母平均

E[X]

や母分散

V[X] =E[X²]− E[X]²

，を求めるのには

E[X^k]

の計算が必要だが，指数関数のテイラー展開

e^tX =

∑∞ k=0

t^k

k!X^k = 1 +tX+t²

2X²+· · · (7.1)

より，モーメント母関数は全ての

E[X^k]

の情報を持つ。

モーメント母関数

統計学§5.3

数理統計p.20 '

&

$

% MX(t) =E[e^tX] =

∑∞ k=0

t^k

k!E[X^k].

統計学(5.40) (7.2)

MX(t) = { ∑

xif_X(x_i)e^txⁱ X

が離散型確率変数の場合

∫_∞

−∞fX(x)e^txdx X

が連続型確率変数の場合

.

統計学(5.41) (7.3)

MX(0) =E[1] = 1, d^kMX(t) dt^k

t=0

=E[X^k].

統計学(5.42) (7.4)

『

X

と

Y

が同じモーメント母関数を持つ』

⇐⇒

『

X

と

Y

が同じ確率分布に従う』，つまり，次が成り立つ：

MX(t) =MY(t) ⇐⇒ fX(z) =fY(z). (7.5)

(参考) E[e^tX]ではなくE[e^itX]を考える場合がある。E[e^itX]を確率変数Xの特性関数と呼ぶ。

前園p.61 E[e^itX]は存在するが，E[e^tX]は存在しない(期待値の級数や積分が発散する)場合がある。

【問

7.1】離散型確率変数X

が二項分布

B(n, p)

^確統^{I L09}

前園p.18

統計学§6.2

数理統計p.29

に従う

(確率p

で表の出るコインを

n

回投げた時，表の出る回数が

X)

。モーメント母関数

MX(t)

を求めなさい。また，(7.4) より，母平均と母分散を求めなさい。

【答

7.1】

fX(x) =nCxp^x(1−p)ⁿ⁻^x x= 0,1,· · ·, n

西川(2.1)

統計学(6.6) (7.6)

より，

MX(t) =

∑n x=0

nCxp^x(1−p)ⁿ⁻^x e^tx=

∑n x=0

nCx

(pe^t)x

(1−p)ⁿ⁻^x= (

pe^t+ 1−p )n

.

統計学p.130 (7.7)

上の最後の等式で二項定理

(a+b)ⁿ=

∑n x=0

nC_x a^xbⁿ⁻^x

^{前園定理}^1.5

西川p.37 (7.8)

を用いた。次に，

dM_X(t)

dt =

d (

pe^t+ 1−p )n

dt =n

(

pe^t+ 1−p )n−1 d

(

pe^t+ 1−p ) dt =npe^t

(

pe^t+ 1−p )n−1

, (7.9) d²M_X(t)

dt² = npde^t dt

(

pe^t+ 1−p )n−1

+npe^t d

(

pe^t+ 1−p )n−1

dt

= npe^t (

pe^t+ 1−p )n−1

+npe^t (n−1) (

pe^t+ 1−p )n−2

pe^t (7.10)

(11)

2019

確統

II.8

.

∫ _∞

−∞e⁻^z²dz=√ π (4.2)

より，

E[X] = dMX(t) dx

t=0

=np , E[X²] = d²MX(t) dx²

t=0

=np+n(n−1)p² (8.1)

なので，母平均

E[X]

と母分散

V[X]

は以下となる：

E[X] =np , V[X] =E[X²]−E[X]²=np(1−p).

前園p.50,53

西川p.55例2.4

統計学(6.8) (8.2)

【問

8.1

】連続型確率変数

X

が正規分布

N(µ, σ²)

^確統^{I L09}

前園p.24

統計学§6.6

数理統計p.36

に従う。モーメント母関数

M_X(t)

を求めなさい。また，(7.4) より，母平均と母分散を求めなさい。

【答

8.1】

fX(x) = 1

√2πσ²exp (

−(x−µ)² 2σ²

)

西川(3.6)

統計学(6.19a) (8.3)

より，

M_X(t) = 1

√2πσ²

∫ _∞

−∞

exp (

−(x−µ)² 2σ² +tx

)

dx= 1

√2πσ²

∫ _∞

−∞

exp (

−x²−2(µ+σ²t)x+µ² 2σ²

) dx

= 1

√2πσ²

∫ _∞

−∞

exp



−

(

x−(µ+σ²t) )2

−2µσ²t−σ⁴t² 2σ²



dx

= exp (

µt+σ²t² 2

) 1

√π

∫ _∞

−∞

e⁻^z²dz= exp (

µt+σ²t² 2

)

. (8.4)

上の

4

つ目の等式では積分変数を

x

から

z= x−(µ+σ²t)

√2σ

に変換し，(4.2 ) を用いた。次に，

dM_X(t)

dt =

dexp (

µt+^σ²₂^t² )

dt = exp

(

µt+σ²t² 2

) d (

µt+^σ²₂^t² )

dt = exp

(

µt+σ²t² 2

) (µ+tσ²) ,(8.5)

d²M_X(t) dt² =

dexp (

µt+^σ²₂^t² ) dt

(µ+tσ²) + exp

(

µt+σ²t² 2

)d(

µ+tσ²) dt

= ((

µ+tσ²)2

+σ² )

exp (

µt+σ²t² 2

)

(8.6)

より，

E[X] = dMX(t) dx

t=0

=µ , E[X²] = d²MX(t) dx²

t=0

=µ²+σ² (8.7)

なので，母平均

E[X]

と母分散

V[X]

は以下となる：

E[X] =µ , V[X] =E[X²]−E[X]²=σ².

前園p.51,55

統計学(6.20),(6.21) (8.8)

正規分布のモーメント母関数

正規分布

N(µ, σ²)

に従う連続型確率変数

X

のモーメント母関数：

MX(t) = exp (

µt+σ²t² 2

)

.

統計学p.131 (8.9)

【問

8.2】確率変数X

のモーメント母関数を

M_X(t)

とするとき，確率変数

Y =aX+b (a，b

は定数) のモーメント母関数

MY(t)

を求めなさい。また，

(7.4)

より，

X

と

Y

母平均と母分散の関係を導きなさい。

【答

8.2

】

MY(t) =E[e^tY] =E[e^t(aX+b)] =E[e^tb e^atX] =e^tb E[e^atX] =e^tb MX(at). (8.10)

(12)

2019

確統

II.9

次に

dMY(t)

dt =

d (

e^tbM_X(at) ) dt =de^tb

dt MX(at) +e^tb dMX(at) dt

= be^tb MX(at) +e^tb dMX(s) ds

s=at

d(at) dt =e^tb

(

bMX(at) +aM_X^′ (at) )

. (9.1)

ここで，M

_X^′ (t)

は

MX(t)

の

1

階導関数を表す。また，

d²MY(t)

dt² = d dt

( e^tb

(

bMX(at) +aM_X^′ (at) ))

=de^tb dt

(

+e^tbd dt

(

= be^tb (

bM_X(at) +aM_X^′ (at) )

+e^tb (

baM_X^′ (at) +a²M_X^′′(at) )

= e^tb (

b²M_X(at) + 2abM_X^′ (at) +a²M_X^′′(at) )

. (9.2)

ここで，

M_X^′′(t)

は

MX(t)

の

2

階導関数を表す。

従って，

E[Y] = dMY(t) dx

t=0

=e⁰ (

bMX(0) +aM_X^′ (0) )

=bE[1] +aE[X] =b+aE[X], (9.3) E[Y²] = d²MY(t)

dx²

t=0

=e⁰ (

b²MX(0) + 2abM_X^′ (0) +a²M_X^′′(0) )

=b²E[1] + 2abE[X] +a²E[X²]

= b²+ 2abE[X] +a²E[X²], (9.4)

なので，母平均

E[Y] =E[aX+b]

と母分散

V[Y] =V[aX+b]

は以下となる：

E[aX+b] = aE[X] +b ,

前園(3.2)

統計学(5.25b,c)

^確統^{I L05} (9.5)

V[aX+b] = E[Y²]−E[Y]²=a²E[X²] + 2abE[X] +b²−(

aE[X] +b )2

=a² (

E[X²]−E[X]² )

= a²V[X].

^{前園定理}^3.2

統計学(5.29b,c)

^確統^{I L05} (9.6)

【問

9.1

】確率変数

X

と

Y

が独立な場合，

Z =X+Y

のモーメント母関数を求めなさい。

【答

9.1】

MZ(t) =E[e^tZ] =E[e^t(X+Y⁾] =E[e^tX e^tY]⁽^4.5=⁾E[e^tX]Ee^tY] =MX(t)MY(t). (9.7)

モーメント母関数の性質

'

&

$

%

・aX

+b

のモーメント母関数

M_aX+b(t) =e^tbM_X(at). (9.8)

・

X

と

Y

が独立なときの，

X+Y

のモーメント母関数

MX+Y(t) =MX(t)MY(t).

統計学(7.28)

数理統計p.61 (9.9)

【問

9.2】独立な確率変数X

と

Y

がそれぞれ次の正規分布に従うとする：

X ∼N(µ1, σ₁²), Y ∼N(µ2, σ₂²). (9.10)

このとき，Z

=aX+bY

が従う確率分布を

(9.8)，(9.9)

を用いて求めなさい。

(13)

2019

確統

II.10

.

d dt

(f(t) g(t) )

=f^′(t)g(t)−f(t)g^′(t) g(t)²

【答

9.2】(8.9)

より

M_X(t) = exp (

µ₁t+σ²₁t² 2

)

, M_Y(t) = exp (

µ₂t+σ₂²t² 2

)

(10.1)

なので，

MZ(t)⁽^9.9=⁾MaX(t)MbY(t)⁽^9.8=⁾MX(at)MY(bt) = exp (

(aµ1+bµ2)t+a²σ₁²+b²σ²₂

2 t²

)

(10.2)

となる。この式と

(8.9)

を比較して，Z

=aX+bY

は母平均が

aµ₁+bµ₂

，母分散が

a²σ²₁+b²σ₂²

の正規分布に従うことがわかる。

正規分布に従う独立な確率変数の和

前園p35 (2.3)’

西川p.80定理3.8

統計学p.151

X ∼N(µ1, σ₁²), Y ∼N(µ2, σ²₂) =⇒ aX+bY ∼N(

aµ1+bµ2, a²σ²₁+b²σ²₂ )

. (10.3) 注意 !

正規分布の例のように，同じ種類の確率分布に従う独立な確率変数

X

と

Y

の和，

Z=X+Y

，もまた同じ種類の確率分布

(ただしパラメタは別でもよい)

に従うとき, この確率分布は再生的であるという。

モーメント母関数の対数，

logMX(t), (

キュミュラント母関数と呼ばれる

)

を考えると，

d

dtlogMX(t) =M_X^′ (t) MX(t), d²

dt²logMX(t) = M_X^′′(t)MX(t)−(M_X^′ (t))²

MX(t)² (10.4)

となるので，以下が成り立つ：

d

dtlogMX(t) t=0

= M_X^′ (0)

M_X(0) =E[X], (10.5)

d²

dt²logMX(t) t=0

=

M_X^′′(0)M_X(0)−( M_X^′ (0)

)2

MX(0)² =E[X²]−( E[X]

)2

=V[X]. (10.6)

キュミュラント

(cumulant)

母関数

数理統計p.20

logM_X(t) = tE[X] + t²

2V[X] +· · ·, (10.7)

MX(t) = exp (

tE[X] +t²

2V[X] +· · ·)

. (10.8)

独立同分布

(i.i.d.)

^確統^{I L09}

確率変数

{X₁, X₂,· · ·, X_n}

が, たがいに独立で, すべて同じ確率分布に従うとする。これを

{X₁, X₂,· · ·, X_n}

は独立同分布に従う

(i.i.d.=independent and identically-distributed)

という。

【例

10.1

】箱の中に入ったカードを無作為に

n

枚取り出す試行を考えよう。取り出したカードを毎回箱に戻す場合

(

復元抽出

)，k

枚目のカードの数字

Xk

は独立同分布の確率変数となる。取り出したカードを箱に戻さない場合

(

非復元抽出

)

も，箱の中のカードの枚数が取り出すカードの枚数に比べて十分大きい場合は，カードの数字は近似的に独立同分布の確率変数であるとみなせる。

西川p.130注意6.1

統計学p.110

数理統計p.27

は『2018 年度確率統計及び演習

確統

確統

プリント中の

は『2018 年度確率統計及び演習

は参考文献，“

確率統計

は参考文献，

確率統計

サイエンス社

を示します。

は参考文献，

確率統計

サイエンス社

を示します。

は参考文献，“統計学入門

は参考文献，“数理統計学

また，以下は

年の科目「微積分及び演習

は参考文献，

桑村『微分積分入門』

裳華房

を示します。

は参考文献，“川野，薩摩，四ツ谷『微分積分＋微分方程式』(裳華房) ”を示します。

は参考文献，“三宅『線形代数学』(培風館) ”を示します。

オフィスアワー： 月曜

講時

講時

確統

★ 成績評価の方法

・予定されている

回の小テストの両方に

点以上をとるか，あるいは定期試験に

点以上をとることで合格 とします。最終成績は，合格の場合は小テストの平均点

小数点以下切り上げ

と定期試験の点数の高い方，

不合格の場合は定期試験の点数，となります。

・小テストと定期試験で参考文献は持込不可です。電子機器

電卓，携帯電話，

等

の使用はできません。

・公式や数表等をまとめた，まとめのプリントを試験問題とともに配布します。

・解答で分数や

は少数になおす必要はありません。答に加減乗除が現れていてもかまいません。

【例】次の確率密度関数

に従う確率変数

について，

となる確率

を求めなさい。

【答】

上の例の場合は，解答は

まででかまいません。

確統

1 多変数の確率分布

1.1 2 変数の離散型確率分布

同時確率分布

確率変数

のとる値が

，確率変数

のとる値が

，とする。

『X

かつ

となる確率』を 同時確率 あるいは 結合確率 と呼ぶ。この確率分布を記号

で表す：

【例

】２枚のコイン

を無作為に投げて表裏を見る。コイン

が表

裏

の場合

，コイン

が表

の場合

の値は次の表のようになる：

＼

計

計

表

つのコインの同時確率分布

オフィスアワー：月曜

点以上をとることで合格とします。最終成績は，合格の場合は小テストの平均点

となる確率』を同時確率あるいは結合確率と呼ぶ。この確率分布を記号

枚のカードの同時確率分布周辺確率分布

の周辺確率分布と呼ばれる。

は同時確率密度関数を意味する。『(X, Y

・X ，Y の周辺確率密度関数

の条件付き確率密度関数