資料置き場 hustat2017 20171117hand

(1)

統計学（第 ₇ 週）大数法則，中心極限定理

高木真吾

北海道大学

URL: http://sites.google.com/site/hustat2017/

質問等は担当者（ [email protected]) までご連絡ください

November 17, 2017

まとめ（非常に重要）

. . . 2

大数の法則

₃

大数の法則

. . . 4

中心極限定理

₆

中心極限定理

. . . 7

二項分布の正規近似

₉

二項分布の正規近似

. . . 10

積率母関数・変数変換 ₍以下の内容は試験範囲外₎

₁₄

積率母関数

. . . 15

一変数確率変数の変数変換

. . . 16

二変数（以上の）確率変数の変数変換

. . . 17

カイ二乗分布，ｔ分布，Ｆ分布，コーシー分布 ₍以下の内容は試験範囲外₎

₁₉

正規分布とカイ二乗分布

. . . 20

ｔ分布：正規分布とカイ二乗分布

. . . 21

ガンマ関数，ベータ関数，_Stirling の公式

. . . 22

ｔ分布：正規分布への収束

. . . 23

コーシー分布，ｔ分布：モーメントの不在

. . . 24

F分布：カイ自二乗分布同士の比

. . . 25

中心極限定理再論

. . . 26

演習問題

. . . 27

(2)

まとめ（非常に重要）

二つの確率変数_X₁_{, X}₂を用いて，_{Y = β}₀_{+ β}₁_{· X}₁_{+ β}₂_{· X}₂ とする．

■ 平均

E_{[Y ] = β}₀_{+ β}₁_{· E[X}₁_{] + β}₂_{· E[X}₂_]

■ 分散

V_{[Y ] = β}₁²_{· V[X}₁_{] + β}₂²_{· V[X}₂_{] + 2β}₁_β₂_{· cov(X}₁_{, X}₂₎

■ 二つの確率変数_X₁_{, X}₂が独立であるとき， V_{[Y ] = β}₁²_{· V[X}₁_{] + β}₂²_{· V[X}₂_]

一般に確率変数がｎ個の場合でも，上の結果は成立する

ｎ個の確率変数_{X₁_{, X}₂, . . . , Xn} を用いて，以下の Y を定める． Y = β0+

∑n i=1

βi_{· X}i

■ 平均

E_{[Y ] = β}₀₊

∑n i=1

βi· E[Xi]

■ 分散

V_{[Y ] =}

∑n i=1

β_i²_{· V[X}i] + 2

n−1∑

i=1

∑n j=i+1

βiβj_{· cov(X}i, Xj)

■ ｎ個の確率変数_X₁_{, X}₂, . . . , Xnが互いに独立であるとき，

V_{[Y ] =}

∑n i=1

β_i²^V[Xi]

以上の結果はすべて離散型確率変数についても，連続型確率変数についても成り立つ

■ 確率変数の基準化（平均を０，分散を１に変換）：以下の結果は期待値演算の性質から明らか Z = ^{X − E[X]}_√

V_[X] ^,

E[Z] = 0, V[Z] = 1

それ自身の平均を引き，標準偏差（分散の平方根）で除した確率変数Z は，必ず平均０，分散１となる．

統計学第

₇

週

_{– 2 / 27}

(3)

大数の法則 _{3 / 27}

大数の法則

✬

✫

✩

✪ 独立で同一の分布に従う確率変数_X₁_{, X}₂_{, . . ., X}_n について，

■ 平均：E_[X_i] = µ（i = 1 ∼ n）

■ 標本平均_{X =}¯ ¹

n

∑n

i=1^Xⁱ ^{について，}

■ 十分大きなn について考えると，ある意味で ¯X が真の平均 E[X] = µ に収束することを示すことができる．

■ その収束の概念を確率収束という

■ 大数の法則：標本平均が真の平均に確率収束することを保証する定理（ ¯X が µ 知る手がかりとなっている）

定理0.1 (大数の法則) 独立で同一な分布に従う確率変数 X1, X2, . . . , Xn^（全てのi について E[Xi] = µ， V_[X_i_{] = σ}²）について，標本平均を以下のように定義する

X =¯ ¹ n

∑n i=1

Xi

このとき，十分大きなn に対しては，どのような正数 ϵ をとっても

n→∞lim ^{Pr[ | ¯}X − µ| ≥ ϵ ] = 0

となることを示すことができる．つまりX が真の平均 µ から乖離してしまう確率は，n が十分大きいと^¯ きには０になる．このとき， ¯X は µ に確率収束するといい，

plim_n→∞X = µ あるいは， ¯^¯ X _{−→ µ}^p と表記する．

重要どんな確率分布に従うものであれ，いわゆる算術平均の形をしている確率変数の加重和_{X を定義する}¯

◆ X は，その真の平均（µ = E[X^¯ 1] = E[X2] = · · · = E[Xn] = · · · ）に関する情報を持っている

◆ 特にn が十分大きいときには真の平均の非常に良い近似になっている，

というのが大数法則の主張である．証明は，Chebyshev の不等式を用いて確認できる．

■ Chebyshev の不等式：確率変数 Y の平均・分散が E[Y ], V[Y ] で与えられるとき，任意の正数 ϵ について，次の関係が成立する．

Pr[|Y − E[Y ]| ≥ ϵ] ≤^V_ϵ^{[Y ]}₂

■ E_{[ ¯}X] = µ, V[ ¯X] = σ²/n であることを利用すると， Pr[| ¯X − µ| ≥ ϵ] ≤ ^σ

2

ϵ²_{· n}

n→∞−→ 0

となって，最左辺の確率（ ¯X と µ の乖離が ϵ 以上となる確率）が，標本が大きくなるにつれて０へ近づくことが分かる．不等式を少し入れ替えると，

Pr[| ¯X − µ| ≤ ϵ] ≥ 1 − ^σ

2

ϵ²_{· n}

n→∞−→ 1

となって，どんなϵ をとっても，確率１で µ と ¯X の乖離がそれよりも小さくなることもわかる．

(4)

統計学第

₇

週

_{– 4 / 27}

大数の法則

■ 例：テレビ観覧者にある番組を見たかどうかを問う調査．

◆ 本当はp ％の視聴率：全員を調べないと真の値は不明．

◆ 無作為にn 人を抽出する行為を考える．

■ 無作為に抜き出す：１人目を抜き出すときの回答＝見ている確率はp，見ていない確率は 1 − p

■ （その人を元に戻して）次の人を抜き出すときも同じ確率のはずである．

■ 各人の回答を確率変数_X_i（0 ≤ i ≤ n）で表現

■ 確率変数_X_iは，見ているとき_X_i= 1，見ていないとき Xi= 0 （Xi^{は成功確率が}p のベルヌーイ分布に従う）

■ _Y_n ₌^∑ⁿ_i=1_X_i は二項分布に従う．

◆ _Y_nの平均は_{n · p：（E[Y}_n_{] = np）}

◆ _X^¯_n ₌ ¹

n^Yⁿ⁼ 1 n

∑n

i=1^Xⁱ^{とする：E}^{[ ¯}^Xⁿ^{] = p）}

◆ また_X¯_nの分散（二項分布の性質）：V_{[ ¯}_X_n] = p(1 − p)/n．調査結果を表現する確率変数_X₁_{, X}₂, . . . , Xn^{について，}

X¯n= ¹ n

∑n i=1

Xi

とおくと大数の法則から

n→∞lim ^Pr

[| ¯^Xn− p | ≥ ϵ^]^{= 0}

となり， ¯_X_nは真の視聴率p に確率収束する（十分大きな調査結果を基にした「平均」 ¯Xn^{は，真の視聴率}

p を推測する良い材料）．

統計学第

₇

週

_{– 5 / 27}

中心極限定理 _{6 / 27}

中心極限定理

■ 正規分布に従う確率変数の標本平均を基準化：正規分布

■ 元の確率変数が正規分布には従っていない：基準化された確率変数は厳密には正規分布には従わない

■ ある条件の下では標準正規分布で近似できることがある，

■ それを保証しているのが中心極限定理である．

統計学第

₇

週

_{– 7 / 27}

(5)

中心極限定理

定理0.2 (中心極限定理) ^■ ^確率変数X1, X2, . . . , Xn は独立で同一の分布にしたがう，

■ 平均：E_[X_i] = µ，分散：V[Xi] = σ²

■ _X₁_{, X}₂, . . . , Xn ^{の標本平均}X を用いて，^¯ ^a，以下の確率変数を定義 Zn_≡

X − µ¯

√σ²/n

■ 十分大きな_{n に対して，Z}_nは標準正規分布に従う確率変数Z に収束する．これを Zn

−→ Z ∼ N(0, 1)D

と表記する．

■ 十分大きな_{n に対して，Z}_nの従う分布は，標準正規分布で近似できる

a

標本平均は

¯ X ₌ ¹

n

∑

i₌₁

X_i

とあたえられる．

統計学第

₇

週

_{– 8 / 27}

二項分布の正規近似 _{9 / 27}

二項分布の正規近似

■ n 個の独立な確率変数 {Xⁱ}ⁿi=1^{について，各}^Xⁱ^が確率p で１の値をとり，1 − p で０の値をとる

■ _Y_n₌^∑ⁿ_i=1_X_i：これは二項分布に従う Yn_{∼ Bi(n, p)}

■ _Y_nの平均と分散は以下の通り． E_[Y_n] = np, V[Yn] = np(1 − p)

■ 標本平均_X¯_n： X¯n= ¹

n^Yⁿ⁼ 1 n

∑n i=1

Xi

統計学第

₇

週

_{– 10 / 27}

(6)

二項分布の正規近似

■ _X^¯_n の平均・分散は以下のようになる． E_{[ ¯}_X_n] = p, V[ ¯Xn] = ^{p(1 − p)}

n

■ X を基準化した確率変数 Z^¯ n

Zn_≡

X¯n− p

√p(1 − p)/n⁼

Yn− np

√np(1 − p)

■ 中心極限定理を適用すると_Z_n が近似的に（十分大きなn については）標準正規分布に従う Zn_≡

Yn− np

√np(1 − p)

−→ Z ∼ N(0, 1)D ··· ^⃝¹

統計学第

₇

週

_{– 11 / 27}

二項分布の正規近似

■ この結果から，二項分布に関する計算が簡略化されることがある

■ 二項分布に従う確率変数_Y_nがある区間で実現する確率を考える．

■ _{Pr[a ≤ Y}_n≤ b] において，a，b の値によっては大変

Pr[a ≤ Yⁿ≤ b] =

∑b k=a

nCkp^k_{(1 − p)}^n−k

■ 中心極限定理を用いると（Z を標準正規分布に従う確率変数として） Pr[a ≤ Yn≤ b] = Pr

[ a − np

√np(1 − p) ^≤

Yn− np

√np(1 − p) ^≤

b − np

√np(1 − p) ]

≈ Pr

[ a − np

√np(1 − p) ^{≤ Z ≤}

b − np

√np(1 − p) ]

となるので標準正規分布の数値表で（近似的に）計算可能となる．

■ 例題：打率３割という実績を持つ打者が，今後500 打席で 175 本以上安打を打つ確率は？

◆ 安打数をY とすると，Y ∼ Bi(500, 0.3) なので，求める確率は Pr[Y ≥ 175] となる．

◆ 中心極限定理から以下の近似が成り立つ Z = Y − 500 · 0.3

√0.3 · 0.7 · 500 ^{∼ N(0, 1)}

このとき，

Pr[Y ≥ 175] = Pr[ Y − 500 · 0.3

√0.3 · 0.7 · 500 ^≥

175 − 500 · 0.3

√0.3 · 0.7 · 500 ]

≈ Pr[Z ≥ 2.44] = 0.5 − 0.4927

■ 練習問題３：ある番組の真の視聴率が12 ％であったとする．1000 人について，その番組の視聴率調査をして，調査結果が10 ％から 15 ％となる確率を求めてください．また，真の視聴率が 8 ％であるとすると同じ確率はいくらになりますか．

統計学第

₇

週

_{– 12 / 27}

(7)

応用問題：視聴率調査

■ テレビ番組の視聴率調査を行う

■ 非常に高い（例えば９５％）確率で，調査結果の誤差が±1 ％（±0.01）以内に収まるようにしたい．

■ 全員に聞けば，正確になるが，費用も膨大になる

■ どの程度の人数に対して調査すれば，上のような精度を達成できるか？

誤差を±0.01 以内に抑える確率が 0.95 以上となることは，| ¯^Xn− p | ≤ 0.01 となる確率が 0.95 以上になることに他ならない．つまり

Pr^[_{| ¯}Xn− p| ≤ 0.01^]≥ 0.95

ところで中心極限定理より Zn=_√^X^¯ⁿ^{− p}

p(1 − p)/n

−→ Z ∼ N(0, 1)D

となって_Z_nが近似的に正規分布に従うことがわかる．この_Z_n_{= ( ¯}_X_n_{− p)/}

√p(1 − p)/n) について，

Pr^[_{| ¯}Xn− p| ≤ 0.01^]≥ 0.95 ⇔ Pr [

X¯n− p

√p(1 − p)/n

< _√ ^0.01 p(1 − p)/n

]

≥ 0.95 ··· ⃝²

という関係がなりたつ．p(1 − p) ≤ 1/4 = 0.25 となることを考慮すると，

Pr [

X¯n_{− p}

√p(1 − p)/n

< _√ ^0.01 p(1 − p)/n

]

≥ Pr [

X¯n_{− p}

√p(1 − p)/n

<_√^0.01 0.25/n

]

= Pr [

X¯n_{− p}

√p(1 − p)/n

< 0.02^√n ]

··· ^⃝³ となることに注意しておく．一方，正規分布の数値表より，_{ϵ に関して}

Pr [

X¯n− p

√p(1 − p)/n

< ϵ ]

= 0.95 =⇒ ϵ = 1.96

という結果になるので_0.02

√n = 1.96（あるいは 0.02^√n ≥ 1.96）という関係を満たすような n を見つけると

（₂）式を満たす．つまり

0.02^√n = 1.96 ⇔ n = ^1.96

2

0.02² ^{= 98}

2_{= 9604}

（あるいは_0.02

√n ≥ 1.96 ⇔ n ≥ 9604）となるように n を定めればよい．結果として１％以内の誤差で抑えるためにはn ≥ 9604 が必要であることが分かる．

■ 練習問題４：以下の結果を確認してください

◆ 誤差を±5 ％以内に抑えることができる確率が 0.95 となるためには n ≥ 384.16 が必要

◆ 誤差を±0.5 ％以内に抑えることができる確率が 0.95 となるためには n ≥ 38416 が必要

◆ 誤差を±2 ％以内に抑えることができる確率が 0.95 となるためには n ≥ 2401 が必要

◆ 誤差を±2 ％以内に抑えることができる確率が 0.99 となるためには n > 4160 が必要

統計学第

₇

週

_{– 13 / 27}

(8)

積率母関数・変数変換 ₍ 以下の内容は試験範囲外 ₎ _{14 / 27}

積率母関数

■ 積率母関数：

mX(θ) = E[e^θX]

◆ 積率母関数は，分布関数（密度関数）と一対一対応

◆ 二つの確率変数が同じ積率母関数を持つとき，それらは同じ分布に従う

◆ 積率母関数は存在しないこともある．類似する性質を持つ関数に特性関数と呼ばれるものがあり， E_[e^i·θX] と定義される（i は i²= −1 を満たす虚数）．この関数は常に存在し，積率母関数が存在するとき，θ を i · θ で置き換えたものと一致する．

■ 積率母関数とモーメント： d^kmX(0)

dθ^k ^{= E[X}

k_]

■ いくつかの例

◆ 正規分布

ϕ(x) = √ ¹ 2πσ²^exp

{

−^{(x − µ)}

2

2σ² }

mX(θ) = ^E[e^θX] =

∫ _∞

−∞

e^θx_√ ¹ 2πσ²^exp

{

−^{(x − µ)}

2

2σ² }

dx

=

∫ _∞

−∞

√ 1

2πσ²^exp {

−^x

2_{− 2(µ + θσ}2_{)x + µ}2

2σ²

} dx

=

∫ _∞

−∞

√ 1

2πσ²^exp {

−{x − (µ + θσ²)}² 2σ²

}

dx · exp^{{ (µ + θσ}

2₎2_{− µ}2

2σ²

}

= exp {

µθ +^θ

2_σ2

2 }

dmX(θ)

dθ ⁼ ^{(µ + θσ}

2_{) · exp}

{

µ · θ +^θ

2_{· σ}2

2 }

, ^dm^X⁽⁰⁾ dθ ^{= µ,}

d²mX(0) dθ² ^{= µ}

2_{+ σ}2

◆ カイ二乗分布

mX(θ) = (1 − 2θ)^−k/2, θ < 1/2

◆ 指数分布（_{f (x) = λe}^−λx） mX(θ) = ^λ

λ − θ

◆ 一様分布（f (x) = 1/(b − a) for x ∈ [a, b] それ以外では０）

mX(θ) = ^e

θ·b_{− e}θ·a

(b − a)θ

◆ 二項分布

mX(θ) = (1 − p + p · e^θ⁾ⁿ

◆ ポアソン分布

mX(θ) = exp^{_{λ · (e}^θ_{− 1)}^}

統計学第

₇

週

_{– 15 / 27}

(9)

一変数確率変数の変数変換

■ 確率変数Y を他の確率変数 X を用いて，Y = g(X) と定義する．

◆ （連続型）確率変数_{X：密度関数 f}_X_(x)

◆ 変数変換：（連続）関数g(•) によって Y = g(X)

◆ 確率変数Y の密度関数はどのようになるか．

■ 分布関数と密度関数の間の関係（_F_X_{(x) =}

∫x

−∞^f^X(t)dt より下の関係は明らか） fX(x) = ^dF^X^(x)

dx

■ 関数g(•) が単調関数の時（逆関数 g⁻¹(•) も単調関数），Y の分布関数および密度関数は， FY(y) = Pr[Y ≤ y] = Pr[X ≤ g⁻¹^{(y)] = F}X

(g⁻¹(y)⁾ fY(y) = ^dF^X

(g⁻¹(y)⁾ dy ^{= f}^X

(g⁻¹(y)⁾_·^dg⁻¹^(y)

dy ··· ^⃝⁴ ただし，ここでは単調増加を想定して計算しているが，単調減少でも同様に計算可能．

◆ 線形変換Y = g(X) = a + bX を考えると，g⁻¹(y) = ^y−a_b , ^dg⁻¹_dy^(y)= 1/b より

fY(y) = fX^{( y − a}

b )

· (1/b)

◆ それ自身の分布関数を用いた変数変換を行うと，一様分布に従う確率変数となる：_{U = F}_X_(X) FU(u) = Pr[U ≤ u] = Pr[X ≤ FX⁻¹^{(u)] = F}^X

(F_X⁻¹(u)⁾= u

ただし，u ≤ 0 のとき Pr[U ≤ y] = 0 であり，u ≥ 1 のとき Pr[U ≤ y] = 1 となるので， FU(u) は一様分布に従う確率変数の分布関数である．

統計学第

₇

週

_{– 16 / 27}

二変数（以上の）確率変数の変数変換

■ 二変数の場合の変数変換：(X, Y ) 7→ (U, V ) u = g(x, y)

v = h(x, y)

このとき，逆に戻す変換を考えると以下の通り， x = ϕ(u, v)

y = ψ(u, v)

■ 変数変換のヤコビアン：次のような行列とその行列式の絶対値を考える．

∆(u, v) = ( _∂φ

∂u

∂φ

∂ψ ∂v

∂u

∂ψ

∂v

)

, ; |∆(u, v)| =

∂ϕ

∂u

∂ψ

∂v ⁻

∂ϕ

∂v

∂ψ

∂u

■ 二変数確率変数(U, V ) の同時密度関数は，

fU V(u, v) = fXY(ϕ(u, v), ψ(u, v)) · |∆(u, v)| ··· ^⃝⁵ と書くことができる

統計学第

₇

週

_{– 17 / 27}

(10)

和の分布，比の分布

■ 二変数(X, Y ) の同時密度関数： fXY(x, y)

■ 和の分布：U = X + Y について考える． u = x + y

v = y とおくと

x = _{u − v} y = v

となり，ヤコビアンは，

|∆(u, v)| =

( ∂φ

∂u

∂φ

∂ψ ∂v

∂u

∂ψ

∂v

) ⁼

( 1 −1 0 1

) ^{= 1}

したがって

fU V(u, v) = fXY_{(u − v, v)}

和の確率変数の密度関数は，U に関する周辺密度なので fU(u) =

∫ _∞

−∞

fXY(u − v, v)dv ··· ⃝⁶

◆ カイ二乗分布に従う二つの確率変数の和もまたカイ二乗分布に従うことを導くために用いる

◆ 実際の導出は，積率母関数を用いたほうが簡単．

■ 比の分布：U = X/Y について考える． u = x/y

v = y ここから

x = uv y = v

となり，ヤコビアンは，

|∆(u, v)| =

( _∂φ

∂u

∂φ

∂ψ ∂v

∂u

∂ψ

∂v

) ⁼

( v u 0 1

) ^{= |v|}

したがって

fU V(u, v) = |v| · f^XY^{(uv, v)}

和の確率変数の密度関数は，U に関する周辺密度なので fU(u) =

∫ _∞

−∞

|v| · fXY(uv, v)dv ··· ⃝⁷

◆ 「正規分布に従う確率変数」と「カイ二乗分布に従う確率変数の平方根」の比がｔ分布に従うことを導くために用いる

◆ カイ二乗分布に従う二つの確率変数の比がF 分布に従うことを導くために用いる

統計学第

₇

週

_{– 18 / 27}

(11)

カイ二乗分布，ｔ分布，Ｆ分布，コーシー分布 ₍ 以下の内容は試験範囲外 _{)19 /}

27

正規分布とカイ二乗分布

■ 標準正規分布（平均０，分散１）に従う確率変数X について，Y = X²^{の密度関数を求める}

■ Y の分布関数から導出する

FY(y) = Pr[Y ≤ y] = Pr[−^√y ≤ X ≤^√^{y] =}

∫ √y

−^√y

√1 2π^exp

{

−^x

2

2 }

dx

= 2

∫ √y 0

√1 2π^exp

{

−^x

2

2 }

dx fY(y) = √¹

2π^{· exp} {

−^y₂^}· y^−1/2

= ¹

2 · Γ(1/2)^· ( y

2 )1/2−1

· exp^{−^y₂^}^{, y > 0} ··· ^⃝⁸

この(8) 式は，以下の密度関数において k = 1 とした特殊ケースである fY(y; k) = ¹

2 · Γ(k/2) ^· ( y

2 )k/2−1

· exp^{−^y 2

}, y > 0 ··· ⃝⁹

このパラメータk は，のちに見る正規分布との関係から「自由度」と呼ばれるパラメータであり，(9) 式は「自由度ｋのカイ二乗分布」と呼ばれる確率変数の密度関数である．

■ 標準正規分布に従う確率変数を二乗したものは，自由度１のカイ二乗分布に従う．

■ 分布の再生性：同じ分布に従う確率変数の和が，元の分布と同一の確率分布に従う．

◆ 正規分布：

■ 正規分布に従う確率変数_X_i_{∼ N(µ}_i_{, σ}²_i_{) の積率母関数は} mi(θ) = exp

{

µi· θ +^σ

i2

2 ^{· θ}

2

}

■ _X₁ と_X₂ が独立であるとき，和_X₁_{+ X}₂の積率母関数は E_[e^θ·(X¹^+X²⁾_{] = E[e}^θ·X¹_{] · E[e}^θ·X²_{] = exp}

{

(µ1+ µ2_{) · θ +}

σ²₁+ σ₂² 2 ^{· θ}

2

}

■ つまり_X₁_{+ X}₂の積率母関数は，平均_µ₁_{+ µ}₂，分散_σ²₁_{+ σ}²₂の正規分布の積率母関数．

◆ カイ二乗分布

■ 自由度k のカイ二乗分布に従う確率変数の積率母関数： mX(θ) = (1 − 2θ)^−k/2, θ < 1/2

■ 自由度_k₁のカイ二乗分布に従う確率変数と自由度_k₂のそれが独立であるとき，和の分布は自由度_k₁_{+ k}₂のカイ二乗分布となる

mX(θ) = (1 − 2θ)^−(k¹^+k²^)/2, θ < 1/2

■ 独立な標準正規分布に従う_{k 個の確率変数 X}₁_{, X}₂, . . . , Xk について，それぞれを二乗したものはそれぞれ独立に自由度１のカイ二乗分布に従い，それらの和は自由度k のカイ二乗分布に従う

X₁²+ X₂²+ · · · + Xk²∼ χ²^(k) ··· ^⃝¹⁰

統計学第

₇

週

_{– 20 / 27}

(12)

ｔ分布：正規分布とカイ二乗分布

■ 標準正規分布に従う確率変数X と自由度 m のカイ二乗分布に従う確率変数 Y を用いて，次の確率変数 T を定義する

T =_√^X Y /m

■ このT の従う確率分布は，自由度 m のｔ分布と呼ばれるもので以下の密度関数を持つ

fT(t; m) = _√ ¹

m · B(m/2, 1/2) (

1 + ^x

2

m

)−(m+1)/2

導出は以下の通り．

◆ Y = y で固定したとき，T の（Y = y とする条件付）分布は， T | Y = y = √^X

y/m ^{∼ N(0, 1/}

√y/m)

条件付密度関数は fT(x|y) = √ ¹

2π/(y/m)^exp {

− ^x

2

2/(y/m) }

◆ 一方，Y は自由度 m のカイ二乗分布に従うので，その周辺密度は (9) の k を m で置き換えたものである

◆ したがって，_{T の周辺密度は} fT(t) =

∫ _∞

0

fT(x|y) × fY(y)dy

=

∫ _∞

0

1

√2π/(y/m)^exp {

− ^x

2

2/(y/m) }

× ¹

2 · Γ(m/2) ^· ( y

2 )m/2−1

· exp^{−^y₂^}

| {z }

自由度m のカイ二乗分布の密度関数 dy

=

∫ _∞

0

( y 2

)1/2 ₁

√m · Γ(1/2)^exp {

−^{y · x}

2

2m }

× ¹

2 · Γ(m/2)^· ( y

2 )_m/2−1

· exp^{−^y₂^}^dy

=

∫ _∞

0

1

2^√m · Γ(1/2) · Γ(m/2) ^{· exp} {

− (

1 +^x

2

m )

·^y₂^{} ( y}₂⁾^(m+1)/2−1^dy

= (

1 + ^x_m²⁾−(m+1)/2+1−1

√m · B(m/2, 1/2) ^×

∫ _∞

0

1

2Γ((m + 1)/2)^{· exp}

{−^z₂^{} ( z}₂⁾^(m+1)/2−1

| {z }

自由度m + 1 のカイ二乗分布の密度関数 dz

ただし最後の等号には，以下の変数変換を用いている． z ≡

( 1 +^x

2

m )

· y → dy = (

1 +^x

2

m )−1

· dz.

統計学第

₇

週

_{– 21 / 27}

(13)

ガンマ関数，ベータ関数， Stirling の公式

■ ガンマ関数の定義 Γ(x) =

∫ _∞

0

t^x−1e^−tdt, x > 0.

◆ _{Γ(1/2) =}^√π, Γ(1) = 1

◆ Γ(n + 1) = n · Γ(n)

◆ 自然数n について，Γ(n) = (n − 1)!

■ ベータ関数：_{B(x, y) =}

∫1

0 ^t^x−1^{(1 − t)}^y−1^dt

◆ ベータ関数とガンマ関数_: B(x, y) = ^Γ(x)Γ(y) Γ(x + y)

■ Stirling の公式

◆ 十分大きな実数x（十分大きな自然数 n）について， Γ(x + 1) ≈^√2π · x ·^{( x}_e⁾

x

=^√_{2π · x}^x+1/2_{· e}^−x_{, n! ≈}^√_{2π · n}^n+1/2_{· e}⁻ⁿ ··· ^⃝¹¹

■ n を自然数とすると次の結果が成り立つ^a

n→∞lim

n^n+1/2_{· e}⁻ⁿ

n! ⁼

√1

2π ··· ⃝¹² (

1 +√^z n

)n−1

e^√^n·z = e^−z²^/2 ··· ^⃝¹³

■ またベータ関数に関して，

√m · B(m/2, 1/2)^m→∞−→ ^√^2π ··· ⃝¹⁴

◆ Stairling の公式を用いて示すことができるが，非常に長い説明が必要なので省略．

a

前者の証明にはスターリングの公式を用いる．後者はlog(1 + z) ≈ z −^z₂² という二次までのマクローリン展開を考えてると1 + z ≈ exp{z −¹₂^z²^}^{となるので，}

( 1 +_√^z

n )ⁿ−1

e⁻^√ⁿ^·^z ₌ (

1 +_√^z n

)−1( 1 +_√^z

n )ⁿ

· e⁻

√_n

·^z

≈ (

1 +_√^z n

)−1

exp {

n · ( _z

√_{n −}¹₂ z²

n )}

· e⁻

√_n

·^z

= (

1 +_√^z n

)−1

exp {

− z²

2 }

≈ exp {

− z²

2 }

.

統計学第

₇

週

_{– 22 / 27}

ｔ分布：正規分布への収束

■ ｔ分布は自由度が大きいとき，標準正規分布へ収束する．自由度m のｔ分布の密度関数についてみると fT(t; m) = √ ¹

m · B(m/2, 1/2) (

1 + ^t

2

m

)−(m+1)/2

= _√ ¹

m · B(m/2, 1/2) {(

1 + ^t

2_/2

m/2

)m/2^}⁻¹

· (

1 + ^t

2

m )−1/2

m/2→∞

−→ √¹ 2π

{e^t²^/2^}⁻¹_{· 1 =} _√¹ 2π^e

−t²^/2

7 – 23 / 27

(14)

コーシー分布，ｔ分布：モーメントの不在

■ コーシー（_{Cauthy）分布} fC(x) = ¹

π · (1 + x²⁾

■ ｔ分布において自由度が１のとき（m = 1），コーシー分布と一致する

fT(t; 1) = √ ¹ 1 · B(1/2, 1/2)

( 1 + ^t

2

1

)−(1+1)/2

= √ ¹ 1 ·^√π ·^√^π/1

1 1 + t² ⁼

1 π · (1 + t²⁾

■ コーシー分布の平均・分散は存在しない（発散する）

◆ ｔ分布も自由度が小さいときは平均も分散も存在しない．自由度が2 (m > 1) なら平均だけ存在．3 以上(m > 2) なら分散も存在する．

統計学第

₇

週

_{– 24 / 27}

F 分布：カイ自二乗分布同士の比

■ 自由度n のカイ二乗分布に従う確率変数 X と自由度 m のカイ二乗分布に従う確率変数 Y について考え，両者が独立であるとき，次の確率変数F の従う確率変数は，自由度 (n, m) のＦ分布と呼ばれる．

F = ^X/n Y /m

■ _{F の密度関数は，} fF(x) = ^n/m

B(n/2, m/2) ( n

m^{· x} )n/2−1

·⁽^{1 +} _mⁿ · x⁾^−(n+m)/2^{x > 0.}

導出には長い計算が必要になるが，ガンマ分布に従う確率変数の性質を用いると見通しよく計算できる．

■ Ｆ分布の性質

◆ _{Y /m}^X/n が自由度(n, m) のＦ分布に従うとき，^{Y /m}_X/n ^が自由度(m, n) のＦ分布に従う

◆ 自由度(n, m) のＦ分布において，n = 1 のとき，自由度 m のｔ分布に従う確率変数を二乗した確率変数の密度関数となる

◆ ｔ分布の性質を引き継いで，分母の自由度m が小さいときには平均も分散も存在しない．ただし，自由度の範囲は少し異なり，分母の自由度が３以上(m > 2) なら自由度 (n, m) のＦ分布平均だけ存在，５以上(m > 4) なら分散も存在する．

統計学第

₇

週

_{– 25 / 27}

(15)

中心極限定理再論

■ 平均１の指数分布に従う大きさn の標本を考える：{X¹^{, X}², . . . , Xn_}

■ 各 _X_i （独立・同一分布に）が従う確率分布の密度関数，分布関数は f (x) = e^−x, F (x) = 1 − e^−x^, x ≥ 0

■ Sn =^∑ⁿ_i=1Xi ^{の平均，分散は，}

◆ E_[X_i_{] =}^∫^∞

0 ^xe^−xdx = 1, V[Xi] =^∫₀^∞_{(x − 1)}²e^−xdx = 1 （第３週の問題参照）より E_[S_n_{] =}

∑n i=1

E_[X_i_{] = n, V[S}_n_{] =}

∑n i=1

V_[X_i] = n, E[ ¯Xn] = ¹ n

∑n i=1

E_[X_i] = 1, V[ ¯Xn] =

∑n i=1

1

n²^V^[Xⁱ^{] =} 1 n

◆ 基準化(平均を引いて，標準偏差で割る) Zn =^Sⁿ√^{− n}

n

−→ N(0, 1) :d ^{中心極限定理}

この結果を，確率変数の和に関する分布を求めることによって確認する．

■ _S_n の密度関数を求め，それを利用して_Z_n の密度関数を求める．その結果が

fZn(z) = ⁿ

n+1/2_{· e}_−n

n! (

1 +_√^z n

)n−1

e⁻^√^n·z _{(z ≥ −}^√n), = 0 (z <^√n),

となることを示す．

◆ _S_nの密度関数が以下のようになることは，数学的帰納法により証明される（ポアソン分布！）． fn(z) = ^zⁿ⁻¹^{· e}^−z

(n − 1)!

◆ _S_n₌^∑ⁿ_i=1_X_i_{= S}_n−1_{+ X}_n となり，第一項の密度関数を_f_n−1(z) と書けば, Sn^{の密度関数は}

fn(z) =

∫ _∞

0

f_n−1(x) · f(z − x)dx =

∫ z 0

f_n−1(x) · f(z − x)dx = e^−z·

∫ z 0

f_n−1_{(x) · e}^xdx

f_n−1(z) = ^zⁿ⁻²_(n−2)^·e^−z ^{なら，上式の積分から}fn(z) = ^zⁿ⁻¹_(n−1)!^·e^−z ^となる．

◆ 基準化された_Z_nの密度関数は，_Z_n_{= n}^−1/2_{· S}_n_{− n}^1/2 _(S_n_{= n}^1/2_{· Z}_n_{+ n) なので，Z}_n _{≥ −n}^1/2 に注意しながら，

fZn(z) = n^1/2_{· f}n(n^1/2· z + n) = n^1/2·⁽ⁿ

1/2_{· z + n)}_n−1_{· e}_−(n^1/2_·z+n)

(n − 1)!

= ⁿ

n+1/2_e_−n

| n!{z }

(₁₂_):→1/^√2π

· (

1 + √^z n

)n−1

· e⁻ⁿ^1/2^·z

| {z }

(13):→e^{−z2 /2}

n→∞−→ √¹ 2π^e

−z²^/2

■ 以上の結果は，基準化された統計量についての中心極限定理， Zn= ^Sⁿ_√^{− n}

n ⁼

X¯n− 1 1/^√n ⁼

√n( ¯Xn− 1)−→ N(0, 1) :^d ^{中心極限定理}

この結果を，確率変数の和に関する分布を直接求めることによって確認した．

統計学第

₇

週

_{– 26 / 27}

(16)

演習問題

1. ^線形変換Y = a + bX（b > 0）を考え，X が一様分布，正規分布に従う場合の Y の密度関数を求めてください．

2. ^確率変数X が標準正規分布に従うとき，|X| の密度関数を求めてください．

3. U が区間 [0, 1] で一様分布に従うとき，Y = −_λ¹log(1 − U) の密度関数を求めてください．

4. 互いに独立に標準正規分布に従う二つの確率変数X と Y について，W = X/Y と置いた確率変数はコーシー分布に従うことを示してください．

5. 互いに独立にコーシー分布に従う確率変数X と Y について，V = (X + Y )/2 も同じコーシー分布に従うことを示してください．

6. n 個の確率変数 X1, X2, . . . , Xn が独立で同一の分布に従っており，その分布関数がF (x) で与えられ，密度関数がf (x) で与えられているとする．このとき，n 個の中の最も大きい確率変数の密度関数を求めてください．また最も小さい確率変数び密度関数を求めてください（順序統計量）．

◆ 一番大きい確率変数（上から一位なので_X₍₁₎ としておく）の従う確率分布は，ある点_{x を X}₍₁₎ が超えないとき，すべての確率変数_X₁_{, X}₂, . . . , Xn^がそのx よりも同時に超えない，という事柄を確率として表現すればよい．分布関数と密度関数の対応関係を用いて密度関数も求められる．

◆ 一番小さい確率変数（上から_{n 位なので X}_(n) としておく）の従う確率分布は，ある点_{x を X}_(n)が超えるとき，すべての確率変数_X₁_{, X}₂, . . . , Xn^がそのx を同時に超える，という事柄を確率として表現すればよい．

今回の演習問題は，これまでに比べて若干難しいかもしれませんが，それぞれの問題に重要な意味がありますのでチャレンジしてみてください．

統計学第

₇

週

資料置き場 hustat2017 20171117hand

統計学（第 7 週）大数法則，中心極限定理

高木 真吾

北海道大学

URL: http://sites.google.com/site/hustat2017/

質問等は担当者（ [email protected]) までご連絡ください

November 17, 2017

. . . 2

3

. . . 4

6

. . . 7

9

. . . 10

14

. . . 15

. . . 16

. . . 17

19

. . . 20

. . . 21

. . . 22

. . . 23

. . . 24

. . . 25

. . . 26

. . . 27

まとめ（非常に重要）

7

– 2 / 27

大数の法則 3 / 27

大数の法則

7

– 4 / 27

大数の法則

7

– 5 / 27

中心極限定理 6 / 27

中心極限定理

7

– 7 / 27

中心極限定理

7

– 8 / 27

二項分布の正規近似 9 / 27

二項分布の正規近似

7

– 10 / 27

二項分布の正規近似

7

– 11 / 27

二項分布の正規近似

7

– 12 / 27

応用問題：視聴率調査

7

– 13 / 27

積率母関数・変数変換 ( 以下の内容は試験範囲外 ) 14 / 27

積率母関数

7

– 15 / 27

一変数確率変数の変数変換

7

– 16 / 27

二変数（以上の）確率変数の変数変換

7

– 17 / 27

和の分布，比の分布

7

– 18 / 27

カイ二乗分布，ｔ分布，Ｆ分布，コーシー分布 ( 以下の内容は試験範囲外 )19 /

27

正規分布とカイ二乗分布

7

– 20 / 27

ｔ分布：正規分布とカイ二乗分布

7

– 21 / 27

ガンマ関数，ベータ関数， Stirling の公式

7

統計学（第 ₇ 週）大数法則，中心極限定理

高木真吾

₃

₆

₉

₁₄

₁₉

₇

_{– 2 / 27}

大数の法則 _{3 / 27}

₇

_{– 4 / 27}

₇

_{– 5 / 27}

中心極限定理 _{6 / 27}

₇

_{– 7 / 27}

₇

_{– 8 / 27}

二項分布の正規近似 _{9 / 27}

₇

_{– 10 / 27}

₇

_{– 11 / 27}

₇

_{– 12 / 27}

₇

_{– 13 / 27}

積率母関数・変数変換 ₍ 以下の内容は試験範囲外 ₎ _{14 / 27}

₇

_{– 15 / 27}

₇

_{– 16 / 27}

₇

_{– 17 / 27}

₇

_{– 18 / 27}

カイ二乗分布，ｔ分布，Ｆ分布，コーシー分布 ₍ 以下の内容は試験範囲外 _{)19 /}

₇

_{– 20 / 27}

₇

_{– 21 / 27}

₇

_{– 22 / 27}

₇

_{– 24 / 27}

₇

_{– 25 / 27}

₇

_{– 26 / 27}

₇

_{– 27 / 27}