統計学(第 7 週)大数法則,中心極限定理
高木 真吾
北海道大学
URL: http://sites.google.com/site/hustat2017/
質問等は担当者( [email protected]) までご連絡ください
November 17, 2017
まとめ(非常に重要)
. . . 2
大数の法則
3
大数の法則. . . 4
中心極限定理
6
中心極限定理. . . 7
二項分布の正規近似
9
二項分布の正規近似. . . 10
積率母関数・変数変換 (以下の内容は試験範囲外)
14
積率母関数. . . 15
一変数確率変数の変数変換
. . . 16
二変数(以上の)確率変数の変数変換
. . . 17
カイ二乗分布,t分布,F分布,コーシー分布 (以下の内容は試験範囲外)
19
正規分布とカイ二乗分布. . . 20
t分布:正規分布とカイ二乗分布
. . . 21
ガンマ関数,ベータ関数,Stirling の公式
. . . 22
t分布:正規分布への収束
. . . 23
コーシー分布,t分布:モーメントの不在
. . . 24
F分布:カイ自二乗分布同士の比
. . . 25
中心極限定理再論
. . . 26
演習問題
. . . 27
まとめ(非常に重要)
二つの確率変数X1, X2を用いて,Y = β0+ β1· X1+ β2· X2 とする.
■ 平均
E[Y ] = β0+ β1· E[X1] + β2· E[X2]
■ 分散
V[Y ] = β12· V[X1] + β22· V[X2] + 2β1β2· cov(X1, X2)
■ 二つの確率変数X1, X2が独立であるとき, V[Y ] = β12· V[X1] + β22· V[X2]
一般に確率変数がn個の場合でも,上の結果は成立する
n個の確率変数{X1, X2, . . . , Xn} を用いて,以下の Y を定める. Y = β0+
∑n i=1
βi· Xi
■ 平均
E[Y ] = β0+
∑n i=1
βi· E[Xi]
■ 分散
V[Y ] =
∑n i=1
βi2· V[Xi] + 2
n−1∑
i=1
∑n j=i+1
βiβj· cov(Xi, Xj)
■ n個の確率変数X1, X2, . . . , Xnが互いに独立であるとき,
V[Y ] =
∑n i=1
βi2V[Xi]
以上の結果はすべて離散型確率変数についても,連続型確率変数についても成り立つ
■ 確率変数の基準化(平均を0,分散を1に変換):以下の結果は期待値演算の性質から明らか Z = X − E[X]√
V[X] ,
E[Z] = 0, V[Z] = 1
それ自身の平均を引き,標準偏差(分散の平方根)で除した確率変数Z は,必ず平均0,分散1となる.
統計学第
7
週– 2 / 27
大数の法則 3 / 27
大数の法則
✬
✫
✩
✪ 独立で同一の分布に従う確率変数X1, X2, . . ., Xn について,
■ 平均:E[Xi] = µ(i = 1 ∼ n)
■ 標本平均X =¯ 1
n
∑n
i=1Xi について,
■ 十分大きなn について考えると,ある意味で ¯X が真の平均 E[X] = µ に収束することを示すことが できる.
■ その収束の概念を確率収束という
■ 大数の法則:標本平均が真の平均に確率収束することを保証する定理( ¯X が µ 知る手がかりとなっ ている)
定理0.1 (大数の法則) 独立で同一な分布に従う確率変数 X1, X2, . . . , Xn(全てのi について E[Xi] = µ, V[Xi] = σ2)について,標本平均を以下のように定義する
X =¯ 1 n
∑n i=1
Xi
このとき,十分大きなn に対しては,どのような正数 ϵ をとっても
n→∞lim Pr[ | ¯X − µ| ≥ ϵ ] = 0
となることを示すことができる.つまりX が真の平均 µ から乖離してしまう確率は,n が十分大きいと¯ きには0になる.このとき, ¯X は µ に確率収束するといい,
plimn→∞X = µ あるいは, ¯¯ X −→ µp と表記する.
重要 どんな確率分布に従うものであれ,いわゆる算術平均の形をしている確率変数の加重和X を定義する¯
◆ X は,その真の平均(µ = E[X¯ 1] = E[X2] = · · · = E[Xn] = · · · )に関する情報を持っている
◆ 特にn が十分大きいときには真の平均の非常に良い近似になっている,
というのが大数法則の主張である.証明は,Chebyshev の不等式を用いて確認できる.
■ Chebyshev の不等式:確率変数 Y の平均・分散が E[Y ], V[Y ] で与えられるとき,任意の正数 ϵ について, 次の関係が成立する.
Pr[|Y − E[Y ]| ≥ ϵ] ≤Vϵ[Y ]2
■ E[ ¯X] = µ, V[ ¯X] = σ2/n であることを利用すると, Pr[| ¯X − µ| ≥ ϵ] ≤ σ
2
ϵ2· n
n→∞−→ 0
となって,最左辺の確率( ¯X と µ の乖離が ϵ 以上となる確率)が,標本が大きくなるにつれて0へ近づく ことが分かる.不等式を少し入れ替えると,
Pr[| ¯X − µ| ≤ ϵ] ≥ 1 − σ
2
ϵ2· n
n→∞−→ 1
となって,どんなϵ をとっても,確率1で µ と ¯X の乖離がそれよりも小さくなることもわかる.
統計学第
7
週– 4 / 27
大数の法則
■ 例:テレビ観覧者にある番組を見たかどうかを問う調査.
◆ 本当はp %の視聴率:全員を調べないと真の値は不明.
◆ 無作為にn 人を抽出する行為を考える.
■ 無作為に抜き出す:1人目を抜き出すときの回答=見ている確率はp,見ていない確率は 1 − p
■ (その人を元に戻して)次の人を抜き出すときも同じ確率のはずである.
■ 各人の回答を確率変数Xi(0 ≤ i ≤ n)で表現
■ 確率変数Xiは,見ているときXi= 1,見ていないとき Xi= 0 (Xiは成功確率がp のベルヌー イ分布に従う)
■ Yn =∑ni=1Xi は二項分布に従う.
◆ Ynの平均はn · p:(E[Yn] = np)
◆ X¯n = 1
nYn= 1 n
∑n
i=1Xiとする:E[ ¯Xn] = p)
◆ またX¯nの分散(二項分布の性質):V[ ¯Xn] = p(1 − p)/n. 調査結果を表現する確率変数X1, X2, . . . , Xnについて,
X¯n= 1 n
∑n i=1
Xi
とおくと大数の法則から
n→∞lim Pr
[| ¯Xn− p | ≥ ϵ]= 0
となり, ¯Xnは真の視聴率p に確率収束する(十分大きな調査結果を基にした「平均」 ¯Xnは,真の視聴率
p を推測する良い材料).
統計学第
7
週– 5 / 27
中心極限定理 6 / 27
中心極限定理
■ 正規分布に従う確率変数の標本平均を基準化:正規分布
■ 元の確率変数が正規分布には従っていない:基準化された確率変数は厳密には正規分布には従わない
■ ある条件の下では標準正規分布で近似できることがある,
■ それを保証しているのが中心極限定理である.
統計学第
7
週– 7 / 27
中心極限定理
定理0.2 (中心極限定理) ■ 確率変数X1, X2, . . . , Xn は独立で同一の分布にしたがう,
■ 平均:E[Xi] = µ,分散:V[Xi] = σ2
■ X1, X2, . . . , Xn の標本平均X を用いて,¯ a,以下の確率変数を定義 Zn≡
X − µ¯
√σ2/n
■ 十分大きなn に対して,Znは標準正規分布に従う確率変数Z に収束する.これを Zn
−→ Z ∼ N(0, 1)D
と表記する.
■ 十分大きなn に対して,Znの従う分布は,標準正規分布で近似できる
a
標本平均は
¯ X = 1
n
n
∑
i=1
Xi
とあたえられる.
統計学第
7
週– 8 / 27
二項分布の正規近似 9 / 27
二項分布の正規近似
■ n 個の独立な確率変数 {Xi}ni=1について,各Xiが確率p で1の値をとり,1 − p で0の値をとる
■ Yn=∑ni=1Xi:これは二項分布に従う Yn∼ Bi(n, p)
■ Ynの平均と分散は以下の通り. E[Yn] = np, V[Yn] = np(1 − p)
■ 標本平均X¯n: X¯n= 1
nYn= 1 n
∑n i=1
Xi
統計学 第
7
週– 10 / 27
二項分布の正規近似
■ X¯n の平均・分散は以下のようになる. E[ ¯Xn] = p, V[ ¯Xn] = p(1 − p)
n
■ X を基準化した確率変数 Z¯ n
Zn≡
X¯n− p
√p(1 − p)/n=
Yn− np
√np(1 − p)
■ 中心極限定理を適用するとZn が近似的に(十分大きなn については)標準正規分布に従う Zn≡
Yn− np
√np(1 − p)
−→ Z ∼ N(0, 1)D ··· ⃝1
統計学 第
7
週– 11 / 27
二項分布の正規近似
■ この結果から,二項分布に関する計算が簡略化されることがある
■ 二項分布に従う確率変数Ynがある区間で実現する確率を考える.
■ Pr[a ≤ Yn≤ b] において,a,b の値によっては大変
Pr[a ≤ Yn≤ b] =
∑b k=a
nCkpk(1 − p)n−k
■ 中心極限定理を用いると(Z を標準正規分布に従う確率変数として) Pr[a ≤ Yn≤ b] = Pr
[ a − np
√np(1 − p) ≤
Yn− np
√np(1 − p) ≤
b − np
√np(1 − p) ]
≈ Pr
[ a − np
√np(1 − p) ≤ Z ≤
b − np
√np(1 − p) ]
となるので標準正規分布の数値表で(近似的に)計算可能となる.
■ 例題:打率3割という実績を持つ打者が,今後500 打席で 175 本以上安打を打つ確率は?
◆ 安打数をY とすると,Y ∼ Bi(500, 0.3) なので,求める確率は Pr[Y ≥ 175] となる.
◆ 中心極限定理から以下の近似が成り立つ Z = Y − 500 · 0.3
√0.3 · 0.7 · 500 ∼ N(0, 1)
このとき,
Pr[Y ≥ 175] = Pr[ Y − 500 · 0.3
√0.3 · 0.7 · 500 ≥
175 − 500 · 0.3
√0.3 · 0.7 · 500 ]
≈ Pr[Z ≥ 2.44] = 0.5 − 0.4927
■ 練習問題3:ある番組の真の視聴率が12 %であったとする.1000 人について,その番組の視聴率調査を して,調査結果が10 %から 15 %となる確率を求めてください.また,真の視聴率が 8 %であるとすると 同じ確率はいくらになりますか.
統計学 第
7
週– 12 / 27
応用問題:視聴率調査
■ テレビ番組の視聴率調査を行う
■ 非常に高い(例えば95%)確率で,調査結果の誤差が±1 %(±0.01)以内に収まるようにしたい.
■ 全員に聞けば,正確になるが,費用も膨大になる
■ どの程度の人数に対して調査すれば,上のような精度を達成できるか?
誤差を±0.01 以内に抑える確率が 0.95 以上となることは,| ¯Xn− p | ≤ 0.01 となる確率が 0.95 以上になるこ とに他ならない.つまり
Pr[| ¯Xn− p| ≤ 0.01]≥ 0.95
ところで中心極限定理より Zn=√X¯n− p
p(1 − p)/n
−→ Z ∼ N(0, 1)D
となってZnが近似的に正規分布に従うことがわかる.このZn= ( ¯Xn− p)/
√p(1 − p)/n) について,
Pr[| ¯Xn− p| ≤ 0.01]≥ 0.95 ⇔ Pr [
X¯n− p
√p(1 − p)/n
< √ 0.01 p(1 − p)/n
]
≥ 0.95 ··· ⃝2
という関係がなりたつ.p(1 − p) ≤ 1/4 = 0.25 となることを考慮すると,
Pr [
X¯n− p
√p(1 − p)/n
< √ 0.01 p(1 − p)/n
]
≥ Pr [
X¯n− p
√p(1 − p)/n
<√0.01 0.25/n
]
= Pr [
X¯n− p
√p(1 − p)/n
< 0.02√n ]
··· ⃝3 となることに注意しておく.一方,正規分布の数値表より,ϵ に関して
Pr [
X¯n− p
√p(1 − p)/n
< ϵ ]
= 0.95 =⇒ ϵ = 1.96
という結果になるので0.02
√n = 1.96(あるいは 0.02√n ≥ 1.96)という関係を満たすような n を見つけると
(2)式を満たす.つまり
0.02√n = 1.96 ⇔ n = 1.96
2
0.022 = 98
2= 9604
(あるいは0.02
√n ≥ 1.96 ⇔ n ≥ 9604)となるように n を定めればよい.結果として1%以内の誤差で抑え るためにはn ≥ 9604 が必要であることが分かる.
■ 練習問題4:以下の結果を確認してください
◆ 誤差を±5 %以内に抑えることができる確率が 0.95 となるためには n ≥ 384.16 が必要
◆ 誤差を±0.5 %以内に抑えることができる確率が 0.95 となるためには n ≥ 38416 が必要
◆ 誤差を±2 %以内に抑えることができる確率が 0.95 となるためには n ≥ 2401 が必要
◆ 誤差を±2 %以内に抑えることができる確率が 0.99 となるためには n > 4160 が必要
統計学 第
7
週– 13 / 27
積率母関数・変数変換 ( 以下の内容は試験範囲外 ) 14 / 27
積率母関数
■ 積率母関数:
mX(θ) = E[eθX]
◆ 積率母関数は,分布関数(密度関数)と一対一対応
◆ 二つの確率変数が同じ積率母関数を持つとき,それらは同じ分布に従う
◆ 積率母関数は存在しないこともある.類似する性質を持つ関数に特性関数と呼ばれるものがあり, E[ei·θX] と定義される(i は i2= −1 を満たす虚数).この関数は常に存在し,積率母関数が存在する とき,θ を i · θ で置き換えたものと一致する.
■ 積率母関数とモーメント: dkmX(0)
dθk = E[X
k]
■ いくつかの例
◆ 正規分布
ϕ(x) = √ 1 2πσ2exp
{
−(x − µ)
2
2σ2 }
mX(θ) = E[eθX] =
∫ ∞
−∞
eθx√ 1 2πσ2exp
{
−(x − µ)
2
2σ2 }
dx
=
∫ ∞
−∞
√ 1
2πσ2exp {
−x
2− 2(µ + θσ2)x + µ2
2σ2
} dx
=
∫ ∞
−∞
√ 1
2πσ2exp {
−{x − (µ + θσ2)}2 2σ2
}
dx · exp{ (µ + θσ
2)2− µ2
2σ2
}
= exp {
µθ +θ
2σ2
2 }
dmX(θ)
dθ = (µ + θσ
2) · exp
{
µ · θ +θ
2· σ2
2 }
, dmX(0) dθ = µ,
d2mX(0) dθ2 = µ
2+ σ2
◆ カイ二乗分布
mX(θ) = (1 − 2θ)−k/2, θ < 1/2
◆ 指数分布(f (x) = λe−λx) mX(θ) = λ
λ − θ
◆ 一様分布(f (x) = 1/(b − a) for x ∈ [a, b] それ以外では0)
mX(θ) = e
θ·b− eθ·a
(b − a)θ
◆ 二項分布
mX(θ) = (1 − p + p · eθ)n
◆ ポアソン分布
mX(θ) = exp{λ · (eθ− 1)}
統計学 第
7
週– 15 / 27
一変数確率変数の変数変換
■ 確率変数Y を 他の確率変数 X を用いて,Y = g(X) と定義する.
◆ (連続型)確率変数X:密度関数 fX(x)
◆ 変数変換:(連続)関数g(•) によって Y = g(X)
◆ 確率変数Y の密度関数はどのようになるか.
■ 分布関数と密度関数の間の関係(FX(x) =
∫x
−∞fX(t)dt より下の関係は明らか) fX(x) = dFX(x)
dx
■ 関数g(•) が単調関数の時(逆関数 g−1(•) も単調関数),Y の分布関数および密度関数は, FY(y) = Pr[Y ≤ y] = Pr[X ≤ g−1(y)] = FX
(g−1(y)) fY(y) = dFX
(g−1(y)) dy = fX
(g−1(y))·dg−1(y)
dy ··· ⃝4 ただし,ここでは単調増加を想定して計算しているが,単調減少でも同様に計算可能.
◆ 線形変換Y = g(X) = a + bX を考えると,g−1(y) = y−ab , dg−1dy(y)= 1/b より
fY(y) = fX( y − a
b )
· (1/b)
◆ それ自身の分布関数を用いた変数変換を行うと,一様分布に従う確率変数となる:U = FX(X) FU(u) = Pr[U ≤ u] = Pr[X ≤ FX−1(u)] = FX
(FX−1(u))= u
ただし,u ≤ 0 のとき Pr[U ≤ y] = 0 であり,u ≥ 1 のとき Pr[U ≤ y] = 1 となるので, FU(u) は一 様分布に従う確率変数の分布関数である.
統計学 第
7
週– 16 / 27
二変数(以上の)確率変数の変数変換
■ 二変数の場合の変数変換:(X, Y ) 7→ (U, V ) u = g(x, y)
v = h(x, y)
このとき,逆に戻す変換を考えると以下の通り, x = ϕ(u, v)
y = ψ(u, v)
■ 変数変換のヤコビアン:次のような行列とその行列式の絶対値を考える.
∆(u, v) = ( ∂φ
∂u
∂φ
∂ψ ∂v
∂u
∂ψ
∂v
)
, ; |∆(u, v)| =
∂ϕ
∂u
∂ψ
∂v −
∂ϕ
∂v
∂ψ
∂u
■ 二変数確率変数(U, V ) の同時密度関数は,
fU V(u, v) = fXY(ϕ(u, v), ψ(u, v)) · |∆(u, v)| ··· ⃝5 と書くことができる
統計学 第
7
週– 17 / 27
和の分布,比の分布
■ 二変数(X, Y ) の同時密度関数: fXY(x, y)
■ 和の分布:U = X + Y について考える. u = x + y
v = y とおくと
x = u − v y = v
となり,ヤコビアンは,
|∆(u, v)| =
( ∂φ
∂u
∂φ
∂ψ ∂v
∂u
∂ψ
∂v
) =
( 1 −1 0 1
) = 1
したがって
fU V(u, v) = fXY(u − v, v)
和の確率変数の密度関数は,U に関する周辺密度なので fU(u) =
∫ ∞
−∞
fXY(u − v, v)dv ··· ⃝6
◆ カイ二乗分布に従う二つの確率変数の和もまたカイ二乗分布に従うことを導くために用いる
◆ 実際の導出は,積率母関数を用いたほうが簡単.
■ 比の分布:U = X/Y について考える. u = x/y
v = y ここから
x = uv y = v
となり,ヤコビアンは,
|∆(u, v)| =
( ∂φ
∂u
∂φ
∂ψ ∂v
∂u
∂ψ
∂v
) =
( v u 0 1
) = |v|
したがって
fU V(u, v) = |v| · fXY(uv, v)
和の確率変数の密度関数は,U に関する周辺密度なので fU(u) =
∫ ∞
−∞
|v| · fXY(uv, v)dv ··· ⃝7
◆ 「正規分布に従う確率変数」と「カイ二乗分布に従う確率変数の平方根」の比がt分布に従うことを 導くために用いる
◆ カイ二乗分布に従う二つの確率変数の比がF 分布に従うことを導くために用いる
統計学 第
7
週– 18 / 27
カイ二乗分布,t分布,F分布,コーシー分布 ( 以下の内容は試験範囲外 )19 /
27
正規分布とカイ二乗分布
■ 標準正規分布(平均0,分散1)に従う確率変数X について,Y = X2の密度関数を求める
■ Y の分布関数から導出する
FY(y) = Pr[Y ≤ y] = Pr[−√y ≤ X ≤√y] =
∫ √y
−√y
√1 2πexp
{
−x
2
2 }
dx
= 2
∫ √y 0
√1 2πexp
{
−x
2
2 }
dx fY(y) = √1
2π· exp {
−y2}· y−1/2
= 1
2 · Γ(1/2)· ( y
2 )1/2−1
· exp{−y2}, y > 0 ··· ⃝8
この(8) 式は,以下の密度関数において k = 1 とした特殊ケースである fY(y; k) = 1
2 · Γ(k/2) · ( y
2 )k/2−1
· exp{−y 2
}, y > 0 ··· ⃝9
このパラメータk は,のちに見る正規分布との関係から「自由度」と呼ばれるパラメータであり,(9) 式 は「自由度kのカイ二乗分布」と呼ばれる確率変数の密度関数である.
■ 標準正規分布に従う確率変数を二乗したものは,自由度1のカイ二乗分布に従う.
■ 分布の再生性:同じ分布に従う確率変数の和が,元の分布と同一の確率分布に従う.
◆ 正規分布:
■ 正規分布に従う確率変数Xi∼ N(µi, σ2i) の積率母関数は mi(θ) = exp
{
µi· θ +σ
i2
2 · θ
2
}
■ X1 とX2 が独立であるとき,和X1+ X2の積率母関数は E[eθ·(X1+X2)] = E[eθ·X1] · E[eθ·X2] = exp
{
(µ1+ µ2) · θ +
σ21+ σ22 2 · θ
2
}
■ つまりX1+ X2の積率母関数は,平均µ1+ µ2,分散σ21+ σ22の正規分布の積率母関数.
◆ カイ二乗分布
■ 自由度k のカイ二乗分布に従う確率変数の積率母関数: mX(θ) = (1 − 2θ)−k/2, θ < 1/2
■ 自由度k1のカイ二乗分布に従う確率変数と自由度k2のそれが独立であるとき,和の分布は自由 度k1+ k2のカイ二乗分布となる
mX(θ) = (1 − 2θ)−(k1+k2)/2, θ < 1/2
■ 独立な標準正規分布に従うk 個の確率変数 X1, X2, . . . , Xk について,それぞれを二乗したものは それぞれ独立に自由度1のカイ二乗分布に従い,それらの和は自由度k のカイ二乗分布に従う
X12+ X22+ · · · + Xk2∼ χ2(k) ··· ⃝10
統計学 第
7
週– 20 / 27
t分布:正規分布とカイ二乗分布
■ 標準正規分布に従う確率変数X と自由度 m のカイ二乗分布に従う確率変数 Y を用いて,次の確率変数 T を定義する
T =√X Y /m
■ このT の従う確率分布は,自由度 m のt分布と呼ばれるもので以下の密度関数を持つ
fT(t; m) = √ 1
m · B(m/2, 1/2) (
1 + x
2
m
)−(m+1)/2
導出は以下の通り.
◆ Y = y で固定したとき,T の(Y = y とする条件付)分布は, T | Y = y = √X
y/m ∼ N(0, 1/
√y/m)
条件付密度関数は fT(x|y) = √ 1
2π/(y/m)exp {
− x
2
2/(y/m) }
◆ 一方,Y は自由度 m のカイ二乗分布に従うので,その周辺密度は (9) の k を m で置き換えたもので ある
◆ したがって,T の周辺密度は fT(t) =
∫ ∞
0
fT(x|y) × fY(y)dy
=
∫ ∞
0
1
√2π/(y/m)exp {
− x
2
2/(y/m) }
× 1
2 · Γ(m/2) · ( y
2 )m/2−1
· exp{−y2}
| {z }
自由度m のカイ二乗分布の密度関数 dy
=
∫ ∞
0
( y 2
)1/2 1
√m · Γ(1/2)exp {
−y · x
2
2m }
× 1
2 · Γ(m/2)· ( y
2 )m/2−1
· exp{−y2}dy
=
∫ ∞
0
1
2√m · Γ(1/2) · Γ(m/2) · exp {
− (
1 +x
2
m )
·y2} ( y2)(m+1)/2−1dy
= (
1 + xm2)−(m+1)/2+1−1
√m · B(m/2, 1/2) ×
∫ ∞
0
1
2Γ((m + 1)/2)· exp
{−z2} ( z2)(m+1)/2−1
| {z }
自由度m + 1 のカイ二乗分布の密度関数 dz
ただし最後の等号には,以下の変数変換を用いている. z ≡
( 1 +x
2
m )
· y → dy = (
1 +x
2
m )−1
· dz.
統計学 第
7
週– 21 / 27
ガンマ関数,ベータ関数, Stirling の公式
■ ガンマ関数の定義 Γ(x) =
∫ ∞
0
tx−1e−tdt, x > 0.
◆ Γ(1/2) =√π, Γ(1) = 1
◆ Γ(n + 1) = n · Γ(n)
◆ 自然数n について,Γ(n) = (n − 1)!
■ ベータ関数:B(x, y) =
∫1
0 tx−1(1 − t)y−1dt
◆ ベータ関数とガンマ関数: B(x, y) = Γ(x)Γ(y) Γ(x + y)
■ Stirling の公式
◆ 十分大きな実数x(十分大きな自然数 n)について, Γ(x + 1) ≈√2π · x ·( xe)
x
=√2π · xx+1/2· e−x, n! ≈√2π · nn+1/2· e−n ··· ⃝11
■ n を自然数とすると次の結果が成り立つa
n→∞lim
nn+1/2· e−n
n! =
√1
2π ··· ⃝12 (
1 +√z n
)n−1
e√n·z = e−z2/2 ··· ⃝13
■ またベータ関数に関して,
√m · B(m/2, 1/2)m→∞−→ √2π ··· ⃝14
◆ Stairling の公式を用いて示すことができるが,非常に長い説明が必要なので省略.
a
前者の証明にはスターリングの公式を用いる.後者はlog(1 + z) ≈ z −z22 という二次までのマクローリン展開を考 えてると1 + z ≈ exp{z −12z2}となるので,
( 1 +√z
n )n−1
e−√n·z = (
1 +√z n
)−1( 1 +√z
n )n
· e−
√n
·z
≈ (
1 +√z n
)−1
exp {
n · ( z
√n −12 z2
n )}
· e−
√n
·z
= (
1 +√z n
)−1
exp {
− z2
2 }
≈ exp {
− z2
2 }
.
統計学 第
7
週– 22 / 27
t分布:正規分布への収束
■ t分布は自由度が大きいとき,標準正規分布へ収束する.自由度m のt分布の密度関数についてみると fT(t; m) = √ 1
m · B(m/2, 1/2) (
1 + t
2
m
)−(m+1)/2
= √ 1
m · B(m/2, 1/2) {(
1 + t
2/2
m/2
)m/2}−1
· (
1 + t
2
m )−1/2
m/2→∞
−→ √1 2π
{et2/2}−1· 1 = √1 2πe
−t2/2
7 – 23 / 27
コーシー分布,t分布:モーメントの不在
■ コーシー(Cauthy)分布 fC(x) = 1
π · (1 + x2)
■ t分布において自由度が1のとき(m = 1),コーシー分布と一致する
fT(t; 1) = √ 1 1 · B(1/2, 1/2)
( 1 + t
2
1
)−(1+1)/2
= √ 1 1 ·√π ·√π/1
1 1 + t2 =
1 π · (1 + t2)
■ コーシー分布の平均・分散は存在しない(発散する)
◆ t分布も自由度が小さいときは平均も分散も存在しない.自由度が2 (m > 1) なら平均だけ存在.3 以上(m > 2) なら分散も存在する.
統計学 第
7
週– 24 / 27
F 分布:カイ自二乗分布同士の比
■ 自由度n のカイ二乗分布に従う確率変数 X と自由度 m のカイ二乗分布に従う確率変数 Y について考え, 両者が独立であるとき,次の確率変数F の従う確率変数は,自由度 (n, m) のF分布と呼ばれる.
F = X/n Y /m
■ F の密度関数は, fF(x) = n/m
B(n/2, m/2) ( n
m· x )n/2−1
·(1 + mn · x)−(n+m)/2x > 0.
導出には長い計算が必要になるが,ガンマ分布に従う確率変数の性質を用いると見通しよく計算できる.
■ F分布の性質
◆ Y /mX/n が自由度(n, m) のF分布に従うとき,Y /mX/n が自由度(m, n) のF分布に従う
◆ 自由度(n, m) のF分布において,n = 1 のとき,自由度 m のt分布に従う確率変数を二乗した確率 変数の密度関数となる
◆ t分布の性質を引き継いで,分母の自由度m が小さいときには平均も分散も存在しない.ただし,自 由度の範囲は少し異なり,分母の自由度が3以上(m > 2) なら自由度 (n, m) のF分布平均だけ存在, 5以上(m > 4) なら分散も存在する.
統計学 第
7
週– 25 / 27
中心極限定理再論
■ 平均1の指数分布に従う大きさn の標本を考える:{X1, X2, . . . , Xn}
■ 各 Xi (独立・同一分布に)が従う確率分布の密度関数,分布関数は f (x) = e−x, F (x) = 1 − e−x, x ≥ 0
■ Sn =∑ni=1Xi の平均,分散は,
◆ E[Xi] =∫∞
0 xe−xdx = 1, V[Xi] =∫0∞(x − 1)2e−xdx = 1 (第3週の問題参照)より E[Sn] =
∑n i=1
E[Xi] = n, V[Sn] =
∑n i=1
V[Xi] = n, E[ ¯Xn] = 1 n
∑n i=1
E[Xi] = 1, V[ ¯Xn] =
∑n i=1
1
n2V[Xi] = 1 n
◆ 基準化(平均を引いて,標準偏差で割る) Zn =Sn√− n
n
−→ N(0, 1) :d 中心極限定理
この結果を,確率変数の和に関する分布を求めることによって確認する.
■ Sn の密度関数を求め,それを利用してZn の密度関数を求める.その結果が
fZn(z) = n
n+1/2· e−n
n! (
1 +√z n
)n−1
e−√n·z (z ≥ −√n), = 0 (z <√n),
となることを示す.
◆ Snの密度関数が以下のようになることは,数学的帰納法により証明される(ポアソン分布!). fn(z) = zn−1· e−z
(n − 1)!
◆ Sn=∑ni=1Xi= Sn−1+ Xn となり,第一項の密度関数をfn−1(z) と書けば, Snの密度関数は
fn(z) =
∫ ∞
0
fn−1(x) · f(z − x)dx =
∫ z 0
fn−1(x) · f(z − x)dx = e−z·
∫ z 0
fn−1(x) · exdx
fn−1(z) = zn−2(n−2)·e−z なら,上式の積分からfn(z) = zn−1(n−1)!·e−z となる.
◆ 基準化されたZnの密度関数は,Zn= n−1/2· Sn− n1/2 (Sn= n1/2· Zn+ n) なので,Zn ≥ −n1/2 に注意しながら,
fZn(z) = n1/2· fn(n1/2· z + n) = n1/2·(n
1/2· z + n)n−1· e−(n1/2·z+n)
(n − 1)!
= n
n+1/2e−n
| n!{z }
(12):→1/√2π
· (
1 + √z n
)n−1
· e−n1/2·z
| {z }
(13):→e−z2 /2
n→∞−→ √1 2πe
−z2/2
■ 以上の結果は,基準化された統計量についての中心極限定理, Zn= Sn√− n
n =
X¯n− 1 1/√n =
√n( ¯Xn− 1)−→ N(0, 1) :d 中心極限定理
この結果を,確率変数の和に関する分布を直接求めることによって確認した.
統計学 第
7
週– 26 / 27
演習問題
1. 線形変換Y = a + bX(b > 0)を考え,X が一様分布,正規分布に従う場合の Y の密度関数を求めてくだ さい.
2. 確率変数X が標準正規分布に従うとき,|X| の密度関数を求めてください.
3. U が区間 [0, 1] で一様分布に従うとき,Y = −λ1log(1 − U) の密度関数を求めてください.
4. 互いに独立に標準正規分布に従う二つの確率変数X と Y について,W = X/Y と置いた確率変数はコー シー分布に従うことを示してください.
5. 互いに独立にコーシー分布に従う確率変数X と Y について,V = (X + Y )/2 も同じコーシー分布に従う ことを示してください.
6. n 個の確率変数 X1, X2, . . . , Xn が独立で同一の分布に従っており,その分布関数がF (x) で与えられ,密 度関数がf (x) で与えられているとする.このとき,n 個の中の最も大きい確率変数の密度関数を求めて ください.また最も小さい確率変数び密度関数を求めてください(順序統計量).
◆ 一番大きい確率変数(上から一位なのでX(1) としておく)の従う確率分布は,ある点x を X(1) が 超えないとき,すべての確率変数X1, X2, . . . , Xnがそのx よりも同時に超えない,という事柄を確 率として表現すればよい.分布関数と密度関数の対応関係を用いて密度関数も求められる.
◆ 一番小さい確率変数(上からn 位なので X(n) としておく)の従う確率分布は,ある点x を X(n)が 超えるとき,すべての確率変数X1, X2, . . . , Xnがそのx を同時に超える,という事柄を確率として 表現すればよい.
今回の演習問題は,これまでに比べて若干難しいかもしれませんが,それぞれの問題に重要な意味があります のでチャレンジしてみてください.
統計学 第