第
2
講:大数の法則大数の弱法則
:
コインを投げる場合
正しいコインを、独立 に
n = 1, 2, · · · , 10000
回投げた場合0 2000 4000 6000 8000 10000
0.495
0.4975
0.5
0.5025
0.505
0.5075
0.51
0.5125
大数の弱法則
大数の弱法則
weak law of large numbers
1.
独立性:確率変数X
1, X
2, · · · , X
n が互いに独立2.
平均の同一性:µ = E(X
i) , i = 1, 2, · · · , n
3.
分散の有限性:σ
2i= V (X
i) ≤ σ
2, i = 1, 2, · · · , n
このとき、任意の> 0
に対してn→∞
lim P
X
1+ X
2+ · · · + X
nn − µ
≥
= 0
このとき、
X ¯
がµ
に 確率収束converge in probability
という。
大数の弱法則
:
証明
Y = X
1+ X
2+ · · · + X
nn
とおくと、
E(Y ) = µ
となる。また独立性よりV (Y ) = σ
12+ · · · + σ
n2n
2≤ σ
2+ · · · + σ
2n
2= σ
2n
を得る。チェビシェフの不等式P ( | Y − E(Y ) | ≥ ) ≤ V (Y )
2 よりP ( | Y − µ | ≥ ) ≤ σ
2n
2 を得る。したがって、n→∞
lim P
X
1+ X
2+ · · · + X
nn − µ
≥
= 0
大数の強法則
:
コインを投げる場合
次々に 正しいコインを
n = 10000
回投げた場合 横軸:投げる回数;縦軸:表の出る相対頻度0 2000 4000 6000 8000 10000
0.49 0.495 0.5 0.505 0.51 0.515 0.52
チェビシェフの不等式の拡張
X
平均をµ = E(X ),
偶数次の中心モーメントν
2k= E(X − µ)
2k とする.
任意の
> 0
に対して、次が成り立つP ( | X − µ | ≥ ) ≤ ν
2k2k
証明
: D = { x | x − µ | ≥ }
とする。ν
2k=
∞
−∞
(x − µ)
2kf (x) dx
≥
D
(x − µ)
2kf (x) dx
≥
D
2k
f (x) dx
≥
2k
D
f (x) dx
2k
標本平均の
4
次のモーメント
• X
1, X
2, · · · , X
n:
互いに独立• E(X
i) = µ, V (X
i) = σ
2, E(X
i− µ)
4= ν
4, i = 1, · · · , n
E( ¯ X − µ)
4= 1 n
21
n ν
4+ 3(1 − 1 n ) σ
4
証明
:
( ¯ X − µ)
4=
⎡
⎣
1 n
n i=1
(X
i− µ)
⎤
⎦ 4
= 1 n
4⎧⎨
⎩ n
i=1
(X
i− µ)
4+
i=j4
C
2(X
i− µ)
2(X
j− µ)
2+
i=j=k=4
C
1(X
i− µ)(X
j− µ)(X
k− µ)(X
− µ) +
i=j4
C
1(X
i− µ)
3(X
j− µ)
⎫⎬
⎭
−
4 1 4大数の強法則
大数の強法則
strong law of large numbers
1.
確率変数X
1, X
2, · · · , X
n:互いに独立で同一分布に従う2.
さらに、 ⎧⎪⎪
⎪⎪
⎨
⎪⎪
⎪⎪
⎩
µ = E(X
i) σ
2= V (X
i) ν
4= E(X
i− µ)
4i = 1, 2, · · · , n
このとき、
P
n→∞
lim
X
1+ X
2+ · · · + X
nn = µ
= 1
このとき、
X ¯
がµ
に 概収束converge almost surely (converge with probability 1)
という。
大数の強法則の証明
•
評価すべき事象はn→∞
lim X ¯ = µ
である。•
この事象は次の事象と同等である。任意の> 0
に対して、自 然数N
が存在し,
全てのn > N
に対してX ¯ − µ
< , ∀ > 0, n > N
という事象である。•
この事象の余事象は、あるが存在し、この
に対して、どん な大きい
N
をとっても, n > N
が存在し、次が満たされる事象X ¯ − µ
≥ , for some n > N
である。
大数の強法則の証明(つづき)
一方、
n > N > ν
4 のとき、チェビシェフの不等式よりP
n= P
| X ¯ − µ | ≥
≤ E( ¯ X − µ)
44
= 1
n
24
1
n ν
4+ 3(1 − 1 n ) σ
4
< 1 + 3σ
44
1 n
2したがって
,
1つの> 0
と任意のN
に対して、P
n→∞
lim X ¯ = µ
= 1 − P
| X ¯ − µ | ≥ | for some n > N
≥ 1 − (P
N+ P
N+1+ · · · )
≥ 1 − 1 + 3σ
44
⎧⎨
⎩
1
N
2+ 1
(N + 1)
2+ · · · +
⎫⎬
⎭ N
−→
→∞1
第
3
講:中心極限定理中心極限定理
:
二項分布の場合
X
1, · · · , X
n:
独立で、p = 1/2
のBernoulli
分布に従い、ni=1X
i の 分布-1 1 2 3 4 5 6
0.05 0.1 0.15 0.2 0.25 0.3 0.35
n=5
中心極限定理
:
二項分布の場合(つづき)
X
1, · · · , X
n:
独立で、p = 1/2
のBernoulli
分布に従い、ni=1X
i の 分布2 4 6 8 10
0.05 0.1 0.15 0.2 0.25
n=10
中心極限定理
:
二項分布の場合(つづき)
X
1, · · · , X
n:
独立で、p = 1/2
のBernoulli
分布に従い、ni=1X
i の 分布5 10 15 20
0.025 0.05 0.075 0.1 0.125 0.15 0.175
n=20
中心極限定理
:
二項分布の場合(つづき)
X
1, · · · , X
n:
独立で、p = 1/2
のBernoulli
分布に従い、ni=1X
i の 分布5 10 15 20 25 30
0.02 0.04 0.06 0.08 0.1 0.12 0.14
n=30
中心極限定理
Central Limit Theorem
定理
1
次の条件の下で1. X
1, · · · , X
n が独立で、同じ分布に従う2. E(X
i) = µ, V (X
i) = σ
2, i = 1, · · · , n
確率変数Y =
√n( ¯X−µ)
σ は標準正規分布に弱収束する。すなわち
n→∞
lim P
⎡
⎣
√ n( ¯ X − µ)
σ ≤ y
⎤
⎦
=
y
−∞
√ 1
2π e
−x22dx (1)
中心極限定理
:
証明(1/2)
Y
の積率母関数が標準正規分布のそれに近づくことを証明する。X
i の積率母関数が存在するという、定理より強い条件を仮定する。Y
i=
Xi−µσ とすると、
E(Y
i) = 0, V (Y
i) = 1, Y = 1
√ n
n
i=1
Y
iY
i の積率母関数をM (t)
とするとM (0) = E
e
0Yi= 1 M
(0) = E(Y
i) = 0
M
(0) = E(Y
i2) = V (Y
i) + (EY
i)
2= 1
またψ(t) = log M (t)
とすると、ψ
(t) = M
(t)
M (t) , ψ
(t) = M
(t)M (t) − [M
(t)]
2[M (t)]
2したがって、
ψ(0) = 0, ψ
(0) = 0, ψ
(0) = 1
となる。中心極限定理
:
証明(2/2)
一方
,
ある| θ | < | t |
が存在し、原点の周りでψ(t)
を展開するとψ(t) = ψ(0) + ψ
(0)
1! t + ψ
(0)
2! t
2+ ψ
(θ)
3! t
3= 1
2 t
2+ ψ
(θ) 6 t
3 従って、Y
の積率母関数はE
e
Y t= E
e
√1nn
i=1Yit
=
ni=1
E
e
√tnY
i
=
M
t/ √ n
n= exp
n log M
t/ √ n
= exp
⎧⎨
⎩
n
⎡
⎣
1 2
t/ √
n
2+ ψ
(θ) 6
t/ √ n
3⎤
⎦
⎫⎬
⎭
= exp
⎧⎨
⎩
1
2 t
2+ ψ
(θ) 6
t
3√ n
⎫⎬
⎭ n→∞
−→ exp
1 t
2
二項分布の正規近似
定理
2 (De Moivre-Laplace Limit Theorem) X
が二項分布に従うならばX ∼ Bi(n, p)
次が成り立つn→∞
lim P
⎡
⎣
a ≤ X − np
np(1 − p) ≤ b
⎤
⎦
= Φ(b) − Φ(a) (2)
ただし、Φ(x)
は標準正規分布の分布関数である。すなわち、Φ(x) =
x
−∞
√ 1
2π e
−12y
2dy
二項分布の正規近似
:
証明
X
1, · · · , X
n を独立で、成功する確率がp
のBernoulli
分布に従うな らば,
X =
ni=1
X
i∼ Bi(n, p) E(X
i) = p
V (X
i) = p(1 − p)
となる。中心極限定理によって
X − np
np(1 − p) =
n
i=1
X
i− np
np(1 − p)
=
√ n( ¯ X − p)
p(1 − p)
−→ N (0, 1)
第
4
講:正規分布からの標本抽出— χ 2 分布・F
分布
χ
2 分布
正規分布からの標本を考える。
• X
1, · · · , X
n∼ N (0, 1)
• X
1, · · · , X
n:
独立• Y = X
12+ · · · + X
n2 の密度関数をf (y)
定理3
密度関数f (y)
は次の式で与えられるf (y) = 1 Γ(n/2)
1 2
n
2
y
n2−1e
−y2I
(0,∞)(y) (3)
定義1 (3)
を自由度n
のχ
2 分布の密度関数という。
χ
2 分布:
証明(1/2)
X
1, · · · , X
n の独立性よりM
Y(t) = E [exp(Y t)]
= E
⎛
⎝
exp
⎧⎨
⎩ n i=1
X
i2t
⎫⎬
⎭
⎞
⎠
=
E e
X12tn
一方
E e
X12t=
∞
−∞
e
x2t1
√ 2π e
−x22dx
=
∞
−∞
√ 1
2π e
−x2
2(1−2t)
dx
= 1
√ 1 − 2t (1 − 2t > 0)
従って、M
Y(t) = (1 − 2t)
−n2
χ
2 分布:
証明(2/2
)
直接的に計算すると
∞
0
e
ytf (y) dy =
∞
0
e
yt1 Γ(n/2)
1 2
n
2
y
n2−1e
−y2dy
=
∞ 0
1 Γ(n/2)
1 2
n
2
y
n2−1e
−y2+ytdy
x = y 2 − yt
=
∞ 0
1 Γ(n/2)
1 2
n
2
2 1 − 2t x
n
2−1
e
−x
2 1 − 2t dx
=
1 1 − 2t
n
2
1
Γ(n/2)
∞
0
x
n2−1e
−xdx
=
1 1 − 2t
n
2
これが
M
Y(t)
と一致する。
χ
2 分布の平均・分散
•
積率母関数M (t) = (1 − 2t)
−n2 よりM
(t) = n(1 − 2t)
−n2−1M
(t) = n(n + 2)(1 − 2t)
−n2−2•
平均:E(Y ) = M
(0) = n
•
分散:V (Y ) = E(X
2) − (EX)
2= M
(0) − n
2= 2n
χ
2 分布の様子
χ
2 分布の密度関数0 5 10 15 20
0 0.1 0.2 0.3 0.4
n=10 n=5 n=4 n=2 n=1
χ
2 分布:
自由度大きい場合
自由度が大きいときの
χ
2 分布の密度関数0 10 20 30 40 50 60 70
0 0.02 0.04 0.06 0.08 0.1
n=30 n=20 n=10
χ
2 分布の正規近似
• Z
1= X
12, · · · , Z
n= X
n2 が独立に自由度1
のχ
2 分布に従う• E(Z
i) = 1, V (Z
i) = 2
• Z ¯ =
1n n
i=1
X
i2= Y /n
とすると•
中心極限定理により、自由度n
が大きいときに、√ n(Y /n − 1)
√ 2 =
√ n( ¯ Z − 1)
√ 2
−→ N (0, 1)
= ⇒ Y −→ N (n, 2n)
F
分布
• X :
自由度m
のχ2
分布• Y :
自由度n
のχ2
分布• X, Y :
独立• Z =
X/mY /n の密度関数を
f (z)
定理
4
密度関数f (z)
は次の式で与えられるf (z) = 1
B(
m2,
n2)
m n
m
2
z
m2−1(1 + m
n z)
−m+n2I
(0,∞(z) (4)
定義2 (4)
を自由度(m, n)
のF
分布の密度関数という。
F
分布:
証明(1/3)
• X, Y
の独立性から、X, Y
の同時密度関数はf (x, y) = 2
−m2Γ(m/2) x
m2−1e
−x2I
x>0(x) × 2
−n2Γ(n/2) y
n2−1e
−y2I
y>0(y )
• 1
対1
の変数変換⎧⎪
⎨
⎪⎩
z =
x/my/n=
mynxw = y ⇔
⎧⎪
⎨
⎪⎩
x =
mn
zw y = w
のヤコビアンJacobian
は∂(x, y)
∂(z, w) =
∂x∂z ∂x
∂y ∂w
∂z
∂y
∂w
=
mn
w
mn
z
0 1
= m
n w
F
分布:
証明(2/3)
したがって
f (z) =
∞
0
g(z, w) dw
=
∞ 0
f ( m
n zw, w) m
n w dzdw
=
∞ 0
2
−m+n2Γ(
m2)Γ(
n2)
m n zw
m 2−1
e
−2nmzww
n2−1e
−w2m
n w dwdz
=
m n
m 2
z
m2−12
m+n2Γ(
m2)Γ(
n2)
∞
0
w
m+n2 −1e
−w(mz+n)2ndw
変数変換
t = −
w(mz+n)2n すると、w = 2nt
mz + n , dw = 2n mz + n dt
F
分布:
証明(3/3)
∞
0
w
m+n2 −1e
−w(mz+n)2ndw =
∞ 0
2nt mz + n
m+n
2 −1
e
−t× 2n mz + n dt
=
2n mz + n
m+n
2 ∞
0
t
m+n2e
−tdt
=
2n mz + n
m+n
2
Γ
m + n 2
従って
f (z) = m
m2n
n2Γ(
m+n2) Γ(
m2)Γ(
n2)
z
m2−1(mz + n)
m+n2=
m n
m 2
B(
m2,
n2) z
m2−1(1 + m
n z)
−m+n2This completes the proof.
F
分布の平均・分散
自由度
(m, n)
のF
分布に対して 平均:E(Z ) = n
n − 2 (n > 2)
分散:V (Z) = 2n
2(m + n − 2)
m(n − 2)
2(n − 4) n > 4
平均の場合の証明: まずE
1 Y
=
∞ 0
1 y
1 Γ(n/2)
1 2
n/2
y
n2−1e
−y2dy
= 1
Γ(n/2)
1 2
n/2 ∞
0
y
n−22 −1e
−y2dy
y 2 = w
= 1
Γ(n/2)
1 2
n/2 ∞
0
2
n2−2w
n−22 −1e
−w2 dw
= 1 2
Γ((n − 2)/2) Γ(n/2) = 1
2 1
n2
− 1 = 1 n − 2
に注意すると、E(Z ) = E
X/m
=
nE(X ) E
1=
nm
1=
nF
分布の密度関数
Z =
X/mY /n
, n = 1
の場合:
0 2 4 6 8 10
0 0.2 0.4 0.6 0.8 1 1.2
m=9 m=7 m=5 m=3 m=1
F
分布の密度関数
Z =
X/mY /n
, m = 1
の場合:
0 2 4 6 8 10
0 0.5 1 1.5 2 2.5
n=9 n=7 n=5 n=3 n=1
F
分布の密度関数
Z =
X/mY /n
, m = n
の場合:
0 2 4 6 8 10
0 0.2 0.4 0.6 0.8 1
H 20,20 L H 10,10 L H 6,6 L H 4,4 L H 2,2 L
第
5
講:正規分布からの標本抽出: t
分布t
分布
• X ∼ N (0, 1)
• Y ∼ χ
2(n)
• X, Y :
独立• T = √
XY /n の密度関数を
f (t)
定理
5
密度関数f (t)
は次の式で与えられるf (t) = 1
√ nB(
n2,
12)
⎛
⎝
1 + t
2n
⎞
⎠
−n+12
(5)
定義3 (5)
を自由度n
のt
分布の密度関数という。
t
分布:
証明(1/3)
• X
とY
の独立性から、X, Y
の同時分布f (x, y) = f
X(x) f
Y(y) = 1
√ 2π e
−12x21 2
n
2
1
Γ(n/2) y
n2−1e
−y2• 1 ↔ 1
変数変換⎧⎪
⎪⎨
⎪⎪
⎩
t = √
xy/n
w = y ⇐⇒
⎧⎪
⎨
⎪⎩
x =
wn
t y = w
ヤコビアン:
∂x
∂t ∂x
∂y ∂w
∂t
∂y
∂w
=
w
n t
2√ wn
0 1
=
$
w n
t
分布:
証明(2/3)
したがって
f (t) =
∞
0
g(t, w) dw
=
∞ 0
f (
$
w n t, w)
$
w n dw
=
∞ 0
√ 1
2π e
−12wnt21 2
n
2
1
Γ(n/2) w
n2−1e
−w2$
w n dw
= 1
√ 2π
1 2
n
2
1
√ n Γ(n/2)
∞
0
w
n2−12e
−w2−2nwt2dw
次の変数変換を考える
s = w
2 + w
2n t
2, w = s
1/2 + t
2/(2n) , dw =
⎛
⎝
1 2 + t
22n
⎞
⎠
−1
ds
t
分布:
証明(3/3)
したがって、
f (t) =
1 2
n
2
1
√ 2π √
n Γ(n/2)
⎛
⎝
1 2 + t
22n
⎞
⎠
−12−n2 ∞
0
s
n2−12e
−sds
=
1 2
n
2
1
√ 2π √
n Γ(n/2)
⎛
⎝
1 2 + t
22n
⎞
⎠
−12−n2
Γ
n 2 + 1
2
次の式
B
n 2 , 1
2
= Γ
n2Γ
12Γ
n2+
12=
√ πΓ
n2Γ
n2+
12 に注意すると, t
分布の密度関数はf (t) =
1 2
n
2+12
1
√ n B
n2,
12⎛
⎝
1 2 + t
22n
⎞
⎠
−12−n2
= 1
√ n B
n2,
12⎛
⎝
1 + t
2n
⎞
⎠
−n+12
t
分布:
自由度大きいとき
次の極限
⎛
⎝
1 + t
2n
⎞
⎠
−n+12
=
⎡
⎢⎣
⎛
⎝
1 + t
2n
⎞
⎠
tn2⎤
⎥⎦
t2
n×(−n+12 )
n→∞
−→ e
−t2 2
に注意すると、次が成り立つ
f (t) = 1
√ n B
n2,
12⎛
⎝
1 + t
2n
⎞
⎠
−n+12
n→∞
−→ 1
√ 2π e
−t22 すなわち定理
6
自由度が大きいときに、t
分布は正規分布に近づく.
(注:中心極限定理からも証明される。)
t
分布:
平均分散
1.
平均: 独立性よりE(T ) = E
⎛
⎝
X
Y /n
⎞
⎠
= E(X ) · E
⎛
⎝
1
Y /n
⎞
⎠
= 0 · E
⎛
⎝
1
Y /n
⎞
⎠
= 0 2.
分散:E(T ) = 0
なので、V (T ) = E(T
2)
= nE
⎛
⎝
X
2Y
⎞
⎠
= nE(X
2) · E
1 Y
= n · 1 · 1
n − 2 = n
n − 2
t
分布の様子
-10 -5 0 5 10
0 0.1 0.2 0.3 0.4
n=20 n=10 n=5 n=3 n=1
正規分布からの標本抽出
定理
7 X
1, X
2, · · · , X
n: N (0, 1)
に従う独立な確率変数1. ¯ X = n
−1ni=1X
i∼ N (0, 1/n)
2. S
2=
ni=1(X
i− X ¯ )
2∼ χ
2(n − 1) 3. ¯ X
とS
2:
独立証明 まず、
(1)
を証明する。X ¯
の積率母関数をM (t)
とする。M (t) = E
e
Xt¯
= E
e
n1n
i=1Xit
=
ni=1
E
e
ntXi
=
exp
t
2/2n
2n= exp
t
2/2n
X ¯
とS
2 の独立性(1/3)
次に
(2), (3)
を証明する。次の変数変換を考える⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
Y
1Y
2...
Y
n−1Y
n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
=
⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
√1
2
−
√120 · · · 0
√1
6 √1
6
−
√26· · · 0
... ... ... ... ...
√
1 n(n−1)√
1 n(n−1)√
1n(n−1)
· · · − √
n−1n(n−1)
√1 n
√1 n
√1
n
· · ·
√1n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
X
1X
2...
X
n−1X
n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
=
⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
a
1a
2...
a
n−1a
n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
X
1X
2...
X
n−1X
n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
= A
⎡
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢⎣
X
1X
2...
X
n−1X
n⎤
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥⎦
明らかに、
• a
ia
ti= 1, i = 1, · · · , n
X ¯
とS
2 の独立性(2/3)
すると、次のことが分かる
• Y
1, · · · , Y
n:
正規分布に従う• E(Y
i) = 0, V (Y
i) = 1, i = 1, · · · , n
• E(Y
iY
j) = 0, i = j = 1, · · · , n
すなわち、
Y
1, · · · , Y
n は互いに独立である•
ni=1X
i2=
ni=1Y
i2:
n
i=1
Y
i2= [Y
1, Y
2, · · · , Y
n] [Y
1, Y
2, · · · , Y
n]
t=
[X
1, X
2, · · · , X
n] A
tA [X
1, X
2, · · · , X
n]
t= [X
1, X
2, · · · , X
n]
A
tA
[X
1, X
2, · · · , X
n]
t= [X
1, X
2, · · · , X
n] I
n×n[X
1, X
2, · · · , X
n]
t=
ni=1
X
i2X ¯
とS
2 の独立性(3/3)
従って、n−1i=1
Y
i2 はχ
2(n − 1)
に従い、またY
n と独立。ところで、
Y
n= √ n X ¯
で、またn−1 i=1
Y
i2=
ni=1
X
i2− Y
n2=
ni=1
X
i2− n( ¯ X )
2=
ni=1
(X
i− X ¯ )
2= S
2
第
6
講:区間推定:
正規分布の平均の場合区間推定
confidence interval
•
母数θ
に依存して決まる確率密度関数:f (x | θ)
•
無作為標本X = { X
1, X
2, · · · , X
n} :
X
1, X
2, · · · , X
n i.i.d.∼ f (x | θ)
•
任意の0 < α < 1
に対し、次が成り立つP [L( X ) ≤ θ ≤ U ( X )] = 1 − α (6)
定義4 • (6)
を満たす区間[L, U] = [L( X ) ≤ θ ≤ U ( X )]
をθ
の信頼係数
1 − α
の信頼区間confidence interval
という。• L, U
をそれぞれ 下側信頼限界lower confidence limit
と 上側信 頼限界upper confidence limit
という。• 1 − α
を[L, U ]
の信頼係数confidence coefficient
という。平均・分散の区間推定問題
• 1
標本問題one sample problem 1. 1
つの無作為標本:
X
1, · · · , X
n i.i.d.∼ N (µ, σ
2) 2. µ
の信頼区間の構成3. σ
2 の信頼区間の構成• 2
標本問題two sample problem 1. 2
つの無作為標本:X
1, · · · , X
m i.i.d.∼ N (µ
x, σ
x2) Y
1, · · · , Y
n i.i.d.∼ N (µ
y, σ
y2) 2. µ
x− µ
y の信頼区間の構成3. σ
x2/σ
y2 の信頼区間の構成
µ
の信頼区間( σ
2が既知)
標準正規分布の
α
パーセント点 をz
α とする。すなわちzα
−∞
√ 1
2π e
−x2
2
dx = α
定理8
1.
無作為標本:
X
1, · · · , X
n i.i.d.∼ N (µ, σ
2) 2. σ
2:
既知3. ¯ X = n
−1ni=1X
iこのとき、
µ
の信頼係数1 − 2α
の信頼区間は次に与えられるP
⎡
⎣
X ¯ − σ
√ n z
1−α≤ µ ≤ X ¯ + σ
√ n z
1−α⎤
⎦
= 1 − 2α
µ
の信頼区間( σ
2 が既知):
証明
標本平均
X ¯
は正規分布に従う。また平均と分散はそれぞれE( ¯ X ) = µ, V ( ¯ X ) = σ
2n
すなわち、X ¯ ∼ N (µ, σ
2n )
従って、次が成り立つY =
√ n( ¯ X − µ)
σ
∼ N (0, 1)
1 − 2α = P [ | Y | ≤ z
1−α]
= P
⎡
⎣
− z
1−α≤
√ n( ¯ X − µ)
σ ≤ z
1−α⎤
⎦
= P
⎡
⎣
X ¯ − σ
√ n z
1−α≤ µ ≤ X ¯ + σ
√ n z
1−α⎤
⎦
µ
の信頼区間( σ
2が未知)
定理
9
次の条件が成り立つとする。1. t
n−1α:
自由度n − 1
のt
分布のα
パーセント点2.
無作為標本:
X
1, · · · , X
n i.i.d.∼ N (µ, σ
2) 3. µ, σ
2:
未知4.
標本平均,標本分散X ¯ = n
−1 ni=1
X
i, S
2= 1 n − 1
n i=1
(X
i− X ¯ )
2 このとき、µ
の信頼係数1 − 2α
の信頼区間は次に与えられるP
⎡
⎣
X ¯ − S
√ n t
n−11−α≤ µ ≤ X ¯ + S
√ n t
n−11−α⎤
⎦
= 1 − 2α
µ
の信頼区間( σ
2 が未知):
証明
条件より
•
Y =
√ n( ¯ X − µ)
σ ∼ N (0, 1) Z = (n − 1)S
2σ
2=
ni=1
⎛
⎝
X
i− X ¯ σ
⎞
⎠ 2
∼ χ
2(n − 1)
• Y, Z
の独立性よりT = Y
Z/(n − 1) =
√ n( ¯ X − µ)
S ∼ t(n − 1)
•
1 − 2α = P
| T | ≤ t
n−11−α= P
⎡
⎣
− t
n−11−α≤
√ n( ¯ X − µ)
S ≤ t
n−11−α⎤
⎦
= P
⎡
⎣
X ¯ − S
√ t
n−11−α≤ µ ≤ X ¯ + S
√ t
n−11−α⎤
⎦
µ
の信頼区間( σ
2が未知):
例
ある学校で
100
人の生徒が無作為に選ばれ、これらの生徒に知能テス トが行われた。テストの点数の平均50.0,
標本分散s
2x= 100.0
が得 られた。この学校の生徒の同じテストにおける得点が正規分布
N (µ, σ
2)
に従 うとして、母平均µ
の信頼係数1 − 2α = 95%, 90%
の信頼区間を求 めよ。解 求める信頼区間は
'
¯
x −
√snt
n−11−α, x ¯ +
√sn
t
n−11−α(
で、
n = 100, x ¯ = 50.0, α = 0.025, 0.05
となる。また、s =
)*
*+
1
n − 1 (x
i− x) ¯
2=
$
n
n − 1 s
2x=
)*
*+
100
99 × 100.0 = 10.05
表によって、t
991−0.025= t
990.975= 1.98, t
991−0.05= t
990.95= 1.65
• 95%
信頼区間: [50.0 −
10.05√1001.98, 50.0 +
10.05√1001.98] = [48.0, 52.0]
第