.
...
統計学 I および演習 第 13 回 推定 補助資料
菅原慎矢
July, 2016
実際の推定
(例題 9.1.)
母平均 µ, 母分布 σ2の母集団からの大きさ n = 10 の無作為標本として、 {x1, ..., x10} = {3.4, 4.5, 1.9, −1.6, 4.4, 0.8, 3.2, −0.3, 0.8, 3.7} が得られたとする (注意: 観測値は実数なので、小文字 xiで表記)
点推定値
母平均 µ, 母分散 σ2の点推定を考える
µと σ2推定量(確率変数) として、標本平均 ¯Xと標本分散 S2を考える (共 に不偏性を満たす)
推定値(確率変数に、実数データを代入したもの) 母平均の推定値:
¯
x = (1/n)
10
∑
i=1
xi= (3.4+4.5+1.9−1.6+4.4+0.8+3.2−0.3+0.8+3.7)/10 = 2.08 (1) 母分散の推定値
1 n − 1
10
∑
i=1
(xi− ¯x)2= 4.375 (2) 注意: ここまでは分布の仮定を必要としない
区間推定 1.
点推定の仮定に加え、母分布を N(µ, σ2)と仮定
まず σ2が既知であったと仮定し、母平均 µ の信頼係数 0.95 の (両側) 区間 推定問題を考える
信頼係数 0.95 の信頼区間の推定量の構成 (復習):
{X1, ..., Xn} ∼ N(µ, σ2)より、X ∼ N(µ, σ¯ 2/n) (ここに母分布の仮定が 必要)
Z = ( ¯X − µ)/(σ/√n)とすると、X ∼ N(µ, σ¯ 2/n)よりZ ∼ N(0, 1)
信頼区間 1: 続き 1
まず P (−z ≤ Z ≤ z) = 0.95 となる z を求める。この z について
0.95 = P (−z ≤ Z ≤ z) (3)
= P (Z ≤ z) − P (Z ≤ −z) (4)
= P (Z ≤ z) − [1 − P (Z ≤ z)] (5)
= 2P (Z ≤ z) − 1 (6)
⇒ P (Z ≤ z) = 1.95/2 = 0.975 (7) 一般的に、両側区間推定で 1 − α = P (−z ≤ Z ≤ z) を満たす z について、 1 − α/2 = P (Z ≤ z) が成立
(上記だと 1 − α = 0.95 なので α = 0.5, 1 − α/2 = 0.975) 標準正規分布表より、これを満たすのは z = 1.96
信頼区間 1, 続き 2
今
0.95 = P (−1.96 ≤ Z ≤ 1.96) (8)
= P(−1.96 ≤ X − µ¯ σ/√n ≤ 1.96
) (9)
= P( ¯X − 1.96√σ
n ≤ µ ≤ ¯X + 1.96
√σ n
) (10)
(9)式から (10) 式を求める際は、(9) 式右の不等号と左の不等号を分けて計 算すること:
左 − 1.96 ≤ X − µσ/¯ √
n (11)
⇔ −1.96σ/√n ≤ X − µ¯ (12)
⇔ µ ≤ X + 1.96σ/¯ √n (13) 右 1.96 ≥ X − µσ/¯ √
n (14)
⇔ 1.96σ/√n ≥ X − µ¯ (15)
⇔ µ ≥ X − 1.96σ/¯ √n (16)
信頼区間 1, 続き 3
求める信頼区間の推定量は
[ ¯X − 1.96√σ
n, ¯X + 1.96
√σ n
] (17)
推定値は, [x − 1.96¯ √σ
10, ¯x + 1.96
√σ 10
]=[2.08 − 1.96√σ
10, 2.08 + 1.96√σ 10
] (18)
区間推定 2
実際には, σ2が既知という仮定は置きにくい。以下 σ2は未知とする 信頼係数 0.95 の信頼区間の推定量の構成 (復習):
S2を標本分散とする
{X1, ..., Xn} ∼ N(µ, σ2)より、T = ( ¯X − µ)/√S2/nとすると、T ∼ t(n − 1)
信頼区間 2: 続き 1
ここまでの議論: n = 10, T ∼ t(n − 1)
この時 P (−a ≤ T ≤ a) = 0.95 となる a を求める。この a について, t 分布 も標準正規分布同様に平均で左右対称な分布なので、下記が成立
0.95 = P (−a ≤ T ≤ a) (19)
⇒ P (T ≤ a) = 0.975 (20)
自由度 n − 1 でこれを満たす a を t0.025とおく
信頼区間 2, 続き 2
今
0.95 = P (−t0.025≤ T ≤ t0.025) (21)
= P(t0.025 ≤ T − µ
√S2/n ≤ t0.025
) (22)
= P( ¯X − t0.025√S2/n ≤ µ ≤ ¯X + t0.025√S2/n) (23) よって求める信頼区間の推定量は
[ ¯X − t0.025√S2/n, ¯X + t0.025√S2/n] (24)
信頼区間 2, 続き 3
今自由度について n − 1 = 10 − 1 = 9
今 t0.025について, P (T ≤ t0.025) = 0.975, T ∼ (9) を満たすものを t 分布表 から探すと、t0.025 = 2.26
よって求める信頼区間の推定値は, s2を確率変数 S2の実現値とすると [¯x − t0.025√s2/n, ¯x + t0.025√s2/n]
= [2.08 − 2.26√4.375/10, 2.08 + 2.26√4.375/10] (25)
≃ [0.5852, 3.5748] (26)
{x1, ..., x10} = {3.4, 4.5, 1.9, −1.6, 4.4, 0.8, 3.2, −0.3, 0.8, 3.7} の平均の 95%区間だが、結構広い. n = 10 では足りないか
区間推定 3.
区間推定 2 の仮定を用いて、母分散 σ2の信頼係数 0.95 の (両側) 区間推定 問題を考える
信頼係数 0.95 の信頼区間の推定量の構成 (復習): U = (n − 1)S2/σ2とすると、U ∼ χ(n − 1)
信頼区間 3: 続き 1
ここまでの議論: n = 10, U ∼ χ(n − 1)
この時 P (a ≤ T ≤ b) = 0.95 となる a, b を求める。χ2分布は左右非対称な 分布なのだが、以下を用いる (これが良いことの証明はしていない)
0.975 = P (U ≤ a) (27) 0.025 = P (U ≤ b) (28) 自由度 n − 1 でこれを満たす a, b を U0.975, U0.275とおく
信頼区間 2, 続き 2
今
0.95 = P (U0.975≤ U ≤ t0.025) (29)
= P (U0.975≤ (n − 1)S2/σ2≤ t0.025) (30)
= P((n − 1)S
2
U0.025 ≤ σ
2≤(n − 1)S
2
U0.975
) (31)
(32) よって求める信頼区間の推定量は
[(n − 1)S
2
U0.025
, (n − 1)S
2
U0.975
] (33)
信頼区間 2, 続き 3
今自由度について n − 1 = 10 − 1 = 9
今 U0.975, U0.025を χ2分布表から探すと、U0.975= 2.7, U0.025 = 19.02 よって求める信頼区間の推定値は, s2を確率変数 S2の実現値とすると
[(n − 1)s
2
U0.025 ,
(n − 1)s2 U0.975 ]
= [9 × 4.375 19.02 ,
9 × 4.375
1.7 ] (34)
≃ [2.070, 14.583] (35)