統計学 I 演習 , 第 3 週
菅原慎矢
April 28
1 Σ 記号に関する問題 , continued
公式
n
∑
i=1
(xi+ yi) =
n
∑
i=1
xi+
n
∑
i=1
yi (1)
n
∑
i=1
c = nc (2)
n
∑
i=1
cxn = c
n
∑
i=1
xi (3)
n
∑
i=1
xi = n¯x (¯xの定義より) (4)
また、平均・標本分散の定義は下記である
¯
x = 1 n
n
∑
i=1
xi (5)
S2 = 1 n − 1
n
∑
i=1
(xi − ¯x)2 (6)
問題
以下では、標本 {x1, ..., xn}の平均が ¯x, 標本分散が S2であるとする 1. ∑ni=1(xi3−2
)を n, ¯x をもちいて表せ
3. ある自然数 m について、∑mj=1∑ni=1jxiを、m, n, ¯x を用いて表せ。なお、下記の 公式を用いて良い
n
∑
i=1
xi = 1 + 2 + ... + n = 1
2n(n + 1) (7)
4. (∑ni=1xi
)2
を n, ¯x をもちいて表せ
5. 次の数列の和を Σ 記号を用いて表せ: x1+ x3+ x5+ ... + x17
2 解答
1.
n
∑
i=1
(xi− 2 3
) = 1 3
n
∑
i=1
(xi− 2) (3)より (8)
= 1 3
(∑n
i=1
xi−
n
∑
i=1
2) (1)より (9)
= 1 3
(∑n
i=1
xi− 2n) (2)より (10)
= 1 3
(n¯x − 2n) (3)より (11)
= n(¯x − 2)
3 (12)
間違えやすい点: 一行目で
n
∑
i=1
(x
i− 2 3
)
=(
n
∑
i=1
(xi− 2)
∑n i=13
)
(13)
とはならない 2.
平均
1 n
n
∑
i=1
cxi = (1 n
)c
n
∑
i=1
xi (2)より (14)
= c(1 n
n
∑
i=1
xi
) (15)
= c¯x (¯xの定義より) (16)
標本分散: 上記解答より、平均は c¯x. 標本分散の定義にこれを代入し 1
n − 1
n
∑
i=1
(cxi− c¯x)2 = 1 n − 1
n
∑
i=1
[c(xi− ¯x)]2 (17)
= 1 n − 1
n
∑
i=1
c2(xi− ¯x)2 (18)
= ( 1 n − 1
)c2
n
∑
i=1
(xi− ¯x)2 (2)より (19)
= c2( 1 n − 1
n
∑
i=1
(xi − ¯x)2) (20)
= c2S2 (S2の定義 (6) より) (21) 3.
m
∑
j=1 n
∑
i=1
jxi =
m
∑
j=1
j
n
∑
i=1
xi (3)より (22)
=
m
∑
j=1
j(n¯x) (4)より (23)
= n¯x
m
∑
j=1
j (3)より (24)
= n¯x · m(1 + m)
2 (7)より (25)
= mn¯x(1 + m)
2 (26)
4.
(∑n
i=1
xi
)2
= (n¯x)2 (4)より (27)
= n2x¯2 (28)
5. いくつか解答がありうると思うが、一例は
x1 + x3+ x5+ ... + x17=
9
∑
i=1
x2i−1 (29)
3 前回演習未決分の解答
3.1 問題 1.2
• 二つの標本 {1, 2, 1, 2, 3}, {1, 2, 1, 2, 3, 91} について、平均・メジアン・ならびに最 大値・最小値一つずつを除いた刈り込み平均をもとめよ
• ふたつの集合の標本分散を求めよ。しんどかったら途中で挫折してかまわない 解答
{1, 2, 1, 2, 3}について:
• 平均: (1 + 2 + 1 + 2 + 3)/5 = 9/5
• メジアン: n = 5 なので大小順に並べたとき 3 番目の要素となり、2
• 刈り込み平均: 最大値は 3, 最小値は 1. それぞれ一つずつを除くという指示なの で、{1, 2, 2} の平均を求めればよく、答えは (1 + 2 + 2)/3 = 5/3
• 標本分散: 1 n − 1
n
∑
i=1
(xi− ¯x)2 = 1 4
5
∑
i=1
(xi− 9/5)2 (30)
= 1
4[2 × (1 − 9/5)2 + 2 × (2 − 9/5)2+ (3 − 9/5)2] (31)
= 7/10 (32)
最後の計算は充分しんどい {1, 2, 1, 2, 3, 91}について:
• 平均: (1 + 2 + 1 + 2 + 3 + 91)/6 = 100/6 = 50/3
• メジアン: n = 6 なので大小順に並べたときの 3 番目,4 番目の要素の平均となるが、 これらが共に 2 なので 2
• 刈り込み平均: 最大値は 91, 最小値は 1. それぞれ一つずつを除くという指示なの で、{1, 2, 2, 3} の平均を求めればよく、答えは (1 + 2 + 2 + 3)/4 = 8/4 = 2
• 標本分散: 省略 (授業で示したとおり、しんどい), 正解は 1326.66...(Excel による 計算)
この問題で見たかったこと: 91 という異常に大きい値が入っているため、二つの標本は 平均・分散がかなり異なるが、メジアンや刈り込み平均と言った異常値に強い手法を用 いると、二つの標本は似ていることが示される
3.2 問題 1.3.1
標本の標準化:
zi = xi− ¯x
S (33)
について、ziが平均 0, 標本分散 1 であることを示せ 解答
授業では全標本での標準化 (σ で割るもの) について ziが平均 0, 分散 1 であることを 示したが、それを標本 (S で割るもの) に関して示す問題。全標本の時とほとんど同じ式 展開で示せる
平均:
1 n
n
∑
i=1
zi = 1 n
n
∑
i=1
xi− ¯x
S (34)
= 1 n
1 S
n
∑
i=1
(xi− ¯x) (3)より (35)
= 1 n
1 S
(∑n
i=1
xi−
n
∑
i=1
¯
x) (1)より (36)
= 1 n
1 S
(∑n
i=1
xi− n¯x) (3)より (37)
= 1 S
(1 n
n
∑
i=1
xi− 1 nn¯x
) (38)
= 1 S
(1 n
n
∑
i=1
xi− ¯x) (39)
= 1 S
(
¯
x − ¯x) (4)より (40)
= 0 (41)
標本分散: 上記より z の平均について ¯z = 0 であることを利用する 1
n − 1
n
∑
i=1
(zi− ¯z)2 = 1 n − 1
n
∑
i=1
(zi− 0)2 (42)
= 1 n − 1
n
∑
i=1
zi2 (43)
= 1 n − 1
n
∑
i=1
(xi− ¯x S
)2
(44)
= 1 n − 1
n
∑
i=1
(xi− ¯x)2
S2 (45)
= 1
(n − 1)S2
n
∑
i=1
(xi − ¯x)2 (3)より (46)
= 1 S2
( 1 n − 1
n
∑
i=1
(xi− ¯x)2) (47)
= 1 S2 × S
2 (6)より (48)
= 1 (49)
3.3 問題 1.3.2
偏差値 50 + 10ziについて、平均と標本標準偏差を示せ 解答
平均
1 n
n
∑
i=1
(50 + 10zi) = 1 n
(∑n
i=1
50 +
n
∑
i=1
10zi
) (1)より (50)
= 1 n
(∑n
i=1
50 + 10
n
∑
i=1
zi
)
(3)より (51)
= 1 n
(
50n + 10
n
∑
i=1
zi
)
(2)より (52)
= 50 + 10(1 n
n
∑
i=1
zi
) (53)
= 50 + 10¯z (54)
= 50 (55)
1 n − 1
n
∑
i=1
(50 + 10zi− 50)2 = 1 n − 1
n
∑
i=1
(10zi)2 (56)
= 1 n − 1
n
∑
i=1
100z2i (57)
= 100( 1 n − 1
n
∑
i=1
zi2) (3)より (58)
= 100( 1 n − 1
n
∑
i=1
(zi− ¯z)2) z = 0¯ より (59)
ここで、(6) より最右辺の括弧内は {z1, ..., zn}の標本分散であるが、{z1, ..., zn}の定義よ りこれは 1。よって偏差値の標本分散は
100 × 1 = 100 (60)
となる。標本標準偏差は標本分散の平方根なので、もとめる値は 10