統計学 I 演習 , 第 3 週
菅原慎矢
May 12
参考 : 問題集
• あまり和の記号 Σ や記述統計に特化した問題集はない
• 度数分布表などに関する問題集としては、日本統計学会編「統計検定 2 級公式問 題集」
1 演習問題
1.1 ( 前回の問題 ): 度数分布表
あるテストに関して Table 1 のような度数分布表が与えられたとする。この時、(1) メジ アンはどの階級にあるか (2) 平均の近似値はいくらになるか
階級 度数 20-30 4 30-40 6 40-50 20 50-60 10 60-70 1 Table 1: 度数分布表
1.2 ( 前回の問題 ): 分割表
Table 2は、あるカレー店における客を対象に実施したアンケートをまとめた分割表で ある。以下を求めよ
1. 満足した客のうち、甘口を注文した客の割合
2. すべての客のうち、辛口を注文して満足した客の割合
1
3. 辛口を注文した客と甘口を注文した客とで、どちらが満足する割合が大きいか答 えよ
満足 不満 計 辛口を注文 10 130 140 甘口を注文 5 30 35
計 15 160 175
Table 2:分割表
1.3 ( 今週の問題 ): 相関
1. 以下は標本共分散が観測単位によって大きく変化することを示す問題である。単純化 のため、両替率は 1 ドル =100 円と仮定する。今二つの商品について、n 店舗でドルでの 価格を調査したデータを、{(x1, y1), (x2, y2), ..., (xn, yn)}とし、これらの標本共分散を Sxy
とする。いま同じ商品について、円で表記した価格データを {(p1, q1), (p2, q2), ..., (pn, qn)} とする。これらの標本共分散 Spqを Sxyを利用して表せ。
2.上記の問題の設定を利用し、標本相関係数が観測単位に影響しないことを示す。いま {(x1, y1), (x2, y2), ..., (xn, yn)}の標本相関係数を rxyとするとき、{(p1, q1), (p2, q2), ..., (pn, qn)} の標本相関係数 rpqを rxy を利用して表せ。
1.4 ( 今週の問題 ): 回帰分析
Figure 1:回帰分析
従業員数を売上高に回帰する回帰分析の結果, Figure 1 のような回帰直線が得られて いるとき、以下を答えよ
2
1. 回帰分析の結果を用いて従業員数が 6,000 人である店舗での売上高を予測した場合、 以下のどれがもっともらしいか (1)200,000 円 (2)400,000 円 (3)600,000 円 (4)800,000 円 (5)1, 000,000 円
2. xの回帰係数 (回帰直線を y = α + βx と書いたときの β) の推定値としてもっとも らしいのは以下のうちどれか. (1)10 (2)50 (3)100 (4)200 (5)250
2 解答
2.1 ( 前回の問題 ): 度数分布表
(1): まず度数の和は 41. よってメジアンは 21 番目の値となる。今累積度数は、階級 20-30 で 4, 階級 30-40 で 10, 階級 40-50 で 30 となるため、21 番目の値は階級 40-50 となる。よっ てメジアンは階級 40-50 に含まれる
(2)階級 20-30, 30-40,40-50,50-60,60-70 の階級値はそれぞれ 25,35,45,55,65。平均近似 の公式は [(階級値 × 度数) の和] / (度数の和) であり、これに代入すると、求める平均近 似は
25 ∗ 4 + 35 ∗ 6 + 45 ∗ 20 + 55 ∗ 10 + 65
41 =
100 + 210 + 900 + 550 + 65
41 =
1825 41 (1)
2.2 ( 前回の問題 ): 分割表
1. 満足した客のうち、甘口を注文した客の割合: 5/15 = 1/3 (列和との比)
2. すべての客のうち、辛口を注文して満足した客の割合: 10/175 = 2/37 (総和との比) 3. 辛口で満足する割合は 10/140 = 1/14, 甘口では 5/35 = 1/7, よって甘口の方が満
足する割合が高い (行和との比)
2.3 ( 今週の問題 ): 相関
1.
仮定した両替率の元で、pi = 100xi, qi = 100yiである。今標本平均について、
¯
pi = 1 n
n
∑
i=1
pi (2)
= 1 n
n
∑
i=1
100xi (3)
= 100 ×(1 n
n
∑
i=1
xi
) (4)
= 100¯x (5)
3
同様に ¯q = 100¯y. 従って
Spq = 1 n − 1
n
∑
i=1
(pi− ¯p)(qi− ¯q) (6)
= 1 n − 1
n
∑
i=1
(100xi− 100¯x)(100yi− 100¯y) (7)
= 1 n − 1
n
∑
i=1
10000(xi− ¯x)(yi− ¯y) (8)
= 10000 ×( 1 n − 1
n
∑
i=1
(xi− ¯x)(yi− ¯y)) (9)
= 10000Sxy (10)
2.
rpq =
∑n
i=1(pi− ¯p)(qi− ¯q)
√∑n
i=1(pi− ¯p)2
√∑n
i=1(qi− ¯q)2
(11)
=
∑n
i=1(100xi− 100¯x)(100yi− 100¯y)
√∑n
i=1(100xi− 100¯x)2
√∑n
i=1(100yi− 100¯y)2
(12)
=
∑n
i=110000(xi− ¯x)(yi− ¯y)
√∑n
i=110000(xi− ¯x)2
√∑n
i=110000(yi− ¯y)2
(13)
= 10000
∑n
i=1(xi− ¯x)(yi − ¯y)
100√∑ni=1(xi− ¯x)2 × 100√∑ni=1(yi− ¯y)2 (14)
= 10000
∑n
i=1(xi− ¯x)(yi− ¯y)
10000√∑ni=1(xi− ¯x)2√∑ni=1(yi− ¯y)2 (15)
=
∑n
i=1(xi− ¯x)(yi− ¯y)
√∑n
i=1(xi− ¯x)2
√∑n
i=1(yi− ¯y)2
(16)
= rxy (17)
2.4 ( 今週の問題 ): 回帰分析
1. x = 6000の時の回帰直線における y の値は 600,000 ほどであり、(3) が最も近い
2. 回帰直線は 1 で示した (x, y) = (6000, 600, 000) 付近に加え、例えば (x, y) = (2000, 200, 000) 付近も通っている。この二点を通る直線の切片、傾きを a, b としたとき、もとめる
回帰係数は b である。下記の連立方程式が成立する
600000 = a + 6000b (18) 200000 = a + 2000b (19) これをとくと b = 100 が得られるため、回答は (3)
4