統計学
I
演習,
第
3
週
菅原慎矢
May 12
参考
:
問題集
• あまり和の記号Σや記述統計に特化した問題集はない
• 度数分布表などに関する問題集としては、日本統計学会編「統計検定2級公式問 題集」
1
演習問題
1.1 (
前回の問題
):
度数分布表
あるテストに関してTable 1のような度数分布表が与えられたとする。この時、(1)メジ アンはどの階級にあるか(2)平均の近似値はいくらになるか
階級 度数 20-30 4 30-40 6 40-50 20 50-60 10 60-70 1
Table 1: 度数分布表
1.2 (
前回の問題
):
分割表
Table 2は、あるカレー店における客を対象に実施したアンケートをまとめた分割表で ある。以下を求めよ
1. 満足した客のうち、甘口を注文した客の割合
2. すべての客のうち、辛口を注文して満足した客の割合
3. 辛口を注文した客と甘口を注文した客とで、どちらが満足する割合が大きいか答 えよ
満足 不満 計 辛口を注文 10 130 140 甘口を注文 5 30 35 計 15 160 175
Table 2:分割表
1.3 (
今週の問題
):
相関
1. 以下は標本共分散が観測単位によって大きく変化することを示す問題である。単純化 のため、両替率は1ドル=100円と仮定する。今二つの商品について、n 店舗でドルでの 価格を調査したデータを、{(x1, y1),(x2, y2), ...,(xn, yn)}とし、これらの標本共分散をSxy
とする。いま同じ商品について、円で表記した価格データを{(p1, q1),(p2, q2), ...,(pn, qn)}
とする。これらの標本共分散SpqをSxyを利用して表せ。
2.上記の問題の設定を利用し、標本相関係数が観測単位に影響しないことを示す。いま
{(x1, y1),(x2, y2), ...,(xn, yn)}の標本相関係数をrxyとするとき、{(p1, q1),(p2, q2), ...,(pn, qn)}
の標本相関係数rpqをrxy を利用して表せ。
1.4 (
今週の問題
):
回帰分析
Figure 1:回帰分析
従業員数を売上高に回帰する回帰分析の結果, Figure 1のような回帰直線が得られて いるとき、以下を答えよ
1. 回帰分析の結果を用いて従業員数が6,000人である店舗での売上高を予測した場合、 以下のどれがもっともらしいか(1)200,000円(2)400,000円(3)600,000円(4)800,000 円(5)1, 000,000円
2. xの回帰係数(回帰直線をy=α+βxと書いたときのβ) の推定値としてもっとも らしいのは以下のうちどれか. (1)10 (2)50 (3)100 (4)200 (5)250
2
解答
2.1 (
前回の問題
):
度数分布表
(1): まず度数の和は41. よってメジアンは21番目の値となる。今累積度数は、階級20-30 で4,階級30-40で10,階級40-50で30となるため、21番目の値は階級40-50となる。よっ てメジアンは階級40-50に含まれる
(2)階級20-30, 30-40,40-50,50-60,60-70の階級値はそれぞれ25,35,45,55,65。平均近似 の公式は[(階級値×度数)の和]/(度数の和)であり、これに代入すると、求める平均近
似は
25∗4 + 35∗6 + 45∗20 + 55∗10 + 65
41 =
100 + 210 + 900 + 550 + 65
41 =
1825 41 (1)
2.2 (
前回の問題
):
分割表
1. 満足した客のうち、甘口を注文した客の割合: 5/15 = 1/3 (列和との比)
2. すべての客のうち、辛口を注文して満足した客の割合: 10/175 = 2/37 (総和との比)
3. 辛口で満足する割合は10/140 = 1/14, 甘口では5/35 = 1/7, よって甘口の方が満 足する割合が高い(行和との比)
2.3 (
今週の問題
):
相関
1.
仮定した両替率の元で、pi = 100xi, qi = 100yiである。今標本平均について、
¯
pi =
1
n
n
∑
i=1
pi (2)
= 1
n
n
∑
i=1
100xi (3)
= 100×(1
n
n
∑
i=1 xi
)
(4)
= 100¯x (5)
同様にq¯= 100¯y. 従って
Spq =
1
n−1
n
∑
i=1
(pi−p¯)(qi−q¯) (6)
= 1
n−1
n
∑
i=1
(100xi−100¯x)(100yi−100¯y) (7)
= 1
n−1
n
∑
i=1
10000(xi−x¯)(yi−y¯) (8)
= 10000×( 1
n−1
n
∑
i=1
(xi−x¯)(yi−y¯)
)
(9)
= 10000Sxy (10)
2.
rpq =
∑n
i=1(pi−p¯)(qi−q¯)
√∑n
i=1(pi−p¯)2
√∑n
i=1(qi−q¯)2
(11)
=
∑n
i=1(100xi−100¯x)(100yi−100¯y) √∑n
i=1(100xi−100¯x)2
√∑n
i=1(100yi−100¯y)2
(12)
=
∑n
i=110000(xi−x¯)(yi−y¯) √∑n
i=110000(xi−x¯)2 √∑n
i=110000(yi−y¯)2
(13)
= 10000
∑n
i=1(xi−x¯)(yi −y¯)
100√∑n
i=1(xi−x¯)2 ×100
√∑n
i=1(yi−y¯)2
(14)
= 10000
∑n
i=1(xi−x¯)(yi−y¯)
10000√∑ni=1(xi−x¯)2
√∑n
i=1(yi−y¯)2
(15)
=
∑n
i=1(xi−x¯)(yi−y¯) √∑n
i=1(xi−x¯)2 √∑n
i=1(yi−y¯)2
(16)
= rxy (17)
2.4 (
今週の問題
):
回帰分析
1. x= 6000の時の回帰直線におけるyの値は600,000ほどであり、(3)が最も近い
2. 回帰直線は1で示した(x, y) = (6000,600,000)付近に加え、例えば(x, y) = (2000,200,000) 付近も通っている。この二点を通る直線の切片、傾きをa, bとしたとき、もとめる
回帰係数はbである。下記の連立方程式が成立する
600000 = a+ 6000b (18) 200000 = a+ 2000b (19)
これをとくとb= 100が得られるため、回答は(3)