練習問題(解答)

13 

Loading....

Loading....

Loading....

Loading....

Loading....

全文

(1)

練習問題1 (2012年4月19日出題)

問題1.順序尺度あるいは順序尺度データの例をあげなさい。 (解答)順序尺度の例

• アンケート調査での5段階による回答「そう思わない、あまりそう思わない、どちらとも 言えない、どちらかというとそう思う、そう思う」

• 債券の格付「Aaa, Aa, A, Baa, Ba, B, Caa, Ca, C」(Moody’sによる格付け)

問題2.ある大学では学生の総合成績を評価するのにGPA(Grade Point Average)を用いてい る。この大学2年生のA君のGPAは3.5,B君のGPAは2であった。A君はB君に向かって 「ぼくの成績は君の成績のちょうど1.5倍だね.もう少しがんばったら。」と言った。A君の発

言について測定の尺度の観点から批判しなさい。

(2)

練習問題2 (2013年4月26日出題)

問題1.30代の会社員を40名選んで年間所得(万円)を調査したところ、以下のデータを得 た。

310, 340,

410, 420, 430, 440, 470, 480,

510, 510, 520, 530, 540, 545, 560, 560, 580, 590,

610, 630, 640, 660, 670, 660, 680,

710, 730, 740, 745, 760, 780,

855, 860, 870, 870, 980,

1020, 1070, 1210,

1360

(1)ヒストグラムを描きなさい.ただし階級の区切りを0,100,200,300, . . .とすること。

(3)

(2)ヒストグラムを描きなさい.ただし階級の区切りを0,50,100,150,200,250, . . .とする こと。

Histogram of sal$salary

sal$salary

Frequency

0 200 400 600 800 1000 1200 1400

0

2

4

6

8

10

図 2: ヒストグラム

(3)このデータのメディアンを求めなさい。(1)で描いたヒストグラムの横軸にメディア ンの位置を矢印で示しなさい。

630 + 640

2 = 635 から,メディアンは635万円である.

(4)二つのヒストグラムの違いを書きなさい。

このデータに対しては、階級幅100のヒストグラムは山の形状がほぼなめらかで、分布の様子 がわかりやすい。一方、階級幅が50のヒストグラムは柱の高さの変化がはげしく、データの分 布の形状がわかりにくい。

(4)

練習問題3 (2013年5月10日出題) 問題1.以下の式を

P

記号を用いない式で書き表わしなさい.ただしaは数である.

(1) 5

X

i=1

xi =x1+x2+x3+x4 +x5

(2)

n X

i=1

xi =x1+x2+· · ·+xn

(3)

n X

i=1

x2

i =x

2 1+x

2

2+· · ·+x 2 n (4) n X i=1

(xi −a) = (x1−a) + (x2 −a) +· · ·+ (xn−a)

=x1+x2+x3+x4+· · ·+xn−na

問題2.以下の式を

P

記号を用いて書き表わしなさい. (1) x1+x2 +· · ·+xn=

n X

i=1

xi

(2) x2+x3 +x4+x5 = 5

X

i=2

xi

問題3.以下の式をが成り立つことを証明しなさい

n X

i=1

(xi−x) = 0¯

証明

n X

i=1

(xi−x) =¯ n X

i=1

xi+ n X

i=1

(x)¯

=

n X

i=1

xi− n X i=1 ¯ x = n X i=1

xi−nx¯

=

n X

i=1

xi− n X

i=1

(5)

練習問題4 (2013年5月17日出題)

問題1.データ(高校生のこづかい、単位千円)

4, 5, 5, 6, 6, 7, 7, 8, 9, 10, 10, 11, 12, 12, 15, 18, 20, 50

このデータについて以下の値を求めなさい.

(1) 第1四分位数=6, 第2四分位数=9.5, 第3四分位数=12 (2)範囲=50−4 = 46

(3)四分位範囲=12−6 = 6

問題2.(分散、標準偏差)以下は,あるクラスの英語の点数である. 2, 4, 6, 8, 10

(1)このデータの平均x¯を求めなさい. (2)このデータの分散S

2

xと標準偏差Sxを求めなさい.計算式も書く. 解答(1)

¯ x= 6

解答(2)

(x1−x)¯ 2

+ (x2 −x)¯ 2

+ (x3−x)¯ 2

+ (x4−x)¯ 2

+ (x5−x)¯ 2

=(26)2

+ (46)2

+ (66)2

+ (86)2

+ (106)2 =(4)2

+ (2)2 + 02

+ 22 + 42 =16 + 4 + 0 + 4 + 16 = 40

したがって S2

x =

40 5 = 8 標準偏差は

Sx =

(6)

練習問題5 (6月7日出題)(解答)

問題1.n個の個体について,二つの変数xとyについてデータ (x1, y1), (x2, y2), . . . , (xn, yn)

で与えられているとする.xとyの共分散および相関係数の定義を書きなさい. Sxy =

1 n

n X

i=1

(xi−x)(y¯ i−y),¯ r=

Sxy

SxSy

問題2.以下のデータは,ある中学のクラスの5人の(1週間の)数学の勉強時間(時間)と数 学の点数である.

勉強時間(xi) 数学の点数(yi) (xi−x)¯ (yi−y)¯ (xi−x)(y¯ i−y)¯

11 71 -2 -2 4

12 73 -1 0 0

13 72 0 -1 0

14 74 1 1 1

15 75 2 2 4

和 9

(1)表を完成させて,勉強時間と数学の点の共分散を求めなさい。(式も書く) ¯

x= 13, ¯y= 73である.これらを用いて表を完成させる.したがって共分散は

Sxy =

9 5 = 1.8 である.

(2)勉強時間と数学の点の相関係数を求めなさい。(式も書く) 以下の公式を用いて相関係数を求める.

r=

n X

i=1

(xi−x)(y¯ i−y)¯ v u u t n X i=1

(xi−x)¯ 2 n X

i=1

(yi−y)¯ 2

n X

i=1

(xi−x)¯

2

= (2)2

+ (1)2

+ (0)2

+ (1)2

+ (2)2 = 10

n X

i=1

(yi−y)¯

2

= (2)2

+ (0)2

+ (1)2

+ (1)2

+ (2)2 = 10

であるから,相関係数は r= √ 9

10×10 = 9

(7)

統計学入門 練習問題6 (6月28日実施,正答付き)

下の表は,郊外の五つの駅の周辺人口と各駅の1日平均乗車数のデータ(架空)である. xi 周辺人口(万人) yi 駅乗車数(万人)

5 5

6 8

7 7

8 6

9 9

(1)散布図にデータを描きなさい

(2)以下の表を完成させて、回帰式を求めなさい. xi yi (xi−x)¯ (yi−y)¯ (xi−x)¯

2

(xi−x)(y¯ i−y)¯

5 5 -2 -2 4 4

6 8 -1 1 1 -1

7 7 0 0 0 0

8 6 1 -1 1 -1

9 9 2 2 4 4

和 0 0 10 6

¯

x=7, y¯= 7

b =6/10 = 0.6, a= 70.6×7 = 2.8 である.回帰式は

ˆ

y= 2.8 + 0.6x

(3)回帰直線を散布図上に描きなさい。

(8)

統計学入門 練習問題7(7月19日)(正答) 問題1

(1) nCr =

n! r!(nr)!

(2) 6C3 = 6! 3!3! =

6×5×4 3×2 = 20

(3) 6C1 = 6! 1!5! = 6

(4) 6個の科目から3個の科目を選ぶ場合の数.

答え: 6C3 =

6! 3!3! = 20 であるから20通り. 問題2

1から4までの数が書かれたカードがそれぞれ1枚ずつある.これらのカードの中から2枚の カードを無作為に引く試行を考える.

(1) この試行の標本空間を書きなさい.

Ω ={(1,2), (1,3), (1,4), (2,3), (2,4), (3,4) }

ただし,たとえば(1,2)は1のカードと2のカードが引かれる結果を意味する. (2) 引かれた2枚のカードに1が書かれたカードが含まれる確率を求めなさい.

P(1が書かれたカードが含まれる) =P({(1,2), (1,3), (1,4)}) = 3 6 =

1 2 問題3

(1) コインを4回投げるとき,4回とも裏が出る確率を求めなさい.

答え:この試行の結果を,たとえば表, 表, 裏, 裏の順になる結果をHHTTと表すとする. P({TTTT}) = 1

16

(2) コインを4回投げるとき,少なくとも1回表が出る確率を求めなさい. 答え:

(9)

統計学入門 練習問題8 (9月13日) 問題1

ある会社が販売するコンピュータには0.1の割合で不良品が含まれている.不良品は使用開始 1年以内に故障する確率が0.5であり,不良品でないコンピュータではこの確率は0.01である. この会社から買ったコンピュータが使用開始一年以内に故障する確率を求めよ.

答え:事象A,Bを以下のように定義する.

A=買ったコンピュータが一年以内に故障する B =買ったコンピュータが不良品である

このときA={A∩B} ∪ {A∩Bc}であるから P(A) =P(AB) +P(ABc

) =P(B)P(A|B) +P(Bc)P(A

|Bc)

=0.1×0.5 + 0.9×0.01 = 0.05 + 0.009 = 0.059

である. 問題2:

(1) さいころを4回投げるときに,3の目が1回だけでる確率を求めよ. 答え:この事象の確率は

4C1

1 6

5 6

3

=4× 5 3

64 = 5

3

9×62 = 75 324 である.

(2) さいころを4回投げるときに,3の目が2回だけでる確率を求めよ. 答え:この事象の確率は

4C2

1 6

2

5 6

2

= 4! 2!2! ×

52 64 =6× 5

2

64 = 25 216 である.

(3) さいころを4回投げるときに,3の目がでる回数をXで表す.Xの確率分布は何か?正確 に答えなさい.また,Xの期待値を求めよ.

答え: Xの確率分布は二項分布B(4,1/6)である.

Xが二項分布B(n, p)にしたがうときXの期待値はnpであるから、この場合,期待値は 4 6 =

(10)

統計学入門 練習問題9

問題1(連続型の一様分布) Xが区間[0,1]上の一様分布にしたがうとき,P(0≦X ≦0.5)の 値を表す部分に斜線を引きなさい.

−0.5 0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

x

問題2 下の図は平均0,分散1の正規分布N(0,1)(標準正規分布)の確率密度関数である.

−4 −3 −2 −1 0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

x

−4 −3 −2 −1 0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

x

(1)Xが正規分布N(0,1)にしたがうとする.左の図上で,P(−1≦X ≦1)の値を表す部 分に斜線を引きなさい.

(11)

問題3 標準正規分布N(0,1)の確率密度関数のグラフを描きなさい.解答:

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

x

...

図 3: 標準正規分布

問題4 正規分布N(4,1)の確率密度関数のグラフを描きなさい.解答:

0 2 4 6 8

0.0

0.1

0.2

0.3

0.4

x

(12)

統計学入門 練習問題11(11月29日出題) 問題1

あるコンビニでは8月に,ポカリスエット(500ml)とおーいお茶(500ml)が多く売れる。8月の 一日に売れるポカリスエットの本数を確率変数X,おーいお茶の本数を確率変数Y で表すとしよ う。X, Y の期待値はE(X) = 90,E(Y) = 80であり,分散はそれぞれV(X) = 25,V(Y) = 9 であるとする。また,X と Y の共分散は Cov(X, Y) = 10 である。両方の合計本数の期待値 と分散を求めなさい。

解答:

E(X+Y) =E(X) +E(Y) = 90 + 80 = 170

V(X+Y) =V(X) +V(Y) + 2Cov(X, Y) = 25 + 9 + 2×10 = 54

問題2

あるスーパーにおける1日の食料品の売上をXとする.雑貨の売上をY とする(単位は万円). XとY は独立であり,Xは正規分布N(300,100)にしたがい,Y は正規分布N(100,44) にした がうと仮定する.合計金額X+Y の確率分布を求めなさい.

解答: X+Y の期待値は300 + 100 = 400(万円),分散は100 + 44 = 144である。したがって講 義ノート定理7.2からX+Y の確率分布は 正規分布N(400, 144)である.

問題3

ある大学の陸上部では,400mリレー走の練習をしている.A君,B君,C君,D君の順に第1, 2,3,4走者である.400mリレー走でのA君,B君,C君,D君の100mのタイム(秒)は独立 でそれぞれ正規分布N(13,0.36), N(12,0.25), N(12,0.25),N(11,0.35)に従うものとする.この チームの400mリレー走のタイムの確率分布を求めよ.

解答:

(13)

統計学入門 練習問題12(12月6日出題) 問題1(母比率の信頼区間)

標本の大きさnが大きいときの,母比率pに対する信頼係数95%の信頼区間の公式を書きなさ い.

解答:

"

ˆ

p1.96

r

ˆ

p(1p)ˆ

n , pˆ+ 1.96

r

ˆ

p(1p)ˆ n

#

問題2(母比率の推定値と信頼区間)

ある選挙区で,100人の有権者を無作為に抽出して調べたところ,A党の支持者が40人であっ た.

(1)標本におけるA党の支持率pˆを求めなさい.

(2)この選挙区におけるA党の支持率pに対する信頼係数95%の信頼区間を求めよ.( √

24;4.9 を使うこと.)

解答:解答:(1) 標本における比率はpˆ= 0.4である.(2)

r

ˆ

p(1p)ˆ

n =

r

0.4(10.4)

100 = r 0.24 100 = r 24

10000 = 4.9/100 = 0.049 であるから,

1.96×

r

ˆ

p(1p)ˆ

n = 1.96×0.049 = 0.096 したがって,pに対する信頼係数95%の信頼区間は

[0.40.096, 0.4 + 0.096] = [0.304, 0.496] となる.

問題3(母比率の信頼区間)

ある工場で,製品の中から無作為に400個を抽出して調べたところ,40個の不良品があった. この工場で作られる製品の不良率pに対する信頼係数95%の信頼区間を求めよ.

解答:解答:標本における比率はpˆ= 0.1である.

r

ˆ

p(1p)ˆ

n =

r

0.1(10.1)

400 =

r

0.09 400 =

0.3

20 = 0.015 であるから,

1.96×

r

ˆ

p(1p)ˆ

n = 1.96×0.015 = 0.0294 したがって,pに対する信頼係数95%の信頼区間は

Updating...

参照

Updating...

関連した話題 :