• 検索結果がありません。

1000 と定める.

ドキュメント内 Part () () Γ Part , (ページ 137-151)

帰無仮説: m

A

= m

B

. v.s. 対立仮説: m

A

̸ = m

B

検定する基準

m = m

A

= m

B

と仮定する.

具体的には

P ( | X Y | ≥ 0.79) 0.05 か否かを判定する.

計算方法は

X

1

+ X

2

+ . . . + X

10

は初めにまとめたこと1を多用して N (m, 10) にしたがうとわかる.

さらに, X = X

1

+ X

2

+ . . . + X

10

10

初めにまとめたこと2を使って XN (m, 1/10) に従うとわかる.

同じく Y N(m, 1/10) に従うから X YN (0, 1/5) に従う.

Z =

5(X Y ) とおくと, Z N (0, 1) に従う.

実際に計算すると

P( | X Y | ≥ 0.79) = P ( | Z | ≥ 1.76) = 0.4608 × 2 = 0.9216

したがって,

許容範囲内だから身長が同じと仮定しても問題ない.

(2) 設定:身長はそれぞれ麻生大学では N (m

A

, 0.1) に小平大学では N (m

B

, 0.1) に従 うとする.麻生大学 1000 人の身長を X

1

, X

2

, . . . , X

1000

とする.小平大学 1000 の身長を Y

1

, Y

2

, . . . , Y

1000

とする.さらに,

X = X

1

+ X

2

+ . . . + X

1000

1000 , Y = Y

1

+ Y

2

+ . . . + Y

1000

1000 と定める.

帰無仮説: m

A

= m

B

. v.s. 対立仮説: m

A

̸ = m

B

検定する基準

m = m

A

= m

B

と仮定する.

具体的には

P (|X Y | ≥ 0.79) 0.5 か否かを判定する.

計算方法は

XN(m, 1/1000) に YN (m, 1/1000) に従うから X Y N (0, 1/5) に従う.

Z =

5(X Y ) とおくと, ZN (0, 1) に従う.

実際に計算すると

P (|X Y | ≥ 0.79) = P (|Z | ≥ 17.6) 0.999

したがって,

許容範囲内ではないから身長が同じではない.

このことから,(1)の容認つまり仮説を採択することを消極的容認という.

例題23.4. ある科目の期末試験を実施した.男子200人の平均点は55点,女子350人の平均点

は52点であった.例年の経験から,男子は分散が42点2で,女子は分散が84点2であった.

(1) mx=my =mとして,X1 ∼N(m,42),Y1∼N(m,84)のとき,Z =X200−Y350 の 従う分布は何か?

(2) 男子と女子との平均点に隔たりがあると言えるか?危険率5パーセントで検定せよ.

確率変数AN(0,1)に従うとき,P(A >1.96) = 0.025が成り立つ.

例題23.4の解答.

(1) N(0,0.72)

(2) 言える.実際に,実際に次の検定をしてみる.

(a) H0:成績に男女差はない.

(b) H1:成績に男女差はある.

(a)より,

Z

0.7 ∼N(0,1) であるから,

P ( Z

0.7 >1.96 )

= 0.025 データを代入して,

Z

0.7 = 5552 0.7 =30

7

となるが,この数が1.96より大きいから,H0は棄却される.よって,成績に男女差はあ るといえる.

23.2. 分散がわかっていないとき等平均の検定. 分散が不明の場合は,分散を等しいと仮定して

よいか確認してから平均を計算する.

確率変数X1, X2, . . . , XMN(mx, σ2)に従い,確率変数Y1, Y2, . . . , YNN(my, σ2)に従う とする.mx, myはどちらも未知とする.このとき,X, Y はそれぞれ平均として,

W =

M N M+N

(X1+X2+· · ·+XN

N −Y1+Y2+· · ·+YM

M

) vu

uu t 1

M+N−2

∑M

j=1

(Xj−X)2+

N k=1

(Yk−Y)2

とおくと,W は自由度(M+N−2)のt-分布に従う.このことを用いて,分散が等しいかそう ではないかの検定ができる.

(1) 分散が等しいと確認できる場合は分散を等しいと仮定して平均を検定する.

(2) 分散が等しくないと言わざるを得ない場合はここでは触れないこととする.(例題23.5(エ) を参照)ウエルチの検定をすることになる.

例題23.5.

(1) ある病気の患者5人と健康者12人について,血清中のカルシウムの量を比較した.

(a) ある病気の患者5人のカルシウムは平均が12.9(mg/ml)で,分散が0.5520(mg2/ml2) であった.

(b) 健康者12人のカルシウムは平均が9.9(mg/ml)で,分散が0.1600(mg2/ml2)であった.

(a),(b)の情報を踏まえて,以下の問に答えよ.

(ア) 等分散の検定をすること.危険率5パーセントで検定せよ.

(イ) 双方の血清量に違いがあると言えるか?危険率1パーセントで検定せよ.

(2) さらに患者3人を加えて情報を更新した.

(c) 患者8人のカルシウムは平均が13.45(mg/ml)で,分散が3.0250(mg2/ml2)であった.

(b),(c)の情報を踏まえて,以下の問に答えよ.

(ウ) 等分散の検定をすること.危険率1パーセントで検定せよ.

(エ) 双方の血清量に違いがあると言えるか?危険率1パーセントで検定せよ.

確率変数D1, D2が自由度(4,11),(7,11)のF-分布に従うとき,

P(D1>4.28) = 0.025, P(D2>5.86) = 0.005

が知られている.さらに,自由度15,7のt-分布に従う確率変数D3, D4 につき,

P(D3>2.947) = 0.005, P(D4>3.499) = 0.005 が知られている.

例題23.5の解答.

(1) (ア) X1, X2, . . . , X5N(mx, σ2)に,Y1, Y2, . . . , Y12N(my, σ2)に,従うとする.こ のとき,

X= 1

5(X1+X2+· · ·+X5), Y = 1

12(Y1+Y2+· · ·+Y12), Z =

( 1 4

5 i=1

(Xi−X)2 )

÷ (

1 11

11 i=1

(Yi−Y)2 )

とおくと,Zは自由度(4,11)のχ2-分布に従う.したがって,P(Z >4.28) = 0.025 である.ここで,Zの定義式に

1 5

5 i=1

(Xi−X)2= 0.5520, 1 11

11 i=1

(Yi−Y)2= 0.1600 を代入すると,

Z= 5

4×0.5520÷ (12

11×0.16 )

= 3.953<4.28

であるから,5パーセントの有意水準で分散に違いはないと言える.

(イ) σx=σyと考えても問題がないことがわかった.mx=my と仮定して,(ア) と同 じ状況を考える.

X−Y

√1/5 + 1/11 ∼N(0, σx2), 1 σx2

5 i=1

(Xi−X)2+ 1 σx2

12 i=1

(Yi−Y)2∼χ2(15) であるから,

U = X−Y

√1/5 + 1/11÷ vu ut1

15 ( 5

i=1

(Xi−X)2 )

+ 1 15

(12

i=1

(Yi−Y)2 )

は自由度15のt-分布に従う.ここで,U の定義式に 1

5 ( 5

i=1

(Xi−X)2 )

= 0.5520, 1 12

(11

i=1

(Yi−Y)2 )

= 0.1600, X= 12.9, Y = 9.9 を代入すると,

U = 3

√16/55

√ 5

15·0.5520 +12

15·0.1600 = 3.106>2.947

となり,帰無仮説は棄却される.したがって,違いがないとは言えない.つまり,健 康な人と患者では血清量に差異が認められる.

(2) (ウ) X1, X2, . . . , X8N(mx, σ2)に,Y1, Y2, . . . , Y12N(my, σ2)に,従うとする.こ のとき,

X= 1

8(X1+X2+· · ·+X8), Y = 1

12(Y1+Y2+· · ·+Y12), Z =

( 1 7

8 i=1

(Xi−X)2 )

÷ (

1 11

12 i=1

(Yi−Y)2 )

とおくと,Zは自由度(7,11)のχ2-分布に従う.したがって,P(Z >5.86) = 0.025 である.ここで,Zの定義式に

1 8

8 i=1

(Xi−X)2= 3.0250, 1 11

11 i=1

(Yi−Y)2= 0.1600 を代入すると,

Z =8

7 ×3.0250÷ (12

11×0.16 )

= 19.8>5.86

であるから,1パーセントの有意水準で分散に違いが生じていると言える.

(エ) 【ウエルチの検定,確率統計範囲外】分散が等しいと仮定する.

T = (X−Y)÷

S2X 7 +SY2

11

が自由度νt-分布に近似的に従う.ここで,

ν = (

s2x 7 +s2y

11 )2

÷ (

s2x 73 + s2y

113 )

= 7

である.(13.459.9)÷

√3.025 7 +0.16

11 = 5.3>3.5 となるので,違いがないとは 言えない.つまり,健康な人と患者では血清量に差異が認められる.

例題23.6. ある予備校の模試8回受けた学生A君がいる.成績は次の通りであった.

69,65,70,58,62,69,66,61 62点を越えるとV大学には合格できるといわれている.

(1) 合格可能性を判定せよ.有意水準は95パーセントとする.

(2) この学生の平均点を信頼度95パーセントで推定せよ.

ただし,自由度7のt-分布に従う確率変数Kにつき,

P(K >1.895) = 0.05, P(K >2.365) = 0.025 が知られている.

例題23.6の解答. データの整理をする.

回数 1 2 3 4 5 6 7 8 平均 得点 69 65 70 58 62 69 66 61 65 得点の2乗 4761 4225 4900 3364 3844 4761 4356 3721 4241.5

(1) 帰無仮説H0を「A君の成績が平均点が62点の正規分布に従う」とし,対立仮説H1

「A君の成績が平均点が62点以上の正規分布に従う」とする.平均点は65点,不偏分 散は √

8

7(得点の2乗の平均平均2) =

√8

7(4241.5652) = 4.34 点である.X1, X2, . . . , X8N(62, σ2)に従うとき,

Z= X1+X2+· · ·+X862·8

8 ÷

vu ut1

7

8 j=1

(Xj−X)2

8·6562

4.34 = 1.955>1.895であるから,H0が棄却される.したがって,H1が採択さ れることになり,A君の合格は確実と言える.

(2)

8·m−65

4.34 =±2.365を解いて,[61.4,69.6]を得る.

【注意】(1)では片側検定を,(2)では両側に推定しているため,(1)で有意となった62点が信頼 区間に現れる.検定の種類によって,用いるt-分布表の値が違うために片側検定,両側検定,危 険率,信頼度が重要になる.

例題23.7. ある科目の期末試験を実施した.男子800人の平均点は62.3点,女子600人の平均

点は62点であった.例年の経験から,男子は分散が36点2で,女子は分散が27点2であった.

(1) mx=my =mとする.X1 ∼N(m,36),Y1∼N(m,27)のとき,Z =X800−Y600 の 従う分布は何か?

(2) 男子と女子との平均点に隔たりがあると言えるか?帰無仮説と対立仮説を述べてから,危 険率は5パーセントとして検定をせよ.

確率変数AN(0,1)に従うとき,P(A >1.96) = 0.025が成り立つ.

23.7の解答.

(1) V[Z] = 36 800 + 27

600 = 9 200 + 9

200 = 9

100 より,Z ∼N(0,0.32) (2) 帰無仮説H0と対立仮説H1は次の通りである.

(a) H0:男子の平均点と女子の平均点は同じである.

(b) H1:男子の平均点と女子の平均点は異なる.

Z/0.3にデータを代入しても,0.33であるから,【結論】男子の平均点と女子の平均点に

隔たりがあると言えない.

単純に,男子の平均点が女子より高く,母集団が女子よりも男子のほうが大きいという理由だけ で,有為になるわけではないから注意しよう.

例題23.8. ある科目の期末試験を実施した.男子216人の平均点は68点,女子108人の平均点

は69点であった.例年の経験から,男子は分散が108点2で,女子は分散が54点2であった.

(1) mx=my =mとする.X1∼N(m,108),Y1∼N(m,54)のとき,Z =X216−Y108の 従う分布は何か?

(2) 男子と女子との平均点に隔たりがあると言えるか?危険率は5パーセントとして検定を せよ.

例題23.8の解答.

(1) N(0,1)に従う.

(2) 言えない.

例題 23.9. ある予備校で行う英語の試験の分散は256点2 であるとわかっている.冬期講習の

成果を判定したい.(a),(b)はそれぞれ講習前と講習後の成績である.

(a) 140,139,80,73,105,162,170,157,103,140,101,139,120,102 (b) 192,178,173,167,138,134,180,137,156,167

受験者が一致していないため,ここでは受験者は講習前と講習後で完全に違うと仮定する.以下 の検定をせよ.

(1) 冬期講習の成果があって,10点以上点数があがると考えられるか?

(2) 分散が当てにならない場合も少なくとも冬期講習の前後で分散は変化しないと仮定して,

10点以上点数があがると考えられるか?

二つの検定において,危険率は1パーセントとする.また,標準正規分布に従う確率変数Xが 1.96以上をとる確率は0.01で,t(22)に従う確率変数Y が2.508以上をとる確率は0.01である.

例題23.9の解答.

(1) X1, X2, . . . , X14∼N(m, σ2)とY1, Y2, . . . , Y10∼N(m, σ2)を仮定する.帰無仮説H0と 対立仮説H1はそれぞれ次のように与えられる.

(a) H0:m=m10 (b) H0:m < m10

(2) 点数が等しいことを検定しているわけではなく,点数が10点差開いていることを検定し ているので,まずは換算表を作る.

冬期講習前 冬期講習後 冬期講習後の点数換算(−10点)

140 192 182

139 178 168

80 173 163

73 167 157

105 138 128

162 134 124

170 180 170

157 137 127

103 156 146

140 167 157

101 139 120 102

平均 × 平均

123.64286 × 152.2

(3) σ2= 256であるとする.

(a) σ2= 256であるとすると,

X1+X2+· · ·+X14

14 −Y1+Y2+· · ·+Y10

10 ∼N

( 0,σ2

14+σ2 10

)

である.つまり,

(X1+X2+· · ·+X14

14 −Y1+Y2+· · ·+Y10

10

) (σ2 14+σ2

10 )1/2

∼N(0,1) である.

(b) データを代入すると,

(X1+X2+· · ·+X14

14 −Y1+Y2+· · ·+Y10

10

) (σ2 14+σ2

10 )1/2

= 152.2123.6428571

√256/14 + 256/10 =28.55714286

6.62462937 = 4.310753 となる.

(c) P(X >1.96) = 0.01より,H0は棄却される.

(d) よって,冬期講習の成果が認められる.

(4) 分散に関しては何も知らないとする.

(a) 確率変数VWV =

14 j=1

(

Xj−X1+X2+· · ·+X14

14

)2

, W =

10 j=1

(

Yj−Y1+Y2+· · ·+Y10

10

)2

, と定めると,

(X1+X2+· · ·+X14

14 −Y1+Y2+· · ·+Y10 10

) ( 1 14+ 1

10 )1/2

÷

√ 1 22V + 1

22W ∼t(22) である.

(b) さらに,次のような表を作る.

冬期講習後 冬期講習前 267.55612 888.04 235.84184 249.64 1904.699 116.64 2564.699 23.04 347.55612 585.64 1471.2704 795.24 2148.9847 316.84 1112.699 635.04 426.12755 38.44 267.55612 23.04 512.69898

235.84184 13.270408 468.41327

偏差平方和 偏差平方和 11977.214 3671.6 (c) データを代入すると,

(152.2123.6428571)÷

√11977.214

22 +3671.6 22 ÷

√ 1 10+ 1

14 = 2.5860908 となる.

(d) P(Y >2.508) = 0.01より,H0は棄却される.

(e) よって,冬期講習の成果が認められる.

23.3. 対比較の検定. データが関連している場合は,データー内の情報は独立とはみなせないの

で,差をとって検定する.

例題23.10 (【エクセル使用】). 血圧を5あげるとされる12人に興奮剤を与える.血圧を測定

したところ,次の表を得た.

被験者コード 1 2 3 4 5 6 7 8 9 10 11 12 前 106 107 100 104 110 98 120 108 120 115 106 110 後 109 115 108 111 111 107 112 105 121 117 100 112 (1) X1, X2, . . . , X12N(5, σ2)に従うとする.

X = 1

12(X1+X2+· · ·+X12), S= vu ut1

12

12 j=1

(Xj−X)2, T =

11·Xj5 S と定める.Tの従う分布は何か?

(2) 12人の血圧の変化(後-前)のデータの平均を求めよ.

(3) 12人の血圧の変化(後-前)のデータの分散を求めよ.

(4) この興奮剤は血圧を5上げていると言えるか?

ただし,自由度11のt-分布に従う確率変数W につき,P(W >1.8) = 0.95である.

例題23.10の解答. 対比較の場合は差をとったものを表に加える必要がある.つまり,次のよう

に表にデータを加える.

被験者コード 1 2 3 4 5 6 7 8 9 10 11 12 前 106 107 100 104 110 98 120 108 120 115 106 110 後 109 115 108 111 111 107 112 105 121 117 100 112 変化量=後-前 +3 +8 +8 +7 +1 +9 8 3 +1 +2 +4 +2 (1) 自由度11のt-分布に従う.

(2) 1

12(3 + 8 + 8 + 7 + 1 + 983 + 1 + 2 + 4 + 2) = 2 (3) 1

12

((32)2+ (82)2+ (82)2+ (72)2+ (12)2+ (92)2+ (82)2 +(32)2+ (12)2+ (22)2+ (42)2+ (22)2)

= 28.2

(4) 変化量をX1, X2, . . . , X12と表して,それぞれがN(m, σ2)に従うと仮定する.帰無仮説 をH0 :m= 5,対立仮説をH1:= 5とする.(1)のTに与えらえている情報を代入 すると,

11× 52

28.2 = 1.87>1.8 であるから,棄却域に与えられたデータが入っては いないため,血圧を5しか上げていないという仮説は棄却できない.

例題23.11 (【エクセル使用】). ○○大学の2年生で,今年と去年の2年とも,インフルエンザ

にかかった学生のうち,去年は予防接種を受けていないが,今年は予防接種を受けた学生の発熱 日数を調べた.予防接種は発熱日数を下げると期待される.医学科の学生のデータに基づき,予 防接種の効果があるかを危険率5%で検定せよ.

学生1 学生2 学生3 学生4 学生5 学生6 学生7 学生8

去年の発熱日数 5 7 2 1 8 1 5 7

今年の発熱日数 4 5 2 1 6 4 6 2

自由度5,6,7,8のt-分布に従う確率変数A5, A6, A7, A8につき,

P(A5>2.571) = 0.025, P(A6>2.447) = 0.025, P(A7>2.365) = 0.025, P(A8>2.306) = 0.025, P(A5>2.015) = 0.05, P(A6>1.943) = 0.05, P(A7>1.895) = 0.05, P(A8>1.860) = 0.05 が知られている.

例題23.11の解答.

24. 等分散の検定

等分散の検定の時は平均がわかっていない状況をとりあえずは想定してよい.

確率変数X1, X2, . . . , XMN(mx, σ2)に従い,確率変数Y1, Y2, . . . , YNN(my, σ2)に従う とする.mx, myはどちらも未知とする.このとき,X, Y はそれぞれ平均として,

W = 1

M 1

M j=1

(Xj−X)2÷ 1 N−1

N k=1

(Yk−Y)2 とおくと,Wは自由度(M 1, N1)のF-分布に従う.

例題24.1. きゅうりの収穫量がある肥料Qによって変わるかどうかを調べる.13地区を6地区,

7地区に分けて,6地区にQを散布してから,きゅうりを収穫した.始めの6地区の平均は34ト ン,分散2.56トン2,残りの7地区の平均は30トン,分散3.81トン2であったとする.

(1) 確率変数X1, X2, . . . , X6N(m1, σ2)に,確率変数Y1, Y2, . . . , Y7N(m2, σ2)に従う とする.

X= 1

6(X1+X2+· · ·+X6), Y =1

7(Y1+Y2+· · ·+Y7) と定める.

U =1 5

6 j=1

(Xj−X)2, V = 1 6

7 j=1

(Yj−Y)2 とおく.U/V の従う分布は何か?

(2) 等分散の検定をすること.危険率5パーセントで検定せよ.

(3) 確率変数KX, KYKX= 1

6

6 j=1

(Xj−X)2, KY =1 7

7 j=1

(Yj−Y)2

と定める.確率変数W =

√42

13(X−Y)÷

√6KX 11 +7KY

11 の従う分布は何か?

(4) Qに効果があると言えるか?危険率5パーセントで検定せよ.

自由度(5,6)のF-分布に従う確率変数D1と自由度11のt-分布に従う確率変数D2につき,

P(D1>6) = 0.025, P(D1<0.142) = 0.025, P(D2>2.2) = 0.025 が知られている.

例題24.1の解答.

(1) 自由度(5,6)のF-分布 (2) 0.142< 6

5·2.56÷ (7

6 ·3.81 )

<6より,分散に違いはない.

ドキュメント内 Part () () Γ Part , (ページ 137-151)

関連したドキュメント