統計学復習問題(1
月
26
日)
∗
1. 次の確率を求めてください(空欄を埋めてください)
• 確率変数Xが標準正規分布に従うとき(X ∼N(0,1)), (a) Pr[X ≤0 ] =
(b) Pr[X ≤1.96 ] =
(c) Pr[X ≥ −1.96 ] =
(d) Pr[−1.00≤X ≤1.96 ] =
• 確率変数Xが平均1,分散4の正規分布に従うとき(X ∼N(1,4)),
(a) Pr[X ≤0 ] という確率を求めてください.このとき,Z =
X−
r
とおくと,
Z∼N(0,1) なので,
Pr[X ≤0 ] = Pr
X−
q
≤
−
= Pr h
Z≤
i
=
(b) Pr[−1≤X ≤1.96 ]という確率を求めてください.
Pr[−1≤X ≤1.96 ] = Pr
−
≤X−
q
≤
−
= Prh ≤Z ≤
i
= PrhZ≤
i
−PrhZ ≤
i
=
2. センター試験の英語について,ある高校で無作為に5人の得点調査をしたところ{138,120,112,140,125}
という結果であった.
(b) この学校における英語の得点の(母集団)平均について,信頼係数0.95の信頼区間の
値を求めてください.
母集団平均をµ,標本平均をX¯,標本分散をS
2
とすると,T =
¯
X−µ √
S2/nとおくと,この
T は に従う.ここから数表を用いて
Pr
"
≤ ¯
X−µ p
S2/n ≤
#
= 0.95
となることも分かる.この式を変形して
0.95 = Pr
"
≤ ¯
X−µ p
S2/n ≤
# = Pr − v u u u u u u u t
≤µ≤ +
v u u u u u u u t
となるので信頼係数0.95の信頼区間は
− v u u u u u u u t , + v u u u u u u u t
となる(母集団平均µがこの区間に含まれる確率は0.95).したがって先ほど計算した 標本平均の値,標本分散の値を用いて信頼係数0.95の信頼区間の値は
(c) 全国の受験者の平均は131.08点であった.この学校の平均は131.08と異なっていると
言えますか?有意水準5%で仮説検定をしてください
1 母集団平均をµとし,帰無仮説H0: ,対立仮説H1:µ6= 131.08とする
2 有意水準は問題から5%と与えられている
3 検定統計量をT =
−
v u u u u
t
とすると,この検定統計量は
– 帰無仮説H0が正しいとき, に従い,
– 対立仮説H1が正しいとき, .
4 有意水準が5%なので,棄却域は( , )あるいは( , )
となる.
5 検定統計量の値は,
t=
−
v u u t
=
という結果から棄却域に .したがって帰無仮説 は
(d) 同校では前年も同じ調査をし,5人について調べたところ平均値は 135 点,分散値は 140であった.(難易度の変化は無視するとして)この学校の平均得点は変化していると
言えますか?有意水準5%で仮説検定をしてください
1 今年度母集団平均をµ,昨年度はµY とし,帰無仮説H0: µX =µY ,対立仮説H1:
µX< µY
2 有意水準は問題から5%と与えられている
3 検定統計量をZ=
v u u u u
t
とすると,この検定統計量は
– 帰無仮説H0が正しいとき, に従い,
– 対立仮説H1が正しいとき, .
4 有意水準が5%なので,棄却域は( , )となる.
5 検定統計量の値は,
z=
v u u
t
=
という結果から棄却域に .したがって帰無仮説 は
3. 内閣を支持するかどうかについて,無作為に500人に対して調査を行った.その結果218人
が支持すると回答し,282人が支持しないと回答した.この結果から支持率が50%未満で あるといえるかどうかを有意水準5%の仮説検定によって確認してください.
1 真の支持率(母集団比率)をpとし,帰無仮説H0: ,対立仮説H0:
とする.
2 有意水準は問題から5%と与えられている.
3 検定統計量をZ=
−
v u u u u
t
とすると,この検定統計量は
– 帰無仮説H0が正しいとき, に従い,
– 対立仮説H1が正しいとき, .
4 有意水準が5%なので,棄却域は となる.
5 検定統計量の値は,
z=
−
v u u t
=
という結果から棄却域に .したがって帰無仮説 は
4. 理科系,文科系学部に進学した学生それぞれ5000人を対象として,漢文に対する苦手科目
について調査した.次の表から理系文系間に差はないと言うことはできるでしょうか?
表 1: 文理別,漢文への好嫌
好き 嫌い 計
文系 1,600 3,400 5,000 理系 1,500 3,500 5,000 計 3,100 6,900 10,000
表2: 文理で好みに差がないときの期待度数
好き 嫌い 計
文系 5,000
理系 5,000
計 3,100 6,900 10,000
0 好みに差がないとき,調査対象から一人の人を選ぶとき,その人が『文系であるか理系
であるか』という事象と『好きか嫌いか』という事象は独立になる
– 文系である確率,理系である確率,好きである確率,嫌いである確率はそれぞれ
p1,•=
5000 10000 =
1
2, p2,•=
5000 10000 =
1
2, p•,1=
3100 10000 =
31
100, p•,2=
6900 10000 =
69 100
– 文系であるか理系であるか』という事象と『好きか嫌いか』という事象は独立であ
ると仮定の下でのそれぞれのセルの期待度数は
(1,1)セル: 10000×p1,•×p•,1= 1550, (2,1)セルも同じ結果
(1,2)セル: 10000×p1,•×p•,2= 3450, (2,2)セルも同じ結果
1 帰無仮説H0:漢文の好みに文理間で差はない,対立仮説H1:差がある.
2 有意水準は問題から5%と与えられている.
3 検定統計量は次ページの式を用いて
– 帰無仮説H0が正しいとき, に従い,
主要な結果のまとめ:
• 母集団分布が正規分布で,母集団平均がµ,母集団分散がσ
2
である変数について考える
• 大きさnの標本を無作為に選ぶとすれば,この標本はn個の確率変数を用いて以下のように
表現できる
{X1, X2, X3, . . . , Xn}
– このとき,各確率変数Xi(i= 1,2,3, . . . , n)は,Xi∼N(µ, σ
2
)という性質を持つ.
• 標本平均X¯ と標本分散S
2
は以下の様に定義される
¯
X= 1
n n X
i=1
Xi, S2
= 1
n−1
n X
i=1
(Xi−X¯)2
(1)
• 標本平均について
¯
X ∼N
µ,σ
2
n
, pX¯ −µ
σ2/n ∼N(0,1) :標準正規分布 (2)
• 標本平均と標本分散を用いて, ¯
X−µ p
S2
/n ∼t(n−1)
:自由度n−1のt分布 (3)
• 母集団分布が正規分布でないとき,(中心極限定理によって)以下の結果が近似的に成り立つ ¯
X−µ p
S2/n ∼N(0,1) :標準正規分布 (4)
• 標本平均の差について:二つの標本{X1, . . . , Xn}(母集団平均µX,母集団分散σ
2
X),{Y1, . . . , Ym}
(母集団平均µY,母集団分散σ
2
Y) ¯
X−Y¯ −(µX−µY)
p S2
X/n+S
2
Y/m
∼N(0,1) :中心極限定理による近似 (5)
表 3: 2次元分割表
B1 B2 計
A1 X11 X12 X1,• A2 X21 X22 X2,•
計 X•,1 X•,2 X
表 4: 列効果と行効果が独立な場合の2次元分割表
B1 B2 計
A1 X·p1,•·p•,1 X·p1,•·p•,2 X1,• A2 X·p2,•·p•,1 X·p2,•·p•,2 X2,•