統計学:復習と練習問題
担当者:
高木
真吾
http://sites.google.com/site/hustat2017/
試験について
試験について
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 3 / 57
■
参照物の持ち込み不可
■
試験時間は
90
分(2月2日10
:
30から12:00)
.
■
試験範囲は,標本理論,母数の推定(信頼区間の推定)
,仮説検定(母集団平
均・分割表)
■
(第8回以降に相当)
問題1:確率変数の復習
正規分布表の利用,確率変数の標準化
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 5 / 57
■
確率変数
◆
実現する前はどういう値が出るかは不明
◆
どの値がどういう確率で実現するかに関する規則は分かっている
◆
この規則をあらわしているものが(連続型確率変数の場合は)密度関数
■
標準正規分布(平均0,分散1)に従う確率変数の密度関数は次の図
■
正規分布に従う確率変数の確率密度は,二つのパラメータ
µ
と
σ
2
に
依存
■
ある区間,たとえば(
-2 ,0
)という区間のどこかで実現する確率の大き
さは,この区間の面積に対応している.
■
正規分布の数表は,標準正規分布に従う確率変数について,ある点cよ
図1:
µ
と
σ
2
を変化させた
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 6 / 57
■
µ
と
σ
2
はそれぞれ平均(中心の位置)
,分散(散らばりの程度)を示す
-4 -2 0 2 4
0.0
0.2
0.4
0.6
0.8
正規分布に従う確率変数の密度関数
x
cbind(y1, y2, y3)
µ =0 , σ
2
=1
µ = −2 , σ
2
=0.25
µ =1 , σ
2
図2:正規分布に従う確率変数の密度関数と
確率
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 7 / 57
■
正規分布に従う確率変数
X
は,ある区間
(
a, b
)
で
,
どういう確率で実現
するか
◆
確率1.
Pr[
−
2
< X <
0 ]
,2.
Pr[
X >
2 ]
■
つまり確率の大きさは,図の面積で表現される(曲線全体では1)
.
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
正規分布に従う確率変数の密度関数
x
数表の利用
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57
■
正規分布の表から
Pr[
Z
≤
1
.
96 ] = 0
.
5 + 0
.
475 = 0
.
975
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
Pr[ X > 1.96 ], Pr[ X < -1.96 ]
x
y1
µ =0 , σ
2
=1
■
Pr[
Z
≥
1
.
96 ]
=?
数表の利用
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57
■
正規分布の表から
Pr[
Z
≤
1
.
96 ] = 0
.
5 + 0
.
475 = 0
.
975
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
Pr[ X > 1.96 ], Pr[ X < -1.96 ]
x
y1
µ =0 , σ
2
=1
■
Pr[
Z
≥
1
.
96 ]
=?
= 1
−
0
.
975 = 0
.
025
数表の利用
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57
■
正規分布の表から
Pr[
Z
≤
1
.
96 ] = 0
.
5 + 0
.
475 = 0
.
975
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
Pr[ X > 1.96 ], Pr[ X < -1.96 ]
x
y1
µ =0 , σ
2
=1
■
Pr[
Z
≥
1
.
96 ]
=?
= 1
−
0
.
975 = 0
.
025
確率変数の標準化(基準化)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 9 / 57
■
平均や分散がどのようなものであっても,その確率変数から平均を引き,
標準偏差で割ると平均が0,分散が1になる
■
例)確率変数
X
について,平均
E
[
X
] =
µ
,分散
V
[
X
] =
σ
2
とする
■
例)このとき,
Y
=
X
−
µ
√
σ
2とする
■
例)新しく定義された
Y
は必ず平均0,分散1となる(
E
[
Y
] = 0
,
問題1:解答例
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 10 / 57
次の確率を求めてください(空欄を埋めてください)
■
確率変数
X
が標準正規分布に従うとき(
X
∼
N
(0
,
1)
)
,
1.
Pr[
X
≤
0 ] =
0.500
2.
Pr[
X
≤
1
.
96 ] =
1-
Pr[
X
≥
1
.
96 ]
= 1-0.025 = 0.975
3.
Pr[
X
≥ −
1
.
96 ] = Pr[
X
≤
1
.
96 ]
= 0.975
4.
Pr[
−
1
.
00
≤
X
≤
1
.
96 ]
= Pr[
X
≤
1.96
]
−
Pr[
X
≤
-1.00
]
=
0.9750 - 0.1587 = 0.8163
◆
ただし,
Pr[
X
≤ −
1
.
00 ]
については,
Pr[
X
≤ −
1
.
00 ]
=
Pr[
X
≥
1
.
00 ]
図解:
Pr[
−
1
.
00
< X <
1
.
96] = Pr[
X <
1
.
96]
−
Pr[
X <
−
1
.
00]
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 11 / 57
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
Pr[-1.00<X<1.96] = Pr[X<1.96] - Pr[X<-1.00]
x
y1
µ =
0 ,
σ
2図解:
Pr[
X
≤ −
1
.
00] = Pr[
X
≥
1
.
00]
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 12 / 57
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
Pr[Z>1.0]=1-0.8413=0.1587 (Pr[Z<1.0]=0.8413)
x
y1
問題1:解答例
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 13 / 57
■
確率変数
X
が平均1,分散4の正規分布に従うとき(
X
∼
N
(1
,
4)
)
,
1.
Pr[
X
≤
0 ]
という確率を求めてください.このとき,
Z
=
X
−
1
r
4
とおく
と,
Z
∼
N
(0
,
1)
なので,
Pr[
X
≤
0 ]
=
Pr
X
−
1
q
4
≤
0
q
−
1
4
=
Pr
h
Z
≤
- 0.5
i
=
0.3085
図解:
Pr[
X
≤ −
0
.
50] = Pr[
X
≥
0
.
50]
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 14 / 57
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
Pr[Z>0.5]=1-0.6915=0.3085 (Pr[Z<0.5]=0.6915)
x
y1
問題1:解答例
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 15 / 57
■
確率変数
X
が平均1,分散4の正規分布に従うとき(
X
∼
N
(1
,
4)
)
,
2.
Pr[
−
1
≤
X
≤
1
.
96 ]
という確率を求めてください.
Pr[
−
1
≤
X
≤
1
,
96 ]
=
Pr
-1
−
1
q
4
≤
X
q
−
1
4
≤
1.96
q
−
1
4
=
Pr
h
-1.00
≤
Z
≤
0.48
i
=
Pr
h
Z
≤
0.48
i
−
Pr
h
Z
≤
-1.00
i
=
0.6844-0.1587 =0.5257
■
.
.
.
Pr[
Z
≤ −
1
.
0] = Pr[
Z >
1
.
0] = 0
.
1587
図解:
Pr[
X
≤ −
1
.
00] = Pr[
X
≥
1
.
00]
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 16 / 57
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
Pr[Z>1.0]=1-0.8413=0.1587 (Pr[Z<1.0]=0.8413)
x
y1
問題2:標本分布・信頼区間・仮説検
定(母集団平均)
母集団平均・分散の推定
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 18 / 57
■
母集団(母集団平均
µ
,母集団分散
σ
2
)
■
標本:
{
X
1
, X
2
, . . . , X
n
}
■
標本平均
¯
X
=
1
n
n
X
i
=1
X
i
(1)
■
標本分散
S
2
=
1
n
−
1
n
X
i
=1
(
X
i
−
X
¯
)
2
(2)
■
これらは母集団平均
µ
,母集団分散
σ
2
の良い推定値(傾向的には偏りが
問題2:解答例(標本平均・標本分散の値)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 19 / 57
センター試験の英語について,ある高校で無作為に
5
人の得点調査をしたところ
{
138
,
120
,
112
,
140
,
125
}
という結果であった.
■
標本平均の値,標本分散の値 を求めてください
¯
x
=
1
5
(138 + 120 + 112 + 140 + 125) = 127
s
2
=
1
5
−
1
{
(138
−
127)
2
+ (120
−
127)
2
+
· · ·
+ (125
−
127)
2
}
復習:標本分布1
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 20 / 57
■
母集団分布が正規分布で記述されるとき,無作為抽出による大きさ
n
の標本を
{
X
1
, X
2
, . . . , X
n
}
とすると
◆
母集団分散
σ
2
をそのまま用いる場合:
¯
X
−
µ
p
σ
2
/n
∼
N
(0
,
1)
(3)
◆
母集団分散
σ
2
を
S
2
で置き換えて用いる場合:
¯
X
−
µ
p
S
2
/n
∼
t
(
n
−
1)
(4)
t分布に従う確率変数
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 21 / 57
■
t分布に従う確率変数は,どういう値でもとる事ができます
■
ただしどういう値が実現しやすいか,というパターンは確率密度として
与えられます
■
t分布に従う確率変数の確率密度は,1つのパラメータ
自由度
k
に依存
します
■
t分布に従う確率変数の確率密度は,中心は常に0,パラメータ
k
で散
らばりを決めます
k
を変化させた図
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 22 / 57
■
k
が小さいとき散らばりが大きい,
k
を大きくすると標準正規分布に近づく
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
t分布に従う確率変数の密度関数
x
cbind(y1, y2, y4)
母集団平均の信頼区間:
S
2
を用いる1
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 23 / 57
■
母集団分布が正規分布
■
母集団平均
µ
について知りたい
■
母集団分散
σ
2
の値を
S
2
で置き換える
■
このとき『母集団平均に関する信頼係数
0.95
の信頼区間』を求める
■
<重要>スライドの(
4
)式から
T
=
¯
X
−
µ
√
S
2/n
∼
t
(
n
−
1)
■
つまり上の
T
は自由度
n
−
1
のt分布に従う.
■
数表の自由度
n
−
1
の欄から
Pr[
T > t
0
.
025
] = 0
.
025
,
Pr[
T <
−
t
0
.
025
] = 0
.
025
という点を探して,
Pr
"
−
t
0
.
025
≤
¯
X
−
µ
p
S
2
/n
≤
t
0
.
025
#
図解
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 24 / 57
-4
-2
0
2
4
0.0
0.1
0.2
0.3
自由度4: Pr[ -2.776 < T < 2.776 ]
x
cbind(y1)
自由度4のt分布
母集団平均の信頼区間:
S
2
を用いる2
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 25 / 57
■
一般公式:
Pr
"
−
t
0
.
025
≤
¯
X
−
µ
p
S
2
/n
≤
t
0
.
025
#
= 0
.
95
◆
例として,
n
= 5
を想定して数表を使うと以下の関係がわかる.
Pr
"
−
2
.
776
≤
p
X
¯
−
µ
S
2
/
5
≤
2
.
776
#
= 0
.
95
◆
ここで自由度
n
−
1 = 4
の欄から
Pr[
T >
2
.
776] = 0
.
025
,
母集団平均の信頼区間:
S
2
を用いる3
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 26 / 57
■
このとき,
Pr
"
−
t
0
.
025
·
r
S
2
n
≤
X
¯
−
µ
≤
t
0
.
025
·
r
S
2
n
#
= 0
.
95
Pr
"
−
t
0
.
025
·
r
S
2
n
≤
µ
−
X
¯
≤
t
0
.
025
·
r
S
2
n
#
= 0
.
95
Pr
"
¯
X
−
t
0
.
025
·
r
S
2
n
≤
µ
≤
X
¯
+
t
0
.
025
·
r
S
2
n
#
= 0
.
95
■
つまり
µ
は次の区間の中に含まれている確率が
0.95
である.
"
¯
X
−
t
0
.
025
·
r
S
2
n
,
X
¯
+
t
0
.
025
·
r
S
2
n
#
(5)
問題2:解答例(母集団平均の信頼区間)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 27 / 57
■
n
= 5
,
x
¯
= 127
,
s
2
= 142
のとき,母集団平均
µ
に関する,信頼係数
0.95
の信
頼区間の値を求める
母集団平均を
µ
,標本平均を
X
¯
,標本分散を
S
2
とすると,
T
=
¯
X
−
µ
√
S
2/
5
とおくと,
この
T
は
自由度
n
−
1 = 5
−
1 = 4
のt分布
に従う.ここから数表を用いて
Pr
"
-2.776
≤
p
X
¯
−
µ
S
2
/
5
≤
2.776
#
= 0
.
95
問題2:解答例(母集団平均の信頼区間)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 28 / 57
この式を変形して
0
.
95
=
Pr
"
-2.776
≤
p
X
¯
−
µ
S
2
/
5
≤
2.776
#
=
Pr
¯
X
−
2.776
v
u
u
t
S
2
5
≤
µ
≤
¯
X
+
2.776
v
u
u
t
S
2
5
となるので信頼係数
0.95
の信頼区間は
¯
X
−
2.776
v
u
u
t
S
2
5
,
¯
X
+
2.776
v
u
u
t
S
2
5
問題2:解答例(母集団平均の信頼区間)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 29 / 57
■
n
= 5
,
x
¯
= 127
,
s
2
= 142
のとき,母集団平均
µ
に関する,信頼係数
0.95
の信
頼区間の値を求める
したがって先ほど計算した標本平均の値,標本分散の値を用いて信頼係数
0.95
の信
頼区間の値は
x
¯
−
2.776
v
u
u
t
s
2
5
,
x
¯
+
2.776
v
u
u
t
s
2
5
=
127
−
2.776
v
u
u
t
142
5
,
127
+
2.776
v
u
u
t
142
5
=
(
112.21
,
141.79
)
仮説検定
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 30 / 57
■
仮説検定とは
◆
帰無仮説(問題2では,
µ
= 131
.
08
)
◆
対立仮説(問題2では,
µ
6
= 131
.
08
)
の二つをデータから判断してどちらがもっともらしいかを見る方法である
■
具体的には,
『帰無仮説が正しい』という仮説を棄却するか,しないかで判断する
◆
『帰無仮説が正しい』という仮説を棄却:対立仮説の方がもっともらしい
◆
『帰無仮説が正しい』という仮説を棄却できない:帰無仮説の方がもっとも
検定の手順
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 31 / 57
1
二つの仮説を立てる
2
有意水準を定める
◆
仮説検定では,
「帰無仮説が正しいとしても,非常に小さい確率で発生す
るかもしれないが,普通は対立仮説が正しいから起きるような自体」
がお
きたら帰無仮説を棄てて,対立仮説を採用するという考え方
◆
上のごく小さい確率=有意水準,通常は5%か1%と定める.
検定の手順
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 32 / 57
4
棄却域を決める
◆
棄却域とは,
帰無仮説が正しいとき検定統計量の実現値が出にくく
,
対立
仮説が正しいときには実現しやすい領域
となるように選ぶ
5
検定統計量の値が棄却域に含まれるかどうかをみる
◆
棄却域に含まれるとき,帰無仮説を棄てる
問題2:解答例(仮説検定
H
0
:
µ
=
µ
0
,
H
1
:
µ
6
=
µ
0
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 33 / 57
全国の受験者の平均は
131.08
点であった.この学校の平均は
131.08
と異なってい
ると言えますか?
1
母集団平均を
µ
とし,帰無仮説
H
0
:
µ
= 131
.
08
,対立仮説
H
1
:
µ
6
= 131
.
08
とする
2
有意水準は問題から5%と与えられている
3
検定統計量を
T
=
¯
X
−
131
.
08
s
S
2
/
5
とすると,この検定統計量は
◆
帰無仮説
H
0
が正しいとき,
自由度
n
−
1 = 4
のt分布
に従い,
◆
対立仮説
H
1
が正しいとき,
問題2:解答例(仮説検定
H
0
:
µ
=
µ
0
,
H
1
:
µ
6
=
µ
0
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 34 / 57
全国の受験者の平均は
131.08
点であった.この学校の平均は
131.08
と異なってい
ると言えますか?
4
有意水準が5%なので,棄却域は(
−∞
, -2.776
)あるいは(
2.776 ,
∞
)
となる.
5
検定統計量の値は,
t
=
127
q
−
131.08
142 / 5
=
-0.7656
という結果から棄却域に
含まれない
.したがって帰無仮説
H
0
:
µ
= 131
.
08
は
棄却されないので
,この学校の平均点は全国平均とお
問題2解答図解(仮説検定
H
0
:
µ
=
µ
0
,
H
1
:
µ
6
=
µ
0
のタイプ
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 35 / 57
-6
-4
-2
0
2
4
6
0.0
0.1
0.2
0.3
0.4
x
H
0
:µ = µ
0が正しい
Pr[T>2.776]=0.025
Pr[T<-2.776]=0.025
-6
-4
-2
0
2
4
6
0.0
0.1
0.2
0.3
0.4
H
1が正しい:
µ
<
µ
0H
1
が正しい:
µ
<<
µ
0H
1が正しい:
µ
>
µ
0H
1
が正しい:
µ
>>
µ
0-6
-4
-2
0
2
4
6
0.0
0.1
0.2
0.3
問題2:解答例(仮説検定
H
0
:
µ
X
=
µ
Y
,
H
1
:
µ
X
< µ
Y
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 36 / 57
同校の昨年度の平均は
5
人について調べたところ平均値は
135
点,分散値は
140
で
あった.変化はあったか?
1
今年度の母集団平均を
µ
X
,昨年度の母集団平均を
µ
Y
.帰無仮説
H
0
:
µ
X
=
µ
Y
,対立仮説
H
1
:
µ
X
< µ
Y
とする(帰無仮説
H
0
:
µ
X
−
µ
Y
= 0
,対立仮説
H
1
:
µ
X
−
µ
Y
<
0
)
2
有意水準は問題から5%と与えられている
3
検定統計量を
Z
=
¯
X
−
Y
¯
s
S
X
2
/
5 +
S
Y
2
/
5
とすると,この検定統計量は
◆
帰無仮説
H
0
が正しいとき,
近似的に標準正規分布
に従い,
◆
対立仮説
H
1
が正しいとき,
平均の差:図解
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 37 / 57
-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
x
H
0
:µ = µ
0が正しい
z = -1.64
-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
H
1が正しい:
µ
<
µ
0H
1
が正しい:
µ
<<
µ
0H
1
が正しい:
µ
<<<
µ
0-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
問題2:解答例(仮説検定
H
0
:
µ
X
=
µ
Y
,
H
1
:
µ
X
< µ
Y
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 38 / 57
同校の昨年度の平均は
5
人について調べたところ平均値は
135
点,分散値は
140
で
あった.変化はあったか?
4
有意水準が5%なので,棄却域は(
−∞
,
−
1
.
64
)となる.
5
検定統計量の値は,
t
=
q
127 - 135
142 / 5+ 140/5
=
-1.065
という結果から棄却域に
含まれない
.したがって帰無仮説
H
0
:
µ
X
=
µ
X
は
棄却されないので
,この学校の平均点は昨年同様であると
問題3:仮説検定(母集団比率)
母集団比率の推定
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 40 / 57
■
母集団(母集団比率
p
)
■
標本:
{
X
1
, X
2
, . . . , X
n
}
■
標本平均
¯
X
=
1
n
n
X
i
=1
X
i
(6)
■
回答が1か0なので,結局は1と回答した人の割合になっている
復習:標本分布3
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 41 / 57
特に比率の場合は,分散の与え方に特徴があり,
■
母集団比率
p
を分母にそのまま用いる場合:
¯
X
−
p
p
p
(1
−
p
)
/n
∼
N
(0
,
1)
(7)
■
分母も推定値で置き換える場合:
¯
X
−
p
p
¯
問題3:解答例(仮説検定
H
0
:
p
=
p
0
,
H
1
:
p < p
0
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 42 / 57
■
内閣を支持するかどうかについて,無作為に
500
人に対して調査を行った.そ
の結果
218
人が支持すると回答し,
282
人が支持しないと回答した.この結果
から支持率が50%未満であるといえるかどうかを有意水準5%の仮説検定に
よって確認してください.
1
真の支持率(母集団比率)を
p
とし,帰無仮説
H
0
:
p
= 0
.
5
,対立仮説
H
1
:
p <
0
.
5
とする.
2
有意水準は問題から5%と与えられている.
3
検定統計量を
Z
=
¯
X
−
0.5
s
0
.
5
·
(1
−
0
.
5)
/n
とすると,この検定統計量は
■
帰無仮説
H
0
が正しいとき,
近似的に標準正規分布
に従い,
問題3:解答例(仮説検定
H
0
:
p
=
p
0
,
H
1
:
p < p
0
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 43 / 57
■
内閣を支持するかどうかについて,無作為に
500
人に対して調査を行った.そ
の結果
218
人が支持すると回答し,
282
人が支持しないと回答した.この結果
から支持率が50%未満であるといえるかどうかを有意水準5%の仮説検定に
よって確認してください.
4
有意水準が5%なので,棄却域は
(
−∞
,
−
1
.
64
)
となる.
5
検定統計量の値は,
z
=
q
218
/
500
−
0.5
0
.
50
·
(1
−
0
.
50)
/
500
=
-2.86
という結果から棄却域に
含まれている
.したがって帰無仮説
問題3解答図解(仮説検定
H
0
:
p
=
p
0
,
H
1
:
p < p
0
のタイプ)
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 44 / 57
-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
x
H
0:
p
=
p
0が正しい
z = -1.64
-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
0.4
H
1が正しい:p < p
0H
1
が正しい:p << p
0H
1
が正しい:p <<< p
0-8
-6
-4
-2
0
2
4
0.0
0.1
0.2
0.3
問題4:分割表の検定
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 46 / 57
二つの属性
A
,
B
で分類された表:2次元分割表
Table 1:
2次元分割表
B
1
B
2
A
1
X
11
X
12
X
1
,
•
A
2
X
21
X
22
X
2
,
•
例:
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 47 / 57
■
理科系,文科系学部に進学した学生それぞれ
5000
人を対象として,漢文に対す
る苦手科目について調査した.次の表から理系文系間に差はないと言うことは
できるでしょうか?
Table 2:
文理別,漢文への好き嫌い
好き
嫌い
計
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 48 / 57
■
A
1
に分類される確率:
Pr[
A
1
]
:
p
1
,
•
=
X
1
,
•
X
■
A
2
に分類される確率:
Pr[
A
2
]
:
p
2
,
•
=
X
2
,
•
X
■
B
1
に分類される確率:
Pr[
B
1
]
:
p
•
,
1
=
X
•
,
1
X
■
B
2
に分類される確率:
Pr[
B
2
]
:
p
•
,
2
=
X
•
,
2
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 49 / 57
『
A
1
に分類されるか
A
2
に分類されるか』という事象と『
B
1
に分類されるか
B
2
に分類されるか』という事象が独立ならば,
■
A
1
かつ
B
1
に分類される確率:
Pr[
A
1
∩ B
1
] = Pr[
A
1
]
×
Pr[
B
1
]
:
p
1
,
•
×
p
•
,
1
■
A
1
かつ
B
2
に分類される確率:
Pr[
A
1
∩ B
2
] = Pr[
A
1
]
×
Pr[
B
2
]
:
p
1
,
•
×
p
•
,
2
■
A
2
かつ
B
1
に分類される確率:
Pr[
A
2
∩ B
1
] = Pr[
A
2
]
×
Pr[
B
1
]
:
p
2
,
•
×
p
•
,
1
■
A
2
かつ
B
2
に分類される確率:
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 50 / 57
Table 3:
列効果と行効果が独立な場合の2次元分割表
B
1
B
2
計
A
1
X
·
p
1
,
•
·
p
•
,
1
X
·
p
1
,
•
·
p
•
,
2
X
1
,
•
A
2
X
·
p
2
,
•
·
p
•
,
1
X
·
p
2
,
•
·
p
•
,
2
X
2
,
•
計
X
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 51 / 57
■
列効果と行効果が独立であるとき,
◆
『
A
1
に分類されるか
A
2
に分類されるか』という事象と『
B
1
に分類され
るか
B
2
に分類されるか』という事象が独立であるとき,
■
以下のような関係が近似的に成り立つ
(
X
11
−
X
·
p
1
,
•
·
p
•
,
1
)
2
X
·
p
1
,
•
·
p
•
,
1
+
(
X
12
−
X
·
p
1
,
•
·
p
•
,
2
)
2
X
·
p
1
,
•
·
p
•
,
2
+
(
X
21
−
X
·
p
2
,
•
·
p
•
,
1
)
2
X
·
p
2
,
•
·
p
•
,
1
+
(
X
22
−
X
·
p
2
,
•
·
p
•
,
2
)
2
X
·
p
2
,
•
·
p
•
,
2
∼
χ
2
(1)
つまり,列効果と行効果が独立であるとき,上の統計量が自由度1のカイ二乗
問題
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 52 / 57
■
理科系,文科系学部に進学した学生それぞれ
5000
人を対象として,漢文に対す
る苦手科目について調査した.次の表から理系文系間に差はないと言うことは
できるでしょうか?
Table 4:
文理別,漢文への好き嫌い
好き
嫌い
計
2次元分割表
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 53 / 57
Table 5:
文理で好みに差がないときの期待度数
好き
嫌い
計
文系
1550
3450
5,000
理系
1550
3450
5,000
問題
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 54 / 57
0
好みに差がないとき,調査対象から一人の人を選ぶとき,その人が
『文系であ
るか理系であるか』という事象
と
『好きか嫌いか』という事象
は独立になる
◆
文系である確率,理系である確率,好きである確率,嫌いである確率はそ
れぞれ
p
1
,
•
=
5000
10000
=
1
2
, p
2
,
•
=
5000
10000
=
1
2
, p
•
,
1
=
3100
10000
=
31
100
, p
•
,
2
=
6900
10000
=
69
100
◆
文系であるか理系であるか』という事象と『好きか嫌いか』という事象は
独立であると仮定の下でのそれぞれのセルの期待度数は
(1,1)
セル
:
10000
×
p
1
,
•
×
p
•
,
1
= 1550
,
(2,1)
セルも同じ結果
(1,2)
セル
:
10000
×
p
1
,
問題
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 55 / 57
1
帰無仮説
H
0
:漢文の好みに文理間で差はない,対立仮説
H
1
:差がある.
2
有意水準は問題から5%と与えられている.
3
検定統計量は 先ほどの式 を用いて
◆
帰無仮説
H
0
が正しいとき,
自由度1のカイ二乗分布
に従い,
◆
対立仮説
H
1
が正しいとき,
自由度1のカイ二乗分布より大きい値が出やすい
.
問題
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 56 / 57
4
有意水準が5%なので,棄却域は
(3
.
84
,
∞
)
となる.
5
検定統計量の値は,
(1
,
600
−
1
,
550)
2
1
,
550
+
(3
,
400
−
3
,
450)
2
3
,
450
+
(1
,
500
−
1
,
550)
2
1
,
550
+
(3
,
500
−
3
,
450)
2
3
,
450
=
4.675
という結果から棄却域に
含まれる
.したがって帰無仮説は
試験について
試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定
http://sites.google.com/site/hustat2017/ 統計学 総復習 – 57 / 57