• 検索結果がありません。

20180126slide 資料置き場 hustat2017 20180126slide

N/A
N/A
Protected

Academic year: 2018

シェア "20180126slide 資料置き場 hustat2017 20180126slide"

Copied!
59
0
0

読み込み中.... (全文を見る)

全文

(1)

統計学:復習と練習問題

担当者:

高木

真吾

http://sites.google.com/site/hustat2017/

(2)

試験について

(3)

試験について

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 3 / 57

参照物の持ち込み不可

試験時間は

90

分(2月2日10

:

30から12:00)

試験範囲は,標本理論,母数の推定(信頼区間の推定)

,仮説検定(母集団平

均・分割表)

(第8回以降に相当)

(4)

問題1:確率変数の復習

(5)

正規分布表の利用,確率変数の標準化

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 5 / 57

確率変数

実現する前はどういう値が出るかは不明

どの値がどういう確率で実現するかに関する規則は分かっている

この規則をあらわしているものが(連続型確率変数の場合は)密度関数

標準正規分布(平均0,分散1)に従う確率変数の密度関数は次の図

正規分布に従う確率変数の確率密度は,二つのパラメータ

µ

σ

2

依存

ある区間,たとえば(

-2 ,0

)という区間のどこかで実現する確率の大き

さは,この区間の面積に対応している.

正規分布の数表は,標準正規分布に従う確率変数について,ある点cよ

(6)

図1:

µ

σ

2

を変化させた

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 6 / 57

µ

σ

2

はそれぞれ平均(中心の位置)

,分散(散らばりの程度)を示す

-4 -2 0 2 4

0.0

0.2

0.4

0.6

0.8

正規分布に従う確率変数の密度関数

x

cbind(y1, y2, y3)

µ =0 , σ

2

=1

µ = −2 , σ

2

=0.25

µ =1 , σ

2

(7)

図2:正規分布に従う確率変数の密度関数と

確率

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 7 / 57

正規分布に従う確率変数

X

は,ある区間

(

a, b

)

,

どういう確率で実現

するか

確率1.

Pr[

2

< X <

0 ]

,2.

Pr[

X >

2 ]

つまり確率の大きさは,図の面積で表現される(曲線全体では1)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

正規分布に従う確率変数の密度関数

x

(8)

数表の利用

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57

正規分布の表から

Pr[

Z

1

.

96 ] = 0

.

5 + 0

.

475 = 0

.

975

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

Pr[ X > 1.96 ], Pr[ X < -1.96 ]

x

y1

µ =0 , σ

2

=1

Pr[

Z

1

.

96 ]

=?

(9)

数表の利用

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57

正規分布の表から

Pr[

Z

1

.

96 ] = 0

.

5 + 0

.

475 = 0

.

975

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

Pr[ X > 1.96 ], Pr[ X < -1.96 ]

x

y1

µ =0 , σ

2

=1

Pr[

Z

1

.

96 ]

=?

= 1

0

.

975 = 0

.

025

(10)

数表の利用

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 8 / 57

正規分布の表から

Pr[

Z

1

.

96 ] = 0

.

5 + 0

.

475 = 0

.

975

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

Pr[ X > 1.96 ], Pr[ X < -1.96 ]

x

y1

µ =0 , σ

2

=1

Pr[

Z

1

.

96 ]

=?

= 1

0

.

975 = 0

.

025

(11)

確率変数の標準化(基準化)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 9 / 57

平均や分散がどのようなものであっても,その確率変数から平均を引き,

標準偏差で割ると平均が0,分散が1になる

例)確率変数

X

について,平均

E

[

X

] =

µ

,分散

V

[

X

] =

σ

2

とする

例)このとき,

Y

=

X

µ

σ

2

とする

例)新しく定義された

Y

は必ず平均0,分散1となる(

E

[

Y

] = 0

,

(12)

問題1:解答例

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 10 / 57

次の確率を求めてください(空欄を埋めてください)

確率変数

X

が標準正規分布に従うとき(

X

N

(0

,

1)

1.

Pr[

X

0 ] =

0.500

2.

Pr[

X

1

.

96 ] =

1-

Pr[

X

1

.

96 ]

= 1-0.025 = 0.975

3.

Pr[

X

≥ −

1

.

96 ] = Pr[

X

1

.

96 ]

= 0.975

4.

Pr[

1

.

00

X

1

.

96 ]

= Pr[

X

1.96

]

Pr[

X

-1.00

]

=

0.9750 - 0.1587 = 0.8163

ただし,

Pr[

X

≤ −

1

.

00 ]

については,

Pr[

X

≤ −

1

.

00 ]

=

Pr[

X

1

.

00 ]

(13)

図解:

Pr[

1

.

00

< X <

1

.

96] = Pr[

X <

1

.

96]

Pr[

X <

1

.

00]

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 11 / 57

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

Pr[-1.00<X<1.96] = Pr[X<1.96] - Pr[X<-1.00]

x

y1

µ =

0 ,

σ

2

(14)

図解:

Pr[

X

≤ −

1

.

00] = Pr[

X

1

.

00]

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 12 / 57

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

Pr[Z>1.0]=1-0.8413=0.1587 (Pr[Z<1.0]=0.8413)

x

y1

(15)

問題1:解答例

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 13 / 57

確率変数

X

が平均1,分散4の正規分布に従うとき(

X

N

(1

,

4)

1.

Pr[

X

0 ]

という確率を求めてください.このとき,

Z

=

X

1

r

4

とおく

と,

Z

N

(0

,

1)

なので,

Pr[

X

0 ]

=

Pr

X

1

q

4

0

q

1

4

=

Pr

h

Z

- 0.5

i

=

0.3085

(16)

図解:

Pr[

X

≤ −

0

.

50] = Pr[

X

0

.

50]

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 14 / 57

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

Pr[Z>0.5]=1-0.6915=0.3085 (Pr[Z<0.5]=0.6915)

x

y1

(17)

問題1:解答例

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 15 / 57

確率変数

X

が平均1,分散4の正規分布に従うとき(

X

N

(1

,

4)

2.

Pr[

1

X

1

.

96 ]

という確率を求めてください.

Pr[

1

X

1

,

96 ]

=

Pr

-1

1

q

4

X

q

1

4

1.96

q

1

4

=

Pr

h

-1.00

Z

0.48

i

=

Pr

h

Z

0.48

i

Pr

h

Z

-1.00

i

=

0.6844-0.1587 =0.5257

.

.

.

Pr[

Z

≤ −

1

.

0] = Pr[

Z >

1

.

0] = 0

.

1587

(18)

図解:

Pr[

X

≤ −

1

.

00] = Pr[

X

1

.

00]

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 16 / 57

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

Pr[Z>1.0]=1-0.8413=0.1587 (Pr[Z<1.0]=0.8413)

x

y1

(19)

問題2:標本分布・信頼区間・仮説検

定(母集団平均)

(20)

母集団平均・分散の推定

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 18 / 57

母集団(母集団平均

µ

,母集団分散

σ

2

標本:

{

X

1

, X

2

, . . . , X

n

}

標本平均

¯

X

=

1

n

n

X

i

=1

X

i

(1)

標本分散

S

2

=

1

n

1

n

X

i

=1

(

X

i

X

¯

)

2

(2)

これらは母集団平均

µ

,母集団分散

σ

2

の良い推定値(傾向的には偏りが

(21)

問題2:解答例(標本平均・標本分散の値)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 19 / 57

センター試験の英語について,ある高校で無作為に

5

人の得点調査をしたところ

{

138

,

120

,

112

,

140

,

125

}

という結果であった.

標本平均の値,標本分散の値 を求めてください

¯

x

=

1

5

(138 + 120 + 112 + 140 + 125) = 127

s

2

=

1

5

1

{

(138

127)

2

+ (120

127)

2

+

· · ·

+ (125

127)

2

}

(22)

復習:標本分布1

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 20 / 57

母集団分布が正規分布で記述されるとき,無作為抽出による大きさ

n

の標本を

{

X

1

, X

2

, . . . , X

n

}

とすると

母集団分散

σ

2

をそのまま用いる場合:

¯

X

µ

p

σ

2

/n

N

(0

,

1)

(3)

母集団分散

σ

2

S

2

で置き換えて用いる場合:

¯

X

µ

p

S

2

/n

t

(

n

1)

(4)

(23)

t分布に従う確率変数

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 21 / 57

t分布に従う確率変数は,どういう値でもとる事ができます

ただしどういう値が実現しやすいか,というパターンは確率密度として

与えられます

t分布に従う確率変数の確率密度は,1つのパラメータ

自由度

k

に依存

します

t分布に従う確率変数の確率密度は,中心は常に0,パラメータ

k

で散

らばりを決めます

(24)

k

を変化させた図

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 22 / 57

k

が小さいとき散らばりが大きい,

k

を大きくすると標準正規分布に近づく

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

t分布に従う確率変数の密度関数

x

cbind(y1, y2, y4)

(25)

母集団平均の信頼区間:

S

2

を用いる1

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 23 / 57

母集団分布が正規分布

母集団平均

µ

について知りたい

母集団分散

σ

2

の値を

S

2

で置き換える

このとき『母集団平均に関する信頼係数

0.95

の信頼区間』を求める

<重要>スライドの(

4

)式から

T

=

¯

X

µ

S

2

/n

t

(

n

1)

つまり上の

T

は自由度

n

1

のt分布に従う.

数表の自由度

n

1

の欄から

Pr[

T > t

0

.

025

] = 0

.

025

Pr[

T <

t

0

.

025

] = 0

.

025

という点を探して,

Pr

"

t

0

.

025

¯

X

µ

p

S

2

/n

t

0

.

025

#

(26)

図解

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 24 / 57

-4

-2

0

2

4

0.0

0.1

0.2

0.3

自由度4: Pr[ -2.776 < T < 2.776 ]

x

cbind(y1)

自由度4のt分布

(27)

母集団平均の信頼区間:

S

2

を用いる2

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 25 / 57

一般公式:

Pr

"

t

0

.

025

¯

X

µ

p

S

2

/n

t

0

.

025

#

= 0

.

95

例として,

n

= 5

を想定して数表を使うと以下の関係がわかる.

Pr

"

2

.

776

p

X

¯

µ

S

2

/

5

2

.

776

#

= 0

.

95

ここで自由度

n

1 = 4

の欄から

Pr[

T >

2

.

776] = 0

.

025

(28)

母集団平均の信頼区間:

S

2

を用いる3

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 26 / 57

このとき,

Pr

"

t

0

.

025

·

r

S

2

n

X

¯

µ

t

0

.

025

·

r

S

2

n

#

= 0

.

95

Pr

"

t

0

.

025

·

r

S

2

n

µ

X

¯

t

0

.

025

·

r

S

2

n

#

= 0

.

95

Pr

"

¯

X

t

0

.

025

·

r

S

2

n

µ

X

¯

+

t

0

.

025

·

r

S

2

n

#

= 0

.

95

つまり

µ

は次の区間の中に含まれている確率が

0.95

である.

"

¯

X

t

0

.

025

·

r

S

2

n

,

X

¯

+

t

0

.

025

·

r

S

2

n

#

(5)

(29)

問題2:解答例(母集団平均の信頼区間)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 27 / 57

n

= 5

x

¯

= 127

,

s

2

= 142

のとき,母集団平均

µ

に関する,信頼係数

0.95

の信

頼区間の値を求める

母集団平均を

µ

,標本平均を

X

¯

,標本分散を

S

2

とすると,

T

=

¯

X

µ

S

2

/

5

とおくと,

この

T

自由度

n

1 = 5

1 = 4

のt分布

に従う.ここから数表を用いて

Pr

"

-2.776

p

X

¯

µ

S

2

/

5

2.776

#

= 0

.

95

(30)

問題2:解答例(母集団平均の信頼区間)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 28 / 57

この式を変形して

0

.

95

=

Pr

"

-2.776

p

X

¯

µ

S

2

/

5

2.776

#

=

Pr

¯

X

2.776

v

u

u

t

S

2

5

µ

¯

X

+

2.776

v

u

u

t

S

2

5

となるので信頼係数

0.95

の信頼区間は

¯

X

2.776

v

u

u

t

S

2

5

,

¯

X

+

2.776

v

u

u

t

S

2

5

(31)

問題2:解答例(母集団平均の信頼区間)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 29 / 57

n

= 5

x

¯

= 127

,

s

2

= 142

のとき,母集団平均

µ

に関する,信頼係数

0.95

の信

頼区間の値を求める

したがって先ほど計算した標本平均の値,標本分散の値を用いて信頼係数

0.95

の信

頼区間の値は

x

¯

2.776

v

u

u

t

s

2

5

,

x

¯

+

2.776

v

u

u

t

s

2

5

=

127

2.776

v

u

u

t

142

5

,

127

+

2.776

v

u

u

t

142

5

=

(

112.21

,

141.79

)

(32)

仮説検定

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 30 / 57

仮説検定とは

帰無仮説(問題2では,

µ

= 131

.

08

対立仮説(問題2では,

µ

6

= 131

.

08

の二つをデータから判断してどちらがもっともらしいかを見る方法である

具体的には,

『帰無仮説が正しい』という仮説を棄却するか,しないかで判断する

『帰無仮説が正しい』という仮説を棄却:対立仮説の方がもっともらしい

『帰無仮説が正しい』という仮説を棄却できない:帰無仮説の方がもっとも

(33)

検定の手順

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 31 / 57

1

二つの仮説を立てる

2

有意水準を定める

仮説検定では,

「帰無仮説が正しいとしても,非常に小さい確率で発生す

るかもしれないが,普通は対立仮説が正しいから起きるような自体」

がお

きたら帰無仮説を棄てて,対立仮説を採用するという考え方

上のごく小さい確率=有意水準,通常は5%か1%と定める.

(34)

検定の手順

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 32 / 57

4

棄却域を決める

棄却域とは,

帰無仮説が正しいとき検定統計量の実現値が出にくく

対立

仮説が正しいときには実現しやすい領域

となるように選ぶ

5

検定統計量の値が棄却域に含まれるかどうかをみる

棄却域に含まれるとき,帰無仮説を棄てる

(35)

問題2:解答例(仮説検定

H

0

:

µ

=

µ

0

,

H

1

:

µ

6

=

µ

0

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 33 / 57

全国の受験者の平均は

131.08

点であった.この学校の平均は

131.08

と異なってい

ると言えますか?

1

母集団平均を

µ

とし,帰無仮説

H

0

:

µ

= 131

.

08

,対立仮説

H

1

:

µ

6

= 131

.

08

とする

2

有意水準は問題から5%と与えられている

3

検定統計量を

T

=

¯

X

131

.

08

s

S

2

/

5

とすると,この検定統計量は

帰無仮説

H

0

が正しいとき,

自由度

n

1 = 4

のt分布

に従い,

対立仮説

H

1

が正しいとき,

(36)

問題2:解答例(仮説検定

H

0

:

µ

=

µ

0

,

H

1

:

µ

6

=

µ

0

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 34 / 57

全国の受験者の平均は

131.08

点であった.この学校の平均は

131.08

と異なってい

ると言えますか?

4

有意水準が5%なので,棄却域は(

−∞

, -2.776

)あるいは(

2.776 ,

となる.

5

検定統計量の値は,

t

=

127

q

131.08

142 / 5

=

-0.7656

という結果から棄却域に

含まれない

.したがって帰無仮説

H

0

:

µ

= 131

.

08

棄却されないので

,この学校の平均点は全国平均とお

(37)

問題2解答図解(仮説検定

H

0

:

µ

=

µ

0

,

H

1

:

µ

6

=

µ

0

のタイプ

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 35 / 57

-6

-4

-2

0

2

4

6

0.0

0.1

0.2

0.3

0.4

x

H

0

:µ = µ

0

が正しい

Pr[T>2.776]=0.025

Pr[T<-2.776]=0.025

-6

-4

-2

0

2

4

6

0.0

0.1

0.2

0.3

0.4

H

1

が正しい:

µ

<

µ

0

H

1

が正しい:

µ

<<

µ

0

H

1

が正しい:

µ

>

µ

0

H

1

が正しい:

µ

>>

µ

0

-6

-4

-2

0

2

4

6

0.0

0.1

0.2

0.3

(38)

問題2:解答例(仮説検定

H

0

:

µ

X

=

µ

Y

,

H

1

:

µ

X

< µ

Y

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 36 / 57

同校の昨年度の平均は

5

人について調べたところ平均値は

135

点,分散値は

140

あった.変化はあったか?

1

今年度の母集団平均を

µ

X

,昨年度の母集団平均を

µ

Y

.帰無仮説

H

0

:

µ

X

=

µ

Y

,対立仮説

H

1

:

µ

X

< µ

Y

とする(帰無仮説

H

0

:

µ

X

µ

Y

= 0

,対立仮説

H

1

:

µ

X

µ

Y

<

0

2

有意水準は問題から5%と与えられている

3

検定統計量を

Z

=

¯

X

Y

¯

s

S

X

2

/

5 +

S

Y

2

/

5

とすると,この検定統計量は

帰無仮説

H

0

が正しいとき,

近似的に標準正規分布

に従い,

対立仮説

H

1

が正しいとき,

(39)

平均の差:図解

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 37 / 57

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

x

H

0

:µ = µ

0

が正しい

z = -1.64

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

H

1

が正しい:

µ

<

µ

0

H

1

が正しい:

µ

<<

µ

0

H

1

が正しい:

µ

<<<

µ

0

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

(40)

問題2:解答例(仮説検定

H

0

:

µ

X

=

µ

Y

,

H

1

:

µ

X

< µ

Y

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 38 / 57

同校の昨年度の平均は

5

人について調べたところ平均値は

135

点,分散値は

140

あった.変化はあったか?

4

有意水準が5%なので,棄却域は(

−∞

,

1

.

64

)となる.

5

検定統計量の値は,

t

=

q

127 - 135

142 / 5+ 140/5

=

-1.065

という結果から棄却域に

含まれない

.したがって帰無仮説

H

0

:

µ

X

=

µ

X

棄却されないので

,この学校の平均点は昨年同様であると

(41)

問題3:仮説検定(母集団比率)

(42)

母集団比率の推定

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 40 / 57

母集団(母集団比率

p

標本:

{

X

1

, X

2

, . . . , X

n

}

標本平均

¯

X

=

1

n

n

X

i

=1

X

i

(6)

回答が1か0なので,結局は1と回答した人の割合になっている

(43)

復習:標本分布3

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 41 / 57

特に比率の場合は,分散の与え方に特徴があり,

母集団比率

p

を分母にそのまま用いる場合:

¯

X

p

p

p

(1

p

)

/n

N

(0

,

1)

(7)

分母も推定値で置き換える場合:

¯

X

p

p

¯

(44)

問題3:解答例(仮説検定

H

0

:

p

=

p

0

H

1

:

p < p

0

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 42 / 57

内閣を支持するかどうかについて,無作為に

500

人に対して調査を行った.そ

の結果

218

人が支持すると回答し,

282

人が支持しないと回答した.この結果

から支持率が50%未満であるといえるかどうかを有意水準5%の仮説検定に

よって確認してください.

1

真の支持率(母集団比率)を

p

とし,帰無仮説

H

0

:

p

= 0

.

5

,対立仮説

H

1

:

p <

0

.

5

とする.

2

有意水準は問題から5%と与えられている.

3

検定統計量を

Z

=

¯

X

0.5

s

0

.

5

·

(1

0

.

5)

/n

とすると,この検定統計量は

帰無仮説

H

0

が正しいとき,

近似的に標準正規分布

に従い,

(45)

問題3:解答例(仮説検定

H

0

:

p

=

p

0

H

1

:

p < p

0

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 43 / 57

内閣を支持するかどうかについて,無作為に

500

人に対して調査を行った.そ

の結果

218

人が支持すると回答し,

282

人が支持しないと回答した.この結果

から支持率が50%未満であるといえるかどうかを有意水準5%の仮説検定に

よって確認してください.

4

有意水準が5%なので,棄却域は

−∞

,

1

.

64

となる.

5

検定統計量の値は,

z

=

q

218

/

500

0.5

0

.

50

·

(1

0

.

50)

/

500

=

-2.86

という結果から棄却域に

含まれている

.したがって帰無仮説

(46)

問題3解答図解(仮説検定

H

0

:

p

=

p

0

H

1

:

p < p

0

のタイプ)

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 44 / 57

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

x

H

0

:

p

=

p

0

が正しい

z = -1.64

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

0.4

H

1

が正しい:p < p

0

H

1

が正しい:p << p

0

H

1

が正しい:p <<< p

0

-8

-6

-4

-2

0

2

4

0.0

0.1

0.2

0.3

(47)

問題4:分割表の検定

(48)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 46 / 57

二つの属性

A

B

で分類された表:2次元分割表

Table 1:

2次元分割表

B

1

B

2

A

1

X

11

X

12

X

1

,

A

2

X

21

X

22

X

2

,

(49)

例:

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 47 / 57

理科系,文科系学部に進学した学生それぞれ

5000

人を対象として,漢文に対す

る苦手科目について調査した.次の表から理系文系間に差はないと言うことは

できるでしょうか?

Table 2:

文理別,漢文への好き嫌い

好き

嫌い

(50)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 48 / 57

A

1

に分類される確率:

Pr[

A

1

]

:

p

1

,

=

X

1

,

X

A

2

に分類される確率:

Pr[

A

2

]

:

p

2

,

=

X

2

,

X

B

1

に分類される確率:

Pr[

B

1

]

:

p

,

1

=

X

,

1

X

B

2

に分類される確率:

Pr[

B

2

]

:

p

,

2

=

X

,

2

(51)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 49 / 57

A

1

に分類されるか

A

2

に分類されるか』という事象と『

B

1

に分類されるか

B

2

に分類されるか』という事象が独立ならば,

A

1

かつ

B

1

に分類される確率:

Pr[

A

1

∩ B

1

] = Pr[

A

1

]

×

Pr[

B

1

]

:

p

1

,

×

p

,

1

A

1

かつ

B

2

に分類される確率:

Pr[

A

1

∩ B

2

] = Pr[

A

1

]

×

Pr[

B

2

]

:

p

1

,

×

p

,

2

A

2

かつ

B

1

に分類される確率:

Pr[

A

2

∩ B

1

] = Pr[

A

2

]

×

Pr[

B

1

]

:

p

2

,

×

p

,

1

A

2

かつ

B

2

に分類される確率:

(52)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 50 / 57

Table 3:

列効果と行効果が独立な場合の2次元分割表

B

1

B

2

A

1

X

·

p

1

,

·

p

,

1

X

·

p

1

,

·

p

,

2

X

1

,

A

2

X

·

p

2

,

·

p

,

1

X

·

p

2

,

·

p

,

2

X

2

,

X

(53)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 51 / 57

列効果と行効果が独立であるとき,

A

1

に分類されるか

A

2

に分類されるか』という事象と『

B

1

に分類され

るか

B

2

に分類されるか』という事象が独立であるとき,

以下のような関係が近似的に成り立つ

(

X

11

X

·

p

1

,

·

p

,

1

)

2

X

·

p

1

,

·

p

,

1

+

(

X

12

X

·

p

1

,

·

p

,

2

)

2

X

·

p

1

,

·

p

,

2

+

(

X

21

X

·

p

2

,

·

p

,

1

)

2

X

·

p

2

,

·

p

,

1

+

(

X

22

X

·

p

2

,

·

p

,

2

)

2

X

·

p

2

,

·

p

,

2

χ

2

(1)

つまり,列効果と行効果が独立であるとき,上の統計量が自由度1のカイ二乗

(54)

問題

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 52 / 57

理科系,文科系学部に進学した学生それぞれ

5000

人を対象として,漢文に対す

る苦手科目について調査した.次の表から理系文系間に差はないと言うことは

できるでしょうか?

Table 4:

文理別,漢文への好き嫌い

好き

嫌い

(55)

2次元分割表

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 53 / 57

Table 5:

文理で好みに差がないときの期待度数

好き

嫌い

文系

1550

3450

5,000

理系

1550

3450

5,000

(56)

問題

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 54 / 57

0

好みに差がないとき,調査対象から一人の人を選ぶとき,その人が

『文系であ

るか理系であるか』という事象

『好きか嫌いか』という事象

は独立になる

文系である確率,理系である確率,好きである確率,嫌いである確率はそ

れぞれ

p

1

,

=

5000

10000

=

1

2

, p

2

,

=

5000

10000

=

1

2

, p

,

1

=

3100

10000

=

31

100

, p

,

2

=

6900

10000

=

69

100

文系であるか理系であるか』という事象と『好きか嫌いか』という事象は

独立であると仮定の下でのそれぞれのセルの期待度数は

(1,1)

セル

:

10000

×

p

1

,

×

p

,

1

= 1550

,

(2,1)

セルも同じ結果

(1,2)

セル

:

10000

×

p

1

,

(57)

問題

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 55 / 57

1

帰無仮説

H

0

:漢文の好みに文理間で差はない,対立仮説

H

1

:差がある.

2

有意水準は問題から5%と与えられている.

3

検定統計量は 先ほどの式 を用いて

帰無仮説

H

0

が正しいとき,

自由度1のカイ二乗分布

に従い,

対立仮説

H

1

が正しいとき,

自由度1のカイ二乗分布より大きい値が出やすい

(58)

問題

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 56 / 57

4

有意水準が5%なので,棄却域は

(3

.

84

,

)

となる.

5

検定統計量の値は,

(1

,

600

1

,

550)

2

1

,

550

+

(3

,

400

3

,

450)

2

3

,

450

+

(1

,

500

1

,

550)

2

1

,

550

+

(3

,

500

3

,

450)

2

3

,

450

=

4.675

という結果から棄却域に

 含まれる 

.したがって帰無仮説は

(59)

試験について

試験について 問題1:確率変数の復習 問題2:標本分布・信頼区間・仮説検定(母集団平均) 問題3:仮説検定(母集団比率) 問題4:分割表の検定

http://sites.google.com/site/hustat2017/ 統計学 総復習 – 57 / 57

参照物の持ち込み不可

電卓も使用不可

大雑把に計算すれば十分

棄却域に入るか否か,信頼区間なら平方根を開く必要なし

試験時間は

90

分.

試験範囲は,標本理論,母数の推定(信頼区間の推定)

,仮説検定(母集団平

均・分割表)

範囲外:ハンドアウトに含めていない内容(有限母集団(非復元抽出)

,最

尤法)

参照

関連したドキュメント

関西学院大学手話言語研究センターの研究員をしております松岡と申します。よろ

【大塚委員長代理】 はい、お願いします。. 【勝見委員】

○田辺座長 有村委員から丸の内熱供給のほうに御質問があったと思います。お願いしま す。. ○佐々木氏(丸の内熱供給)

○菊地会長 では、そのほか 、委員の皆様から 御意見等ありまし たらお願いいたし

○齋藤部会長 ありがとうございました。..

○杉田委員長 ありがとうございました。.

原則としてメール等にて,理由を明 記した上で返却いたします。内容を ご確認の上,再申込をお願いいた

○藤本環境政策課長 異議なしということでございますので、交告委員にお願いしたいと思