• 検索結果がありません。

⇒標本の平均や分散は、確率変数

N/A
N/A
Protected

Academic year: 2021

シェア "⇒標本の平均や分散は、確率変数"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

1

母集団と標本:得られたデータを、「標本」と捉える。

⇒標本の平均や分散は、確率変数

統計学の目的:標本の性質を調べて、そこから母 集団の性質を推定すること

母集団の性質:特性量である母平均や母分散に 対して仮説を立てて検定し、また推定する

第13回: 検定・推定の実際 検定・推定の考え方

• 検定・推定 :母集団の性質(特性量)を直接調 べられない場合に、標本をとってきて、その性質

(特性量)を調べ、その結果に基づいて、もとの 母集団の性質(特性量)を推測する。

¾

世論調査などのサンプリング調査や、物理や化学 の実験も、ある意味ではその例。

標本の特性量は確率変数。ある標本分布に従う。

よって、推測結果も確率的なものとなる。

検定(仮説検定)

母集団の特性を推測する代表的な方法 母集団の性質について、1つの仮説(命題)を

立てる。

標本の性質を調べ、調べた結果に基づいて、

立てた仮説を否定する(棄却する)か、否定 しない(棄却しない)かを、ある確率のもとで、

判定する。

テキスト p.103 例題 7.1 求めたい母集団の性質:

このサイコロを振ったときに偶数の目が出る確率

p

・仮説H

0

p=1/2

いかさまサイコロではなく、公平なサイコロである、ならばそうなる。

・対立仮説

H1

p

1/2

仮説H

0

のもとで、「標本平均=3/5」⇔「偶数の目 が出る回数が60回」となる確率を求める。

仮説H

0

のもとでは、サイコロを1回振ったときに 偶数の目が出る確率は 1/2 。よって、

100 回振ったとき偶数の目が出る回数

y

は、確率 変数であり、二項分布

B(n=100, p=1/2)に従う。

二項分布 B(n=100, p=1/2) の平均μ =np=50, 分散σ

2

=np(1-p)=25 。

n

が大きく

p=1/2

のため、

これは、同じ平均μ =50, 分散σ

2

=25 (標準偏 差σ =5 )の正規分布

N(

μ =50, σ

2

=25) で近似で きる。

そこで、正規分布 N(50, 25) に従う確率変数

y

が とる値の範囲を考える。

正規分布

N(

μ

=50,

σ

2=25)

に従う確率変数

y

がとる値 の範囲を考える。正規分布表より、

80%の確率で、

90% の確率で、

95% の確率で、

99% の確率で、

いま より、

80% の確率で、

90% の確率で、

95%の確率で、

99%の確率で、

y<40.2 または y>59.8 となる確率は5%

σ μ σ

μ−1.282 ≤y≤ +1.282

σ μ σ

μ

−1.96 ≤y≤ +1.96 σ μ σ

μ−1.645 ≤y≤ +1.645

5 ,

50 =

=

σ

μ

4 . 56 6

. 43 ≤y

2 . 58 8

. 41 ≤y

8 . 59 2

. 40 ≤y

σ μ σ

μ−2.576 ≤y≤ +2.576

9 . 62 1

. 37 ≤y

(2)

2

仮説H

0

のもとでは、

y<40.2 または y>59.8 となる確率は 5%

y=60 とは、 5% 以下の確率のことが起こったこと になる。

⇔「 y=60 であることを根拠として、

仮説H

0

は否定される; 仮説H

0

は棄却される」

との判定が、誤りである確率は5%

⇔ 仮説H

0

は、有意水準(あるいは危険率) 5% で 棄却される、という。

y<40.2 または y>59.8 の領域を、棄却域という。

有意水準は、 5% にとることが多い。 この例の場合 有意水準を 1% にとると、 仮説H

0

は棄却されない。

仮説

H0, H1

を、

H0: p= p0

,

H1: p

p0

としたとき、

有意水準αに対して

のとき、仮説

H0

は棄却される。

仮説H

0

のもとでは、確率変数 は、近似的に 平均 、標準偏差

の正規分布N( , ) に従う、ことに基く。

母集団比率 p の検定

(

0

)

2

0 1

0

1 K

α

p np

np x

n

i i

− >

∑ −

=

=

= n

i

xi

y

1

np0 np0

(

1−p0

)

np0 np0

(

1−p0

)

=

= n

i

xi

y

1

そこで、( p

0

ではなさそうな本当の) p の値を推定し よう。このとき、やはり確率変数 は、

平均 、標準偏差 の二項分布 B(n, p) に従う。よってまた、近似的に

正規分布 N( , ) に従う。よって、

( )

α = α

⎪⎪

⎪⎪⎬

⎪⎪

⎪⎪⎨

− <

= 1

Prob 1 1 K 2

p np

np x

n

i i

np

np

(

1−p

)

np np

(

1−p

)

区間の推定

テキストp.107 例題7.2

100 回サイコロを振ったところ 60 回偶数の目が出た、

という結果から得られた確率 は、その100回に よる標本平均であり、やはり確率変数であって、

と書ける。

前ページの

より、

よって、 。つまり、

確率 1-αで、

となる。

( ) α = α

⎪⎪

⎪⎪

<

= 1

1

Prob 1 K 2

p np

np x

n

i

i

=

=

= n

i

xi

n n p y

1

ˆ 1

( )

α

α =

ˆ < 1 1

Prob p p K 2 p pn

pˆ

( )

α = α

<

1

1

Prob ˆ K 2

n p p

p p

( ) ( )

n p K p

p n p p K p

p 1 < <ˆ+ 1

ˆ α2 α2

信頼度1-α での、母集団比率 p の区間推定 いま、既知の から を推定しようとしている。

そこで、上記の不等式において、√の中の を で置き換えることにする。これは、未知の を 既知の で近似したことに他ならない( n が十分 大きければ、近似できる)。

( ) ( )

n p K p

p n p

p K p

p ˆ −

α2

⋅ ˆ 1 − ˆ < p < ˆ +

α2

⋅ ˆ 1 − ˆ

( )

α

α = −

⎭⎬

⎩⎨

⎧ˆ− < ⋅ 1− 1

Prob 2 n

p K p

p p

pˆ

pˆ

p

pˆ

p

p

例題の場合には、α=0.05に対して、0.6-0.096 < p< 0.6+0.096

内閣支持率

p

を精度± 2% 以内で推定するためには、

標本の大きさ(数)

n

を何人以上にすればよいか。

信頼度1-α=95%で考えよ。

( 1 ˆ ) 0 . 02

2

p ˆ − p nK

α

(

p

)

p

n ˆ1 ˆ

02 . 0

96 . 1

2

⎟ ⋅

⎜ ⎞

≥⎛

96 . 1

05 .

0 /2=

= α

α より K

( )

⎛ =

のとき

2 ˆ 1 2 1 2 ˆ 1 1

ˆ p p

p

テキスト p.108 例題 7.3

ただし、

ここで、

2401 2 49

1 2 1 02 . 0

96 .

1 2

2

=

=

⎟ ⋅

⎜ ⎞

≥⎛

n

よって、2401人以上

参照

関連したドキュメント

• 1つの厚生労働省分類に複数の O-NET の職業が ある場合には、 O-NET の職業の人数で加重平均. ※ 全 367

(変圧器周囲温度) 周囲温度 - 5 ℃~ 40 ℃(日間平均気温が 35 ℃以下、及び、年間平均気温が 20 ℃以下). 標高

この節では mKdV 方程式を興味の中心に据えて,mKdV 方程式によって統制されるような平面曲線の連 続朗変形,半離散 mKdV

また、支払っている金額は、婚姻費用が全体平均で 13.6 万円、養育費が 7.1 万円でし た。回答者の平均年収は 633 万円で、回答者の ( 元 )

・逆解析は,GA(遺伝的アルゴリズム)を用い,パラメータは,個体数 20,世 代数 100,交叉確率 0.75,突然変異率は

浮遊粒子状物質の将来濃度(年平均値)を日平均値(2%除外値)に変換した値は 0.061mg/m 3 であり、環境基準値(0.10mg/m

一方、区の空き家率をみると、平成 15 年の調査では 12.6%(全国 12.2%)と 全国をやや上回っていましたが、平成 20 年は 10.3%(全国 13.1%) 、平成

5日平均 10日平均 14日平均 15日平均 20日平均 30日平均 4/8〜5/12 0.152 0.163 0.089 0.055 0.005 0.096. 