• 検索結果がありません。

14 仮説検定

N/A
N/A
Protected

Academic year: 2021

シェア "14 仮説検定"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

14

仮説検定

14.1

背理法

定理

14.1.1

2

は無理数である。

【証明】

2

が有理数であると仮定します。このとき

2 = m n

と既約分数で書く事がで きますが、この両辺を自乗すると

2 = m n

22、すなわち、

2n 2 = m 2

が得られます。従って 右辺の

m 2

は偶数です。しかし自乗が偶数と云う事は

m

自身が偶数である事を意味しま すから

m = 2k

と書くことが出来ます。すると今度は

2n 2 = (2k) 2

、すなわち

n 2 = 2k 2

となって同じ理由で

n

も偶数である事が分かります。これは

m, n

が互いに素であった 事に反します。これは矛盾であり、従って最初の仮定『

2

は有理数である』は間違っ ていた事が分かり、

2

は無理数である事が証明されました。

正しい命題から出発して論理的に正しい議論を経て矛盾に到達する事はできませんか ら、矛盾が生じたと云う事は仮定が間違っていた以外にはあり得ないわけです。この様 に、ある仮定から出発して最終的に矛盾を導きだし、結果として最初に置いた仮定が間 違っていたと論じる議論の仕方を背理法と呼びます。

14.2

分散既知の正規母集団における母平均の仮説検定

14.2.1

両側検定の場合

例題

14.2.1

ある工場で生産している製品の重さは、通常は平均値が

80g

、標準偏差が

5g

の正規分布をしている筈ですが、その平均値に疑義が生じています(分布が正規分 布である事や標準偏差の値には疑義は生じていないとします)。正しく生産されている か調べるために、ある日の製品の中から

100

個のサンプルを抽出して調査をする事に なりました。

実際にサンプルをとって重さを測定したところ、平均値が

81.1g

でした。この日の製 品は平常通りの重さであると言えるでしょうか?

母集団

X

(この日の製品の重量全体)は正規分布に従い、母平均は不明、母分散は

5 2

です。この母集団からとった大きさ

100

の標本平均を

X ¯

とするとき、区間推定のと きに見たように、母平均の値は分からなくても

P £ØØ X ¯ (

母平均

) Ø Ø d §

= 0.05 (14.1)

となるような

d > 0

を求める事が出来ます。実際、

X ¯ (

母平均

)

N ≥ 0, 100 5

2

¥

に従い ますから

0.05 = P £ØØ X ¯ (

母平均

) Ø Ø d §

= P ∑ØØ Ø Ø N µ

0, 1 4

∂ØØ Ø Ø d

0.95 = P ∑ØØ Ø Ø N µ

0, 1 4

∂ØØ Ø Ø d

= P

| N (0, 1) | ≤ d

1 2

0.475 = P [0 N(0, 1) 2d]

となって標準正規分布表により

2d 1.96

、従って

d 0.98

と求まってしまうわけです。

ここで仮に母平均が通常通りの値

80

であったと仮定すると、

P £ØØ X ¯ 80 Ø Ø 0.98 §

0.05 (14.2)

すなわち

P [ ¯ X ( −1 , 79.02] [80.98, 1 )] 0.05 (14.3)

が成り立っている筈ですが、

X ¯

の実現値である実際の大きさ

100

のサンプルの平均値 は区間

( −1 , 79.02] [80.98, 1 )

に入るか、入らないか、どちらかしかなく、前者であ る確率が

0.05

、後者が

0.95

であるわけです。

この区間

( −1 , 79.02] [80.98, 1 )

を、『有意水準5%の両側棄却域』と呼びます。

まず前提として、

X ¯

がこの区間に入る確率は

0.05

と『極めて小さい』値です。いや、

むしろ逆で、『小さい』という概念は相対的なものですから、『どれ位なら極めて小さ いと考えるか』が問題になります。で、ここでは、

0.05

だったら極めて小さいとします よ、と云う意味で『有意水準5%』と云う言い方をします。式

(14.1)

の右辺を

0.05

したのにはそう云う背景があります。有意水準は

0.05

でなければならないわけではな く、

0.01

0.1

などを採用する場合もあります。

そして、『極めて小さい』事が何を意味するかと言うと、『そんな確率の小さな事象 は起きない』と考えます。勿論どんなに小さな確率であったとしてもその事象が起きる 可能性はあるわけですから、この『起きない』と云う判断は事実としては間違っていま す。そう、正しいかどうかではないのです。

(2)

Revised at 14:13, February 6, 2017 14 http://my.reset.jp/˜gok/math/statistics/ 2

朝家を出るときに傘をどうするかと云う問題の答えは、『持って行く』か『持って行

かない』のどちらかしかありません。天気予報が常に降水確率

0

%か

100

%しかない のであれば話は簡単ですが、

30

%のときどうするか、

40

%のときどうするかが現実に は問題になるわけです。『今日は降水確率が

30

%だから傘を

30

%だけ持って行こう!』

なんて出来たら良いのですが、そうは行きません。普通は自分なりのしきい値を設定し て、降水確率がそれ以下なら持って行かない、それより大きければ持って行く、という 判断をするわけです。つまり、ある程度小さな確率の事象は『起きない』ものとして行 動するわけです。ここでは予想に反して雨が降って来て傘がなくて困るリスクをとって いるわけです。それよりは傘を持たずに身軽に行く事を選ぶ場合もあるわけです。これ は判断の問題であって、真実かどうかの問題ではありません。

2つの式

(14.2)

(14.3)

を見比べれば分かるように、この区間は仮想の母平均

80

ら両側に『大きくずれた』値の集合になっています。それは『あまりにも大きくずれて いる』ために、確率変数である標本平均

X ¯

がそこに入る確率は

0.05

と云う『極めて小 さい』値であって、そんな事象は『起きる筈がありません』。

もし仮に、実際に採取したサンプルの平均値がこの区間に入っていたら、そのサンプ ル値は母平均よりもずっと大きいか、ずっと小さいか、いずれにせよ大きくずれている わけです。そんなに大きくずれる可能性は

0.05

しかありません。『確率

0.05

の事象が 起きた』わけです。この事実をどう受け止めれば良いのでしょうか?

今『事実』と言いましたが、本当にそうですか? 確率云々の話は何かを仮定した上 での仮の計算だったのではなかったですか?

そうです。われわれは『仮に母平均が通常通りの値

80

であったと仮定すると』と宣 言して架空の話をしているのです。ですから式

(14.3)

自体が仮説に基づいた結果であっ て、『確率

0.05

の事象が起きた』というのは事実ではありません(正確には『事実でな い可能性がある』ですが)。

要するに『母平均が通常通りの値

80

であったと仮定する』と、計算により今採取し たサンプルは出現確率が

0.05

であるくらいに『母平均から大きくずれたレアなサンプ ルだ』と言えるわけです。

つまりサンプルを採取した私は、

100

個の玉の入った袋の中から、たった

5

個しか入っ ていない筈の赤玉を取り出せる『ゴッドハンド』を持っていると云うことです・ や、いや、そうじゃないでしょう。そんなレアなものは普通引けねえよ。そんなわけな いじゃん。何かがおかしいんだよ、そう、『間違った仮定を仮定してしまったから、一 見起きない筈のことが起きているように見えているだけなんだ』と考えるわけです。

従ってもし実際のサンプル値がこの区間に入っていたら、最初に仮定した仮定『母平 均は通常通りの値

80

である』は間違っていると考える事になります。つまりこの仮定

は『棄却され』ます(正しいかどうかではないので『否定』とは言いません)。以上の ような理由で『(両側)棄却域』と呼ばれています。

更に云えば、最初の仮定『母平均が通常通りの値

80

であったと仮定する』は、『仮 定』ではなく『仮説』、もっと言えば『帰無仮説』と呼ばれます。無に帰される(予定 の)仮説、つまり最初から否定されるべき運命にあるというニュアンスです。

母集団に対してある仮説を立てる

今回のサンプリング結果は仮説を基に計算した理論値から大きくずれている

そんなに大きくずれる確率は小さく起る筈がないので『これはおかしい』

こんなおかしな結果が出たのは間違った仮説を立てたからだ

最初に立てた仮説は間違っている

どうでしょうか?背理法による議論に良く似ていると思いませんか。

背理法: 仮定

計算

矛盾

仮定の否定 仮説検定: 仮説

計算

おかしい

仮説の棄却 話を整理しましょう。

まず最初に『帰無仮説:母平均は

80

である』を仮定します。問題となっているのは

『母平均が

80

であるかどうか』ですから、これより大きくても小さくてもいけない事 になります。そこでこの仮想の母平均の両側に一定幅以上ずれた値の領域である『両側 棄却域』が設定されます。どれぐらいずれれば『レア判定』されるかは『有意水準』に よって変わりますので、有意水準を幾らにするかは実際にサンプル採取をする前に決定 し、それに応じた両側棄却域を事前に計算しておきます。今の例では有意水準を

0.05

とし、この場合の両側棄却域は

( −1 , 79.02] [80.98, 1 )

となります。

そしていよいよ実際にサンプルを採取します。今の問題で言えばその結果平均値が

81.1

だったわけですが、この値は事前に求めておいた棄却域に入っています。従って

(帰無)仮説は棄却され、この日の製品の平均重量は

80g

ではないと判断されます。

もしも有意水準として

1

%を採用するなら、次のような

d > 0

を別に求めます:

P £ØØ X ¯ 80 Ø Ø d §

= 0.01.

(3)

すると

0.01 = P £ØØ X ¯ 80 Ø Ø d §

= P ∑ØØ Ø Ø N µ

0, 1 4

∂ØØ Ø Ø d

0.99 = P ∑ØØ Ø Ø N µ

0, 1 4

∂ØØ Ø Ø d

= P

| N (0, 1) | ≤ d

1 2

0.495 = P [0 N (0, 1) 2d]

となって標準正規分布表により

2d 2.575

、従って

d 1.2875

ですから、この場合の 両側棄却域は

( −1 , 78.7125] [81.2875, 1 )

となり、今回のサンプル値はこの棄却域に 入っていません。つまり、このサンプルはそれほどレアなものとは言えないわけで、あ る意味普通のことが起きているだけの話ですから、最初に立てた仮説に文句を言う筋合 いはありません。従ってこのような場合には『帰無仮説を棄却するに足る合理的な理由 は存在しない』とし、『この日の製品の平均重量は

80g

でないとは言えない』、要する に消極的な意味で『平均重量は

80g

である』と判断する事になります。

14.2.2

片側検定の場合

例題

14.2.2

ある工場で生産している製品の重さは、通常は平均値が

80g

、標準偏差が

5g

の正規分布をしている筈ですが、最近ちょっと重いのではないかとの疑義が生じてい ます(分布が正規分布である事や標準偏差の値には疑義は生じていないとします)。正 しく生産されているか調べるために、ある日の製品の中から

100

個のサンプルを抽出 して調査をする事になりました。

実際にサンプルをとって重さを測定したところ、平均値が

80.9g

でした。この日の製 品は平常と比べて重いと言えるでしょうか。有意水準

5

%で検定して下さい。

今回問題となっているのは母平均が

80g

であるかどうかではなくて、『母平均が

80g

より大きいかどうか』です。大きくなければ、小さい分にはどんなに小さくても構わな いわけです(それはそれで問題でしょうが、今回はそこは見ない云う事)。

この場合、さっきと同じ計算をして両側棄却域を設定してしまうと、

80g

よりもずっ と小さなサンプル結果が出た場合にも帰無仮説は棄却されて仕舞います。そこは問題で はなかったにも拘らずです。出来れば

80g

よりずっと大きなサンプル結果が出た場合だ け帰無仮説を棄却し、母平均は通常より大きいんだと結論したい筈です。

そこでこの日の製品の中から取り出す大きさ

100

の標本平均を

X ¯

として

0.05 = P[d X ¯ (

母平均

)]

となる

d > 0

を求めることにします。

X ¯ (

母平均

)

N °

0, 1 4 ¢

に従いましたから

0.05 = P[d X ¯ (

母平均

)] = P

d

1 2

N (0, 1)

= 0.5 P [0 N(0, 1) 2d]

0.45 = P [0 N (0, 1) 2d]

となり、正規分布表から

2d 1.645

、つまり

d 0.8225

が分かります。これは母平均

80

と仮定すれば

0.05 P [80.8225 X] = ¯ P [ ¯ X [80.8225, 1 )]

を意味しますので、今回はこの区間

[80.8225, 1 )

を棄却域として判断をします。この様 に対象となる値が『大きいこと』や『小さいこと』を調べる場合には、棄却域を片側の みの区間に設定します。

今回のサンプル値

80.9

はこの片側棄却域に入っていますから帰無仮説は棄却され、こ の日は平常よりも重かったと言えます(なぜなら、サンプル値が重い方に大きくずれた 場合のみ棄却されるように設定しているからです)。

2つの例を見ましたが、どちらも最初に仮定する帰無仮説は同一のものであり、どち らもサンプル値が棄却域に入ることによってその帰無仮説は棄却されました。しかしそ の結果何が言えるかは違っています。

母平均が

80

であるかどうかが問題であれば、大きい側にも小さい側にも対称に棄却 域を設定し、サンプル値が棄却域に入った場合には母平均は

80

ではないと判断します。

母平均が

80

より大きいかどうかが問題であれば、大きい側のみに棄却域を設定し、

サンプル値が棄却域に入った場合には母平均は

80

より大きいと判断します。

この様に判断したい内容によって棄却域を両側に取る場合と片側に取る場合があり、

それぞれ両側検定、片側検定と呼ばれます。ここを分かり易くするために、帰無仮説が 棄却された時にその 否定 として肯定されるであろう命題を『対立仮説』と呼んで明 示する方法があります。例えば今の例(

80g

より重いかどうかが問題の場合)では

帰無仮説: この日も重さの平均値は

80g

である 対立仮説: この日の重さの平均値は

80g

より重い とし、最初の例(

80g

かどうかが問題の場合)では

帰無仮説: この日も重さの平均値は

80g

である 対立仮説: この日の重さの平均値は

80g

ではない とします。

(4)

Revised at 14:13, February 6, 2017 14 http://my.reset.jp/˜gok/math/statistics/ 4

14.3

2項母集団における仮説検定

例題

14.3.1

箱の中に触っただけでは区別のつかない赤玉と白玉がたくさん入っており、

何回か抽出してみたところどうも赤玉の方が多く出る気がします。そこで試しに復元抽 出を8回繰り返した結果、1個の白玉と7個の赤玉が出てきました。さて、箱の中の玉 の数は赤玉の方が多いと言えるでしょうか? 有意水準

5

%で仮説検定して下さい。

帰無仮説

H 0

: 赤玉と白玉の個数は等しい 対立仮説

H 1

: 赤玉の方が多い

とします。帰無仮説が正しいと仮定すると8回取り出したときの赤玉の数

X

は2項分

B °

8, 1 2 ¢

に従います。

j 0 1 2 3 4

P [X = j] ° 1

2

¢ 8

= 0.004 8 ° 1

2

¢ 8

= 0.031 ° 8

2

¢ ° 1

2

¢ 8

= 0.109 ° 8

3

¢ ° 1

2

¢ 8 ° 8

4

¢ ° 1

2

¢ 8

8 7 6 5

° 1

2

¢ 8

= 0.004 ° 8 7

¢ ° 1

2

¢ 8

= 0.031 ° 8 6

¢ ° 1

2

¢ 8

= 0.109 ° 8 5

¢ ° 1

2

¢ 8

今回は赤玉の方が多いかどうかのみが問題になっていますから、赤玉が多い側一方だ けに棄却域を設定することになります。つまり

P [k X ] = 0.05

となる

k

を求めるわ けですが、上の分布表によると

P[6 X] 0.144 > 0.05, P[7 X] 0.035 < 0.05

ですから、有意水準を

0.05

とするのであれば

k = 7

とするしかありません。従って下 図のように棄却域を設定する事になります:

 この場合、赤玉が7回以上出た場合にのみ帰無仮 説は棄却され、白玉が多く出ても棄却されません。

この場合、帰無仮説を棄却して得られるものは『赤 玉の方が多い』になります。赤玉の方が多いかどう かが問題ですので赤玉が多く引かれる側の片側だけ に棄却域を設定すれば良いのです。

今回の具体的なサンプル値は

X = 7

でしたから、これは上記の片側棄却域に入って おり、帰無仮説は棄却され、赤玉の方が多く入っていると判断されます。

ちなみに同じ有意水準で『赤・白同数かどうか』を問題にするのであれば、赤が多く出 た場合も少なく出た場合も同じように仮説を棄却すべきですから

P [ | X 4 | ≥ k] = 0.05

となる

k

を求めて両側に棄却域を設定します。先の確率計算によれば

k = 4

です:

 この場合は赤玉が8回出るか全く出なかった場合 に帰無仮説は棄却されます。赤玉が多くても少なく てもとにかく偏ってさえいれば帰無仮説は棄却され ますから、棄却した結果得られるものは純粋に『赤 白同数ではない』と云う事になります。

しかし今回のサンプル値はこの両側棄却域には入っておらず、帰無仮説を棄却するに 足る合理的な理由はなく、『赤・白同数でないとは言えない』と判断され、(消極的では ありますが)赤・白同数であると考えることになります。

例題

14.3.2

1つのサイコロを

100

回振った所2の目が

22

回出ました。このサイコロ

は2の目が出やすいと言えるでしょうか? 有意水準

0.05

で仮説検定して下さい。

帰無仮説

H 0

: このサイコロは全ての目が

1

6

の確率で出る正しいサイコロである。

対立仮説

H 1

: このサイコロは2が出やすい。

とし、まず有意水準

0.05

の右片側棄却域を求めます。

帰無仮説が正しいと仮定すると、

100

回振って2の出る数

X

は2項分布

B ° 100, 1 6 ¢

に従い、平均値は

100 · 1 6 17

回です。このとき

0.05 = P [d X ] = P

d B

µ 100, 1

6

∂∏

となる

d > 0

を求めるわけですが、2項分布

B(n, p)

は、

n

が十分大きければ、平均

np

分散

npq

の正規分布で次のように近似されました(

q = 1 p

P [B(n, p) = j] P

j 1

2 N (np, npq) j + 1 2

.

これを使えば

0.05 P

d 1

2 N µ 100

6 , 500 6 2

∂∏

= P

"

d 1 2 100 6

10 5 6

N (0, 1)

#

0.45 P

"

0 N (0, 1) d 1 2 100 6 10

5 6

#

となって正規分布表から

d

1012

51006

6

1.645

、すなわち

d 0.5+ 100 6 +1.645 · 10 6 5 23.3

が分かります。従って棄却域は

[24, 1 )

(もしくは

[23, 1 )

でもまあ良いでしょう)と なります。今回の標本値

22

はここには入りませんので仮説

H 0

を棄却するだけの理由 はないと判断され、2が出やすいとは言えないことが分かります。

(5)

14.4

問題演習

基本演習

14.1 (

教科書 練習問題

16-6)

あるサイコロを

600

回無作為に投げたと

ころ、

1

の目が

118

回出ました。このサイコロは

1

の目が出やすいと言えるでしょ うか。有意水準1%で検定して下さい。

基本演習

14.2

ある機械が袋に詰める砂糖の重さは、平均

100g

、標準偏差

5g

の正 規分布に従うように調整されます。機械が正しく調整されているかどうか確かめる ために、無作為に9個の袋を取って砂糖の重さを測ったところ平均は

102.4g

でし た。この機械は正しく調整されているか有意水準5%で検定して下さい。

基本演習

14.3

多数の人口をもつある都市の中学一年生に数学の学力テストを一斉 に実施しました。受験生から

100

名を無作為に抽出し得点を調べたところ、得点 の平均は

52.2

でした。全受験生の得点は標準偏差

10.5

の正規分布に従うことが分 かっているものとします。このとき仮説『全受験生の得点の平均は

50

点である』

を、有意水準5%で検定して下さい。また1%でも検定して下さい。

基本演習

14.4

ある工場で生産される糸の強さは平均

170.8g

の重さに耐えるよう に作られていますが、最近糸が弱くなったと苦情が寄せられています。糸の強さ

X

は正規分布

N(m, 5.5 2 )

に従うことが経験的に分かっており、平均

m

170.8g

りも小さいことが予想されます。今製品から

50

本を無作為抽出して強さを測定し たところ、その平均は

169.5g

でした。糸は弱くなったと言って良いでしょうか?有 意水準

0.05

で検定して下さい。また、同様に有意水準

0.01

でも検定して下さい。

基本演習

14.5

ある工場の資料によると、機械Aを用いて作られた製品の平均重量

5.68g

です。新しい機械Bが導入されて同じ製品が作られていますが、製品の平

均重量に変化が生じたように思われたので、Bによる製品から

70

個無作為に抽出 したところ平均重量が

5.73g

、標準偏差が

0.23g

でした。Bを用いて作られた製品の 重量は正規分布に従うものとし、また、標本数が大きいのでその標準偏差は

0.23g

であるとし、平均重量が変化したかどうか有意水準5%で仮説検定して下さい。

基本演習

14.6

ある工場で作られる電球の寿命は標準偏差

100

時間の正規分布に 従っています。計画では寿命の平均値は

1800

時間になるように製造されている筈 ですがこの平均値に関して疑義が生じています。

そこでこの工場で製造された多数の電球の中から

25

個を抽出して寿命時間を測 定したところ、その平均値は

1835

時間でした。以下の3通りで検定して下さい

(1)寿命時間の平均値は

1800

時間より長いと言えるか有意水準

5

%で検定し て下さい。

(2)寿命時間の平均値は

1800

時間と言えるか有意水準

5

%で検定して下さい。

(3)寿命時間の平均値は

1800

時間と言えるか有意水準

10

%で検定して下さい。

参照

関連したドキュメント

の変化は空間的に滑らかである」という仮定に基づいて おり,任意の画素と隣接する画素のフローの差分が小さ くなるまで推定を何回も繰り返す必要がある

このうち糸球体上皮細胞は高度に分化した終末 分化細胞であり,糸球体基底膜を外側から覆い かぶさるように存在する.

7IEC で定義されていない出力で 575V 、 50Hz

存在が軽視されてきたことについては、さまざまな理由が考えられる。何よりも『君主論』に彼の名は全く登場しない。もう一つ

問題はとても簡単ですが、分からない 4人います。なお、呼び方は「~先生」.. 出席について =

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

テストが成功しなかった場合、ダイアログボックスが表示され、 Alienware Command Center の推奨設定を確認するように求め

題が検出されると、トラブルシューティングを開始するために必要なシステム状態の情報が Dell に送 信されます。SupportAssist は、 Windows