14
仮説検定14.1
背理法定理
14.1.1 √
2
は無理数である。【証明】
√
2
が有理数であると仮定します。このとき√
2 = m n
と既約分数で書く事がで きますが、この両辺を自乗すると2 = m n
22、すなわち、2n 2 = m 2
が得られます。従って 右辺のm 2
は偶数です。しかし自乗が偶数と云う事はm
自身が偶数である事を意味しま すからm = 2k
と書くことが出来ます。すると今度は2n 2 = (2k) 2
、すなわちn 2 = 2k 2
となって同じ理由でn
も偶数である事が分かります。これはm, n
が互いに素であった 事に反します。これは矛盾であり、従って最初の仮定『√
2
は有理数である』は間違っ ていた事が分かり、√
2
は無理数である事が証明されました。正しい命題から出発して論理的に正しい議論を経て矛盾に到達する事はできませんか ら、矛盾が生じたと云う事は仮定が間違っていた以外にはあり得ないわけです。この様 に、ある仮定から出発して最終的に矛盾を導きだし、結果として最初に置いた仮定が間 違っていたと論じる議論の仕方を背理法と呼びます。
14.2
分散既知の正規母集団における母平均の仮説検定14.2.1
両側検定の場合例題
14.2.1
ある工場で生産している製品の重さは、通常は平均値が80g
、標準偏差が5g
の正規分布をしている筈ですが、その平均値に疑義が生じています(分布が正規分 布である事や標準偏差の値には疑義は生じていないとします)。正しく生産されている か調べるために、ある日の製品の中から100
個のサンプルを抽出して調査をする事に なりました。実際にサンプルをとって重さを測定したところ、平均値が
81.1g
でした。この日の製 品は平常通りの重さであると言えるでしょうか?母集団
X
(この日の製品の重量全体)は正規分布に従い、母平均は不明、母分散は5 2
です。この母集団からとった大きさ100
の標本平均をX ¯
とするとき、区間推定のと きに見たように、母平均の値は分からなくてもP £ØØ X ¯ − (
母平均) Ø Ø ≥ d §
= 0.05 (14.1)
となるような
d > 0
を求める事が出来ます。実際、X ¯ − (
母平均)
はN ≥ 0, 100 5
2¥
に従い ますから
0.05 = P £ØØ X ¯ − (
母平均) Ø Ø ≥ d §
= P ∑ØØ Ø Ø N µ
0, 1 4
∂ØØ Ø Ø ≥ d
∏
0.95 = P ∑ØØ Ø Ø N µ
0, 1 4
∂ØØ Ø Ø ≤ d
∏
= P
∑
| N (0, 1) | ≤ d
1 2
∏
0.475 = P [0 ≤ N(0, 1) ≤ 2d]
となって標準正規分布表により
2d ∼ 1.96
、従ってd ∼ 0.98
と求まってしまうわけです。ここで仮に母平均が通常通りの値
80
であったと仮定すると、P £ØØ X ¯ − 80 Ø Ø ≥ 0.98 §
∼ 0.05 (14.2)
すなわち
P [ ¯ X ∈ ( −1 , 79.02] ∪ [80.98, 1 )] ∼ 0.05 (14.3)
が成り立っている筈ですが、X ¯
の実現値である実際の大きさ100
のサンプルの平均値 は区間( −1 , 79.02] ∪ [80.98, 1 )
に入るか、入らないか、どちらかしかなく、前者であ る確率が0.05
、後者が0.95
であるわけです。この区間
( −1 , 79.02] ∪ [80.98, 1 )
を、『有意水準5%の両側棄却域』と呼びます。まず前提として、
X ¯
がこの区間に入る確率は0.05
と『極めて小さい』値です。いや、むしろ逆で、『小さい』という概念は相対的なものですから、『どれ位なら極めて小さ いと考えるか』が問題になります。で、ここでは、
0.05
だったら極めて小さいとします よ、と云う意味で『有意水準5%』と云う言い方をします。式(14.1)
の右辺を0.05
と したのにはそう云う背景があります。有意水準は0.05
でなければならないわけではな く、0.01
や0.1
などを採用する場合もあります。そして、『極めて小さい』事が何を意味するかと言うと、『そんな確率の小さな事象 は起きない』と考えます。勿論どんなに小さな確率であったとしてもその事象が起きる 可能性はあるわけですから、この『起きない』と云う判断は事実としては間違っていま す。そう、正しいかどうかではないのです。
Revised at 14:13, February 6, 2017 14 http://my.reset.jp/˜gok/math/statistics/ 2
朝家を出るときに傘をどうするかと云う問題の答えは、『持って行く』か『持って行かない』のどちらかしかありません。天気予報が常に降水確率
0
%か100
%しかない のであれば話は簡単ですが、30
%のときどうするか、40
%のときどうするかが現実に は問題になるわけです。『今日は降水確率が30
%だから傘を30
%だけ持って行こう!』なんて出来たら良いのですが、そうは行きません。普通は自分なりのしきい値を設定し て、降水確率がそれ以下なら持って行かない、それより大きければ持って行く、という 判断をするわけです。つまり、ある程度小さな確率の事象は『起きない』ものとして行 動するわけです。ここでは予想に反して雨が降って来て傘がなくて困るリスクをとって いるわけです。それよりは傘を持たずに身軽に行く事を選ぶ場合もあるわけです。これ は判断の問題であって、真実かどうかの問題ではありません。
2つの式
(14.2)
、(14.3)
を見比べれば分かるように、この区間は仮想の母平均80
から両側に『大きくずれた』値の集合になっています。それは『あまりにも大きくずれて いる』ために、確率変数である標本平均
X ¯
がそこに入る確率は0.05
と云う『極めて小 さい』値であって、そんな事象は『起きる筈がありません』。もし仮に、実際に採取したサンプルの平均値がこの区間に入っていたら、そのサンプ ル値は母平均よりもずっと大きいか、ずっと小さいか、いずれにせよ大きくずれている わけです。そんなに大きくずれる可能性は
0.05
しかありません。『確率0.05
の事象が 起きた』わけです。この事実をどう受け止めれば良いのでしょうか?今『事実』と言いましたが、本当にそうですか? 確率云々の話は何かを仮定した上 での仮の計算だったのではなかったですか?
そうです。われわれは『仮に母平均が通常通りの値
80
であったと仮定すると』と宣 言して架空の話をしているのです。ですから式(14.3)
自体が仮説に基づいた結果であっ て、『確率0.05
の事象が起きた』というのは事実ではありません(正確には『事実でな い可能性がある』ですが)。要するに『母平均が通常通りの値
80
であったと仮定する』と、計算により今採取し たサンプルは出現確率が0.05
であるくらいに『母平均から大きくずれたレアなサンプ ルだ』と言えるわけです。つまりサンプルを採取した私は、
100
個の玉の入った袋の中から、たった5
個しか入っ ていない筈の赤玉を取り出せる『ゴッドハンド』を持っていると云うことです・・・ い や、いや、そうじゃないでしょう。そんなレアなものは普通引けねえよ。そんなわけな いじゃん。何かがおかしいんだよ、そう、『間違った仮定を仮定してしまったから、一 見起きない筈のことが起きているように見えているだけなんだ』と考えるわけです。従ってもし実際のサンプル値がこの区間に入っていたら、最初に仮定した仮定『母平 均は通常通りの値
80
である』は間違っていると考える事になります。つまりこの仮定は『棄却され』ます(正しいかどうかではないので『否定』とは言いません)。以上の ような理由で『(両側)棄却域』と呼ばれています。
更に云えば、最初の仮定『母平均が通常通りの値
80
であったと仮定する』は、『仮 定』ではなく『仮説』、もっと言えば『帰無仮説』と呼ばれます。無に帰される(予定 の)仮説、つまり最初から否定されるべき運命にあるというニュアンスです。母集団に対してある仮説を立てる
⇓
今回のサンプリング結果は仮説を基に計算した理論値から大きくずれている
⇓
そんなに大きくずれる確率は小さく起る筈がないので『これはおかしい』
⇓
こんなおかしな結果が出たのは間違った仮説を立てたからだ
⇓
最初に立てた仮説は間違っている
どうでしょうか?背理法による議論に良く似ていると思いませんか。
背理法: 仮定
⇒
計算⇒
矛盾⇒
仮定の否定 仮説検定: 仮説⇒
計算⇒
おかしい⇒
仮説の棄却 話を整理しましょう。まず最初に『帰無仮説:母平均は
80
である』を仮定します。問題となっているのは『母平均が
80
であるかどうか』ですから、これより大きくても小さくてもいけない事 になります。そこでこの仮想の母平均の両側に一定幅以上ずれた値の領域である『両側 棄却域』が設定されます。どれぐらいずれれば『レア判定』されるかは『有意水準』に よって変わりますので、有意水準を幾らにするかは実際にサンプル採取をする前に決定 し、それに応じた両側棄却域を事前に計算しておきます。今の例では有意水準を0.05
とし、この場合の両側棄却域は( −1 , 79.02] ∪ [80.98, 1 )
となります。そしていよいよ実際にサンプルを採取します。今の問題で言えばその結果平均値が
81.1
だったわけですが、この値は事前に求めておいた棄却域に入っています。従って(帰無)仮説は棄却され、この日の製品の平均重量は
80g
ではないと判断されます。もしも有意水準として
1
%を採用するなら、次のようなd > 0
を別に求めます:P £ØØ X ¯ − 80 Ø Ø ≥ d §
= 0.01.
すると
0.01 = P £ØØ X ¯ − 80 Ø Ø ≥ d §
= P ∑ØØ Ø Ø N µ
0, 1 4
∂ØØ Ø Ø ≥ d
∏
0.99 = P ∑ØØ Ø Ø N µ
0, 1 4
∂ØØ Ø Ø ≤ d
∏
= P
∑
| N (0, 1) | ≤ d
1 2
∏
0.495 = P [0 ≤ N (0, 1) ≤ 2d]
となって標準正規分布表により
2d ∼ 2.575
、従ってd ∼ 1.2875
ですから、この場合の 両側棄却域は( −1 , 78.7125] ∪ [81.2875, 1 )
となり、今回のサンプル値はこの棄却域に 入っていません。つまり、このサンプルはそれほどレアなものとは言えないわけで、あ る意味普通のことが起きているだけの話ですから、最初に立てた仮説に文句を言う筋合 いはありません。従ってこのような場合には『帰無仮説を棄却するに足る合理的な理由 は存在しない』とし、『この日の製品の平均重量は80g
でないとは言えない』、要する に消極的な意味で『平均重量は80g
である』と判断する事になります。14.2.2
片側検定の場合例題
14.2.2
ある工場で生産している製品の重さは、通常は平均値が80g
、標準偏差が5g
の正規分布をしている筈ですが、最近ちょっと重いのではないかとの疑義が生じてい ます(分布が正規分布である事や標準偏差の値には疑義は生じていないとします)。正 しく生産されているか調べるために、ある日の製品の中から100
個のサンプルを抽出 して調査をする事になりました。実際にサンプルをとって重さを測定したところ、平均値が
80.9g
でした。この日の製 品は平常と比べて重いと言えるでしょうか。有意水準5
%で検定して下さい。今回問題となっているのは母平均が
80g
であるかどうかではなくて、『母平均が80g
より大きいかどうか』です。大きくなければ、小さい分にはどんなに小さくても構わな いわけです(それはそれで問題でしょうが、今回はそこは見ない云う事)。この場合、さっきと同じ計算をして両側棄却域を設定してしまうと、
80g
よりもずっ と小さなサンプル結果が出た場合にも帰無仮説は棄却されて仕舞います。そこは問題で はなかったにも拘らずです。出来れば80g
よりずっと大きなサンプル結果が出た場合だ け帰無仮説を棄却し、母平均は通常より大きいんだと結論したい筈です。そこでこの日の製品の中から取り出す大きさ
100
の標本平均をX ¯
として0.05 = P[d ≤ X ¯ − (
母平均)]
となる
d > 0
を求めることにします。X ¯ − (
母平均)
はN °
0, 1 4 ¢
に従いましたから0.05 = P[d ≤ X ¯ − (
母平均)] = P
∑ d
1 2
≤ N (0, 1)
∏
= 0.5 − P [0 ≤ N(0, 1) ≤ 2d]
0.45 = P [0 ≤ N (0, 1) ≤ 2d]
となり、正規分布表から
2d ∼ 1.645
、つまりd ∼ 0.8225
が分かります。これは母平均 を80
と仮定すれば0.05 ∼ P [80.8225 ≤ X] = ¯ P [ ¯ X ∈ [80.8225, 1 )]
を意味しますので、今回はこの区間
[80.8225, 1 )
を棄却域として判断をします。この様 に対象となる値が『大きいこと』や『小さいこと』を調べる場合には、棄却域を片側の みの区間に設定します。今回のサンプル値
80.9
はこの片側棄却域に入っていますから帰無仮説は棄却され、こ の日は平常よりも重かったと言えます(なぜなら、サンプル値が重い方に大きくずれた 場合のみ棄却されるように設定しているからです)。2つの例を見ましたが、どちらも最初に仮定する帰無仮説は同一のものであり、どち らもサンプル値が棄却域に入ることによってその帰無仮説は棄却されました。しかしそ の結果何が言えるかは違っています。
母平均が
80
であるかどうかが問題であれば、大きい側にも小さい側にも対称に棄却 域を設定し、サンプル値が棄却域に入った場合には母平均は80
ではないと判断します。母平均が
80
より大きいかどうかが問題であれば、大きい側のみに棄却域を設定し、サンプル値が棄却域に入った場合には母平均は
80
より大きいと判断します。この様に判断したい内容によって棄却域を両側に取る場合と片側に取る場合があり、
それぞれ両側検定、片側検定と呼ばれます。ここを分かり易くするために、帰無仮説が 棄却された時にその 否定 として肯定されるであろう命題を『対立仮説』と呼んで明 示する方法があります。例えば今の例(
80g
より重いかどうかが問題の場合)では帰無仮説: この日も重さの平均値は
80g
である 対立仮説: この日の重さの平均値は80g
より重い とし、最初の例(80g
かどうかが問題の場合)では帰無仮説: この日も重さの平均値は
80g
である 対立仮説: この日の重さの平均値は80g
ではない とします。Revised at 14:13, February 6, 2017 14 http://my.reset.jp/˜gok/math/statistics/ 4
14.3
2項母集団における仮説検定例題
14.3.1
箱の中に触っただけでは区別のつかない赤玉と白玉がたくさん入っており、何回か抽出してみたところどうも赤玉の方が多く出る気がします。そこで試しに復元抽 出を8回繰り返した結果、1個の白玉と7個の赤玉が出てきました。さて、箱の中の玉 の数は赤玉の方が多いと言えるでしょうか? 有意水準
5
%で仮説検定して下さい。帰無仮説
H 0
: 赤玉と白玉の個数は等しい 対立仮説H 1
: 赤玉の方が多いとします。帰無仮説が正しいと仮定すると8回取り出したときの赤玉の数
X
は2項分 布B °
8, 1 2 ¢
に従います。j 0 1 2 3 4
P [X = j] ° 1
2
¢ 8
= 0.004 8 ° 1
2
¢ 8
= 0.031 ° 8
2
¢ ° 1
2
¢ 8
= 0.109 ° 8
3
¢ ° 1
2
¢ 8 ° 8
4
¢ ° 1
2
¢ 8
8 7 6 5
° 1
2
¢ 8
= 0.004 ° 8 7
¢ ° 1
2
¢ 8
= 0.031 ° 8 6
¢ ° 1
2
¢ 8
= 0.109 ° 8 5
¢ ° 1
2
¢ 8
今回は赤玉の方が多いかどうかのみが問題になっていますから、赤玉が多い側一方だ けに棄却域を設定することになります。つまり
P [k ≤ X ] = 0.05
となるk
を求めるわ けですが、上の分布表によるとP[6 ≤ X] ∼ 0.144 > 0.05, P[7 ≤ X] ∼ 0.035 < 0.05
ですから、有意水準を
0.05
とするのであればk = 7
とするしかありません。従って下 図のように棄却域を設定する事になります:この場合、赤玉が7回以上出た場合にのみ帰無仮 説は棄却され、白玉が多く出ても棄却されません。
この場合、帰無仮説を棄却して得られるものは『赤 玉の方が多い』になります。赤玉の方が多いかどう かが問題ですので赤玉が多く引かれる側の片側だけ に棄却域を設定すれば良いのです。
今回の具体的なサンプル値は
X = 7
でしたから、これは上記の片側棄却域に入って おり、帰無仮説は棄却され、赤玉の方が多く入っていると判断されます。ちなみに同じ有意水準で『赤・白同数かどうか』を問題にするのであれば、赤が多く出 た場合も少なく出た場合も同じように仮説を棄却すべきですから
P [ | X − 4 | ≥ k] = 0.05
となるk
を求めて両側に棄却域を設定します。先の確率計算によればk = 4
です:この場合は赤玉が8回出るか全く出なかった場合 に帰無仮説は棄却されます。赤玉が多くても少なく てもとにかく偏ってさえいれば帰無仮説は棄却され ますから、棄却した結果得られるものは純粋に『赤 白同数ではない』と云う事になります。
しかし今回のサンプル値はこの両側棄却域には入っておらず、帰無仮説を棄却するに 足る合理的な理由はなく、『赤・白同数でないとは言えない』と判断され、(消極的では ありますが)赤・白同数であると考えることになります。
例題
14.3.2
1つのサイコロを100
回振った所2の目が22
回出ました。このサイコロは2の目が出やすいと言えるでしょうか? 有意水準
0.05
で仮説検定して下さい。帰無仮説
H 0
: このサイコロは全ての目が1
6
の確率で出る正しいサイコロである。対立仮説
H 1
: このサイコロは2が出やすい。とし、まず有意水準
0.05
の右片側棄却域を求めます。帰無仮説が正しいと仮定すると、
100
回振って2の出る数X
は2項分布B ° 100, 1 6 ¢
に従い、平均値は100 · 1 6 ∼ 17
回です。このとき0.05 = P [d ≤ X ] = P
∑ d ≤ B
µ 100, 1
6
∂∏
となる
d > 0
を求めるわけですが、2項分布B(n, p)
は、n
が十分大きければ、平均np
、 分散npq
の正規分布で次のように近似されました(q = 1 − p
):P [B(n, p) = j] ∼ P
∑ j − 1
2 ≤ N (np, npq) ≤ j + 1 2
∏ .
これを使えば
0.05 ∼ P
∑ d − 1
2 ≤ N µ 100
6 , 500 6 2
∂∏
= P
"
d − 1 2 − 100 6
10 √ 5 6
≤ N (0, 1)
#
0.45 ∼ P
"
0 ≤ N (0, 1) ≤ d − 1 2 − 100 6 10 √
5 6
#
となって正規分布表から
d −
1012−
√510066
∼ 1.645
、すなわちd ∼ 0.5+ 100 6 +1.645 · 10 6 √ 5 ∼ 23.3
が分かります。従って棄却域は[24, 1 )
(もしくは[23, 1 )
でもまあ良いでしょう)と なります。今回の標本値22
はここには入りませんので仮説H 0
を棄却するだけの理由 はないと判断され、2が出やすいとは言えないことが分かります。14.4
問題演習基本演習
14.1 (
教科書 練習問題16-6)
あるサイコロを600
回無作為に投げたところ、
1
の目が118
回出ました。このサイコロは1
の目が出やすいと言えるでしょ うか。有意水準1%で検定して下さい。基本演習
14.2
ある機械が袋に詰める砂糖の重さは、平均100g
、標準偏差5g
の正 規分布に従うように調整されます。機械が正しく調整されているかどうか確かめる ために、無作為に9個の袋を取って砂糖の重さを測ったところ平均は102.4g
でし た。この機械は正しく調整されているか有意水準5%で検定して下さい。基本演習
14.3
多数の人口をもつある都市の中学一年生に数学の学力テストを一斉 に実施しました。受験生から100
名を無作為に抽出し得点を調べたところ、得点 の平均は52.2
でした。全受験生の得点は標準偏差10.5
の正規分布に従うことが分 かっているものとします。このとき仮説『全受験生の得点の平均は50
点である』を、有意水準5%で検定して下さい。また1%でも検定して下さい。
基本演習
14.4
ある工場で生産される糸の強さは平均170.8g
の重さに耐えるよう に作られていますが、最近糸が弱くなったと苦情が寄せられています。糸の強さX
は正規分布N(m, 5.5 2 )
に従うことが経験的に分かっており、平均m
は170.8g
よ りも小さいことが予想されます。今製品から50
本を無作為抽出して強さを測定し たところ、その平均は169.5g
でした。糸は弱くなったと言って良いでしょうか?有 意水準0.05
で検定して下さい。また、同様に有意水準0.01
でも検定して下さい。基本演習
14.5
ある工場の資料によると、機械Aを用いて作られた製品の平均重量は
5.68g
です。新しい機械Bが導入されて同じ製品が作られていますが、製品の平均重量に変化が生じたように思われたので、Bによる製品から
70
個無作為に抽出 したところ平均重量が5.73g
、標準偏差が0.23g
でした。Bを用いて作られた製品の 重量は正規分布に従うものとし、また、標本数が大きいのでその標準偏差は0.23g
であるとし、平均重量が変化したかどうか有意水準5%で仮説検定して下さい。基本演習
14.6
ある工場で作られる電球の寿命は標準偏差100
時間の正規分布に 従っています。計画では寿命の平均値は1800
時間になるように製造されている筈 ですがこの平均値に関して疑義が生じています。そこでこの工場で製造された多数の電球の中から
25
個を抽出して寿命時間を測 定したところ、その平均値は1835
時間でした。以下の3通りで検定して下さい(1)寿命時間の平均値は
1800
時間より長いと言えるか有意水準5
%で検定し て下さい。(2)寿命時間の平均値は
1800
時間と言えるか有意水準5
%で検定して下さい。(3)寿命時間の平均値は