第 8 章 2項分布 63
12.3 標本比率の確率分布:数学的説明
84 第12章 母集団比率の推定
12.3. 標本比率の確率分布:数学的説明 85 と見なして,解いてみる.すなわち,2 次不等式
( 1 + z2
n )
p2−2 (
ˆ p+ z2
2n )
+ ˆp2 50 を解く.判別式は
D =
( ˆ p+ z2
2n )2
− (
1 + z2 n
)
·pˆ2
= z2 ·p(1ˆ −p)ˆ n + z4
4n2
となる.ここで,標本数 n は十分に大きい 場合を考えていることを思い出すと,右辺 第 2項は第 1 項と比較して無視できる.そこで,
D=約 z2· p(1ˆ −p)ˆ n すなわち,記号を簡単にするために,
ˆ s =
√p(1ˆ −p)ˆ
n (12.1)
と書くことにすると,√
D=約 zsˆである.したがって,2 次不等式の解 (
ˆ p+ z2n2
)−√ D
1 + zn2 5p5 (
ˆ p+2nz2
) +√
D 1 + zn2 は簡単化できて,次のようになる.
ˆ
p−zˆs5p5pˆ+zsˆ (12.2) 出発点の 2 次不等式は確率1−α(z) で成立しているのだから,その解である不等式
(12.2)も同じ確率で成立している.したがって,つぎの結果を得ることができた.
確率1−α(z) で,未知の母集団比率p はpˆ−zsˆ以上,ˆp−zsˆ以下である.
ただし sˆ=
√p(1ˆ −p)ˆ n
12.3.1 標本数の決定
例5 政党 A の支持率を調査するとき,支持率の95% 信頼区間の幅を 2% 以下にする ためには,標本数をいくつ以上にしなければいけないか?
86 第12章 母集団比率の推定
(解) 信頼区間は [ˆp−zs,pˆ+zs] であるから,その幅は 2zs である.幅を w%以下 にしたいのすれば,2zs5w とすればよい.だから
s 5 w 2z とすればよい.すなわち
ˆ
p(1−p)ˆ
n 5(w
2z )2
とすればよい.数I の知識「2次関数 f(x) = x(1−x)の最大値は 14 である」を思い起 こす.すると,上の不等式を成り立たせるためには,
1
4n 5(w 2z
)2
, すなわち n =(z
w )2
(12.3) とすればよい.
95% 信頼区間を考えているから z = 1.96 であり,また幅を 2% 以下にしたいのだか ら w= 0.02と置く.すると,公式 (12.3) を用いて,n=9604 が得られる.
問 4 ある市では,糖尿病患者の割合を知るために,集団検診を実施する予定である.
糖尿病患者の割合の95% 信頼区間の幅を 1% 以下にするためには,標本数をいくらに したらよいか?
87
第 13 章 一様性の検定
13.1 一様性の検定の処方箋
13.1.1 正しいサイコロか?
例 13.1.1 つぎの表は平成 21 年度の名瀬市の月別出生数(男子と女子の計)を示してい る.1
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
48 45 48 46 53 44 56 51 57 62 42 61
出生数は月に無関係であるか? すなわち,一人の新生児が生まれる確率はどの月も 1 に等しいか? 12
例 13.1.2 つぎの表は平成 21 年度の鹿児島市の曜日別火災発生件数を示している.2 日 月 火 水 木 金 土
39 31 32 35 41 31 39
火災発生件数は曜日に無関係であるか? すなわち,一件の火災が発生する確率はどの 曜日も 1
7 に等しいか?
上の二つの問題のように,いくつかの場合が起きる可能性があって,それぞれの場合 が起きる確率がたがいに等しいかどうかを調べる問題は,現実の世界にしばしば現れる.
これらの問題は,つぎの『賭博場』で現れる問題と,じつは全く同じ種類の問題である.
例 13.1.3 つぎの表は,サイコロを 60 回投げたときに,それぞれの目が出た回数を示 している(架空の例).
1の目 2の目 3の目 4の目 5の目 6の目 サイコロ A 12 7 8 10 12 11 サイコロ B 7 10 7 6 6 24
1『人口動態統計調査』http://www.pref.kagoshima.jp/tokei/bunya/jinko/jinkodotai/H21jinnkoudoutai.html
2『消防年報』http://www.kagoshima-fd.jp/pdfs/nenpou/h22nenpou.pdf
88 第13章 一様性の検定 二つのサイコロA, B は正しいサイコロであるか? すなわち,それぞれの目が出る確率 はどの目も 1
6 に等しいか?
いくつかの場合が起きる可能性があって,それぞれの場合が起きる確率がたがいに等 しいかどうかを調べるテスト方法,すなわち確率が『一様』であるかどうかを調べるテ スト方法を,一様性の検定と言う.
13.1.2 一様性の検定の基本的アイデア
正しいサイコロを 60 回投げたとき,それぞれの目が出る回数は『ほぼ』 10 回ずつ になるだろう.だから例3.1.3で,サイコロ A のような結果が現れても,誰も不思議に 思わない.しかし,サイコロB のような結果が現れたとしたら,誰もが「6の目が出す ぎているので,このサイコロは正しくない」,と判断するであろう.
一般に,ある偶然現象では k 種類の結果が起きる可能性があり,実際に調査(または 観察)したところ,それぞれの結果が起きた度数が
X1, X2,· · ·, Xk であったとする.このとき仮説
それぞれの結果が起きる確率は 1k である が正しいかどうかを,データに基づいて判断したい.
仮説が正しいとき,それぞれの結果が起きる期待度数は n× 1
k = n k
ずつである(ただし n は度数の合計n =X1+X2+· · ·+Xk である).このとき
• もし実際の度数と期待度数の差 X1− n
k, X2− n
k,· · ·, Xk−n k がすべて小さいならば,「仮説は正しい」と判断する.
• 逆に,実際の度数と期待度数の差が,ある結果に対して大きすぎるならば,「仮説 は正しくない」と判断する.
この基本的アイデアにしたがって,一様性の検定を行うことができる.この検定方法 は,統計学においてカイ2乗検定と呼ばれている.3
3「カイ」はギリシャ文字のχを表す.「カイ2乗検定」の名称は,この方法を最初に考案した カール・
ピアソンによるが,検定方法の中身はギリシャ文字のχとは何の関係もない.
13.1. 一様性の検定の処方箋 89
13.1.3 表計算ソフトを用いたカイ2乗検定の実際
例3.1.3のサイコロ A のデータに対して,Excel を用いてカイ2乗検定を行うには,
つぎのようにすればよい.
1. 真偽を検討したい仮説は「サイコロは正しい」である.
2. 観察度数(データ)を A 列に入力し,期待度数を B 列に入力する.
A B
1 12 10
2 7 10
3 8 10
4 10 10
5 12 10
6 11 10
3. セル D1 に式 =CHITEST(A1:A6,B1:B6) を入力する.すると,その場所にp 値が 計算される.今の例の場合,p値 = 0.8208 である.
4. p 値は仮説が正しい確率と解釈してよい.今の例の場合,p 値は大きいので,「仮 説は正しい」と判断できる.
サイコロ B のデータに対して同様のことを行うと,つぎのようになる.
1. 真偽を検討したい仮説は「サイコロは正しい」である.
2. 観察度数(データ)を A 列に入力し,期待度数を B 列に入力する.
A B
1 7 10
2 10 10
3 7 10
4 6 10
5 6 10
6 24 10
3. セル D1 に式 =CHITEST(A1:A6,B1:B6)を入力する.すると p値 = 0.0001664 と なる.
4. p 値は小さいので「仮説は正しくない」と判断できる.
90 第13章 一様性の検定
13.1.4 検定の論理
注意1 前節では,p値が 0.8208 であるときは「大きい」と見なし,0.0001664である ときは「小さい」と見なした.では,たとえばp値が 0.02であるときや,0.07である ときは,どのように見なしたらよいだろうか?
慣例では,p 値が 0.05 未満のときは「小さい」と見なし,
0.05 以上のときは「大きい」と見なしている.
ここで,仮説検定のような合理的な思考の場面で,「慣例」が用いられることは,奇妙 だと思うかもしれない.しかし,仮説検定の結果を述べる際,「仮説を棄却した」または
「しなかった」という結論だけを述べることはせず,必ず p値を記す.A 氏が「仮説検 定を行って,仮説を棄却しました」と述べたときに,もし p値を述べ忘れたとしても,
それを聞いた B 氏は「p 値が 0.05 より小さいので,仮説は棄却されたのだな」と推測 できる.このように,この「慣例」が,誤った推論,意見の相違をうむことは無い.
注意2 仮説検定の論理の流れを図示すると次のようになるだろう.
仮説が正しいとしたら・・・ ⇒ p値の計算
⇓
p値が小さい
⇐ 仮説を棄却
これは,次の背理法の論理の流れとよく似ている.
仮定が正しいとしたら・・・ ⇒ 推論
⇓
⇐ 矛盾 仮定を棄却
ただ一つの,しかし大きな相違点は,背理法において矛盾が起きたとき,仮定は絶対 的に誤りであるのに対し,仮説検定においてp値が小さいとき,慣例にしたがって仮説 を棄却するが,じつは仮説が正しい可能性もある事である.
注意3 仮説検定において仮説が果たす役割は,背理法における仮定の役割と同じであ ることがわかった.ところで,背理法における仮定は,それが誤りを示す目的で置かれ たものである.同様に,仮説検定における仮説も,じつは,それが誤りを示す目的で置 く.この意味で,仮説検定における仮説は帰無仮説と呼ばれている.