統計的仮説検定と
Excelによる
t検定
樋口さぶろお
龍谷大学理工学部数理情報学科
確率統計☆演習I L14(2016-01-15 Fri)
最終更新: Time-stamp: ”2016-01-15 Fri 14:03 JST hig”
今日の目標
母分散のカイ二乗検定ができる
検定の第1種の過誤,第2種の過誤,信頼係数, 検出力, p値,棄却域が説明できる
Excelでp値を求めてカイ二乗検定, t検定で
母分散の区間推定と検定・カイ二乗分布
L13-Q1
Quiz解答:母分散の区間推定 標本サイズは n= 9 である.
母分散σ2 の信頼係数0.95の信頼区間は, S2× n−1
χ2α
2
(n−1)<σ2 < S2× n−1 χ2
1−α 2
(n−1) 72· 8
17.53 <σ2 <72· 8 2.180 32.85<σ2 <264.2 L13-Q2
Quiz解答:母分散の区間推定 標本サイズは n= 9 である.
標本平均値は,X= 19[78 +· · ·+ 82] = 80g.
不偏標本分散は,S2= 9−11[(78−80)2+· · ·+ (82−80)2] = 4g2. よって 母平均値 は 母分散 2 は 2 と推定する
母分散の区間推定と検定・カイ二乗分布
母平均値µの信頼係数0.95の信頼区間は, X−t0.025(9−1)
√
S2
n <µ < X+t0.025(9−1)
√
S2 n
80−2.306
√
4
9 <µ <80 + 2.306
√
4 9
78.46<µ <81.54.
母分散σ2 の信頼係数0.95の信頼区間は, S2× n−1
χ2α 2
(n−1)<σ2 < S2× n−1 χ2
1−α 2
(n−1) 4· 8
17.53 <σ2 <4· 8 2.180 1.825<σ2 <14.68
統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
ここまで来たよ
3 母分散の区間推定と検定・カイ二乗分布
4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
統計的仮説検定の有意水準と検定力 Excelで検定
統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
母分散のカイ二乗検定
(母平均値未知
)未知の正規分布N(µ, σ2) からの標本に基づき,母分散がσ02 かどうか判定 したい!(σ20でないと言いたい)
対立仮説 H1 母分散σ ̸=σ0.
帰無仮説(背理法の仮定)H0 母分散 σ =σ0.
サイズnの標本の不偏標本分散をS2 とすると,帰無仮説のもとで,検定 統計量 Y = (n−1)× Sσ22
0
は,自由度 n−1のカイ二乗分布にしたがう.
y0 =χ2
1−α 2
(n−1), y1 =χ2α 2
(n−1)
統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
極端でない確率 1−α= 0.95 などのケースを考えると, P
( χ21−α
2
(n−1)<(n−1)×S2 σ20 < χ2α
2
(n−1) )
= 1−α.
逆に,S2 が上を満たさないとき,すなわち,S2 の棄却域
S2< σ02× χ2
1−α 2
(n−1)
n−1 ,またはσ20× χ2α
2
(n−1) n−1 < S2 に含まれるとき,帰無仮説を棄却する.
統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
L14-Q1
TA Prob and Sol:母分散の検定
あるファーストフードチェーンのポテトフライSの重さは,母分散 σ20 = 4g2の分布であることが定められているという.
トレーニング中のアルバイトの人に,ポテトフライSサイズを9個作って もらったところ,重さは下のようだった(単位はg).
76,76,76,76,80,84,84,84,84.
このアルバイトの作るポテトフライSの重さの母分散σ2 は,σ20 と異な るか? アルバイトのほうの重さが正規分布にしたがうと仮定し,有意水準 α= 0.05 で,母分散のカイ二乗検定で判定しよう.
略解
1 有意水準 α= 0.05で,
2 母分散のカイ二乗検定を行う.
統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
3 帰無仮説を,「アルバイトの…重さの正規分布の母分散σ2 は, σ02 = 4 に等しい」とする
4 サイズnの標本の不偏標本分散を S2 とすると,量 χ2 = (n−1)×σs22
0
は,自由度n−1 のカイ二乗分布に従う. この量 を検定統計量として用いる.
5 この標本に対して χ2= (n−1)×σs22
0 = (9−1)·164 = 32.
6 カイ二乗分布表より,この値は,棄却域χ2< χ2
1−α 2
(n−1) = 2.180, χ2 > χ2α
2
(n−1) = 17.53 に含まれるので帰無仮説を棄却する. 母分 散は有意にσ20 = 4 と異なると結論する.
棄却域に含まれなかったときの書き方は,「棄却域に含まれないので帰無 仮説は棄却できない. 母分散とσ20が異なるとは結論できない(母分散と σ20 との差は有意でない).」
最後のステップでは,p値を使った別解法「Excelでp値を求めると, p= 1.9×10−4< αなので,帰無仮説を棄却する」がある.
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
ここまで来たよ
3 母分散の区間推定と検定・カイ二乗分布
4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
統計的仮説検定の有意水準と検定力 Excelで検定
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
有意水準と検出力
統計的検定
あるくじ付きお菓子は,工場で,q0 = 0.03 の確率で独立に当たりを混ぜ ることになっている.
工場の当たりくじ混ぜ込みマシンが異常でないか調べたい.
対立仮説 H1 実際の当たり確率q ̸=q0
帰無仮説 H0 実際の当たり確率q =q0
提案する検定: 100個からなる標本のうちの当たりくじの個数Xを 検定統計量とする. 当たりがX = 0,5,6, . . . ,100個という極端な値 であるときには帰無仮説を棄却する「マイ検定」を使ってみよう.
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
L14-Q2
2項検定
実際の当たり確率が q0= 0.03 であるときに,提案した検定で,帰無仮説 を間違えて棄却してしまう確率 α を求めよう.
このような誤りを
第 1 種の過誤
,誤りの起こる確率α を 検定 の
有意水準 significance level
という. α は小さい方がいい.
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
L14-Q3
2項検定
実際の当たり確率が q(̸=q0) であるときに,提案した検定で,帰無仮説を 棄却できない確率 β を求めよう.
こ の よ う な 誤 り を
第 2 種の過誤
, 誤 り の 起 こ ら な い 確 率 1 − β を 検 定 の
検出力 power
という. β は小さい方がいい.
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
過誤
,有意水準
,検出力
真実H0 は真 H0 は偽
判断 H0 を棄却しない 正しい判断 第2 種の過誤(確 率βで起きる)
H0 を棄却 第1 種の過誤 (確
率α で起きる)
正しい判断
α: 有意水準
1−α: 区間推定でいう
信頼係数
に対応 1−β: 検出力 or 検定力
ふつうは,β を小さくしようとすると α が大きくなってしまう.
ふつうは,α を指定の値に固定して,β をなるべく小さくするという作戦.
統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力
p
値
(t分布の例
)標本のp値(p-value)
帰無仮説のもとで,検定統計量が この標本よりも
極端な値をとる
確率.
p値<有意水準α のときに 帰無 仮説を棄却する.
帰無仮説棄却
帰無仮説採用
統計的仮説検定とExcelによるt検定 Excelで検定
ここまで来たよ
3 母分散の区間推定と検定・カイ二乗分布
4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定
統計的仮説検定の有意水準と検定力 Excelで検定
統計的仮説検定とExcelによるt検定 Excelで検定
Excel 2013
で標本ナントカ
標本にまつわるExcelの関数 標本平均値average 不偏標本分散 var 不偏標本標準偏差 stdev
注: 有限母集団の量は母平均値average,母分散 varp,母標準偏差 stdevp. 要区別
統計的仮説検定とExcelによるt検定 Excelで検定
Excel 2013
での
t分布
n: 自由度
t分布にまつわるExcelの関数
p
2 =t.dist.rt(t, n) t=t.inv(p2, n) ご注意
Excelのバージョンで異なる
Excelはバグがあるから信じない,という人も. → R確率統計☆演習II,計算科学II
統計的仮説検定とExcelによるt検定 Excelで検定
Excelを用いたt検定の手順
標本平均値と不偏標本分散を計算 T 統計量を計算
T に対するp値を計算
p < αなら帰無仮説棄却
実は分析ツールの中にもt検定があるが,それは「2標本t検定」確率統計☆演 習II
統計的仮説検定とExcelによるt検定 Excelで検定
Excel 2013
でのカイ二乗分布
n: 自由度
カイ二乗t分布にまつわるExcelの関数
p
2 =chisq.dist.rt(y1, n) 1−p2 =chisq.dist.rt(y0, n) y1 =chisq.inv(p2, n)
y0 =chisq.inv(1−p2, n)
統計的仮説検定とExcelによるt検定 Excelで検定
連絡
t検定と同じのりでカイ二乗検定のレポート. 2016-01-18月以降にダ ウンロード印刷 → 2016-01-29金3までのMathラウンジに提出. 予習問題,非参照Quizはきょうが最後です.
2016-01-29金2ファイナルトライアル. 外部記憶ペーパーが使用可
能. 出題計画は2016-01-22金に確定.
配布資料は1-503向かいの引出,http://hig3.netで再配布. Quizの略解は授業終了後に http://hig3.netで配布. オフィスアワー月4木6(1-502)
manaba / 出席カード
https://manaba.
ryukoku.ac.jp