• 検索結果がありません。

統計的仮説検定と Excel による t 検定

N/A
N/A
Protected

Academic year: 2021

シェア "統計的仮説検定と Excel による t 検定"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的仮説検定と

Excel

による

t

検定

樋口さぶろお

龍谷大学理工学部数理情報学科

確率統計☆演習I L14(2016-01-15 Fri)

最終更新: Time-stamp: ”2016-01-15 Fri 14:03 JST hig”

今日の目標

母分散のカイ二乗検定ができる

検定の第1種の過誤,第2種の過誤,信頼係数, 検出力, p,棄却域が説明できる

Excelp値を求めてカイ二乗検定, t検定で

(2)

母分散の区間推定と検定・カイ二乗分布

L13-Q1

Quiz解答:母分散の区間推定 標本サイズは n= 9 である.

母分散σ2 の信頼係数0.95の信頼区間は, S2× n−1

χ2α

2

(n1)2 < S2× n−1 χ2

1α 2

(n1) 72· 8

17.53 2 <72· 8 2.180 32.852 <264.2 L13-Q2

Quiz解答:母分散の区間推定 標本サイズは n= 9 である.

標本平均値は,X= 19[78 +· · ·+ 82] = 80g.

不偏標本分散は,S2= 911[(7880)2+· · ·+ (8280)2] = 4g2. よって 母平均値 は 母分散 22 と推定する

(3)

母分散の区間推定と検定・カイ二乗分布

母平均値µの信頼係数0.95の信頼区間は, X−t0.025(91)

S2

n <µ < X+t0.025(91)

S2 n

802.306

4

9 <µ <80 + 2.306

4 9

78.46<µ <81.54.

母分散σ2 の信頼係数0.95の信頼区間は, S2× n−1

χ2α 2

(n1)2 < S2× n−1 χ2

1α 2

(n1) 4· 8

17.53 2 <4· 8 2.180 1.8252 <14.68

(4)

統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

ここまで来たよ

3 母分散の区間推定と検定・カイ二乗分布

4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

統計的仮説検定の有意水準と検定力 Excelで検定

(5)

統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

母分散のカイ二乗検定

(

母平均値未知

)

未知の正規分布N(µ, σ2) からの標本に基づき,母分散がσ02 かどうか判定 したい!(σ20でないと言いたい)

対立仮説 H1 母分散σ ̸=σ0.

帰無仮説(背理法の仮定)H0 母分散 σ =σ0.

サイズnの標本の不偏標本分散をS2 とすると,帰無仮説のもとで,検定 統計量 Y = (n1)× Sσ22

0

は,自由度 n−1のカイ二乗分布にしたがう.

y0 =χ2

1α 2

(n1), y1 =χ2α 2

(n1)

(6)

統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

極端でない確率 1−α= 0.95 などのケースを考えると, P

( χ21α

2

(n1)<(n1)×S2 σ20 < χ2α

2

(n1) )

= 1−α.

逆に,S2 が上を満たさないとき,すなわち,S2 の棄却域

S2< σ02× χ2

1α 2

(n1)

n−1 ,またはσ20× χ2α

2

(n1) n−1 < S2 に含まれるとき,帰無仮説を棄却する.

(7)

統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

L14-Q1

TA Prob and Sol:母分散の検定

あるファーストフードチェーンのポテトフライSの重さは,母分散 σ20 = 4g2の分布であることが定められているという.

トレーニング中のアルバイトの人に,ポテトフライSサイズを9個作って もらったところ,重さは下のようだった(単位はg).

76,76,76,76,80,84,84,84,84.

このアルバイトの作るポテトフライSの重さの母分散σ2 は,σ20 と異な るか? アルバイトのほうの重さが正規分布にしたがうと仮定し,有意水準 α= 0.05 ,母分散のカイ二乗検定で判定しよう.

略解

1 有意水準 α= 0.05,

2 母分散のカイ二乗検定を行う.

(8)

統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

3 帰無仮説を,「アルバイトの…重さの正規分布の母分散σ2 , σ02 = 4 に等しい」とする

4 サイズnの標本の不偏標本分散を S2 とすると,量 χ2 = (n1)×σs22

0

は,自由度n−1 のカイ二乗分布に従う. この量 を検定統計量として用いる.

5 この標本に対して χ2= (n1)×σs22

0 = (91)·164 = 32.

6 カイ二乗分布表より,この値は,棄却域χ2< χ2

1α 2

(n1) = 2.180, χ2 > χ2α

2

(n1) = 17.53 に含まれるので帰無仮説を棄却する. 母分 散は有意にσ20 = 4 と異なると結論する.

棄却域に含まれなかったときの書き方は,「棄却域に含まれないので帰無 仮説は棄却できない. 母分散とσ20が異なるとは結論できない(母分散と σ20 との差は有意でない).」

最後のステップでは,p値を使った別解法「Excelp値を求めると, p= 1.9×104< αなので,帰無仮説を棄却する」がある.

(9)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

ここまで来たよ

3 母分散の区間推定と検定・カイ二乗分布

4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

統計的仮説検定の有意水準と検定力 Excelで検定

(10)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

有意水準と検出力

統計的検定

あるくじ付きお菓子は,工場で,q0 = 0.03 の確率で独立に当たりを混ぜ ることになっている.

工場の当たりくじ混ぜ込みマシンが異常でないか調べたい.

対立仮説 H1 実際の当たり確率q ̸=q0

帰無仮説 H0 実際の当たり確率q =q0

提案する検定: 100個からなる標本のうちの当たりくじの個数Xを 検定統計量とする. 当たりがX = 0,5,6, . . . ,100個という極端な値 であるときには帰無仮説を棄却する「マイ検定」を使ってみよう.

(11)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

L14-Q2

2項検定

実際の当たり確率が q0= 0.03 であるときに,提案した検定で,帰無仮説 を間違えて棄却してしまう確率 α を求めよう.

このような誤りを

第 1 種の過誤

,誤りの起こる確率α を 検定

有意水準 significance level

という. α は小さい方がいい.

(12)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

L14-Q3

2項検定

実際の当たり確率が q(̸=q0) であるときに,提案した検定で,帰無仮説を 棄却できない確率 β を求めよう.

こ の よ う な 誤 り を

第 2 種の過誤

, 誤 り の 起 こ ら な い 確 率 1 β を 検 定 の

検出力 power

という. β は小さい方がいい.

(13)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

過誤

,

有意水準

,

検出力

真実

H0 は真 H0 は偽

判断 H0 を棄却しない 正しい判断 第2 種の過誤(βで起きる)

H0 を棄却 第1 種の過誤 (確

α で起きる)

正しい判断

α: 有意水準

1−α: 区間推定でいう

信頼係数

に対応 1−β: 検出力 or 検定力

ふつうは,β を小さくしようとすると α が大きくなってしまう.

ふつうは,α を指定の値に固定して,β をなるべく小さくするという作戦.

(14)

統計的仮説検定とExcelによるt検定 統計的仮説検定の有意水準と検定力

p

(t

分布の例

)

標本のp値(p-value)

帰無仮説のもとで,検定統計量が この標本よりも

極端な値をとる

確率.

p<有意水準α のときに 帰無 仮説を棄却する.

帰無仮説棄却

帰無仮説採用

(15)

統計的仮説検定とExcelによるt検定 Excelで検定

ここまで来たよ

3 母分散の区間推定と検定・カイ二乗分布

4 統計的仮説検定とExcelによるt検定 母分散のカイ二乗検定

統計的仮説検定の有意水準と検定力 Excelで検定

(16)

統計的仮説検定とExcelによるt検定 Excelで検定

Excel 2013

で標本ナントカ

標本にまつわるExcelの関数 標本平均値average 不偏標本分散 var 不偏標本標準偏差 stdev

注: 有限母集団の量は母平均値average,母分散 varp,母標準偏差 stdevp. 要区別

(17)

統計的仮説検定とExcelによるt検定 Excelで検定

Excel 2013

での

t

分布

n: 自由度

t分布にまつわるExcelの関数

p

2 =t.dist.rt(t, n) t=t.inv(p2, n) ご注意

Excelのバージョンで異なる

Excelはバグがあるから信じない,という人も. R確率統計☆演習II,計算科学II

(18)

統計的仮説検定とExcelによるt検定 Excelで検定

Excelを用いたt検定の手順

標本平均値と不偏標本分散を計算 T 統計量を計算

T に対するp値を計算

p < αなら帰無仮説棄却

実は分析ツールの中にもt検定があるが,それは「2標本t検定」確率統計☆演 II

(19)

統計的仮説検定とExcelによるt検定 Excelで検定

Excel 2013

でのカイ二乗分布

n: 自由度

カイ二乗t分布にまつわるExcelの関数

p

2 =chisq.dist.rt(y1, n) 1p2 =chisq.dist.rt(y0, n) y1 =chisq.inv(p2, n)

y0 =chisq.inv(1p2, n)

(20)

統計的仮説検定とExcelによるt検定 Excelで検定

連絡

t検定と同じのりでカイ二乗検定のレポート. 2016-01-18月以降にダ ウンロード印刷 2016-01-293までのMathラウンジに提出. 予習問題,非参照Quizはきょうが最後です.

2016-01-29金2ファイナルトライアル. 外部記憶ペーパーが使用可

能. 出題計画は2016-01-22金に確定.

配布資料は1-503向かいの引出,http://hig3.netで再配布. Quizの略解は授業終了後に http://hig3.netで配布. オフィスアワー月46(1-502)

manaba / 出席カード

https://manaba.

ryukoku.ac.jp

参照

関連したドキュメント

統計量 値1 試行回数 平均値 中央値 最頻値 標準偏差 分散 歪度 尖度 変動 係数 最小範囲 最大範囲 範囲 標準誤差.. 中央値 最頻値 標準偏 差 分散

(プチテスト範囲の再出題) データが与えられたときに, 母平均値, 母分散, 母標準.

離散型確率変数

例2 同じM寸の卵でありながら,スーパーSはスーパ ーKよりも軽い卵を売っていると考え,両店の 10 個の卵についてそれぞれ調査したところ,スーパ ーSの卵は平均

平均値 mean 中央値 median 最頻値 mode 最大値・最小値.. 分散~標準偏差 var/std 平均偏差

平均値  mean 中央値 median 最頻値 mode 最大値・最小値.. 分散ー標準偏差 var/std 平均偏差

平均値 mean 中央値 median 最頻値 mode 最大値・最小値.. 分散~標準偏差 var/std 平均偏差

平均値 mean 中央値 median 最頻値 mode 最大値・最小値.. 分散~標準偏差 var/std 平均偏差