第 10 回
検定①
本日 容
• 検定
– 帰無仮説 対立仮説
– 検定 基本
– 棄却域
– 両側検定 片側検定
– P -値
– 過誤
• 第 1 種 過誤
• 第 2 種 過誤
前回 復習
&ア' 石川:
9 ≈ . 、東京: ≈ .
&イ' 標準誤差:
標本分散
�−
� − �
− =
. × .
− ≈ .
. × .
− ≈ .
前回 復習
& '& ' 信頼区間: 均 前後 標準誤
差×標準正規分布表 求 数
区間
• 例えば、石川 95 %信頼区間 場合、
– 標準正規分布表 0.975 1.96
– 標準誤差 0.02
– 、 均& 0.13 ' 前後 . × . ≈ .
区間 0.09 、 0.17
前回 復習
東京
0.06 標準誤差&0.01' 1.96倍→約0.02
0.04 0.08
石川
0.13 標準誤差&0.02' 1.96倍→約0.04
0.09 0.17
東京 均 95% 確 率 範
石川 均 95% 確率 範
、東京 均 95% 確率 0.08以 石川 均 95% 確率 0.09以
• 中間アンケ 満足度
– 満足; 4 、 あ あ満足; 3 、 不満; 2 、不満
; 1 、
– 均: 3.29 、分散: 0.42 、観測数: 49
– 、 均 90 %信頼区間
標準誤差 :
. ≈ .
– 90% 信頼区間: . − . × . , . +
. × . →3.14 ~ 3.44
検定
• 推定 、未知 数 得
• 得 数 推定値 妥当性 検討 必要 あ
– 推定 、 集団 一部 取 出 標本 利用 行う
– 大数 法則 中心極限定理 、標本 十分 大 ば、
理論的 数 正 推定
– 、標本 取 方 、実際 得 推定 結果
変わ 、真 数 可能性 あ
– 例'硬貨投 い 、一般的 表 裏 出 確率 半分
• 、実際 硬貨 投 場合、 う 半分 回数表 出 限 い
– そ 程度大 い 、許容 検討
検定
帰無仮説 対立仮説
• 検定 行う前 、仮説 立 必要 あ
– 調べ い数値 & '(null hypothesis) いう
• 例'硬貨投 、表 出 確率& 均' 0.5 あ
• 例'男女比率& 均' 0.6 あ
– 帰無仮説 、 � いう記号 用い 、次 う 表さ
� :調べ い 数 = 数値
• 例'硬貨投 、 表 出 確率� 0.5 あ いう帰無仮説 、
� : � = .
– 帰無仮説 正 い、 いう仮説 & '(alternative hypothesis) いう
• 例'硬貨投 表 出 確率 0.5 い
• 例'男女比率 0.6 い
– 対立仮説 、 �� いう記号 用い 、帰無仮説 否定 表さ
��:調べ い 数 ≠ 数値
• 例'硬貨投 、帰無仮説 � : � = . 、対立仮説
��: � ≠ .
帰無仮説 対立仮説
• 検定 、帰無仮説 対立仮説 正 い
&確率 高い' 確認 作業
– さ 言えば、 帰無仮説 正 い 確認
作業
– 、帰無仮説 正 い 確認
場合、そ 検定 意味 有 いう
– 帰無仮説 正 い&帰無仮説 正 い可能性
一定以 い' いう結論 得 場合、 帰無仮
説 棄却さ 検定 有意 あ いう
– 帰無仮説 正 い可能性 一定以 あ 場合 、
帰無仮説 棄却さ い 検定 有意 い
いう
例
• 子供 帰宅時間 い 考え
– 帰宅時刻 、授業 何時間目 あ 、習い い 、等 異
– ぴ 同 時間 帰 &例えば、午後7時 う 帰
' 稀
– 、 い い同 う 時間&午後6時30分 7時30分、 ' 考え
– 最近、子供 帰宅時刻 早い 、 塾 さ い い ? い 疑惑 生
– そ 、仮説検定
– 塾 行 場合、帰 標準的 時刻 午後7時 – あ 程度 期間 取 、 均帰宅時刻 取
– そ 均帰宅時刻 対 、
� : 均帰宅時刻 = 時
��: 均帰宅時刻 ≠ 時
検定 基本
• 検定 基本 、&帰無'仮説 値 得
値 差 0 否
– 仮説 値 値 差 0 あ ば、仮説 正
い 考え
– 仮説 値 値 差 0 あ ば、仮説
誤 い 可能性 あ &少 、 一致
い'
• 例えば、標本 均 � 、仮説 均
時 、
� − =
成 立 い う 検証
検定 基本
• 計算 、 う 0 少 い
– 例'硬貨投 、投 回数 う 半分 表
少 い
– 、通常 差 あ
• 注目 、そ 差 大 い 小さい
– 差 小さ ば、誤差 範 考え 無視
– 差 大 ば、誤差 範 考え 何 原因
仮説 間違 い 考え う 自然
• 何 基準 大 い 小さい 考え ?
– 分析対象 、引 算 場合 絶対値 異
• そ 、& ' 利用
検定 基本
• 中心極限定理 、標本 十分 大 ば、標本 均 分布
正規分布
– 均 分布 正規分布 、 均 分布 正規分布 – 標準誤差&��' 用い 基準化 ば、標準正規分布
� = � −��
�� = 標本分散 観測数
– � 0 近い う 判断 ば い
– そ 数 &偶然'起 確率 、標準正規分布表 見 ば計算 – 、標準正規分布表 使う場合 � 、t-分布表 使う場合 � い
う記号 用い 多い&前回講義参照'
イ
• 差 絶対的 大 さ 、元 数 大 さ
変わ
– 例'硬貨投 ば、差 一番大 1
– 例'日経 均 13000 、 い 分析 場合 、
1000 単 起 不思議 い
• 標準誤差 大 さ 、 数 大 さ
変わ
• 、 標準誤差何個分 いう単 & � ' 用い
、元 数 大 さ 左右さ 離 い
距離 測
– 標準誤差 割 → 基準化さ 、元 数 大 さ
均 0 、分散 1 正規分布 い
イ
• 帰宅時間 考え
– 性格 子供 、寄 道 い 家 帰
場合 、帰宅時刻 狭い範 入
– 性格 子供 、面白い あ 寄 道
う 場合 、帰宅時刻 ば あ 、範 広い
– 場合、 子供 帰宅時刻 標誤差差 小さ 、
性格 子供 帰宅時刻 標準誤差 大 い いう
– 仮 、同 20 分帰宅時刻 、 子供
割 あ 、 子供 何 あ い
不安
– 、普段 帰宅時刻 ば &標準誤差' 比べ 、 20
分 いう数 大 い 小さい 考え い 差
あ
棄却域
• 大 さ 基準化 ば、標準正規分布表 、 そ
大 い あ 確率 知
– 例' � = 場合、標準正規分布表 見 約0.84→1 右 確率 約0.16→ イ 方向 同 大 さあ 、1 大 い 確率 0.32→ 、1 大 い 約32% 確率 起 – 例' � = 場合、標準正規分布表 約0.98→2 右 確
率 約0.02→ イ 方向 同 大 さあ 、2 大 い 確率 0.02→ 、2 大 い 約4% 確率 起
• 逆 言う 、あ 基準 確率&十分 小さい 考え 確
率' 決 ば、標準正規分布表 基準 � 値 知
• そ � 大 い ば、確率的 起 い 起
い 、仮説 誤 い 判断さ → そ 範
& 'いう&仮説
却さ
棄領域'
両側検定 片側検定
• 通常、仮説 正負 い &大 、小さ
' わ い
– 例'硬貨 歪 い 、表 出 確率 0.5 い 、表 出
い 裏 出 い わ い
– そ う 場合 、棄却域 正負両側 & ' 行う
• 場合 、仮説 い 方向 特定 場合 あ
– 例'塾 さ い 場合、通常 帰宅時刻 早 7時早い う 検証 ば い
– そ う 場合 、棄却域 い 方向 & ' 行う
• 両者 違い 、対立仮説 設定 仕方 違い
両側検定 対立仮説 ⇒ ��:調べ い 数 ≠ 数値 片側検定 対立仮説 ⇒ ��:調べ い 数 > < 数値
P- 値
• 検定 手順 、
1. 帰無仮説 設定
2. 対立仮説 設定& 設定 、両側検定 片側検定 決
'
3. 起 い 考え 確率 大 さ&有意水準' 決 4. 標準正規分布表 、そ 確率 満 領域&棄却域' 探
5. � 計算 、棄却域 入 い う 判定
• 入 い →帰無仮説 棄却さ
• 入 い い→帰無仮説 棄却さ い
• 、標準正規分布表 、 � 値 計算 ば、そ 起
確率 逆算
• � 値 計算 、そ 外側 入 確率
P-値いう
• 手順 3 確率 決 、 � 計算 、標準正規分
布表 P- 値 計算 、有意水準 議論 場合 多い
検定 手順
中心極限定理 、帰無仮説 均 標準正規分布 従う 対立仮説 決 &両側検定 片側検定 決 '
有意水準 決
帰無仮説 数値 決
→
有意水準 棄却域 決
� 計算 、棄却域
入 う 調べ
例
• 中間アンケ 結果 い
• 帰無仮説: 均;3.3
– 対立仮説: 均:3.3&片側検定'
– 先 数 使 計算 、
� = � −�� = . − .. = .
– 片側検定 有意水準10% 標準正規分布表 1.28→棄却 い
– 片側検定 0.11 P-値 表 0.5438→約46% 確率 均3.3 あ わ 3.29以 いう結果 生 う
• 帰無仮説: 均;3
– 対立仮説: 均≠3&両側検定' – 同様 計算
� = . −. = .
– 両側検定 有意水準1% 標準正規分布表 2.57→棄却
う!
• H ゼ R 西高校出身者 割合 い 分析
• 過去 2 間 H ゼ 在籍 学生 76 人、う R 西高校
出身者 9 人 あ 、 R 西高校出身者 割合
≈ .
• 標準誤差 約 0.04 あ
• – R 西高校出身者 割合 10 % あ いう帰無仮説 検定
さい
– R 西高校出身者 割合 5% あ いう帰無仮説 検定
さい
う!
• R西高校出身者 割合 10% あ
– 対立仮説 割合≠10% – 検定統計量 計算 、
� = . − .
. ≈ .
– 正規分布表 、0.5 数値 0.64→P-値 0.72→10%水準 棄却 い→有意
差 い
– 、本当 10% 、何 12% 十分 あ う
• R西高校出身者 割合 5% あ
– 対立仮説 割合≠5%
– 検定統計量 計算 、
� = . − .. ≈ .
– 正規分布表 、1.75 数値 0.96→P-値 0.08→10%水準 棄却 →有意 差 あ
– 、本当 5% 、何 12% 可能性 10%以 、
5% 大 い 考え 自然
う いい話
• 以 結果 、 H ゼ R 西高校出身者
割合 、 5% 以 あ 考え
• 90% 信頼区間 計算 、約 5.9% ~約 18.7%
• 星稜大学 経済学部 学生数 学 約 420 人 、
90% 確率 25 人以 学生 入 い
• 実際 、 10 人~ 15 人程度 あ
• 発生 い 理 、所属ゼ 学生 ラ
ン い 考え
– 、所属 い R 西高校出身者 示 合わ 所
属 い う 見え い 、 う バイア
い わ い
過誤
• 検定 あ 確率的 考え 仮説 正 い 否
判断 い
– 仮説 値 値 比べ、 偶然 そ う 差 生
確率 計算 、判断 い
– 、確率 0 い限 起 あ 、
判断 間違え 可能性 常 在
– 例'サ イプライ イク ア
• 判断 誤 、 2 イプ 分類
– 仮説 正 い わ 、正 い 判断 棄却
う誤 &第一種 過誤'
– 仮説 正 い わ 、正 い 判断 棄却
う誤 &第 種 過誤'
過誤
仮説 本当 正誤
正 い 誤
検定 結果
正 い ○ 第 種 過誤
誤 第一種 過誤 ○
第一種 過誤
• 棄却域 面積 、第一種 過誤 大 さ
– 例えば、有意水準 5 % 検定 結果、仮説
棄却さ
– 判断 、 5 % いう い確率 起 い
→ そ 珍 い 起 考え 、仮
説 間違 い 考え 方 自然 いう根拠
基
– 逆 言う 、 5 % 確率 起 、 5 % 確率
判断 間違え い
第 種 過誤
• 帰無仮説 誤 い わ 、正
い 判断 う 第 種 過誤
– 第 種 過誤 確率 、真 値 分布 、仮説
分布 重 、棄却域 真 値 分布
近い部分
真 分布 仮説 分布
有意 水準 側 あ ば、
仮説 正 い 判断
判断 確率
大 さ