基礎統計
6.4.2 標本平均の差の標本分布
•母平均の差
•標本平均の差をみれば良い
•ただし,母分散に依存するため場合分けをする
① 分散が既知 ② 分散が未知であるが等しい ③ 分散が未知であり等しいとは限らない①母分散が既知のとき
• が既知
②母分散が未知であり,等しいとき
•
分散が未知であるが,等しいということは分かってい
るとき
標準化変量
③母分散が未知であり等しいとは限らないとき
正規母集団の母平均,母分散の区間推定(1)
•母平均の信頼区間
となる を求めたい. • 分散が既知の場合 母平均μの信頼係数1-αの信頼区間 は標準正規分布 の上側100α/2パーセント点 標準化 (信頼上限,信頼下限)正規母集団の母平均,母分散の区間推定(2)
•母平均の信頼区間
• 分散が未知の場合 は自由度n-1のt分布 の上側100α/2パーセント点 母平均μの信頼係数1-αの信頼区間正規母集団の母平均,母分散の区間推定(3)
•母分散の信頼区間
は自由度n-1のカイ二乗分布
の上側100(1-α/2), 100α/2パーセント点
二つの正規母集団の母平均の差,
母分散の比の区間推定(1)
•母平均の差の信頼区間
二つの正規母集団 母平均の差 • 二つの母分散が等しい場合 • 二つの母分散が等しいと仮定できない場合 未知 に最も近い整数 は二つの正規母集団の母平均の差,
母分散の比の区間推定(2)
•母分散の比の信頼区間
•例:母平均の差の信頼区間
• 母分散の比:信頼区間に1を含むかどうか( ) • 1を含む場合 • 1を含まない • 数値例: • 実際は次章で紹介する母分散の比の検定をおこなう二項,ポアソン母集団の各母数の信頼区間
•
中心極限定理より,標準正規分布で近似することで
求める
• 二項分布の場合
点推定の考え方とその手順
推定量と推定値
•推定量
•母集団の母数を推定するために標本から求められ
る統計量
•推定値
•標本として具体的にn個の観測値が与えられたとき,
これを代入して計算される値が推定値である.
点推定の手順(1)
•
モーメント法
モーメント(再録)
• Xの(原点のまわりの)r次のモーメント(積率)
• Xの期待値(平均)のまわりのr次のモーメント
点推定の手順(1)
•最尤法
• 最尤原理:「現実の標本は確率最大のものが実現した」 • 例:コイン投げ • 表が出る確率 p (裏が出る確率 1-p) • 表が出たら1、裏が出たら0とする • 5回投げたところ {1,1,0,1,0} という結果が出た • 表が出る確率 p をどのように考えたらよいか? • コインは公正にできている。 p=0.5 • コインは歪んでいるかも知れない。 表が出た割合で評価 p= 3/5= 0.6 • どのような確率 p であっても {1,1,0,0,1} という結果が出る 可能性があるので、{1,1,0,0,1}という結果が出現する可能性 が最も高いものを p とする。 => 最尤法尤度と対数尤度
• {1,1,0,0,1}が出る可能性 p3(1 p)2 2 3(1 ) ) (p p p L 尤度(尤度関数))
1
log(
2
log
3
)
(
log
L
p
p
p
対数尤度 p p dp p L d 1 2 3 ) ( log 6 . 0 ˆ p 一般的には…
n i i X f L 1 ) , ( ) (
n i i X f L 1 ) , ( log ) ( log
尤度 対数尤度 と呼ぶ を最尤推定量 を最大にする もしくは ) log ( ) ˆ ( L L点推定の基準(1)
• 不偏性 • 推定量の期待値が,真の母数の値となること • は不偏推定量と呼ばれる • 例: は不偏推定量 は不偏推定量ではない点推定の基準(2)
•一致性
•標本の大きさ
n が大きくなるに従い,真の母数の値
に近づく性質
•(確率収束)
•例:
一致推定量点推定の基準(3)
•漸近正規性
• 標本分布の漸近分布が正規分布である性質 • この性質をみたす推定量を漸近正規推定量と呼ぶ • 例: •有効性
• 不偏推定量の中でも,分散が小さい方を有効とする • いかなる不偏推定量よりも分散が小さい推定量が存在すれば,それは 有効推定量または最小分散不偏推定量と呼ばれる • 漸近的有効性:漸近分布が正規分布となる推定量のうち,漸近分散が 最小となる性質点推定の例
• 母平均と母分散の推定 • モーメント法と最尤法の結果が同じ • 正規分布 • 二項分布 • ポアソン分布 • モーメント法と最尤法の結果が異なる • 一様分布 最尤法 モーメント法正規分布に関する推定(最尤法)
• 正規分布 の尤度関数
• について解く
不偏で はない
ノンパラメトリックの場合
• 最尤法は使えない. 母集団分布の形がわからないため. • モーメント法による推定 不偏で はない統計的仮説検定
• 仮説検定 • 事例(問題設定) • 白熱電球の寿命の平均が1700時間であるという。 • 新型の電球が開発され光度が改良されたが、寿命が変 化したか否かについては不明であるとする。 • 電球の寿命は新型も従来のものも正規分布をなし、その 標準偏差はσ=180(時間)であることがわかっている。 • 仮説検定:新型電球の寿命の平均をμ時間とおくと、 (新型電球の寿命に変化はない) (新型電球の寿命に変化がある) 帰無仮説 対立仮説いずれが正しいか? 仮説検定する。
帰無仮説と対立仮説
• 帰無仮説 考察の基準となる仮説 • 対立仮説 が棄却されたときに採択される仮説 • 両者を合わせて仮説検定あるいは検定という •結論としては、2つの一方を選択する
•を棄却する(
reject
)
•を採択する(受容する) (
accept )
• 標本の値に基づいてこの選択を行うことを統計的仮説検定と いう。単に検定という。検定の手順や方法を検定方式と呼ぶ。検定方式
• 平均値の検定 • 標本から得られた平均値1835時間と、1700時間との差に意味がある かどうか。 • 差に意味があることを、差が有意であるという • 意味のある差のことを有意差という • どれほど差があれば有意差とみなせるか? を棄却する を採択する 検定統計量 臨界値第
1種の誤り、第2種の誤り、有意水準
• 統計的仮説検定では、誤りを犯す確率ができるだけ小さくなる ようにcを選択する • 2種類の誤り • 第1種の誤り:帰無仮説 が正しいときに、帰無仮説 を棄却する誤り • 第2種の誤り:対立仮説 が正しいときに( が誤ってい るときに)、帰無仮説 を採択する誤り。 • 統計的仮説検定では第1種の誤りを重視する • 有意水準:第1種の誤りの確率として許容できる値αを事前 に定める 第1種の誤りの確率=P({ を棄却する}) =P(|T|>c) 例:α=0.05 のとき c=1.96母平均の検定
• は正規母集団 からの大きさ の無作為標本とする。このとき、 とおけば、 は検定問題に対する有意水準αの検定である。 を棄却する を採択する片側検定と両側検定
• 改良によって寿命が長くなることはあっても短くなることはない ことが事前にわかっているときは? • 対立仮説 を とすればよい。 • 片側仮説 を棄却する を採択する 右片側検定 左片側検定片側検定(右片側検定)
•は正規母集団
からの
大きさ
の無作為標本とする。このとき、
とおけば、
は、検定問題
に
対する有意水準
αの検定である.
を棄却する を採択する検出力
• 第一種の誤り( ) • 帰無仮説が真であるにもかかわらず, 統計量の値が棄却域に入ってしまった ために,帰無仮説を棄却してしまう誤り. • 第二種の誤り( ) • 帰無仮説が偽であるにもかかわらず, 統計量の値が棄却域に入らなかったた めに,帰無仮説を棄却しない誤り. • 検出力( ) • 帰無仮説が真でないとき,その通りに, これを棄却する確率 検定方法の良さの評価基準 検出力が大きいことが望ましい8.2 母平均の検定
•8.2.1 両側t検定
•は正規母集団
から
の大きさ
の無作為標本とする.
•母分散は
未知
とする.
•検定問題
•検定統計量
自由度 n-1 のt分布に従う母平均のt検定
•は正規母集団
からの
大きさ
の無作為標本とする.このとき,
は検定問題
に対す
る有意水準
αの検定である.ここに
は
の上側
100α/2%点である。
を棄却する を採択する事例:電球の寿命
• 母分散が未知の場合 • 検定問題 • 有意水準 • 標本から得られる情報 • 棄却域 • 結論:帰無仮説 は棄却される.母平均の検定①(両側検定・母分散既知)
• 帰無仮説と対立仮説 • 検定統計量 • 有意水準 • 棄却域 • 例:牛乳の乳脂肪分 乳脂肪分が3%の牛乳を製造販 売する会社があったとする.会社 の主張は正しいといえるか.有意 水準5%で検定せよ. 標本数 標本平均 分散(既知) 検定統計量 棄却域 の密度関数 帰無仮説は棄却される.主張は正しくない. 有意水準母平均の検定②(両側検定・母分散未知)
• 帰無仮説と対立仮説 • 検定統計量 • 有意水準 • 棄却域 • 例:牛乳の乳脂肪分 先ほどと同じ問題. 分散が未知 標本数 標本平均 標本分散 の密度関数 検定統計量 棄却域 有意水準 帰無仮説は有意水準5%で棄却できない. 主張が正しくないとはいえない.8.2.2 片側t検定
•
片側検定問題
•
右片側検定
母平均の片側t検定
•は正規母集団
からの大
きさ
の無作為標本とする.このとき,
は検定問題
に対す
る有意水準
αの検定である.ここに
は
の上側
100α/2%点である。
を棄却する を採択する母平均の検定③(片側検定・母分散既知)
• 帰無仮説と対立仮説 • 検定統計量 • 有意水準 • 棄却域 • 例:改良の確認の検定 分散既知とみなす (右片側検定) の密度関数 検定統計量 棄却域 有意水準 標本数 標本平均 分散(既知) 有意水準5%で帰無仮説は棄却される. この講義に効果があったと認められる.母平均の検定④(片側検定・母分散未知)
• 帰無仮説と対立仮説 • 検定統計量 • 有意水準 • 棄却域 • 例:改良の確認の検定 標本数 標本平均 標本分散 (右片側検定) の密度関数 検定統計量 棄却域 有意水準 有意水準5%で帰無仮説は棄却される. この講義に効果があったと認められる.8.3 母分散の検定
•母分散の片側検定
•は正規母集団
から
の大きさ
の無作為標本とする.
•検定問題
•検定統計量
自由度n-1のカイ2乗分布に従う母分散の検定
•
は正規母集団
か
らの大きさ
の無作為標本とする.このとき,
は、検定問題
に対
する有意水準
αの検定である.
ここに
は自由度
n-1のカイ2乗分布
の上側
100α%点である.
を棄却する を採択する母分散に対する仮説検定
• 両側検定 • 対立仮説 • 棄却域 • 片側検定 • 右片側検定 • 対立仮説 • 棄却域 • 左片側検定 • 対立仮説 • 棄却域 検定統計量 の密度関数 おさらい母平均の差の検定
• 二つのグループで結果に差があるかどうか • 帰無仮説と対立仮説 • 分散が等しい場合 • 分散が等しくない場合 両側 右片側 左片側 ウェルチの検定母分散の比の検定
•母分散が等しい(母分散の比=1)かどうかの検定
• 母平均の差の検定では,母分散の比の検定の結果によっ て方式を選ぶことになる. • 手順 • 帰無仮説と対立仮説 • 検定統計量 • 有意水準 • 棄却域 状況によって は片側検定も ありうる F分布の密度関数検定
• 観測度数をもとにして行われる検定 • 検定統計量はカイ二乗分布に従う • 適合度検定 • 仮定された理論上の確率分布に対して,標本から求めら れた度数が適合するか否かを検証する方法 • 独立性の検定 • 2つの異なる属性を同時に測定し,集計結果を分割表に したとき,2つの属性が独立かどうかを検証する方法適合度検定
• 観測度数と理論度数の差が小さい⇒ 適合している 計 カテゴリー 観測度数 理論確率 理論度数 数字 1 2 3 4 5 6 計 回数 10 7 8 11 6 8 50 サイコロ投げ50回 サイコロは正しく作られているか?独立性の検定
計
計