.
...
統計学
I
および演習 第
9
回 標本 補助資料
菅原慎矢
June, 2016
母集団
調査対象集団の属性値全体(これは記述統計の時と同じ)
推測統計では、母集団は確率分布に従うものと考える
母集団の分布の性質を表す未知母数(パラメーター)の分析が、推測統計の
目的
ex. 母集団の平均・分散は何か?
標本
母集団の一部
表記: {X1, X2, ..., Xn}
n: 標本の大きさ(sample size)
Xi: 大文字で書かれていることから分かるように、確率変数と見なされている。
標本の時点ではまだ値が定まっていない
標本抽出: 母集団から標本を選ぶこと
無作為標本
標本{X1, X2, ..., Xn}について、すべての異なるi, jでXiとXjの分布が
独立であるとき、この標本を無作為標本(random sample)と呼ぶ
無作為標本を構成するXiは、それぞれ独立で、かつ母集団と同一の分布を
持つ
この講義では、これ以降ほぼ無作為標本を扱う
標本抽出の方法にも様々なものがあり、「標本調査法」とよばれる統計学の 一分野であり、マーケティングなどでは重要
Web
調査は無作為か
?
Macromilなど、ネット経由で調査を行う会社が増加
ネットでの質問に答える人は、特定の層に偏る傾向がある(主婦など): 独立
ではなく、似たXiが選ばれている
⇒無作為抽出ではなく、母集団ではない特定の層に関する標本
cf. Kinjo and Sugawara “Predicting Empirical Patterns in Viewing Japanese TV Dramas Using Case-Based Decision Theory,” accepted inB.E.Journal of
Theoretical Economics: Web調査データによって、月9ドラマの視聴パ
ターンを分析
統計量
T(X1, ..., Xn): 標本の関数
標本が確率変数なので、統計量も確率変数であり、分布を持つ
標本分布: 統計量の分布
観測値
標本の確率変数が、実際に取った値 (x1, ..., xn)
小文字で書かれていることから分かるように、確率変数ではなく実数値
統計値T(x1, ..., xn)
統計量の実現値
推測統計学の手法
統計的推定:
母集団の未知母数について、標本の関数である統計量の実現値を用いて情報を 求めること
ex. 母集団の平均を、標本の平均によって近似する
統計的検定
母集団の未知母数についての仮説について、統計量の実現値を用いて、妥当性 を検証すること
ex. 仮説「母集団の平均は0か?」