計量経済学#04
統計的推測 (1)
鹿野繁樹
大阪府立大学
2017 年 10 月更新
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 1 / 27
Outline
1 統計的推測
2 標本平均の性質
テキスト・参考書。
テキスト:鹿野繁樹 [2015]、第 3.1 章・第 3.2 章。 参考書:松原望 et al. [1991]。
前回の復習
Section 1
統計的推測
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 3 / 27
母集団・母数と標本
科学研究の分析対象は、非常に広範。
経済学:「一般家計の消費支出」や「代表的な事業所の生産 技術」。
マーケティング:「潜在的な顧客のニーズ」。 医療:「代表的な患者に対する新薬の効果」。
統計的推測とは?⇒ 図1。
分析対象「全体」を母集団、母集団が持つ数量的な特徴を母 数(パラメータ)と呼ぶ。∴ 分析者の目的= 母集団が持つ未 知母数の値をつかむ。
母集団全体の観測は、物理的・金銭的に不可能。⇒ その一部、 標本(サンプル)を抽出し、標本に基づき母数の値を推測。 コレが統計的推測。
∴ 統計的推測=「一部から全体を知る」。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 5 / 27
図 1 : 統計的推測の全体像
Example 1
「女性の働き方」に関する研究。⇒ 母集団=「女性全体」。 未知の母数:年収の平均・標準偏差や、大卒の割合、週労働 時間と子ども数の相関係数など。
「女性全体」の観測は困難⇒ 全国から女性を1000 人ランダ ムに抽出し標本とする。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 7 / 27
Remark 1
統計的推測:標本から、未知の母数を統計的に推測(図1)。 母集団= 分析対象全体。
母数(パラメータ)= 母集団の平均や分散など、数量的な特 徴。⇒ これらの値を知りたい。
母集団の全観測は不可能⇒ 標本を抽出し、母数を推測。 確率論の役割:標本による母数の推測なので、統計的推測は 誤差を伴う。⇒ 確率論を応用、誤差の小さい分析を目指す!
統計量による標本の集約
標本平均X や標本分散 s¯ 2のように、標本X1, X2, . . . , Xnを一つに
まとめたものを統計量(統計)と呼ぶ。
標本は(事前には)確率変数⇒ 統計量もまた確率変数。 データ分析で得られる分析結果は、統計量の実現値のひとつ に過ぎない!
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 9 / 27
標本に頼る以上、統計分析でランダムネスは不可避。
Remark 2
統計のランダムネス。
観測の事前には、標本X1, X2, . . . , Xnはn 個の確率変数⇒ ¯X やs
2
など、標本から作る統計量も、事前には確率変数。
∴ 得られた分析結果は、数ある実現値のひとつに過ぎない。 この認識は,自身の・他者の分析結果を評価する際に重要。
Section 2
標本平均の性質
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 11 / 27
母集団モデル
ある母集団全体の平均を母平均と呼び、µ と表記。
分析者にとって、µ は未知の母数⇒ 標本 X1, X2, . . . , Xnの平
均X を、µ の近似と考える。¯ µ= ?
全体の平均
⇒ X¯ = 1 n
Xi 標本の平均
. (1)
これは、統計的に正しいアプローチか?⇒ 確率論的に、標本 平均X はいかなる性質を持つか?¯
いま、個々のXiは次の誤差モデルに従って観測されると仮定。
誤差モデル
標本観測の誤差モデル。
Xi = µ + ui, ui ∼N(0, σ2), i= 1, 2, . . . , n. (M) ただしu1, u2, . . . , unは互いに独立(独立標本の仮定)。
右辺第1 項は母平均 µ、観測を通じて一定。
第2 項は、正規分布に従い確率的に変動するノイズで、誤差 項と呼ぶ。
誤差のバラつきの大きさを司る母分散σ
2
も、やはり未知の 母数。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 13 / 27
(M) 式は、標本 X1, X2, . . . , Xnに現れる個体差・変動を、母平均µ からの確率的な誤差uiで表現。
uiの意味するところは、
1 標本抽出の偶然性:多様な母集団から誰が(どれが)抽出され るかは偶然。
2 行動の偶然性:母集団のメンバー(経済主体)は固定されてい
るが、各メンバーの意思決定・行動が偶然に左右され、変化。
3 観測誤差:計測ミスや誤記入など、観測上・記録上の純粋な エラー。
(M) 式のように、(a)未知の母数を含み、かつ(b)標本が発 生するメカニズムを描写した確率モデルを母集団モデルと 呼ぶ。
Xiは、正規分布に従うui ∼N(0, σ2) を、µ だけずらした確率変 数。⇒ 正規分布の性質(講義ノート#03)より
Xi = µ + ui,
ui ∼N(0, σ2) ⇒ Xi ∼N(µ, σ
2), i= 1, 2, . . . , n. (2)
∴Xiは正規分布に従う。
統計学では(M) 式を正規母集団と呼ぶ。
誤差項uiが互いに独立⇒ Xiも互いに独立。社会調査におけ る無作為抽出は、この状況に対応する。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 15 / 27
確率変数としての標本平均
(M) 式の XiをX の定義に代入し整理¯ ⇒ ¯X の誤差表現 X¯ = 1
n
(µ + ui) = 1 n
µ
=n·µ
+1 n
ui
= 1
n · nµ+ ¯u
= µ + ¯u, u¯= 1 n
ui (3)
を得る。
標本X1, X2, . . . , Xnが(M) 式に従って観測されるならば、 ¯X
Remark 3
誤差表現:標本平均と母平均の関係。
標本平均X¯ = 母平均 µ + 誤差の平均 ¯u.
誤差項の平均u があるおかげで、一般的に ¯¯ X = µ。⇒ ¯u の確 率的な性質(期待値と分散)を分析。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 17 / 27
¯
uiの期待値:和の公式(講義ノート#03)を n 次元に拡張すれば、 E(ui) = 0 より
E(¯u) = E 1
n(u1+ u2+ · · · + un)
= 1
nE(u1+ u2+ · · · + un)
= 1
n [E(u1) + E(u2) + · · · + E(un)]
= 1
n(0 + 0 + · · · + 0) = 0. (4)
この性質は、uiが独立でも、独立でなくても成立。
¯
uiの分散:独立な確率変数の公式(講義ノート#03)および Var(ui) = σ2から
Var(¯u) = Var 1
n(u1 + u2+ · · · + un)
= 1
n2Var(u1+ u2+ · · · + un)
= 1
n2 [Var(u1) + Var(u2) + · · · + Var(un)]
= 1 n2 (σ
2+ σ2+ · · · + σ2)
=nσ2
= σ
2
n . (5)
この性質は、uiの独立性が前提条件。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 19 / 27
∴X の期待値と分散は、講義ノート#02 の期待値・分散の公式を¯ 上記の結果に当てはめれば
E( ¯X) = E(µ + ¯u) = E(µ)
=µ
+ E(¯u)
=0
= µ, (6)
Var( ¯X) = Var(µ + ¯u) = Var(µ)
=0
+ Var(¯u)
=1
nσ 2
= 1 nσ
2. (7)
公式 1 ( 標本平均の期待値と分散 )
独立な誤差モデル(M) 式に従うとき、
E( ¯X) = µ, Var( ¯X) = 1σ2. (8)
公式(8) を土台に、標本平均 ¯X の「性能」を考察。
E( ¯X) = µ: ¯X は、事前に母平均 µ ぐらいの値が見込める確率 変数。∴X の実現値で未知の µ を推測するのは、合理的。¯ Var( ¯X) = n1σ2: ¯X の、µ の周りのバラつきが、サンプル数 n に反比例。∴ 観測が多いほど、 ¯X の精度が上がる!
n → ∞のときVar( ¯X) → 0。∴無限の観測に基づくX¯ は、や がて真の平均・µに収束。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 21 / 27
Remark 4
公式(8) より、標本平均 ¯X で µ の値を推測するのは合理的。
1 標本を集める事前にX は確率変数だが、ターゲットである µ¯ ぐらいの値が実現値として見込める。
2 サンプル数n が多いほど、 ¯X の精度が良くなる。(n が十分大 きければ、誤差はほぼ消えてしまう。)
標本平均の分布
標本平均X の期待値・分散はすでに判明¯ ⇒ ¯X が従う分布は? 正規分布の再生性(講義ノート#03)より
ui ∼N(0 + 0 + · · · + 0, σ2+ σ2+ · · · + σ2)
−−→整理 ui ∼N(0, nσ2). (9)
正規確率変数の一次式の性質(講義ノート#03)より X¯ = µ + 1
n
ui ∼N
µ, 1
n2nσ
2
−−→整理 X¯ ∼N
µ, 1
nσ
2
. (10) 誤差項の正規性の仮定から、 ¯X も正規分布に従う!
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 23 / 27
公式 2
誤差項の正規性により,標本平均X の分布は¯ X¯ ∼N
µ, σ
2
n
. (11)
証明:前段で証明済み.
X の期待値・分散は、公式¯ (8) と同じである点に注意。 誤差項の正規性で付加された新事実は, ¯X が正規分布を成 す点。
公式(11) は、仮説検定(次回)で重要な役割。
「標本平均X による母平均 µ の統計的推測」から学ぶべきこと。¯ 標本X1, X2, . . . , Xnの発生プロセスと母数パラメータの役割 を結びつける、母集団モデルの重要性。
統計量の性能は一般に、標本の確率的な性質に依存。 もし標本X1, X2, . . . , Xnが、正規分布からかけ離れた歪んだ 分布に従うならば、公式(11)は誤り。
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 25 / 27
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 あるコインを考える。
1 このコインが歪んでいるかどうか、統計的推測で確認する方法 を考えよ。
2 この問題における母数パラメータは何か?
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.
松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.
鹿野繁樹 (大阪府立大学) 計量経済学#04 2017 年 10 月更新 27 / 27