統計的推測計量経済学鹿野研究室 note04

(1)

はじめに

前回の復習

正規分布_{N(µ, σ}²₎、標準正規分布_{N(0, 1)}。

多次元分布：複数の確率変数の確率。

今回学ぶこと

統計的推測の考え方。

標本平均の確率的性質_⇒母数の推定。

テキスト該当箇所：付録_B1∼B3章。鳥居（₁₉₉₄）、東大出版会（₁₉₉₁）も参照。

1 統計的推測とは？

1.1 母集団・母数と標本

母集団：分析者が興味のある「全体」を、と呼ぶ。

⊲ 例：日本の既婚女性「全体」。

⊲ 例：堺市内にある事業所「全体」。

母数：母集団が持つ数量的な特徴を、と呼ぶ。割合や平均・分散など。

⊲ 例：既婚女性に占める大卒の割合。

⊲ 例：堺市内にある事業所の、従業員数の平均や分散。

⊲ ^{分析者の目的}₌^{母数の値を知る。}

_Remark：統計的推測の考え方（図₁）

⊲ 多くの場合、母集団全体を観測するのは不可能。∴母集団から（「一部」）を抽出し、標本から母数を近似・推測。

⊲ 精度の高い標本の集め方・使い方をデザインするには？_⇒確率論の応用。

⊲ ＝確率論に基づき、標本から未知の母数を推測する作業。

1

(2)

図_1:統計的推測のイメージ

1.2 標本と統計量

サンプル数_nの標本を_X₁_{, X}₂, . . . , X_n^と表記。

⊲ 実際にどんな値が観測されるかは偶然。∴標本_X_iは、ひとつひとつが。

⊲ ^{「母集団から}n^{個の標本を抽出」}_≈^{「サイコロを}n回振って、出た目を記録」

統計量：標本を適当な定数にまとめたものを、と呼ぶ。

⊲ ^{分析者は標本}X₁, X2, . . . , X_n^{を統計量に集約}_⇒^{統計的推測に利用。}

⊲ ^標本平均_{X =}^¯ ¹_nⁿ_i=1X_i^{や標本分散}s²_X ₌ _n−1¹ ⁿ_i=1(Xi− ¯^X)²^{（講義ノート}^#01^）は、統計量。標本の最大・最小値なども統計量。これらをと呼ぶ。

_Remark：統計の偶然性

⊲ ^標本X₁, X2, . . . , X_n^は、n^{個の確率変数}_⇒標本から作った統計量も、確率変数。

∴統計量に基づく分析結果は、常に偶然を伴う。

⊲ ^「X^¯ ^やs²_X^はである」という認識が、データ分析で非常に重要。

2 _{標本平均の確率的性質}

2.1 誤差モデルによる標本の定式化

母平均と母分散：母集団の典型的な値を、その周りのバラつきをと呼ぶ。

⊲ µ =^母平均、^σ²=^{母分散と表記。}^{（注意：正規分布}^{N(µ, σ}²⁾^{でなくとも良い。}^）

⊲ µ^、σ²^{は未知の母数}_⇒^標本X1, X2, . . . , X_n^{から統計的推測。}

標本は、母数のどんな情報を分析者に運んでくれるのか？_⇒標本のモデル化。

誤差モデル：標本_X₁_{, X}₂, . . . , X_nは、次式の過程に従って観測されると仮定。

X_i _{= µ + u}_i, i = 1, 2, . . . , n. ⁽¹⁾ ただし_u_iは確率変数で、全ての_iについて

E(u_i_{) = 0,} Var(u_i_{) = σ}². (2)

これをと呼ぶ。

(3)

観測される_X_i₌典型的な値_{µ +}確率的な誤差_u_i ₍₄₎ で表現。誤差_u_iのバラつき具合いは、母分散_σ²の大小で決まる。_u_iの意味するところは

1. 標本抽出の偶然性：母集団から誰が（どれが）抽出されるか分からない。 2. 行動の偶然性：分析対象である経済主体の意思決定・行動自体が偶然を伴う。 3. 純粋な観測誤差：観測上・記録上のエラー。（計測ミス、誤記入など。）

2.2 標本平均の期待値と分散

標本平均_X^¯ の確率的な性質（期待値や分散）は？_⇒誤差モデル₍₁₎式に基づき検証。

⊲ (1)式の表現より、標本平均_{X =}^¯

1 n

n i=1^Xⁱ^は

X =¯ ¹ n

n i=1

(µ + ui) = ¹ n

n i=1

µ +¹ n

n i=1

u_i ₌ ¹

n· nµ + ¯u = ^. ⁽⁵⁾

ただし _{¯u =} ¹

n

i=1^uⁱは誤差項の平均。和記号の性質（講義ノート_#01）に注意。

⊲ ∴標本平均と母平均の関係は

標本平均_{X =}¯ 母平均_{µ +}誤差の平均 _¯u. ₍₆₎

標本平均の期待値：標本平均の期待値は

E( ¯_{X) = µ.} (7)

∴標本平均_X¯ は確率的にバラつくが、母平均_µぐらいの値が比較的出やすい。

⊲ ^証明：¯uの期待値は、和の期待値（講義ノート_#03)に注意すると E(¯u) = E

⎛

⎜⎜

⎜⎝ 1 n

n i=1

u_i

⎞

⎟⎟

⎟⎠ = 1

n^E(u¹^{+ u}²+ · · · + un) = ¹

n^(E(u¹^{) + E(u}²) + · · · + E(un⁾⁾

= ¹

n(0 + 0 + · · · + 0) = 0. ⁽⁸⁾ よって期待値の公式（講義ノート_#02）より

E( ¯X) = E(µ + ¯u) = µ + E(¯u) = µ. ⁽⁹⁾

独立性の仮定：簡単化のため、誤差項_u₁_{, u}₂, . . . , u_n^は ^{であると仮定。}

⊲ ^独立_{⇒ Cov(u}_i, u_j_{) = 0}^{（無相関、講義ノート}#03^）^{。共分散の定義と}(2)^式より Cov(u_i, u_j_{) = E}(u_i_{− E(u}_i))(u_j_{− E(u}_j))_{= E}(u_i_{− 0))(u}_j_{− 0)}_{= E(u}_iu_j_{) = 0.} (10)

(4)

⊲ 標本が互いに独立になるような標本抽出を、と呼ぶ。

⊲ 注意：標本が時間軸で並んでいる時系列データ（講義ノート_#01）は、隣り合う時点の標本_u_iと_u_i−1が強い相関を持つため、独立性の仮定は妥当でない。

標本平均の分散：誤差項が互いに独立ならば、標本平均の分散は Var( ¯_{X) =} ¹

n^σ

2. (11)

∴標本平均_X^¯ のバラつきは、母分散_σ²に比例、サンプル数_nに反比例。

⊲ ^証明：_{E(¯u) = 0}^なので、¯u^の分散は Var(¯u) = E(¯u²) = E¹

n²^(u¹^{+ u}²+ · · · + un⁾²

= ¹

n²^E[(u¹^{+ u}²+ · · · + un^)(u1+ u2+ · · · + un^)]

= ¹ n²^E[u

2

1+ u²2+ · · · + u²_n

n 個の 2 乗項 u²_i

+ u1u2+ u1u3+ · · · + un−1^un

n(n − 1) 個の交差項 uiuj

]. (12)

ここで₍₃₎式より_E(u²

i^{) = Var(u}ⁱ^{) = σ} 2

、また独立性の仮定より_E(u_i_u_j_{) = Cov(u}_i_{, u}_j_{) =}

0^なので、

Var(¯u) = ¹ n²

(σ²+ σ²+ · · · + σ²) + (0 + 0 + · · · + 0)= ¹ n² ^{· nσ}

2= ¹ n^σ

2. (13)

よって分散の公式（講義ノート_#02）より

Var( ¯X) = Var(µ + ¯u) = Var(¯u) = ¹ n^σ

2. (14)

_Remark：標本平均_X¯の確率的性質をまとめると

, . (15)

分散の導出で、誤差項の独立性（_→無相関）の仮定を置いた点に注意。

1. ^標本平均X^¯ ^は、 ^{を重心に分布。}^{∴ ¯}X^は、µ^{に近い値が出やすい。} 2. ¯X^のµ^{周りのブレは、} ^{に反比例。}^∴n^{が多いほど}X^¯ ^{の精度が上昇。}

3 母数の推定

3.1 未知母数とその推定量

推定：適当な統計量で未知の母数（母平均_µや母分散_σ²など）の近似値を求める作業を、母数のと呼ぶ。

⊲ 推定で用いられる統計量を特に、と呼ぶ。

未知の母数を一般に_θ（シータ）、その推定量を _ˆθと表記。

⊲ ^推定量 ˆθ^は標本X_i, X2, . . . , X_n^{から求める。}^（^{∴ ˆ}θ^{は、確率変数）}^。

⊲ 標本をどう使うのが確率論的に望ましいか？_⇒採用基準：不偏性と有効性。

(5)

が成立するとき、_ˆθを_θのと呼ぶ。

⊲ 不偏性はなぜ望ましい？_{⇒ ˆθ}の実現値として、_θ（＝分析者が知りたいターゲット）が出る確率が高い。∴不偏性＝。

⊲ ^例：(15)^式より、X^¯ ^はµ^{の不偏推定量。}

有効性：_θに対し不偏性を持つ推定量が複数ある場合、そのうち最も分散が小さい不偏推

定量をと呼ぶ。

⊲ 有効性はなぜ望ましい？_{⇒ θ}を軸にした確率的なブレが、最も小さい₌精度が高い。

∴有効性＝。

⊲ 注意：有効性は、複数ある不偏推定量を一つに絞り込むための採用基準。

⊲ ^例：µ^{の不偏推定量は}X^¯ 以外にも無数に存在するが、_X¯ は_µの有効推定量であることが知られている。

_Remark：標本平均_X¯による母平均_µの推定は、確率論上の合理性（不偏性・有効性）が

ある。

⊲ ¯Xの計算は、誰でもできる。統計学・計量経済学で問うべきことは、「なぜそこで標本平均_X¯ なのか？」_⇒その基礎として確率論（講義ノート_#02、_#03）が必須。

まとめと復習問題

今回のまとめ

統計的推測の考え方。

標本平均の確率的性質_⇒母数の推定。不偏性・有効性。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^{未知の母数}θ（例えば母分散）に対し二つの推定量の候補 _ˆθ₁、_ˆθ₂があり、それぞれの確率分布が次の通りであるとする。

f (ˆθ₁_{) =}

⎧⎪

⎪⎨

⎪⎪

⎩

0.5 for ˆθ1 _{= 0.5θ}

0.5 for ˆθ1 = 1.5θ

, g(ˆθ₂_{) =}

⎧⎪

⎪⎨

⎪⎪

⎩

0.4 for ˆθ2_{= 0.5θ}

0.6 for ˆθ2= 1.5θ

(17)

（注意：_ˆθ₁と_ˆθ₂の実現しうる値は_{0.5θ, 1.5θ}で共通だが、確率が異なる。） (a) ˆθ1^とˆθ2、それぞれの期待値を求めよ。

(b) ^{不偏性の観点から、}θの推定量としてどちらが望ましいか？

統計的推測 計量経済学 鹿野研究室 note04

はじめに

前回の復習

今回学ぶこと

1 統計的推測とは？

1.1 母集団・母数と標本

1.2 標本と統計量

2 標本平均の確率的性質

2.1 誤差モデルによる標本の定式化

2.2 標本平均の期待値と分散

3 母数の推定

3.1 未知母数とその推定量

まとめと復習問題

今回のまとめ

復習問題

統計的推測計量経済学鹿野研究室 note04

2 _{標本平均の確率的性質}