• 検索結果がありません。

統計的推測 計量経済学 鹿野研究室 note04

N/A
N/A
Protected

Academic year: 2018

シェア "統計的推測 計量経済学 鹿野研究室 note04"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

はじめに

前回の復習

 正規分布N(µ, σ2)、標準正規分布N(0, 1)

 多次元分布:複数の確率変数の確率。

今回学ぶこと

 統計的推測の考え方。

 標本平均の確率的性質母数の推定。

 テキスト該当箇所 :付録B1∼B3章。鳥居(1994)、東大出版会(1991)も参照。

1 統計的推測とは?

1.1 母集団・母数と標本

 母集団:分析者が興味のある 「全体」を、 と呼ぶ。

⊲ 例:日本の既婚女性「全体」。

⊲ 例:堺市内にある事業所 「全体」。

 母数:母集団が持つ数量的な特徴を、 と呼ぶ。割合や平均・分散など。

⊲ 例:既婚女性に占める大卒の割合。

⊲ 例:堺市内にある事業所の、 従業員数の平均や分散。

分析者の目的=母数の値を知る。

 Remark:統計的推測の考え方 (図1

⊲ 多くの場合、母集団全体を観測するのは不可能。∴母集団から (「一部」)を 抽出し、標本から母数を近似 ・推測。

⊲ 精度の高い標本の集め方 ・使い方をデザインするには ?確率論の応用。

⊲ =確率論に基づき、 標本から未知の母数を推測する作業。

1

(2)

1:統計的推測のイメージ

1.2 標本と統計量

 サンプル数nの標本をX1, X2, . . . , Xnと表記。

⊲ 実際にどんな値が観測されるかは偶然。∴標本Xiは、ひとつひとつが 。

「母集団からn個の標本を抽出」「サイコロをn回振って、出た目を記録」

 統計量:標本を適当な定数にまとめたものを、 と呼ぶ。

分析者は標本X1, X2, . . . , Xnを統計量に集約統計的推測に利用。

標本平均X =¯ 1nni=1Xiや標本分散s2X = n−11 ni=1(Xi− ¯X)2(講義ノート#01)は、統 計量。標本の最大・最小値なども統計量。これらを と 呼ぶ。

 Remark:統計の偶然性

標本X1, X2, . . . , Xnは、n個の確率変数標本から作った統計量も、 確率変数。

∴統計量に基づく分析結果は、 常に偶然を伴う。

X¯ s2X である」という認識が、データ分析で非常に重要。

2 標本平均の確率的性質

2.1 誤差モデルによる標本の定式化

 母平均と母分散:母集団の典型的な値を 、その周りのバラつきを と 呼ぶ。

⊲ µ =母平均、σ2=母分散と表記。(注意:正規分布N(µ, σ2)でなくとも良い。

⊲ µσ2は未知の母数標本X1, X2, . . . , Xnから統計的推測。

 標本は、母数のどんな情報を分析者に運んでくれるのか ?標本のモデル化。

 誤差モデル:標本X1, X2, . . . , Xnは、次式の過程に従って観測されると仮定。

Xi = µ + ui, i = 1, 2, . . . , n. (1) ただしuiは確率変数で、全てのiについて

E(ui) = 0, Var(ui) = σ2. (2)

これを と呼ぶ。

(3)

観測されるXi=典型的な値µ +確率的な誤差ui (4) で表現。誤差uiのバラつき具合いは、母分散σ2の大小で決まる。uiの意味するところは

1. 標本抽出の偶然性 :母集団から誰が(どれが)抽出されるか分からない。 2. 行動の偶然性:分析対象である経済主体の意思決定 ・行動自体が偶然を伴う。 3. 純粋な観測誤差:観測上・記録上のエラー。(計測ミス、誤記入など。)

2.2 標本平均の期待値と分散

 標本平均X¯ の確率的な性質(期待値や分散) は?誤差モデル(1)式に基づき検証。

⊲ (1)式の表現より、標本平均X =¯

1 n

n i=1Xi

X =¯ 1 n

n i=1

(µ + ui) = 1 n

n i=1

µ +1 n

n i=1

ui = 1

n· nµ + ¯u = . (5)

ただし ¯u = 1

n

n

i=1uiは誤差項の平均。 和記号の性質(講義ノート#01) に注意。

⊲ ∴標本平均と母平均の関係は

標本平均X =¯ 母平均µ +誤差の平均 ¯u. (6)

 標本平均の期待値 :標本平均の期待値は

E( ¯X) = µ. (7)

∴標本平均X¯ は確率的にバラつくが、 母平均µぐらいの値が比較的出やすい。

証明:¯uの期待値は、和の期待値(講義ノート#03)に注意すると E(¯u) = E

⎜⎜

⎜⎜

⎜⎝ 1 n

n i=1

ui

⎟⎟

⎟⎟

⎟⎠ = 1

nE(u1+ u2+ · · · + un) = 1

n(E(u1) + E(u2) + · · · + E(un))

= 1

n(0 + 0 + · · · + 0) = 0. (8) よって期待値の公式(講義ノート#02) より

E( ¯X) = E(µ + ¯u) = µ + E(¯u) = µ. (9)

 独立性の仮定:簡単化のため、誤差項u1, u2, . . . , un であると仮定。

独立⇒ Cov(ui, uj) = 0(無相関、講義ノート#03。 共分散の定義と(2)式より Cov(ui, uj) = E(ui− E(ui))(uj− E(uj))= E(ui− 0))(uj− 0)= E(uiuj) = 0. (10)

(4)

⊲ 標本が互いに独立になるような標本抽出を、 と呼ぶ。

⊲ 注意:標本が時間軸で並んでいる時系列データ(講義ノート#01)は、隣り合う時点 の標本uiui−1が強い相関を持つため、 独立性の仮定は妥当でない。

 標本平均の分散:誤差項が互いに独立ならば、 標本平均の分散は Var( ¯X) = 1

nσ

2. (11)

∴標本平均X¯ のバラつきは、母分散σ2に比例、サンプル数nに反比例。

証明:E(¯u) = 0なので、¯uの分散は Var(¯u) = E(¯u2) = E 1

n2(u1+ u2+ · · · + un)2

= 1

n2E[(u1+ u2+ · · · + un)(u1+ u2+ · · · + un)]

= 1 n2E[u

2

1+ u22+ · · · + u2n



n 個の 2 乗項 u2i

+ u1u2+ u1u3+ · · · + un−1un



n(n − 1) 個の交差項 uiuj

]. (12)

ここで(3)式よりE(u2

i) = Var(ui) = σ 2

、また独立性の仮定よりE(uiuj) = Cov(ui, uj) =

0なので、

Var(¯u) = 1 n2

(σ2+ σ2+ · · · + σ2) + (0 + 0 + · · · + 0)= 1 n2 · nσ

2= 1 nσ

2. (13)

よって分散の公式(講義ノート#02) より

Var( ¯X) = Var(µ + ¯u) = Var(¯u) = 1 nσ

2. (14)

 Remark:標本平均X¯の確率的性質をまとめると

, . (15)

分散の導出で、 誤差項の独立性(無相関)の仮定を置いた点に注意。

1. 標本平均X¯ は、 を重心に分布。∴ ¯Xは、µに近い値が出やすい。 2. ¯Xµ周りのブレは、 に反比例。nが多いほどX¯ の精度が上昇。

3 母数の推定

3.1 未知母数とその推定量

 推定:適当な統計量で未知の母数(母平均µや母分散σ2など)の近似値を求める作業を、 母数の と呼ぶ。

⊲ 推定で用いられる統計量を特に、 と呼ぶ。

 未知の母数を一般にθ(シータ)、その推定量を ˆθと表記。

推定量 ˆθは標本Xi, X2, . . . , Xnから求める。∴ ˆθは、確率変数)

⊲ 標本をどう使うのが確率論的に望ましいか ?採用基準:不偏性と有効性。

(5)

が成立するとき、ˆθθの と呼ぶ。

⊲ 不偏性はなぜ望ましい ?⇒ ˆθの実現値として、θ(=分析者が知りたいターゲット) が出る確率が高い。∴不偏性= 。

例:(15)式より、X¯ µの不偏推定量。

 有効性:θに対し不偏性を持つ推定量が複数ある場合、そのうち最も分散が小さい不偏推

定量を と呼ぶ。

⊲ 有効性はなぜ望ましい?⇒ θを軸にした確率的なブレが、最も小さい=精度が高い。

∴有効性= 。

⊲ 注意:有効性は、複数ある不偏推定量を一つに絞り込むための採用基準。

例:µの不偏推定量はX¯ 以外にも無数に存在するが、X¯ はµの有効推定量であるこ とが知られている。

 Remark:標本平均X¯による母平均µの推定は、確率論上の合理性(不偏性・有効性)が

ある。

⊲ ¯Xの計算は、誰でもできる。統計学・計量経済学で問うべきことは、「なぜそこで標 本平均X¯ なのか?」その基礎として確率論 (講義ノート#02#03)が必須。

まとめと復習問題

今回のまとめ

 統計的推測の考え方。

 標本平均の確率的性質母数の推定。不偏性・有効性。

復習問題

出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。

1. 未知の母数θ(例えば母分散)に対し二つの推定量の候補 ˆθ1ˆθ2があり、それぞれの確率 分布が次の通りであるとする。

f (ˆθ1) =

⎧⎪

⎪⎨

⎪⎪

0.5 for ˆθ1 = 0.5θ

0.5 for ˆθ1 = 1.5θ

, g(ˆθ2) =

⎧⎪

⎪⎨

⎪⎪

0.4 for ˆθ2= 0.5θ

0.6 for ˆθ2= 1.5θ

(17)

(注意:ˆθ1ˆθ2の実現しうる値は0.5θ, 1.5θで共通だが、確率が異なる。) (a) ˆθ1ˆθ2、それぞれの期待値を求めよ。

(b) 不偏性の観点から、θの推定量としてどちらが望ましいか ?

図 1: 統計的推測のイメージ 1.2 標本と統計量  サンプル数 n の標本を X 1 , X 2 , . . . , X n と表記。 ⊲ 実際にどんな値が観測されるかは偶然。 ∴ 標本 X i は、ひとつひとつが 。 ⊲ 「母集団から n 個の標本を抽出」 ≈ 「サイコロを n 回振って、出た目を記録」  統計量:標本を適当な定数にまとめたものを、 と呼ぶ。 ⊲ 分析者は標本 X 1 , X 2 ,

参照

関連したドキュメント

[r]

2006 年 6 月号から台湾以外のデータ源をIMF のInternational Financial Statistics に統一しました。ADB のKey Indicators of Developing Asian and Pacific

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC

カメルーン国立統計研究所 (Institut National de la Statistique du Cameroun) は, 2001 年に独立採算制

を変狐そ漱単純に/め一ξ鵬の値を効用変化の一義的な貨幣尺

6学会報告 「貨幣価値変動と損益計算」東北経営・会計研究会第3回大会於福島大学、

研究計画題目.

奥村 綱雄 教授 金融論、マクロ経済学、計量経済学 木崎 翠 教授 中国経済、中国企業システム、政府と市場 佐藤 清隆 教授 為替レート、国際金融の実証研究.