漸近理論経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

重回帰モデルの使い方。

ダミー変数を説明変数に使う。

今回学ぶこと

漸近理論とは？

大数の法則と中心極限定理。

テキスト該当箇所：₈章。

1 ^{漸近理論とは？}

1.1

漸近理論による統計量の近似

漸近理論：サンプル数_nが十分大きい場合の統計的推測を、（大標本理論）と呼ぶ。

⊲ ^{統計量の、}_{n → ∞}のときに成立する性質（）を、推定・検定に利用。

⊲ ^例：n^{が大きい時、自由度}_{m = n − 1}^のt^分布T (m)の代わりに標準正規分布_{N(0, 1)} の臨界値を仮説検定に使う。

⊲ 基幹となる定理：大数の法則（たいすうのほうそく）と中心極限定理。

小標本理論：_nが有限に固定された下での統計的推測を、と呼ぶ。

⊲ nの大小に左右されず、常に成立する統計量の性質を利用。

⊲ ∴ここまで使ってきた分析ツールのほとんどは、小標本理論。

_Remark：漸近理論の必要性

1. 緩い前提条件でデータ分析ができる。（正規性を仮定しない、など。）

2. モデルによっては、不偏推定量が存在しない。_⇒推定方法の選択で、漸近的な採用基準が必要。

1

(2)

⊲ ^確率分布 fn(an)^{に従う確率変数}anを、順序良く並べたのが、確率数列。

⊲ ... ^{分かりにくい場合は、}a_n^を「nに依存して確率分布が変化するひとつの確率変数」と考えれば良い。

例：サンプル数n = 1, 2, 3, ..^{の標本平均} X¯₁₌ ¹

1^X¹^, ^X^¯²⁼ 1

2^(X¹^{+ X}²^), ^X^¯³⁼ 1

3^(X¹^{+ X}²^{+ X}³^), ^{. . .} ⁽¹⁾

⊲ ¯X1^{, ¯}X2^{, ¯}X3^{, . . .}^は、nの大きさ順に並べた確率数列。_→代表してと表記。

⊲ ¯X_nの期待値・分散は、無作為標本ならば（講義ノート_#16） E( ¯Xn) = µ, ^{Var( ¯}^Xn) = ^σ

2

n ^. ⁽²⁾

∴_nに依存して、_X¯_nの分布（厳密には分散）は変化。

確率収束：確率数列_a_nと定数_cを考える。任意の定数_{ǫ >}₀（イプシロン）について

n→∞lim ^Pr(|aⁿ− c| > ǫ) = 0 ⁽³⁾

ならば、「_a_nは_cにする」と言う。

⊲ an^のc^{への確率収束を、}

(4)

と略記（plim = probability limit^）^。

⊲ 確率収束の意味：確率変数_a_nと定数_cがわずか_ǫだけズレる確率が、_{n → ∞}ならばゼロに近づく。（_ǫは何でもよいので、ǫ = 0.000001など小さい数をイメージ。）

⊲ ... ^{簡単に言えば、}^「n^{が十分大きければ、} ^{」ということ。}

分布収束：確率数列_a_nの確率分布 _f_n_(a_n₎が、_{n → ∞}のとき確率分布 _f^∗_(a)に近づくならば、「_a_nは_f^∗_(a)にする」と言う。

⊲ a_n^の f^∗(a)^{への分布収束を、}

(5)

と略記（a = asymptotically^）^。

⊲ ... ^{簡単に言えば、}^「n^{が十分大きければ、} ^{」ということ。}_{⇒ n}^が十分大きいときは、分布 _f^∗_(a)で_a_nの確率計算ができる。

⊲ ^{特に、収束先の分布} f^∗(a)が取扱いやすい分布ならうれしい！

(3)

0.00.20.40.60.8

µ

n→ ∞ Var(X) = ^σ

2

n

図_{1: ¯}_Xの分布と大数の法則

2 大数の法則と中心極限定理

2.1

^{大数の法則}

大数の法則：無作為標本の標本平均_X¯_n ₌ ¹

n^Xⁱ（正規母集団の仮定は不要）について、

plim ¯Xn= µ ⁽⁶⁾

が成立。これをと呼ぶ。

⊲ ^{無作為標本ならば、}X^¯n^は母平均^µ^{に確率収束。}^∴nが十分大きければ、未知の_µは、ぐらいであるとみなしてよい！

⊲ ^{証明（簡略版、図}1^参照）^：(2)^式より、X^¯_n^{は、どんな}n^{であれ常に}µ^{を重心に分布。} 一方分散は_nに反比例。∴_X¯_nの分布は_{n → ∞}のとき_µの近傍に集中_{⇒ ¯}_X_nが_µから外れた値をとる確率は、ほぼゼロ。

⊲ ^{厳密な照明}_⇒^テキスト_{p160 ∼ 162}^参照。

_Remark：「_{n → ∞}」は、現実のデータでは有り得ない。

⊲ 現実的なサンプル数で、大数の法則が示す近似は成立するか？_⇒コンピュータ・シミュレーションで確認。

⊲ 適当な母数値を設定し、そのもとで擬似的なサンプリング（乱数発生）を行い、統計量の理論上の性質を確認するシミュレーションを、と呼ぶ。

大数の法則のモンテカルロ実験：成功確率_{p = 0.5}のベルヌーイ母集団_X_i∼ Bin(1, 0.5)^。

⊲ ベルヌーイ分布の母平均・母分散は一般に

µ = p, ^σ²= p(1− p) ⁽⁷⁾

（講義ノート_#08）。∴この実験では_{µ = 0.5}、_σ²_{= 0.5}²。母数がであることがポイント。_→好きなサンプル数で乱数を発生できる。

(4)

50 100 150 200

0.000.050.10

n

|X−p| µ = p = 0.5

図_2:サンプル数_nと_{| ¯}_{X − p|}の関係

⊲ n = 10, 50, 100, 150, 200^{の標本抽出を各}¹^{万回づつ反復}→ | ¯^Xⁿ− 0.5|^{の平均値を計算。}

⊲ ^図2^：n^{が増えるにつれ、}_{| ¯}_{X − 0.5|}^の平均は ^。^（_{n = 200}^で約6%^{程度のズレ。}^）

2.2

^{中心極限定理}

中心極限定理：標本平均_X¯_n₌ ¹

n^Xⁱ^{を、標準化する。}

Z_n₌ ^X^¯ⁿ^{− µ}

σ/^√n^. ⁽⁸⁾

このとき無作為標本ならば（正規母集団の仮定は不要）、

Z_n_{∼ N(0, 1)}^a (9)

が成立。これをと呼ぶ。

⊲ ^{作為標本ならば、}Znの分布は標準正規分布へ分布収束。∴_nが大きければ、無母集団分布が正規分布でなくとも、_Z_nの臨界値を標準正規分布で近似できる！（詳しくは次回。）

⊲ 注意：正規母集団なら、_nの大小に関わらず_Z_n_{∼ N(0, 1)}。

⊲ 証明：とても難しいので省略。中級以上の数理統計学のテキスト参照。

例：ベルヌーイ母集団_X_i∼ Bin(1, p) → ¯^Xⁿ^。

⊲ ベルヌーイ分布の母平均・母分散は_{µ = p}、_σ²_{= p(1}_{− p)}。₍₇₎式参照。∴ _X¯_nを標準化すれば

Zn=

X¯n_{− p}

σ²/n ⁼

X¯n_{− µ}

p(1 − p)/n^. ⁽¹⁰⁾

⊲ n^{が少ないとき}Z_n _{∼? ...}^{分布は不明。}

⊲ n^{が十分大きければ}Zn_{∼ N(0, 1)}^a 。コレを区間推定（信頼区間の計算）や仮説検定に使う。

(5)

−4 −2 0 2 4

0.00.10.20.30.40.50.6

n = 10

x

−4 −2 0 2 4

0.00.10.20.30.40.50.6

n = 25

x

−4 −2 0 2 4

0.00.10.20.30.40.50.6

n = 100

x

−4 −2 0 2 4

0.00.10.20.30.40.50.6

n = 500

x

図_3:標本平均_X¯_n（ベルヌーイ母集団）の分布収束

中心極限定理のモンテカルロ実験：成功確率_{p = 0.25}のベルヌーイ母集団_X_i ∼ Bin(1, 0.25)^。

⊲ ^{この実験では}µ = p = 0.25^、^σ²= p(1− p) = 0.25 · 0.75^。

⊲ n = 10, 25, 100, 500^{の標本抽出を各}¹^{万回づつ反復}→ Zn = ^√0.25·0.75/n^X^¯ⁿ^−0.25 ^{のヒストグラ}

ムを作成。

⊲ ^図3（曲線は標準正規分布）：_{n = 25}程度でも、_Z_nの分布はで十分近似できそう。

_Remark：「収束」は「近似」。簡単に言えば_...

⊲ 大数の法則（確率収束と関係）：_nが大きい_{⇒ µ}を_X¯_nで！

⊲ ^{中心極限定理}^{（分布収束と関係）}^：n^が大きい_{⇒ Z}_n₌ _σ/^X^¯ⁿ^−µ√_n^の分布をN(0, 1)^で ^！

⊲ 「収束」と言うと分かりづらいが、要は_nが大きいときに許される「近似」。

⊲ いずれの定理も、無作為標本の仮定だけで_OK。正規母集団である必要はない。

(6)

漸近理論：確率収束と分布収束。

大数の法則と中心極限定理。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. 大数の法則とはどんな定理か？「確率収束」という言葉を用い、簡潔に説明せよ。この定理が成立するための条件も、明記する事。

2. ^確率変数X^は実現値_{x = 0, 1}のいずれかをとり、その確率は

Pr(Xn= 0) = 1− ¹_n^, ^Pr(Xⁿ= 1) = ¹

n ⁽¹¹⁾

で与えられるとする。_{n → ∞}のときの，_X_nの収束先を考えよ．

漸近理論 経済統計 鹿野研究室

担当：鹿野（大阪府立大学）

はじめに

前回の復習

今回学ぶこと

1 漸近理論とは？

漸近理論による統計量の近似

2 大数の法則と中心極限定理

大数の法則

中心極限定理

復習問題

漸近理論経済統計鹿野研究室

1 ^{漸近理論とは？}

^{大数の法則}

^{中心極限定理}