確率論計量経済学鹿野研究室 note02

(1)

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

前回の復習

計量経済学とは何か？

基本概念（和記号、記述統計）の復習。

今回学ぶこと

確率変数と確率分布。

期待値、分散と標準化。

テキスト該当箇所：付録_A1∼A3章。東大出版会（₁₉₉₁）も参照。

1 確率変数と確率分布

1.1 確率変数

なぜ統計学・計量経済学で確率論が必要か？_⇒データ分析の結果は、偶然性を伴う。

⊲ 理由：分析者の取得するデータ（標本）自体が、ランダムであるため。

⊲ ∴^{確率論に基づき、}「データを上手く使う方法＝精度の高い分析方法」をデザイン。

⊲ 確率論＝確率変数と確率分布を使って「偶然」を制御する技術。

確率変数：起こり得る値（あるいは区間）に確率が与えられた変数を、と呼ぶ。

⊲ ^{確率変数を大文字}X^で表し、X^{が任意の値} x（実現値と呼ぶ）をとる確率を

Pr(X = x) ⁽¹⁾

と表記。同様に、a < X < b^{となる確率を}Pr(a < X < b)^と表記。a, b^は定数。

例：サイコロを_Xと置く。

⊲ _Xの実現値はx = 1, 2, . . . , 6。サイコロに歪みが無ければ、それぞれの確率は Pr(X = x) = ¹

6^, x = 1, 2, . . . , 6. ⁽²⁾

1

(2)

1 2 3 4 5 6 x

Pr(X=x)=f(x) 0.00.10.20.30.4

A：サイコロ

1 2 3 4 5 6

x Pr(X=x)=f(x) 0.00.10.20.30.4

B：細工されたサイコロ

図_1:サイコロの確率分布

_Remark：確率変数のタイプ

⊲ 確率変数＝実現値ひとつひとつに番号をふり、数え上げることが出来る確率変数。例：サイコロ。

⊲ 確率変数＝測定を厳密にすると実現値が無限に存在し、番号がふれない確率変数。長さ、重さ、貨幣価値などの定量的な現象。

例：円周₁メートルのルーレットを回し、針がどこに止まるか？_⇒連続型確率変数_X。

⊲ ^{実現値は開閉区間}(0, 1]^{に無限に存在。}^∴0 < x ≤ 1^{。全て列挙はムリ。}

⊲ 確率をどうやって与える？_⇒確率密度関数。

1.2 確率分布

確率分布：離散型確率変数_Xが実現値_x_kをとる確率が

Pr(X = xk) = f (xk), k = 1, 2, 3, . . . , K. ⁽³⁾ で得られるとき、_f_(x_k₎をと呼ぶ。

⊲ ^確率分布 f(x_k)^{をグラフに描く}_⇒出やすい値・出にくい値が明確に。

⊲ f(x)の満たすべき性質：確率の自然な性質に注意すれば

確率は非負： _{Pr(X = x}_k_{) = f (x}_k_{) ≥ 0,} ₍₄₎ 確率の和は₁：

K k=1

Pr(X = xk) =

K k=1

f(xk) = 1. ⁽⁵⁾

例：歪みの無いサイコロと細工されたサイコロ

⊲ ^図1A：歪みの無いサイコロの確率分布は

f(1) = f (2) = · · · = f (6) = ¹₆^. ⁽⁶⁾

(3)

0.000.040.08

f(x)

a b

R

A：Pr ( a<X<b)

0.000.040.08

f(x)

c

S

B：Pr ( X>c )

図_2:確率密度関数と確率の対応関係（斜線部分）

⊲ ^図1B：細工されたサイコロ。_“2”の目を消し、_“5”を上書き_⇒実現値は1, 5, 3, 4, 5, 6^。確率分布は

f(x_k_{) =}

⎧⎪

⎪⎪

⎨

⎪⎪

⎪⎩

1

6 ^（^x^k = 1, 3, 4, 6^のとき） 0 ^（x_k _{= 2}^のとき）

1

3 ^（^x^k ^{= 5}^のとき）

. (7)

⊲ ^{両ケースとも条件}(4)^、条件(5)^{を満たす。}

1.3 連続型の確率分布：確率密度関数

確率密度関数：連続型確率変数_Xが区間_{[a, b]}の値をとる確率Pr(a ≤ X ≤ b)^が定積分 Pr(a ≤ X ≤ b) =

b a

f(x)dx (8)

で得られるとき、_f_(x)を_Xのと呼ぶ。

⊲ 特定の実現値に確率を与えるのは諦めて、代わりに区間の確率を与える。

⊲ ^密度関数 _f(x)の満たすべき性質：離散型の条件₍₄₎、条件₍₅₎と類似。

f(x_k_{) ≥ 0,} (9)

Pr(−∞ ≤ X ≤ ∞) =

_∞

−∞

f_{(x) = 1.} (10)

_Remark：密度関数と図の対応関係。図_2A。

⊲ ^条件(4)^、_{(5) ⇒}^{グラフ全体の面積}= Pr(−∞ ≤ X ≤ ∞) = 1.

⊲ ∴(8)式は、グラフ全体に占める斜線部Rので確率Pr(a ≤ X ≤ b)^を表現。

⊲ 注意：確率計算以外の場合は、「密度関数の頂上のあたり＝比較的出やすい値」と見て構わない。∴グラフの見方は離散型の分布と同じ。

(4)

積分の性質に注目すると_...

1. Pr(X = a) = Pr(a ≤ X ≤ a) =_a^a ^f(x)dx = F(a) − F(a) = 0^。^∴^{連続型に限り、} Pr(a ≤ X ≤ b) = Pr(X = a)

=0

+ Pr(a < X < b) + Pr(X = b)

=0

= ^. ⁽¹¹⁾

2. Pr(X > c) = Pr(c < X < ∞) =_c^∞ ^f(x)dx^。^∴ ^X^が定数^c^{を超える確率}Pr(X > c)^は、図 B^の斜線部^S^。

2 _{期待値と分散}

2.1 期待値

確率変数_Xの性質を、いくつかのパラメータ（定数値）で要約。

⊲ データを記述統計（講義ノート_#01：標本平均や標本分散）でまとめるのと同じ発想。

⊲ 確率変数の特性パラメータ：期待値と分散。

期待値：実現値_x₁_,_x₂_{, . . . ,}_x_Kをとり得る離散型の確率変数_Xについて、実現値の加重平均 E(X) = x1Pr(X = x1) + x2Pr(X = x2) + · · · + x^KPr(X = xK)

= x1^f^(x1) + x2^f^(x2) + · · · + xK^f^(xK) =

K k=1

x_kf(x_k) (12)

を、_Xのと呼ぶ。（_Eはexpectation^の略。^）

⊲ ^各実現値x_k^を確率_{Pr(X = x}_k_{) = f (x}_k)でウェイト付けして加重平均。出やすい_x_kに大きなウェイト。

⊲ ∴_E(X)は、さまざまな値をとり得る_Xの代表的な値。

⊲ ^注意：X^{は確率変数だが、}E(X)^{は定数扱い。}

例：歪みの無いサイコロ_Xの期待値は

E(X) = 1 · f (1) + 2 · f (2) + · · · + 6 · f (6) = ¹

6· 21 = 3.5. ⁽¹³⁾

⊲ 細工したサイコロの期待値も確認せよ。

連続型の期待値：連続型確率変数_Xについて、 E(X) =

_∞

−∞

x f(x)dx (14)

を、_Xの期待値（平均値）と呼ぶ。

⊲ E(X)^はX^{の代表的な値。}^∴^{意味は離散型と同じ。}（積分＝精密な足し算。）

期待値_E(·)の公式：（証明_⇒今回の補足資料。）定数_cについて、

1. ^。

2. ^。

3. ^。

(5)

0.00.10.20.30.4

f(x),g(y)

E( X) E( Y)

f g A：E( X) < E( Y)

0.00.10.20.30.4

f(x),g(y)

E( X) =E( Y)

f ( g( B：Var ( X) < Var ( Y)

図_3:期待値・分散の違いと分布の見た目

2.2 分散

分散：確率変数_Xについて、

Var(X) = E(X − E(X))²=

⎧⎪

⎪⎨

⎪⎪

⎩

(x_k_{− E(X))}²f(xk) ^{（離散型の場合）}

(x − E(X))²^f^(x)dx ^{（連続型の場合）} ⁽¹⁵⁾

を、_Xのと呼ぶ。（_Varは_varianceの略。）

⊲ ^各実現値xk^の期待値E(X)^{からのズレ}(xk_{− E(X))}²^{を、加重平均。}

⊲ ∴Var(X)^は、Xの平均周りの散らばりを測る。_Var(X)が大きい＝変動が大きく不安定。

⊲ ^{分散の平方根} ^√Var(X)^を、 ^と呼ぶ。

分散の別表現：_E(X)が定数であることに注意すれば、期待値の公式より Var(X) = E^X²− 2XE(X) + E(X)²

= E(X²) − 2E(X)E(X) + E(X)²= ^. ⁽¹⁶⁾

⊲ ∴(15)^式or (16)式、計算しやすい方を使えば良い。

分散_Var(·)の公式：（証明_⇒今回の補足資料。）定数_cについて、

1. ^。

2. ^。

3. ^要注意： ^。

2.3 期待値・分散の補足

_Remark：確率分布 _f_(x)の「見た目」と期待値_E(X)・分散_Var(X)の関係

⊲ ^図3^の f(x)^、g(y)^{は、二つの確率変数}X^、Y^の分布。

⊲ ^図3A：期待値が大きいほど分布の重心が右へ。（_⇔大きな値が出やすい。）

(6)

⊲ ^図3B：分散が大きいほど分布が広がる。（_⇔平均から外れた値が出やすい。）

確率変数の標準化：確率変数_Xから期待値_E(X)を引き、標準偏差

√Var(X)^{で割ることで} できる新たな確率変数

Z = ^{X − E(X)}_√

Var(X) ⁽¹⁷⁾

を、された確率変数と呼ぶ。

⊲ ^{重要な性質：}Xがどんな確率変数であっても、標準化すると期待値・分散は

E(Z) = ^, Var(Z) = ^. ⁽¹⁸⁾

（証明_⇒今回の復習問題。）

⊲ 標準化は、統計学・計量経済学で頻繁に使われる。

注意：記述統計（講義ノート_#01）の諸概念と、確率論の諸概念を混同しないこと。

記述統計確率論

代表的な値標本の平均_X¯ 確率変数の期待値_E(X) バラつきを測る標本の分散_s²

X ^{確率変数の分散}^Var(X)

まとめと復習問題

今回のまとめ

確率変数（連続型・離散型）と確率分布。

確率変数の期待値、分散と標準化。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. ^確率変数X^の分散Var(X)^は、Xのどんな特徴を測るパラメータか？

2. ^{標準化された確率変数}Z^{について、}(18)^式の_{E(Z) = 0}^{を示せ。ヒント：}(17)^式のE(X)^、

√ 1

Var(X)が定数であることに注意し、両辺の期待値をとる。期待値の公式に注目。余裕が

あれば_{Var(Z) = 1}も確認せよ。

確率論 計量経済学 鹿野研究室 note02

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

前回の復習

今回学ぶこと

1 確率変数と確率分布

1.1 確率変数

1.2 確率分布

R

S

1.3 連続型の確率分布：確率密度関数

2 期待値と分散

2.1 期待値

2.2 分散

2.3 期待値・分散の補足

まとめと復習問題

今回のまとめ

復習問題

確率論計量経済学鹿野研究室 note02

2 _{期待値と分散}