『新しい計量経済学』鹿野研究室 slide02

(1)

計量経済学_#02

確率論：確率変数と確率分布 ₍₁₎

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 確率変数とその分布

2 期待値と分散

テキスト・参考書。

テキスト：鹿野繁樹 [2015]、第 2.1 章・第 2.2 章。参考書：松原望 et al. [1991]。

前回の復習

1 _{計量経済学の役割}

(3)

Section 1 確率変数とその分布

(4)

なぜ確率論が必要か？：データの偶然性

データは、観測する前の段階では不確定。

例：中古マンションデータ（前回より再掲）。観測の事前に、いかなる値が並ぶかは不明。⇒ 平均や標準偏差もまた、偶然の産物。

統計は（イメージに反し）不安定な数字！

id ^価格 ^{最寄駅所要時間} ^築年数 ^面積 ^{ワンルーム}

1 620 5 26 15 1

2 3700 3 11 50 0

3 3700 12 12 55 0

...

194 3400 8 24 60 0

(5)

統計を含め、ランダムな事象を分析・制御する科学が確率論。六面体のサイコロを考える。事前に何が出るかは不明。 ... しかし、事前に次のことは確定。

1 起こり得る値は{1, 2, 3, 4, 5, 6}^。

2 それぞれ均等に起こる（等確率 ¹

6^）^。

∴ 不確定なサイコロの挙動に、一定の秩序・法則性！

(6)

離散型の確率変数

サイコロのように、起こり得る値それぞれに確率が明示された変数を確率変数と呼び、大文字_{X で表記。}

起こり得る候補の値、実現値は小文字_{x₁_{, x}₂, . . . , xk} で表す。（サイコロなら{1, 2, 3, 4, 5, 6}）。

ある値_{X = x}_jが起こる確率（probability）を

Pr(X = xj) (1) と略記。

この_{X は}離散型。飛び飛びの、有限個の実現値だけをとる。

(7)

実現値_{x₁_{, x}₂, . . . , xk} とその確率 Pr(X = xj) の対応関係を数式で整理_{⇒ X の}確率分布

Pr(X = xj) = f (xj), j = 1, 2, . . . , k. (2)

確率分布が確率であるために、次の条件を満たすとする。確率は非負： _{Pr(X = x}_j_{) = f (x}_j_{) ≥ 0,} ₍₃₎ 確率の和は_1：

k

j=1

Pr(X = xj) =

k

j=1

f (xj) = 1. (4)

(8)

Example 1

図1A：ゆがみのないサイコロ X の確率分布は Pr(X = x) = f (x) = ¹

6 (x = 1, 2, . . . , 6).

サイコロの「2」の目を消し、「5」と上書き。⇒ 細工されたサイコロX の実現値は {1, 5, 3, 4, 5, 6}。確率分布は

Pr(X = x) = f (x) =

1

6 (x = 1, 3, 4, 6)

1

3 ^{(x = 5)}

.

図_{1B 参照。}

(9)

1 2 3 4 5 6 x

Pr(X=x) = f(x) 0.00.10.20.30.4

A

1 2 3 4 5 6

x Pr(X=x) = f(x) 0.00.10.20.30.4

B

図 _{1 :} ゆがみのないサイコロと、細工されたサイコロの確率分布

(10)

連続型の確率変数と密度関数

実現値が連続的な数の集合で与えられる確率変数を、連続型と呼ぶ。

例：「1 キロの距離を歩いているうちに指輪を落とした」状況。指輪が落ちた地点を確率変数X と置けば、X の実現値 x の集合は、0 < x ≤ 1。

... 実現値が無限に存在 ⇒ 離散型のように番号を付け実現値を区別するのは不可能。

(11)

連続型のX が a から b の値を取る確率を、Pr(a ≤ X ≤ b) と置く。この確率が、ある関数_{f (x) の定積分}

Pr(a ≤ X ≤ b) =

b a

f (x)dx, (ただし xmin < a ≤ b < xmax) (5)

から得られるとき、f (x) を X の確率密度関数（密度関数）と呼ぶ。

xmin^とxmax^{は、実現値}x の最小値と最大値。

連続型は実現値が無現に存在、列挙できない。_{⇒ 個々の実現} 値に確率を与えるのを諦め、区間の確率だけを考える。 (5) 式が、確率として意味をなすための条件。

f (x) ≥ 0, (6)

xmax

xmin

f (x)dx = 1. (7)

(12)

条件(6)、(7) は、何を意味する？

図2A は、任意の密度関数 f (x) のグラフ。次の点に着目。条件₍₆₎より、_f_(x)は必ず横軸より上の領域に描かれる。条件₍₇₎より、曲線_f_(x)による山型図形の面積は₁。 (5)式左辺の定積分は、斜線部_Rに対応。

∴(5) 式は、「山型に占める R の割合」で確率 Pr(a ≤ X ≤ b) を表現。

この定義に従えば、必ず0 ≤ Pr(a ≤ X ≤ b) ≤ 1^{を満たす。} X がある値 c を上回る確率 Pr(X > c) は？⇒f (x) の右端面積

（図2B の斜線部 S）。

(13)

0.000.040.08

f(x)

a b

R

A

0.000.040.08

f(x)

c

S

B

図 _{2 :} 密度関数の面積と確率Pr(a < X < b)^、Pr(X > c)^{の対応関係}

(14)

Remark 1

密度関数f (x) のピーク辺りの x が、X の実現値として出やすい．確率Pr(a ≤ X ≤ b) ⇔ ^図2A の面積 R．

確率_{Pr(X ≥ c)} _⇔ 図2B の面積 S（分布右端）．

正確に連続型の確率Pr(a ≤ X ≤ b) を求めるには、密度関数 f (x) の積分計算を要する。

しかしグラフを見るときは、 f (x) の高さを「x の出やすさ ≈ 確率」とみなして_OK。

(15)

Section 2 期待値と分散

(16)

期待値

さまざまな実現値_{x₁_{, x}₂, . . . , xk} をとり得る X について、事前にいくらぐらいの値を「期待」できるか？_{⇒ 次式を X の}期待値

（expectation）と呼ぶ。

E(X) =

k

j=1

xjf (xj). (8)

上式右辺の和記号を展開すれば、確率分布の定義_{(2) 式より} E(X) = x1f (x1) + x2f (x2) + · · · + xkf (xk)

= x1Pr(X = x1) + x2Pr(X = x2) + · · · + xkPr(X = xk). (9)

(17)

Remark 2

期待値E(X) は X の実現値 {x₁, x₂, . . . , xk} の、確率に基づく加重平均。∴E(X) は X の実現値（結果）を代表する値。

一方、講義ノート#01・記述統計の標本平均 ¯X = _n¹ Xi^は、

標本_X₁_{, X}₂, . . . , Xn^{の代表値。}

連続型の期待値は、和記号を積分記号に置き換え E(X) =

x

xf (x)dx.

（

x^は「X の実現値 x の範囲内で積分する」という略記。）離散型で成立する性質は連続型でも成立。_{⇒ 連続型は省略。}

(18)

Example 2

ゆがみの無いサイコロ_{X の期待値は} E(X) = 1 ·f (1)

=¹₆

+2 · f (2)

=¹₆

+ · · · + 6 · f (6)

=¹₆

= 3.5.

よってサイコロを振る事前に、3.5 ぐらいの値が期待される。

(19)

確率変数X の、定数 a, b による一次式

Y = a + bX (10)

を考える。Y もまた、確率変数。⇒ Y の期待値は？

確率分布の条件式(4)、期待値の定義式 (8) に注意すれば E(a + bX) =(a + bxj)f (xj)

= af (xj)

=1

+bxjf (xj)

=E(X)

= a + bE(X).

注意：足し算の範囲が明確な場合は、和記号を「

」と略記。

(20)

公式 _{1 (} 期待値の演算ルール ₎

E(a + bX) = a + bE(X). (11) 証明：前段で証明済み．

例えば

E(3) = 3, E(−2X) = −2E(X). (12)

(21)

分散

確率変数_{X の}分散（_variance）

Var(X) = E(X − E(X))² =(xj− E(X))²f (xj) (13)

は、X のバラつきを測る指標。

Var(X) は、各実現値 xj^{の、期待値からのズレ}(xj − E(X))² の加重平均。∴ 記述統計における、_X_iの標本分散

s²_X = _n−1¹ (Xi− ¯X)²^{と同じ解釈。}

分散の正の平方根_Var(X)を、X の標準偏差と呼ぶ。

Remark 3

分散Var(X) は X の実現値 {x1, x2, . . . , xk} の、期待値 E(X) を軸とする平均的なバラつき。

(22)

Example 3

サイコロX の期待値は E(X) = 3.5 ⇒ X の分散は Var(X) = (1 − 3.5)²· f (1) + (2 − 3.5)²· f (2)

+ · · · + (6 − 3.5)²· f (6)

= ^17.5

6 ^{≈ 5.83.} ⁽¹⁴⁾

また標準偏差は Var(X) ≈ 1.71^。

(23)

分散は、もう一つの計算法がある。

公式 _{2 (} 分散の別表現 ₎

Var(X) = E(X²) − E(X)². (15)

ここで_E(X²_{) =}_x²_j_{f (x)。}

証明：分散の定義式(13) 左辺を展開すると Var(X) = EX²− 2XE(X) + E(X)²

= E(X²) − 2E(X)E(X) + E(X)² = E(X²) − E(X)². (16) 上式の展開で、期待値E(X) は定数である点に注意。∴ 公式 (11) よりE(E(X)) = E(X)。

(24)

X の一次式 Y = a + bX で作られる、Y の分散は？

公式 _{3 (} 分散の演算ルール ₎

Var(a + bX) = b²Var(X). (17) 証明：テキスト_{p34-35 参照。}

この公式より、定数a の分散は Var(a) = 0。... 動かない定数 a の分散がゼロになるのは当然。例えば

Var(−5) = 0, Var(10 + X) = Var(X). (18) X の係数 b がその 2 乗に。例えば

Var(−4X) = 16Var(X). (19)

(25)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _{テキスト第}2 章復習問題 2.1。

2 _{テキスト第}2 章復習問題 2.3。

3 _{ある確率変数}X について、E(X) = 5、Var(X) = 2 であるとする。E(X/2) と Var(−2X + 100) を求めよ。（テキスト第 2 章復習問題_{2.4 の類題。）}

(26)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

松原望, 縄田和満, and 中井検裕. 統計学入門. 東京大学出版会, 1991.

『新しい計量経済学』 鹿野研究室 slide02

確率論：確率変数と確率分布 (1)

Outline

前回の復習

Section 1

確率変数とその分布

なぜ確率論が必要か？ ：データの偶然性