• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide02

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide02"

Copied!
26
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#02

確率論:確率変数と確率分布 (1)

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 確率変数とその分布

2 期待値と分散

テキスト・参考書。

テキスト:鹿野繁樹 [2015]、第 2.1 章・第 2.2 章。 参考書:松原望 et al. [1991]。

前回の復習

1 計量経済学の役割

(3)

Section 1

確率変数とその分布

(4)

なぜ確率論が必要か? :データの偶然性

データは、観測する前の段階では不確定。

例:中古マンションデータ(前回より再掲)。観測の事前に、 いかなる値が並ぶかは不明。⇒ 平均や標準偏差もまた、偶然 の産物。

統計は(イメージに反し)不安定な数字!

id 価格 最寄駅所要時間 築年数 面積 ワンルーム

1 620 5 26 15 1

2 3700 3 11 50 0

3 3700 12 12 55 0

...

194 3400 8 24 60 0

(5)

統計を含め、ランダムな事象を分析・制御する科学が確率論。 六面体のサイコロを考える。事前に何が出るかは不明。 ... しかし、事前に次のことは確定。

1 起こり得る値は{1, 2, 3, 4, 5, 6}

2 それぞれ均等に起こる(等確率 1

6

∴ 不確定なサイコロの挙動に、一定の秩序・法則性!

(6)

離散型の確率変数

サイコロのように、起こり得る値それぞれに確率が明示された変 数を確率変数と呼び、大文字X で表記。

起こり得る候補の値、実現値は小文字{x1, x2, . . . , xk} で表 す。(サイコロなら{1, 2, 3, 4, 5, 6})。

ある値X = xjが起こる確率(probability)を

Pr(X = xj) (1) と略記。

このX は離散型。飛び飛びの、有限個の実現値だけをとる。

(7)

実現値{x1, x2, . . . , xk} とその確率 Pr(X = xj) の対応関係を数式 で整理⇒ X の確率分布

Pr(X = xj) = f (xj), j = 1, 2, . . . , k. (2)

確率分布が確率であるために、次の条件を満たすとする。 確率は非負: Pr(X = xj) = f (xj) ≥ 0, (3) 確率の和は1:

k



j=1

Pr(X = xj) =

k



j=1

f (xj) = 1. (4)

(8)

Example 1

図1A:ゆがみのないサイコロ X の確率分布は Pr(X = x) = f (x) = 1

6 (x = 1, 2, . . . , 6).

サイコロの「2」の目を消し、「5」と上書き。⇒ 細工されたサ イコロX の実現値は {1, 5, 3, 4, 5, 6}。確率分布は

Pr(X = x) = f (x) =

1

6 (x = 1, 3, 4, 6)

1

3 (x = 5)

.

1B 参照。

(9)

1 2 3 4 5 6 x

Pr(X=x) = f(x) 0.00.10.20.30.4

A

1 2 3 4 5 6

x Pr(X=x) = f(x) 0.00.10.20.30.4

B

1 : ゆがみのないサイコロと、細工されたサイコロの確率分布

(10)

連続型の確率変数と密度関数

実現値が連続的な数の集合で与えられる確率変数を、連続型と 呼ぶ。

例:「1 キロの距離を歩いているうちに指輪を落とした」状況。 指輪が落ちた地点を確率変数X と置けば、X の実現値 x の集 合は、0 < x ≤ 1。

... 実現値が無限に存在 ⇒ 離散型のように番号を付け実現値を 区別するのは不可能。

(11)

連続型のX が a から b の値を取る確率を、Pr(a ≤ X ≤ b) と置く。 この確率が、ある関数f (x) の定積分

Pr(a ≤ X ≤ b) =

 b a

f (x)dx, (ただし xmin < a ≤ b < xmax) (5)

から得られるとき、f (x) を X の確率密度関数(密度関数)と 呼ぶ。

xminxmaxは、実現値x の最小値と最大値。

連続型は実現値が無現に存在、列挙できない。⇒ 個々の実現 値に確率を与えるのを諦め、区間の確率だけを考える。 (5) 式が、確率として意味をなすための条件。

f (x) ≥ 0, (6)

 xmax

xmin

f (x)dx = 1. (7)

(12)

条件(6)、(7) は、何を意味する?

図2A は、任意の密度関数 f (x) のグラフ。次の点に着目。 条件(6)より、f(x)は必ず横軸より上の領域に描かれる。 条件(7)より、曲線f(x)による山型図形の面積は1 (5)式左辺の定積分は、斜線部Rに対応。

∴(5) 式は、「山型に占める R の割合」で確率 Pr(a ≤ X ≤ b) を表現。

この定義に従えば、必ず0 ≤ Pr(a ≤ X ≤ b) ≤ 1を満たす。 X がある値 c を上回る確率 Pr(X > c) は?⇒f (x) の右端面積

(図2B の斜線部 S)。

(13)

0.000.040.08

f(x)

a b

R

A

0.000.040.08

f(x)

c

S

B

2 : 密度関数の面積と確率Pr(a < X < b)Pr(X > c)の対応関係

(14)

Remark 1

密度関数f (x) のピーク辺りの x が、X の実現値として出やすい. 確率Pr(a ≤ X ≤ b) ⇔ 2A の面積 R.

確率Pr(X ≥ c) 図2B の面積 S(分布右端).

正確に連続型の確率Pr(a ≤ X ≤ b) を求めるには、密度関数 f (x) の積分計算を要する。

しかしグラフを見るときは、 f (x) の高さを「x の出やすさ ≈ 確率」とみなしてOK。

(15)

Section 2

期待値と分散

(16)

期待値

さまざまな実現値{x1, x2, . . . , xk} をとり得る X について、事前に いくらぐらいの値を「期待」できるか?⇒ 次式を X の期待値

(expectation)と呼ぶ。

E(X) =

k



j=1

xjf (xj). (8)

上式右辺の和記号を展開すれば、確率分布の定義(2) 式より E(X) = x1f (x1) + x2f (x2) + · · · + xkf (xk)

= x1Pr(X = x1) + x2Pr(X = x2) + · · · + xkPr(X = xk). (9)

(17)

Remark 2

期待値E(X) は X の実現値 {x1, x2, . . . , xk} の、確率に基づく加重 平均。∴E(X) は X の実現値(結果)を代表する値。

一方、講義ノート#01・記述統計の標本平均 ¯X = n1  Xiは、

標本X1, X2, . . . , Xnの代表値。

連続型の期待値は、和記号を積分記号に置き換え E(X) =



x

xf (x)dx.



xは「X の実現値 x の範囲内で積分する」という略記。) 離散型で成立する性質は連続型でも成立。⇒ 連続型は省略。

(18)

Example 2

ゆがみの無いサイコロX の期待値は E(X) = 1 ·f (1)

=16

+2 · f (2)

=16

+ · · · + 6 · f (6)

=16

= 3.5.

よってサイコロを振る事前に、3.5 ぐらいの値が期待される。

(19)

確率変数X の、定数 a, b による一次式

Y = a + bX (10)

を考える。Y もまた、確率変数。⇒ Y の期待値は?

確率分布の条件式(4)、期待値の定義式 (8) に注意すれば E(a + bX) =(a + bxj)f (xj)

= af (xj)

=1

+bxjf (xj)

=E(X)

= a + bE(X).

注意:足し算の範囲が明確な場合は、和記号を「



」と略記。

(20)

公式 1 ( 期待値の演算ルール )

E(a + bX) = a + bE(X). (11) 証明:前段で証明済み.

例えば

E(3) = 3, E(−2X) = −2E(X). (12)

(21)

分散

確率変数X の分散(variance)

Var(X) = E(X − E(X))2 =(xj− E(X))2f (xj) (13)

は、X のバラつきを測る指標。

Var(X) は、各実現値 xjの、期待値からのズレ(xj − E(X))2 の加重平均。∴ 記述統計における、Xiの標本分散

s2X = n−11 (Xi− ¯X)2と同じ解釈。

分散の正の平方根 Var(X)を、X の標準偏差と呼ぶ。

Remark 3

分散Var(X) は X の実現値 {x1, x2, . . . , xk} の、期待値 E(X) を軸 とする平均的なバラつき。

(22)

Example 3

サイコロX の期待値は E(X) = 3.5 ⇒ X の分散は Var(X) = (1 − 3.5)2· f (1) + (2 − 3.5)2· f (2)

+ · · · + (6 − 3.5)2· f (6)

= 17.5

6 ≈ 5.83. (14)

また標準偏差は Var(X) ≈ 1.71

(23)

分散は、もう一つの計算法がある。

公式 2 ( 分散の別表現 )

Var(X) = E(X2) − E(X)2. (15)

ここでE(X2) = x2jf (x)。

証明:分散の定義式(13) 左辺を展開すると Var(X) = EX2− 2XE(X) + E(X)2

= E(X2) − 2E(X)E(X) + E(X)2 = E(X2) − E(X)2. (16) 上式の展開で、期待値E(X) は定数である点に注意。∴ 公式 (11) よりE(E(X)) = E(X)。

(24)

X の一次式 Y = a + bX で作られる、Y の分散は?

公式 3 ( 分散の演算ルール )

Var(a + bX) = b2Var(X). (17) 証明:テキストp34-35 参照。

この公式より、定数a の分散は Var(a) = 0。... 動かない定数 a の分散がゼロになるのは当然。例えば

Var(−5) = 0, Var(10 + X) = Var(X). (18) X の係数 b がその 2 乗に。例えば

Var(−4X) = 16Var(X). (19)

(25)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 テキスト第2 章復習問題 2.1。

2 テキスト第2 章復習問題 2.3。

3 ある確率変数X について、E(X) = 5、Var(X) = 2 であると する。E(X/2) と Var(−2X + 100) を求めよ。(テキスト第 2 章復習問題2.4 の類題。)

(26)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.

参照

関連したドキュメント

専攻の枠を越えて自由な教育と研究を行える よう,教官は自然科学研究科棟に居住して学

・ 継続企業の前提に関する事項について、重要な疑義を生じさせるような事象又は状況に関して重要な不確実性が認め

◼ 自社で営む事業が複数ある場合は、経済的指標 (※1) や区分計測 (※2)

・ 継続企業の前提に関する事項について、重要な疑義を生じさせるような事象又は状況に関して重要な不確実性が認

事前調査を行う者の要件の新設 ■

統制の意図がない 確信と十分に練られた計画によっ (逆に十分に統制の取れた犯 て性犯罪に至る 行をする)... 低リスク

分配関数に関する古典統計力学の近似 注: ややまどろっこしいが、基本的な考え方は、q-p 空間において、 ①エネルギー En を取る量子状態

・本計画は都市計画に関する基本的な方 針を定めるもので、各事業の具体的な