• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide03

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide03"

Copied!
31
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#03

確率論:確率変数と確率分布 (2)

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 正規分布

2 二次元の確率変数

テキスト・参考書。

テキスト:鹿野繁樹 [2015]、第 2.3 章・第 2.4 章。 参考書:松原望 et al. [1991]。

前回の復習

1 確率変数とその分布 2 期待値と分散

(3)

Section 1

正規分布

(4)

正規分布の特徴

連続型確率変数X の確率Pr(a ≤ X ≤ b) =abf(x)dx が密度関数 f(x) = 1

2πσ2e

1

2σ2(x−µ)

2, −∞ < x < ∞ (1)

で与えられるとき、このf(x) を正規分布と呼ぶ。 統計学で最も重要な確率分布のひとつ。

π≈ 3.14 は円周率、e ≈ 2.72 は自然対数の低(ネイピア数)。 いずれも定数。

µ(ミュー)と σ2(シグマ2 乗)は、期待値と分散。

(5)

公式 1 ( 正規確率変数の期待値・分散 )

X が正規分布に従うならば、その期待値・分散は

E(X) = µ, Var(X) = σ2. (2) 証明:松原 望 et al. [1991] 参照.

正規分布(normal distribution)の姿は µ と σ2の値で決まる ので、

X ∼ N(µ, σ2) と略記。

図1:異なる正規分布 N(−3, 1.52)、N(5, 22)、N(15, 12)。

(6)

−10 −5 0 5 10 15 20

0.00.10.20.30.4

f(x)

N(3, 1.52)

N(5, 22)

N(15, 12)

1 : 期待値µ・分散σ2が異なるさまざまな正規分布N(µ, σ2)

(7)

(1) 式を暗記するより、次の点をグラフで確認することが重要!

Remark 1

正規分布N(µ, σ2) は、期待値 µ を中心に左右対称の釣鐘型。 期待値µ が大きいほど,分布の中心は右にシフト。 分散σ2が大きいほど,分布の散らばりが拡大。

(8)

正規分布の基本性質。

公式 2

X ∼ N(µ, σ2) ならば、その一次式 Y = a + bX の分布は

Y ∼ N(a + bµ, b2σ2). (3) 証明:松原 望 et al. [1991] 参照.

X ∼ N(µ, σ2) を一次変換すると、

期待値はµ→ a + bµ、分散はσ2→ b2σ2に変換。 一方、分布型は正規分布(左右対称・釣鐘型)のまま!

例:X ∼ N(0, 22) を Y = 3 + X に変換 ⇒3 だけ分布の中心が 右にシフトしY ∼ N(3, 22)。

注意:X が正規分布でなくとも、一般的にE(Y ) = a + bµ、 Var(Y ) = b2σ2(講義ノート#02)。

(9)

標準正規分布と「 ±2 の壁」

正規確率変数X ∼ N(µ, σ2) を標準化:

Z = X− E(X)

Var(X) =

X− µ σ .

標準化=「まず期待値を引き、次いで標準偏差で割る」。

標準化によりX は、期待値がゼロ、分散が1 の特殊な正規分 布、標準正規分布Z ∼ N(0, 1) となる。

(10)

公式 3 ( 正規分布の標準化 )

X ∼ N(µ, σ2) −−−→標準化 Z = X− µ

σ ∼ N(0, 1). (4) 証明:Z = −µ

σ + 1

σX = a + bX と置けば,X の一次式なので,公 式(3) より

Z ∼ N



µσ +σ1µ

=0

, 1 σ2σ

2

=1



−−→整理 Z ∼ N(0, 1).

X から期待値 µ を引くと,正規分布の重心がゼロに横滑り。 次いで標準偏差(分散の平方根)σ で割り、分布の広がり具 合を丁度1 に調整。

(11)

標準正規分の密度関数は,(1) 式で µ = 0,σ2 = 1 と置いた φ(z) = 1

e

1

2z2. (5)

⇒ Z ∼ N(0, 1),Z ∼ φ(z) などと略記。(φ は「ファイ」または

「フィー」。)

図2 A:N(0, 1) のグラフ。

Z が−2 を下回る確率、+2 を上回る確率は、非常に小さい。

Z の尺度で見れば、±2 は大きな「壁」!

Remark 2

±2 の壁:Z ∼ N(0, 1) は,およそ ±2 の範囲までの確率をカバー。

∴Z のスケールで考えると、−2 以下・+2 以上という実現値は極 端に小さな・大きな値。めったに起こらない。

(12)

−3 −2 −1 0 1 2 3

0.00.10.20.30.4

z

f(x)

A: Z ~ N(0,1)

0.00.10.20.30.4

z

f(x)

0 z=1.96 α=0.025 1−α

α B: α=Pr(Z>1.96)=0.025

2 : 標準正規分布Z ∼ N(0, 1)

(13)

Pr(Z < z) Pr(Z > z) 確率 0.01 0.025 0.05 0.05 0.025 0.01 臨界値z −2.326 −1.960 −1.645 1.645 1.960 2.326

分布の左端 → 分布の右端

1 : Z ∼ N(0, 1)の臨界値

表1:Z が定数 z を下回る確率 Pr(Z < z)・上回る確率 Pr(Z > z) を、正確に計算⇒ Z の 5%、2.5%、1%臨界値。

図2 B:Z の右端 2.5%臨界値、z = 1.960 ≈ 2 を図示。斜線部 α の面積が確率Pr(Z > 1.960) = 0.025 に相当。

Z の対称性⇒ Pr(Z < −1.960) = Pr(Z > 1.960) = 0.025。

(14)

標準正規分布の使い方

X を Z に標準化する理由:X の実現値 xを観測したとき、その xが「十分大きいか、それともありふれた値か」を客観的に判断。

Example 1

ある湖に住む魚の体長(cm)の分布は X ∼ N(20, 52)。A さんは 32cm の魚を釣り上げた。⇒ X = 32 を標準化し、Z ∼ N(0, 1) のス ケールに直せば

z = 32 − 20

5 = 2.4.

一方表1の Z の臨界値より Pr(Z > 2.326) = 0.01。∴ この魚は 1%以下の確率でしかお目にかかれない、非常に大きな魚。

(15)

このコースでは、図2 B で見た Z の 2.5%臨界値 z = 1.960 ≈ 2 を

「十分大きな値」と置く。(この値は、成人男性の身長187cm ぐら いに相当。)

Remark 3

X ∼ N(µ, σ2) を標準化する目的:実現値 X = xを、Z = zのス ケールに換算して「大小」の判断。

1 |z| > 1.960 → xは極端に大きい(極端に小さい)。

2 |z| < 1.960 → xは大きくも小さくもない。

(16)

Section 2

二次元の確率変数

(17)

結合分布

複数の確率変数を、同時に扱うには?結合分布(同時分布)。 表2:ある二つの確率変数 X と Y は、実現値 x = {1, 3, 5} と y= {2, 4, 6} が起こり得るとする。

さらに実現値のペアの確率が、表2で与えられるものと仮定。 例えば「X = 1で、かつY = 6」の確率(結合確率)は、表よ Pr(X = 1, Y = 6) = 0.1

h(x, y) Y = 2 Y = 4 Y = 6 X = 1 0.2 0.1 0.1 X = 3 0.1 0.15 0.1 X = 5 0 0.1 0.15

2 : 結合分布の例

(18)

二つの確率変数(X, Y ) について、実現値のペアを (xj, ys) と表せ ば、その結合分布は一般的に

Pr(X = xj, Y = ys) = h(xj, ys). (6)

一次元の確率分布f(x) 同様、h(xj, ys) が確率であるためには、 h(xj, ys) ≥ 0,



j



s

h(xj, ys) = 1. (7)

表2はこれらの性質を満たす。 注意:二重和「



j



s」は,表2の全セル(全組み合わせ)の 和をとる作業の、数式表現。

(19)

X と Y の和・積の期待値は、 E(X + Y ) =

j



s

(xj + ys)h(xj, ys), (8) E(XY ) = 

j



s

xjysh(xj, ys). (9)

X+ Y や XY をひとつの確率変数と考えれば、一次元の期待 値と同じこと。

Example 2

表2の結合分布について,和の期待値 E(X + Y ) は E(X + Y ) = (1 + 2)h(1, 2) + (1 + 4)h(1, 4) + · · ·

+ (5 + 6)h(5, 6) = 6.8.

(20)

結合分布h(x, y) と、X 単体の分布 f (x) との関係は?⇒ 表 2から、

Y が2 だろうが 4 だろうが 6 だろうが,とにかく Pr(X = x) とな る確率」を求めると、

f(x) =

⎪⎨

⎪⎩

0.2 + 0.1 + 0.1 = 0.4 (x = 1) 0.1 + 0.15 + 0.1 = 0.35 (x = 3) 0 + 0.1 + 0.15 = 0.25 (x = 5) .

これをX の周辺分布と呼ぶ。 Y の周辺分布も同様に、

g(y) =

⎪⎨

⎪⎩

0.3 (y = 2) 0.35 (y = 4) 0.35 (y = 6) .

f(x)、g(y) から、X と Y それぞれの期待値 E(X)、E(Y ) が定 義できる。

(21)

E(X + Y ) や E(XY ) と、E(X)、E(Y ) の関係は?

公式 4 ( 確率変数の和・積の期待値 )

E(X + Y ) = E(X) + E(Y ), (10) 特殊ケースを除きE(XY ) = E(X)E(Y ). (11) 証明:テキストp35 参照。

(10) 式は期待値演算の「分配法則」。

(11) 式に注意。一般に、「積の期待値」と「期待値の積」は異 なる。

(22)

共分散と和の分散

二つの確率変数(X, Y ) の共分散(covariance)

Cov(X, Y ) = E [(X − E(X))(Y − E(Y ))] (12) は、(X, Y ) の共変動を測る指標。

期待値E(X)、E(Y ) を軸に、実現値 (xj, ys) が 同方向に動けば(xj − E(X))(ys− E(Y )) > 0 逆方向に動けば(xj − E(X))(ys− E(Y )) < 0

⇒ 期待値をとり Cov(X, Y ) > 0 なら正、Cov(X, Y ) < 0 なら 負の相関。

∴ データの共分散sXY(講義ノート#01)と同じ考え方。

(23)

公式 5 ( 分散の別表現 )

Cov(X, Y ) = E(XY ) − E(X)E(Y ). (13) 証明:分散の別表現(講義ノート#02)の証明手順を参照.

定義(12) と比較し、扱いやすい方を用いればよい。

(24)

確率変数の和X+ Y の分散は、次式で定義される。

Var(X + Y ) = E [(X + Y ) − E(X + Y )]2 . (14) X+ Y をひとつの確率変数と考えれば、一変数の分散と同じこと。

公式 6 ( 確率変数の和の分散 )

Var(X + Y ) = Var(X) + 2Cov(X, Y ) + Var(Y )

= Var(X) + Var(Y ). (15)

∴ 和の分散は、共分散と密接な関係。

Cov(X, Y ) = 0 という特殊な状況でない限り、「和の分散」と

「分散の和」は異なる。

(25)

証明:(14) 式右辺を展開・整理すれば Var(X + Y )

= E(X − E(X) + Y − E(Y ))2

= E(X − E(X))2+ 2(X − E(X))(Y − E(Y )) + (Y − E(Y ))2

= E(X − E(X))2

=Var(X)

+2 E [(X − E(X))(Y − E(Y ))]

=Cov(X,Y )

+ E(Y − E(Y ))2

=Var(Y )

= Var(X) + 2Cov(X, Y ) + Var(Y ).

(26)

確率変数の独立性

二つの確率変数(X, Y ) の全ての実現値に関し h(x, y)

=Pr(X=x,Y =y)

= f(x) × g(y)

=Pr(X=x)×Pr(Y =y)

(16)

が成立するとき、X と Y は互いに独立。

より一般的には、二つの事象A と B の結合確率が Pr(A, B) = Pr(A) Pr(B) のとき、両者は互いに独立。

(27)

確率変数が独立な場合だけ成立する,非常に重要な性質!

公式 7 ( 独立な確率変数の性質 )

(X, Y ) が独立ならば、

E(XY ) = E(X)E(Y ), (17) Cov(X, Y ) = 0 (∴ 無相関), (18) Var(X + Y ) = Var(X) + Var(Y ). (19) 証明:(17) 式の証明はテキスト p35 参照。(17) 式を (13) 式に代入 して(18) 式を、(18) 式を (15) 式に代入して (19) 式を得る。

(X, Y ) が独立ならば、E(XY ) や Var(X + Y ) の計算がとても 簡単に。

(28)

Remark 4

表3:(X, Y ) が独立でないケースと、独立なケースを比較。

独立でない 独立

定義 h(x, y) = f(x)g(y) h(x, y) = f (x)g(y)

⇓ ⇓

XY の期待値 E(XY ) = E(X)E(Y ) E(XY ) = E(X)E(Y )

⇓ ⇓

共分散 Cov(X, Y ) = E(XY ) Cov(X, Y ) = 0

−E(X)E(Y ) = 0

⇓ ⇓

X+ Y の分散 Var(X + Y ) = Var(X) Var(X + Y ) +2Cov(X, Y ) + Var(Y ) = Var(X) + Var(Y ) X+ Y の期待値 いつでもE(X + Y ) = E(X) + E(Y )

3 : 確率変数(X, Y )の独立性

(29)

最後に、独立な正規確率変数に関し成立する重要な性質、正規分 布の再生性。

公式 8 ( 正規分布の再生性 )

二つの確率変数(X, Y ) が互いに独立で、かつ X ∼ N(µX, σ2X)、

Y ∼ N(µY, σY2) ならば、和 X + Y の分布は

X+ Y ∼ N(µX + µY, σ2X + σY2). (20)

証明:松原 望 et al. [1991] 参照.

∴ 正規確率変数を足し合わせると、その和もやはり正規分布 に従う。

(30)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 テキスト第2 章復習問題 2.5。

2 確率変数(X, Y ) について、次の結合分布を考える。 h(x, y) Y = 0 Y = 1

X = 0 0.2 0.2 X = 1 0.2 0.4

和の期待値E(X + Y ) と、積の期待値 E(XY ) をそれぞれ求め よ。(テキスト第2 章復習問題 2.6 の類題。)

(31)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.

表 3:(X, Y ) が独立でないケースと、独立なケースを比較。

参照

関連したドキュメント

URL http://doi.org/10.20561/00041066.. も,並行市場プレミアムの高さが目立つ (注3) 。

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC

都市計画分野において余暇活動を扱った既存研究とし て,椎野ら 2)

荒神衣美(こうじんえみ) アジア経済研究所 地域研究センター研究員。ベトナム の農業・農村発展について研究しており、

脚注 [1] 一橋大学イノベーション研究センター(編) “イノベーション・マネジメント入門”, 日本経済新聞出版社 [2] Henry Chesbrough

内的効果 生産性の向上 欠勤率の低下、プレゼンティーイズムの解消 休業率 内的効果 モチベーションUP 家族も含め忠誠心と士気があがる

 当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文