• 検索結果がありません。

確率論 計量経済学 鹿野研究室 note02

N/A
N/A
Protected

Academic year: 2018

シェア "確率論 計量経済学 鹿野研究室 note02"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2013 年度後期

はじめに

前回の復習

 計量経済学とは何か ?

 基本概念(和記号、記述統計)の復習。

今回学ぶこと

 確率変数と確率分布。

 期待値、分散と標準化。

 テキスト該当箇所 :付録A1∼A3章。東大出版会(1991) も参照。

1 確率変数と確率分布

1.1 確率変数

 なぜ統計学・計量経済学で確率論が必要か ?データ分析の結果は、 偶然性を伴う。

⊲ 理由:分析者の取得するデータ (標本)自体が、ランダムであるため。

⊲ ∴確率論に基づき、「データを上手く使う方法=精度の高い分析方法」 をデザイン。

⊲ 確率論=確率変数と確率分布を使って 「偶然」を制御する技術。

 確率変数:起こり得る値 (あるいは区間) に確率が与えられた変数を、 と 呼ぶ。

確率変数を大文字Xで表し、Xが任意の値 x(実現値と呼ぶ) をとる確率を

Pr(X = x) (1)

と表記。同様に、a < X < bとなる確率をPr(a < X < b)と表記。a, bは定数。

 例:サイコロをXと置く。

Xの実現値はx = 1, 2, . . . , 6。サイコロに歪みが無ければ、 それぞれの確率は Pr(X = x) = 1

6, x = 1, 2, . . . , 6. (2)

1

(2)

1 2 3 4 5 6 x

Pr(X=x)=f(x) 0.00.10.20.30.4

A:サイコロ

1 2 3 4 5 6

x Pr(X=x)=f(x) 0.00.10.20.30.4

B:細工されたサイコロ

1:サイコロの確率分布

 Remark:確率変数のタイプ

⊲ 確率変数=実現値ひとつひとつに番号をふり、数え上げることが出来る 確率変数。例:サイコロ。

⊲ 確率変数=測定を厳密にすると実現値が無限に存在し、 番号がふれない 確率変数。長さ、重さ、貨幣価値などの定量的な現象。

 例:円周1メートルのルーレットを回し、 針がどこに止まるか ?連続型確率変数X

実現値は開閉区間(0, 1]に無限に存在。0 < x ≤ 1。全て列挙はムリ。

⊲ 確率をどうやって与える ?確率密度関数。

1.2 確率分布

 確率分布:離散型確率変数Xが実現値xkをとる確率が

Pr(X = xk) = f (xk), k = 1, 2, 3, . . . , K. (3) で得られるとき、f(xk)を と呼ぶ。

確率分布 f(xk)をグラフに描く出やすい値・出にくい値が明確に。

⊲ f(x)の満たすべき性質 :確率の自然な性質に注意すれば

確率は非負: Pr(X = xk) = f (xk) ≥ 0, (4) 確率の和は1

K k=1

Pr(X = xk) =

K k=1

f(xk) = 1. (5)

 例:歪みの無いサイコロと細工されたサイコロ

1A:歪みの無いサイコロの確率分布は

f(1) = f (2) = · · · = f (6) = 16. (6)

(3)

0.000.040.08

f(x)

a b

R

A:Pr ( a<X<b)

0.000.040.08

f(x)

c

S

B:Pr ( X>c )

2:確率密度関数と確率の対応関係 (斜線部分)

1B:細工されたサイコロ。“2”の目を消し、“5”を上書き実現値は1, 5, 3, 4, 5, 6 確率分布は

f(xk) =

⎧⎪

⎪⎪

⎪⎪

⎪⎪

⎪⎪

⎪⎩

1

6 xk = 1, 3, 4, 6のとき) 0 xk = 2のとき)

1

3 xk = 5のとき)

. (7)

両ケースとも条件(4)、条件(5)を満たす。

1.3 連続型の確率分布:確率密度関数

 確率密度関数:連続型確率変数Xが区間[a, b]の値をとる確率Pr(a ≤ X ≤ b)が定積分 Pr(a ≤ X ≤ b) =

 b a

f(x)dx (8)

で得られるとき、f(x)Xの と呼ぶ。

⊲ 特定の実現値に確率を与えるのは諦めて、 代わりに区間の確率を与える。

密度関数 f(x)の満たすべき性質:離散型の条件(4)、条件(5)と類似。

f(xk) ≥ 0, (9)

Pr(−∞ ≤ X ≤ ∞) =



−∞

f(x) = 1. (10)

 Remark:密度関数と図の対応関係。 図2A

条件(4)(5) ⇒グラフ全体の面積= Pr(−∞ ≤ X ≤ ∞) = 1.

⊲ ∴(8)式は、グラフ全体に占める斜線部Rの で確率Pr(a ≤ X ≤ b)を表現。

⊲ 注意:確率計算以外の場合は、「密度関数の頂上のあたり=比較的出やすい値」 と見 て構わない。∴グラフの見方は離散型の分布と同じ。

(4)

 積分の性質に注目すると...

1. Pr(X = a) = Pr(a ≤ X ≤ a) =aa f(x)dx = F(a) − F(a) = 0連続型に限り、 Pr(a ≤ X ≤ b) = Pr(X = a)

 

=0

+ Pr(a < X < b) + Pr(X = b)  

=0

= . (11)

2. Pr(X > c) = Pr(c < X < ∞) =c f(x)dx Xが定数cを超える確率Pr(X > c)は、図 Bの斜線部S

2 期待値と分散

2.1 期待値

 確率変数Xの性質を、いくつかのパラメータ (定数値)で要約。

⊲ データを記述統計(講義ノート#01:標本平均や標本分散)でまとめるのと同じ発想。

⊲ 確率変数の特性パラメータ :期待値と分散。

 期待値:実現値x1,x2, . . . ,xKをとり得る離散型の確率変数Xについて、実現値の加重平均 E(X) = x1Pr(X = x1) + x2Pr(X = x2) + · · · + xKPr(X = xK)

= x1f(x1) + x2f(x2) + · · · + xKf(xK) =

K k=1

xkf(xk) (12)

を、Xの と呼ぶ。(Eはexpectationの略。

各実現値xkを確率Pr(X = xk) = f (xk)でウェイト付けして加重平均。 出やすいxkに 大きなウェイト。

⊲ ∴E(X)は、さまざまな値をとり得るXの代表的な値。

注意:Xは確率変数だが、E(X)は定数扱い。

 例:歪みの無いサイコロXの期待値は

E(X) = 1 · f (1) + 2 · f (2) + · · · + 6 · f (6) = 1

6· 21 = 3.5. (13)

⊲ 細工したサイコロの期待値も確認せよ。

 連続型の期待値:連続型確率変数Xについて、 E(X) =



−∞

x f(x)dx (14)

を、Xの期待値(平均値)と呼ぶ。

⊲ E(X)Xの代表的な値。意味は離散型と同じ。(積分=精密な足し算。)

 期待値E(·)の公式:(証明今回の補足資料。)定数cについて、

1.

2.

3.

(5)

0.00.10.20.30.4

f(x),g(y)

E( X) E( Y)

f g A:E( X) < E( Y)

0.00.10.20.30.4

f(x),g(y)

E( X) =E( Y)

f ( g( B:Var ( X) < Var ( Y)

3:期待値・分散の違いと分布の見た目

2.2 分散

 分散:確率変数Xについて、

Var(X) = E (X − E(X))2=

⎧⎪

⎪⎨

⎪⎪

(xk− E(X))2f(xk) (離散型の場合)

(x − E(X))2f(x)dx (連続型の場合) (15)

を、Xの と呼ぶ。(Varvarianceの略。)

各実現値xkの期待値E(X)からのズレ(xk− E(X))2を、加重平均。

⊲ ∴Var(X)は、Xの平均周りの散らばりを測る。Var(X)が大きい=変動が大きく不安定。

分散の平方根 Var(X)を、 と呼ぶ。

 分散の別表現:E(X)が定数であることに注意すれば、 期待値の公式より Var(X) = EX2− 2XE(X) + E(X)2

= E(X2) − 2E(X)E(X) + E(X)2= . (16)

⊲ ∴(15)or (16)式、計算しやすい方を使えば良い。

 分散Var(·)の公式:(証明今回の補足資料。) 定数cについて、

1.

2.

3. 要注意:

2.3 期待値・分散の補足

 Remark:確率分布 f(x)の「見た目」と期待値E(X)・分散Var(X)の関係

3 f(x)g(y)は、二つの確率変数XYの分布。

3A:期待値が大きいほど分布の重心が右へ。(大きな値が出やすい。)

(6)

3B:分散が大きいほど分布が広がる。(平均から外れた値が出やすい。)

 確率変数の標準化:確率変数Xから期待値E(X)を引き、標準偏差

√Var(X)で割ることで できる新たな確率変数

Z = X − E(X)

Var(X) (17)

を、 された確率変数と呼ぶ。

重要な性質:Xがどんな確率変数であっても、 標準化すると期待値・分散は

E(Z) = , Var(Z) = . (18)

(証明今回の復習問題。)

⊲ 標準化は、統計学・計量経済学で頻繁に使われる。

 注意:記述統計(講義ノート#01) の諸概念と、確率論の諸概念を混同しないこと。

記述統計 確率論

代表的な値 標本の平均X¯  確率変数の期待値E(X) バラつきを測る 標本の分散s2

X  確率変数の分散Var(X)

まとめと復習問題

今回のまとめ

 確率変数(連続型・離散型)と確率分布。

 確率変数の期待値、 分散と標準化。

復習問題

出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。

1. 確率変数Xの分散Var(X)は、Xのどんな特徴を測るパラメータか ?

2. 標準化された確率変数Zについて、(18)式のE(Z) = 0を示せ。ヒント:(17)式のE(X)

1

Var(X)が定数であることに注意し、両辺の期待値をとる。期待値の公式に注目。余裕が

あればVar(Z) = 1も確認せよ。

参照

関連したドキュメント

1880 年代から 1970 年代にかけて、アメリカの

1880 年代から 1970 年代にかけて、アメリカの

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

 ティモール戦士協会‑ティモール人民党 Kota/PPT 1974 保守・伝統主義  2  ティモール抵抗民主民族統一党 Undertim 2005 中道右派  2.

⑧ Ministry of Statistics and Programme Implementation National Sample Survey Office Government of India, Report No.554 Employment and Unemployment Situation in India NSS 68th ROUND,

Ⅲ期はいずれも従来の政治体制や経済政策を大きく転

2016.④ Daily News &amp; Analysis &#34;#dnaEdit: Tamil Nadu students' suicide exposes rot in higher

中国の食糧生産における環境保全型農業の役割 (特 集 中国農業の持続可能性).