担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
計量経済学とは何か ?
基本概念(和記号、記述統計)の復習。
今回学ぶこと
確率変数と確率分布。
期待値、分散と標準化。
テキスト該当箇所 :付録A1∼A3章。東大出版会(1991) も参照。
1 確率変数と確率分布
1.1 確率変数
なぜ統計学・計量経済学で確率論が必要か ?⇒データ分析の結果は、 偶然性を伴う。
⊲ 理由:分析者の取得するデータ (標本)自体が、ランダムであるため。
⊲ ∴確率論に基づき、「データを上手く使う方法=精度の高い分析方法」 をデザイン。
⊲ 確率論=確率変数と確率分布を使って 「偶然」を制御する技術。
確率変数:起こり得る値 (あるいは区間) に確率が与えられた変数を、 と 呼ぶ。
⊲ 確率変数を大文字Xで表し、Xが任意の値 x(実現値と呼ぶ) をとる確率を
Pr(X = x) (1)
と表記。同様に、a < X < bとなる確率をPr(a < X < b)と表記。a, bは定数。
例:サイコロをXと置く。
⊲ Xの実現値はx = 1, 2, . . . , 6。サイコロに歪みが無ければ、 それぞれの確率は Pr(X = x) = 1
6, x = 1, 2, . . . , 6. (2)
1
1 2 3 4 5 6 x
Pr(X=x)=f(x) 0.00.10.20.30.4
A:サイコロ
1 2 3 4 5 6
x Pr(X=x)=f(x) 0.00.10.20.30.4
B:細工されたサイコロ
図1:サイコロの確率分布
Remark:確率変数のタイプ
⊲ 確率変数=実現値ひとつひとつに番号をふり、数え上げることが出来る 確率変数。例:サイコロ。
⊲ 確率変数=測定を厳密にすると実現値が無限に存在し、 番号がふれない 確率変数。長さ、重さ、貨幣価値などの定量的な現象。
例:円周1メートルのルーレットを回し、 針がどこに止まるか ?⇒連続型確率変数X。
⊲ 実現値は開閉区間(0, 1]に無限に存在。∴0 < x ≤ 1。全て列挙はムリ。
⊲ 確率をどうやって与える ?⇒確率密度関数。
1.2 確率分布
確率分布:離散型確率変数Xが実現値xkをとる確率が
Pr(X = xk) = f (xk), k = 1, 2, 3, . . . , K. (3) で得られるとき、f(xk)を と呼ぶ。
⊲ 確率分布 f(xk)をグラフに描く⇒出やすい値・出にくい値が明確に。
⊲ f(x)の満たすべき性質 :確率の自然な性質に注意すれば
確率は非負: Pr(X = xk) = f (xk) ≥ 0, (4) 確率の和は1:
K k=1
Pr(X = xk) =
K k=1
f(xk) = 1. (5)
例:歪みの無いサイコロと細工されたサイコロ
⊲ 図1A:歪みの無いサイコロの確率分布は
f(1) = f (2) = · · · = f (6) = 16. (6)
0.000.040.08
f(x)
a b
R
A:Pr ( a<X<b)
0.000.040.08
f(x)
c
S
B:Pr ( X>c )
図2:確率密度関数と確率の対応関係 (斜線部分)
⊲ 図1B:細工されたサイコロ。“2”の目を消し、“5”を上書き⇒実現値は1, 5, 3, 4, 5, 6。 確率分布は
f(xk) =
⎧⎪
⎪⎪
⎪⎪
⎨
⎪⎪
⎪⎪
⎪⎩
1
6 (xk = 1, 3, 4, 6のとき) 0 (xk = 2のとき)
1
3 (xk = 5のとき)
. (7)
⊲ 両ケースとも条件(4)、条件(5)を満たす。
1.3 連続型の確率分布:確率密度関数
確率密度関数:連続型確率変数Xが区間[a, b]の値をとる確率Pr(a ≤ X ≤ b)が定積分 Pr(a ≤ X ≤ b) =
b a
f(x)dx (8)
で得られるとき、f(x)をXの と呼ぶ。
⊲ 特定の実現値に確率を与えるのは諦めて、 代わりに区間の確率を与える。
⊲ 密度関数 f(x)の満たすべき性質:離散型の条件(4)、条件(5)と類似。
f(xk) ≥ 0, (9)
Pr(−∞ ≤ X ≤ ∞) =
∞
−∞
f(x) = 1. (10)
Remark:密度関数と図の対応関係。 図2A。
⊲ 条件(4)、(5) ⇒グラフ全体の面積= Pr(−∞ ≤ X ≤ ∞) = 1.
⊲ ∴(8)式は、グラフ全体に占める斜線部Rの で確率Pr(a ≤ X ≤ b)を表現。
⊲ 注意:確率計算以外の場合は、「密度関数の頂上のあたり=比較的出やすい値」 と見 て構わない。∴グラフの見方は離散型の分布と同じ。
積分の性質に注目すると...
1. Pr(X = a) = Pr(a ≤ X ≤ a) =aa f(x)dx = F(a) − F(a) = 0。∴連続型に限り、 Pr(a ≤ X ≤ b) = Pr(X = a)
=0
+ Pr(a < X < b) + Pr(X = b)
=0
= . (11)
2. Pr(X > c) = Pr(c < X < ∞) =c∞ f(x)dx。∴ Xが定数cを超える確率Pr(X > c)は、図 Bの斜線部S。
2 期待値と分散
2.1 期待値
確率変数Xの性質を、いくつかのパラメータ (定数値)で要約。
⊲ データを記述統計(講義ノート#01:標本平均や標本分散)でまとめるのと同じ発想。
⊲ 確率変数の特性パラメータ :期待値と分散。
期待値:実現値x1,x2, . . . ,xKをとり得る離散型の確率変数Xについて、実現値の加重平均 E(X) = x1Pr(X = x1) + x2Pr(X = x2) + · · · + xKPr(X = xK)
= x1f(x1) + x2f(x2) + · · · + xKf(xK) =
K k=1
xkf(xk) (12)
を、Xの と呼ぶ。(Eはexpectationの略。)
⊲ 各実現値xkを確率Pr(X = xk) = f (xk)でウェイト付けして加重平均。 出やすいxkに 大きなウェイト。
⊲ ∴E(X)は、さまざまな値をとり得るXの代表的な値。
⊲ 注意:Xは確率変数だが、E(X)は定数扱い。
例:歪みの無いサイコロXの期待値は
E(X) = 1 · f (1) + 2 · f (2) + · · · + 6 · f (6) = 1
6· 21 = 3.5. (13)
⊲ 細工したサイコロの期待値も確認せよ。
連続型の期待値:連続型確率変数Xについて、 E(X) =
∞
−∞
x f(x)dx (14)
を、Xの期待値(平均値)と呼ぶ。
⊲ E(X)はXの代表的な値。∴意味は離散型と同じ。(積分=精密な足し算。)
期待値E(·)の公式:(証明⇒今回の補足資料。)定数cについて、
1. 。
2. 。
3. 。
0.00.10.20.30.4
f(x),g(y)
E( X) E( Y)
f g A:E( X) < E( Y)
0.00.10.20.30.4
f(x),g(y)
E( X) =E( Y)
f ( g( B:Var ( X) < Var ( Y)
図3:期待値・分散の違いと分布の見た目
2.2 分散
分散:確率変数Xについて、
Var(X) = E (X − E(X))2=
⎧⎪
⎪⎨
⎪⎪
⎩
(xk− E(X))2f(xk) (離散型の場合)
(x − E(X))2f(x)dx (連続型の場合) (15)
を、Xの と呼ぶ。(Varはvarianceの略。)
⊲ 各実現値xkの期待値E(X)からのズレ(xk− E(X))2を、加重平均。
⊲ ∴Var(X)は、Xの平均周りの散らばりを測る。Var(X)が大きい=変動が大きく不安定。
⊲ 分散の平方根 √Var(X)を、 と呼ぶ。
分散の別表現:E(X)が定数であることに注意すれば、 期待値の公式より Var(X) = EX2− 2XE(X) + E(X)2
= E(X2) − 2E(X)E(X) + E(X)2= . (16)
⊲ ∴(15)式or (16)式、計算しやすい方を使えば良い。
分散Var(·)の公式:(証明⇒今回の補足資料。) 定数cについて、
1. 。
2. 。
3. 要注意: 。
2.3 期待値・分散の補足
Remark:確率分布 f(x)の「見た目」と期待値E(X)・分散Var(X)の関係
⊲ 図3の f(x)、g(y)は、二つの確率変数X、Yの分布。
⊲ 図3A:期待値が大きいほど分布の重心が右へ。(⇔大きな値が出やすい。)
⊲ 図3B:分散が大きいほど分布が広がる。(⇔平均から外れた値が出やすい。)
確率変数の標準化:確率変数Xから期待値E(X)を引き、標準偏差
√Var(X)で割ることで できる新たな確率変数
Z = X − E(X)√
Var(X) (17)
を、 された確率変数と呼ぶ。
⊲ 重要な性質:Xがどんな確率変数であっても、 標準化すると期待値・分散は
E(Z) = , Var(Z) = . (18)
(証明⇒今回の復習問題。)
⊲ 標準化は、統計学・計量経済学で頻繁に使われる。
注意:記述統計(講義ノート#01) の諸概念と、確率論の諸概念を混同しないこと。
記述統計 確率論
代表的な値 標本の平均X¯ 確率変数の期待値E(X) バラつきを測る 標本の分散s2
X 確率変数の分散Var(X)
まとめと復習問題
今回のまとめ
確率変数(連続型・離散型)と確率分布。
確率変数の期待値、 分散と標準化。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. 確率変数Xの分散Var(X)は、Xのどんな特徴を測るパラメータか ?
2. 標準化された確率変数Zについて、(18)式のE(Z) = 0を示せ。ヒント:(17)式のE(X)、
√ 1
Var(X)が定数であることに注意し、両辺の期待値をとる。期待値の公式に注目。余裕が
あればVar(Z) = 1も確認せよ。