計量経済学#02
確率論:確率変数と確率分布 (1)
鹿野繁樹
大阪府立大学
2017 年 10 月更新
Outline
1 確率変数とその分布
2 期待値と分散
テキスト・参考書。
テキスト:鹿野繁樹 [2015]、第 2.1 章・第 2.2 章。 参考書:松原望 et al. [1991]。
前回の復習
1 計量経済学の役割
Section 1
確率変数とその分布
なぜ確率論が必要か? :データの偶然性
データは、観測する前の段階では不確定。
例:中古マンションデータ(前回より再掲)。観測の事前に、 いかなる値が並ぶかは不明。⇒ 平均や標準偏差もまた、偶然 の産物。
統計は(イメージに反し)不安定な数字!
id 価格 最寄駅所要時間 築年数 面積 ワンルーム
1 620 5 26 15 1
2 3700 3 11 50 0
3 3700 12 12 55 0
...
194 3400 8 24 60 0
統計を含め、ランダムな事象を分析・制御する科学が確率論。 六面体のサイコロを考える。事前に何が出るかは不明。 ... しかし、事前に次のことは確定。
1 起こり得る値は{1, 2, 3, 4, 5, 6}。
2 それぞれ均等に起こる(等確率 1
6)。
∴ 不確定なサイコロの挙動に、一定の秩序・法則性!
離散型の確率変数
サイコロのように、起こり得る値それぞれに確率が明示された変 数を確率変数と呼び、大文字X で表記。
起こり得る候補の値、実現値は小文字{x1, x2, . . . , xk} で表 す。(サイコロなら{1, 2, 3, 4, 5, 6})。
ある値X = xjが起こる確率(probability)を
Pr(X = xj) (1) と略記。
このX は離散型。飛び飛びの、有限個の実現値だけをとる。
実現値{x1, x2, . . . , xk} とその確率 Pr(X = xj) の対応関係を数式 で整理⇒ X の確率分布
Pr(X = xj) = f (xj), j = 1, 2, . . . , k. (2)
確率分布が確率であるために、次の条件を満たすとする。 確率は非負: Pr(X = xj) = f (xj) ≥ 0, (3) 確率の和は1:
k
j=1
Pr(X = xj) =
k
j=1
f (xj) = 1. (4)
Example 1
図1A:ゆがみのないサイコロ X の確率分布は Pr(X = x) = f (x) = 1
6 (x = 1, 2, . . . , 6).
サイコロの「2」の目を消し、「5」と上書き。⇒ 細工されたサ イコロX の実現値は {1, 5, 3, 4, 5, 6}。確率分布は
Pr(X = x) = f (x) =
1
6 (x = 1, 3, 4, 6)
1
3 (x = 5)
.
図1B 参照。
1 2 3 4 5 6 x
Pr(X=x) = f(x) 0.00.10.20.30.4
A
1 2 3 4 5 6
x Pr(X=x) = f(x) 0.00.10.20.30.4
B
図 1 : ゆがみのないサイコロと、細工されたサイコロの確率分布
連続型の確率変数と密度関数
実現値が連続的な数の集合で与えられる確率変数を、連続型と 呼ぶ。
例:「1 キロの距離を歩いているうちに指輪を落とした」状況。 指輪が落ちた地点を確率変数X と置けば、X の実現値 x の集 合は、0 < x ≤ 1。
... 実現値が無限に存在 ⇒ 離散型のように番号を付け実現値を 区別するのは不可能。
連続型のX が a から b の値を取る確率を、Pr(a ≤ X ≤ b) と置く。 この確率が、ある関数f (x) の定積分
Pr(a ≤ X ≤ b) =
b a
f (x)dx, (ただし xmin < a ≤ b < xmax) (5)
から得られるとき、f (x) を X の確率密度関数(密度関数)と 呼ぶ。
xminとxmaxは、実現値x の最小値と最大値。
連続型は実現値が無現に存在、列挙できない。⇒ 個々の実現 値に確率を与えるのを諦め、区間の確率だけを考える。 (5) 式が、確率として意味をなすための条件。
f (x) ≥ 0, (6)
xmax
xmin
f (x)dx = 1. (7)
条件(6)、(7) は、何を意味する?
図2A は、任意の密度関数 f (x) のグラフ。次の点に着目。 条件(6)より、f(x)は必ず横軸より上の領域に描かれる。 条件(7)より、曲線f(x)による山型図形の面積は1。 (5)式左辺の定積分は、斜線部Rに対応。
∴(5) 式は、「山型に占める R の割合」で確率 Pr(a ≤ X ≤ b) を表現。
この定義に従えば、必ず0 ≤ Pr(a ≤ X ≤ b) ≤ 1を満たす。 X がある値 c を上回る確率 Pr(X > c) は?⇒f (x) の右端面積
(図2B の斜線部 S)。
0.000.040.08
f(x)
a b
R
A
0.000.040.08
f(x)
c
S
B
図 2 : 密度関数の面積と確率Pr(a < X < b)、Pr(X > c)の対応関係
Remark 1
密度関数f (x) のピーク辺りの x が、X の実現値として出やすい. 確率Pr(a ≤ X ≤ b) ⇔ 図2A の面積 R.
確率Pr(X ≥ c) ⇔ 図2B の面積 S(分布右端).
正確に連続型の確率Pr(a ≤ X ≤ b) を求めるには、密度関数 f (x) の積分計算を要する。
しかしグラフを見るときは、 f (x) の高さを「x の出やすさ ≈ 確率」とみなしてOK。
Section 2
期待値と分散
期待値
さまざまな実現値{x1, x2, . . . , xk} をとり得る X について、事前に いくらぐらいの値を「期待」できるか?⇒ 次式を X の期待値
(expectation)と呼ぶ。
E(X) =
k
j=1
xjf (xj). (8)
上式右辺の和記号を展開すれば、確率分布の定義(2) 式より E(X) = x1f (x1) + x2f (x2) + · · · + xkf (xk)
= x1Pr(X = x1) + x2Pr(X = x2) + · · · + xkPr(X = xk). (9)
Remark 2
期待値E(X) は X の実現値 {x1, x2, . . . , xk} の、確率に基づく加重 平均。∴E(X) は X の実現値(結果)を代表する値。
一方、講義ノート#01・記述統計の標本平均 ¯X = n1 Xiは、
標本X1, X2, . . . , Xnの代表値。
連続型の期待値は、和記号を積分記号に置き換え E(X) =
x
xf (x)dx.
(
xは「X の実現値 x の範囲内で積分する」という略記。) 離散型で成立する性質は連続型でも成立。⇒ 連続型は省略。
Example 2
ゆがみの無いサイコロX の期待値は E(X) = 1 ·f (1)
=16
+2 · f (2)
=16
+ · · · + 6 · f (6)
=16
= 3.5.
よってサイコロを振る事前に、3.5 ぐらいの値が期待される。
確率変数X の、定数 a, b による一次式
Y = a + bX (10)
を考える。Y もまた、確率変数。⇒ Y の期待値は?
確率分布の条件式(4)、期待値の定義式 (8) に注意すれば E(a + bX) =(a + bxj)f (xj)
= af (xj)
=1
+bxjf (xj)
=E(X)
= a + bE(X).
注意:足し算の範囲が明確な場合は、和記号を「
」と略記。
公式 1 ( 期待値の演算ルール )
E(a + bX) = a + bE(X). (11) 証明:前段で証明済み.
例えば
E(3) = 3, E(−2X) = −2E(X). (12)
分散
確率変数X の分散(variance)
Var(X) = E(X − E(X))2 =(xj− E(X))2f (xj) (13)
は、X のバラつきを測る指標。
Var(X) は、各実現値 xjの、期待値からのズレ(xj − E(X))2 の加重平均。∴ 記述統計における、Xiの標本分散
s2X = n−11 (Xi− ¯X)2と同じ解釈。
分散の正の平方根 Var(X)を、X の標準偏差と呼ぶ。
Remark 3
分散Var(X) は X の実現値 {x1, x2, . . . , xk} の、期待値 E(X) を軸 とする平均的なバラつき。
Example 3
サイコロX の期待値は E(X) = 3.5 ⇒ X の分散は Var(X) = (1 − 3.5)2· f (1) + (2 − 3.5)2· f (2)
+ · · · + (6 − 3.5)2· f (6)
= 17.5
6 ≈ 5.83. (14)
また標準偏差は Var(X) ≈ 1.71。
分散は、もう一つの計算法がある。
公式 2 ( 分散の別表現 )
Var(X) = E(X2) − E(X)2. (15)
ここでE(X2) = x2jf (x)。
証明:分散の定義式(13) 左辺を展開すると Var(X) = EX2− 2XE(X) + E(X)2
= E(X2) − 2E(X)E(X) + E(X)2 = E(X2) − E(X)2. (16) 上式の展開で、期待値E(X) は定数である点に注意。∴ 公式 (11) よりE(E(X)) = E(X)。
X の一次式 Y = a + bX で作られる、Y の分散は?
公式 3 ( 分散の演算ルール )
Var(a + bX) = b2Var(X). (17) 証明:テキストp34-35 参照。
この公式より、定数a の分散は Var(a) = 0。... 動かない定数 a の分散がゼロになるのは当然。例えば
Var(−5) = 0, Var(10 + X) = Var(X). (18) X の係数 b がその 2 乗に。例えば
Var(−4X) = 16Var(X). (19)
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第2 章復習問題 2.1。
2 テキスト第2 章復習問題 2.3。
3 ある確率変数X について、E(X) = 5、Var(X) = 2 であると する。E(X/2) と Var(−2X + 100) を求めよ。(テキスト第 2 章復習問題2.4 の類題。)
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.
松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.