担当:鹿野(大阪府立大学) 2013 年度後期
はじめに
前回の復習
確率変数と確率分布。 離散型・連続型。
期待値(確率変数の代表値)、 分散(散らばり具合) と確率変数の標準化。
今回学ぶこと
正規分布と標準正規分布。
二次元の確率変数 :同時分布、共分散と独立性。
テキスト該当箇所 :付録A4∼A6章。鳥居(1994)、東大出版会(1991)も参照。
1 正規分布と標準正規分布
1.1 正規分布
確率分布には多くの 「型」が存在。パソコンで分布を描いたり、 確率計算が可能。
⊲ 最も重要な連続型の分布=正規分布。
⊲ その他(二項分布、 ポアソン分布、etc)⇒東大出版会(1991、6章)を参照。
正規分布:連続型の確率変数Xの密度関数が f(x) = √1
2πσ2 exp
− 1
2σ2(x − µ)
2
, −∞ < x < ∞ (1)
で与えられるとき、f(x)を と呼ぶ。
⊲ µ(ミュー)、σ2(シグマ2乗)は正規分布を特徴づけるパラメータ。
⊲ 正規分布の期待値と分散は、
E(X) = µ, Var(X) = σ2. (2)
∴密度関数のパラメータµ, σ2と期待値・分散に、1対1の対応関係。
注意:exp(a)という表現は、eaと同じ。e = 2.718...は自然対数の底(ネイピア定数)。 1
−10 −5 0 5 10 15 20
0.00.10.20.30.4
f(x)
N(−3, 1.52)
N(5, 22)
N(15, 12)
図1:正規分布N(−3, 1.52)、N(5, 22)、N(15, 12)
Remark:正規分布で重要なのはµ, σ2の値。∴正規分布に従う確率変数Xを
X ∼ N(µ, σ2) (3)
と表記。(Nはnormal distributionの略。)(1)式は暗記しなくて良い !
⊲ 図1:正規分布N(−3, 1.52)、N(5, 22)、N(15, 12)。左右対称の釣り鐘型。
正規分布の一次変換の分布 :X ∼ N(µ, σ2)ならば、その一次式Y = a + bXの分布は、 X ∼ N(µ, σ2) −−−−−−−−−−−−→変換Y = a + bX Y ∼ . (4)
⊲ ∴正規確率変数を一次変換⇒期待値はµ→ a + bµ、分散はσ2 → b2σ2に置き換わ るが、分布型は正規分布(左右対称・釣り鐘型)のまま。
⊲ 注意:期待値の公式・分散の公式(講義ノート#02)より、どんな確率変数でも一次 変換の期待値・分散は
E(Y) = a + bE(X), Var(Y) = b2Var(X). (5) ただし、分布が一次変換前と同じである保障はない。
1.2 標準正規分布
標準正規分布(図2):µ= 0、σ2 = 1の特殊な正規分布N(0, 1)を、 と 呼ぶ。
⊲ 任意の正規分布X ∼ N(µ, σ2)を標準化(講義ノート#02) し、変形すると Z = X − E(X)√
Var(X) = X − µ
σ =− µ σ +
1
σX. (6)
a = −σµ、b = σ1 と置けば、(4)式の性質より Z ∼ N
−µ σ+
1 σµ,
1 σ2σ
2
整理
−−−→ Z ∼ N(0, 1). (7)
−3 −2 −1 0 1 2 3
0.00.10.20.30.4
z
f(x)
A: Z ~ N(0,1)
0.00.10.20.30.4
z
f(x)
0 z=1.96 α=0.025 1−α
α B: α=Pr(Z>1.96)=0.025
図2:標準正規分布Z ∼ N(0, 1)と臨界値を上回る確率α= Pr(Z > z)
⊲ ∴ Z ∼ N(0, 1)は、X ∼ N(µ, σ2)を標準化すると得られる。
Zの臨界値:Z ∼ N(0, 1)が特定の値zを超える確率をα= Pr(Z > z)と置くと z Pr(Z > z)
右端5% 1.645 0.050
右端2.5% 1.960 0.025
右端1% 2.326 0.010
これらzを、Zの と呼ぶ。(より細かい確率計算⇒テキストp351の表。)
⊲ 確率Pr(Z > z)はZ ∼ N(0, 1)の右端面積(講義ノート#02の図2B参照)。
⊲ 図2B:Zが1.96を上回る確率はPr(Z > 1.96) = 0.025。
Remark:Z ∼ N(0, 1)が2を超える(or −2を下回る)確率は、 。
⊲ 図2:N(0, 1)は、−2 < z < 2ぐらいの確率をカバー。 臨界値の表からも明らか。
⊲ ∴「Z目線」で考えると、±2を超える値は非常に大きな、 まれにしか出ない値。
2 二次元の確率変数と同時確率分布
2.1 同時確率分布
Remark:二次元の確率変数とその確率分布
⊲ 確率分布=確率変数Xの実現値xとその確率Pr(X = x)の対応関係を、 関数orグラ フで表したもの。 例:正規分布。
⊲ 二つの確率変数のペア(X, Y)について同じことをするには ?⇒同時確率分布。
同時確率分布 :二つの離散型確率変数(X, Y)について、実現値のペア(X = x, Y = y)とそ の確率Pr(X = x, Y = y)の対応関係を与える関数
Pr(X = x, Y = y) = h(x, y) (8)
を、二次元の と呼ぶ。
⊲ XとYの実現値を x1, x2, . . . , xK、y1, y2, . . . , yLと置くと、確率の自然な性質より h(xk, yl) ≥ 0,
K k=1
L l=1
h(xk, yl) = 1. (9)
一次元の確率分布 (講義ノート#02) と比較せよ。
例:X、Yの実現値がx = 1, 3, 5、y = 2, 4, 6(3 × 3 = 9通りのペア)であり、確率Pr(X =
x, Y = y)が下表で与えられるとする。
h(x, y) Y = 2 Y = 4 Y = 6
X = 1 0.2 0.1 0.1
X = 3 0.1 0.15 0.1
X = 5 0 0.1 0.15
∴実現値のペアとその確率を表にすれば、 それが同時分布h(x, y)。
⊲ 表中の確率が、(9)式の性質を満たすことを確認せよ。
連続型の同時分布 :同時密度関数。⇒今回の補足資料。
周辺分布:同時分布h(x, y)に対し、X、Y単体に確率を与える分布 f(x)、g(y)を、X、Yの と呼ぶ。∴周辺分布=一次元の分布のこと。
⊲ 講義ノート#02と同様、f(x)でXの期待値E(X)、g(y)でYの期待値E(Y)を定義。
⊲ 周辺分布 f(x)、g(y)と同時分布h(x, y)の関係⇒今回の補足資料。
確率変数の和と積の期待値 :(証明⇒今回の補足資料。)
1. 。分配法則。
2. 要注意: 。
2.2 共分散
二つの確率変数X、Yの連動性・相関を測る⇒共分散。
⊲ データ中の相関関係を標本共分散 (講義ノート#01) でまとめるのと、 同じ発想。
共分散:確率変数のペア(X, Y)について、
Cov(X, Y) = E [(X − E(X))(Y − E(Y))] (10) を、XとYの と呼ぶ。(Covはcovarianceの略。)
⊲ E(X)、E(Y)を軸に、(X, Y)が同方向に動く⇒ (xk− E(X))(yl− E(Y)) > 0。
⊲ (X, Y)が逆方向に動く⇒ (xk− E(X))(yl− E(Y)) < 0。
⊲ ∴平均的に前者の傾向が強ければCov(X, Y) > 0( )、後者の傾向が強け
ればCov(X, Y) < 0( )、打ち消し合えばCov(X, Y) ≈ 0( )。
共分散の別表現:共分散の定義(10)を書き換えると
Cov(X, Y) = E(XY) − E(X)E(Y). (11)
⊲ ∴(10)式と(11)式、使いやすい方を使う。
⊲ 証明⇒今回の復習問題。 講義ノート#02、(16)式の展開とほぼ同じ。
確率変数の和の分散 :XとYの和の分散は、X + Yをひとつの確率変数と見れば Var(X + Y) = E(X + Y − E(X + Y))2
= E(X − E(X) + Y − E(Y))2
= E(X − E(X))2+ 2(X− E(X))(Y − E(Y)) + (Y − E(Y))2
= Var(X) + + Var(Y). (12)
∴一般にVar(X + Y) Var(X) + Var(Y)なので注意。
⊲ (X, Y)の共分散とX + Yの分散には、密接な関係。
⊲ 例:Cov(X, Y) > 0の株式X、Yを同時に保有⇒ Var(X) + Var(Y)以上にリスクが増幅。 2.3 確率変数の独立性
独立性:同時分布h(x, y)が周辺分布 f(x)、g(y)の積 h(x, y)
=Pr(X=x,Y=y)
= f(x)g(y)
=Pr(X=x) Pr(Y=y)
(13)
で得られるとき、XとYは である、と言う。
⊲ 一般に、二つのイベント A, Bについて、Pr(AかつB) = Pr(A) Pr(B)ならば、AとB は互いに独立である、 と言う。
⊲ 例:A =「今夜雨が降る」、B =「夕食が唐揚げ」。Pr(AかつB) = Pr(A) Pr(B) ⇒ Aと
Bは独立。
独立な確率変数の性質 :XとYが独立である場合に限り、 積XYの期待値は
E(XY) = . (14)
(証明⇒今回の補足資料。)
1. ∴ (10)式より、独立⇒ Cov(X, Y) = (無相関)。
2. ∴ (11)式より、独立⇒ Var(X + Y) = 。
Remark:XとYが独立のケース・独立でないケースを整理。
(X, Y)が独立 (X, Y)が独立でない
定義 h(x, y) = f (x)g(x) h(x, y) f (x)g(x) 積の期待値 E(XY) = E(X)E(Y) E(XY) E(X)E(Y)
共分散 Cov(X, Y) = 0(無相関) Cov(X, Y) 0
和の分散 Var(X + Y) = Var(X) + Var(Y) Var(X + Y) Var(X) + Var(Y)
n次元の独立性:n個の確率変数X1, X2, . . . , Xnの同時分布が、各周辺分布 fi(xi)の積 h(x1, x2, . . . , xn) = f1(x1) f2(x2) · · · fn(xn) =
n i=1
fi(xi) (15)
で得られるとき、X1, X2, . . . , Xnは互いに独立である、 と言う。
⊲ 独立⇒任意のペア(Xi, Xj)についてCov(Xi, Xj) = 0。
⊲ 独立⇒和X1+ X2+· · · + Xnの分散が
Var(X1+ X2+· · · + Xn) = Var(X1) + Var(X2) + · · · + Var(Xn) =
n i=1
Var(Xi). (16)
⊲ 注意:独立であろうがなかろうが、 和の期待値は(分配法則より) E(X1+ X2+· · · + Xn) = E(X1) + E(X2) + · · · + E(Xn) =
n i=1
E(Xi). (17)
まとめと復習問題
今回のまとめ
正規分布と標準正規分布。
二次元(多次元)の確率変数:同時分布、共分散と独立性。
⊲ 多次元の確率変数は、 この講義の後半で再考する。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. 講義ノート#02、(16)式のやり方を参考に、 分散の別表現(11)式が成立することを示せ。 ヒント:確率変数の和の期待値(分配法則)、および期待値公式(講義ノート#02)に注意。 2. 独立性の定義に即し、 互いに独立なイベント (と思われるもの) の例を挙げよ。