Revised at 23:08, December 9, 2015 統計学 第6回 http://my.reset.jp/˜gok/math/statistics/ 1
6 多次元の確率変数
多次元のデータを(くじ引きとしての)確率変数と解釈したものは多次元の確率変 数と呼ばれます。つまり、某かのランダムネスによって様々な多次元の実数値(ヴェク ター値)をとり得る関数/変数のようなものを多次元の確率変数と言います。
6.1 密度関数
1次元の確率変数X とその密度関数h(x)は(任意 の区間Jに対して)
P[X∈J] = Z
J
h(x)dx
と云う関係で結ばれていましたがこの積分値は右図の 様に面積と考える事が出来ます。
2次元の確率変数 に対しても同様に考えれ ば、ある非負値2変数関数h(x, y)があって、任 意の領域D に対して がDに入っている確率 P[ ∈D]が、左図の様な立体の体積(2重積分 によって計算されます)で与えられる場合に の 密度がh(x, y)であると言う事が出来ます。
定義 6.1.1 2変数非負値関数h(x, y)が2次元の確率変数 の密度関数であると
は、任意の領域Dに対して次が成り立つこととします:
P[ ∈D] = ZZ
D
h(x, y)dxdy. (6.1)
しかし、実際にチェックする身になって考えれば、『任意の領域』に対してそんなも のをチェックする事は出来ませんからこの特徴付けは『実用的』ではありません。
領域Rが2つの(内部は重ならない)長方形R1, R2をつなぎ合わせた形である場合、
体積・確率ともに次のような『和の法則』をもっています:
ZZ
R
h(x, y)dxdy= ZZ
R1
h(x, y)dxdy+ ZZ
R2
h(x, y)dxdy, P[ ∈R] =P[ ∈R1] +P[ ∈R2].
従って、密度関数を特徴付ける式(6.1)が長方形領域に対して成り立てば、2つの長方 形を合わせてできる領域に対しても成り立つ事が分かります(2個でなくても任意の有 限個で良く、極限をとれば可算無限個でも良い)。
更にどんな領域も大小様々の長方形をつなぎ合わせた極限として 捉える事が出来ますから(正確には、そう表現出来る『よい領域』
だけを考えます)、結局の所任意の長方形領域に対して(6.1)が成り 立てば任意の領域に対しても(6.1)が成り立つと言えます。従って 2次元の確率変数の密度関数は次の様に特徴付ける事が出来ます:
事実 6.1.2 = (X, Y)を2次元の確率変数、h(x, y)を非負値関数とします。任 意のa≤b, c≤dに対して
P[a≤X ≤b, c≤Y ≤d] =P[ ∈[a, b]×[c, d]] = ZZ
[a,b]×[c,d]
h(x, y)dxdy が成り立っているとき、関数h(x, y)は = (X, Y)の密度関数です。
6.2 多次元の密度から成分の密度を得る事
2次元の確率変数(X, Y)の密度関数がh(x, y)であるとき、各成分確率変数X, Y そ れぞれの密度はどうなっているか見てみます。
v≤X ≤wであると云う事は、2次元の確率変数(X, Y)としてはY の方はどんな 値でも良いわけですから(X, Y)∈[v, w]×(−1,1)であると考えられ、
P[v≤X≤w] =P[(X, Y)∈[v, w]×(−1,1)] = Z w
v
ΩZ 1
−1
h(x, y)dy æ
dx となります。これは2変数関数h(x, y)をyで積分して出来るxの関数R1
−1h(x, y)dy がXの密度である事を意味しています。全く同様にY の密度はR1
−1h(x, y)dxです。
この様に、多次元の密度(同時密度と言います)が分かれば、各成分ごとの1次元確 率変数の密度(周辺密度と言います)も積分計算によって分かってしまいます。
Revised at 23:08, December 9, 2015 統計学 第6回 http://my.reset.jp/˜gok/math/statistics/ 2
6.3 確率変数の独立性と成分の密度から多次元の密度を得る事
例えばX, Y が共に[0,1]区間上に一様に分布していたとしても、X = Y であれば
= (X, Y)は対角線y=x上にしか分布しませんが、XとY が無関係であれば は
長方形[0,1]×[0,1]全体に分布しています。この様に、2次元の確率変数において各成 分の分布が分かっていても成分同士の相互関係が分からなければ全体としての分布は分 かりません。ここでは最も簡単な成分同士が無関係である場合を見てみましょう。
確率変数X1, . . . , Xnのそれぞれがどの程度の値をとるかと云う事柄同士が無関係で あるとき、これらは独立であると言います。正確には確率論で学んだ事象の独立性、つ まり、事象が独立であるとは、大雑把に言って、同時に起る確率がそれぞれの確率の積 になる事であったのを思い出せば、X1, . . . , Xnの独立性は、各Xjが区間Jjに含まれ る(=その程度の値をとる)と云う事象同士の独立性によって次の様に定義されます:
定義6.3.1 確率変数のファミリーX1, . . . , Xnが、任意の区間J1, . . . , Jnに対して P[X1∈J1, . . . , Xn∈Jn] =P[X1∈J1]· · ·P[Xn∈Jn]
を満たすとき、これらは独立(independent)であると言います。
X, Y が独立であればP[(X, Y)∈J×K] =P[X ∈J]P[Y ∈K]ですから,それぞれ
の密度f(x), g(y)が分かっていれば、
P[(X, Y)∈J×K] = Z
J
f(x)dx· Z
K
g(y)dy= ZZ
J×K
f(x)g(y)dxdy
となりますから、2次元の確率変数X= (X, Y)の密度は各成分の密度の積f(x)g(y) になっている事が分かります(3次元以上の場合も同様)。
事実 6.3.2 独立な成分をもった多次元確率変数の密度関数は、各成分の密度関数
の積になります。
6.4 2次元確率変数から派生する確率変数の期待値
2次元の確率変数(X, Y)が与えられた時、これを使って例えばX +Y であるとか XY などの派生した(1次元)確率変数を考える事があります。
定義6.4.1 2次元の確率変数(X, Y)の密度関数がh(x, y)であるとき、右辺の積 分が存在する様な良い関数w(x, y)に対して、
E[w(X, Y)] = Z 1
−1
ΩZ 1
−1
w(x, y)h(x, y)dx æ
dy を(派生した)確率変数w(X, Y)の期待値と言います。
6.4.1 独立な成分の積
確率変数X, Y は独立であるとし、有限な平均・分散をもつものとします。
このとき、X, Yの密度をそれぞれf(x), g(x)とすれば(X, Y)の密度関数は積f(x)g(y) になりますから
E[XY] = Z 1
−1
ΩZ 1
−1
xyf(x)g(y)dx æ
dy= Z 1
−1
xf(x)dx Z 1
−1
yg(y)dy=E[X]E[Y] が分かります。また、X−E[X]とY −E[Y]も独立ですから共分散は0です:
Cov[X, Y] =E[(X−E[X])(Y −E[Y])] =E[X−E[X]]E[Y −E[Y]] = 0
6.4.2 成分の和
任意の実数a, b, cに対して E[aX+bY +c]
= Z 1
−1
ΩZ 1
−1
(ax+by+c)h(x, y)dx æ
dy
=a Z 1
−1
x ΩZ 1
−1
h(x, y)dy æ
dx+b Z 1
−1
y ΩZ 1
−1
h(x, y)dx æ
dy +c
Z 1
−1
ΩZ 1
−1
h(x, y)dx æ
dy
=aE[X] +bE[Y] +c
Revised at 23:08, December 9, 2015 統計学 第6回 http://my.reset.jp/˜gok/math/statistics/ 3 となっている事が分かります。この様に和の期待値は期待値の和ですが、分散は
V ar[X+Y] =V ar[X] + 2Cov[X, Y] +V ar[Y]
となっており、共分散が0でなければ和の分散は分散の和になりません。ただし、特に X, Y が独立であれば(さっき見た様に)共分散は0ですから分散もそれぞれの分散の 和になります。
6.5 独立な確率変数の和とたたみこみ
成分が独立な2次元確率変数 = (X, Y)を考えます。任意にとって固定した実数t に対して、不等式x+y≤tを満たす点(x, y)の全体からなる領域をDtとすれば
P[X+Y ≤t] =P[(X, Y)∈Dt] ですが、領域Dtは連立不等式:
−1< x≤t−y
−1< y <1
で表され、また前に見た様に の密度は各成
分の密度f(x), g(x)の積になったので、
P[X+Y ≤t] = ZZ
Dt
f(x)g(y)dxdy= Z 1
−1
ΩZ t−y
−1
f(x)dx æ
g(y)dy となります。中の積分でx=z−yと変換して積分の順序を交換すれば
P[X+Y ≤t] = Z 1
−1
ΩZ t
−1
f(z−y)dz æ
g(y)dy= Z t
−1
ΩZ 1
−1
f(z−y)g(y)dy æ
dz となります。従ってこの最後の括弧の中身がX+Y の密度に他なりません。そこで
定義 6.5.1 関数f とgのたたみこみ(convolution)f∗gを次の様に定義します:
(f∗g)(x) = Z 1
−1
f(x−y)g(y)dy.
と定義すれば、互いに独立な2つの確率変数X, Y の密度関数がそれぞれf(x), g(x)で あるとき、X+Y の密度関数はたたみこみ(f∗g)(x)であると言えます。
例題 6.5.2 区間(0,1)上の一様分布の密度関数をf(x)とするとき、たたみこみf∗f を求めて下さい。
この一様分布の密度関数は
f(x) =
1 0< x <1 0 otherwise
ですから、被積分関数のうち第2因子f(y)の方を具体化すると次の様になります:
(f ∗f)(x) = Z 1
−1
f(x−y)f(y)dy= Z 1
0
f(x−y)dy.
次に残った部分を具体化するわけですが、定義により被積分関数は0< x−y <1す なわちx−1< y < xである範囲以外では0となるのでこの範囲[x−1, x]が積分区間 [0,1]とどう交わるかが問題となります(端点は気にしなくていいです)。これをxの値 によって場合分けするわけですが、下図のような絵を描いて目で見て確認しながら考え ると良いでしょう:
従って2つの区間の重なりにだけ積分計算が出現して以下の通りになります:
(f∗f)(x) =
0 2≤x
R1
x−1dy 1≤x≤2 Rx
0 dy 0≤x≤1
0 x≤0
=
0 2≤x
−x+ 2 1≤x≤2 x 0≤x≤1
0 x≤0.
これは三角分布ですね。
Revised at 23:08, December 9, 2015 統計学 第6回 http://my.reset.jp/˜gok/math/statistics/ 4
Exercise
基本演習6.1 f(x) = 12e−|x|とするとき、たたみ込みf ∗f を求めて下さい。
基本演習6.2 たたみ込みの対称性:f∗g=g∗f を証明して下さい。
基本演習 6.3 3つの事象A, B, Cのうちどの2つの組(例えば{A, B}など)も独 立であるが、{A, B, C}は独立でないような例を作って下さい。要するに、
P[A∩B] =P[A]P[B], P[B∩C] =P[B]P[C], P[C∩A] =P[C]P[A]
は成り立つけれども
P[A∩B∩C]6=P[A]P[B]P[C]
であるような例を挙げて下さい。
また、逆に、P[A∩B∩C] =P[A]P[B]P[C]は成り立つけれどもP[A∩B]6=
P[A]P[B]であるような例を挙げて下さい。
発展演習 6.4 長方形領域D:[0,1]×[1,3]上に一様に分布した確率変数を(X, Y) とするとき、各成分確率変数X, Y はどんな密度関数をもつか調べて下さい。
発展演習 6.5 2次元の確率変数 = (X, Y)は密度関数 1
2πe−x2+y2 2 をもつとしま す。このとき各成分確率変数X, Y の密度関数を求め、また、X, Y が独立であるか どうかも調べて下さい。
発展演習6.6 次の三角分布の密度関数:
w(x) =
x+ 1 −1≤x≤0
−x+ 1 0≤x≤1
0 otherwise
に対してたたみ込みw∗wを計算して下さい。
発展演習 6.7 2つの独立な標準正規分布の比がCauchy分布に従う事を示して下 さい。