6 多次元の確率変数

(1)

Revised at 23:08, December 9, 2015 統計学第6回 http://my.reset.jp/˜gok/math/statistics/ 1

6 ^{多次元の確率変数}

多次元のデータを（くじ引きとしての）確率変数と解釈したものは多次元の確率変数と呼ばれます。つまり、某かのランダムネスによって様々な多次元の実数値（ヴェクター値）をとり得る関数／変数のようなものを多次元の確率変数と言います。

6.1 密度関数

１次元の確率変数X とその密度関数h(x)は（任意の区間Jに対して）

P[X∈J] = Z

J

h(x)dx

と云う関係で結ばれていましたがこの積分値は右図の様に面積と考える事が出来ます。

２次元の確率変数に対しても同様に考えれば、ある非負値２変数関数h(x, y)があって、任意の領域D に対してがDに入っている確率 P[ ∈D]が、左図の様な立体の体積（２重積分によって計算されます）で与えられる場合にの密度がh(x, y)であると言う事が出来ます。

定義 6.1.1 ２変数非負値関数h(x, y)が２次元の確率変数の密度関数であると

は、任意の領域Dに対して次が成り立つこととします：

P[ ∈D] = ZZ

D

h(x, y)dxdy. (6.1)

しかし、実際にチェックする身になって考えれば、『任意の領域』に対してそんなものをチェックする事は出来ませんからこの特徴付けは『実用的』ではありません。

領域Rが２つの（内部は重ならない）長方形R1, R2をつなぎ合わせた形である場合、

体積・確率ともに次のような『和の法則』をもっています：

ZZ

R

h(x, y)dxdy= ZZ

R1

h(x, y)dxdy+ ZZ

R2

h(x, y)dxdy, P[ ∈R] =P[ ∈R1] +P[ ∈R2].

従って、密度関数を特徴付ける式(6.1)が長方形領域に対して成り立てば、２つの長方形を合わせてできる領域に対しても成り立つ事が分かります（２個でなくても任意の有限個で良く、極限をとれば可算無限個でも良い）。

更にどんな領域も大小様々の長方形をつなぎ合わせた極限として捉える事が出来ますから（正確には、そう表現出来る『よい領域』

だけを考えます）、結局の所任意の長方形領域に対して(6.1)が成り立てば任意の領域に対しても(6.1)が成り立つと言えます。従って２次元の確率変数の密度関数は次の様に特徴付ける事が出来ます：

事実 6.1.2 = (X, Y)を２次元の確率変数、h(x, y)を非負値関数とします。任意のa≤b, c≤dに対して

P[a≤X ≤b, c≤Y ≤d] =P[ ∈[a, b]×[c, d]] = ZZ

[a,b]×[c,d]

h(x, y)dxdy が成り立っているとき、関数h(x, y)は = (X, Y)の密度関数です。

6.2 多次元の密度から成分の密度を得る事

２次元の確率変数(X, Y)の密度関数がh(x, y)であるとき、各成分確率変数X, Y それぞれの密度はどうなっているか見てみます。

v≤X ≤wであると云う事は、２次元の確率変数(X, Y)としてはY の方はどんな値でも良いわけですから(X, Y)∈[v, w]×(−1,1)であると考えられ、

P[v≤X≤w] =P[(X, Y)∈[v, w]×(−1,1)] = Z w

v

ΩZ ₁

−1

h(x, y)dy æ

dx となります。これは２変数関数h(x, y)をyで積分して出来るxの関数R₁

−1h(x, y)dy がXの密度である事を意味しています。全く同様にY の密度はR₁

−1h(x, y)dxです。

この様に、多次元の密度（同時密度と言います）が分かれば、各成分ごとの１次元確率変数の密度（周辺密度と言います）も積分計算によって分かってしまいます。

(2)

6.3 確率変数の独立性と成分の密度から多次元の密度を得る事

例えばX, Y が共に[0,1]区間上に一様に分布していたとしても、X = Y であれば

= (X, Y)は対角線y=x上にしか分布しませんが、XとY が無関係であればは

長方形[0,1]×[0,1]全体に分布しています。この様に、２次元の確率変数において各成分の分布が分かっていても成分同士の相互関係が分からなければ全体としての分布は分かりません。ここでは最も簡単な成分同士が無関係である場合を見てみましょう。

確率変数X1, . . . , Xnのそれぞれがどの程度の値をとるかと云う事柄同士が無関係であるとき、これらは独立であると言います。正確には確率論で学んだ事象の独立性、つまり、事象が独立であるとは、大雑把に言って、同時に起る確率がそれぞれの確率の積になる事であったのを思い出せば、X1, . . . , Xnの独立性は、各Xjが区間Jjに含まれる（＝その程度の値をとる）と云う事象同士の独立性によって次の様に定義されます：

定義6.3.1 確率変数のファミリーX1, . . . , Xnが、任意の区間J1, . . . , Jnに対して P[X1∈J1, . . . , Xn∈Jn] =P[X1∈J1]· · ·P[Xn∈Jn]

を満たすとき、これらは独立（independent）であると言います。

X, Y が独立であればP[(X, Y)∈J×K] =P[X ∈J]P[Y ∈K]ですから,それぞれ

の密度f(x), g(y)が分かっていれば、

P[(X, Y)∈J×K] = Z

J

f(x)dx· Z

K

g(y)dy= ZZ

J×K

f(x)g(y)dxdy

となりますから、２次元の確率変数X= (X, Y)の密度は各成分の密度の積f(x)g(y) になっている事が分かります（３次元以上の場合も同様）。

事実 6.3.2 独立な成分をもった多次元確率変数の密度関数は、各成分の密度関数

の積になります。

6.4 ２次元確率変数から派生する確率変数の期待値

２次元の確率変数(X, Y)が与えられた時、これを使って例えばX +Y であるとか XY などの派生した（１次元）確率変数を考える事があります。

定義6.4.1 ２次元の確率変数(X, Y)の密度関数がh(x, y)であるとき、右辺の積分が存在する様な良い関数w(x, y)に対して、

E[w(X, Y)] = Z ₁

−1

ΩZ ₁

−1

w(x, y)h(x, y)dx æ

dy を（派生した）確率変数w(X, Y)の期待値と言います。

6.4.1 独立な成分の積

確率変数X, Y は独立であるとし、有限な平均・分散をもつものとします。

このとき、X, Yの密度をそれぞれf(x), g(x)とすれば(X, Y)の密度関数は積f(x)g(y) になりますから

E[XY] = Z ₁

−1

ΩZ 1

−1

xyf(x)g(y)dx æ

dy= Z ₁

−1

xf(x)dx Z ₁

−1

yg(y)dy=E[X]E[Y] が分かります。また、X−E[X]とY −E[Y]も独立ですから共分散は０です：

Cov[X, Y] =E[(X−E[X])(Y −E[Y])] =E[X−E[X]]E[Y −E[Y]] = 0

6.4.2 成分の和

任意の実数a, b, cに対して E[aX+bY +c]

= Z ₁

−1

ΩZ ₁

−1

(ax+by+c)h(x, y)dx æ

dy

=a Z ₁

−1

x ΩZ ₁

−1

h(x, y)dy æ

dx+b Z ₁

−1

y ΩZ ₁

−1

h(x, y)dx æ

dy +c

Z ₁

−1

ΩZ ₁

−1

h(x, y)dx æ

dy

=aE[X] +bE[Y] +c

(3)

Revised at 23:08, December 9, 2015 統計学第6回 http://my.reset.jp/˜gok/math/statistics/ 3 となっている事が分かります。この様に和の期待値は期待値の和ですが、分散は

V ar[X+Y] =V ar[X] + 2Cov[X, Y] +V ar[Y]

となっており、共分散が0でなければ和の分散は分散の和になりません。ただし、特に X, Y が独立であれば（さっき見た様に）共分散は0ですから分散もそれぞれの分散の和になります。

6.5 独立な確率変数の和とたたみこみ

成分が独立な２次元確率変数 = (X, Y)を考えます。任意にとって固定した実数t に対して、不等式x+y≤tを満たす点(x, y)の全体からなる領域をDtとすれば

P[X+Y ≤t] =P[(X, Y)∈Dt] ですが、領域Dtは連立不等式：





−1< x≤t−y

−1< y <1

で表され、また前に見た様にの密度は各成

分の密度f(x), g(x)の積になったので、

P[X+Y ≤t] = ZZ

Dt

f(x)g(y)dxdy= Z ₁

−1

ΩZ t−y

−1

f(x)dx æ

g(y)dy となります。中の積分でx=z−yと変換して積分の順序を交換すれば

P[X+Y ≤t] = Z ₁

−1

ΩZ t

−1

f(z−y)dz æ

g(y)dy= Z t

−1

ΩZ 1

−1

f(z−y)g(y)dy æ

dz となります。従ってこの最後の括弧の中身がX+Y の密度に他なりません。そこで

定義 6.5.1 関数f とgのたたみこみ（convolution）f∗gを次の様に定義します：

(f∗g)(x) = Z ₁

−1

f(x−y)g(y)dy.

と定義すれば、互いに独立な２つの確率変数X, Y の密度関数がそれぞれf(x), g(x)であるとき、X+Y の密度関数はたたみこみ(f∗g)(x)であると言えます。

例題 6.5.2 区間(0,1)上の一様分布の密度関数をf(x)とするとき、たたみこみf∗f を求めて下さい。

この一様分布の密度関数は

f(x) =





1 0< x <1 0 otherwise

ですから、被積分関数のうち第２因子f(y)の方を具体化すると次の様になります：

(f ∗f)(x) = Z ₁

−1

f(x−y)f(y)dy= Z 1

0

f(x−y)dy.

次に残った部分を具体化するわけですが、定義により被積分関数は0< x−y <1すなわちx−1< y < xである範囲以外では０となるのでこの範囲[x−1, x]が積分区間 [0,1]とどう交わるかが問題となります（端点は気にしなくていいです）。これをxの値によって場合分けするわけですが、下図のような絵を描いて目で見て確認しながら考えると良いでしょう：

従って２つの区間の重なりにだけ積分計算が出現して以下の通りになります：

(f∗f)(x) =











0 2≤x

R1

x−1dy 1≤x≤2 Rx

0 dy 0≤x≤1

0 x≤0

=











0 2≤x

−x+ 2 1≤x≤2 x 0≤x≤1

0 x≤0.

これは三角分布ですね。

(4)

Exercise

基本演習6.1 f(x) = ¹₂e^−|^x^|とするとき、たたみ込みf ∗f を求めて下さい。

基本演習6.2 たたみ込みの対称性：f∗g=g∗f を証明して下さい。

基本演習 6.3 ３つの事象A, B, Cのうちどの２つの組（例えば{A, B}など）も独立であるが、{A, B, C}は独立でないような例を作って下さい。要するに、

P[A∩B] =P[A]P[B], P[B∩C] =P[B]P[C], P[C∩A] =P[C]P[A]

は成り立つけれども

P[A∩B∩C]6=P[A]P[B]P[C]

であるような例を挙げて下さい。

また、逆に、P[A∩B∩C] =P[A]P[B]P[C]は成り立つけれどもP[A∩B]6=

P[A]P[B]であるような例を挙げて下さい。

発展演習 6.4 長方形領域D：[0,1]×[1,3]上に一様に分布した確率変数を(X, Y) とするとき、各成分確率変数X, Y はどんな密度関数をもつか調べて下さい。

発展演習 6.5 ２次元の確率変数 = (X, Y)は密度関数 ¹

2πe⁻^x2+y² ² をもつとします。このとき各成分確率変数X, Y の密度関数を求め、また、X, Y が独立であるかどうかも調べて下さい。

発展演習6.6 次の三角分布の密度関数：

w(x) =











x+ 1 −1≤x≤0

−x+ 1 0≤x≤1

0 otherwise

に対してたたみ込みw∗wを計算して下さい。

発展演習 6.7 ２つの独立な標準正規分布の比がCauchy分布に従う事を示して下さい。