多変量正規分布数理統計 2016 S1・S2 Kengo Kato

(1)

2016.7.14. 作成：加藤賢悟補足資料：多変量正規分布

特性関数. n次元確率ベクトルX = (X₁, . . . , X_n)^′に対して，その特性関数を

ϕ(t) = E[eⁱ^∑ⁿ^j=1^t^j^X^j] = E[e^it^′^X], t = (t₁, . . . , t_n)^′ _{∈ R}ⁿ, i =^√₋₁ と定義する．1次元のときと同様に，特性関数と分布は1対1に対応する．

Theorem 1. _{X, Y} _を_n次元確率ベクトルとし，X ∼ F, Y ∼ G^{とする．また，}^{X, Y} ^の特性関数をそれぞれϕ_F, ϕ_Gとおく．このとき，ϕ_F _{≡ ϕ}_Gならば_{F ≡ G}である．

多変量正規分布. X₁, . . . , X_nを独立なr.v.’sとし，X_j _{∼ N(0, 1)}とする．このとき， X = (X₁, . . . , X_n)^′の分布をn次元標準正規分布と呼び，_{X ∼ N(0, I}n⁾と書く．Xの密度関数は

f (x) = ¹ (2π)^n/2^e

−x^′x/2_{, x ∈ R}n

である．また，_{µ ∈ R}ⁿと_{n × n}行列Bに対して，Y = µ + BXとおくと，

E[Y ] = µ, Var(Y ) = B Var(X)B^′ = BB^′

である．このとき，Σ = BB^′とおいて，Y の分布を平均ベクトルµ, 共分散行列Σをもつ多変量正規分布 (multivariate normal distribution)と呼び，Y ∼ N(µ, Σ)^と書く．

(1). 与えられた半正定値対称行列Σに対して，Σ = BB^′をみたす_{n × n}行列Bが存在する．従って，多変量正規分布N (µ, Σ)はあらゆる_{µ ∈ R}ⁿと_{n × n}半正定値対称行列Σ に対して定義される．また，_{|Σ| = |B|}²より，

Σが正則 _{⇔ B}が正則

である．ここで注意すべきなのは，Σ = BB^′をみたす_{n × n}行列Bは一意でないことである．N (µ, Σ)の定義がBの選び方によらないことを確認しよう．_{X ∼ N(0, I}n)の特性関数は

ϕ_X(t) = E[eⁱ^∑ⁿ^j=1^t^j^X^j] =

n

∏

j=1

E[e^it^j^X^j] =

n

∏

j=1

e^−t²^j^/2= e^−t^′^t/2, t = (t₁, . . . , t_n)^′ _{∈ R}ⁿ

だから，Y = µ + BXの特性関数は

ϕ_Y(t) = E[eît^′^Y] = E[eît^′^(µ+BX)] = eît^′^µE[eî(B^′^t)^′^X]

= ϕ_X(B^′t) = e^it^′^µe^−t^′^BB^′^t/2 = e^it^′^µ−t^′^Σt/2

1

(2)

であって，Bの選び方によらない．特性関数と分布は1対1に対応していることから，Y

の分布はΣ = BB^′をみたす_{n × n}行列Bの選び方によらないことがわかる．

(2). Bが正則のとき，Y の密度関数を求めてみよう．y = µ + Bxより，x = B⁻¹_{(y − µ)} であって，変換_{y 7→ x}のJacobianは_1/|B|である．ここで，_{|Σ| = |B|}²より，||B|| = |Σ|^1/2 だから，

f_Y(y) = ¹

(2π)^n/2_|Σ|^1/2^exp {

−¹₂^(B⁻¹(y − µ))^′^(B⁻¹(y − µ)) }

= ¹

(2π)^n/2_|Σ|^1/2^exp {

−¹

2^{(y − µ)}

′_Σ−1_{(y − µ)}

}

となる．

(B⁻¹)^′B⁻¹ = (B^′)⁻¹B⁻¹ = (BB^′)⁻¹= Σ⁻¹ という関係を使った．

(3). Cov(Y_j, Y_k) = 0 ∀j ̸= k^なら，^Y1, . . . , Y_nは独立になる．実際，Cov(Y_j, Y_k) = 0 ∀j ̸= k^なら，^Σ^{は対角行列になる：}

Σ =







σ²₁ 0 _{· · ·} 0 0 σ²₂ _{· · ·} 0 ... ^... . .. ... 0 0 _{· · · σ}_n²





 .

ここで，σ_j² = Var(Yj), 1 ≤ j ≤ n^{である．そこで，}

B =˜







σ₁ 0 _{· · ·} 0 0 σ₂ _{· · ·} 0 ... ^... . .. ... 0 0 _{· · · σ}n







とおくと，B^˜はΣ = ˜B ˜B^′をみたすから，

Y = ˜^d BX = (σ₁X₁, . . . , σ_nX_n)^′

を得る．よって，Y₁, . . . , Y_nは独立であって，Y_j _{∼ N(0, σ}_j²)となることが示された． (4). 任意の_{m × n}行列Aに対して，AY ∼ N(Aµ, AΣA^′⁾^{となる．実際，}^Y ^{の特性関数} はϕ_Y(t) = E[e^it^′^Y] = e^it^′^µ−t^′^Σt/2だから，AY の特性関数は

E[eît^′ÂY] = E[eî(A^′^t)^′^Y] = ϕ_Y(A^′t) = eît^′Âµ−t^′ÂΣA^′^t/2

である．これはN (Aµ, AΣA^′)の特性関数だから，AY ∼ N(Aµ, AΣA^′⁾^を得る．

(5). (4)より，Σの第(j, j)成分をσ²_j とおくと，各Y_j の周辺分布はN (µ_j, σ²_j)である．すなわち，多変量正規分布に従う確率ベクトルの各成分の周辺分布は正規分布になる．こ

2

(3)

の逆は成り立たない．すなわち，周辺分布が正規分布である1次元確率変数を並べたベクトルが多変量正規分布に従うとは限らない．例えば，U, V ∼ N(0, 1)^{を独立とし，}

W =







U _{if U V ≥ 0}

−U if UV < 0

と定めると，_−U = U^d であって，P (U V = 0) = 0だから，

P (W ≤ x) = P (U ≤ x, UV ≥ 0) + P (−U ≤ x, (−U)V > 0) = 2P (U ≤ x, UV > 0). ここで，{UV > 0} = {U > 0, V > 0} ∪ {U < 0, V < 0}^だから，

P (W ≤ x) = 2{P (0 < U ≤ x)P (V > 0) + P (U < min{x, 0})P (V < 0)} = P (U ≤ x). よって，W ∼ N(0, 1)^{である．しかし，}^{(U, W )}^は集合S = {(u, w) : w = u or w = −u}^に集中していて，Sは面積0なので，(U, W )は同時密度をもたない．仮に(U, W )が多変量正規分布に従う場合，(U, W )が同時密度をもたないのは，(U, W )の共分散行列が正則でない場合のみであって，それはCorr(U, W ) = 1かCorr(U, W ) = −1^{のいずれかである．} しかし，W の定義からそのいずれも起こり得ないので，(U, W )は多変量正規分布に従わないことが示された．

3

多変量正規分布 数理統計 2016 S1・S2 Kengo Kato

多変量正規分布数理統計 2016 S1・S2 Kengo Kato