2016.7.14. 作成:加藤賢悟 補足資料:多変量正規分布
特性関数. n次元確率ベクトルX = (X1, . . . , Xn)′に対して,その特性関数を
ϕ(t) = E[ei∑nj=1tjXj] = E[eit′X], t = (t1, . . . , tn)′ ∈ Rn, i =√−1 と定義する.1次元のときと同様に,特性関数と分布は1対1に対応する.
Theorem 1. X, Y をn次元確率ベクトルとし,X ∼ F, Y ∼ Gとする.また,X, Y の特 性関数をそれぞれϕF, ϕGとおく.このとき,ϕF ≡ ϕGならばF ≡ Gである.
多変量正規分布. X1, . . . , Xnを独立なr.v.’sとし,Xj ∼ N(0, 1)とする.このとき, X = (X1, . . . , Xn)′の分布をn次元標準正規分布と呼び,X ∼ N(0, In)と書く.Xの密度 関数は
f (x) = 1 (2π)n/2e
−x′x/2, x ∈ Rn
である.また,µ ∈ Rnとn × n行列Bに対して,Y = µ + BXとおくと,
E[Y ] = µ, Var(Y ) = B Var(X)B′ = BB′
である.このとき,Σ = BB′とおいて,Y の分布を平均ベクトルµ, 共分散行列Σをもつ 多変量正規分布 (multivariate normal distribution)と呼び,Y ∼ N(µ, Σ)と書く.
(1). 与えられた半正定値対称行列Σに対して,Σ = BB′をみたすn × n行列Bが存在 する.従って,多変量正規分布N (µ, Σ)はあらゆるµ ∈ Rnとn × n半正定値対称行列Σ に対して定義される.また,|Σ| = |B|2より,
Σが正則 ⇔ Bが正則
である.ここで注意すべきなのは,Σ = BB′をみたすn × n行列Bは一意でないことで ある.N (µ, Σ)の定義がBの選び方によらないことを確認しよう.X ∼ N(0, In)の特性 関数は
ϕX(t) = E[ei∑nj=1tjXj] =
n
∏
j=1
E[eitjXj] =
n
∏
j=1
e−t2j/2= e−t′t/2, t = (t1, . . . , tn)′ ∈ Rn
だから,Y = µ + BXの特性関数は
ϕY(t) = E[eit′Y] = E[eit′(µ+BX)] = eit′µE[ei(B′t)′X]
= ϕX(B′t) = eit′µe−t′BB′t/2 = eit′µ−t′Σt/2
1
であって,Bの選び方によらない.特性関数と分布は1対1に対応していることから,Y
の分布はΣ = BB′をみたすn × n行列Bの選び方によらないことがわかる.
(2). Bが正則のとき,Y の密度関数を求めてみよう.y = µ + Bxより,x = B−1(y − µ) であって,変換y 7→ xのJacobianは1/|B|である.ここで,|Σ| = |B|2より,||B|| = |Σ|1/2 だから,
fY(y) = 1
(2π)n/2|Σ|1/2exp {
−12(B−1(y − µ))′(B−1(y − µ)) }
= 1
(2π)n/2|Σ|1/2exp {
−1
2(y − µ)
′Σ−1(y − µ)
}
となる.
(B−1)′B−1 = (B′)−1B−1 = (BB′)−1= Σ−1 という関係を使った.
(3). Cov(Yj, Yk) = 0 ∀j ̸= kなら,Y1, . . . , Ynは独立になる.実際,Cov(Yj, Yk) = 0 ∀j ̸= kなら,Σは対角行列になる:
Σ =
σ21 0 · · · 0 0 σ22 · · · 0 ... ... . .. ... 0 0 · · · σn2
.
ここで,σj2 = Var(Yj), 1 ≤ j ≤ nである.そこで,
B =˜
σ1 0 · · · 0 0 σ2 · · · 0 ... ... . .. ... 0 0 · · · σn
とおくと,B˜はΣ = ˜B ˜B′をみたすから,
Y = ˜d BX = (σ1X1, . . . , σnXn)′
を得る.よって,Y1, . . . , Ynは独立であって,Yj ∼ N(0, σj2)となることが示された. (4). 任意のm × n行列Aに対して,AY ∼ N(Aµ, AΣA′)となる.実際,Y の特性関数 はϕY(t) = E[eit′Y] = eit′µ−t′Σt/2だから,AY の特性関数は
E[eit′AY] = E[ei(A′t)′Y] = ϕY(A′t) = eit′Aµ−t′AΣA′t/2
である.これはN (Aµ, AΣA′)の特性関数だから,AY ∼ N(Aµ, AΣA′)を得る.
(5). (4)より,Σの第(j, j)成分をσ2j とおくと,各Yj の周辺分布はN (µj, σ2j)である. すなわち,多変量正規分布に従う確率ベクトルの各成分の周辺分布は正規分布になる.こ
2
の逆は成り立たない.すなわち,周辺分布が正規分布である1次元確率変数を並べたベク トルが多変量正規分布に従うとは限らない.例えば,U, V ∼ N(0, 1)を独立とし,
W =
U if U V ≥ 0
−U if UV < 0
と定めると,−U = Ud であって,P (U V = 0) = 0だから,
P (W ≤ x) = P (U ≤ x, UV ≥ 0) + P (−U ≤ x, (−U)V > 0) = 2P (U ≤ x, UV > 0). ここで,{UV > 0} = {U > 0, V > 0} ∪ {U < 0, V < 0}だから,
P (W ≤ x) = 2{P (0 < U ≤ x)P (V > 0) + P (U < min{x, 0})P (V < 0)} = P (U ≤ x). よって,W ∼ N(0, 1)である.しかし,(U, W )は集合S = {(u, w) : w = u or w = −u}に 集中していて,Sは面積0なので,(U, W )は同時密度をもたない.仮に(U, W )が多変量 正規分布に従う場合,(U, W )が同時密度をもたないのは,(U, W )の共分散行列が正則で ない場合のみであって,それはCorr(U, W ) = 1かCorr(U, W ) = −1のいずれかである. しかし,W の定義からそのいずれも起こり得ないので,(U, W )は多変量正規分布に従わ ないことが示された.
3