• 検索結果がありません。

dvi

N/A
N/A
Protected

Academic year: 2021

シェア "dvi"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

20081216 日・筑波大学)

Shrinkage estimators for covariance matrices in

multivariate complex normal distributions

日本女子大学理学部   今野 良彦

(2)

この講演の目的と構成

 近年,データ数よりも変量の次元が高いデータ( 高次元データ)の解析のた

めの多変量推測理論の構築が注目を集めている.本講演では,高次元データの 設定のもとで多変量複素正規分布の共分散行列(Large Covariance matrix)の推 定問題を統計的決定理論の枠組みで考察した結果を報告する. 本講演の構成 (1) 複素正規分布と複素 Wishart 分布について; (2) 記号と問題設定; (3) 先行研究について; (4) 推定量のクラスとリスクの評価の方針(SURE 法); (5) リスクの不偏推定量(SURE)の導出; (6) 改良型推定量について.

(3)

複素正規分布

(1)

 複素確率変数 XX = ReX + √−1ImX, [X] =  ReX ImX  ; ReX, ImXX の実部と虚部.  X は標準複素正規分布 N(0, 1) に従うとは [X] =  ReX ImX  ∼ N2(  0 0  , 12  1 0 0 1  ).  X の確率密度関数(w.r.t. Lebesgue measure on )は

(4)

複素正規分布

(2)

 Z ∼ N(0, 1), θ ∈ , σ ∈ + に大して X := θ + σZ ∼ N(θ, σ2).  X ∈ p は複素確率ベクトルとする.∀c ∈ pθ ∈ pΣ ∈ Herm(p, ) + に対して, cX ∼ N(cθ, cΣc) ⇐⇒ X ∼ Np(θ, Σ).

ただし ,cc の transpose complex conjugate である.

 X ∼ Np(θ, Σ) の確率密度関数(w.r.t. Lebesgue measure on p )は

fX(x) = 1

(5)

複素正規分布

(3)

 Z ∼ Np(θ, Σ) のとき, [Z] :=  Re Z Im Z  ∼ N2p(  Re θ Im θ  ,  Re Σ −Im Σ Im Σ Re Σ  ) ただし ,Re Σ, Im Σ は symmetric と skew-symmetric.

(6)

複素

Wishart

分布

(1)

 p 次元複素確率ベクトル Z1, Z2, · · · , Zn は独立同一に Np(0, Σ) に従うと する.このとき, W := n  i=1 ZiZi は母数 Σ, p, n の複素 Wishart 分布に従うといい, Wp(Σ, n) と書く.  n ≥ p のとき,(W は正定値) = 1 で,W の確率密度関数(w.r.t. Lebesgue measure on Herm+( , p) )fW(w) = Det (w) n−p exp(−Tr (wΣ−1)) Det (Σ)nπp(p−1)/2Πp j=1Γ(n + 1 − j), w ∈ Herm +( , p)

(7)

記号と問題設定

(1)

 Z1, Z2, . . . , Zn ∼ Np(0, Σ).各 Zi(i = 1, 2, . . . , n)p 変量確率(縦) ベクトルで,独立同一に p 変量複素正規分布に従う.ただし ,Σp × p の 正値エルミート行列で未知.  n は (標本数 - 1) で,p は変量の次元.  Wishart 確率行列(p × p の行列) W := nk=1 ZiZi.ただし ,“ ”はベク トルや行列の transpose complex conjugate を示す.

 共分散行列 Σ の推定問題を損失関数 L( Σ, Σ) = Tr ( ΣΣ−1 − Ip)2 のもとで考える.ここで,Σ は Σ の推定量,Ipp × p の単位行列,Tr は行列のトレースを表す.  W の分布に関する損失関数 L の期待値R( Σ, Σ) := [L( Σ, Σ)] をリスク とよぶ.Σ に関して一様に推定量のリスクを比較したい.

(8)

記号と問題設定

(2)

 平均を 0 としたことは本質的ではない;  Wishart 確率行列 W は正定値 ⇐⇒ n ≥ p;  Wishart 確率行列 W の分布は(n は正整数のとき)常に存在するが,確率 密度関数はn ≥ p のとき存在;  変換 Σ → A  ΣA; Σ → AΣA(Ap × p の正則行列)に関して不変な損 失関数: L( Σ, Σ) = Tr ( ΣΣ−1− Ip)2; LS( Σ, Σ) = Tr ( ΣΣ−1) − log Det( ΣΣ−1) − p. ただし ,Det は行列式.しかし ,n < p のとき,LSn−1WLS の期待 値)を評価できない.

(9)

先行研究について

(1)

推定量 n−1W の問題点    [n −1W ] = Σ だが,n−1W の固有根は,Σ の固有根よりも広がってい る.(Marchenko-Pastur law).  n < p のとき,Σ は正定値であるにもかかわらず,n−1W は正定値では ない.

(10)

先行研究について

(2)

n ≥ p の場合の先行研究

 損失関数 LS のもとでは,n−1W の固有根をShrinkage-expansion method を 用いた改良型推定量. Svensson (2004), Konno (2007a, 2007b), Konno(2009).  リスクを評価するために,SURE 法が有効 — 部分積分の公式と eigenvalue-caluculus  → n < p の場合は?

 損失関数 L のもとでは,Konno (2009)(Haff (1980)は実 Wishart の場合 )

(11)

先行研究について

(3)

n < p の場合の実 Wishart 行列に対する先行研究

 S ∼ Wp(Σ, n) とする.ただし ,Σ は正定値行列である;

 Ledoit and Wolf (2004):損失関数Tr( Σ − Σ)2 のもとで,n−1SIp の線

形結合のなかで漸近的(n/p は有界)に最適なもの.積率の条件のみで分布に

依存しない結果;

 Wu and Pourahmadi (2003), Bickel and Levina (2008): banding approach.

 漸近的に評価;

 Furrer and Bengtsson (2007): “tapering”;  AOS (2009) に特集.

(12)

問題設定の復習

 Z1, Z2, . . . , Zn ∼ Np(0, Σ).各 Zi (i = 1, 2, . . . , n)p 変量確率(縦) ベクトルで,独立同一に p 変量複素正規分布に従う.ただし ,Σp × p の 正値エルミート行列で未知.  n は (標本数 - 1) で,p は変量の次元;  Wishart 確率行列(p × p の行列) W := nk=1ZiZi に基づき,共分散行列 Σ の推定問題を損失関数 L( Σ, Σ) = Tr ( ΣΣ−1 − Ip)2 のもとで考える.ここで,Σ は Σ の推定量;  W の分布に関する損失関数 L の期待値R( Σ, Σ) := [L( Σ, Σ)] をリスク とよぶ.Σ に関して一様に推定量のリスクを比較したい.

(13)

推定量のクラス

 W = ni=1 ZiZiを分解する:1 ≥ · · · nW の固有値で, W = U1LU1, L = Diag(1, . . . , ln); U1 は p × n の半直交行列 s.t. U1U1 = In. 推定量のクラス   Σ = U 1Ψ(L)U1, (1) ただし ,Ψ := Ψ(L) = Diag(ψ1, ψ2, . . . , ψn) でψk := ψk(L)(k = 1, 2, . . . , n) は n から  への可微分関数. 目標  Σ に依存するリスク[Tr ( ΣΣ −1 − I p)2] を評価したい!

(14)

推定量のクラスとリスクの評価の方針(

SURE

)

 リスク[Tr ( ΣΣ −1 − I p)2] の不偏推定量R(  Σ) ( ϕ1, . . . , ϕn1, . . . , n を 通して W のみ依存 )を導出: [Tr ( ΣΣ −1 − I p)2] = [ R( Σ)]  [Tr (n −1W Σ−1 − I p)2] は定数リスクなので,  R( Σ) ≤ [Tr (n −1−1 − I p)2] ならば, [Tr ( ΣΣ −1 − I p)2 [Tr (n −1W Σ−1 − I p)2] がわかる. SURE の導出 推定量の族 (1) に対して,リスクの不偏推定量R(  Σ) を導出 する.

(15)

部分積分の公式と

SURE

(1)

 (zij)i=1, ..., n; j=1, ..., p := [Z1, Z2, . . . , Zn] ∼ Nn×p(0, In ⊗ Σ);  n × p の行列作用素 Z を次で定める: Z =  ∂zij  i=1, 2, ..., n j=1, 2, ..., p =  1 2 ∂(Re zij) − −1 2 ∂(Im zij)  i=1, 2, ..., n j=1, 2, ..., p ;  行列 ZA(i, j) 成分を (∇ZA)ij = p  k=1 ∂akj ∂zik for i = 1, 2, . . . , n; j = 1, 2, . . . , p.

(16)

部分積分の公式と

SURE

(2)

補題1  [Z1, Z2, . . . , Zn] ∼ Nn×p(0, In ⊗ Σ) とし ,W = ni=1 ZiZi とおいたとき,p × p 関数 G = G(W ) に対して,  −1W G] =  [nG + (Z  Z)G]. 特に, [Tr (Σ −1W G)] = [nTr (G) + Tr (Z ∇ZG)]. ただし , は転置.

(17)

部分積分の公式と

SURE

(3)

 補題 1 において,G = U1Diag(−11 ψ1, . . . , −1n ψn)U1 とおく: 補題 2  それぞれの期待値が存在するとき,  −1U 1ΨU1] =   U1Ψ(1c)U1 + Tr (L−1Ψ)(Ip − U1U1)  . ただし ,Ψ(1c) = Diag(ψ1(1c), ψ2(1c), . . . , ψn(1c)) で ψk(1c) = nb=k ψk−ψb k−b + ∂ψk ∂k

(k = 1, 2, . . . , n).  特に,complex analog of Kubokawa and Srivastava (2008)’s identity として,  [Tr {Σ −1U 1ΨU1}] =  ⎡ ⎣n k=1 ⎧ ⎨ ⎩(p − n) ψk k + ∂ψ k ∂k + n  b=k ψk − ψb k − b ⎫ ⎬ ⎭ ⎤ ⎦ .

(18)

部分積分の公式と

SURE

(4)

補題 3  Σ = U 1Ψ(L)U1 に対して, [Tr {Σ −1U 1ΨU1Σ−1U1ΨU1}] = [Tr {Σ −1U 1Ψ(1)U1}]. ただし ,Ψ(1) = Diag( ˜ψ1(1), ˜ψ2(1), . . . , ˜ψn(1)) で ˜ ψk(1) = (p − n)ψk2 k + 2ψk · ∂ψk ∂k + 2ψk · n  b=k ψk − ψb k − b , k = 1, 2, . . . , n.

(19)

部分積分の公式と

SURE

(5)

定理 4  Σ = U 1Ψ(L)U1 に対して, R( Σ, Σ) =  n k=1  (p − n) ψ (1) k k − 2 ψk k  + ∂ ψ (1) k ∂k − 2 ∂ψk ∂k  + n  b=k ( ψk(1) − 2ψk) − ( ψb(1) − 2ψb) k − b  + p  . ただし ,ψk(1) = (p − n)ψk2/k + 2ψk(∂ψk/∂k) + 2ψk nb=kk − ψb)/(k − b) (k = 1, 2, . . . , n).

(20)

改良型推定量

(1)

推定量の族  n < p とする.つぎの推定量の族を考える:  Σt = p + n1 W + t Tr W+U1U1  . ただし ,U1p × n の半直交行列で, W の正の固有値に対応する固有ベクト ルを並べたのもの,SW+ は S の Moore-Penrose の逆行列,t は正の定数で ある. 結果  Σt のリスクの不偏推定量(SURE)を導出し,リスクを評価することに より次の結果を得る. 0 < t < 2(n − 1)(p − n + 1)/{(p − n + 1)(p − n + 2)} のとき,すべての Σ に 対して,R( Σt, Σ) ≤ R(n−1W , Σ) が成立する.

(21)

改良型推定量

(2)

 Σt は正定値ではない.  p+n1 W + Tr Wt +U1U1  を修正したもの:  Σt = p + n1 W + Tr Wt Ip.  残念なことに,推定量 Σt のリスクを SURE を用いて評価できない!  数値実験で調べたい.

参照

関連したドキュメント