• 検索結果がありません。

次元縮約の問題における逆説的な現象について

N/A
N/A
Protected

Academic year: 2021

シェア "次元縮約の問題における逆説的な現象について"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

次元縮約の問題における逆説的な現象について

逸見 昌之

データ科学研究系 准教授

2016年6月17日 統計数理研究所 オープンハウス

はじめに】

高次元のデータに対する次元縮約の方法には様々なものがありますが、p次元の共変量ベクトル が与えられた下での1次元の結果変量 の条件付き分布(あるいは条件付き期待値)

が、 (但し はあるp×d 行列でp > d)というpよりも低次元の変量を通してのみ に依存するという仮定の下で定式化された次元縮約の問題は、Li (1991) によって層別逆回帰法(

sliced inverse regression (SIR) が提案されて以来、統計学の分野で様々な研究が成されてきました。これまで提案されてきた方法の多くは、必要に応じてさらにいくつかの仮定を置きな

がら個々に工夫を施すというものでしたが、近年、Ma and Zhu (2012) はこの問題をセミパラメトリック推定の問題と見なし、その一般論による統一的な方法論の枠組みを提示して、これま での提案法の多くが、その特別な場合として見なせることを示しました。しかしながら、そこである不思議な現象が起こることが述べられています。それは、これまで多くの方法で付加され ていた条件が仮に成り立っていたとしても、それを無視して(用いずに)推定を行った方が、推定効率が良くなる、ということです。この逆説的な現象は、後にMa and Zhu (2013) によって厳 密に証明されていますが、ここでは、幾何的な観点からこのような現象が起こるメカニズムについて考察します。なお本研究は、サウスカロライナ大学のYanyuan Ma教授と共同で行ったも のです。

【次元縮約の問題】

次元縮約の条件 ( 行列, ) 中心化部分空間(central subspace) の列ベクトルで張られる最小の部分空間 中心化平均部分空間(central mean subspace の列ベクトルで張られる最小の部分空間 一般性を失うことなく、 とし、 とする。(但し、 d 次単位行列で、 が推定すべきパラメータとなる。)

今回は、中心化部分空間の方について考える。

【推定方程式】

セミパラメトリックモデル

セミパラメトリック推定理論に基づく推定方程式 (但し、 からのランダムサンプル)

次元ベクトル値関数, 次元ベクトル値関数, ,

【既存法との関係】

例えば、SIR (Li, 1991) では、 , 行列

特に、 (線型条件)を仮定、つまり は既知とする。

【関数

m

が既知の場合と未知の場合】

推定方程式 (以下、q=1の場合で考える。)

が未知の場合は、カーネルによるノンパラメトリック推定を行い、 をそれぞれ が既知の場合、未知の場合の(推定方程式の解としての) の推定量とすると、

Ma and Zhu, 2013) 但し、Avar は漸近分散共分散行列を表し、vecl は行列の下側部分をベクトル化したものを表す。

【シミュレーション】

線型条件が成り立っている下で、

サンプル数200、シミュレーション回数1000 (Ma and Zhu, 2013)

【パラメトリックモデルとプラグイン推定量】

に対するパラメトリックモデル 回帰モデル

推定方程式 によってパラメータ を推定 (但し、 はランダムサンプルで、 行列)

特に、最適な重み付け最小二乗推定方程式 の解を として、

の推定方程式 のプラグイン推定量

【3つの推定量の比較】

但し、

ここで、 は に直交し、 は に直交する。

【ノンパラメトリック推定】

(を示唆)

【参考文献】

[1] Li, K. C. (1991). Sliced inverse regression for dimension reduction, Journal of the American Statistical Association, 86, 316-342.

[2] Ma, Y. and Zhu, Z. (2012). A semiparametric approach to dimension reduction, Journal of the American Statistical Association, 107, 168-179.

[3] Ma, Y. and Zhu, Z. (2013). Efficiency Loss Caused by Linearity Condition in Dimension Reduction, Biometrika, 100, 371-383.

X

Y

TX

 

X

Y y X PY y β X y R

P | |

T

β : pd pd S

Y|X

: β

Y XEY β

T

X

E |  | S

EY|X

: β

  Cov   I

p

E X0 , X  

 

 

l

I

d

β : β I

d

β

l

 

1

 

2

 

1 2

,

, y ; ,     y , x    , 

p

X Y

x β x β

T

     a X mβ X   0

g  

 

n

i

q j

T i T j i

j i j

Y

1 1

  X

i

, Y

i

 

ni1

p

X,Y

x , y ; β ,

g j

: p

g a

j

: p

a

p

g

p

d

  pdd  dim β

l

  E

j

 

T

j q

T

j

β X :  a X | β X  1 ,  ,

m

 

j

   

j j

p

T

j

YD E X | Y , a XX , XX

1

,  , X

g D

j

:  p dd p

X β

T

X    β β

T

β β

T

X

E | 

1

m   β Xa   X β X  

j

β

T

X

T j

T

j

:  E |  E X |

    

a X m

β X

 

0

g  

n i

T i T i

Yi

X β

1

m ,

β ~ , β ˆ

m

X,β

β

 

β ˆAvar    β ~

Avar veclvecl

β X α   a   X β X

m

T

, : E |

T

β X

 

a

 

X m

β X α

 

0

A  

n

i i

T i

i T

1 ,

α α   β X

1

,  , X

n

i

T

X

A β

p pa

 

X m

β X α

ε

ε β X

0

ε β X

  

Q β X

aT ,  , E | T  ,V | T : T

β X α

 

β X

 

a

 

X m

β X α

 

0

mα  

n

i i

T i

i T i

T

T Q

1

1 ,

,

α ˆ   β

β

in g

    

a X m

β Xi α

 

β

 

T 0

T i

Yi

1 , ˆ

β β

 

~ 1 1 1

, ,

 

, ,

p

 

1 n

i A i Yi i Yi o

n vecl

n  

  

u X β v X β

β

 

βˆ 1 1 1

, ,

p

 

1 n

i A i Yi o

n vecl

n  

 

u X β

β β

 

1 1 1

, ,

 

, ,

 

, ,

p

 

1 n

i A i Yi i Yi i Y o

n vecl

n  

   

u X β v X β w X β

β β

X Y β

vec

 

g

 

Y E

g

 

Y βTX

  

a

 

X E

a

 

X βTX

 

T

u , , :  |  |

X Y β

vec

 

E

g

 

Y βTX

  

a

 

X E

a

 

X βTX

 

T

v , , : |  |

X β

B B A

 

β X

a

 

X

a

 

X β X

 

w ,Y, :  2 31 TE | T

           

 

T T T

AE a XE a X β X E g Y β Xvecl β

 : | |

 

   

Y

E m X β α β g B2 : α , , 0

 

   

α α  β

α X β α β m X β α α

m , , 0 :  , ,  T | 0

 

     

m X β α β Q β X m X β α β

B3 : E Tα , , 0 1 T α , , 0

X β

u ,Y, v

X,Y,β

 

,w X,Y,β

w

X,Y,β

v

X,Y,β

 

w X,Y,β

C a

b O

(u) v

w

v w w

   

v w

T

v wE   v

T

v

E   

 

βAvar    β ~

Avar vecl   vecl

x0

β

βTXT のとき、 として

 

β X :

a

 

X |β X

c0

m TE T

β X β x

 

β X

a

 

X c

0

n

i i i

T T

i

T Q

1I 0

1

推定方程式 0

   

 

 

n

i

T i

T n

i i

T i

T

I I

1 0

1 0

0 β X β x

X a β x

β X c

期待値関数の滑らかさを仮定して

   

 

 

n

i

T i

T h n

i i

T i

T h

K K

1 0

1 0

0 β X β x

X a β x

β X

c Nadaraya-Watsonノンパラメトリック

カーネル回帰推定量)

参照

関連したドキュメント

In section 2 we present the model in its original form and establish an equivalent formulation using boundary integrals. This is then used to devise a semi-implicit algorithm

Keywords: continuous time random walk, Brownian motion, collision time, skew Young tableaux, tandem queue.. AMS 2000 Subject Classification: Primary:

Key words: Sobolev lifting over invariants; complex representations of finite groups; Q- valued Sobolev functions.. 2020 Mathematics Subject Classification: 22E45; 26A16;

We study the local dimension of the invariant measure for K for special values of β and use the projection to obtain results on the local dimension of the Bernoulli

This paper presents an investigation into the mechanics of this specific problem and develops an analytical approach that accounts for the effects of geometrical and material data on

While conducting an experiment regarding fetal move- ments as a result of Pulsed Wave Doppler (PWD) ultrasound, [8] we encountered the severe artifacts in the acquired image2.

In the present paper, we show that, under the same hypothesis on the diameter of the tree, the group is an HNN extension with finitely presented base group, and hence that the

The existence of a global attractor and its properties In this section we finally prove Theorem 1.6 on the existence of a global attractor, which will be denoted by A , for