先行研究との比較 - 方向統計学におけるノンパラメトリック統計解析

表15は，Hall型LPRとDi Marzio型LPRの性質をまとめたものである．Di Marzio型LPRは，1次のときカーネルの選択がMISEの収束レートに大きな影響を与える点や次数pを上げてもMISEの収束レートが改善できるか不明である点が標準的なLRRと異なっていた．Hall型LPRはこれらの欠点を克服した推定量である．つまり，次数pが奇数であればカーネルに依存することなくMISE[ ˆm(θ;p, h_∗)|Θ_n] = Op(n⁻(2p+4)/(2p+5))となり，偶数のときはMISE[ ˆm(θ;p, h_∗)|Θn] = Op(n⁻(2p+4)/(2p+5))となる．Hall型 LPRは次数pを上げることで推定量の性能を向上できる良い性質を持つ．ただし，6章ではバンド幅hの推定量としてLSCV推定量を用いたが，Hall型LPRに関するLSCV推定量の一致性などの理論的性質は明らかではなく，これは今後の研究課題となっている．

表15: Hall型LPRとDi Marzio型LPRの性質の比較．⃝^{：当てはまる，}×^{：当てはまらない，}△^：VMカーネルのみ当てはまる．

LPR Hall型LPR Di Marzio型LPR

標本空間円周：T ^円周：T

p= 1⇒MISE =Op(n⁻^4/5) ⃝ △

高次のp⇒MISEの収束レートの改善 ⃝ ×

7 方向統計学における多変量ノンパラメトリック回帰 7.1 先行研究

7.1.1 先行研究の分類

方向統計学における多変量ノンパラメトリック回帰の研究としては説明変数がトーラス上で与えられるトーラス上のノンパラメトリック回帰(Di Marzio et al., 2009)や実数・円周上のノンパラメトリック回帰(Qin et al., 2011)がある．これらの研究は，1.4節で述べた実数空間上の多変量ノンパラメトリック回帰(Ruppert

and Wand, 1994)をヒントにして行われた．これらの先行研究を説明変数が定義される空間に応じて分類し

たのが図10である．

これらの多変量ノンパラメトリック回帰の説明をする前にトーラス上の空間と実数・円周上の空間について説明する．q次元トーラス空間T^q ^{とは，円周}T^のq個の直積で与えることができ，T^q :=T× · · ·T^と定義される．q次元の角度変数ベクトルΘ= (Θ1,Θ2, . . . ,Θd)^T はq次元トーラスT^q上の空間で与えられる．例えば,(風向，海鳥の飛び立つ方向)からなる2次元角度変数ベクトルは2次元トーラスT²^{上で与えられ，}2次元トーラスT²^は図10のようなドーナッツのような形となる．実数・円周上の空間R^d×T^{は実数空間}R^d^と円周Tの直積で与えられる．方向統計学でよく用いられるのはシリンダーR×T上の空間である．シリンダー上で定義される変数ベクトルの例は(風速，風向)である．また，(風速，気圧，風向)からなる変数ベクトルはR²×T上で定義されることがすぐに分かる．

Qin et al. (2011)

(シリンダー) Ruppert and Wand (1994)

Di Marzio et al. (2009)

(𝑞次元トーラス)

(実数空間)

(円周)

(実数・円周)

図10: 方向統計学における多変量ノンパラメトリック回帰の分類．

7.1.2 トーラス上のノンパラメトリック回帰

Di Marzio et al. (2009)によるトーラス上のノンパラメトリック回帰の研究について述べる．独立同一分

布からランダムに得られたデータ (Y1,Θ1), . . . ,(Y1,Θn)を考える．Θiはq次元トーラスθ ∈T^q ^で値を持つ説明変数ベクトルであり，Yiは実数直線R上で与えられたスカラーな目的変数とする．

我々は次のような回帰モデルを考える．

Yi=m(Θi) +v^1/2(Θi)εi, (7.1)

ただし，m(Θi) = EY[Y|Θ=θ]は真の回帰関数を，VarY[Y|Θ=θ] =v(θ)は条件付分散を表す．集中度パラメータベクトルをκq :=κIqと定義する．このとき，トーラス上のカーネルKκ_q(θ)は，定義2.1を満たし，かつ，非負の値を取るDi Marzio型カーネルのプロダクトカーネルとして

Kκ_q(θ) :=

∏q j=1

Kκ((Θij−θj)) で定義される．

sin(θ) := (sin(θ₁), . . . ,sin(θ_n))^T とし，回帰係数ベクトルをβ_q := (β₁, . . . , β_q)^T とし，切片をαとおく．

このとき，トーラス上のLLR(: local linear regression) ˆm(θ;κq)は，最小二乗誤差：

∑n i=1

{Yi−α−β^T_q sin(Θi−θ)}²Kκ_q(Θi−θ), (7.2)

を最小にする(α,β_q^T)^T の切片αˆで与えられる．したがって，m(θ;ˆ H)は ˆ

m(θ;p, h) :=e^T₁(S^T_θWθSθ)⁻¹S_θ^TWθY (7.3) となる．ただし，e1は第1要素は1でそれ以外は0となるような(q+ 1)×1ベクトル，Y = (Y1, . . . , Yn) は目的変数ベクトル，

S_θ:=





1 sin(Θ₁−θ)^T ... ... 1 sin(Θ_n−θ)^T



=





1 sin(Θ₁₁−θ₁) · · · sin(Θ_1q−θ_q) ... ... . .. ... 1 sin(Θ_n1−θ₁) · · · sin(Θ_nq−θ_q)



 (7.4)

はn×(q+ 1)デザイン行列，かつ，Wθ:= diag{Kκ_q(Θi−θ), . . . , Kκ_q(Θi−θ)}^はn×n重み付き対角行列を表す．

トーラス上の重み付条件付MISEをMISEY [ ˆm(θ;κq)] := E[∫

T^q{m(θ;ˆ κq)−m(θ)}²f(θ)dθ]と定義する．

トーラス上のLLRの重み付条件付MISEを次の定理として与える．

定理7.1. 次の仮定:

1. ヘッセ行列Hm(θ)は連続である．

2. 周辺密度f(θ)>0は連続微分可能であり，条件付分散v(θ)は連続である．

3. n→ ∞^のとき，η2(Kκ)→0かつR(Kκ)→0である. を満たし，かつ，nが十分大きいならば，漸近的なMISEは

AMISEY [ ˆm(θ;κq)]≃ η2(Kκ)²∫

{∇²m(θ)}²f(θ)dθ

4 +R(Kκ)^q∫

T^dv(θ)dθ n

となる．

定理7.1を見ると集中度パラメータκとカーネルKの分離が難しいので，Di Marzio型LPRと同様に一般的なMISEの収束レートを求めるのは難しい問題であることが分かる．

7.1.3 実数・円周上のノンパラメトリック回帰

Qin et al. (2011)が与えた実数・円周上のノンパラメトリック回帰の定義とその理論的性質について述べ

る．実数・円周R^d×T^{上の説明変数を}Ui= (Xi,Θi)^T とする．ただし，XiはR^d^{上で定義される}d次元変数ベクトルを表す．(Ui, Yi) i= 1, . . . , nはランダムな標本とする．このとき，我々は次のような回帰モデルを考える．

Yi=m(Ui) +v^1/2(Θi)εi, (7.5)

ただし，m(u) = E_Y[Y|U =u]は真の回帰関数を，Var_Y[Y|U =u] =v(u)は条件付分散を表す．実数・円周上のカーネルK_Hκ(U_i−u)は以下のようなプロダクトカーネルとして定義される．

K_Hκ(U_i−u) = 1 h1· · ·hn

∏d j=1

K((X¯ _ij−x_j)/h_j)×K_κ(θ_ij−θ_j), (7.6)

ただし，K¯ は通常の非負カーネルであり，Kκは定義2.1を満たしかつ非負の値を取るDi Marzio型カーネルである．実数・円周上のLLR ˆm(u;H, κ)は，最小二乗誤差：

∑n i=1

{Yi−α−β_d^T(Xi−x)−βd+1sin(Θi−θ)}²KHκ(Ui−u) (7.7) を最小にする(α,β_q^T, βd+1)^Tの切片αˆで与えられる．ただし，

Uu:=





1 (X1−x)^T sin(Θ1−θ) ... ... ... 1 (Xn−x)^T sin(Θn−θ)



 (7.8)

はn×(q+ 1)デザイン行列を表す．したがって，m(u;ˆ H, κ)は ˆ

m(u;H, κ) :=e^T₁(U_u^TW_uU_u)⁻¹U_u^TW_uY (7.9) となる．ただし，e1は第1要素は1でそれ以外は0となるような(d+ 2)×1ベクトル，Y = (Y1, . . . , Yn) は目的変数ベクトル，かつ，Wu:= diag{KHκ(U1−u), . . . , KHκ(Un−u)}^はn×n重み付き対角行列を表す．

実数・円周上のLLRの重み付条件付MISEは次の定理として与えられる．

定理7.2. 次の仮定：

1. n→ ∞^のとき，Hの各成分とn⁻¹|H|⁻^1/2^は0に収束する．

2. ヘッセ行列Hm(u)は，連続とである．

3. 周辺密度f(u)>0は連続微分可能であり，条件付分散v(u)は連続である．

4. n→ ∞^のとき，η2(Kκ)→0かつR(Kκ)→0である. を満たし，かつ，nが十分大きいならば，漸近的なMISEは

AMISEY [ ˆm(u;H, κ)] =

∑

λ,τ=1Cλ,τ(m)˜h²_λ˜h²_τα˜λα˜τ

4 +R( ¯K)^dR(Kκ)∫

v(u)du nh₁· · ·h_d ,

ただし，

C_λ,τ(m) =

∫

(∂/∂u²_λ)m(u)(∂/∂u²_τ)m(u)f(u)du, λ, τ = 1, . . . , d+ 1, であり，ここで，h˜λとα˜λはそれぞれ

˜h_λ= {

h_λ, λ= 1, . . . , d,

1, λ=d+ 1, , α˜_λ= {

α₂( ¯K), λ= 1, . . . , d, η2(Kκ), λ=d+ 1 を表す．

定理7.1と同様な理由で定理7.2の漸近的なMISEの収束レートを求めることは難しい問題である．また，

κとhという異なる平滑化パラメータを一緒に使うことでMISEの形は非常に複雑な形となってしまっている．

ドキュメント内方向統計学におけるノンパラメトリック統計解析 (ページ 58-62)