先行研究との比較

推定量とDPI推定量は，分布の非対称性の影響をほとんど受けていないことが分かる．

LSCV推定量の性能は不安定であるためにサンプルサイズnが小さいときはDPI推定量を用いるべきである．サンプルサイズnが十分に大きいとき，LSCV推定量とDPI推定量の性能の優位性は分布の形状の影響を受けているので，どちらの推定量を採用するかは，分析者が2つの推定量を用いたKDEを構築したうえで両者の結果を比較して判断すべきである．

5 Di Marzio ^{型局所多項式回帰} [Tsuruta and Sagae (2017d)]

5章では，Di Marzio et al. (2009)が与えたDi Marzio型LPRについて議論する．また，Tsuruta and Sagae (2017d)が明らかにしたDi Marzio型LPRの理論的性質やVMカーネルとWCカーネルを適用した場合の理論的性質について述べる．

5.1 Di Marzio 型局所多項式回帰の定義とその理論的性質

ランダムな2変数標本(Y₁,Θ₁), . . . ,(Y_n,Θ_n)について目的変数Y_i∈R^{と説明変数}Θ_i∈T= [−π, π)との関係を推定する問題を考える．ただし，Y_iは次の仮定を満たすとする．

Yi=m(Θi) +v(Θi)^1/2εi, i= 1, . . . , n, (5.1) ここで，回帰関数mは周期性m(θ) =m(θ+ 2π)を持つ．(5.1)についてその他の仮定に関しては(1.23)と同様であるとする．m(θ)の推定量は周期性を持つことが望ましいだろう．しかし，1.3節で定義した標準的な

LPRは，(1.22)や(1.23)を見ても分かるように，有限標本の下では周期性を持たない．

説明変数が角度変数Θi であるときは，周期性を持つ新しいノンパラメトリック回帰が必要となる．Di Marzio et al.(2009)は，周期性を満たすノンパラメトリック回帰としてsine型局所多項式回帰(S-LPR: sine local polynomial regression)を提案した．彼らは，θ= sin⁻¹(sin(θ))と考えればθ≃sin(θ)で近似できることから，sine級数型のテイラー展開:

m(Θi) =m(θ) +

∑p j=1

m^(j)(θ) sin(Θi−θ)^j (5.2)

が成り立つと主張した．円周上の非負カーネルとsine級数型の多項式β0+∑p

j=1βsin(· −θ)^p を用いて，

S-LPR ˆm(θ;p, κ)は，次の重み付二乗誤差：

∑n i=1

{Y_i−β₀−β₁sin(Θ_i−θ)− · · · −β_psin(Θ_i−θ)^p}²K_κ(Θ_i−θ) (5.3)

を最小にする( ˆβ0,βˆ1, . . . ,βˆp)^T の切片βˆ0で与えられる．したがって，m(x;ˆ p, κ)は ˆ

m(θ;p, κ) :=e^T₁(S_θ^TWθSθ)⁻¹S_θ^TWθY (5.4) となる．ただし，e¹は第1要素は1でそれ以外は0となるような(p+ 1)×1ベクトル，Y = (Y₁, . . . , Y_n) は目的変数ベクトル:

Sθ:=





1 sin(Θ1−θ) · · · sin^p(Θ1−θ) ... ... . .. ... 1 sin(Θn−θ) · · · sin^p(Θn−θ)





はn×(p+ 1)デザイン行列，W_θ:= diag{K_κ(Θ₁−θ), . . . , K_κ(Θ_n−θ)}^はn×n重み付き対角行列を表す．

S-LPRに定義2.1で与えたDi Marzio型カーネルを適用したものを本稿ではDi Marzio型LPR ˆm(x;p, κ) と呼ぶことにする．

例えば，p= 0のとき，(5.4)からm(θ; 0, κ)ˆ は ˆ

m(θ; 0, κ) =∑

Kκ(Θi−θ)Yi

/ ∑

Kκ(Θi−θ) (5.5)

となる．また，p= 1のとき，(5.4)からm(θ; 1, κ)ˆ は次式に等しい．

m(θ; 1, κ) :=n⁻¹∑

{sˆ2(θ;κ)−ˆs1(θ;κ) sin(Θi−θ)}Kκ(Θi−θ)Yi

s2(θ;κ)ˆs0(θ;κ)−ˆs1(θ;κ)² , (5.6) ただし，sˆl(θ;κ) :=n⁻¹∑

isin(Θi−θ)^lKκsin(Θi−θ)である．(5.5)と(5.6)からm(θ; 0, κ)ˆ とm(θ; 1, κ)ˆ は周期性を持つことが示される．同様に考えれば，p≥2のときもDi Marzio型LPRは周期性の性質を持つことは容易に分かる．

高次のDi Marzio型LPRの理論的性質を導出することは難しいので，5章ではp= 1のときの理論的性質

のみを議論することにする．

Θn :={Θ1, . . . ,Θn}とおく．また，条件付バイアスをBiasY[ ˆm(θ;κ)|Θn] =: EY[ ˆm(θ;κ)|Θn]−m(θ)とし，条件付分散をVar_Y[ ˆm(θ;κ)|Θ_n]とする．

Di Marzio et al. (2009)は次の定理として条件付バイアスと条件付分散を与えた．

定理5.1. 次の4つの仮定：

i) limn→∞n⁻¹R(Kκ) = 0.

ii) limn→∞γj(κ) = 1.

iii) 周辺密度f(θ)は連続微分可能である．ただし，任意のθについてf(θ)>0である．

iv) 導関数m^′′(θ)と条件付分散v(θ)はそれぞれ連続である．

を満たすならば，そのとき，条件付バイアスは

BiasY[ ˆm(θ; 1, κ)|Θn]≃η2(Kκ)m^′′(θ)

2! (5.7)

となり，条件付分散は

VarY[ ˆm(θ; 1, κ)|Θn]≃R(Kκ) v(θ)

nf(θ) (5.8)

となる．

2章で議論したのと同様な理由でη2(Kκ)とR(Kκ)に関してκとカーネルKを分離するのは難しいので，

一般的な条件付MSEの収束レートを求めるのは困難である．

定理5.1と中心局限定理からm(θ; 1, κ)ˆ の漸近正規性が成り立つことを示す．

定理5.2. 定理5.1のすべての仮定が成り立つと仮定する．そのとき，n→ ∞^ならば，

√n/R(K_κ)[ ˆm(θ; 1, κ)−E_Y[ ˆm(θ; 1, κ)|Θ_n]]−→^d N(0, v(θ)/f(θ)), (5.9)

が成り立つ．

定理5.2の証明の詳細に関してはAppendix Kを参照すること．

ドキュメント内方向統計学におけるノンパラメトリック統計解析 (ページ 46-49)

5 Di Marzio 型局所多項式回帰 [Tsuruta and Sagae (2017d)]

5.1 Di Marzio 型局所多項式回帰の定義とその理論的性質

5 Di Marzio ^{型局所多項式回帰} [Tsuruta and Sagae (2017d)]