ある極限定理 - ランダム - ワイル - サンプリング

4.2 ランダム - ワイル - サンプリング

4.2.3 ある極限定理

注意11 RWSの場合，アリスがどんなω⁰ = (x, α) ∈ {0,1}^{2m+2 j} を選ぶべきでないか，について少しだけ助言をすることができる．それは，とくにαを簡単な数にしないことである．極端な場合α=(0,0, . . . ,0)∈ {0,1}^m⁺^j と選ぶとRWSはほぼ完全に失敗することがすぐ分かる(cf. §1.6.1)．

∫

T¹

dx f (x)

∫

T¹

dαh((n⁰−n)α)

∫

T¹dx f (x)

∫

T¹dαh(α).

よく知られているようにワイル変換はルベーグ確率空間(T¹,B,P)上でエルゴード的であり，従って f ∈ L¹(T¹,B,P)に対して大数の法則が成り立つ．とくに f が滑らかな関数のときは大数の法則の収束が早い．実際，exp(2kπ√

−1 x)，0, k∈Z，の場合，

1 N

XN n=1

e²

√−1πk(x+nα) = 1

N × 1−e²^√⁻¹^π^Nk^α 1−e²^√⁻¹^π^k^α ×e²

√−1πk(x+α) =O 1

, N → ∞.

∫

T¹exp(2kπ√

−1 x)dx= 0であるから，大数の法則の収束速度がO(N⁻¹)であることを示し

ている．一般の関数のときはフーリエ(Fourier)級数で近似すればよい．このとき，滑らかな関数ほどフーリエ係数が速く0に収束するので，その場合の大数の法則も，ほとんど O(N⁻¹)に近い速さで収束するのである．

RWSはα∈ T¹を x ∈T¹ とともにランダムに選ぶ．選ばれるαは確率1で無理数であり，従って，上の段落で述べたことが確率1で成り立っている．このことから想像されることは，RWSに関する大数の法則はi.i.d.-サンプリングの場合より収束が早いであろう，

ということである．実際，1 ≤ p < 2なる pに対しては，RWSの p次平均誤差に関して次の極限定理がある．

定理19 ([7, 26]) 2乗可積分関数 f :T¹ →Rおよび1≤ p< 2に対して

Nlim→∞

∫∫

T¹×T¹

√1 N

XN n=1

f (x+nα)−

∫

T¹

f (y)dy!

dαdx = 0. 従って，任意のρ >0について

Nlim→∞P²

(x, α)∈T²

√1 N

XN n=1

f (x+nα)−

∫

T¹

f (y)dy! > ρ

=0. (110) すなわち，標本平均の中心極限定理のスケーリングによる極限分布は退化する．

証明. 簡単のため∫

T¹dx f (x) = 0を仮定する．M ∈Nに対して関数F_M : T^k → Rを次のように定義する:

f_M(t) := X

|l|≤M

bf (l)e²

√−1πlt,

ただし bf (l)はF のフーリエ(Fourier)係数，すなわち bf (l) =

∫

T¹

dt f (t)e⁻²^√⁻¹^π^lt.

∫

T¹dt f (t)=0から bf (0)=0が従うことに注意せよ．任意の1< p< 2を固定する．三角不等式，ヘルダー(H¨older)の不等式，および定理18によって

√1 N

XN n=1

f (x+nα) _p :=





∫ ∫

T¹×T¹

dαdx

√1 N

XN n=1

f (x+nα)

p





1 p

≤

√1 N

XN n=1

fM(x+nα) _p+

√1 N

XN n=1

( f − fM)(x+nα) _p

≤

√1 N

XN n=1

f_M(x+nα) _p+

√1 N

XN n=1

( f − f_M)(x+nα) ₂

√1 N

XN n=1

f_M(x+nα) _p+ p

Var( f − f_M). (111)

(111)の最後の辺の第一項を詳しく計算しよう．f_Mの定義によって

√1 N

XN n=1

f_M(x+nα) = X

0<|l|≤M



bf (l)e²

√−1πlx× 1

√N XN

n=1

e²

√−1πnlα



 だから，L^p(T²,dαdx)-ノルムをとれば

√1 N

XN n=1

f_M(x+nα)

_p ≤ X

0<|l|≤M

bf (l)





∫

T¹

dα

√1 N

XN n=1

e²^√⁻¹^π^nl^α

p





1/p

= X

0<|l|≤M

bf (l)





∫

T¹

dα

√1 N

XN n=1

e²

√−1πnα

p





1/p

, ここで変換T¹3α7→lα∈T¹がルベーグ測度を保存することを用いた．そして

∫

T¹

dα

√1 N

XN n=1

e²

√−1πnα

∫ ¹₂

dα

√1 N

XN n=1

e²

√−1πnα

∫ 1

1 2

dα

√1 N

XN n=1

e²

√−1πnα

= 2

∫ ¹₂

dα

√1 N

XN n=1

e²^√⁻¹^πⁿ^α

= 2

∫ ¹

dα 1

√N

sinπNα sinπα

= 2

∫ ^N₂

dt N

√N sinπt sinπ_N^t

^p (変数変換Nα= t)

= 2 1 N

!₂^p₊1∫ ^N

dt π_N^t

sinπ_N^t

^psinπt πt

^pN^p

= 2 1 N

!₁₋^p₂ ∫ ^N₂

dt π_N^t

sinπ_N^t

^psinπt πt

< 1 N

!1−^p2

2 π

2 p∫ _∞

dtsinπt πt

^p,

ここで0< y< π/2ならばy/sin y< π/2であることを用いた．これより

√1 N

XN n=1

f_M(x+nα)

_p ≤ X

0<|l|≤M

bf (l)





∫

T¹

dα

√1 N

XN n=1

e²

√−1πnα

p





1/p

N−→→∞0.

従って結局

N→∞lim

√1 N

XN n=1

f (x+nα)

_p ≤ p

Var( f − f_M) −→

M→∞ 0.

数値積分の観点からは極限(110)は中心極限定よりもずっと望ましい．(110)によれば，

サンプル数N が大きければ大きいほど，RWSの誤差がρ/√

N >0を超えるペア(x, α)は，

ますます少なくなる．これは大変望ましい性質といえる．

用心深い人のために少し付け加えよう．じつは，分散は

∫

T²

1 N

XN n=1

f (x+nα)−

∫

T¹

f (y)dy

dxdα= Var( f )

N (112)

を満たすので，もし，運悪く(110)の左辺の事象が起こってしまうと，サンプリングの誤差は非常に大きくなることが考えられる．有限精度2⁻^mのRWSの場合で考えよう．もし，

α=0と選んでしまったら，すべてのnでXn(ω)= xになってしまい，とんでもなく悪いサンプリング点を生成してしまう(cf. 注意11)．その確率は2⁻^m であり，i.i.d.-サンプリングの場合の同様の事象の起こる確率よりずっと大きい．いい換えれば，前者のサンプリングでとんでもなく大きな誤差を生ずる確率が後者よりずっと大きいのである．一方で，

(112)を満たすから，このような事象が起こらないとき，前者のサンプリングの誤差は後

者より小さくなければならない．

もっとも，このような「とんでもなく大きな誤差を生ずる確率」は，mがそこそこ大きければ，大変小さいので実用上はまったく心配することはなかろう．よって結論として，

RWSはi.i.d.-サンプリングより数値積分に適していると考えられるのである．

注意12 非常に複雑な被積分関数のときは，RWSの生成するサンプルがほとんど独立のようになってしまって，RWSはi.i.d.-サンプリングと収束速度がほとんど変わらなくなることがある．たとえば，§3.2.3で見た従属性消滅定理(定理13)はその例を与えている．

ドキュメント内 (ver ) (ページ 71-74)