4.2 ランダム - ワイル - サンプリング
4.2.3 ある極限定理
注意11 RWSの場合,アリスがどんなω0 = (x, α) ∈ {0,1}2m+2 j を選ぶべきでないか,に ついて少しだけ助言をすることができる.それは,とくにαを簡単な数にしないことで ある.極端な場合α=(0,0, . . . ,0)∈ {0,1}m+j と選ぶとRWSはほぼ完全に失敗することが すぐ分かる(cf. §1.6.1).
=
∫
T1
dx f (x)
∫
T1
dαh((n0−n)α)
=
∫
T1dx f (x)
∫
T1dαh(α).
よく知られているようにワイル変換はルベーグ確率空間(T1,B,P)上でエルゴード的で あり,従って f ∈ L1(T1,B,P)に対して大数の法則が成り立つ.とくに f が滑らかな関数 のときは大数の法則の収束が早い.実際,exp(2kπ√
−1 x),0, k∈Z,の場合,
1 N
XN n=1
e2
√−1πk(x+nα) = 1
N × 1−e2√−1πNkα 1−e2√−1πkα ×e2
√−1πk(x+α) =O 1
N
!
, N → ∞.
∫
T1exp(2kπ√
−1 x)dx= 0であるから,大数の法則の収束速度がO(N−1)であることを示し
ている.一般の関数のときはフーリエ(Fourier)級数で近似すればよい.このとき,滑ら かな関数ほどフーリエ係数が速く0に収束するので,その場合の大数の法則も,ほとんど O(N−1)に近い速さで収束するのである.
RWSはα∈ T1を x ∈T1 とともにランダムに選ぶ.選ばれるαは確率1で無理数であ り,従って,上の段落で述べたことが確率1で成り立っている.このことから想像される ことは,RWSに関する大数の法則はi.i.d.-サンプリングの場合より収束が早いであろう,
ということである.実際,1 ≤ p < 2なる pに対しては,RWSの p次平均誤差に関して 次の極限定理がある.
定理19 ([7, 26]) 2乗可積分関数 f :T1 →Rおよび1≤ p< 2に対して
Nlim→∞
∫∫
T1×T1
√1 N
XN n=1
f (x+nα)−
∫
T1
f (y)dy!
p
dαdx = 0. 従って,任意のρ >0について
Nlim→∞P2
(x, α)∈T2
√1 N
XN n=1
f (x+nα)−
∫
T1
f (y)dy! > ρ
=0. (110) すなわち,標本平均の中心極限定理のスケーリングによる極限分布は退化する.
証明. 簡単のため∫
T1dx f (x) = 0を仮定する.M ∈Nに対して関数FM : Tk → Rを次 のように定義する:
fM(t) := X
|l|≤M
bf (l)e2
√−1πlt,
ただし bf (l)はF のフーリエ(Fourier)係数,すなわち bf (l) =
∫
T1
dt f (t)e−2√−1πlt.
∫
T1dt f (t)=0から bf (0)=0が従うことに注意せよ.任意の1< p< 2を固定する.三角不 等式,ヘルダー(H¨older)の不等式,および定理18によって
√1 N
XN n=1
f (x+nα) p :=
∫ ∫
T1×T1
dαdx
√1 N
XN n=1
f (x+nα)
p
1 p
≤
√1 N
XN n=1
fM(x+nα) p+
√1 N
XN n=1
( f − fM)(x+nα) p
≤
√1 N
XN n=1
fM(x+nα) p+
√1 N
XN n=1
( f − fM)(x+nα) 2
=
√1 N
XN n=1
fM(x+nα) p+ p
Var( f − fM). (111)
(111)の最後の辺の第一項を詳しく計算しよう.fMの定義によって
√1 N
XN n=1
fM(x+nα) = X
0<|l|≤M
bf (l)e2
√−1πlx× 1
√N XN
n=1
e2
√−1πnlα
だから,Lp(T2,dαdx)-ノルムをとれば
√1 N
XN n=1
fM(x+nα)
p ≤ X
0<|l|≤M
bf (l)
∫
T1
dα
√1 N
XN n=1
e2√−1πnlα
p
1/p
= X
0<|l|≤M
bf (l)
∫
T1
dα
√1 N
XN n=1
e2
√−1πnα
p
1/p
, ここで変換T13α7→lα∈T1がルベーグ測度を保存することを用いた.そして
∫
T1
dα
√1 N
XN n=1
e2
√−1πnα
p
=
∫ 12
0
dα
√1 N
XN n=1
e2
√−1πnα
p
+
∫ 1
1 2
dα
√1 N
XN n=1
e2
√−1πnα
p
= 2
∫ 12
0
dα
√1 N
XN n=1
e2√−1πnα
p
= 2
∫ 1
2
0
dα 1
√N
sinπNα sinπα
p
= 2
∫ N2
0
dt N
1
√N sinπt sinπNt
p (変数変換Nα= t)
= 2 1 N
!2p+1∫ N
2
0
dt πNt
sinπNt
psinπt πt
pNp
= 2 1 N
!1−p2 ∫ N2
0
dt πNt
sinπNt
psinπt πt
p
< 1 N
!1−p2
2 π
2 p∫ ∞
0
dtsinπt πt
p,
ここで0< y< π/2ならばy/sin y< π/2であることを用いた.これより
√1 N
XN n=1
fM(x+nα)
p ≤ X
0<|l|≤M
bf (l)
∫
T1
dα
√1 N
XN n=1
e2
√−1πnα
p
1/p
N−→→∞0.
従って結局
N→∞lim
√1 N
XN n=1
f (x+nα)
p ≤ p
Var( f − fM) −→
M→∞ 0.
数値積分の観点からは極限(110)は中心極限定よりもずっと望ましい.(110)によれば,
サンプル数N が大きければ大きいほど,RWSの誤差がρ/√
N >0を超えるペア(x, α)は,
ますます少なくなる.これは大変望ましい性質といえる.
用心深い人のために少し付け加えよう.じつは,分散は
∫
T2
1 N
XN n=1
f (x+nα)−
∫
T1
f (y)dy
2
dxdα= Var( f )
N (112)
を満たすので,もし,運悪く(110)の左辺の事象が起こってしまうと,サンプリングの誤 差は非常に大きくなることが考えられる.有限精度2−mのRWSの場合で考えよう.もし,
α=0と選んでしまったら,すべてのnでXn(ω)= xになってしまい,とんでもなく悪い サンプリング点を生成してしまう(cf. 注意11).その確率は2−m であり,i.i.d.-サンプリ ングの場合の同様の事象の起こる確率よりずっと大きい.いい換えれば,前者のサンプリ ングでとんでもなく大きな誤差を生ずる確率が後者よりずっと大きいのである.一方で,
(112)を満たすから,このような事象が起こらないとき,前者のサンプリングの誤差は後
者より小さくなければならない.
もっとも,このような「とんでもなく大きな誤差を生ずる確率」は,mがそこそこ大き ければ,大変小さいので実用上はまったく心配することはなかろう.よって結論として,
RWSはi.i.d.-サンプリングより数値積分に適していると考えられるのである.
注意12 非常に複雑な被積分関数のときは,RWSの生成するサンプルがほとんど独立の ようになってしまって,RWSはi.i.d.-サンプリングと収束速度がほとんど変わらなくなる ことがある.たとえば,§3.2.3で見た従属性消滅定理(定理13)はその例を与えている.