有限次元分布の事前評価 - ワイル変換による疑似乱数生成器

3.2 ワイル変換による疑似乱数生成器

3.2.4 有限次元分布の事前評価

定理11を用いると{Y_n^(m)(•;α)}^∞_n₌₀の有限次元分布に関する統計的性質を調べることができる．

はじめに，二項間の相関について，

N^(m)(k;α) := 1 16

F^(m)(0,k;α)− ¹₂2 (30) と定義する．このとき，以下のように疑似乱数の使用限界を推定することができる．まず







η^(m)_n;k(•;α) := Y_n^(m)(•;α)+Y_n^(m)₊_k(•;α) (mod 2)

S^(m)_N;k(•;α) := 1 N

N−1

n=0

η^(m)_n;k(•;α)

とおく．{Y_n^(m)(•;α)}^∞_n=0が硬貨投げの確率過程だったと仮定すればS_Nの分散はσ²_N :=1/(4N) である．各k∈Nに対して次の仮説

S^(m)_N;k(•;α)i

≡ F^(m)(0,k;α) = 1

2 (31)

の検定を行うために

S^(m)_N;k(•;α)− 1 2

< 2σN = 1

√N (32)

となる確率を求める．{Y_n^(m)(•;α)}^∞_n₌₀が硬貨投げの確率過程であるという仮説の下では(32) の確率は，中心極限定理によって正規分布で近似すれば，約95%である．

37安富は一連の論文[32, 33, 34, 35]によって定理12を様々に拡張した諸定理を証明している．このノートでは，それらの論文の証明の一部のアイデアを，ここでの議論の文脈に合わせて紹介する．

命題1 mが十分大きいとき，N = N^(m)(k;α) (以下)ならば，事象(32)の確率は約92% (以上)である．

証明. mが十分大きければ疑似乱数{Y_n^(m)(•;α)}^∞_n₌₀が十分ランダムであるので，S_Nの分散は {η^(m)n (•;α)}^∞_n=0を硬貨投げの確率過程と考えたときのS^(m)_N;k(•;α)の分散σ²_N にほぼ等しいであろう．Nが十分大きければ，S^(m)_N;k(•;α)の分布は中心極限定理により，ほぼN(1/2+a, σ²_N) に従う．ただし，a= F^(m)(0,k;α)−1/2である．いまN = N^(m)(k;α)= 1/(16a²)とすれば，

|a|= σN/2であるから，

S^(m)_N;k− 1 2

< 2σN ⇐⇒







−5σN

2 <S^(m)_N;k − 1 2+a

< 3σN

2 (a> 0)

−3σN

2 <S^(m)_N;k − 1 2+a

< 5σN

2 (a< 0) だから，いずれにしろ，上の確率は簡単な変数変換によって

∫ 3/2

−5/2

√1

2πe⁻^x²^/²dx = 0.926983

に等しい．これが「約92%」の理由である．

命題1を根拠に，(31)の検定に対し，疑似乱数{Y_n^(m)(•;α)}^∞_n₌₀の使用限界が臨界サンプル数N^(m)(k;α)程度と考えることができよう．命題1では「mが十分大きいとき」とあるが，実際はそれほど大きくないmでも命題1の評価はほぼ正しいことが，次の例から分かる．

例8 α=(√

5−1)/2，m=40およびk=305として定理11を適用すれば，F⁽⁴⁰⁾(0,305;α)=

0.5029834であることが分かる．このとき，

1 16

F⁽⁴⁰⁾(0,305;α)− ¹₂2 = 1

16×(0.0029834)² = 7021.94∼7022 となる．そこで，

S⁽⁴⁰⁾_7022;305− 1 2

< 1

√7022, (33)

となる確率を数値的に求めてみた．計算方法は次の通りである:

{Y_n⁽⁴⁰⁾(0;α)}⁷⁰²²n=1^×¹⁰⁶⁺³⁰⁵

をコンピュータで生成し，i=1,2, . . . ,10⁶に対して，

p_i := 1

7022#{7022(i−1)+1≤ j≤7022 i|η⁽⁴⁰⁾_j;305(0;α)= 1}, を計算した．このとき，

pi− 1 2

の平均 = 10⁻⁶

10⁶

i=1

(pi−1/2) = 0.002983535

pi の分散 = 10⁻⁶

10⁶

i=1

(pi−0.502983535)² = 0.0000370605

を得た．平均の方は理論値0.0029834に近い．分散は{Y_n^(m)}^∞_n=0が硬貨投げの確率過程と仮定したときの値1/(4×7022)= 0.0000356024と比べて4%ほど大きい．最後に

pi− 1 2

< 1

√7022

を満たすiは921514個，すなわち(33)の確率として92.1514%という近似値を得た．

以下の例でも，ワイル変換に用いる無理数として，引き続き黄金分割の比として知られる次の数を採用した.

α =

√5−1 2 .

命題1を踏まえて，二項間の相関についてK ∈Nに対し，

a^(m)(K) := max

1≤k≤K

F^(m)(0,k;α)− 1 2

, N_c^(m)(K) := 1

16 a^(m)(K)2, (34) とする．Nc^(m)(K)を臨界サンプル数と呼ぶ．³⁸(34)をK =10,000のときに計算し，表にしたのが表1の左半分である．a^(m)(K)の値のすぐ右側の( )の中は最大値がどのようなkによって達成されたかを表わす．

表1:二項間・多項間分布の評価

m a^(m)(10000) (k) N_c^(m)(10000) b^(m)(16) k₁, . . . 10 0.4860680 ( 5473 ) 2.6×10⁻¹ 0.1099945 1,9,10 20 0.1084934 ( 1449 ) 5.3×10⁰ 0.0053298 9 30 0.0435756 ( 305 ) 3.3×10¹ 0.0008288 9 40 0.0029834 ( 305 ) 7.0×10³ 0.0000769 9 50 0.0001943 ( 610 ) 1.7×10⁶ 8.0×10⁻⁶ 9 60 0.0000136 ( 8484 ) 3.4×10⁸ 6.1×10⁻⁷ 9 70 1.2×10⁻⁶ ( 7264 ) 4.1×10¹⁰ 5.9×10⁻⁸ 1 80 2.0×10⁻⁷ ( 7697 ) 1.6×10¹² 6.8×10⁻⁹ 16 90 8.5×10⁻⁹ ( 165 ) 8.7×10¹⁴ 2.1×10⁻⁹ 16 100 2.9×10⁻⁹ ( 5201 ) 7.7×10¹⁵ 3.0×10⁻¹⁰ 1

次に一般の有限次元分布(K-次元以下)の評価を考えよう．このとき各偶数lについて F^(m)(0,k₁, . . . ,k_l₋₁;α), 1≤ k₁ <· · ·< k_l₋₁≤ K,

を評価すればよい．これらを全部調べることは比較的小さなK についてさえ計算量が莫大になり大きなK では絶望的に思えるが，それでも少しは望みがある．表1の右半分は K = 16の場合を計算したものである．左の欄は，

b^(m)(16) := max

1≤k1<...<kl−1≤16

F^(m)(0,k1, . . . ,kl−1;α)− 1 2

38[19]で述べられているcritical sample numberはここでのN_c^(m)(K)の4倍である．

を表わし，右の欄はその最大値がどのようなk₁, . . .によって達成されたかを表わす．表1 の右半分からは次の仮説が成り立つように見受けられる．

仮説1 各K ∈Nに対してmが十分大きいとき，

1≤k1<···<kmaxl−1≤K

F^(m)(0,k₁, . . . ,k_l₋₁;α)− 1 2

= max

1≤k≤K

F^(m)(0,k;α)− 1 2

実は仮説1は定理12の証明を詳しく見ると成り立つことが十分期待できるのであるが(注

意10)，現在のところ厳密な証明はない．もし仮説1が正しければ，我々は二項間の相関

の最大値さえ評価すればよいことになる．

ドキュメント内 (ver ) (ページ 36-39)