第 5 章
5.4 変数の制御性
となるように設定することによって可能となる.ここで,確率変数B=bβとする.b の確 率分布をPとすると Bの期待値は,
∫
∫
−∞∞∞
∞
− =
= b dP b b p b db
B β ( ) β ( ) (5.13)
で与えられる.ただし,p(⋅)は b の確率密度関数とする.p(b)は,さまざまな分布が考 えられるが,ここでは簡単のため [bmin,bmax]の一様分布を仮定する.確率の規格化 により,
1 ) )(
( )
( )
( max max min
min
=
−
=
=
∫
∫
p bdb p b bb db p b b b (5.14)よって,
min max
) 1
(b b b
p = − (5.15)
となる.このとき(5.13)式は,
∫
∫
== max
min max
min
) ( )
( b
b b
b b p bdb p b b db
B β β
= 1 max 1
min min
max
−
∫
bb b db= bb
β (5.16)
よって,
min max
max min
b b db b
b
b = −
∫
β (5.17)となる.図5.7は,bの範囲を決める際の方法を示したものである.(5.17)式から,①の 範囲と②の範囲の面積は等しい.つまり,求めたい分布の傾きであるべき指数βとb の上限bmaxを決めればbminが求まり,bの範囲も決まるのである.例えば, β =2.0,
bmax=1.6 と設定したとき,(5.17)式の計算により,bmin=0.24 と求まる.よってbの平均
average
b は 0.92 となる.ここで,bmaxを小さく設定すると,bの範囲は狭まり,baverageは大 きくなる.逆に,bmaxを大きく設定すると,bの範囲は広くなり,baverageは小さくなる.こ のような関係に着目し,以後bについて述べるときにはbaverageの値を用いる.
図5.7 bの範囲を決める方法
5.4.2 ノイズ操作による左右への分布シフト
bmax bmin
① 0
0.5 1 1.5 2 2.5 3 3.5 4
0 0.5 1 1.5 2
bβ
b
②
=1 bβ
∫
=−
max min
1 1
min max
b
b b db
b b
β
さらに,乗算ノイズbもしくは加算ノイズfの平均や範囲を変更することによって,分 布を左右にシフトできることを発見した.図5.8は,β=2.5,baverage=0.99, frange=1と設
定して, faverageの値を変化させたときのランクサイズプロットである.横軸はサイズ,
縦 軸 は 順 位 を 表 し て い る . そ れ ぞ れ , faverage=4000 は ○ , faverage=20000 は×,
average
f =40000 は□に対応している.この図から, faverageを大きくすると分布は右へ,
小さくすると左へ平行移動することが見てとれる.
100 101 102 103
104 105 106 107 108
N(x)
x
4000 20000 40000
図 5.8 加算ノイズ faverageの大きさと分布シフトの関係 faverageはそれぞれ(○)=4000,
(×)=20000,(□)=40000を表す.
同様に,baverageを大きくすると分布が右に平行移動し,小さくすると左に移動する.
ノイズ操作によって分布が左右にシフトするという特徴は,実データとのフィッティング において明確な方針を与えてくれる.例えば,適当な変数設定で得られた分布が,
実データにより作成した分布よりも左側にあったとする.この場合,bもしくは f を大き くすることによって,分布が右に平行移動し,実データの分布に近づくのである.
ノイズと分布シフトの関係を表5.1にまとめた.baverageを固定して,分布を左にシフト させたい場合, faverageを大きくすればよい.逆に分布を右にシフトさせたい場合,
average
f を小さくすればよい. b と f の立場を入れ替えて, faverageを固定して,分布を左 にシフトさせたい場合,baverageを大きくすればよい.逆に分布を右にシフトさせたい場
合,baverageを小さくすればよい.このように,bと f の大小関係には,トレードオフがあ
る.このことについては,5.5.3節で詳しく述べる.ここで, frangeは分布に影響を与えな いことを確認している.つまり,加算ノイズのばらつきは,大きくても小さくても関係な いということである.
表5.1 ノイズと分布シフトの関係
Distribution Noise
Shift to left Shift to right Average Decrease Increase
b Range Wide Narrow
Average Decrease Increase
f Range No Influence
5.4.3 サイト数変更による分布幅の拡大縮小
サイト数を変更することによって,分布幅を変更することができる.図5.9はサイト数 を変化させたときのランクサイズプロットである.横軸はサイズ,縦軸は順位を表して いる.それぞれ,N=100は○,N =1000は×,N =10000は□に対応している.この図 から,サイト数を増やすと,分布の形はそのままに,分布幅を拡大できることが分かる.
これは,サイト数が異なる対象(例えば都道府県なら47,市町村なら1600以上)に対 して,同じようにモデルを適用できることを表している.
100 101 102 103 104
105 106 107 108 109
N(x)
x
100 1000 10000
図 5.9 サイト数と分布幅の関係 N はそれぞれ(○)=100,(×)=1000,(□)=10000
を表す.