• 検索結果がありません。

第 5 章

5.4 変数の制御性

となるように設定することによって可能となる.ここで,確率変数B=bβとする.b の確 率分布をPとすると Bの期待値は,

=

= b dP b b p b db

B β ( ) β ( ) (5.13)

で与えられる.ただし,p(⋅)は b の確率密度関数とする.p(b)は,さまざまな分布が考 えられるが,ここでは簡単のため [bmin,bmax]の一様分布を仮定する.確率の規格化 により,

1 ) )(

( )

( )

( max max min

min

=

=

=

p bdb p b bb db p b b b (5.14)

よって,

min max

) 1

(b b b

p = − (5.15)

となる.このとき(5.13)式は,

=

= max

min max

min

) ( )

( b

b b

b b p bdb p b b db

B β β

= 1 max 1

min min

max

bb b db= b

b

β (5.16)

よって,

min max

max min

b b db b

b

b = −

β (5.17)

となる.図5.7は,bの範囲を決める際の方法を示したものである.(5.17)式から,①の 範囲と②の範囲の面積は等しい.つまり,求めたい分布の傾きであるべき指数βとb の上限bmaxを決めればbminが求まり,bの範囲も決まるのである.例えば, β =2.0,

bmax=1.6 と設定したとき,(5.17)式の計算により,bmin=0.24 と求まる.よってbの平均

average

b は 0.92 となる.ここで,bmaxを小さく設定すると,bの範囲は狭まり,baverageは大 きくなる.逆に,bmaxを大きく設定すると,bの範囲は広くなり,baverageは小さくなる.こ のような関係に着目し,以後bについて述べるときにはbaverageの値を用いる.

図5.7 bの範囲を決める方法

5.4.2 ノイズ操作による左右への分布シフト

bmax bmin

① 0

0.5 1 1.5 2 2.5 3 3.5 4

0 0.5 1 1.5 2

bβ

b

=1 bβ

=

max min

1 1

min max

b

b b db

b b

β

さらに,乗算ノイズbもしくは加算ノイズfの平均や範囲を変更することによって,分 布を左右にシフトできることを発見した.図5.8は,β=2.5,baverage=0.99, frange=1と設

定して, faverageの値を変化させたときのランクサイズプロットである.横軸はサイズ,

縦 軸 は 順 位 を 表 し て い る . そ れ ぞ れ , faverage=4000 は ○ , faverage=20000 は×,

average

f =40000 は□に対応している.この図から, faverageを大きくすると分布は右へ,

小さくすると左へ平行移動することが見てとれる.

100 101 102 103

104 105 106 107 108

N(x)

x

4000 20000 40000

図 5.8 加算ノイズ faverageの大きさと分布シフトの関係 faverageはそれぞれ(○)=4000,

(×)=20000,(□)=40000を表す.

同様に,baverageを大きくすると分布が右に平行移動し,小さくすると左に移動する.

ノイズ操作によって分布が左右にシフトするという特徴は,実データとのフィッティング において明確な方針を与えてくれる.例えば,適当な変数設定で得られた分布が,

実データにより作成した分布よりも左側にあったとする.この場合,bもしくは f を大き くすることによって,分布が右に平行移動し,実データの分布に近づくのである.

ノイズと分布シフトの関係を表5.1にまとめた.baverageを固定して,分布を左にシフト させたい場合, faverageを大きくすればよい.逆に分布を右にシフトさせたい場合,

average

f を小さくすればよい. b と f の立場を入れ替えて, faverageを固定して,分布を左 にシフトさせたい場合,baverageを大きくすればよい.逆に分布を右にシフトさせたい場

合,baverageを小さくすればよい.このように,bf の大小関係には,トレードオフがあ

る.このことについては,5.5.3節で詳しく述べる.ここで, frangeは分布に影響を与えな いことを確認している.つまり,加算ノイズのばらつきは,大きくても小さくても関係な いということである.

表5.1 ノイズと分布シフトの関係

Distribution Noise

Shift to left Shift to right Average Decrease Increase

b Range Wide Narrow

Average Decrease Increase

f Range No Influence

5.4.3 サイト数変更による分布幅の拡大縮小

サイト数を変更することによって,分布幅を変更することができる.図5.9はサイト数 を変化させたときのランクサイズプロットである.横軸はサイズ,縦軸は順位を表して いる.それぞれ,N=100は○,N =1000は×,N =10000は□に対応している.この図 から,サイト数を増やすと,分布の形はそのままに,分布幅を拡大できることが分かる.

これは,サイト数が異なる対象(例えば都道府県なら47,市町村なら1600以上)に対 して,同じようにモデルを適用できることを表している.

100 101 102 103 104

105 106 107 108 109

N(x)

x

100 1000 10000

図 5.9 サイト数と分布幅の関係 N はそれぞれ(○)=100,(×)=1000,(□)=10000

を表す.