シミュレーションに基づく統計的検定法の優劣比較利用統計を見る

(1)

シミュレーションに基づく統計的検定法の優劣比較

杉山俊幸

良知孝悦

（昭和59年8月30日受理）

Accuracy of Various Goodness-of-fit Significance Tests

ToshiyukiSUGIYAMA TakayoshiRACHI Abstract In case goodness−of−fit of some assumed models which represent one phenomenon has to be tested， several goodness−of−fit significance tests are used． Each one of them can give the order of goodness−of−fit among assumed models relatively， but not absolutely． So it is very difficult to determine which test must be used in such cases． The purpose、 of this paper is to discuss the accuracy of goodness−of−fit significance tests which are usually used in testing the goodness−of−fit of traffic assignment models−i・e・ CHI−square value， correlation coefficient， root−mean−square error， and weighted−root−mean・ Square error・ The following results are obtained under the condition that the number of traffic routes is small：（1）correlation coe．fficient is not so good as others；（2）the difference in accuracy among CHI・square value， root・mean−square error， and weighted−root−mean−square error is not significant．

1．はじめに

実験あるいは調査の対象とする事象がどのようなモデル（確率モデルあるいは力学モデル）に従うかを検討する場合を考える。仮定したモデルがどの程度事象を的確に表わし得るかを，適合度（goodness−of−fit）の検定により明らかにするのが通常用いられる方法である。たとえば，仮定した確率分布の検定に関しては，カイニ乗法やコルモゴロフ・スミルノブ法が利用される1）。また，交通工学の分野でよく行われている交通量配分モデルの検定（優劣比較）に関しては，カイニ乗法を用いたり，二乗平均誤差・相関係数等の大小関係を明らかにすることにより，各モデルの優劣を比較している2）・3）。こうした検定作業においては，幾つかの検定法を用いて各モデル間の適合度を比較し，大部分の手法において適合度が高いと判定されたモデルが最適であるとしている。これは，おのおのの検定法において適合度の判定に用いられる情報は，仮定した個々の ’ 土木工学科，Department of Civil Engineering ＊＊_{@静岡県庁，Shizuoka Prefectural Office} モデルが真の事象をどの程度正確に表わしているのかに関する絶対評価を与えるものでなく，異なるモデル間の相対評価を示しているにすぎないためである。したがって，たとえば，ある検定法ではAモデルが最適であると判定され，別の検定法ではBモデルが最適であるとの結果が生じた場合，どのように対処すればよいのかについては何の示唆も与えないことになる。このように，用いた手法の違いにより検定結果が異なることはあり得ないのであればよいが，交通量配分モデルの検定においては，この現象が実際に生じている2）β）。したがって，種々の力学モデル等を用いた将来予測などが活発になされている現時点において，幾種類かの検定法のうちのどの手法の精度が相対的に良いのかを検討しておくことは重要であると考えられる。しかしながら，この点に関して取扱った研究はほとんどみられないのが実1青である。そこで本研究では，前出の交通量配分モデルの検定に着目し，通常用いられる幾つかの統計的検定法の優劣を，モンテカルロ法を用いた数値実験により比較検討することにする。具体的には以下のことを行う。（1）幾つかの代表的な交通量配分モデルのうちの任意の

(2)

一つのモデルに従う交通量データを，乱数を用いて作成する。（2）おのおのの交通量配分モデルより算出される配分量の理論値を求める。（3）（1）で得られたデータと（2）の理論値に関し，幾つかの統計的検定法を用いて各モデルの適合度検定を行う。（4）（1）∼（3）の操作を100回繰返し，各検定法により最適合と判定されたモデルと（1）でデータを作成したモデルとが100回のうち何回一致したかを調べることにより，各手法の精度の優劣を比較する。なお，この種の問題を数値実験により解明しようとするのは，統計学・数学等を用いて理論的に各手法間の優劣を比較することは，今のところ不可能と考えられるためである。 2．交通量配分モデルの適合度検定に関する統計的手法 2．1統計的検定法4）交通量配分に関する実測データを用いて，仮定したモデルの適合度を検定する方法として，以下に示す4 通りの検定法が通常用いられている2）・3）。 a）相関係数 2個の変数間の線形関係の強さを表わす指標で， ρ＝Cov（X， Y）／（σx・σy）ただし，ρ：相関係数 Cov（X， Y）：変数X， Yの共分散 σx，σy二変数X，Yの標準偏差により表わされる。相関使数ρは，前述したように，

2個の変数X，Y間の線形関係の強さを表わす指標

であるが，それは必ずしも2個の変数の間に因果関係があることを意味するものではない。すなわち，Xと Yとの問に完全な関数関係があっても，その関係が非線形である場合には，相関係数が0となることがある。交通量配分モデルの検定に際しては，2変数のうちの一方は観測値，他方は理論値として相関係数を算出する。 b）カイニ乗検定法ん個の観測値κ1，κ2，・…，Xhと，仮定されたモデルから得られる理論値nl， n2，・…， nkとを比較する。この比較結果の良否を評価する尺度として k x2＝Σ（n，一κ，）2／x、 z＿1 なる量を用いる。x2はカイニ乗値と呼ばれ，この値が小さいほど仮定したモデルの適合度が良いことになる。 c）二乗平均誤差 ll個の観測値κ1， x2，・…， Xkと，仮定されたモデルから得られる理論値nl，〃2，…・，12・kとの二乗平均誤差を考え，その平方根

RMS−

o糖（・・ h ni ）2／1／2 が最小となるモデルを最適とする。 d）重み付き二乗平均誤差単に二乗平均誤差を求めるのでなく，個々の観測データが持つ重みを考慮して

VVRMS−

o鷲（・・一・・）2｝1／2 ただし，X：観測値の総和 x，：観i貝rJイ直 n、：理論値で表わされる重み付き二乗平均誤差ルRルfSを適合度の尺度として用いる。c）のRMSと比較して，観測された値が相対的に大きい領域においてモデルの適合度が良くなることを念頭に置いている。 2．2交通量配分モデル5）・6）交通量配分モデル（配分率モデル）は，転換交通量＊をできる限り正確に推定するために用いられるモデルである。配分モデルそのものの開発や諸モデルの比較等に関しては，これまで交通工学の専門家の間で数多くの研究がなされ，幾つかの交通量配分モデルが提案されている。そのおのおのについて詳細な説明を行い，優劣を比較することは本研究の範囲外であるため，ここでは，数値実験に用いた4種類のモデルについて簡単な説明を加えるに留め，詳細は専門書等に譲る。 i）アブラハム理論（一般化アブラハム理論）経路∫（∫＝1∼k）に関する評価値E、の分布を，万（x）：礎率密度関数 F，（x）：確率分布関数とする。ここで，EJ＜E，ならば経路iよりも経路ノが選択されるとすると，経路∫が選択される確率Pjは， h P，＝∫竺。。〔f、（x）・H｛1−F、（x）｝〕dx l≠j_{で表わされる。} 評価値E、が EJ＝βF・F，°＋T」ただし，βF：料金から時間への換算係数 F，°：経路ノの通行料金 T、：経路ノの所要時間で表わせるものとし，呪゜＝（一定），βF，T、が正規分布に従う確率変数であるとすると βF・L°は平均値PtβF ・ F，°，標準偏差F，°・σβFの正規分布 T、は平均値Pt・TJ，標準偏差σ7、の正規分布＊ある地点からある地点へ車で走行する際，2本以上の路線かある場合に各路線に分かれる交通量。

(3)

に従う。ここで，μβF，lt・T，はおのおのβF， T」の平均値， σβF，σT，はおのおのβF，万の標準偏差である。したがって，確率変数Ejは平均値μβF・呪゜＋βT、，標準偏差（乃゜2・σβF2＋σT、2）1／2 の正規分布に従う。 ii）ロジットモデル数多くの行動モデル（モーダル・チョイス・モデル）のうち，集計ロジットモデルを導入して，道路網への交通量配分を行うモデルである。このモデルは，『利用者は効用が最大となる経路を選択する』との立場から提案されたもので，経路∫を選択する確率（＝配分率）は P，＝exp（V」一α」）／Σexp（V，一 ev，）ビニただし，V，＝βT（T、＋βF・瓦）＆：時間から価値への換算係数 βF：料金から時間への換算係数 T，：経路iの所要時間 F，：経路iの通行料金 α，：パラメータで表わされる。なお本研究では簡単のためα，＝0と仮定する。 iii）転換曲線を用いた配分法この配分法は，日本道路公団で開発された転換率曲線を用いる方法で，経路選択の主要因が各経路を利用する場合の料金であると考えている。経路iから経路ノへの転換率Pi，・は Pu＝K／｛1＋α（T／S）β｝ただし，T：経路iの高速道路料金 S：｛（経路iの経由時間）一（経路∫の経由時間）｝ α，β，K：パラメータで表わされる。例として，3本の道路が現存するときに 4本目の道路を建設する場合を考える。現在の各道路の配分率をP、°（i＝1∼3）として，新しい配分率P、（i ＝1∼4）は P，＝1）10×（1−Pi 4）、P2＝P，°×（1−P24） P、＝P，°×（1− P，、） P、＝P，°×P，，＋ P2°×P24＋P，°×P，、で与えられる。ただし，制約条件として 1）1°＋P，°＋P，°＝1 を満足する必要がある。なお本研究では，転換率曲線として，乗用車の転換率曲線 1）t」＝｛1十〇．01348（T／S）L71742｝−1 を用いている。 iv）比例配分法各経路への配分量は，おのおのの経路の走行時間に比例すると考えられるもので，その配分比P、は k P」＝（T，）−b／Σ（T，）−b i＝1 ただし，T、：経路iの走行時間 b：経験的に求められるパラメータで表わされる。なお本研究では，簡単のためろ＝1としている。以上述べた4種類の交通量配分モデルでは，いずれも各経路の所要時間と通行料金が与えられれば，各経路への配分率が算出されることになる＊。 3．シミュレーションに基づく統計的検定法の優劣比較モンテカルロ法を用いた数値実験により，交通量配分モデルに関するおのおのの検定法の優劣を比較するプロセスは以下のとおりである。 ①交通量配分の対象とする各経路の所要時間と通行料金を仮定する。 ②所与の条件（所要時間・通行料金）の下で，任意の一つの交通量配分モデルを用いて，各経路への配分率を算出する。 ③1台の車両の通行を〔0，1〕の一様乱数発生で置き換える。そして，②で算出した配分率に従って，各経路を通過する車両台数を決定する。すなわち発生させた乱数κが k−1 h

Σ君くx≦Σ君

ぐコ j＝1 ただし，Pゴ：各経路への配分率ならば，その車両は経路feを通過するとする。

④車両の全通行台数をNとして乱数をN個発生さ

せ，③の操作を繰り返す。そして，各経路を通過した車両台数を“実測データ”とする。 ⑤？’実測デーダ’とおのおのの交通量配分モデルより算出される理論値を用いて，2．1で述べた4種類の検定法によりおのおののモデルの適合度を検定する。 ④で得られるtt実測データ”は，任意の一つの交通量配分モデルに従うように作成されたものであるから，精度の高い検定法を用いれば，最適合と判定されるモデルは，データ作成に用いられたモデルと．tt致するはずである。そこで， ⑥③∼⑤の操作を100回繰り返し，そのうち何回正しい判定がなされたかを調べることにより，各検定法の優劣を比較する。＊各モデルに含まれるパラメータの値は与えられているものとする。

(4)

経路 1 図一1数値実験に用いた経路網 Fig． l Traffic netwark used for numerical experiments．本研究においては数値計算上の簡便さから，対象とする経路の数は，図一1に示すように4とし，また，各経路の所要時間および通行料金に関しては，表一1（a） ∼（c）のように仮定している。この所要時間・通行料金の仮定に際しては， Type−A：各経路の配分率の差が大きい場合（表一1 （a）） Type−B：各交通量配分モデルによる配分率の差が大きい場合（表一1（b））表一1数値実験上の仮定と各交通量配分モデルによる配分率 Table 1 Values of parameters assumed for computer・ simulation and assignment ratio calculated with each traffic assignment model．（a）Type−A：各経路の配分率の差が大きい場合（β＝−O．6，β＝1／1500）経路Nα 所要條ﾔ通行ｿ金アブラノ、ムロジット _転換曲線比例 z分法 3．Ohr Q．0 P．2 O．5 ￥ 0 @400 @600 @800 0．0072 O．0336 O．1618 O．7974 0．1231 O．1911 O．2851 O．4007 0．0396 O．1164 O．2686 O．5754 0．0704 O．1144 O．2112 O．6040 （b） Type−B： _{各交通量配分モデルによる配分率の差が大きい} 場合（β＝−0．2，β＝1／800）経路No．所要條ﾔ通行ｿ金アブラノ’・ムロジツト _転換曲線比例 z分法 1234 2．Ohr P．5 P．0 O．5 ￥ 0 @ 100 @200 @400 0．0491 O．1120 O．2758 O．5631 0．2242 O．2416 O．2604 O．2738 0．0460 O．0863 O．1920 O．6757 0．1797 O．2073 O．2539 O．3591 （c） Type−C：各交通量配分モデル，各経路の配分率の差が小さい場合（β＝−0．2，β＝1／800）経路Nα 所要條ﾔ通行ｿ金アブラノ、ムロジット _転換曲線比例 z分法 1．5hr P．2 P．0 O．6 ￥ 0 @200 @300 @600 0．2276 ‘ O．2364 O．2757 O．2603 0．2460 O．2484 O．2522 O．2534 0．1507 O．2091 O．2609 O．3793 0．2031 O．2271 O．2487 O．3211 Type−C：各交通量配分モデル，各経路の配分率の差が小さい場合（表一1（c））の3通りを想定している。なお同表には，これらの仮定の下での，各交通量配分モデルにより算出される配分率も記してある。発生交通量の総和に関しては，100台，200台，300 台，400台，500台，1000台とする。 4．数値実験結果および考察数値実験結果の一例を示したのが，表一2，図一2，図一3である。表一2は，おのおのの検定法を用いた場合の最適合モデルの判定結果を100回のシミュレーションから求め表一2 100回のシミュレーションによる検定結果 Table 2 Results of goodness・of−fit significance tests from 100・times computer−simulations．（a）Type−A：各路線の配分率の差が大きい場合検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

75 0 2 23 ロジット 11 60 23 6 転換曲線 3 27 50 20

比例配分法

32 0 21 47 （検定法：相関係数，発生交通量＝100）検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

100 0 0 0 ロジット 0 100 0 0 転換曲線 0 0 92 8

比例配分法

0 0 7 93 （検定法：CHI二乗値，発生交通量＝300）検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

100 0 0 0 ロジット 0 100 0 0 転換曲線 0 0 89 11

比例配分法

0 0 7 93 （検定法：二乗平均誤差，発生交通量＝500）検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

100 0 0 0 ロジット 0 100 0 0 転換曲線 0 0 97 3

比例配分法

0 0 4 96 （検定法：重み付き二乗平均誤差，発生交通量＝1000）

(5)

（b）Type−B：各交通量配分モデルによる配分率の差が大きい場合検定結果 fータアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

81 0 0 19 ロジット 14 65 15 6 転換曲線 0 0 100 0

比例配分法

34 6 14 46 （検定法：相関係数，発生交通量＝1000）検定結果 fータアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

100 0 0 0 ロジット 0 98 0 2 転換曲線 0 o 100 0

比例配分法

0 2 0 98 （検定法：CHI二乗値，発生交通量＝500）検定結果 fータアブラハムロジット転換曲線比例配分法作成モデノ

アブラハム

99 0 1 0 ロジツト 0 96 0 4 転換曲線 0 0 100 0

比例配分法

0 2 0 98 （検定法：二乗平均誤差，発生交通量＝400）検定結果 fータアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

88 0 11 1 ロジット 0 83 0 17 転換曲線 10 0 90 0

比例配分法

1 22 0 77 （検定法：重み付き二乗平均誤差，発生交通量＝100）たものである。点線で示した対角線上に並ぶ数値が 100に近いほど検定法の精度が高いことになる。図一2（a）∼（b）は，横軸に発生交通量を，縦軸に適中率＊をとって両者の関係を調べたもので，”実測データ”を作成した交通量配分モデル別に示してある。図一3（a）∼（c）は，おのおののType−A， Type−B， Type −Cにおいて，各発生交通量・各配分モデルに関する適中率を平均した全体的な適中率を示したものである。これらの表および図より以下のことがいえる。（1）いずれの場合も，4種類の検定法の中では相関係数の精度が相対的に低い。特に各配分法の配分率の差が大きいType−Aの場合でも精度が低い。しかしながら，他の3種類の検定法の優劣の差はほとんど見られない。＊100回シミュレーションのうち何回正しい検定結果が出現したかを示す相対度数のことを，ここでは適中率と称する。（c） Type−C：さい場合各交通量配分モデル，各路線の配分率の差が小検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

67 15 7 11 ロジツト ₃₆ ₁₀ ₁₀ ₄₄ 転換曲線 0 14 53 33

比例配分法

1 9 24 64 （検定法：相関係数，発生交通量＝500）検定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

57 27 0 16 ロジット 22 67 0 11 転換曲線 0 0 86 14

比例配分法

11 5 16 68 （検定法：CHI二乗値，発生交通量＝200）検定結果 fータアブラハムロジット転換曲線比例配分法作成モデノ

アブラハム

54 33 0 13 ロジット 29 67 0 4 転換曲線 0 0 93 7

比例配分法

7 6 15 72 （検定法：二乗平均誤差，発生交通量＝300）定結果データアブラハムロジット転換曲線比例配分法作成モデル

アブラハム

55 34 0 11 ロジツト ₃₀ ₆₆ ₀ ₄ 転換曲線 0 0 93 7

比例配分法

7 6 14 73 （検定法：重み付き二乗平均誤差，発生交通量＝300）（2）各経路の配分率の差が大きいType−Aの場合および，各配分法の配分率の差が大きいType−Bの場合の検定結果をみると，相関係数以外の検定法では，ほとんどのケースで70％以上の適中率を示している。（3）各経路毎に得られた実測データ間に顕著な差が認められるような場合には，どの配分モデルが適切なのかを比較的容易に知ることができると考えられる。しかしながら，各経路の配分率，各配分法による配分率の差が小さい場合には，どの配分モデルが最も適合するかを判定することは容易でなく，したがって，このときの検定の精度が最も重要となってくる。そこでType−Cの場合に着目すると，各検定法の精度は，発生交通量の大小にかなり影響されるものの，相関係数以外の検定法では50∼80％程度の適中率を示している。

(6)

R 1 ．8 ．6 ．4 ．2 相関係数 CHI二乗値二乗平均誤差重み付き二乗平均誤差 0 100 200 500 1000 Q （a）アブラハム R 1 t：；．8 ！．6 ．4 ．2

mp−−

Type−B 0 100 200 500 1000 Q （b）ロジット R 1 ．8 ．6 ．4 ．2

茅ち

0 100 200 500 1000 Q （c）転換曲線（4）予想されるように，検定法の精度は発生交通量が大きくなるほど向上する。これは”実測データ”のばらつきが発生交通量の増大に伴って小さくなるためと考えられる。しかし，発生交通量の大小によって，各検定法間の優劣の順位が逆転することはほとんどない。 5．まとめ交通量配分モデルの検定に際して通常用いられる相関係数・カイニ乗値・二乗平均誤差および重み付き二乗平均誤差の4種類の検定法の優劣を，モンテカルロ法を用いた数値実験により比較検討した。その結果，配分の対象とする経路の数が比較的少ない場合の配分モデルの検定に関して，以下のことが結論として得られた。 ①相関係数を用いる検定は，カイニ乗値・二乗平均誤 R 1 ．8 ．6 ．4 ．2

フ男iA多

！’ ’∠

≠

14’

4

0

100 200 5001000Q

（d）比例配分法図一2発生交通量Q

と適中率Rの

関係 Fig．2 Nunber of CarS gettlng through the traffic net− wark v．s． ac・ curacy of goodness・of −fit signifi・ cance tests．差・重み付き二乗平均誤差を用いる検定と比べて精度が低い。 ②カイニ乗値・二乗平均誤差および重み付き二乗平均誤差を用いる検定法の精度の差はほとんど認められない。 ③検定の精度は発生交通量の大小にかなり影響されるが，それによって各検定法間の優劣が変わることはない。なお本研究においては，各種統計的検定法の優劣をモンテカルロ法を用いた数値実験により比較検討する方法の考案に主眼を置くに届まっている。そのため，仮定したパラメータの値や経路数等は，数値実験を容易にするための値となっている。したがって，次のような検討課題も残されている。（i）二乗平均誤差を用いた検定法と，重み付き二乗平均誤差を用いた検定法の精度にほとんど差が認めら

(7)

的中率相関係数 CHI二乗値二乗平均誤差重み付き二乗平均誤差痴＝＝コ 77・9％鍵＝＝＝＝＝＝＝コ95・7％＄＝＝＝＝＝＝＝コ 92・8％仁＝＝＝＝＝コ 89・8％ Type−A 各経路の配分率の差が大きい場合的中率相関係数 CHI二乗値二乗平均誤差重み付き二乗平均誤差＄＝コ 62・O％

⊂＝コ95・5％

＄：＝＝＝＝＝＝＝＝コ95・6％位＝＝＝＝＝＝＝コ95・1％ Type−B 各交通量配分モデルによる配分率の差が大きい場合的中率相関係数 CHI二乗値二乗平均誤差重み付き二乗平均誤差しているとも考えられる。この2点に関しては，経路数を増加させて現実に行われている交通量配分の経路網に近づける等の作業を実施することにより，今後さらに検討を進めていく必要がある。本論文では，交通量配分モデルを数値実験の対象としたが，交通量分布モデルを対象とする場合には，経路数などがかなり多くなり，上記二つの問題点も解消されることが予想される。したがって，この点に関しても同時に検討を加えていく必要があろう。そしてこれらの成果を踏まえて，交通計画の問題に限らずいずれの事象モデルの検定に際しても共通した普遍的な検定法が存在するのか，あるいは，検定の対象とする事象モデルごとに最も適した検定法が存在するのかを明らかにしていくべきであろう。最後に，本研究を遂行するに際し，有益な助言を賜った土木工学科星野哲三教授に深謝する。痴＝コ 45・1％＄＝＝＝＝＝＝＝＝コ75・8％痴＝＝＝＝：＝＝コ74・8％仁＝＝＝＝：＝コ74・9％ Type−C 各交通量配分モデル，各経路の配分率の差が小さい場合図一34種類の検定法の適中率 Fig．3 Accuracy of goodness−of−fit significance tests．れない。これは，配分の対象とする経路の数が，本研究の場合4本と少なかったため，重み付き二乗平均誤差を用いられた検定法の利点が生かされないことによると考えられる。（ii）相関係数を用いた検定法の精度が，他の方法と比較して著しく低いという結果を得たが，この点についても，数値実験の対象とした経路数の少なさが影響

参考文献

1）Ang， A．H．−S． and Tang， W．H．（伊藤学，亀田弘之訳）：土本・建築のための確率・統計の基礎，丸善，1977年． 2）須山恭三，山本芳幸：自動車交通量の路線配分に関する諸理論の比較一山梨県内をトリップのエンドとする交通を対象として，山梨大学工学部土木工学科卒業論文，1981年 3月． 3）翠川潔：配分率に集計ロジットモデルを用いた解析的手法による道路網への交通量配分，山梨大学工学部土木工学科卒業論文，1982年3月． 4）Benjamin， J．A． and Cornell， C．A．：Probabilily， Statistics， and Decision for Civil Engineers， McGraw−Hill Book Company，1970． 5）星野哲三：交通量配分理論の分類と特質，高速道路と自動車，Vol． XII， No．8， pp．27−34，1969年8月． 6）八十島義之助，花岡利幸：交通計画，技報堂，1971年，

シミュレーションに基づく統計的検定法の優劣比較 利用統計を見る