早稲田大学大学院 基幹理工学研究科
博士論文審査報告書
論 文 題 目
非定常ポアソン過程を用いた
ネットワークトラヒック解析に関する研究 On the Network Traffic Analysis
with the Non-Stationary Poisson Process
申 請 者
小泉 大城 KOIZUMI Daiki
2010 年 7 月
インターネットの急速な普及に伴い,優れたネットワークの設計・管理手法の必要性は年々 高まっている.このような必要性に対してネットワークトラヒックの解析は,重要な研究対象 のひとつとなっている.本論文ではこのネットワークトラヒックにおけるユーザの到着数に関 する数理モデルの研究を行っている.
従来から待ち行列理論などではユーザ到着数は確率変数として扱われ,電話サービスにおけ る呼の到着数にはポアソン分布,到着間隔には指数分布やアーラン分布が用いられてきた.ネッ トワークトラヒック研究においても,初期にはユーザ到着数に関してポアソン分布が用いられ ていたが,定常なポアソン分布に従わないトラヒックデータが多く観測されるにいたり,非定 常分布,特に非定常ポアソン分布を用いた研究が盛んに行われるようになってきている.
非定常ポアソン分布の一般的表現では,ある単位時間t= 0,1,2,· · ·ごとのユーザ到着数を表 す離散確率変数Xtの分布を,次式のようにtに依存したパラメータθtを用いて定義している.
Pr{Xt =xt|θt} = (θt)xt
(xt)! exp (−θt).
パラメータθtの変化モデルをどのように表現するかによって,様々な非定常ポアソン分布を 構成することが可能である.従来研究で用いられているモデルとしては,θtを時刻tとn個の 超パラメータ k1, k2,· · ·, knの関数として陽に表す方法がある.これらの変化モデルは,ユー ザ到着に周期やトレンドがあったり,接続開始や停止の過渡的状態がある場合などに有効と考 えられている.しかし,そのような傾向は顕著には見られないものの,定常ポアソン分布では ユーザ到着数を表現できない,よりランダム性が高いと思われるトラヒックデータも観測され ている.このようなトラヒックデータにも,時刻tの陽な関数モデルを用いることは可能であ り,例えば,この関数をフーリエ級数展開した係数を,超パラメータk1, k2,· · ·として用いて,
θtを表現する従来研究も存在している.しかし,このモデルでは,トラヒックの変化パターン のランダム性が高まれば,非常に多くの超パラメータが必要になり,結果として超パラメータ 数nを大きく取った条件下での超パラメータ推定がきわめて困難になる等の問題があった.
本論文では,このようなランダム性の高いトラヒックデータに対して,パラメータθtを確率 変数Θtとし,その確率的変化を表現した非定常ポアソン過程モデルの応用を提案している.ま た,このモデルの数理的性質について考察を行ったうえ,超パラメータの推定法の提案と評価,
実トラヒックデータへの適用を通じて有効性の検証をおこなっている.
パラメータを確率変数Θtとしたモデルも,様々な定式化が可能であるが,本論文ではランダ ムウォーク型のモデルを用いている.このランダムウォーク型のモデルにおいて,時刻(t+ 1) のパラメータΘt+1は次式のように表現される.
Θt+1 = Ut
k Θt, 0< k ≤1,
Θ1 ∼ Gamma (α1, β1), α1 >0, β1 >0, Ut ∼ Beta [kαt,(1−k)αt].
ここで,Θ1は初期時刻t = 1におけるポアソンパラメータで,α1とβ1で表されるガンマ分 布に従うと仮定する.また,Utはkとαtで表されるベータ分布に従うことを仮定する.
1
この非定常ポアソン分布のパラメータ変化モデルは,時刻毎に,一つ前の時刻のΘtから確率 変数UtによってΘt+1へと確率的に変化するランダムウォーク型のモデルとなっている.パラ メータ変化のランダム性を表現する超パラメータがkで,0 < k ≤ 1なる実数をとる.超パラ メータk= 1のときは,Utの従うベータ分布の尺度パラメータが0となり,Utの分散も0とな る.したがって,Θt+1は時刻によらずに定数となり,Xtの確率分布は定常ポアソン分布に帰着 する.一方,0< k <1のときは,Θtは確率的に変化し,Xtの分布は非定常ポアソン分布とな る.このように,上で定義した非定常ポアソン過程は,一つの超パラメータkによりそのラン ダム性を表現し,k= 1で定常ポアソン過程となるポアソン過程の一般型となっている.
また,ガウス過程のランダムウォーク型モデルであるカルマンフィルターと,ポアソン過程 のランダムウォーク型モデルであるこの非定常ポアソン過程は類似の性質を持っていることが 示されている.例えばこの非定常ポアソン過程では,パラメータΘtの事前分布と,ユーザ到着
数xt1 = (x1, x2,· · ·, xt)が観測されたもとでのΘtの事後分布は常にガンマ分布となることが確
かめられる.このようなランダムウォーク型の非定常ポアソン分布は,すでに統計学の分野で 提案されていたが,このモデルをトラヒック解析に応用し,その性質や有効性を詳細に検討し た研究はこの研究が初めてである.
本論文の第1章では,本研究の背景と目的,従来研究とその問題点を述べている.
第2章では,第3章以降で用いる数理を整理し準備をおこなっている.
第3章では,上記の非定常ポアソン過程のランダムウォーク型モデルを定義すると共に,ネッ トワークトラヒック解析にこのモデルを応用した場合の,数理的性質について検討を行ってい る.本論文のネットワークトラヒック解析では,時刻tまでのユーザ到着数xt1 = (x1, x2,· · ·, xt) が観測されたもとで,以下の(1)または(2)を行うことが主要な問題と考えられる.
(1) 時刻tにおけるパラメータθˆtを推定する.
(2) 時刻(t+ 1)におけるユーザ到着数xˆt+1を予測する.
本論文では,(1)のように時刻tにおける非定常ポアソンパラメータθˆtを推定することを特に パラメータ推定,(2)のように時刻(t+ 1)におけるユーザ到着数xˆt+1を予測することを特にト ラヒック予測と呼んでいる.
本論文では二乗誤差などの損失関数に対して,ベイズ基準から最適なトラヒック予測について 考察をおこなっている.その場合,時刻(t+ 1)におけるユーザ到着数の確率分布p(xt+1 |θt+1) をパラメータθtの事後分布p(θt+1 |xt1)で重み付けを行った予測分布,
∫
p(xt+1 |θt+1)p(θt+1 |xt1)dθt+1,
などを用いる必要があり,一般的には計算が困難となる.しかし,このランダムウォーク型の非 定常ポアソン過程においては,任意の時刻tにおけるパラメータの事後分布がポアソン過程の 自然共役な事前分布であるガンマ分布となっているため,トラヒック予測値xˆt+1や,パラメー タの推定値θˆtを解析的に比較的簡単に求めることが可能である.第3章では,このような本モ デルの数学的取り扱いの容易性をまとめ,本モデルのトラヒック解析への応用における計算的 効率性や優位性について論じている.
第4章では,この非定常ポアソン過程のランダム性を表す超パラメータkの推定とその精度 について考察している.前章では,超パラメータkは既知として,トラヒック予測やパラメー
2
タ推定の問題を扱ったが,実データへの応用場面では超パラメータkは既知と仮定できる場合 はそれほど多くないと考えられ,その推定は重要な問題である.
従来研究では,より多くの超パラメータを使った非定常ポアソン過程も扱われてきたが,本 論文ではランダムウォーク型モデルを用いることで,1つの超パラメータのみで定常ポアソン 過程も含む非定常ポアソン過程を表現している.従来の多くの超パラメータを使ったモデルで は,最尤推定量を数値計算で求めることも困難で,遺伝的アルゴリズム(GA)など,最適性が 保証されない探索法で推定を行っている場合もあった.
これに対し本論文のモデルでは,超パラメータkは一つであり,ネットワークトラヒックの ユーザ到着数データを観測したもとでの尤度関数が経験的に単峰型となるため,最尤推定量を 求めることは解析的には不可能なものの,数値計算によって比較的容易に求めることが可能で ある.このような超パラメータkの推定の容易さも,従来のモデルに対する本論文のランダム ウォーク型非定常ポアソン過程モデルの優位性と考えられる.
この章では,超パラメータkの近似最尤推定アルゴリズムを提案し,その推定精度について,
シミュレーションにより評価を行っている.また,その推定値kˆを用い,トラヒック予測をした 場合の予測精度についても,同様にシミュレーションにより評価を行っている.その結果,推 定アルゴリズムが良好なパラメータ推定精度および予測精度を持つことが確認されている.
第5章では,このランダムウォーク型非定常ポアソン過程モデルを様々な実トラヒックデータ に適用した場合の有効性について考察している.第4章で提案した超パラメータkの近似最尤 推定アルゴリズムを用い,トラヒックデータから超パラメータを推定し,その超パラメータを 用いた非定常ポアソン過程モデルでトラヒック予測を行うことで,その有効性を検証している.
例えば,予測精度の面から,定常ポアソン過程を用いた方法などと比較を行い,その優位性を 示している.また,AIC情報量規準によるモデル選択なども行っており,このランダムウォー ク型非定常ポアソン過程モデルが,多くの実トラヒックデータに対して有効なモデルであるこ とを確かめている.
以上を総括すると,本論文は,ポアソン分布のパラメータを確率変数とみなしたランダム ウォーク型非定常ポアソン過程モデルを,ネットワークトラヒック解析に応用し,パラメータ 推定とトラヒック予測に関する数理的性質の考察,超パラメータの推定法の提案と評価,実ト ラヒックデータへの適用による有効性の検証を行っている.これらの結果はネットワークトラ ヒック解析の分野において新たな知見を与える有用な成果といえる.よって本論文は,博士(工 学)の学位論文として価値のあるものと認められる.
2010年7月
審査員(主査) 早稲田大学教授 博士(工学) 早稲田大学 松嶋 敏泰 早稲田大学教授 工学博士 (早稲田大学) 大石 進一 早稲田大学名誉教授 工学博士 (大阪大学) 平澤 茂一
3