ここでは,前節で述べたCTFIの3ステップの詳細を説明する.
4.2.1 トラヒック観測
ここでは,ルータiの時点j におけるトラヒックデータTi,j を取得し,データベース に蓄積する.本研究では,下記の入出力両方向の転送データ量(パケット数とビット数)
で構成される4次元トラヒックデータTi,j を観測する.
Ti,j = (packetsin, bitsin, packetsout, bitsout )
取得したTi,j はトラヒックデータベース(表4.1)に蓄積される.この表はn+ 1台の ルータからサンプリング間隔300(秒)で取得したTi,j のデータベースを表している.
図4.3 トラヒック観測
表4.1 トラヒックデータベースの例
時刻 ルータ0 ルータn
j IN OUT … IN OUT
(秒) packets bits packets bits packets bits packets bits
0 15315 124451232 10895 52193336 18094 121055112 12173 56458624 300 26697 207606936 20645 99947480 35553 218470832 25019 112890272 600 37716 268497224 31595 148912952 55541 338235440 38451 180086768 900 49065 339589360 41324 206255096 … 68306 421477024 52067 262020456
: : : : : : : : :
4.2.2 トラヒック時系列の適応的ラベル時系列表現
ここでは,多次元トラヒック時系列をベクトル量子化して,短期特徴ベクトルT F V を 生成する.そして,全T F V を学習機能付き事例データベースDANDELIONに学習さ
せ,T F V 時系列として表現されたトラヒック時系列を適応的ラベル時系列に変換する.
(1) 短期特徴ベクトルT F V の生成
ここでは,複数の平滑化区間δk によりトラヒック時系列を多次元的にベクトル量子化 し,短期特徴ベクトルT F V を求める(図4.4).平滑化区間δkにおけるTi,j の変化量 θ′i,j,kはデータセグメントTi,jTi,j−δk の傾きを表す.
θ′i,j,k = Ti,j−Ti,j−δk
δk
(4.1)
このθ′i,j,k は変化量の実値であるため,これだけでは分布における位置を評価できない.
そこで,事前に定めた基準変化量µkと偏差σkによりθ′i,j,kを正規化し,分布が反映され
図4.4 トラヒックの変化量
た相対変化量θ
′
i,j,kを求める.
θ
′
i,j,k= θ′i,j,k−µk
σk
(4.2) ここでは,1次元トラヒックデータにより説明したが,q次元トラヒックデータを観測す るとき,これらのθ′i,j,kとθ
′
i,j,kは共にq次元ベクトルである.よって,p種類の平滑化区
間を用いる場合,実変化量ベクトルθ′i,j = (
θ′i,j,k )
と相対変化量ベクトルθ
′
i,j = (
θ
′
i,j,k
) は共にpq次元ベクトルである.これらのθ′i,j とθ
′
i,jを要素として,ルータiの時点jに おける短期特徴ベクトルT F V(i, j)を構成する.このT F V(i, j)は2pq次元ベクトル である.このとき,相互比較のため,θ′i,j とθ
′
i,j の全要素を[0,1]へと写像し,T F V を 正規化する.
T F V(i, j) =(
θi,j, θi,j
) θi,j = 1
∥θ′i,j∥ (
θi,j,k,l′ )
, θi,j = (1
π {
arctan (
θ
′
i,j,k,l
) + π
2 })
(4.3) 次に,表4.1の観測データによるT F V の例を示す.本研究では,4次元データを観測 するため,2種類の平滑化区間を用いる場合,T F V は2×2×4 = 16次元ベクトルであ る.ここでは簡略化のため,ルータ0の入力側データ転送量(パケット数とビット数)の みの2次元データを観測した場合を例として説明する.つまり,T F V は2×2×2 = 8 次元ベクトルである.この場合のT F V 計算の詳細を表4.2に示す.この表のT F V は 正規化前のものであり,太字の数値がその要素を表す.基準変化量µと偏差σは表4.3 に記す.
(2) T F V 時系列の適応的ラベル時系列への変換
ここでは,ルータiのトラヒック時系列Tiを適応的ラベル時系列に変換する.まず,
DANDELION により全T F V(i, j) に分類ラベル L(T F V (i, j))を付与する.次に,
L(T F V (i, j))を時系列順に並べたラベル時系列L∗(i)としてTiを表現する.
L(T F V (i,0))L(T F V (i,1))· · ·=aacbac· · ·=L∗(i) (4.4)
表4.2 T F V 計算の例
時刻 トラヒック θi,j= (Ti,j−Ti,j−δ)/δ θi,j= (θi,j−µδ)/σδ
j データ δ= 300 δ= 600 δ= 300 δ= 600
(秒) packets bits packets bits packets bits packets bits packets bits
0 15315 124451232 n/a n/a n/a n/a n/a n/a n/a n/a
300 26697 207606936 37.94 277185.68 n/a n/a -1.3251 -1.1250 n/a n/a
600 37716 268497224 36.73 202967.63 37.34 240076.65 -1.3368 -1.2389 -1.3414 -1.1929 900 49065 339589360 37.83 236973.79 37.28 219970.71 -1.3261 -1.1867 -1.3422 -1.2239
: : : : : : : : : : :
j 短期特徴ベクトル
(秒) T F V(i, j)
0 n/a
300 n/a
600 36.73,202967.63,37.34,240076.65,-1.3368,-1.2389,-1.3414,-1.1929 900 37.83,236973.79,37.28,219970.71,-1.3261,-1.1867,-1.3422,-1.2239
: :
表4.3 基準変化量µと偏差σ
δ µ σ
(秒) packets bits packets bits 300 174.86 1010690.16 103.33 651982.55 600 175.33 1013379.92 102.85 648264.40
このL∗(i)がTiの適応的ラベル時系列である.T F V 列(表4.2)のラベル時系列変換 を表4.4に示す.DANDELIONはT F V(i, j)の蓄積とL(T F V(i, j))への変換を同時 に実時間で実行する.
表4.4 T F V 列のラベル時系列変換
j(秒) T F V(i, j) L(T F V(i, j)) L∗(i)
0 n/a n/a n/a
300 n/a n/a n/a
600 36.73, 202967.63, 37.34, 240076.65, -1.3368, -1.2389, -1.3414, -1.1929 a a 900 37.83, 236973.79, 37.28, 219970.71, -1.3261, -1.1867, -1.3422, -1.2239 a aa
: : : :
4.2.3 圧縮性による適応的ラベル時系列の分類
ここでは,圧縮性特徴空間により,適応的ラベル時系列L∗(i) として表現されたトラ ヒック時系列を低次元の圧縮性特徴ベクトルCF V に変換し,DANDELION で分類 する.
(1) 圧縮性特徴ベクトルCF V の生成
事前に定めたz個の独立性の高い基準トラヒックの適応的ラベル時系列をb0,· · ·, bz−1
とする.ここでは,bmとの正規化圧縮距離NCDに基づく類似性ρ(bm)により圧縮性特 徴空間を構成し,Tiを圧縮性特徴ベクトルCF V(i)に変換する.3種類の基準トラヒッ クが張る3次元圧縮性特徴空間を図4.5に,この圧縮性特徴空間によるCF V 生成の例 を表4.5に示す.
CF V(i) = (N CD(b0, L∗(i) ), · · ·, N CD(bz−1, L∗(i) ) ) (4.5)
図4.5 3次元圧縮性特徴空間
表4.5 CF V 生成
ルータi L∗(i) ρ(b0) ρ(b1) ρ(b2) CF V(i) 0 aaabczbbc… 0.35 0.55 0.45 0.35, 0.55, 0.45 1 baaaczbcc… 0.43 0.33 0.38 0.43, 0.33, 0.38 2 ccabczbbb… 0.44 0.24 0.41 0.44, 0.24, 0.41
: : : : : :
(2) 圧縮性特徴ベクトルCF V の分類
ここでは,Tiの圧縮性特徴ベクトルCF V(i)をDANDELIONにより分類し,最終的 なトラヒック分類ラベルを得る.表4.6に3次元CF V の分類例を示す.CF V の分類 に使用するDANDELIONデータベースはT F V の分類に使用するものとは異なる独立 したDBであり,CTFIは2種類の独立したDANDELIONデータベースを内包する.
表4.6 CF V の分類
ルータi CF V(i) 分類ラベル 0 0.35, 0.55, 0.45 A 1 0.43, 0.33, 0.38 B 2 0.44, 0.24, 0.41 C
: : :
(3) 基準トラヒックの選択
CF V の生成には圧縮性特徴空間を構成する基準トラヒックを事前に定める必要があ る.これを実現するためには,全トラヒック時系列に対し何らかの特徴ベクトルを構成し クラスタリングする事で基準トラヒックを構成すれば良い.ここではその概略を述べる.
特徴ベクトルの構成には提案手法と同様の圧縮性を利用する方法が考えられる.具体的 には,全トラヒックの適応的ラベル時系列を個別に圧縮し,その圧縮辞書から特徴表現に 適した部分文字列を選択し,それらの部分文字列の出現頻度により特徴ベクトルを構成す る.次に,全ての特徴ベクトルをクラスタリングし,各クラスタの中心部に位置するトラ ヒックを基準として選択する.基準トラヒック数を自動で決定するという観点から,クラ スタ数を指定する必要がないクラスタリング手法(DBSCAN,MST,スペクトラルクラ スタリング等)を使用する事が望ましい.特徴点の分布形状によってはクラスタ中心部に 位置するトラヒックだけでは十分ではない.そのため,正答率が低いクラスタがある場合 には,そのクラスタから代表的な分類誤りトラヒックを選択して,基準に追加する.