機械学習を用いたネットワーク異常検知技術の WebAPI 化の研究 *

(1)

機械学習を用いたネットワーク異常検知技術の _WebAPI 化の研究 _*

中野雄介

^†^a)

池田泰弘

^†

松尾洋一

^†

渡辺敬志郎

^†

石橋圭介

^††

西松研

^†

WebAPI Design for Providing Machine Learning Based Network Anomaly Detection Technology

^∗

Yuusuke NAKANO

^†^a)

, Yasuhiro IKEDA

^†

, Yoichi MATSUO

^†

, Keishiro WATANABE

^†

, Keisuke ISHIBASHI

^††

, and Ken NISHIMATSU

^†

あらまし将来的な労働人口の減少に備えるため，ネットワークの障害対応の自動化が急務である．障害対応の自動化には，トリガとなる異常検知技術が欠かせない．一方近年，機械学習による異常検知技術の研究が盛んである．しかし現状，ネットワークでこのような技術は普及していない．原因は次の二つである．(1)ネットワーク事業者にとって，検知対象に応じて複数の検知技術を導入する場合，技術に応じたデータ収集／前処理等の開発が必要である．(2)検知技術開発者にとって，検知技術をネットワークで利用可能な技術に仕上げるには，

ネットワークに関する機能／非機能要件も満たす必要がある．本論文ではこれらの障壁を解消する，異常検知技術のWebAPI化ラッパの構成を提案する．ラッパは(1)ネットワークに対して共通のWebAPIのIFを提供し，

1回の開発で複数技術を導入可能とする．一方(2)ラッパでの実装を肩代わりし，各検知技術の開発の障壁も解消する．ラッパを実装し，実際の検知技術をWebAPI化することで，少ない工数でネットワークに導入できることを確認した．また，検知技術をネットワークに対応させるためのプログラム変更は難易度の低いものであった．一方，ラッパによる実行時間のオーバーヘッドは，実測により許容範囲であると確認した．

キーワード機械学習，異常検知，WebAPI，ラッパ

1.

^{まえがき}

これまでのネットワークにおける障害対応は人手で行われることが多かった．しかし，将来的な労働人口の減少などの社会環境の変化に対応し，ネットワーク事業者が持続的にネットワークサービスを提供するため，ネットワーク障害対応の自動化が急務となっている．ネットワーク障害対応は主に，異常検知，分析，

対処の三つのフェーズから構成され，異常検知がトリガとなり，その後の異常箇所を特定するための分析，

分析結果に従った復旧などの対処が実施される．この

†日本電信電話株式会社 NTTネットワーク基盤技術研究所，武蔵野市

NTT Network Technology Laboratories, NTT Corporation, Musashino-shi, 180–8585 Japan

††国際基督教大学教養学部アーツ・サイエンス学科，三鷹市 College of Liberal Arts, Division of Arts and Sciences, Inter- national Christian University, Mitaka-shi, 181–8585 Japan a) E-mail: [email protected]

*本論文は，システム開発・ソフトウェア開発論文である．

DOI:10.14923/transcomj.2018NSI0001

ため，まず異常検知技術の確立が必要である．

一方近年，機械学習を用いた異常検知技術の研究が盛んであり，日々新たな技術が公表されている．また，

ネットワーク異常検知への応用も提案されている．しかし，現状のネットワークに最新の技術をタイムリーに適用するには，以下の二つの障壁が存在すると考えられる．

（

1

）機械学習による異常検知技術は，技術によって必要なデータや前処理が異なるため，ネットワーク事業者が特定の検知技術の導入のためにデータ収集や前処理を実装したとしても，新たな検知技術を導入する場合は，新たな実装が必要となり，導入障壁となる．

（

2

）検知技術をネットワークで利用可能な技術に仕上げるには，ネットワークで利用されるための要件

(

長期運用されるネットワークの異常検知に対応するための可用性確保，早期の障害対応のための検知にかかる時間短縮などの非機能要件を含む

)

を満たす必要があり，これがネットワーク向けに検知技術を実現する障壁となる．

(2)

(1)

のネットワーク事業者側の導入障壁解消の一般的な方法として，

WebAPI

の形で検知技術を提供することが考えられる．

WebAPI

とは遠隔にある機能を

HTTP

を介してネットワーク越しに呼び出すためのインタフェース

(IF)

である．

WebAPI

として機能を提供することで，機能をコンポーネント化できる．このようなコンポーネントを組み合わせることで，様々な人が新たなアプリケーションを簡易に作成できる．

近年多様な

WebAPI

が提供され，これらを組み合わせたアプリケーションも盛んに作成されており，多くの技術者にとって

WebAPI

は一般的な

IF

となっている．そこで，

WebAPI

を検知技術の共通の

IF

として取り決めることとする．そのうえで，ネットワーク事業者はこの

API

に対して，データ収集や前処理などを実装する．こうすることで，ネットワーク事業者は，

この

API

をもつ検知技術であればどれでも利用可能となり，導入障壁である検知技術ごとの実装を解消できる．

一方，検知技術をネットワーク向けに提供したい検知技術開発者にとって，検知技術に上記のような

WebAPI

の

IF

を実装するのは容易ではない．そこで，

検知技術を

WebAPI

でラップするラッパが解決方法として考えられる．このラッパはネットワーク事業者の環境内の

Web

サーバ上で動作するサービスであり，

サーバ内に配置された検知技術のプログラム

(

検知プログラム

)

をラップし，

WebAPI

として検知機能を提供する．

WebAPI

向けのリクエストを受け取ったラッパは，リクエストを検知プログラムの呼び出しに変換し，実行する．その後，実行結果を

WebAPI

のレスポンスに変換し，返信する．検知技術開発者はこのラッパからの呼び出しを受ける

IF

を作成すれば，自身で

WebAPI

を実装することなく，検知プログラムを

WebAPI

化できる．更に，

(2)

の検知技術開発者に対する障壁解消のため，ラッパ内でネットワークの要件を満たすための仕組みを一括して実装する方法が考えられる．これにより，ネットワークの要件を満たすための仕組みを検知技術開発者が実装する必要はなく，

ネットワーク向けの検知技術の実現における障壁が解消される．

このような検知技術の

WebAPI

化ラッパを実現することで，ネットワーク事業者・検知技術開発者双方の障壁を解消することが求められる．しかし，

WebAPI

化ラッパを普及させ多くのネットワークで多様な機械学習による検知技術の活用につなげるためには，

WebAPI

化ラッパは，ネットワーク事業者にとって使いやすい

WebAPI

を提供すること，且つ，検知技術開発者に

とって開発しやすいラッパであることが要求される．

本論文では，まず検知技術の

WebAPI

に対するネットワーク事業者の要件と，それらの要件の満たす上での検知技術の課題を抽出する．更に，検知技術開発者の障壁解消のため，これらの課題をラッパで解決するためのラッパの構成を提案する．最後に，この構成を実現する実装を報告する．また，これまで筆者らが検討を進めてきたディープラーニングによる異常検知技術を，ラッパを用いて

WebAPI

化することで，ラッパに本検知技術を対応させるための検知技術開発者に対する工数と難易度を評価する．加えて，既存のネットワークオペレーション環境に

WebAPI

化された検知技術を導入することで，ネットワーク事業者による検知技術導入の工数と難易度を評価する．最後に，ラッパを介することによる実行時間のオーバーヘッドを実測することで，オーバーヘッドは許容範囲であることを報告する．

2.

(

しきい値など

)

を人手で設定することは困難となってきている．また，あらかじめ設定したルールでは検知困難なサイレント故障などもネットワークでは発生する．このような課題に対応するため，

様々な機械学習によるネットワーク異常検知技術が提案されている．このような検知技術を文献

[1]

を参考に以下のように分類する．なお，ネットワークからは複数の監視項目に関するデータが一定周期ごとに収集されているものとし，それを入力データと考える．

•

教師なし

(

ラベルなし

)

／教師あり

(

ラベルつき

)

：教師なしの検知では，ネットワークの正常時のみに収集されたデータを用いて正常状態を学習しておき，

現在の値がそれから外れているか否かで異常を検知する．一方，教師ありの検知では，ネットワークから収集されたデータに加え，故障対応などの記録

(

トラブルチケット

)

を教師データとして用いて正常状態／

異常状態を学習しておき，現在の値の「正常状態との乖離」や「異常状態との類似度」で異常を検知する

[2], [3]

．

•

時系列モデル：時系列モデルに基づく検知では，

例えばある特定の監視項目

(

あるリンクを流れるトラヒック量など

)

に関し，過去の時系列データからの予

(3)

測モデルを構築し，予測値と現在の観測値の乖離により異常を検知する

[4], [5]

．

•

関係性モデル：関係性モデルに基づく検知では，

例えば複数の監視項目間の正常時の関係性モデルを学習により構築しておき，現在の観測値がそのモデルから乖離しているかどうかで異常を検知する

[6]

〜

[9]

．

以上のような分類で，様々な機械学習によるネットワーク異常検知技術が検討されている．しかし，実際のネットワーク障害対応に適用するためには，ネットワーク事業者は技術ごとに入力データの前処理，定期的な実行，出力の後処理，表示等の実装が必要となり，

導入の障壁となる．

次に，実際に利用されているネットワークの監視ツールとしては，

Zabbix [10]

，

Nagios [11]

，

Hinemos [12]

などが有名であり，他にも多様なプロダクトを利用可能である．これらはネットワークからのデータの収集，

収集したデータの可視化，主にしきい値などを用いた異常検知などを提供し，ネットワークの監視のための一通りの機能を備えている．また，ネットワークの監視に特化したツールではないが，多様なデータ分析に用いられるデータ分析基盤をネットワーク監視に利用することもできる．有名なプロダクトとしては

Elastic

スタック

[13]

や

splunk [14]

などがある．しかし，このようなネットワーク監視ツールやデータ解析基盤で機械学習による異常検知技術を用いるには，連携可能な形で検知技術を実装する必要があるため，多様なツールに向けた技術の実装は困難である．

一方，近年，機械学習を用いたアプリケーション

を

WebAPI

として提供する基盤が提案されている．

Azure Machine Learning Studio [15]

は機械学習のアルゴリズムを

GUI

を介して作成でき，作成したアルゴリズムを

WebAPI

として公開できる．公開された

WebAPI

は他のサービスなどに組み込むことができ，

様々な応用が容易に実現できる．しかし，それぞれの検知技術が異なる仕様の

WebAPI

を実装してしまうと，結果としてネットワーク事業者側でそれらを利用する際に，それぞれの技術のための実装が必要となる．

本論文では以上のような課題を解決するため，異常検知技術をラップすることで，検知技術に共通の

WebAPI

を

IF

として付加する，機械学習による異常検知技術の

WebAPI

化ラッパの構成を提案する．

3.

^{ラッパの概要}

ラッパの概要を図

1

に示す．ラッパは

WebAPI

の

図1 ラッパの概要 Fig. 1 Wrapper.

プロトコルと検知プログラムの関数呼び出しのプロトコルとを相互変換するプロトコル変換機能と，ラッパが提供するネットワーク異常検知

WebAPI (

以降，単に

WebAPI)

に対するネットワーク事業者の要件を満たすための共通機能から構成され，ネットワーク事業者の環境内の

Web

サーバで動作する．検知技術開発者から提供される，具体的な異常検知を行う検知プログラムはサーバ内に配置され，ラッパにより

WebAPI

の

IF

が付加される．

まず，ネットワーク事業者から特定の検知プログラムへのリクエストを受け取ったプロトコル変換機能は，

リクエストを共通機能の関数呼び出しに変換し，共通機能を呼び出す．その後，共通機能が対象の検知プログラムを呼び出す．その際，ネットワーク事業者の要件を満たすための処理が共通機能によって実施される．

その後，検知プログラムの実行結果が共通機能に返され，それがプロトコル変換機能によって

WebAPI

のレスポンスに変換され，ネットワーク事業者に返信される．

4.

ラッパの構成

以上のラッパによって実現される

WebAPI

に対するネットワーク事業者の要件を満たすために必要なラッパの構成を以下の手順で明確化し，表

1

の各列にまとめた．

（

1

）ラッパが提供する

WebAPI

に対する，ネッ

(4)

表1 WebAPIに対する要件とラッパの構成 Table 1 Requirement for WebAPI and design of wrapper.

WebAPIに対する要件要件に対する検知技術の課題課題を解決するラッパの構成

機能機能学習・検知・再学習(トレンド追従・

誤検知再学習)・要因推定が必要である

検知技術に再学習・要因推定が実装されているとは限らない

(A)検知技術に実装されていない機能の呼び出しに対し，エラー応答を返す

入力データ利用する検知技術にかかわらず，入力データの前処理は単純な集計・

フォーマット変換程度に抑える必要がある

技術に応じて必要な入力データが異なる

(B)利用する技術に不要なデータも含め，多くの検知技術の動作に必要なデータを入力データとして要求するが，単純な集計とフォーマット変換で作成可能な入力データとする出力データネットワーク事業者や検知対象の

ネットワーク・サーバによって検知結果として必要な形式(数値／ブーリアン／要因推定の要否)が異なる

検知技術によって出力形式(数値／

ブーリアン)，要因推定結果の出力有無が異なる

(C)出力データのフォーマットは数値，ブーリアン，要因推定結果それぞれを保持できる仕様とするが，値が入っているかどうかは検知技術に応じて変化する

パラメタハイパーパラメタなどの設定を必須としない

必要なパラメタが設定されないと動作できない

(D) デフォルトパラメタを保持し，

リクエストに含まれないパラメタはデフォルト値を用いる

モデル検知対象のネットワーク・サーバや検知したい異常に応じて複数のモデルを使い分ける

使用するモデルの指定が必要 (E)学習によって生成されたモデルにIDを付与，IDと学習済みモデルをラッパ内で保持，検知・再学習のリクエストにIDを要求，指定されたIDの学習済みモデルを検知技術にわたす

非機能可用性検知対象のネットワーク・サーバの可用性に応じて長期安定動作が必要である

十分に非機能要件を満たせない場合がある

(F)複数GPUをラウンドロビンで利用する

性能異常への早期対処のため検知・要因推定に掛けられる時間が限られる

(G)学習済みモデル，デフォルトパラメタなどをオンメモリで保持する (H)入力データのメタデータを省略可能とし，入力データを軽量化する (I)時間のかかる学習機能を非同期処理とする

運用 WebAPI自身の保守のため，エラー

応答，ログ出力などが必要である

(J)検知技術の例外発生時にエラー応答を返す

(K)検知技術についてのログを出力する

トワーク事業者の要件を明確化

(1

列目

)

（

2

）これらの要件にラップ対象の検知技術で対応する場合の課題を抽出

(2

列目

)

（

3

）課題を解決するためのラッパの構成を検討

(3

列目

)

なお，ネットワーク事業者の

WebAPI

に対する要件は，ネットワークキャリア，アプリケーションプロバイダ等への異常検知技術の導入のためのヒアリングや，実際の導入作業を通して調査した．また，検知技術での要件への対応における課題は，既存の異常検知技術の特性から推測した．

4. 1

ラッパが提供する

WebAPI

に対するネットワーク事業者の要件と検知技術で対応する場合の課題

表

1

の

1

列目に示すように，ネットワーク事業者の

WebAPI

に対する要件を以下のように分類して述べる．

•

機能要件：ラッパが提供する

WebAPI

の機能についての要件である．機能そのものの他に，付随する以下の要件について述べる．

–

機能：

WebAPI

として提供するべき検知に関する機能についての要件

–

入力データ：機能が学習・検知などを実施するための入力データ，データの形式などについての要件

–

出力データ：機能が学習・検知した結果の出力データ，データの形式などについての要件

–

パラメタ：検知技術に設定するパラメタ，パラメタの形式などについての要件

–

モデル：検知技術が生成する学習済みモデルについての要件

•

非機能要件：可用性，性能，運用・保守に対する要件

なお，本論文では，

IPA

で定める『非機能要求グ

(5)

レード』

[16]

の大項目となっている非機能要件のうち，

上記のように可用性，性能，運用・保守の要件について議論する．一方，その他の非機能要件

(

移行性，セキュリティ，環境・エコロジー

)

は，調査の範囲で明確なものはなく，今後必要に応じて議論することとし，

本論文では対象としない．

以降の各項で，表

1

に示す

WebAPI

に対する要件，

要件に対する検知技術の課題ついて詳しく述べる．

4. 1. 1

^機能要件

(

機能

)

基本的な機能である学習，検知以外に，ネットワークでは以下の機能も必要である．

•

再学習

(

トレンド追従

)

：ネットワークは利用者数の増加，新サービスの提供，ネットワークの構成変更等により，ネットワークから収集されるデータの傾向は変化するため，このようなデータのトレンド変化に追従するための再学習機能が必要である．

•

再学習

(

誤検知再学習

)

：ネットワークではバックアップ等による正常なトラヒック急増や

CPU

などのリソース使用量の急増がある．このような状況をあらかじめ学習できていない場合，正常な状況を異常と検知する，誤検知が発生する．これに対し，それ以降は誤検知しないよう，誤検知したデータが正常であることを再学習するための機能が必要である．

•

要因推定：ネットワーク事業者にとって，異常が検知されても，異常の要因が判明しないと次のアクションに移ることができない．このため，要因推定機能が必要となる．

一方，このような要件に対し，全ての検知技術に再学習，要因推定が実装されているわけではない．

4. 1. 2

機能要件

(

入力データ

)

ネットワーク事業者に所属する技術者はネットワーク関連技術には長けているが，機械学習による異常検知技術には不慣れな場合が多い．このため，ネットワーク事業者にとって，自身のネットワーク等から収集されたデータを，検知技術に応じて前処理することは困難である．このため，データの前処理は単純な集計やフォーマット変換程度に抑える必要がある．

一方，異常検知技術は多様であり，それぞれに入力するデータについても多様となっている．以下に各技術に対する入力データを整理する．なお，下記のマルチモーダルについて関連研究では述べていないことを補足する．これは，関係性モデルを用いる技術の効率的な学習のために，様々な傾向のデータが混在する場合，

1

種類のベクトルデータとして入力するのではな

く，複数種類のベクトルデータに分割して入力する手法のことである．

•

教師あり：異常なデータと正常なデータとが分離されたデータ

•

関係性モデル：複数次元のベクトルデータ

•

時系列モデル：それぞれのベクトルに時刻が付加されたデータ

•

マルチモーダル：複数の種類のベクトルデータに分離されたデータ

また，実際の検知技術の入力データは，上記の掛け合わせ

(

関係性，且つ，時系列モデルなど

)

となるため，

入力データの種類も膨大となる．

4. 1. 3

^機能要件

(

出力データ

)

ネットワーク事業者や検知対象によっては，検知結果を異常度合いの数値で提示されても解釈が困難な場合があり，検知結果は異常有無のブーリアンで返す必要がある場合がある．また，ネットワーク事業者が検知結果の数値を分析して，独自に判断をするため，数値で返す必要がある場合もある．このように事業者・

検知対象によって検知結果の提示方法に対する要件は異なる．加えて，要因推定結果の要否についても様々である．

一方，検知技術によって，検知結果をブーリアンで返すものと，数値で返すものとがある．また，先の機能要件で挙げたように，要因推定が可能な技術と不可能な技術とがあり，技術によって検知結果に要因推定結果が含まれるかどうかが異なる．

4. 1. 4

^機能要件

(

パラメタ

)

ネットワーク事業者は先に述べたとおり，機械学習による異常検知技術には不慣れな場合が多いため，検知技術に設定するハイパーパラメタ等のチューニングが困難な場合が多い．このため，

WebAPI

の入力としてはハイパーパラメタ等は必須の入力とすることはできない．

一方，検知技術にパラメタの設定は必須である．また，検知技術に応じて，設定が必要なパラメタは異なる．

4. 1. 5

^機能要件

(

モデル

)

ネットワーク事業者は複数のネットワークやサーバなどを運用するため，複数の学習済みモデルを使い分けて検知・再学習を実施する．また，短期的に発生する異常

(

バースト的にリソース使用量が変化する異常等

)

や，長期的に発生する異常

(

メモリリーク等

)

等，

検知対象の異常によっても使用する学習済みモデルが

(6)

変わる可能性がある．このため，ネットワーク事業者は

WebAPI

を介し，対象の学習済みモデルを指定し，

そのモデルを用いて検知・再学習ができる必要がある．

一般的に検知技術は指定されたモデルを用い検知・再学習を実施するため，大きな課題はないが，

WebAPI

経由で指定されたモデルを検知技術に指定する必要がある．

4. 1. 6

^{非機能要件}

非機能要件のうち，可用性については，検知対象であるネットワークやサーバの長期安定動作のため，

継続的に異常検知を実施する必要がある．このため，

WebAPI

についても継続的に検知，再学習を実施できる必要がある．また，ネットワーク事業者では異常に対し，早期検知，対処する必要がある．このため，検知・要因推定に掛けられる時間は限られ，一定の性能が求められる．最後に運用・保守については，

WebAPI

自身の保守のために，ログの出力やエラー発生時のエラー応答などが必要である．

一方，検知技術開発者にとって，このような非機能要件を満たすための検討や実装を行うことはネットワーク向けの検知技術開発の障壁となり，それぞれの検知技術で十分に非機能要件を満たすことは困難である．

4. 2

要件を満たす異常検知技術の

WebAPI

化ラッパの構成の提案

本節では以上の課題を解決するラッパの構成を提案する

(

表

1

の右端列

)

．なお，文中の記号は表の内容と対応する．

4. 2. 1

^機能要件

(

機能，出力データ

)

機能，出力データについての課題は，検知技術の実装上，

WebAPI

に対する要件に対応できない場合があるというものであった．技術に実装されていないものをラッパで実装することはできないため，ラッパは次のような構成とする．機能の課題に対しては，再学習・要因推定が実装されていないにもかかわらず，

WebAPI

経由でリクエストがあった場合は，ラッパはエラー応答を返す

(A)

．出力データの課題に対しては，

出力のデータのフォーマットとしてはブーリアン，数値，要因推定いずれも保持可能な仕様とするが，各値の出力を必須としないことで，出力できない値がある技術を許容する

(C)

．このようにして，

IF

としては共通のものをラッパにより実現する．

4. 2. 2

機能要件

(

パラメタ

)

パラメタに対する課題は，検知技術に必要なパラメタがリクエストに含まれない可能性があることであっ

た．これに対して，ラッパはデフォルト値をあらかじめ保持し，不足パラメタにはこれを設定する

(D)

．

4. 2. 3

^機能要件

(

入力データ

)

入力データに対する課題は，検知技術によって必要なデータは異なるが，

WebAPI

の入力データとしては技術によらず単純なデータ形式にする必要がある，

というものであった．ラッパは先で挙げた全ての技術が要求するデータを

WebAPI

の入力として要求するが，データ自体は単純な集計とフォーマット変換で作成可能なものとする．これにより，検知技術によっては，入力された一部のデータは使われない場合があるが，ラップされた検知技術は

WebAPI

経由で入力されたデータで動作可能とする

(B)

．

4. 2. 4

^機能要件

(

モデル

)

モデルに対する課題は複数のモデルの使い分けが必要というものであった．ラッパは学習によって生成された学習済みモデルに

ID

をつけ，

ID

を

WebAPI

の学習機能の出力として返信するとともに，ラッパ内で学習済みモデルを

ID

とともに保持する．その後，

WebAPI

の検知・再学習に対するリクエストには対象の学習済みモデルの

ID

を含めることで特定のモデルに対する操作を可能とする

(E)

．

以上のように，課題を解決するラッパを構成し，共通の

WebAPI

で複数種類の検知技術をラップ可能とするとともに，ラップされた技術を共通の

WebAPI

の

IF

経由で実行可能とする．

4. 2. 5

非機能要件

非機能要件の課題をラッパで解決するための構成を以下にまとめる．

•

可用性

–

複数

GPU

を利用可能な場合，特定の

GPU

への負荷集中による動作不安定化を防ぐため，ラウンドロビンで

GPU

の負荷を分散する

(F)

•

性能

–

学習済みモデルやデフォルトパラメタなど，読み込み頻度の高いファイルについては，読み込み時間の短縮のためオンメモリで保持する

(G)

–

入力データの転送時間とラッパ内でのデータ変換にかかる時間の短縮のため，

WebAPI

の利用者側の判断で入力データのメタデータを省略することによる入力データの軽量化を可能とする

(H)

–

時間のかかる学習機能を非同期処理とする

(I)

•

保守・運用

–

入力データに誤りがあった場合や，検知技術の

(7)

例外発生時に，エラーの内容を

WebAPI

の出力として返す

(J)

–

検知技術のデバッグやエラー時の対応のため，

検知技術についてのログを出力する

(K)

5.

実装

以上の構成を実現するラッパを実装した．本章では実装したラッパの

WebAPI

の仕様と実装方式について述べる．なお，文中の記号は表

1

の右端列の構成を実現する実装を示す．

5. 1 WebAPI

の仕様

WebAPI

は先の要件に対応する，学習，検知

(

要因推定含む

)

，再学習

(

誤検知再学習，トレンド追従

)

の機能を提供する．なお，学習済みモデルの削除，学習済みモデルの情報（学習実施日，パラメタ条件，学習データの情報など）を提供する機能も提供するが，これまで述べてきたラッパの構成と直接関連しないため詳しい説明は割愛する．

WebAPI

が提供する機能に共通の仕様は下記のとおりである．

•

リクエスト・レスポンスでデータを送受信する場合は，

HTTP

のボディに

JSON

形式でデータを保持する．

•

パラメタは

URL

のクエリパラメタに保持する．

•

利用する検知技術は

URL

のパスで指定する．

•

対象の学習済みモデルの

ID

は

URL

のパスの末尾で指定する

(E)

．

•

ラッパや検知技術自体の異常時には

HTTP

レスポンスに異常を示すステータスコード

(4xx

，

5xx

等

)

を含め，ボディーにはエラーの内容を示す文言を含める

(J)

．

それぞれの機能の

IF

仕様について以下で説明する．

説明には，各機能の

URL

例，メソッド，入出力データのフォーマットを説明するためのデータ例，機能の説明を含める．なお，異常検知

WebAPI

自身の異常時の出力については，紙面が限られるため本論文では割愛する．

5. 1. 1

^学 ^習

• URL

サンプル

(URL

の

”machinelearning-a”

までのホスト名・パス，クエリパラメタは例であり，

実際は異なる．以降同様

)

：

http

://

^api

.

^dnn

.

^com

/

machinelearning

-

^a

/

^traning

-

^results

?

^parameter1

=100&

^parameter2

=

^true

•

メソッド：

POST

•

入力データサンプル：

{"

training_data

": [

{"

^data_name

": "

^MIB

", "

time_series_data

": [ {"

^time

": "2015/12/05 15:20", "

^data

": [{"

value_name

": "

^cpu1

", "

^value

": 71.0}, {"

value_name

": "

cpu2

", "

value

": 79.0},

…

{"

^time

]}, ": "2015/12/05 15:21", "

^data

": [{"

value_name

": "

^cpu1

", "

^value

": 71.0}, {"

value_name

": "

cpu2

", "

value

": 79.0},

…

: ]},

]},

{"

^data_name

": "

^FLOW

", "

time_series_data

": [ {"

^time

": "2015/12/05 15:20", "

^data

": [{"

value_name

": "

TCP_pkt

", "

value

": 3.0}, {"

^value_name

": "

^TCP_byt

", "

^value

":

212.0},

^…

{"

time

]}, ": "2015/12/05 15:21", "

data

": [{"

value_name

": "

^TCP_pkt

", "

^value

": 10.0}, {"

^value_name

": "

^TCP_byt

", "

^value

":

923.0},

…

: ]},

]}, : ]

"

false_positive_time

": [

{

^start

:"2015/12/05 18:10",

^end

:"2015/12/05 18:15"},

{

start

:"2015/12/06 12:22",

end

:"2015/12/06 12:30"},

: ]}

•

出力データサンプル：

{"

^id

": 3}

•

説明：学習データとハイパーパラメタ等を受け取り，それらに従って学習を実施する機能である．

POST

でリクエストを受け付け，その際のボディに学習データが含まれていることを前提とし，ボディから学習データを取得する．また，クエリパラメタにはハイパーパラメタ等を含み，利用者の指定に応じて学習

(8)

に用いる

(

指定されていない場合はデフォルト値を使用する

(D))

．リクエストを受信し，すぐに学習済みモデルの

ID

を返信するが，非同期で学習を実施することで，利用者側の処理をブロックすることを防ぐ

(I)

．学習が終わると，生成された学習済みモデルをラッパ内で保持する

(E)

．

入力データの先頭の

training data

の

value

は

array

であり，マルチモーダルな技術への入力を想定し，複数種類のデータを保持できる．この

array

の各要素は

object (

連想配列

)

であり，データの種類の名前

(

上記の例では

MIB

と

FLOW)

と，時系列データ

(time series data)

を含む．更に時系列データの

value

は

array

であり，要素には時系列順にデータが保持されている．各時刻のデータには，時刻とその時刻に収集された複数の値が

array

で含まれる．このようなフォーマットとすることで，時系列モデルへの入力が可能となるとともに，複数の値の

array

を複数次元のベクトルデータとして扱うことができ，関係性モデルへの入力も可能となる．一方，教師あり学習に対応するため，

入力データの末尾に，学習データに含まれる異常な時間帯を示す

array

を

false positive time

の

value

としてもつことができる．

array

の要素は異常の開始時刻と終了時刻を保持し，学習データのうち，この時間帯に含まれるデータは異常なデータとみなされる

(B)

．なお，入力データには三つのメタデータ

(

データの名前，時刻，値の名前

)

を含むが，これらのうち，不要なものを省略することができる．この場合，省略されたメタデータを保持する

object

ごと省略される

(

下記に時刻を省略した場合の入力データのサンプルを示す

)

．このようにして，入力データのサイズを削減し，

転送／処理にかかる時間を削減する

(H)

．

{"

^data_name

": "

^MIB

", "

time_series_data

": [ [{"

value_name

": "

cpu1

", "

value

": 71.0}, {"

value_name

": "

^cpu2

", "

^value

": 79.0},

^…

[{"

^value_name

], ": "

^cpu1

", "

^value

": 71.0}, {"

value_name

": "

cpu2

", "

value

": 79.0},

…

: ],

]},

5. 1. 2

再学習

• URL

サンプル：

http

://

^api

.

^dnn

.

^com

/

machinelearning

-

^a

/

^traning

-

^results

/3?

^overwrite

=

^true

&

^parameterx

=0.1&

^parametery

=

^a

•

メソッド：

PUT

•

入力データサンプル：学習と同様

•

出力データサンプル：学習と同様

•

説明：先の学習機能で生成された学習済みモデルを再学習するための機能である．

PUT

でリクエストを受け付け，

URL

のパスの末尾の学習済みモデルの

ID

に対応する学習済みモデルを対象に再学習を実施するが

(E)

，ラップ対象の技術に再学習が実装されていない場合はエラーを返信する

(A)

．また，ハイパーパラメタについては再学習特有のものをクエリパラメタから取得するが，その他のパラメタは学習時に設定されたものを用いる．なお，クエリパラメタには再学習結果を既存の学習済みモデルに上書きするかどうかを指定するパラメタと，トレンド追従をするのか，誤検知再学習をするのかを指定するパラメタも含む．その他の仕様は学習機能と同様である．

5. 1. 3

検知

• URL

サンプル：

http

://

^api

.

^dnn

.

^com

/

machinelearning

-

^a

/

^testing

-

^results

/3?

^paramete1

=100&

^parameter2

=

^true

•

メソッド：

POST

•

入力データサンプル：ほぼ学習データと共通の形式であるが，以下の差分がある．

–

^冒頭の

key

が

training data

ではなく

test data

となる

– false positive time

を含まない

•

出力データサンプル：

{"

test_results

": [

{"

^time

":"2015/12/05 15:20","

anomaly_degree

":

0.0001,"

^is_anomaly

":

^false

},

{"

time

":"2015/12/05 15:21","

anomaly_degree

":

77.2,"

^is_anomaly

":

^true

}, :

],

"

cause_analysis_results

": [

{"

^time

": "2015/12/05 15:20","

^causes

": {"

anomaly_degree

": 0.0001,"

cpu1

":

-0.04292,"

^cpu2

": 0.00965,

^…，

"

^TCP_pkt

": 0.000711,"

^TCP_byt

"-0.000908,

…

{"

^time

}}, ": "2015/12/05 15:20","

^causes

": {"

anomaly_degree

": 77.2,"

^cpu1

":

(9)

-2.42925328,"

^cpu2

": 1.00965547,

…，

"

TCP_pkt

": 1.71820751,"

TCP_byt

":

-0.90843786,

^…

: }}

]}

•

説明：検知データを受け取り，指定された

ID

の学習済みモデルを用い，そのデータが異常であるかどうかを検知する機能である．

POST

でリクエストを受け付け，そのボディのデータを検知データとして用いる．また，クエリパラメタにはハイパーパラメタを含み，利用者の指定に応じて，検知に用いる

(

指定されていな場合はデフォルト値を用いる

(D))

．利用する学習済みモデルは

URL

のパスの末尾の学習済みモデルの

ID

を参照することで決定される

(E)

．通常，検知は短時間で終了するため，本機能は同期処理となり，

検知が終わると検知結果をレスポンスとして返す．

出力データの先頭には

test results

の

value

として，

入力データの各時刻に対する検知結果を

array

として保持する．この

array

の各要素は入力データの各時刻に対応する検知結果であり，時刻，異常度の数値，異常有無のブーリアンから構成される．なお，検知技術によって，どちらか，若しくは，両方に値が設定される．値の有無については保証されないが，共通の

IF

をネットワーク事業者に提供できる．また，要因推定結果は

cause analysis results

の

value

として含めることができ，これも入力データの時刻に対応した要因推定結果が

array

の各要素に含まれる．この

array

の各要素は，時刻，要因推定結果から構成され，検知技術が要因推定を実装していれば，要因に関する値

(

一般的には異常に対する各値の寄与度

)

が設定される

(C)

．

5. 2

実装方式

図

2

にラッパの実装方式を示す．ラッパは

Nginx

，

WSGI

，

Django

の組み合わせにより，

WebAPI

のプロトコルと

Python

の関数呼び出しとを相互変換する機能

(

プロトコル変換機能

)

と，先に提案したラッパの構成を実現する共通機能で構成される．これにより，

検知技術開発者によって作成され，具体的な異常検知を行うプログラム

(

学習，再学習，検知プログラムを含む

)

をラッパは

WebAPI

化する．また，学習済みモデルや各種コンフィグ

(

デフォルトパラメタなど

)

をオンメモリで取り扱うことで，学習，検知などの際の性能向上を実現する

memcached (G)

と，学習済みモデ

図2 実装方式 Fig. 2 Implementation.

ルの情報

(ID

，学習実施日，パラメタ条件，学習データの情報など

)

を保持する

postgreSQL

も含まれる．

学習のリクエストを受け付けると，プロトコル変換機能を経て，パラメタと学習データが共通機能の学習の関数に渡される．共通機能はこれらの形式のチェックを行い，正常なパラメタ，データではない場合はエラーを返し，プロトコル変換機能がエラーのレスポンスを返す

(J)

．正常なパラメタ，データの場合は，

postgreSQL

から学習済みモデルの

ID

を新たに払い出し

(E)

，レスポンスとして返信する．一方，学習はレスポンスとは非同期で実施しており

(I)

，必要なパラメタが不足していれば，共通機能が

memcached

からデフォルトパラメタを取得する

(D)

とともに，

JSON

形式の学習データを学習プログラムで用いる形式に変換する．その後，共通機能から学習プログラムにこれらのパラメタ，データを渡すことで学習を実施する．なお，

GPU

が複数ある場合は，ラウンドロビンで

GPU

を割り当てることで，特定の

GPU

への負荷の集中を防止する

(F)

．また，必要に応じ，共通機能からログを出力する

(K)

．

再学習のリクエストを受け付けた場合，基本的には学習と同様の流れであるが，再学習プログラムに対して，再学習対象の学習済みモデルと，その学習済みモデルを学習したときに設定したパラメタを指定する必要があるため，共通機能は

memcached

から対象の学習済みモデルを，

postgresql

からパラメタを取得する．

これらをデータとともに再学習プログラムに渡し，再学習を実施する．

(10)

検知のリクエストを受け付けた場合，プロトコルの変換，パラメタ，データのチェック，不足するパラメタと学習済みモデルの取得を行い，共通機能から検知プログラムを呼び出す．その後，検知プログラムからの検知結果を共通機能が取得し，これを

JSON

形式に変換し，プロトコル変換機能に返す．最後にプロトコル変換機能から

WebAPI

のレスポンスとして検知結果が返信される．

なお，上記のように検知プログラムが共通機能から呼び出され，データやパラメタを受け渡しができるように，検知プログラムは

Python

で記述され，特定の

IF

を実装する必要がある．また，エラーなどのログの出力のため，共通機能が提供するログ出力のための機能を検知プログラムから呼び出すことができる．

6.

評価

以上のようにして実装したラッパを用い，これまで筆者らが検討を進めてきたディープラーニングによる異常検知技術

[17], [18]

のプログラムを

WebAPI

化し，

実際のネットワークで異常検知を実施することで，本ラッパによる検知技術開発者，ネットワーク事業者に対する工数と難易度について評価した．更に，ラッパによる性能に対するオーバーヘッドを測定した．

6. 1

検知技術開発者にかかる工数と難易度ラッパは検知技術の開発者が

WebAPI

として技術を提供するための実装と，ネットワークでの利用に関する要件を満たすための実装を引き受けることで，検知技術開発者が検知技術をネットワーク対応させる工数を削減する一方，検知技術をラッパに対応させるため，検知プログラムに専用の

IF

を実装する必要がある．これが，検知技術の開発者にとってどの程度の障壁となるか確認した．

ラップ対象の技術はオートエンコーダを用いた異常検知技術とし，関係性モデルを用いた異常検知技術に分類される．学習時は，正常時のネットワークから収集される複数の数値

(CPU

使用率やトラヒック量など

)

をベクトルとし，各時刻のベクトルを学習データとして受け付ける．オートエンコーダはこのようなデータで正常時の関係性を学習する．その後，検知の際は，現在のネットワークから収集される同様なデータを検知データとして受け付け，学習済みモデルを用いて異常かどうかを判定する．なお，オートエンコーダを用いた異常検知は要因推定・再学習ができないが，

これまでの筆者らの検討により，これらが可能な技術

となっている．

このようなプログラムをラップするための実装の規模を確認した．この結果，既存のオートエンコーダによる検知プログラムは

33.1KB

であったのに対し，

ラッパに対応したプログラムは

51.6KB

であった．つまり，既存プログラムへの

IF

の実装のために

20KB

程度，

1

行あたり

30B

程度と考えると

700

行程度の追加が必要であった．既存のプログラムの規模が小規模であることも考えられるが，ある程度の量の修正が必要であると考えられる．

また，追加の内容は下記のようなものであった．

•

学習，検知のデータの入力，検知結果の出力をファイル

(CSV)

経由で行っていたものを，引数と戻り値でやり取りするように修正

•

学習済みモデルをファイルで入出力していたものを，

memcached

に入出力するように修正

•

パラメタをコンフィグファイルから読み込んでいたものを，引数から読み込むように修正

これらは検知技術の開発者が実装するにあたり検討が必要なものではなく，一意に実装ができるような内容であるため，難易度は低いと言える．

また，ラッパを用いない場合，

WebAPI

の実装とネットワークの要件を満たすための実装を，実装方法の検討からスクラッチで行う必要があるため，ラッパによる

WebAPI

化と比較し，工数・難易度ともに大幅に上がると考えられる．

6. 2

ネットワーク事業者にかかる工数と難易度ラッパはネットワーク事業者に共通の

WebAPI

を提供し，技術ごとにかかる導入のための実装を削減する．

一方，既存のネットワークオペレーションに

WebAPI

の異常検知技術を導入するための実装が必要である．

これがネットワーク事業者にとってどの程度の障壁となるか確認した．

図

3

に実装したラッパの利用環境例を示す．図の上部に既存のネットワークオペレーション環境を示しており，この環境では，ネットワークを構成するサーバ・ルータ・スイッチ等から

Logstash

でデータを取得，取得したデータを

Kafka

にバッファ，バッファされたデータを

Logstash

で取得し，

syslog

などのテキストデータを

syslog templater [19]

を用いて数値化，

数値データを

Elasticsearch

に保存，保存された数値データを

Kibana

で可視化，といった手順で構成されている．

このような環境に検知

WebAPI

を導入するために，

(11)

図3 利用環境例 Fig. 3 Practical environement.

学習，検知機能の起動プログラムを新たに作成する必要があった．このプログラムは，

Elasticsearch

からデータを取得し，そのデータを

JSON

形式に整形し，

WebAPI

にリクエストを送り，結果を

Elasticsearch

に保存する．このプログラムの規模は約

80KB

であった．この程度の規模であれば数人日程度で実装できると考えられる．

一方，上記プログラムは技術者自身が得意とする言語で実装できた

(Go

言語を利用

)

．また，

WebAPI

と連携するためのライブラリなどは多くのものが公開されており，一般的に導入の難易度は低いと考えられる．

以上に加えて，一度実装すると他の技術に対しても使い回せることも考慮すると，ネットワーク事業者に対する工数と難易度は低いといえる．

6. 3

オーバーヘッド

ラッパは検知プログラムをラップし，

WebAPI

とのプロトコル変換を行う．そこにオーバーヘッドが発生するため，オーバーヘッドの程度について評価した．

評価対象の機能としては，検知＋要因推定とし，学習については非同期処理であるため評価対象外とした．

また，測定項目としては，

WebAPI

のレスポンスタイムと，内部の検知プログラムの実行時間とし，これらの差分がラッパによるオーバーヘッドと考える．

評価の条件を以下に示す．

•

検知データの次元数：

36

次元

•

メタデータ省略による入力データの軽量化：なし

図4 評価環境 Fig. 4 Experimental condition.

•

リクエスト頻度：

2

リクエスト

/

秒

•

測定時間：

300

秒

•

評価環境：図

4

に示す．

検知データの次元数については実際のネットワークで異常検知に必要であった次元数とした．また，リクエスト頻度の根拠としては，ネットワーク事業者が抱える検知対象のネットワークを

10

程度とし，各ネットワークに対して

10

種類のモデル

(

トレンド追従の頻度や前処理の内容を変えたモデル

)

を用いて異常検知を運用することを前提とし，各モデルでの検知間隔を

1

回

/

分とする．そうすると，全体のリクエスト頻度としては

100

リクエスト

/

分となるが，多少の余裕をもつために評価のためのリクエスト頻度としては

2

リクエスト

/

秒

(120

リクエスト

/

分

)

とした．なお，評価環境としては

Docker

コンテナを用いるが，コンテナの異常検知プログラムからホストのリソースの利用に制限は加えず，また，コンテナから

GPU

にアクセスできる環境を構築した．更に，ラッパが提供する

WebAPI

に負荷をかけるためのトラヒックジェネレータとして

Tsung

を用いた．

以上の評価の結果，

WebAPI

のレスポンスタイムの平均は

4.29

秒であったのに対し，検知プログラムの実行時間の平均は

3.95

秒であった．この結果，

WebAPI

のレスポンスタイムのうち，オーバーヘッドはわずかであると考えられる．また，ネットワークにおいてリアルタイムな異常検知を実施するにあたり，この程度のレスポンスタイムであれば問題ないと考えられる．

7.

むすび

本論文では機械学習によるネットワーク異常検知技術を

WebAPI

化するラッパの構成を提案した．本ラッパは様々な検知技術をラップし，共通の

WebAPI

を介して検知機能を提供する．これにより，ネットワーク事業者は本

WebAPI

を利用するための実装をすれば，

(12)

様々な検知技術を利用可能となり，技術ごとの実装を削減できる．一方，検知技術開発者は本ラッパを用いることで，自身で

WebAPI

を実装する必要はなく，更に，技術のネットワーク対応のための実装をラッパに肩代わりさせることで容易にネットワーク対応の検知技術を作成できる．このようなラッパを実装し，ネットワーク事業者・検知技術開発者双方に対する工数・

難易度は低いことを確認した．加えて，本ラッパによる検知時間に対するオーバーヘッドが問題ない範囲であることを実測により確認した．

今後は，ネットワークの障害対応の現場での本ラッパの普及を進める．これにより，ネットワーク障害対応で多様な検知技術をタイムリーに利用可能となる．

また，ネットワーク事業者での機械学習による検知技術の導入コストが下がり，このような技術に対する需要が高まることで，検知技術開発者によるネットワーク向けの技術提供の促進も期待される．

また，異常検知以降の分析・対処と本

WebAPI

との連携による，ネットワークの障害対応の完全自動化に向けた研究を進めるとともに，ネットワーク以外の分野でも障害対応の自動化は求められているため，本ラッパの他分野での活用についても検討を進める．

文献

[1] 川原亮一，渡辺敬志郎，原田薫明，川田丈浩，“ネットワークオペレーションへのAI活用，”信学通誌，vol.12, no.1, pp.29–38, 2018.

[2] 井手剛，入門機械学習による異常検知，コロナ社，

2015.

[3] 井手剛，杉山将，異常検知と変化点検知，講談社，

2015.

[4] S. Harada, R. Kawahara, T. Mori, N. Kamiyama, H.

Hasegawa, and H. Yoshino, “A method of detecting network anomalies in cyclic traﬃc,” IEEE GLOBE- COM 2008 - 2008 IEEE Global Telecommunications Conference, pp.1–5, Nov. 2008.

[5] J. Takeuchi and K. Yamanishi, “A unifying frame- work for detecting outliers and change points from time series,” IEEE Trans. Knowl. Data Eng., vol.18, no.4, pp.482–492, April 2006.

[6] G. Jiang, H. Chen, and K. Yoshihira, “Discover- ing likely invariants of distributed transaction sys- tems for autonomic system management,” 2006 IEEE International Conference on Autonomic Computing, pp.199–208, June 2006.

[7] T. Id´e, A.C. Lozano, N. Abe, and Y. Liu, “Proximity- based anomaly detection using sparse structure learning,” Proc. 2009 SIAM International Conference on Data Mining, pp.97–108, 2009.

[8] 中野雄介，池田泰弘，渡辺敬志郎，石橋圭介，川原亮一，

“オートエンコーダによるネットワーク異常検知，” 2017

信学総大，B-7-33, March 2017.

[9] 池田泰弘，中野雄介，渡辺敬志郎，石橋圭介，川原亮一，

“オートエンコーダを用いたネットワーク異常検知における精度向上に向けた一検討，” 2017信学総大，B-7-34, March 2017.

[10] Zabbix LLC, “Zabbix,” https://www.zabbix.com/, 参照Aug. 31, 2018.

[11] “Nagios,” https://www.nagios.org/, 参照Aug. 31, 2018.

[12] NTT データ先端技術株式会社，“Hinemos,”

http://www.hinemos.info/,参照Aug. 31, 2018.

[13] Elastic, “Elastic,” https://www.elastic.co/,参照Aug.

31, 2018.

[14] Splunk, “Splunk,” https://www.splunk.com/, 参照 Aug. 31, 2018.

[15] Microsoft, “Azure machine learning studio,”

https://azure.microsoft.com/ja-jp/services/

machine-learning-studio/,参照Aug. 31, 2018.

[16] 情報処理推進機構，“非機能要求の見える化と確認の手段を実現する「非機能要求グレード」の公開，” https://www.

ipa.go.jp/sec/softwareengineering/reports/

20100416.html,参照Aug. 31, 2018.

[17] 池田泰弘，石橋圭介，中野雄介，渡辺敬志郎，川原亮一，

“オートエンコーダを用いた異常検知におけるスパース最適化を用いた要因推定手法(情報ネットワーク)，”信学技報，IN2017-18, June 2017.

[18] 池田泰弘，石橋圭介，中野雄介，渡辺敬志郎，川原亮一，

“オートエンコーダを用いた異常検知におけるモデル再学習手法(情報ネットワーク)，”信学技報，IN2017-84, Jan.

2018.

[19] T. Kimura, A. Watanabe, T. Toyono, and K.

Ishibashi, “Proactive failure detection learning gen- eration patterns of large-scale network logs,” 2015 11th International Conference on Network and Ser- vice Management (CNSM), pp.8–14, Nov. 2015.

（2018年8月31日受付，12月11日再受付，

2019年2月1日早期公開）

中野雄介（正員）

平成17年和歌山大学大学院システム工学研究科修了．同年日本電信電話株式会社入社．以後，NTTネットワークサービスシステム研究所，NTTネットワーク基盤技術研究所勤務．Webスクレイピング，ユビキタスコンピューティング，サービスデリバリープラットホーム，分散データベース，Webパフォーマンス，異常検知技術等の分野の研究に従事．博士(情報科学) (平成23年3月，大阪大学)．

(13)

池田泰弘（正員）

2010年慶應義塾大学大学院基礎理工学専攻応用物理専修修士課程修了．同年日本電信電話株式会社に入社．以降インターネットトラヒック分析，ネットワーク設計，

品質分析等に関する研究に従事．2012年電子情報通信学会情報ネットワーク研究賞受賞．

松尾洋一（正員）

2015年慶應義塾大学大学院理工学研究科基礎理工学専攻博士課程修了．同年，日本電信電話株式会社に入社．以後，通信ネットワークのデータ分析を用いた保守運用高度化に関する研究に従事．

渡辺敬志郎（正員）

2004年九州大学大学院システム情報科学府修士課程修了．同年，NTTサービスインテグレーション基盤研究所入社．以降，

映像通信サービスの品質評価・管理技術に関する研究開発に従事．2012年NTTコミュニケーションズに転籍し，メールサービスの開発／管理業務に従事．2015年NTTネットワーク基盤技術研究所に転籍後，現在までAI技術の活用による保守運用高度化に向けた検討に従事．

石橋圭介（正員：シニア会員）

平5東北大・理・数学卒，平7年同大学院修士課程了，同年，日本電信電話株式会社に入社．IPネットワークのトラヒック，

品質計測等の研究に従事．平29から国際基督教大学教養学部アーツ・サイエンス学科准教授．博士（情報理工学）．日本ソフトウェア科学会，IEEE会員．

西松研（正員）

1997年早稲田大学大学院理工学研究科情報科学専攻修士課程修了．同年，日本電信電話株式会社に入社．以降，通信トラヒックやデータ分析に関する研究に従事．現在は，NTTネットワーク基盤技術研究所に所属．情報処理学会，日本オペレーションズ・リサーチ学会会員．

機械学習を用いたネットワーク異常検知技術の WebAPI 化の研究 *