• 検索結果がありません。

要 旨 不正侵入パケットに対する機械学習の適用

N/A
N/A
Protected

Academic year: 2021

シェア "要 旨 不正侵入パケットに対する機械学習の適用"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

要 旨

不正侵入パケットに対する機械学習の適用

松尾 達郎

機械学習を用いた異常検知型侵入検知システムはシグネチャ型の問題点である未知の攻 撃を検知できないという欠点を解消する手法として注目されている.そのため,異常検知 型侵入検知システムの精度を向上する研究が行われている.しかし,近年のネットワークの 高速化と取り扱うデータの増大により,異常パケットの判別に用いられる機械学習は,精度 に加え学習の速さが重要になってきている.そこで,本研究では,異常検知型侵入検知シス テムの学習アルゴリズムとして,近年提案された高速な学習アルゴリズムであるExtreme

Learning Machine(ELM) を適用し,汎化性能が高く,多くの実問題で用いられているサ

ポートベクターマシン (SVM) と,精度と学習速度を比較する.データセットには UCI Machine Learning Repository提供のデータセット「KDD Cup 1999 Data」の訓練データ サンプルを用いる.4,898,431個のデータに対して,5001行の一定行間隔のサンプリング を行うことでサブデータセットを生成し,それぞれのサブデータに対して判別を行う.実験 の結果,ELMの学習時間はデータセットの大きさに対して線形的に増加し,データセット 全体に対しては,SVMを用いた学習は精度が99.91%,学習時間が34,902秒であるのに対 し,ELMを用いた学習は精度が99.84%,学習時間が865秒となることを示す.この結果 は,ELMが精度を保ったまま,学習を高速化できることを示しており,高速通信路を短時 間で通過する大きなサイズのデータに対する学習法として有用であると考える.

キーワード 異常検知型侵入検知システム,Extreme Learning Machine,サポートベク ターマシン,KDD Cup 1999 Data

i

(2)

Abstract

A Study of Network Intrusion Detection System using Machine Learning Algorithm

Tatsuro MATSUO

Anomaly intrusion detection system(IDS) using machine learning has been studied by many researchers to overcome the weakness of signature-based IDS in detecting unknown attacks. Improvement of precision of classification is an important issue in the research area of anomaly IDS. High speed network produces tremendous amount of data to inspect by IDS. Then not only precision of classification, but also the speed of convergence is important for a real network application. In this study, the extreme learning machine(ELM), which is a novel neural-network learning algorithm proposed in 2006, is applied to IDS, and is compared with support vector machine(SVM), which is a popular learning algorithm applied in various area. The advantage of ELM is its convergence speed. The precision and convergence speed of ELM are compared with those of SVM. For abnormal packets classification, the dataset “KDD Cup 1999 Data”

by University of California Irvine, Machine Learning Repository is used. Total number of the data is 4,898,431 and sub-datasets are generated by equal interval sampling. The discrimination is performed using each sub-dataset. The result shows linear increase of learning time using ELM for datasets, while the learning time of SVM increases in cubic to the number of data. SVM classifier achieves 99.84% of the precision and 34,902 seconds for learning. ELM classifier achieves 99.84% of the precision and 865 seconds for learning. These results show that learning speed of ELM improves while its

ii

(3)

classification precision is preserved, and ELM has an advantage for IDS in a high speed communication network.

key words Intrusion Detection System, Extreme Learning Machine, Support Vector Machine, KDD Cup 1999 Data

iii

参照

関連したドキュメント

解析にかける前に,データを適切に編集する必要があ ることも多い.

と環境要因の変化を SVM(Support Vector Machine)で機械学習することで,非線形な猿の 出現を予測した.ここでは,8

Treeを使用する.可視化が不要で,データ量が多い場合には,多量のデータに対して短時間で分

近年、マルウェアや不正侵入といったサイバ

1.  データセットを 学習データ と テストデータ に分割..

クレジットカード加入審査結果データセットを用いた複数の機械学習 手法の性能比較 池田政人†1 新美礼彦†2 概

最適化の上で,DARPA のデータセットに関しては HTTP

製品やそれを構成する部品,またその製品を成 形する為の金型に至るまで,製造着手前に作