評価用ルールの準備

第 7 章評価 99

7.1.2 評価用ルールの準備

能動攻撃型マルウェアの検知ルール

本手法による能動攻撃型マルウェアの検知精度を評価するために，IRC^{によって命令を送} 受信するボットの主要な活動パターンを示すルールを作成した．これを表7.1^{に示す．ルール} 作成にはEvanらの研究[34]やCyber-TAによる調査[75]において明らかにされている能動攻撃型マルウェアによる通信データを参考にした．

ルールR₁^，R₂^，R₃^{はそれぞれイベント}e_1,2,3,4,5^，e_6,7,8,9^，e_10,11,12で構成されている．イベントの発生条件を満たすと指定された動作を実行し，最終的にボットの活動を検知した場合は管理者に対応を促すアラートが発行される．各イベントの動作では変数v_nにあらかじめ指定した値や通信データの一部を代入し，発生順序の制御や通信データの保持を実現している．

• R1: IRC^{で受信した}C&Cサーバからの命令にもとづいて，TCP^ポート135^，137^，139^， 445のいずれかを調査する活動を検知するルールである．明らかにされており，e2ではその一部を用いている．また，Base64形式の命令とみられる文字列もe₃^{で検知対象と} している．IRCセッションに命令と予想される文字列が発見された後に各TCP^ポートへの接続要求が一定回数を上回った場合，ボットの活動と見なす．

• R₂: IRCで受信したボット更新ファイルの取得命令にもとづいて，HTTP経由で実行ファ

イルを取得するふるまいを検知するルールである．e7においてIRC^{上で発見した}URL をv5に保存し，e8のHTTP^要求とv5のURLが一致するかを確認する．e9はe8からの

表7.1:能動攻撃型マルウェアの検知用ルール概要

イベントの発生条件イベント発生時の動作

R₁ e₂ (TCPセッションにおけるIRC)∧ v₂←true(120秒) data("(root.mass|ipscan|adv.start|

135|137|139|msass|advscan|lsass|scanall")

e₃ (v₁=true)∧data("[0-9A-F]{64}") v₂←true(120秒) e4 (v2=true)∧TCPポート135，137，139，445番への

接続要求

v3←v3+1 (60秒)

e₅ v₃>32 アラート

R2 e7 IRCセッション∧URL形式の文字列の出現 v₅← URL形式の文字列 (120秒)

e₈ data(v₅) v₆←true(60秒)

e₉ (v₆=true)∧ f ormat(WinExe) アラート

R₃ e₁₀ TCPポート135，137，139，445, v₇←v₇+1 (120秒) 3127番への接続要求 v₈←src_addr(120秒) e11 (v8=src_addr)∧Windows実行形式のファイルの送

信

v9←true(300秒)

e₁₂ (v₇>32)∧(v₉=true) アラート

src_addr:^送信元IP^アドレス

data(R) : HTTP^{応答データに正規表現}Rに一致するデータが含まれればtrue f ormat(WinExe) : HTTP応答データがWindowsの実行形式ファイルであればtrue

状態遷移であるため，e₈と同一セッションでのHTTP応答にMicrosoft Windowsにおいて実行可能な形式のファイルが含まれていた場合，これをボットの活動とみなす．実行形式の検知は[28]を参考にルールを作成した．

• R3: 同一ホストから調査活動とWindows実行形式のファイル送信が同時期に発生していることを検知するルールである．TCPポート135，137，139，445を用いた調査活動を検知し，同時に送信元アドレスをv₈に保存する．当該ホストから送信されるパケッ

トにWindows形式を検知した場合，ボットの感染活動およびマルウェアの送信を実施

しているとみなす．

受動攻撃型マルウェアの検知ルール

受動攻撃型マルウェアによるネットワークトラフィックを評価するためのルールを用意し

た．Web^閲覧時にJava Script処理をきっかけとして攻略される脆弱性を利用した攻撃を受け，

マルウェアの転送や悪意ある活動が発生するというシナリオに基づいて定義されている．ア

表7.2:受動攻撃型マルウェアの検知用ルール概要

Sn en 条件の詳細一致後の動作

S1 e13 data("(<script|function)")=true v10←true(10秒)

e14 data("((%u[0-9a-fA-F]{4}){10}| v11←true(10^秒) (\x5cx[0-9a-fA-F]{2}){10}|

([0-9]{2,3},[ ]*){10}|

[\x21-\x23\x26-\x7e]{64}|

[A-Fa-f0-9]{16})")=true

e15 v10=true∩v11=true v12←true(60^秒) v₁₅←s_addr(60秒)

S2 e16 v12=true∩ v13←true(10秒)

url(".(jpg|gif|css|txt)$")=true

e₁₇ v₁₃=true∩f ormat(WinExe)=true A₁の検知

S3 e18 v12=true∩f ormat(WinExe)=true v14←v14+1 (10^秒) v16←true(60^秒) S4 e19 v14>0∩f ormat(WinExe)=true v14←v14+1 (120^秒)

e20 v14≥5 A2の検知

S₅ e21 v₁₅=s_addr∩f ormat(WinExe)=true A3の検知

S6 e22 v16=true∩var_name A4の検知

("^(id|ver|smtp|url|[a-z])$")=true

s_addr: HTTPサーバ側IPアドレス

data(R) : HTTP^{応答データに正規表現}Rに一致するデータが含まれればtrue url(R) : HTTP^要求のURL^{に正規表現}Rに一致するデータが含まれればtrue

var_name(R) : HTTPのGET/POST要求に正規表現Rに一致する変数名が含まれればtrue f ormat(WinExe) : HTTP^{応答データが}Windowsの実行形式ファイルであればtrue

vn(^{変数の生存時間})

ラートは1つの通信データに対して1つ以上発生する可能性があり，1^{つでも発見されればマ} ルウェアによる活動があったと見なす．アラート検知用のルールの作成や各事象間の待機時間設定については，通信データD_pを参考として作成した．

受動攻撃型マルウェアの検知ルールは能動攻撃型マルウェアのそれとは異なり，1つのルールが分岐する形式になっている．これは受動攻撃型マルウェアによる攻撃に共通項が見られ，

1つのルールとして集約できため，このように表現した．受動攻撃型マルウェア検知のルールをA₂とし，出力されるアラートをA₁_.₂_.₃_.₄の4種類に分類した．各々のアラートのシナリオについて説明する．

• A1 : Web^{ブラウザの}Java Script処理をきっかけとして攻略される脆弱性を利用した

攻撃(これを攻撃wとする)が発生し，画像やテキストデータを示す拡張子のファイル

がWindows実行形式ファイルだった場合にマルウェアの攻撃，転送とみなすアラート．

".exe"の拡張子のファイルをダウンロードした際にネットワーク監視によって検知されるのを防ぐため，一部のマルウェアはマルウェア本体を画像やテキストデータに見せかける．

• A₂ : 攻撃wが発生した後，短時間に5回以上Windows実行形式のファイルがダウンロードされるアラート．マルウェアは耐性を高めて長期間ホスト上で活動するために数種類のマルウェアを転送し，感染させる[12]．そのため，攻撃後に短時間で数種類の

Windows実行形式ファイルのダウンロードがあった場合にマルウェアの活動とみなせ

る．CCCDataSet 2008の各通信データにおいて実行形式ファイルが平均4.78^回(^小数点第3^{位以下切捨})ダウンロードされていたため，短時間での転送を5^{回以上と設定した．}

• A₃:攻撃wが発生した後，短時間内に攻撃を受けたサーバからWindows実行形式のファイルがダウンロードされるアラート．マルウェアの攻撃と転送には同じサーバが使用される場合が多く，同じ通信相手に対して疑わしい事象が断続的に発生したことを検知する．

• A4:^攻撃w^{が発生した後，}Windows実行形式のファイルが最低1^{回ダウンロードされ，}

受動感染型マルウェアのHTTP要求に多く発生する変数名が含まれた場合にマルウェアの活動とみなすアラート．個々の事象は悪意のない通信でも発生する可能性があるが，

一定時間内に連続して発生したことを検知する．

A1,2,3,4を検知するために作成したROOK^{のルールの説明を表}7.2^に示す．ROOK^は異なる TCPセッションの相関関係を表現するため，ルールはTCPセッション(S_n)と各TCPセッションに属する検査条件(en)^{を示している．同じ}TCPセッションに属する検査条件は，同一の TCPセッションにおいて連続して発生した場合に条件を満たしたと判断する．各検査条件の発生順序や検査に関する情報の保持はパラメータ(v_n)によって制御している．パラメータはホスト毎に数値やIPアドレス，真偽の値を保持する記憶領域であり，各検査条件では各プロトコルヘッダの値や固定値とパラメータを比較することで，状態遷移の発生などを検出する．

また，図7.1では各検査条件がどのパラメータによって相関関係を表しているのかを示している．

e₁₃はHTTPの応答データにJava Scriptが含まれるかを調査する条件である．一方，e₁₄は Internet Explorer^のJava Script処理をきっかけとして攻略される脆弱性を利用した攻撃コードが含まれる場合，出現する可能性の高い文字列を表している．e13,14が共に満たされることで，

e₁₅の条件が成立し，悪意のあるJava Scriptを受信した可能性を示すv₁₂にtrueが代入される．

e16,17はe15の成立後にテキストデータや画像データの拡張子を含む要求パスを送信しているにもかかわらず，Windows実行形式のファイルがダウンロードされた場合にA1の検知と見な

e13

e14

e15

e16 e17

e18

e19 e20

e21

e22

A4 v10

v11

v12

v12 v15

v13

v14 v16

v14

図7.1:検知ルールにおける検査条件とパラメータの関係

す．また，e_18,19はe₁₅後にWindows実行形式のファイルがダウンロードされた回数をカウントしている．e20で5回以上のダウンロードが確認された場合は，A2の検知と見なす．さらに e₁₅が成立した際に，悪意のあるJava Scriptが送信されたと考えられるサーバのIPアドレスをv₁₅^{に保存している．}e₂₁^ではWindows^{実行形式のファイルが}v₁₅^{に保存された}IP^アドレスからダウンロードされたのかを確認し，一致すればA3の検知と見なす．そして，e22では

1つ以上のWindows実行形式ファイルがダウンロードされた後に，マルウェアが頻繁に利用

すると見られる単語がHTTP要求の変数名に含まれているかを確認する．これが成立すれば A4の検知と見なす．

各ルールにおける変数保持時間の設定

本実装ではマルウェアの活動を追跡するために変数によって状態を保持するが，変数を長時間保持することで記憶領域を圧迫する可能性があるため，保持時間の設定は慎重に検討しなければならない．本評価における各ルールの保持時間設定は，ルール作成時に参考とした通信データの他に第3.3節での調査結果を利用した．

第3.3節においてモデル化したマルウェアの状態遷移は大きく分けて初期化フェイズ(図3.6

におけるS_1,2,3,4)^{と活動フェイズ}(^図3.6^におけるS₅)^{とに分類できる．表}3.7^{において示し}

た各状態開始から遷移までの所要時間によれば，S1,2,3,4における状態遷移の平均所要時間は 9.743秒(S₁→S₂→S₄)から19.138秒(S₁→S₂→S₃→S₄)となっている．評価で利用したルールは，R4が初期化フェイズ，R1,2,3が活動フェイズに位置づけられる．第3.3^{節での調査} 結果でもS4→S5の状態遷移にかかった所要時間は平均で137.091^{秒，最大で}489.683^秒と

表7.3:^{比較に用いた}Snort^のルール

ルールファイル名能動攻撃型マルウェアの検査受動攻撃型マルウェアの検査

backdoor.rules O O

emerging-malware.rules O O

emerging-virus.rules O O

emerging-web.rules O

emerging-web_client.rules O

emerging-web_server.rules O

emerging-web_specific_apps.rules O

emerging-web_sql_injection.rules O

emerging.rules O

spyware-put.rules O O

virus.rules O O

web-activex.rules O

web-attacks.rules O

web-cgi.rules O

web-client.rules O

web-coldfusion.rules O

web-frontpage.rules O

web-iis.rules O

web-misc.rules O

web-php.rules O

合計ルール数 3,387件 9,012件

なっており，初期化フェイズ中での状態遷移に比べると長時間待たなければならない．これ

は，C&Cサーバが任意のタイミングで命令を発行するために，初期化フェイズが終了してか

ら活動フェイズに入るまでの時間が不定であるためだと考えられる．しかし，評価で利用したルールは初期化フェイズと実行フェイズが完全に分離しており，この間の状態を変数として保持する必要はない．実装の仕様上，長時間にわたって変数を保持するルールも記述可能だが，R1,2,3,4では変数の保持時間が一定時間内になっていると言える．

比較用ルールの準備

比較対象のSnort^{は公式サイト} [19]^{で配布されている}Sourcefire VRT Certified Rules^と

Emergin Threats[20]で配布されているルールを利用した．検査に利用したルールファイルの

一覧を表7.3に示す．能動攻撃型マルウェアとの比較には2008年11月27日版のルールセットを用意し，3,387件のルールを利用した．受動攻撃型マルウェアとの比較には2010^年5^月 14日版のルールセットを用意し，から9,012件のルールを利用した．

ドキュメント内 Year 2009 Dissertation (ページ 112-118)

第 7 章 評価 99

7.1.2 評価用ルールの準備

第 7 章評価 99