• 検索結果がありません。

悪性サイトを攻撃ツールにより分類するWebクローラー

N/A
N/A
Protected

Academic year: 2021

シェア "悪性サイトを攻撃ツールにより分類するWebクローラー"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 79 回全国大会. 1W-05. 悪性 Web サイト解析に向けた通信データの収集のためのサイト探索手法 永井 達也†. 神薗 雅紀‡ 白石 善明† 神戸大学†. 毛利 公美†† 高野 泰洋†. PwC サイバーサービス‡. 1 はじめに 悪性 Web サイトによる被害が問題となってい る.Drive-by Download 攻撃のような悪性 Web サ イトによる攻撃を防御したり,その被害を早期に 復旧させるためには,そのような攻撃のデータを 収集し,技術の高度化を図ることになる.アンチ ウイルスベンダはユーザのクライアント端末に, ISP は網内の各所にセンサー機能を配置することで, 不正なアクセスを検知したら直ちに通信データを 収集し,解析することができる[1][2].センサーイ ンフラの所有者はこのときの通信データを研究等 に利活用できる.しかしながら,アンチウイルス ベンダや ISP のセンサーインフラはその加入者に よる通信とそれに関連するデータは,そのまま研 究用データセットとして他者には供出しにくい. センサーインフラを持っていなければ,悪性 Web サイトを探索したうえで通信データを収集するこ とになる. 公開されている情報をシードとして悪性 Web サ イトの探索および通信データの収集ができれば, それを研究用データセットとして広く利活用でき るようになる.本研究では悪性 Web サイトの研究 に資する通信データの収集に向けて,センサーイ ンフラを必要としない悪性 Web サイトの発見と, 通信データを採取する方法の確立を目標としてい る.本稿ではその初期的段階として悪性 Web サイ ト探索のためのシードを検討している.アンチウ イルスベンダの発行する解析レポートに掲載され ている悪性 Web サイトを手がかりに,そのサイト が属する AS を探索するというアプローチをとる. その結果,悪性 Web サイト探索のシードとして解 析レポートを用いると,探索した Web サイトのう ち約 8%が悪性であったと判定された.. 星澤 裕二‡ 森井 昌克†. 岐阜大学††. 通信データは Web サイトをクロールして収集す る.しかし,悪性 Web サイトの通信データが収集 できると期待してブラックリストに掲載されてい るサイトをクロールしても,以下の事由により期 待する通信データを容易に採取できない. 1. 悪性ではない Web サイトの情報が含まれる 2. ブラックリストに掲載された時点でその悪性 Web サイトが存在しない これらはブラックリストサイトの多くは悪性 Web サイトを登録するための認証が無く,誰でも登録 できるようになっていること,そして,攻撃者は 悪性 Web サイトの URL を短時間で変更させるこ との 2 点が原因としてあげられる. 3 本研究のアプローチ 2 章に述べたようにブラックリストには悪性では ない Web サイトの情報が載せられていることがあ る.このような情報をシードとして使うと探索精 度が下がってしまう.そこで,本研究ではアンチ ウイルスベンダの発行する解析レポートをシード として,それに掲載されている悪性 Web サイトを 手がかりとする.悪性 Web サイトが一部の AS に 集中しているという報告[4]があることから,解析 レポートが示す既知の悪性 Web サイトが属する AS を探索対象とする. 図 1 に悪性 Web サイト探索のアプローチを示す. アンチウイルスベンダは悪性 Web サイトの解析を 十分に行ったのち,その脅威情報を解析レポート として発行している.つまり,解析レポートに記 載されている情報は悪性 Web サイトのものである ことが確認されている.確かな情報源をシードと することで探索精度の向上が期待できる.. 2 従来のアプローチ Malware Domain List[3]のように悪性 Web サイ トをブラックリスト化して共有する取り組みが行 われている.. 解析レポート. ②発行. アンチウイルスベンダ ①解析. ③URL取得. AS. Searching websites for collecting communication data to analyze malicious websites †Tatsuya NAGAI ‡Masaki KAMIZONO †Yoshiaki SHIRAISHI ††Masami MOHRI †Yasuhiro TAKANO ‡Yuji HOSHIZAWA †Masakatu MORII †Kobe University ‡PwC Cyber Services ††Gifu University. クローラー ④ASにアクセス. 図 1:悪性 Web サイト探索のアプローチ. 3-537. Copyright 2017 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 79 回全国大会. 4 提案手法:解析レポートをシードとした悪性 Web サイトの探索 3 章のアプローチを具体的に以下の手順で実行す る. Step1) 解析レポートから既知の悪性 Web サイトの URL を抜き出す. Step2) 悪性 Web サイトの URL から,そのサイト が属する AS 番号を抜き出す. Step3) AS に対応する IP アドレス群を取得し,ア クセスする. Step4) アクセスしたサイトに対して悪性 Web サイ トであるかどうかの判定を行う. 5 評価実験 5.1 実験概要 解析レポートをシードとしたときの悪性 Web サ イトの探索精度を確認するために,4 章で述べた探 索手法を表 1 の環境で実装した. Step1 の解析レポートには MalwarebytesLab が 2016 年 12 月 2 日に発行したもの[5]と IIJ-SECT が 2016 年 10 月 17 日に発行したもの[4]を利用し た. この二つの解析レポートから探索を行い, 悪性 Web サイトの数を集計する.Step4 の悪性 Web サイトかどうかの判定に VirusTotal[6]を利用 した.Web サイトの IP アドレスを VirusTotal に 送ると,過去のホスト名や関連する URL の検査情 報が得られる.これらの情報からアクセスした Web サイトが過去に悪性だと判定されていたかど うかを確認する. 5.2 実験結果 2016 年 12 月 14 日~2017 年 1 月 10 日の間で, MalwarebytesLab の解析レポートに記載されてい た AS 番号(AS X とする)の IP アドレス 3700 個, IIJ-SECT の解析レポートに記載されていた AS 番 号(AS Y とする)の IP アドレス 415 個にアクセ スを行い,Web サイトであった IP アドレスに対し て悪性であるかどうかの判定を行った. 悪性 Web サイト探索の集計結果を表 1 に示す. AS X,AS Y の両方とも,Web サイトであった IP アドレスのうち約 8%が悪性であった.そのうちの, 12 月 15 日にアクセスした AS X に含まれるある IP アドレスはホスト名を変えながら頻繁に悪性 Web サイトになっていることが確認できた.この 現象は解析レポート発行日である 12 月 2 日以降も 続いていた. 5.3 考察 解析レポートから得られた AS に存在する Web サイトのうち約 8%が悪性 Web サイトであった. GoogleSafeBrowsing のレポートでは『1 日に数十 億件の URL を調査して,安全ではないウェブサイ トが新たに数千件も見つかり』と報告している[7].. 表 1: Web クローラーの実装環境 OS Windows7 Home Premium HtmlUnit 2.23 ブラウザ VirusTotal 悪性判定 収集期間 2016/12/14~2017/1/10. 表 2: 解析レポートをシードとした Web サイト探索の結果 AS X AS Y 1176 156 良性だった Web サイト 100 12 悪性だった Web サイト 1276 168 Web サイト合計 単純な比較はできないものの,本研究のアプロー チで発見した悪性 Web サイトの割合は低いもので はないと考えられる. 6 まとめ 本稿では悪性 Web サイトの通信データの収集に 向けて,その探索のためのシードとしてアンチウ イルスベンダが公開している解析レポートを利用 する手法を検討した.実験により,ある 2 つの AS に対して,Web サイトのうち約 8%が悪性であった ことが確認できた.本論文での探索手法をもとに して,出現してから間もない悪性 Web サイトを見 つける方法を考えていく予定である. 参考文献 [1] 八木毅, 谷本直人, 浜田雅樹, 伊藤光恭. (2009). プロバイダによる Web サイトへのマルウェア 配布防御方式. 電子情報通信学会技術研究報告. IN, 情報ネットワーク, 109(119), 55-60. [2] 針生剛男, 秋山満昭, 青木一史, 八木毅, 岩村誠, 倉上弘. (2012). 進化するマルウェア等による サイバー攻撃の検知・解析・対策技術. NTT 技術ジャーナル, 13-17. [3] Malware Domain List, https://www.malwar edomainlist.com/mdl.php [4] IIJ-SECT,”Rig Exploit Kit 観測数の拡大に関 す る 注 意 喚 起 ”, https://sect.iij.ad. jp/d/2016/10/178746.html [5] Malwarebytes Lab, “Tor Browser zero-day strikes again”, https://blog.malware bytes.com/threat-analysis/2016/11/torbrowser-zero-day-strikes-again/ [6] VirusTotal, https://www.virustotal.com/ ja/ [7] Google Safe Browsing, “セーフ ブラウジング 透 明 性 レ ポ ー ト ”, https://www.google. com/transparencyreport/safebrowsing/?hl=ja. 3-538. Copyright 2017 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

鋼板中央部における貫通き裂両側の先端を CFRP 板で補修 するケースを解析対象とし,対称性を考慮して全体の 1/8 を モデル化した.解析モデルの一例を図 -1

25 法)によって行わ れる.すなわち,プロスキー変法では,試料を耐熱性 α -アミラーゼ,プロテ

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

Vertical comp.. and Ichii, K.: A practical method to estimate strong ground motions after an earthquake based on site amplification and phase characteristics, Bull. Kanazawa:

名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の  

このように,フラッシュマーケティングのためのサイトを運営するパブ

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (