• 検索結果がありません。

フィッシングサイトの特徴を用いた検出手法に関する考察

N/A
N/A
Protected

Academic year: 2021

シェア "フィッシングサイトの特徴を用いた検出手法に関する考察"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

フィッシングサイトの特徴を用いた検出手法に関する考察

宮澤 孝如† 寺田真敏 土居範久† 中央大学理工学部情報工学科† 中央大学研究開発機構

1

はじめに

1 ブラックリストに基づきフィッシングサイトを 検出する方式の場合,ブラックリストに登録され ていないフィッシングサイトを検出することはで きない.本研究では,この問題を解決するために, フィッシングサイトの存続期間は短いといったフ ィッシングサイト固有の特徴に着目した検出方式 を提案してきた[1].本稿では,検出精度向上のた め,新たにドメイン登録情報,ログイン判定,サ ーチエンジンキャッシュの3 つの特徴に着目した 検出方式を提案する.さらに,実際にフィッシン グサイトに手動でアクセスを行なった評価結果か ら3 つの特徴を用いた検出方式の有効性を示す.

2

既存方式の課題

本節では,提案方式の前提となる文献1)に示す フィッシングサイト検出方式(以降,既存方式と 呼ぶ)と,既存方式の課題について述べる. 既存方式は,クライアントPCとWebサーバの間 に設置したプロキシサーバでHTTPリクエストの 内容を解析し,アクセスしたサイトが表 1に示す 特徴を有しているか否かを調査する.次に,その 調査結果を各項目毎に重み付けしたポイントに換 算した後,その積算値をWebサイトの危険度とす る.最終的に,Webサイトの危険度があらかじ 表 1 既存方式の調査項目 分類 調査項目 Netcraftサイト[2]から取得した Webサイトの稼働日数が短い Netcraft サ イ ト か ら 取 得 し た Web サイトのランクが低い Web サイトの 存続期間の特徴 WayBack Machineサイト[3 ]か ら取得した過去のWebページと の差異が大きい Web サイトへのアクセス回数が 少ない トップレベルドメイン(TLD),セ カンドレベルドメイン(SLD)名 が危険なドメイン名に属する ドメイン名の特徴 DNS サーバを用いた正引き,逆 引きに不整合がある 個人情報の詐取を 目的とする特徴 Web ページに個人情報の入力を促す文字を含む

1Feasibility study for the detection approach of

"phishing site"

†Miyazawa Takayuki, Norihisa Doi, Faculty of Science and Engineering, Chuo University

‡Masato Terada, Research and Development Initiative, Chuo University め設定した閾値を超えた場合,フィッシングサイ トとみなす. この既存方式を用いた2006 年 3 月の評価結果 は,フィッシングサイト検出率85%,正規サイト 検出率 92%で検出率と誤検出率共に良好であっ た.しかし,2006 年 8 月~11 月に評価した際に は,フィッシングサイト検出率 100%に対し,正 規サイト検出率は 9%に留まり,正規サイトの誤 検出率が高い結果となった. 本稿で解決したい課題は,フィッシングサイト 検出率を維持しつつ,正規サイトの誤検出率を下 げる既存方式の改善にある.

3

追加調査項目を用いた検出方式の提案

本節では,既存方式の検出精度を向上する方式 として,既存方式に新たな調査項目を追加する方 式を提案する. 3.1 追加調査項目 (1) ドメイン登録情報 フィッシングサイトがドメイン名を取得してい る場合,ドメイン名を取得してからサイトを開設 するまでの期間が短い,ドメイン名の有効期間が 短いという傾向が見られる.これに対し,正規サ イトでは,サイト開設までの期間に余裕があり, 有効期間も長い傾向にある.本項目ではWhois か ら取得したサイトのドメイン名の登録年月日,ド メイン名の有効期限から特徴を調査する. (2) ログイン判定 フィッシングサイトにログイン入力フォームが 存在する場合,でたらめな ID やパスワードでロ グインできる傾向がある.これは,ID やパスワー ドを怪しまれずに搾取するための見せかけのログ イン入力フォームを用意しているだけに過ぎない からと思われる.一方,正規サイトでは正規ユー ザを識別するためにログイン入力フォームを用意 していることから,通常でたらめな ID やパスワ ードでログインできることはない.本項目では, アクセスしている Web サイトにログイン入力フ ォームが存在する場合,でたらめな ID やパスワ ードでログインを試みることで特徴を調査する. (3) サーチエンジンキャッシュ フィッシングサイトの存続期間が短いという特 徴は,検索ポータルサイト(以降,サーチエンジ ン)のキャッシュにWebページが登録される前に

3-353

4W-2

情報処理学会第69回全国大会

(2)

閉鎖されてしまう可能性が高い.すなわち,サー チエンジンのキャッシュにWebページが存在しな い可能性が高くなる.これに対し,正規サイトは 存続期間が長く,利用頻度も高いことからサーチ エンジンに登録されているキャッシュ数も多いと 考えられる.本項目ではWebサイトのドメイン名 を検索キーに,Google[4]に登録されているキャッ シュ数を取得することで特徴を調査する. 0% 20% 40% 60% 80% 100% フィッシング 正規サイト 1週間以下 3年以下 7年以下 7年以上 ※ドメインがIP アドレスのサイトは除外 3.2 危険度の算出方法 フィッシングサイトであるか否かを判定するた めの危険度の算出方法は,式(1)の通りである. i n i i n w d w

危険度 = j l k

× ÷ + i n i i n w d w

危険度 = j l k

× ÷ + (1) diは既存方式の各項目とドメイン登録情報の調 査結果のポイントであり 0~100 の数値をとる. wiは重み付けであり0~3 の数値をとる.kjはロ グイン判定,サーチエンジンキャッシュの調査結 果を換算したポイントであり,それぞれ-5~+15, -20~+20 の数値をとる.n,lは調査項目数である. また,危険度の値が 65 以上の場合をフィッシン グサイト,また,40 以上 65 未満の場合は疑わし いとみなす.

4

評価

評 価 に 利 用 し た フ ィ ッ シ ン グ サ イ ト は , RBL.JP[5]が公開している情報を参考にし,2006 年8 月~11 月で,計 66 の実在のフィッシングサ イトを対象とした.また,誤検出率を評価するた めの正規Webサイトとして,文献 6)で取り上げて いるランキング上位のWebサイト,大手金融機関 のWebサイトと文献5)で提示している頻繁に狙わ れる会社,計 54 サイトを対象とした.これら実 在するサイトに手作業でアクセスし,既存方式の 各項目と追加項目について調査を行なった結果を 図 1~図 4,表 2に示す.評価結果から既存方式 はフィッシングサイト検出率 100%,正規サイト 検出率 9%に対し,提案方式はフィッシングサイ ト検出率を 100%に維持しつつ,正規サイト検出 率を50%とし,誤検出率を大幅に下げていること がわかる.

5

まとめ

本稿では,既存方式にドメイン登録情報,ログ イン判定とサーチエンジンキャッシュを新たな調 査項目として追加する方式を提案した.また,評 価を通して,新たに追加した3 つの調査項目がフ ィッシングサイト検出に有効であることを示した. 今後は,調査結果に基づき,既存システムへの追 加実装を行なっていく予定である. 図 1 ドメイン登録日-調査結果 0% 20% 40% 60% 80% 100% フィッシング 正規サイト 1年以下 3年以下 7年以下 10年以下 10年以上 ※ドメインがIP アドレスのサイトは除外 図 2 ドメイン有効期間-調査結果 0% 20% 40% 60% 80% 100% フィッシング 正規サイト ログイン可能 ログイン不可能 フォーム無し 図 3 ログイン判定-調査結果 0% 20% 40% 60% 80% 100% フィッシング 正規サイト 0件 1件~100件 101件以上 図 4 サーチエンジンキャッシュ-調査結果 表 2 既存方式と提案方式の比較 フィッシングサイト 正規サイト 既存方式 提案方式 既存方式 提案方式 40 以下 0% 0% 9% 50% 41~64 0% 0% 51% 44% 危 険 度 65 以上 100% 100% 40% 6%

参考文献

[1]中村元彦 他,“Proxy を利用した HTTP リクエ スト解析による AntiPhishing システムの提案”, 情報処理学会 CSEC 研究報告 Vol.2006 No.026. [2] Netcraft,http://news.netcraft.com/ [3] Wayback Machine,http://www.archive.org/ [4] Google, http://www.google.co.jp/ [5] RBL.jp フィッシング詐欺サイト情報, http://www.rbl.jp/phishing/ [6] ビデオリサーチ:”世帯内パソコンにおける インターネット 利用状況調査” http://www.videoi.co.jp/data/wsr/wsr060920.html

3-354

情報処理学会第69回全国大会

参照

関連したドキュメント

C =>/ 法において式 %3;( のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図 ;

会社法 22

ロボットは「心」を持つことができるのか 、 という問いに対する柴 しば 田 た 先生の考え方を

a b Patterned model of compressional property of thin dress fabrics, a at the maximum pressure Pmax=50 gf/cm2 standard, b at Pmax=10 gf/cm2.. Compression and recovery processes

る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity

攻撃者は安定して攻撃を成功させるためにメモリ空間 の固定領域に配置された ROPgadget コードを用いようとす る.2.4 節で示した ASLR が機能している場合は困難とな

納付日の指定を行った場合は、指定した日の前日までに預貯金口座の残

担い手に農地を集積するための土地利用調整に関する話し合いや農家の意