Web top-k TF-IDF Indri PRF 5 10 [7] Miyanishi TREC Microblog Track Indri (LM) 3 PRF (RM [8], EXRM [9], TBRM [4] [6]) PRF LM Miyanishi Tweet

(1)

DEIM Forum 2015 G4-5

マイクロブログを用いた Web 検索のパーソナライゼーション手法

岡本

里夏

†,††

_{GARKAVIJS,Viktors}

†,††

_大山

_敬三

††,†

†

総合研究大学院大学複合科学研究科情報学専攻博士課程

〒 101–8430 東京都千代田区一ツ橋 2–1–2

††

国立情報学研究所

〒 101–8430 東京都千代田区一ツ橋 2–1–2

E-mail:

†{

lica,gvb,oyama

}

@nii.ac.jp

あらましソーシャルメディアネットワークサービス (以下，SNS) は，ユーザの発信する情報量の多さから，様々な

場面での活用が検討されている．本研究は Web 検索の場面でマイクロブログから得られる情報を使ったパーソナライ

ゼーションの実現を目的としている．本報告では，マイクロブログサービスの一つである Twitter を用いた Web 検

索のパーソナライゼーションの手法として，Twitter のホーム画面に表示されるユーザ発言の集合（Twitter ではタイ

ムラインという．以下，TL）を文書とした擬似レレバンス・フィードバックによるクエリ拡張を提案する．今回著者

らが行った実験では，Web 検索のデータセットとして Text Retrieval Conference (TREC) Web Track 2013 Ad Hoc

Task のテストコレクションを用いた．２つの比較対照システムと提案手法によるシステムから得られた検索結果につ

いて，TREC のテストコレクションと Twitter ユーザの目線からの主観的評価の二つの側面から比較し，マイクロブ

ログのツイート素性を用いたパーソナライゼーション手法の有効性について検討する．

キーワード

擬似レレバンス・フィードバック, クエリ拡張, Twitter, パーソナライゼーション, 情報検索

1. はじめに

今日では，Webから自分に関連度の高い適切な文書を検索することは一般的である．PCやインターネット接続の普及と高速化，携帯電話・スマートフォンの普及，および商用のWeb 検索サービスの普及により，ユーザがWeb検索をする機会が格段に増え，生活に必要不可欠なものとなっている．自分自身の興味関心に適したWebページを探すことは，検索エンジンを使って行うことが一般的である．また，増え続けるWebページの中から自分に適したものを探し出すには，従来の検索方法ではしばしば失敗する．一般に，このような検索システムを使用する場合には，検索サービスのキーワードを入力する箇所（検索窓）から検索質問（クエリ）を入力してWebを検索する．検索の失敗を回避したり，検索を容易にしたりするための手段としては，例えばGoogleのWeb 検索サービスではオートコンプリート機能（注1）_{がある．オート} コンプリート機能は検索者自身の過去の検索履歴や，クエリに関するトレンドなどを考慮した上で検索窓の下にクエリとなる候補のキーワードのリストが提示される．しかし，この様な機能であっても，自分の探したい物事を表すキーワードが表示されない場合もある．

さらに，SNS (Social Network Services)を含む各種Web

サービスでは，テキスト・画像・音声・動画をはじめとして様々な情報の発信が多く行われている．こうしたユーザのやりとりの中には，友人の近況や動画サイトへのリンク，友人たちからの面白いWeb記事の推薦や，今まさに進行中のニュースの内（注1）：https://support.google.com/websearch/answer/106230?hl=ja 容など，自らの興味との関連性が高い文を目にすることも少なくない．この場合，その興味との関連性の高い文は検索のキーワードとなる語を含む可能性がある．そこで本研究では，検索ユーザの興味関心をフィードバックするものとして，SNSでやりとりされる情報に注目する．検索者の検索体験向上を目的として，デスクトップ，モバイル端末，ソーシャルネットワークサービス（SNS）等で活動する際のふるまいを記録し，それらを用いて，疑似レレバンス・フィードバック（PRF）を行うシステムを試作する．本報告では，マイクロブログサービスの一つであるTwitter のユーザTLをPRF用文書にしたWeb検索のパーソナライゼーション手法を提案する．また今回，Text REtrieval

Con-ference (TREC)の2013年のAd Hoc Taskで使用されたテス

トコレクションを利用し，提案手法を適用した実験を行った．実験に使用した３つのシステムの検索結果のうち，特徴的な検索結果が得られた9件のクエリについて，検索者の視点を反映させたレレバンス判定を上位5件の文書に対して行った．その結果について報告する．

2.

3. 提案手法

今回我々が提案する手法は，Web検索時にTwitterのツイートに対してPRFを用い，PRFの結果をクエリ拡張に用いる事によって，検索のパーソナライゼーションを行う為のものである．ここでは，TwitterのユーザTLを，ユーザ自身およびフォロー先ユーザが発信したユーザ自身の関心と関連度の高いと考えられる情報として仮定する．これにより，PRFによってユーザの関心が検索クエリにフィードバックされると仮定する [図1]．具体的には，検索エンジンはIndri 5.6を用い，Indriにある

(3)

従来のPRF

提案手法のPRF

疑似レレバンス・フィードバック(PRF)手法の比較

Twitter Tweets

❶元の検索クエリ

①元の検索クエリ

❺検索結果

②1回目の検索上位

k件の文書

④拡張したクエリ

❹拡張したクエリ

❷検索

❸クエリ拡張

③クエリ拡張

Webページ

SNS,マイクロブログ

⑤検索結果

図 1 擬似レレバンスフィードバック手法の比較 Lavrenkoのレレバンス・モデル[8]を用いたPRFによるクエリ拡張機能を使用する．今回PRFに使うツイート文書には， 4.2.1で後述する実験用に想定した疑似ユーザのツイートを用いる．提案手法においてPRFの文書数は，Kim等の実験[7]で良いとされたツイート文書集合の検索結果上位5文書とする．クエリ拡張語数は，同様に，上位10語を使用する．ただし，オリジナルのクエリとクエリ拡張語の重み付けは0.5:0.5とし，各クエリ拡張語の重み付けは語の頻度によって振り分けられるものとする．スムージングにはDirichlet smoothingを用いる(μ =2500; Indri のデフォルト値)．

4. 実

験

今回の実験は，検索結果の比較条件をそろえるため，クエリ

にIndriのサイトに例示されている基本的なStop Wordsを適

用し，5文書10語のPRFと比較する．実験のデザインおよび，疑似ユーザの立場からレレバンス判定する際には，SWT [1] [2] の考え方を一部援用している． 4. 1 目的 3 つの実験用システム (baseline, ClueWeb12-PRFB, Twitter-PRFB)を用意し，次の条件で比較する． • TwitterユーザTLを使ったPRFを行った場合 (Twitter-PRFB)と，行わない場合(baseline)を比較する． • Twitter ユーザ TL を使った PRF を行った場合と，ClueWeb12 データセットを使って PRFを行った場合 (ClueWeb12-PRFB)を比較する．また，検索結果について疑似ユーザの立場からのレレバンス判定を行い，TRECのレレバンス判定と違う物があるかどうかを調査する． 4. 2 データセットおよびテストコレクション 次に，実験で使用するデータセットおよびテストコレクションについて述べる． 4. 2. 1 Twitter 本実験では，検索するユーザはTwitterのTLを情報収集を目的に閲覧することを想定している．そのため，このユーザ

TLを取得するために，Twitter Inc. 提供のAPI (REST API,

Streaming API)を用いた．また，自分以外のユーザが送信した文のみの利用を目的としている．したがって，mention（「＠ユーザ名」の形で表される）と呼ばれるユーザ間の公開通信がTL内への混入を避けるため，使用したアカウントを非公開（Web上に疑似ユーザの発言が公開されない設定）とした．実験では，TwitterのユーザTLは，疑似レレバンス・フィー

(4)

ドバックをするための文書集合として用いた．以下に取得した

TLの属性について記す．

Twitter ID： twi twi

フォローしているTwitterアカウント数： 642人（2014年7月13日現在） ツイートの取得期間： 2014年5月26日から6月25日まで 取得した英語ツイートの件数： 9,100件（重複したツイートはTwitterユーザTLをマージする際に排除済み）

文書の形式： Twitter APIを使用して取得したJSON形

式のデータを，プログラムによりTRECTEXT形式(XML)

に変換して保存する．

4. 2. 2 ClueWeb12

ClueWeb12はLemur Projectが提供するWebページのコ

レクションある．ClueWeb12は2012年2月10日から同年5

月10日までに集められた英語のWebページ733,019,372 件を含む（注 2）_．

ClueWeb12は2013年のTREC Web Track, Ad

Hoc Task（注3）で用いられた．今回の実験はそのテストコレク

ションを用いて行うため，このデータセットを検索対象のデータセットとした．

4. 2. 3 TREC Web Track 2013 Ad Hoc Taskテストコレクション

実験に使うクエリとその正解データについては，TREC Web

Track 2013, Ad Hoc Taskのテストコレクションを使用した．

4. 3 実験用システム 次に実験用システムについて概要を説明する． 4. 3. 1 ベースライン・システム(baseline) Indri 5.6デフォルトの設定でIndriRunQueryという検索クエリを実行するプログラムを動かしたものをベースラインとした．主なデフォルト値は次の通りである． 取得件数： 1,000件 疑似レレバンス・フィードバック：無 クエリ言語： Indri Query Language

スムージング: Dirichlet smoothing (μ= 2500,μ はスムージングパラメータ．2500はIndri のデフォルト値) 結果フォーマット： TREC 4. 3. 2 実験システム１(ClueWeb12-PRFB) Indri 5.6のPRFを使ったシステムである．フィードバックする文書はClueWeb12である．このシステムはTwitterのユーザTLをフィードバックする文書として検索した場合の比較対

（注2）：Lemur Project, The ClueWeb12 Dataset, Dataset Details, Summary Statistics より引用．

http://lemurproject.org/clueweb12/specs.php (accessed 2015-01-13.) （注3）：TREC Web Track 2013

http://research.microsoft.com/enus/projects/trec-web-2013/ (accessed 2015-01-13.) 照の為のシステムである．PRFは提案手法と条件をそろえるために，検索結果上位５文書から10語を拡張クエリ語として設定した．それ以外はベースライン・システムと同様とした． 4. 3. 3 実験システム２(Twitter-PRFB) TwitterのユーザTLをフィードバックする文書として検索するシステムである．PRFを行うために，まずテストコレクションのクエリを用いてTwitterユーザTLから作成した検索用データセットを対象にクエリを用いて検索する．ツイートの検索結果上位５位までをPRFを行うための文書とし，実験システム１と同様に，５文書から10語選ぶように設定を行った．それ以外はベースライン・システムと同様とした． 4. 4 実験手順 提案手法に関する実験の手順は次の通りである[図2]． TL取得 TL保存開始 TREC 2013 Web AdHoc タスクQuery ユーザ TL ClueWeb 12 Twitter 終了 TL→TREC TEXT 検索結果1 PRF用文書取得 PRF用文書５件/Query PRF用パラメータファイル作成検索結果２ TREC評価ツール評価結果 TL検索用パラメータファイル作成 TL検索用パラメータファイル PRF用パラメータファイル Indri Indri TREC 2013 Web AdHoc タスクQuery TL(TREC TEXT) 凡例入力出力検索図 2 提案手法の処理手順（1）作成したツイート取得用のプログラムにより取得した

Twitterのツイート文書をJSON形式からTRECTEXT形式

に変換する．（2） IndriBuildIndexでインデックスを構築する．その際， Krovetz stemmerを適用し，ストップワードは適用しない．（3）インデックスされたツイート文書のデータセットをテストコレクションのクエリで検索する．（4）検索結果上位5位までの文書をPRF用の文書として Web検索用のパラメータ・ファイルに実験用に作成したプログラムにて自動的に登録する．（5）作成したクエリパラメータファイルを用いて ClueWeb12のデータセットを検索する．クエリに対しては

(5)

ストップワードを適用する．（6）出力された検索結果とクエリ拡張の結果ログを保存する．（7）検索結果はt検定を行う．（8）検索結果について，提案手法のERR-IA@10の値が良かったクエリ，悪かったクエリ，ベースラインと同じ値だったクエリ各3件合計9件について，疑似ユーザの観点からレレバンス判定を行う．

なお，ERR-IA (Intetnt Aware Expected Reciprocal Rank)

とは，TREC Web Trackの評価指標の一つであり，ERRはレ

レバンスが高い文書が上位にあった場合に検索者が閲覧を中止してしまう可能性を考慮したモデルである[3]．IA はクエリの複数のファセットについてレレバンス判定を考慮するため，一つのクエリについてファセット毎に複数のレレバンス判定が正解データで与えられる．クエリのファセットが１つの場合， ERRと同等の計算になる[5]．ERR-IA＠10は上位10件を評価対象としている．ここで，rを閲覧を中止する位置，Rr をr位の文書のレレバンス(Rr=R(g))，gをレレバンスのグレーディング，Riを i位の文書に満足する確率とする．Ri と，R(g)が， R(g) := 2g− 1 2gmax, g∈ {0, ..., gmax} (1) Ri:=R(gi) (2) で表されるとき，ERRは次のように定義される[3]． ERR := n ∑ r=1 1 r r_∏−1 i=1 (1− Ri)Rr (3)

5. 実験結果

ここでは，TwitterのTL閲覧時のツイートをPRF用の文書として行った実験結果を示す．なお，統計解析にはR (version 3.1.2)（注 4）_{を使用した．} 5. 1 TREC評価ツールによる検索結果の評価

TREC Web Track Ad Hoc Task の主な評価指標である

ERR-IA@10の値をクエリ毎システム毎の値をグラフにしたものを示す[図3]（注5）． PRF用に検索したツイート文書で5文書検索できなかったクエリ番号は，201 (0文書)，241 (1文書), 242 (4文書), 249 (1文書)の計４件であった．今回の実験では，３つのシステムについてt検定（95%信頼区間）を行った．２つのシステム毎に対応のあるデータ（各クエリによる検索結果から算出した評価指標）を３つのシステムについてのすべての組み合わせで比較するため，ボンフェローニ補正を適用した(p < 0.0167)．t 検定の帰無仮説，対立仮説は， 帰無仮説「システム毎の評価指標の平均の差は０である」 対立仮説「システム毎の評価指標の平均の差は０ではない」 （注4）：http://www.r-project.org/index.html(accessed2015-01-13.) （注5）：赤は baseline, 緑は ClueWeb12-PRFB, 青は Twitter-PRFB の結

果を表す．

である．

この結果についてt検定を行った結果を以下に示す[図4][表

1]．

ClueWeb12−baseline ClueWeb12−PRFB twitter_PRFB

0.0 0.2 0.4 0.6 0.8 1.0

Comparing of performance index: ERR−IA@10

ERR−IA@10 図 4 ERR-IA@10 の各システムの比較 [表1]からわかるように，提案手法のERR-IA@10の評価値の平均値について，有意差は認められなかった．しかしながら，個々のクエリについての評価値を見ると，クエリによってはbaselineを大きく上回り，現段階で提案手法は，クエリによるばらつきが大きいシステムであると言える． 5. 2 検索した文書のレレバンス判定 今回，9件のクエリについて，疑似ユーザの視点からレレバンス判定を行った．レレバンス判定はERR–IA@10の値を提案手法とベースラインの間で比較し，3パタンに分けたクエリについて行った[表2]．ここで，PRFの文書数が0だったものはシステム的にClueWeb12-PRFBと同じ動作になるので判定の候補からは除外した．表 2 擬似ユーザ視点からレレバンス判定を行ったクエリ ERR-IA@10 の比較クエリ番号 Twitter-PRFB > baseline 214, 242, 248 Twitter-PRFB < baseline 205, 221, 240 Twitter-PRFB = baseline 216, 232, 233 今回レレバンス判定を行う際には，それぞれのクエリで得られた検索結果の上位５件について行った．ただし，上位5件の中にテストコレクションの正解データの中に含まれない文書名がある場合には，その文書は判定から除外し，その次に出現するテストコレクションの正解データ内にある文書について判定を行う事とした． TwitterユーザTLの収集およびレレバンス判定に使用する Twitterの疑似ユーザのプロファイルを次に示す． 年齢：４０代後半 性別：女性 使用言語：日本語・英語 職業：防衛産業関係のシステムエンジニア

(6)

0.0

0.2

0.4

0.6

0.8

1.0 Scatter Diagram of ERR

−IA@10

Query Numbers

ERR

−

IA@10

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

1.0

230

240

250

201 ₂₁₀

₂₂₀

提案手法(Twitter-PRFB) ClueWeb12-PRFB baseline 図 3 ERR-IA@10 での比較表 1 ERR-IA@10 の t 検定結果実験システム t 差の平均 p 値 有意差 (p < 0.0167) ClueWeb12-PRFB vs. baseline -2.7731 -0.0761567 0.0078 有 Twitter-PRFB vs. baseline -2.0457 -0.0631799 0.0461 無 Twitter-PRFB vs. ClueWeb12-PRFB 0.3612 0.0129767 0.7195 無 主な関心：健康・食事療法・科学一般・IT技術動向・一般ニュース フォローしているユーザ：新聞・通信社・雑誌・テレビ局 などのメディア関係，アメリカのHealth Care関係の研究機関，官公庁，軍関係，IT企業，プログラマ，研究者，記者，NASA関係，科学技術関係のニュースブログサイト，学会等レレバンス判定の際にテストコレクションの判定と違う判定があった件数を表に示す[表3]．

6. 考

察

6. 1 検索結果について 今回，条件をそろえてERR-IA@10のみでt検定を行ったが，平均値の比較では有意差は見られなかった．しかし，[図3]からわかるように，ベースラインとIndriのPRFの値がそれほどではなくても，提案手法が突出して良い場合がある．今回レレバンス判定を行った提案手法で良い値が出る3件の

クエリは，TREC 2013 Web Trackにおいて，いずれもTREC

のベースラインを基準にBottom 25 topicsにランクされたクエリであった[5]．例えばクエリ番号214（“capital gains tax

rate”）は，TwitterのユーザTL文書にこのクエリに有効な語を含んでいたためと考えられる．検索対象の文書から有効なクエリ拡張語を展開できない場合に，提案した手法により改善できる可能性を示している．その一方で，提案手法の値が悪かった3件のクエリについては，いずれもTop 25 topicsにランクされたクエリであり，先程とは逆の結果となった．例えばクエリ番号240 (“presidential middle names”)は，実験結果でリストされた文書を見てみると，本実験のbaselineとIndriによるPRFはほぼ同じ文書を検索結果としてリストしている．つまり，文書番号が違っていても文書の内容はほとんど同じであった．これの原因はレレバンス判定が3(Key)と判定されたページのコピーサイトの文書が上位にリストされていたからであると考える．一方，提案手法による検索結果では（テストコレクションの正解データにない）レレバンス判定されていない文書が上位に，baseline で上位の文書が下位にランクされていた．上位５件中３件がレレバンス判定されておらず，他２件の文書はbaselineにも ClueWeb12-PRFBにも上位20件以内にリストされていない 2(HRel)と3(Key)の文書であった．うち1件は疑似ユーザ視点によるレレバンス判定で2(Key)から0(Non)に評価が変わっている．baselineとClueWeb12-PRFB の検索結果上位5件は全て3(Key)の高いレレバンス判定であったため，提案手法

(7)

表 3 レレバンス判定が変更になった件数

Twitter-PRFB > baseline Twitter-PRFB < baseline Twitter-PRFB = baseline

クエリ番号 214 242 248 205 221 240 216 232 233 baseline 0 1(良) 0 0 0 0 0 0 0 ClueWeb12-PRFB 0 1(良) 0 0 0 0 0 0 0 Twitter-PRFB 0 1(良) 0 0 0 1(悪) 0 0 0 は相対的に値が悪くなった．このように，提案手法のPRFによるクエリ拡張では，ツイート文書の数が1万件に満たない数であっても検索者の意図に近い語がユーザTL内にあれば非常に効果的にクエリ拡張が行われる．その一方で，検索者の検索意図に沿う情報がツイート内になければ，検索者の意図に近い形でのクエリ拡張がなされず，検索結果に悪影響を及ぼす．これを回避するには，(1)PRFに使用するTwitterユーザTLのサイズを大きくする(2)PRF用にツイート文書をオリジナルのクエリで検索する際に，検索意図と合ったツイートを精度よく抽出する(3)検索者の意図がわかる行動をログから抽出しそれを利用してPRFに使う文書を決定する，以上３点が考えられる． 6. 2 疑似ユーザ視点によるレレバンス判定

TREC Web Trackでは6段階でレレバンス判定を行ってい

る．そのうちレレバンス・グレード-2(Junk)はTRECの評価ツールであるndevalでは扱わないので，-2は0(Non)とみ

なされる[5]．すなわち，

0(Non; non relevant)，

1(Rel; relevant)，

2(HRel; highly relevant)，

3(Key; Key page or site)，

4(Nav; navigational page or site)

の5段階で評価される．今回レレバンス判定した中で，疑似ユーザ視点により判定を変えた文書は2箇所あった．１件は0 (Non) から1(Rel)への変更であり，もう１件は2(HRel)から0(Non)への変更であった．検索結果上位5件×9個のクエリで，のべ45件の文書を確認した結果，約4％の文書についてレレバンス判定の変更が生じた．これは，上位5件に検索結果として得られたものを擬似ユーザの視点からレレバンス判定した場合でも概ねTRECのレレバンス判定と合致した，といえる．しかし，本報告では対象外とした上位20位までの検索結果には，TRECの正解データに含まれない文書もあった．TRECの正解データになかった文書は ERR-IAの計算には含まれないので，それが評価値に悪影響を及ぼした． baselineと違ったものが上位にランクされるということは，検索エンジンは同じでもフィードバックする文書が検索対象と違うことで得られた結果である．提案手法では，擬似ユーザの Twitter上のTLにはユーザの興味関心が反映されたと仮定してクエリ拡張用の語を展開することでパーソナライズドな検索結果を得る．今回はレレバンス判定されていない文書は疑似ユーザ視点によるレレバンス判定を行っていない．これらの検索結果についてもレレバンス判定を行い，興味関心が反映されたページが取得できているかどうか確認する必要がある．実験では，Twitterのツイート文書によるPRFを使った検索において，結果をできるだけ客観的に評価するために，TREC Web Trackのテストコレクションにあるクエリと興味が重なるような疑似ユーザのペルソナを作成した．このペルソナに従いフォローする事で疑似ユーザの意図するTLを表現しようとした．そのためフォローするユーザはニュースサイトや企業や国の機関の公式ユーザを多くフォローした．これについては，個人的につながりのあるユーザはフォローしていないため，実際に存在するユーザのフォロー内容とはやや異なる印象になった．しかしながら，擬似的なユーザを模して作ったTLではあるが，一部のクエリに対しては提案手法が有効に働く事がわかった．今後の課題として，擬似ユーザとツイートのクラスタリング結果とクエリとの比較，疑似ユーザでツイート文書を増やした時に検索が改善されるかどうか，あるいはTwitterのパブリックTLを使ったときとの比較，および実際のユーザのTLで提案手法を実行した場合の検索結果のレレバンス判定の比較調査，ユーザ視点からレレバンス判定を上位20件について行い評価値計算の実行することが挙げられる．

7. おわりに

本報告では，Twitterのツイート文書をPRFによるクエリ拡張を用いて行う検索のパーソナライゼーション手法を提案した．そして，提案手法についてテストコレクションを使った実験を行い，その結果に関する考察を述べた．テストコレクションの評価ツールによる平均値の比較では有意差は見られなかったが，個々のクエリについて検索結果を見た場合，TREC 2013

Web Track Ad Hoc Taskの下位25件に含まれるクエリにつ

いて，評価値を大きく上回るものがあり，検索意図通りにクエリが拡張された場合の有効性が示された．

今後は，検索のパーソナライズ手法の全般的な改善と，実際のユーザについて提案手法の実験を行いたい．

文献

[1] Borlund, P.: Experimental components for the evalua-tion of interactive informaevalua-tion retrieval systems, Journal

of Documentation, Vol. 56, No. 1, pp.71–90 (online), DOI

10.1108/EUM0000000007110 (2000).

[2] Borlund, P. and Ingwersen, P.: The development of a method for the evaluation of interactive information re-trieval systems, Journal of Documentation, Vol. 53, No. 3, pp.225–250 (online), DOI 10.1108/EUM0000000007198 (1997).

[3] Chapelle, O., Metlzer, D., Zhang, Y. and Grinspan, P.: Ex-pected reciprocal rank for graded relevance, Proceeding of

(8)

management - CIKM ’09, New York, New York, USA, ACM

Press, p.621 (online), DOI 10.1145/1645953.1646033 (2009). [4] Choi, J. and Croft, W. B.: Temporal models for microblogs,

Proceedings of the 21st ACM international conference on Information and knowledge management - CIKM ’12, New

York, New York, USA, ACM Press, p.2491 (online), DOI 10.1145/2396761.2398674 (2012).

[5] Collins-Thompson, K., Paul Bennett, Diaz, F., Clarke, C. L. A. and Voorhees, E. M.: TREC 2013 Web Track Overview, TREC 2013, (online), http://trec.nist.gov/ pubs/trec22/papers/WEB.OVERVIEW.pdf (2013).

[6] Keikha, M., Gerani, S. and Crestani, F.: Time-based relevance models, Proceedings of the 34th international

ACM SIGIR conference on Research and development in Information - SIGIR ’11, New York, New York, USA,

ACM Press, p.1087 (online), DOI 10.1145/2009916.2010062 (2011).

[7] Kim, Y., Yeniterzi, R. and Callan, J.: Overcoming Vocab-ulary Limitations in Twitter Microblogs (2012).

[8] Lavrenko, V. and Croft, W. B.: Relevance based lan-guage models, Proceedings of the 24th annual

interna-tional ACM SIGIR conference on Research and develop-ment in information retrieval - SIGIR ’01, New York,

New York, USA, ACM Press, pp.120–127 (online), DOI 10.1145/383952.383972 (2001).

[9] Li, X. and Croft, W. B.: Time-based language models,

Proceedings of the twelfth international conference on In-formation and knowledge management - CIKM ’03, New

York, New York, USA, ACM Press, p.469 (online), DOI 10.1145/956863.956951 (2003).

[10] Li, Y. and Hu, D.: Interactive retrieval using simu-lated versus real work task situations: Diﬀerences in sub-facets of tasks and interaction performance,

Proceed-ings of the American Society for Information Science and Technology, Vol. 50, No. 1, pp.1–10 (online), DOI

10.1002/meet.14505001092 (2013).

[11] Metzler, D. and Cai, C.: USC/ISI at TREC 2011: Mi-croblog Track, In Proceedings of TREC 2011, (online), http://trec.nist.gov/pubs/trec20/papers/isi.microblog. update.pdf (2011).

[12] Miyanishi, T., Seki, K. and Uehara, K.: Improving pseudo-relevance feedback via tweet selection, Proceedings of the

22nd ACM international conference on Conference on in-formation & knowledge management - CIKM ’13, New

York, New York, USA, ACM Press, pp.439–448 (online), DOI 10.1145/2505515.2505701 (2013).

[13] Teevan, J., Ramage, D. and Morris, M. R.: #Twit-terSearch: a comparison of microblog search and web search, Proceedings of the fourth ACM international

con-ference on Web search and data mining - WSDM ’11, New

York, New York, USA, ACM Press, p. 35 (online), DOI 10.1145/1935826.1935842 (2011).

Web top-k TF-IDF Indri PRF 5 10 [7] Miyanishi TREC Microblog Track Indri (LM) 3 PRF (RM [8], EXRM [9], TBRM [4] [6]) PRF LM Miyanishi Tweet

DEIM Forum 2015 G4-5

マイクロブログを用いた Web 検索のパーソナライゼーション手法

岡本

里夏

GARKAVIJS,Viktors

大山

敬三

†

総合研究大学院大学複合科学研究科情報学専攻博士課程

〒 101–8430 東京都千代田区一ツ橋 2–1–2

††

国立情報学研究所

〒 101–8430 東京都千代田区一ツ橋 2–1–2

E-mail:

†{

lica,gvb,oyama

}

@nii.ac.jp

あらまし ソーシャルメディアネットワークサービス (以下，SNS) は，ユーザの発信する情報量の多さから，様々な

場面での活用が検討されている．本研究は Web 検索の場面でマイクロブログから得られる情報を使ったパーソナライ

ゼーションの実現を目的としている．本報告では，マイクロブログサービスの一つである Twitter を用いた Web 検

索のパーソナライゼーションの手法として，Twitter のホーム画面に表示されるユーザ発言の集合（Twitter ではタイ

ムラインという．以下，TL）を文書とした擬似レレバンス・フィードバックによるクエリ拡張を提案する．今回著者

らが行った実験では，Web 検索のデータセットとして Text Retrieval Conference (TREC) Web Track 2013 Ad Hoc

Task のテストコレクションを用いた．２つの比較対照システムと提案手法によるシステムから得られた検索結果につ

いて，TREC のテストコレクションと Twitter ユーザの目線からの主観的評価の二つの側面から比較し，マイクロブ

ログのツイート素性を用いたパーソナライゼーション手法の有効性について検討する．

キーワード

擬似レレバンス・フィードバック, クエリ拡張, Twitter, パーソナライゼーション, 情報検索

1.

は じ め に

2.

関 連 研 究

3.

提 案 手 法

従来のPRF

提案手法のPRF

疑似レレバンス・フィードバック(PRF)手法の比較

❶元の検索クエリ

①元の検索クエリ

❺検索結果

②1回目の検索上位

k件の文書

④拡張したクエリ

❹拡張したクエリ

❷検索

❸クエリ拡張

③クエリ拡張

Webページ

SNS,マイクロブログ

⑤検索結果

4.

実

験

5.

実 験 結 果

0.0

0.2

0.4

0.6

0.8

1.0

Scatter Diagram of ERR

−IA@10

Query Numbers

ERR

−

IA@10

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

_{GARKAVIJS,Viktors}

_大山

_敬三

あらましソーシャルメディアネットワークサービス (以下，SNS) は，ユーザの発信する情報量の多さから，様々な

はじめに

関連研究

提案手法

実験結果

₂₁₀

₂₂₀

おわりに