• 検索結果がありません。

電子情報通信学会ワードテンプレート (タイトル)

N/A
N/A
Protected

Academic year: 2021

シェア "電子情報通信学会ワードテンプレート (タイトル)"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2015 D4-6

カスタマイズ可能な信頼度基準に基づく実用的 Twitter 検索

藤 一鶴

疋田輝雄

†‡ 明治大学基礎理工学専攻 214-8571 神奈川県川崎市多摩区東三田 1-1-1

E-mail: †fuji@cs.meiji.ac.jp ‡hikita@cs.meiji.ac.jp

あらまし 現在のインターネット上では,大量の情報のためにユーザが有用な情報を思うように取得しにくい状況があり, この問題は特にリアルタイムメディアである Twitter において起こっている.この問題に対する一つの方策として信 頼度(credibility)を用いるものがある.C. Castillo ら(WWW2011)は,ツイートおよびその発信者に対する信頼度 について分析し,どのような要素が信頼度に貢献するかを示している.我々はこの手法に基づいて,あるトピック に対する Twitter 上の検索結果に対し,信頼度を構成する要素間の順位と重みを,ユーザの興味に応じて変更可能に して,「信頼値」を求めた上で,その値によってソートされた検索結果をユーザにリアルタイムに提供するという システムを構成した.この方法によって,リツイート数に依存しないツイートを抽出できる.また,発信者を一部 に片寄らずに幅広く抽出可能である. キーワード Twitter,信頼度,動的信頼度,決定木,情報検索

1. は じ め に

Facebook, YouTube な ど の デ ジ タ ル メ デ ィ ア が 発 達 し た こ と に よ り , ユ ー ザ は 容 易 に 情 報 発 信 を で き る 時 代 に な っ た . し か し 安 易 な 情 報 発 信 は 情 報 の 質 を 落 と し , イ ン タ ー ネ ッ ト 上 で は 利 用 価 値 の 低 い 情 報 が 大 量 に 発 生 し た . こ の よ う な 現 象 は 情 報 洪 水 と 呼 ば れ て い る . こ れ は 最 近 発 達 し た リ ア ル タ イ ム メ デ ィ ア( Twitter)上 で も 現 れ て い る .Twitter は ,娯 楽 的 な メ デ ィ ア と い う 位 置 と 同 時 に , 情 報 伝 達 の 広 範 囲 性 と 即 時 性 を 活 か し た , 人 々 の 情 報 交 換 の 役 を 担 う . 本 研 究 で は Twitter 上 に 利 用 価 値 の 高 い 情 報 が 存 在 す る と 認 識 し , 埋 も れ て い る 有 用 な 情 報 を よ り 効 率 よ く 情 報 収 集 で き る ア プ リ ケ ー シ ョ ン の 開 発 を 試 み る . そ の 手 段 と し て , ツ イ ー ト ( 発 言 ) の 発 信 者 や 個 々 の ツ イ ー ト な ど に 対 す る 信 頼 度 ( credibility) を 用 い る . C. Castillo ら は , ツ イ ー ト お よ び そ の 発 信 者 に 対 す る 信 頼 度 に つ い て 分 析 し , ど の よ う な 要 素 が 信 頼 度 に 貢 献 す る か を 示 し て い る [2].我 々 は こ の 手 法 に 基 づ い て , あ る ト ピ ッ ク に 対 す る Twitter 上 の 検 索 結 果 に 対 し , 信 頼 度 を 構 成 す る 要 素 間 の 順 位 と 重 み を ,ユ ー ザ の 興 味 に 応 じ て 変 更 可 能 に し て , 「 信 頼 値 」 を 求 め た 上 で , そ の 値 に よ っ て ソ ー ト さ れ た 検 索 結 果 を ユ ー ザ に リ ア ル タ イ ム に 提 供 す る と い う シ ス テ ム を 構 成 し た . こ の 方 法 に よ っ て , た と え ば リ ツ イ ー ト 数 に 依 存 し な い ツ イ ー ト を 抽 出 で き る . ま た , 発 信 者 を 一 部 に 片 寄 ら ず に 幅 広 く 抽 出 可 能 で あ る

2. 関 連 研 究

Twitter の 情 報 抽 出 に 着 目 し た 研 究 は 数 多 い .大 量 の 発 言 デ ー タ を 収 集 し , 工 夫 さ れ た ア ル ゴ リ ズ ム で 情 報 抽 出 を 行 う も の で あ る .Castillo ら は ツ イ ー ト の 信 頼 度 を 機 械 学 習 に よ る 分 類 器 で 評 価 し た [2].一 般 に ツ イ ー ト を ま ず , ニ ュ ー ス 的 価 値 の も の と , 雑 談 的 な も の に 分 け る . さ ら に , ニ ュ ー ス 的 価 値 の あ る 発 言 に 対 し て , 信 頼 で き る か , 否 か , あ る い は 確 信 が 持 て な い の か の , 3 種 類 に 分 け る . い く つ か の 振 り 分 け の た め の ア ル ゴ リ ズ ム を 試 し た 結 果 と し て , 機 械 学 習 さ れ た 決 定 木 に よ る 振 り 分 け が も っ と も 良 い 結 果 が 得 ら れ た と 結 論 づ け た . 発 言 を 取 得 す る 際 に 付 随 さ れ る 様 々 な フ ィ ー チ ャ ( 本 論 文 で は パ ラ メ ー タ と 呼 ぶ ) を 決 定 木 の 評 価 の 基 準 に す る . 例 え ば そ の 発 言 の リ ツ イ ー ト の( ど れ だ け 拡 散 さ れ た か の ) 数 が あ る 基 準 値 以 上 な ら ば 有 用 な 情 報 で あ る と 判 断 す る な ど で あ る . 大 量 の デ ー タ の 分 析 の 結 果 , ニ ュ ー ス 的 価 値 の あ る 発 言 は URL を 含 ん で お り ,か つ 深 く 伝 達 ( RT) さ れ て い る 傾 向 が あ る と 述 べ て い る . ま た そ の 中 で も 信 頼 で き る と 判 断 さ れ た 発 言 は , 過 去 か ら 沢 山 発 言 が あ っ た ユ ー ザ に よ っ て 伝 達 さ れ , そ の 発 言 の 起 源 は 少 人 数 の ネ ッ ト ワ ー ク 内 か ら の も の で , 多 く の 人 に よ っ て 引 用 さ れ て い る , と い う 特 徴 が あ る . そ の 他 O’Donovan ら は ト ピ ッ ク ,信 頼 度 ,リ ツ イ ー ト の 深 さ , 会 話 と い う 4 つ の 観 点 か ら 発 言 の 有 用 さ を 測 っ た [8]. Sikdar ら は 一 度 人 為 的 な 信 頼 度 判 断 を 行 っ た 後 , 有 用 な 発 言 に 対 し パ ラ メ ー タ を 組 み 合 わ せ る と 高 い 精 度 の 信 頼 度 が 得 ら れ る と 結 論 づ け た [9].Aditi Gupta ら は パ ラ メ ー タ に よ る 機 械 学 習 と 再 検 索 を 用 い て 信 頼 度 ラ ン ク 付 け を 行 っ た . 信 頼 度 は 投 稿 し た ユ ー ザ の 情 報 だ け で な く , 発 言 の 質 も 重

(2)

要 で あ る と い う 結 論 が 得 ら れ た [3]. Kang ら は フ ォ ロ ー と 発 言 数 に 着 目 し た ソ ー シ ャ ル モ デ ル , 発 言 の パ ラ メ ー タ に 着 目 し た コ ン テ ン ツ に 基 づ く モ デ ル と こ の 二 つ を 組 み 合 わ せ た ハ イ ブ リ ッ ド モ デ ル を 提 案 し た , 評 価 結 果 で は パ ラ メ ー タ に 基 づ く コ ン テ ン ツ モ デ ル か ら 良 い 結 果 を 得 ら れ た [6]. こ の よ う に こ れ ま で の 多 く の 研 究 で は , そ の 発 言 ご と の パ ラ メ ー タ に 着 目 し た 計 算 が 主 流 で あ っ た . そ う し た も の を 我 々 は 静 的 パ ラ メ ー タ と 呼 ぶ .一 方 , 動 的 な ツ イ ー ト の 評 価 方 法 と し て , Rasha M.BinSultan ら が Twitter 上 の ア ラ ブ 語 の 信 頼 度 を 決 定 す る 際 に ,ユ ー ザ の 評 価 を 行 う 外 部 API を 用 い て い る [1].そ の API は ユ ー ザ の 過 去 の 発 言 の 質 を 調 査 し , 評 価 を 返 す も の で あ る ( 現 在 そ の API は 存 在 し な い よ う で あ る ) . 他 に も 手 法 が い く つ か あ る . Manish Gupta ら は ユ ー ザ , ツ イ ー ト , イ ベ ン ト を リ ン ク モ デ ル 化 し , PageRank ア ル ゴ リ ズ ム を 参 考 に し て イ ベ ン ト の 信 頼 度 を 計 っ た . そ れ に 加 え , 値 を 更 新 す る 最 適 化 を 行 う こ と で 高 い 精 度 を 得 ら れ た [4].山 口 ら は リ ツ イ ー ト と フ ォ ロ ー し て い る ユ ー ザ の リ ン ク 構 造 を 考 慮 し た ユ ー ザ ラ ン キ ン グ 手 法 を 提 案 し た [10]. ト ピ ッ ク モ デ ル に 着 目 し た Ikegami ら は 機 械 学 習 ア ル ゴ リ ズ ム LDA( Latent Dirichlet Allocation)を 用 い て ト ピ ッ ク モ デ ル を 生 成 し , そ し て そ の ト ピ ッ ク に 対 す る 意 見 が ポ ジ テ ィ ブ か ど う か で 発 言 を 分 別 し た [5].北 口 ら は 同 じ ト ピ ッ ク の 発 言 を グ ル ー プ 化 し , 必 要 に 応 じ て 再 検 索 も 可 能 な 災 害 情 報 検 索 シ ス テ ム を 提 案 し た [7].

3. カ ス タ マ イ ズ 可 能 な Twitter 検 索 シ ス テ ム

本 論 文 で は 「 発 言 や ユ ー ザ が 持 つ 情 報 の 信 頼 度 」 を 数 値 化 し , そ の 値 を 「 信 頼 値 」 と 定 義 し て い る . 発 言 の 影 響 力( RT)な ど の パ ラ メ ー タ に よ っ て 計 算 さ れ た 信 頼 値 を 付 加 情 報 と し て 提 示 す る こ と で , ユ ー ザ が Twitter 上 で 効 率 よ く 情 報 収 集 で き る よ う に 図 る . 図 3.1 は 本 ア プ リ ケ ー シ ョ ン の 画 面 レ イ ア ウ ト を 示 す . そ れ ぞ れ の パ ー ツ に つ い て 説 明 す る . レ イ ア ウ ト の 上 部 は 入 力 フ ォ ー ム( 図 3.2)で あ る . ユ ー ザ は 検 索 し た い ク エ リ を 入 力 し ,Sort Mode の 選 択 で 発 言 か あ る い は 発 言 者 か ど ち ら の 信 頼 度 に よ る ソ ー ト か を 決 め る .選 ん だ ソ ー ト モ ー ド に 合 わ せ て , 図 3.3 の 発 言 者 オ プ シ ョ ン で 発 言 者 に 関 す る 信 頼 値 の 重 み を , あ る い は 図 3.4 の 発 言 オ プ シ ョ ン に よ っ て 発 言 に 関 す る 信 頼 度 の 重 み を 決 め る こ と が で き る . 最 後 に search ボ タ ン を 押 す と 送 信 さ れ ,検 索 結 果( 図 3.5)が 提 示 さ れ る .特 に ,ク エ リ 入 力 が な い 初 期 状 態 で は ,現 在 Twitter 上 に あ る ト レ ン ド( 流 行 っ て い る キ ー ワ ー ド ) の 検 索 結 果 が 提 示 さ れ る 仕 様 に な っ て い る . 図 3.1 画 面 レ イ ア ウ ト 図 3.2 入 力 フ ォ ー ム 図 3.3 発 言 者 オ プ シ ョ ン 図 3.4 発 言 オ プ シ ョ ン 図 3.5 ツ イ ー ト 検 索 結 果

(3)

出 力 結 果 の 見 方 と し て , 左 上 に 発 言 者 の ア イ コ ン が あ り , そ の 隣 に 発 言 者 の 名 前 が あ る . そ の 右 で は 検 索 結 果 ラ ン ク と 信 頼 値 ポ イ ン ト , そ の ポ イ ン ト 理 由 が 提 示 さ れ て い る . ラ ン ク の 付 け 方 は 信 頼 値 ( 発 言 者 か 発 言 ) の 高 い 順 ソ ー ト と い う 仕 様 に な っ て い る ( 詳 し く は 4 節 ) . そ の 下 の 行 に 平 均 値 が 出 力 さ れ て お り , そ の ユ ー ザ の 過 去 の 平 均 的 な 値 を 知 る こ と が 可 能 で , 情 報 判 断 の 補 助 に な っ て い る .ア ク テ ィ ブ 率 ,平 均 発 言 値 , 平 均 ユ ー ザ 値 で あ る . こ れ ら は 個 々 の ツ イ ー ト に 対 す る 動 的 な 値 で , 4 節 に 詳 し く 説 明 す る . そ し て そ の 下 部 は ユ ー ザ の 発 言 ( ツ イ ー ト ) の 内 容 で あ る .

4. ツ イ ー ト の 選 択 ア ル ゴ リ ズ ム

こ こ で 採 用 し た ツ イ ー ト 選 択 シ ス テ ム の ア ル ゴ リ ズ ム は ,普 段 の Twitter 検 索 の 使 用 経 験 か ら 工 夫 し た も の で あ る . た と え ば 信 頼 度 を 構 成 す る 要 素 ( パ ラ メ ー タ )を 選 ぶ の に あ た っ て ,Castillo[2]の う ち の 主 要 と 判 断 し た い く つ か を 採 用 し て い る . 4.1 プ ロ グ ラ ム の 流 れ こ こ で は 主 な 流 れ を 示 し( 図 4.1),具 体 的 な 仕 組 み は 後 述 す る . ユ ー ザ は ま ず 検 索 ク エ リ を 入 力 し , そ の 際 , 信 頼 度 の 重 み の パ ラ メ ー タ を 決 め る こ と が で き る . ク エ リ に 対 し て , ア プ リ ケ ー シ ョ ン は Twitter の API を 使 っ て デ ー タ を 取 得 す る .取 得 し た 一 件 ず つ の デ ー タ に 対 し て 信 頼 値 を 求 め る . さ ら に Twitter の API を 用 い て ,発 言 ユ ー ザ 一 人 ひ と り に 対 し 少 数 の 発 言 を 取 得 し ,そ れ ら の 信 頼 値 を 割 り 出 し , 平 均 値 を 取 る . 最 後 に 得 た デ ー タ を 整 形 し , Twitter 側 が 指 定 す る 表 示 ガ イ ド ラ イ ン に 合 わ せ た 出 力 を 行 う . 図 4.1 処 理 の 流 れ 4 .2 信 頼 度 の パ ラ メ ー タ Twitter の API を 用 い て ユ ー ザ 発 言 を 取 得 す る 際 , 発 言 の テ キ ス ト 情 報 の み な ら ず , そ れ に つ い て 様 々 な 付 随 情 報 を 得 る こ と が 可 能 で あ る . た と え ば 発 言 し た ユ ー ザ を フ ォ ロ ー ( そ の ユ ー ザ の 発 言 を 見 て い る ) し て い る ア カ ウ ン ト の 数 や , 発 言 が ど れ だ け 拡 散 し た か ( リ ツ イ ー ト 数 ) な ど が 存 在 す る , 我 々 は こ の よ う な 付 随 情 報 の 項 目 を パ ラ メ ー タ と 呼 び , 信 頼 値 計 算 す る 際 に 使 用 す る . 信 頼 値 は 2 種 類 に 分 け ら れ る . 一 つ は 発 言 に つ い て , 文 章 そ の も の の 信 頼 度 で あ る . そ れ は そ の 発 言 が ど れ ぐ ら い 拡 散 さ れ て い る の か , ま た テ キ ス ト と し て リ ン ク や タ グ な ど の 情 報 が 含 ま れ て い る か で あ る . 発 言 の 信 頼 値 の 計 算 は 以 下 の 5 種 の パ ラ メ ー タ を 採 用 す る . ・ リ ツ イ ー ト : 発 言 が ど れ だ け 拡 散 さ れ て い る か を 表 す 数 . 影 響 度 を 示 す の で , そ の 数 そ の も の を 信 頼 値 計 算 す る た め の 値 と し て 採 用 す る . ・ お 気 に 入 り : Fav 数 . 発 言 が ど れ だ け お 気 に 入 り に 追 加 さ れ て い る か を 表 す 数 値 , リ ツ イ ー ト 数 よ り は 信 頼 に 欠 け る が 違 っ た 角 度 を 示 す 数 値 な の で 採 用 す る . ・リ ン ク を 含 む: 発 言 に 入 っ て い る リ ン ク の 数 , パ ラ メ ー タ と し て 直 接 提 供 さ れ て い る も の で は な く , テ キ ス ト 解 析 で 得 ら れ る 情 報 で , テ キ ス ト の 充 実 度 を 計 る た め に 採 用 し て い る . ・タ グ を 含 む: Twitter に は ハ ッ シ ュ タ グ と い う 独 自 の タ グ 付 け 方 式 が あ り ( # を 使 用 す る ) , タ グ 付 け は ユ ー ザ が 意 識 し て 行 う も の な の で , そ れ も テ キ ス ト の 充 実 度 に 影 響 す る . ・リ プ ラ イ を 含 む: Twitter 上 で は ユ ー ザ の 発 言 に 返 信 す る こ と を リ プ ラ イ と 呼 ぶ( @ を 使 用 す る ). も う 一 方 は 発 言 者 自 身 が ど れ だ け 信 頼 に 値 す る か の 信 頼 値 で あ る . 発 言 者 の 影 響 力 や プ ロ フ ィ ー ル な ど の メ タ 情 報 を 用 い て 決 め る . 使 用 す る パ ラ メ ー タ は 以 下 の 5 種 で あ る . ・ 認 証 済 み : 著 名 人 な ど の ア カ ウ ン ト に は 本 人 認 証 済 み で あ る こ と が 多 く , 不 特 定 多 数 が 使 用 す る Twitter 上 に お い て ,認 証 済 み か ど う か で 信 頼 が 大 き く 変 わ る の で 採 用 . ・ 支 持 率 : フ ォ ロ ー と フ ォ ロ ワ ー の 比 率 を 計 算 し た も の . そ の ユ ー ザ の 発 言 が 何 人 の 人 に 見 ら れ て い る か ( フ ォ ロ ワ ー 数 ) , ま た 自 分 自 身 は 何 人 の 発 言 を み て い る か ( フ ォ ロ ー 数 ) で , そ の ユ ー ザ が Twitter 上 に お い て の 影 響 力 が 決 ま る . ・ プ ロ フ ィ ー ル 充 実 度 : 一 般 的 に は ユ ー ザ 自 身

(4)

の プ ロ フ ィ ー ル が 充 実 し て い れ ば い る ほ ど , そ う で な い ユ ー ザ に 比 べ て 良 質 ( ス パ ム の 可 能 性 が 低 い ) で あ る . ・ リ ス ト : リ ス ト 追 加 さ れ て い れ ば そ の ユ ー ザ が な ん ら か の 属 性 を 持 つ こ と が ,わ か る の で ,採 用 . ・ ア イ コ ン を 変 更 済 み か : ス パ ム 対 策 . Twitter と い う サ ー ビ ス を 楽 し む 上 で , ア イ コ ン 変 更 は 普 遍 的 で あ る . 4.3 決 定 木 本 研 究 で は Castilo ら が も っ と も 良 い 結 果 を 得 ら れ た ア ル ゴ リ ズ ム で あ る 決 定 木 を 参 考 に し , 優 先 順 序 が 変 更 可 能 な 決 定 木 に よ る 重 み 付 け で 信 頼 度 を 付 加 し て い る . 図 4.2 で は 例 と し て デ フ ォ ル ト 設 定 で 生 成 さ れ る 決 定 木 を 示 す . デ フ ォ ル ト の 重 み の 順 番 は RT 数 > Fav 数 > 発 言 に リ ン ク > 発 言 に タ グ > 発 言 が リ プ ラ イ と な っ て い る た め , 生 成 さ れ た 木 の 問 い 合 わ せ 順 番 も 大 き い 順 の パ ラ メ ー タ が 先 に な る . 実 際 に ユ ー ザ が 本 ア プ リ ケ ー シ ョ ン を 使 用 す る 際 , パ ラ メ ー タ の 重 み を 自 由 に カ ス タ マ イ ズ す る こ と が 可 能 で あ る . そ れ に よ っ て , 一 番 重 み の あ る パ ラ メ ー タ か ら 順 番 に 木 の 先 頭 と な り , 決 定 木 が 生 成 さ れ る . 4.4 信 頼 値 の 算 出 4.2 節 で 述 べ た パ ラ メ ー タ を 用 い て , 4.3 節 の 決 定 木 で 振 り 分 け を 行 い , 信 頼 値 を 算 出 す る . ユ ー ザ は ま ず ユ ー ザ か 発 言 の ど ち ら か の 信 頼 値 で ソ ー ト す る か の モ ー ド を 選 ぶ . 発 言 の モ ー ド を 選 べ ば , 発 言 に 関 す る パ ラ メ ー タ (4.2)を 使 用 し , ユ ー ザ の モ ー ド で あ れ ば ユ ー ザ に 関 す る パ ラ メ ー タ を 用 い る . そ れ ぞ れ の モ ー ド の パ ラ メ ー タ に 対 し 重 み を 決 め る こ と も で き て , こ の 重 み に よ っ て 決 定 木 は 生 成 さ れ る . 検 索 ク エ リ に 対 し 取 得 さ れ た ツ イ ー ト 1 件 ご と に 決 定 木 を 適 用 す る .発 言 に 対 し 決 定 木 の 上 部 か ら YES か NO の 質 問 を 行 う ( 図 4.2 で あ れ ば “ RT 数 が 一 定 以 上 か ” と な る ) . 質 問 に 対 す る 答 え が NO な ら ば , 次 の 質 問 に 進 む( 図 4.2.1 で あ れ ば“ Fav 数 が 一 定 以 上 か ” ) す べ て の 質 問 に 対 し NO な ら ば そ の ツ イ ー ト の 信 頼 値 は 使 用 さ れ た パ ラ メ ー タ で 測 る こ と が で き な い た め ,0 に 設 定 さ れ る .一 方 ,質 問 に 対 し YES で あ れ ば , 質 問 は そ こ で 終 了 し , そ の ツ イ ー ト の 信 頼 値 が 計 算 さ れ る . ま た , そ の 質 問 の 項 目 が 信 頼 値 の 決 定 理 由 と な る . 表 4.1 で は パ ラ メ ー タ に 対 応 す る 質 問 の 項 目 を ま と め て あ る . 図 4.2 デ フ ォ ル ト 決 定 木 表 4.1 パ ラ メ ー タ と 対 応 す る 質 問 一 方 ,信 頼 値 計 算 の 計 算 式 は つ ぎ の (1) と し て い る . 信 頼 値 = 重 み × 10 + 重 みx × パ ラ メ ー タ 値 (1) 式 の 前 半 で あ る ( 重 み ×10) の 部 分 は , 重 み の 数 値 の 比 重 を 大 き く し た い た め で あ り , そ れ を 基 礎 部 分 と し て い る . パ ラ メ ー タ 値 の 上 限 は , パ ラ メ ー タ に よ っ て , 1 か ら 100 ま で 幅 が あ る . ま た 数 式 の 後 半 で あ る(重 みx × パ ラ メ ー タ 値 )は パ ラ メ ー タ 値 を 用 い て ツ イ ー ト ご と の 数 値 に 差 別 化 を 図 る た め の も の で あ る . パ ラ メ ー タ 値 と は , 数 値 と し て 取 得 さ れ る 各 パ ラ メ ー タ の 値 の こ と で あ る ( リ ツ イ ー ト 数 , フ ォ ロ ー 数 な ど ) . そ れ と 別 に 数 値 で な い パ ラ メ ー タ

(5)

の 場 合 ( 認 証 済 み か ど う か や ア イ コ ン 変 更 な ど ) は パ ラ メ ー タ 値 の 部 分 を 定 数 に 置 き 換 え て 算 出 す る . こ の 際 , 差 別 化 で き な い と い う 弱 点 が あ る . ま た パ ラ メ ー タ 値 に 対 し重 みx を 掛 け て い る の は 重 み に よ る 値 の 制 御 を 強 く す る た め で あ る . リ ツ イ ー ト 数 や Fav 数 の よ う な 爆 発 的 に 増 大 し や す い パ ラ メ ー タ 値 に は x=10 を 代 入 し 制 御 を 行 う .リ ン ク 数 や タ グ 数 の よ う な 基 本 的 に 小 さ い 数 ( 発 言 の 投 稿 に 文 字 数 制 限 が あ る た め ) は x=1 と し , パ ラ メ ー タ 値 の 重 み を 強 く し て い る . こ の よ う に パ ラ メ ー タ 値 の 大 小 に 完 全 に 依 存 す る の で は な く , 重 み に よ る 補 正 が 多 く か か る よ う に し て い る が , そ れ で も 偏 る 場 合 が あ る の で , 現 在 は 重 み の 100 倍 の 数 を 上 限 と し て 制 御 を 行 っ て い る . 後 述 す る 出 力 で も 紹 介 さ れ る が , す ぐ に 上 限 に 達 し て し ま う ケ ー ス が 多 々 あ る の で , 更 に 良 い 式 を 模 索 す る こ と が 今 後 の 目 標 の 一 つ で も あ る . 以 上 の よ う に 信 頼 値 を 決 め ら れ た ツ イ ー ト は そ の 値 の 大 き い 順 に ラ ン ク 付 け さ れ , ソ ー ト さ れ て 出 力 さ れ る . 4.5 動 的 パ ラ メ ー タ Rasha M.BinSultan ら [1]を 参 考 に し ,ユ ー ザ ご と の 発 言 を い く つ か 取 得 し , そ れ ら の 発 言 ご と の パ ラ メ ー タ を 使 っ て 信 頼 度 を 計 算 し た 後 に , そ れ を 平 均 値 化 し た も の を 動 的 パ ラ メ ー タ と 呼 ぶ . 検 索 結 果 で 得 ら れ た ユ ー ザ の 一 人 一 人 に 対 し ,過 去 10 件 の ツ イ ー ト を 取 得 し そ れ ら の 平 均 値 を と っ て い る . つ ぎ の 3 種 を 採 用 す る . ・ ア ク テ ィ ブ 率 : ユ ー ザ の 発 言 頻 度 . 主 に 検 索 を 行 っ た 日 時 と そ の ユ ー ザ の 過 去 の 発 言 の 日 時 を 比 べ , 日 付 が 同 じ で あ れ ば , 検 索 す る 同 日 に 発 言 を 行 っ て い る の で , 評 価 値 に 1 を 加 え , 更 に 時 間 が 同 じ で あ れ ば 1 を 加 え , 分 が 同 じ で あ れ ば 更 に 1 を 加 え る . 過 去 1 0 件 の 発 言 そ れ ぞ れ に 対 し 評 価 値 を 求 め , そ れ ら の 平 均 値 に 対 し 評 価 を 行 う . こ の 平 均 値 が 高 け れ ば 高 い ほ ど そ の ユ ー ザ の ア ク テ ィ ブ 率 が 高 い こ と を 証 明 す る .0-5 を 低 ,6-15 を 中 ,16-30 を 高 と し て い る . ・ ツ イ ー ト の 信 頼 値 の 平 均 値 : 前 述 し た ツ イ ー ト の 信 頼 値 の 評 価 を 過 去 1 0 件 の 発 言 に 対 し 行 い , そ の 平 均 値 を 求 め た も の . ・ ユ ー ザ の 信 頼 度 の 平 均 値 : ユ ー ザ の 信 頼 値 評 価 を 過 去 1 0 件 の 発 言 に 対 し 行 い , そ の 平 均 値 を 求 め た も の . こ れ ら の 結 果 を ユ ー ザ の 名 前 の 下 の 行 に 出 力 し て い る . ユ ー ザ が 情 報 選 択 を す る 際 の 指 標 と な る .

5. 種 々 の 信 頼 度 に 対 す る 実 行 例

こ こ で は 「 円 安 」 と い う キ ー ワ ー ド を 選 び , 様 々 な ケ ー ス で の 出 力 を 掲 示 す る . ソ ー ト モ ー ド を USER に し た( 発 言 者 の 信 頼 度 を ソ ー ト 基 準 に す る ) 場 合 で の 検 索 結 果 を 図 5.1 に , ソ ー ト モ ー ド を TWEET に し た ( 発 言 の 信 頼 度 を ソ ー ト 基 準 に す る ) 場 合 の 結 果 を 図 5.2 に 示 す . 見 や す さ を 考 慮 し , 上 位 5 位 ま で の 出 力 の み に 留 め て い る . 両 者 を 比 べ る と , 注 目 す る の が ユ ー ザ か 発 言 か で ま っ た く 違 う 発 言 と ユ ー ザ が 得 ら れ た . ま た , オ プ シ ョ ン を そ れ ぞ れ デ フ ォ ル ト の 認 証 済 み 重 視 ,リ ツ イ ー ト 重 視 か ら ,リ ス ト さ れ た 数 重 視 , 発 言 に リ ン ク を 含 む か 重 視 ( 図 5.3, 図 5.4) に 変 更 し て か ら 検 索 し た 結 果 を 図 5.5,図 5.6 に 示 す .変 更 後 の 検 索 結 果 で は 予 想 ど お り の , パ ラ メ ー タ を 重 視 す る 結 果 が 得 ら れ た . こ の よ う に ユ ー ザ は オ プ シ ョ ン を 変 更 す る こ と に よ り , 自 由 な 検 索 結 果 を 得 る こ と が 可 能 で あ る . 異 な る ユ ー ザ に よ る 異 な る 判 断 基 準 に 対 応 し た シ ス テ ム だ と 言 え る . 図 5.1 USER モ ー ド に よ る 検 索 結 果

(6)

図 5.2 TWEET モ ー ド に よ る 検 索 結 果 図 5.3 変 更 後 オ プ シ ョ ン 1 図 5.4 変 更 後 オ プ シ ョ ン 2 さ ら に 重 み を 変 更 す る 前 後 の 結 果 に 焦 点 を 当 て る . (A) デ フ ォ ル ト 重 み で の USER モ ー ド ソ ー ト 図 5.1 に 注 目 す る . ユ ー ザ の 支 持 率 を 色 濃 く 反 映 し て い る , し か し 発 言 の 中 身 は 充 実 し て い る わ け で は な い ,特 に 3 位 の ユ ー ザ の 発 言( オ レ ン ジ の 囲 み ) は キ ー ワ ー ド の 羅 列 を し て い る だ け に 過 ぎ な い た め , 情 報 量 が 非 常 に 薄 い . こ の よ う な 自 体 を 避 け る た め に も 発 言 の 信 頼 度 に 注 目 し た ソ ー ト や パ ラ メ ー タ の 変 更 が 有 効 で あ る . (B) 重 み 変 更 後 の USER モ ー ド ソ ー ト 次 に 図 5.1 の パ ラ メ ー タ の 重 み を 図 5.3 の よ う に 変 更 し て 得 ら れ た 図 5.5 に 着 目 す る と , 発 言 の 中 身 が 明 ら か に 充 実 し て い る こ と が わ か る . 2 位 か ら 4 位 が 同 じ 人 物 ( 水 色 の 囲 み ) で あ る こ と は , そ の 発 言 者 は キ ー ワ ー ド ( 円 安 ) に 対 し 関 心 を も っ て お り , 積 極 的 に 情 報 を 発 信 す る 優 良 な ユ ー ザ で あ る と 判 断 も で き る (C) デ フ ォ ル ト 重 み で の Tweet モ ー ド ソ ー ト 図 5.2 で は 発 言 の 信 頼 度 に 着 目 し た 場 合 の 結 果 に な っ て い る .リ ツ イ ー ト( RT)の 重 み の 値 が 高 い た め , 同 じ ツ イ ー ト が 上 位 を 独 占 し て い る 現 象 が 起 き て い る( 赤 の 囲 み ).こ れ は Twitter 上 に よ く あ る ケ ー ス で , バ ー ス ト と も 呼 ば れ て い る 現 象 で あ る . こ の 現 象 は RT と Fav の カ ウ ン ト が 炎 上 や 流 行 な ど の 理 由 に よ り 爆 発 的 に 増 え る こ と が 原 因 で あ る . こ の 時 RT も し く は Fav パ ラ メ ー タ の 数 値 は , リ ス ト さ れ た 数 や 他 の パ ラ メ ー タ の 値 と 何 倍 も の さ が 生 じ て し ま う . こ れ に よ り 結 果 は 重 複 し た 情 報 に な っ て し ま い , 情 報 の 多 様 性 が 失 わ れ て し ま う . 勿 論 検 索 結 果 で RT を 除 く オ プ シ ョ ン が あ る が , そ れ を 使 用 す る と RT に よ る burst が 観 測 で き な く な る た め ,本 研 究 で は パ ラ メ ー タ の 重 み を 変 更 す る と い う 違 う ア プ ロ ー チ で 対 応 し て い る . (D) 重 み 変 更 後 の Tweet モ ー ド ソ ー ト 図 5.6 は 図 5.4 の よ う に パ ラ メ ー タ を 設 定 し 再 検 索 を 行 っ た 結 果 で あ る . こ の よ う に リ ン ク を 含 む 発 言 を 優 先 す る よ う に 設 定 し た 結 果 , 上 位 発 言 は そ れ ぞ れ 異 な る が , ど の 発 言 に も URL( ) が 入 っ て お り , 情 報 の 多 様 性 が 観 測 で き る . 図 5.5 変 更 後 の USER モ ー ド に よ る 検 索 結 果

(7)

図 5.6 変 更 後 の TWEET モ ー ド に よ る 検 索 結 果

6. 考 察 と 今 後 の 課 題

本 研 究 で は 「 ユ ー ザ が ツ イ ー ト 選 択 を 決 め る 」 と い う カ ス タ マ イ ズ 機 能 が 実 現 で き た . し か し カ ス タ マ イ ズ の 自 由 度 と 仕 様 の 理 解 し や す さ と は ト レ ー ド オ フ の 関 係 で あ り , ど こ ま で ユ ー ザ が 決 め る か が 課 題 で あ る . ま た , ス ラ イ ダ ー の 操 作 に よ り 重 み の 変 更 が 可 能 だ が , ど の パ ラ メ ー タ に ど れ だ け の 重 み が 適 当 な の か が 確 立 さ れ て い る わ け で は な く , 今 後 の 課 題 で あ る . (a) パ ラ メ ー タ の 数 値 の 大 き い 発 信 者 が 有 利 デ フ ォ ル ト の 重 み バ ラ ン ス で は RT 数 や フ ォ ロ ー 数 が 多 い 発 信 者 の 情 報 が 上 位 に あ が る . し か し そ の 発 言 が 有 用 で あ る と は 限 ら な い .た と え ば「 有 名 人 」 の つ ぶ や き だ が , 有 名 人 で あ る こ と を 考 慮 す る オ プ シ ョ ン が 追 加 で き れ ば , 埋 も れ て い る 情 報 を 発 掘 し や す く な る と 考 え ら れ る . (b) 動 的 パ ラ メ ー タ の 活 用 動 的 パ ラ メ ー タ は 現 段 階 で は , 計 算 し た 平 均 値 を 出 力 結 果 に 表 示 し て ユ ー ザ に 情 報 選 択 の 補 助 の 一 つ と し て い る だ け だ が , 将 来 は こ の 動 的 な 値 で の ソ ー ト や 他 に も 活 用 で き る 方 法 を 模 索 し て い き た い . (c) 信 頼 度 の パ ラ メ ー タ 本 研 究 で は 信 頼 度 を 算 出 す る 際 に , 主 要 と さ れ る パ ラ メ ー タ を 使 用 し た . し か し Twitter の API で 取 得 可 能 な パ ラ メ ー タ は 数 多 く あ り , そ の 中 で 信 頼 度 に 結 び つ く よ う な パ ラ メ ー タ が ま だ 存 在 す る 可 能 性 が あ る [2] . ま た Twitter 公 式 サ イ ト で は , Twitter Analytics と い う ユ ー ザ の 発 言 傾 向 を 分 析 す る サ ー ビ ス を 開 始 し て い る .そ の API に よ る 利 用 が 可 能 で あ れ ば , 信 頼 度 を 計 る 範 囲 が 広 が る と 考 え ら れ る . 今 後 は よ り 柔 軟 で 多 様 な ケ ー ス に 対 応 で き る 信 頼 度 の 算 出 を 追 求 し て い き た い . (d) 処 理 速 度 処 理 は シ ン グ ル ス レ ッ ド で 実 行 し て い て , 特 に 平 均 値 の 計 算 で は 一 人 ひ と り の ユ ー ザ に 対 し て API の 呼 出 し を 行 う た め , 実 行 速 度 に 課 題 が あ る . 解 決 策 と し て は マ ル チ ス レ ッ ド に よ る API リ ク エ ス ト が 考 え ら れ る . 7. お わ り に 実 用 性 .Twitter 関 連 の 研 究 多 く は「 分 析 」と い う 点 に 重 み を 置 い て い る . そ れ は 大 量 な デ ー タ セ ッ ト を 元 に , 繰 り 返 し 処 理 を 行 い , 結 果 を 提 示 す る も の で あ る . 実 際 に ユ ー ザ が 直 接 利 用 で き る も の は 少 な い . 本 研 究 で は 実 用 性 に お い て , 必 要 な 処 理 と そ の 負 荷 に つ い て も 考 慮 し て い る . カ ス タ マ イ ズ . 大 部 分 の 関 連 研 究 で は 研 究 者 ら が 提 唱 す る 一 定 の ア ル ゴ リ ズ ム に 基 づ い て 情 報 抽 出 を 行 う . 実 際 ユ ー ザ が 使 用 さ れ る 際 , 異 な る ユ ー ザ が そ れ ぞ れ 異 な る 基 準 を 持 つ こ と は 明 白 で あ り , こ の こ と に 対 応 す る た め , 本 研 究 で は 「 ユ ー ザ に も 計 算 基 準 を 決 め る 権 利 が あ る 」 と い う こ と を 主 張 し , 実 際 に 信 頼 度 計 算 の 重 み や パ ラ メ ー タ 優 先 度 の カ ス タ マ イ ズ が 可 能 で あ る こ と を 実 現 し た .

参 考 文 献

[1] Rasha M. BinSultan Al -Eidan, Hend S. Al-Khalifa and AbdulMalik S. Al-Salman. “Measuring the credibility of Arabic text content in Twitter”. Fifth Int. Conf. on Digital Information Management (ICDIM), 2010, pp. 285-291

[2] C. Castillo, M. Mendoza and B. Poblete.

“Information credibility on Twitter”. Proc. 20th Int. Conf. on World Wide Web, pp. 675-684, 2011

[3] A. Gupta and P. Kumaraguru. “Credibility ranking of tweets during high impact events”. Proc. 1st Workshop on Privacy and Security in Online Social Media, 2012. Article No. 2

[4] M. Gupta, P. Zhao and J. Han. “Evaluating event credibility on Twitter”. SIAM Int. Conf. on Data Mining, 2012, pp. 153-164

[5] Y. Ikegami, K. Kawai, Y. Namihira and S. Tsuruta. “Topic and opinion classification based information credibility analysis on Twitter”. IEEE Int. Conf. on Systems, Man, and Cybernetics (SMC), 2013, pp. 4676-4681

[6] B. Kang, J. O’Donovan and T. H¨ollerer. “Modeling topic specific credibility in Twitter”. ACM Int. Conf. on Intelligent User Interfaces ,

(8)

2012, pp. 179-188

[7] 北 口 沙 也 香 , 宮 西 大 樹 , 関 和 広 , 上 原 邦 昭 . “マ イ ク ロ ブ ロ グ 文 書 の 選 択 に よ る 対 話 的 な 災 害 情 報 検 索 シ ス テ ム”. 言 語 処 理 学 会 第 19 回 年 次 大 会 発 表 論 文 集 , pp. 240-243, 2013

[8] J. O’Donovan, B. Kang, G. Meyer and T. H¨ollerer. “Credibility in context: An analysis of feature distributions in Twitter”. Privacy, Security, Risk and Trust (PASSAT), 2012 International Conference on, and 2012 Int. Conf. on Social Computing (SocialCom), pp. 293-301

[9] S. Sikdar, B. Kang, J. O’Donovan, T. H¨ollerer and S. Adah. “Understanding information credibility on Twitter”. Int. Conf. on Social Computing (SocialCom), 2013, pp. 19-24 [10] 山 口 祐 人 , 髙 橋 翼 , 天 笠 俊 之 , 北 川 博 之 . “リ ン ク 構 造 解 析 に よ る Twitter ユ ー ザ の ラ ン キ ン グ 手 法 . 情 報 処 理 学 会 創 立 50 周 年 記 念( 第 72 回 ) 全 国 大 会 , pp. 751-752. 2010 [11] https://twitter.com/ [12] https://dev.twitter.com/overview/documentation

図 5.2 TWEET モ ー ド に よ る 検 索 結 果       図 5.3 変 更 後 オ プ シ ョ ン 1    図 5.4 変 更 後 オ プ シ ョ ン 2  さ ら に 重 み を 変 更 す る 前 後 の 結 果 に 焦 点 を 当 て る .  (A) デ フ ォ ル ト 重 み で の USER モ ー ド ソ ー ト   図 5.1 に 注 目 す る . ユ ー ザ の 支 持 率 を 色 濃 く 反 映 し て い る , し か し 発 言 の 中 身 は 充 実 し
図 5.6 変 更 後 の TWEET モ ー ド に よ る 検 索 結 果   6. 考 察 と 今 後 の 課 題   本 研 究 で は 「 ユ ー ザ が ツ イ ー ト 選 択 を 決 め る 」 と い う カ ス タ マ イ ズ 機 能 が 実 現 で き た . し か し カ ス タ マ イ ズ の 自 由 度 と 仕 様 の 理 解 し や す さ と は ト レ ー ド オ フ の 関 係 で あ り , ど こ ま で ユ ー ザ が 決 め る か が 課 題 で あ る . ま

参照

関連したドキュメント

話者の発表態度 がプレゼンテー ションの内容を 説得的にしてお り、聴衆の反応 を見ながら自信 をもって伝えて

すべての Web ページで HTTPS でのアクセスを提供することが必要である。サーバー証 明書を使った HTTPS

結果は表 2

析の視角について付言しておくことが必要であろう︒各国の状況に対する比較法的視点からの分析は︑直ちに国際法

信号を時々無視するとしている。宗教別では,仏教徒がたいてい信号を守 ると答える傾向にあった

それに対して現行民法では︑要素の錯誤が発生した場合には錯誤による無効を承認している︒ここでいう要素の錯

行ない難いことを当然予想している制度であり︑

妥当性・信頼性のある実強度を設定するにあたって,①