• 検索結果がありません。

しているイベント名 鑑賞しているテレビ番組名などが考えられる () システムはそのクエリに対して適切なレポータを返すために レポータ候補者を収集する (3) レポータ候補者のツイートから それぞれの候補者がレポータとしてふさわしいかを評価する () 適切なレポータとして評価された Twitter ユ

N/A
N/A
Protected

Academic year: 2021

シェア "しているイベント名 鑑賞しているテレビ番組名などが考えられる () システムはそのクエリに対して適切なレポータを返すために レポータ候補者を収集する (3) レポータ候補者のツイートから それぞれの候補者がレポータとしてふさわしいかを評価する () 適切なレポータとして評価された Twitter ユ"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

短期持続型情報取得を目的とした Twitter 上での

アドホックフォローネットワーク自動構成手法

田島 真悟

牛尼 剛聡

†九州大学芸術工学部 〒815-8540 福岡県福岡市南区塩原 4-9-1

‡九州大学芸術工学部 〒815-8540 福岡県福岡市南区塩原 4-9-1

E-mail: †[email protected], ‡[email protected]

あらまし Twitter は多くの利用者を有する代表的な SNS サービスのひとつであり、ユーザは実世界で起こってい る様々な事象に関してリアルタイムな情報を投稿する。Twitter においてユーザは他のユーザをフォローすることで 自らのフォローネットワークを構成し、フォローしたユーザが発するツイートをリアルタイムに取得できる。しか し、一般的に Twitter 上でのフォローネットワークは静的なものであり、目的に応じて変更されることはない。一方、 ユーザが地域の祭りや音楽フェスティバルといった実世界イベントに参加した際、そのイベント内での情報を短期 間だけ持続的に取得したいという情報要求を有するケースは多い。本研究ではこの問題を解決するため、Twitter 上 で目的に応じたアドホックフォローネットワークを構成する手法を提案し、ユーザの短期持続型情報要求に応える ことを目的とする。そして、プロトタイプシステムを利用した実験により提案手法の有効性を評価する。 キーワード Twitter、アドホックフォローネットワーク、情報共有

1. は じ め に

近 年 、マイクロブログをはじめとする SNS が注 目 を集 めてい る。多 数 の SNS の中 で利 用 者 数 、投 稿 数 ともに多 いマイクロ ブログの代 表 例 として Twitter がある。 Twitter では、ユーザは 140 文 字 以 内 でメッセージ(ツイー ト)を 発 信 で き、 そのツ イー ト はフォロー ネット ワー クを 通 じ て 伝 播 される。 特 に、ユーザは 自 らのフォローネットワークを 構 成 す るた めに フ ォロ ー 対 象 の ユーザ か ら の 承 認 を 受 け る必 要 が な い。 こ の た め 、 自 分 の 興 味 や 関 心 に 合 わせ て フ ォ ロ ーする対 象 となるユーザを選 択 し、自 分 にとって必 要 な情 報 を得 ることができる。 しかし、一 般 的 に Twitter ユーザは友 人 、知 人 、家 族 、著 名 人 をフォローすることが多 く、構 成 したフォローネットワーク を日 常 的 に変 化 させることはない。つまり、Twitter において、 多 くのユーザは日 常 的 に閉 ざされたコミュニティ内 でのみ情 報 共 有 を 行 な っ て い る と 考 え ら れ る 。 こ う し た 特 徴 の た め 、 Twitter は以 下 のような状 況 では有 効 的 でない。  催 し 物 や コン サー ト 等 の 実 世 界 イベン トに 参 加 した ときに、イベントに関 する情 報 を取 得 したい。  スポーツの試 合 やテレビ番 組 を鑑 賞 しているときに、 そのスポーツやテレビ番 組 に関 しての情 報 を取 得 し たい。  事 故 や 災 害 に 巻 き 込 ま れ た と きに 、 そ の 事 故 や 災 害 に関 する情 報 を取 得 したい。 上 記 の 種 類 の 情 報 要 求 に 関 し て 共 通 す る 事 項 は 、 数 時 間 から数 日 にかけて継 続 的 な情 報 取 得 が要 求 されることで ある。すなわち、ハッシュタグやキーワードによる検 索 で上 記 の情 報 取 得 を継 続 的 に実 現 する場 合 、検 索 要 求 を 何 度 も 繰 り 返 し 実 行 す る 必 要 が あ り 効 率 的 で な い。 従 っ て 、 短 期 限 定 の イベント 参 加 者 内 フォ ローネットワークを 構 成 す る手 法 が効 率 的 であると考 える。しかし、Twitter では同 じ状 況 に あるユーザ間 で動 的 にフォローネットワークを構 成 する機 能 を 提 供 し て いな い。 そ こで 本 研 究 で はこ の 問 題 を 解 決 す る ため、ユーザの状 況 と目 的 に 応 じた一 時 的 なフォローネット ワークを自 動 的 に 構 成 する手 法 を提 案 する。本 手 法 では、 同 じ状 況 を共 有 している Twitter ユーザを発 見 し、そのユー ザを 一 時 的 に フォローするこ とによって、その 状 況 に 関 す る 情 報 を Twitter からリアルタイムに取 得 するアプローチをとる。 本 稿 では、このとき構 成 されるフォローネットワークをアドホッ クフォローネットワークと呼 び、同 じ状 況 を共 有 しており、その 状 況 に関 する有 益 な情 報 を提 供 する可 能 性 がある Twitter ユーザをレポータと呼 ぶ。図 1 にアドホックフォローネットワ ークの概 念 図 を示 す。 図 1 ア ド ホ ッ ク フ ォ ロ ー ネ ッ ト ワ ー ク の 概 念 図 図 2 に、提 案 システムの処 理 の流 れを示 す。本 システムは 以 下 のように動 作 する。 (1) システムを利 用 するユ ーザがシステムに対 してクエリを 入 力 する。ここで一 般 的 なクエリとしては、ユーザが参 加

(2)

し て いる イ ベ ン ト 名 、 鑑 賞 し て い るテ レ ビ 番 組 名 な ど が 考 えられる。 (2) システムはそのクエリに対 して適 切 なレポータを返 すた めに、レポータ候 補 者 を収 集 する。 (3) レポータ候 補 者 のツイートから、それぞれの候 補 者 がレ ポータとしてふさわしいかを評 価 する。 (4) 適 切なレポータとして評 価された Twitter ユーザを推 薦 する。 (5) ユーザは、推 薦 されたレポータを一 時 的 にフォローする ことにより、入 力 したクエリに関 連 する情 報 をレポータか ら得 る。 図 2 処 理 の 流 れ

2. 関 連 研 究

Twitter は投 稿 数 の多 さ,及 び利 用 者 の多 さから数 多 くの 研 究 が行 われている。Bernardo ら[6]は、Twitter 上 における フォロー・フォロワー数 と実 際 の友 人 数 との関 連 を調 査 す る 研 究 を行 っている。また、Danah ら[7]は Twitter ユーザが利 用 するリツイート機 能 をその目 的 によって分 類 している。これ らは、Twitter 自 体 の特 徴 を分 析 する研 究 である。 また、Twitter の解 析 によってトレンドや世 論 、その他 の社 会 的 事 象 や傾 向 を発 見 するという研 究 も活 発 に行 われてい る。例 えば、若 宮 ら[1]は、Twitter を解 析 することで、特 定 の テレビ 番 組 を 視 聴 して いると 考 えられ るユーザ を 抽 出 し 、 そ のユーザ数 からテレビ番 組 の視 聴 率 を計 算 する手 法 を提 案 している。同 様 に、Jansen ら[2]は、ブランドに対 する消 費 者 の意 見 を Twitter から収 集 する手 法 を提 案 している。 さらに、Twitter はイベントや流 行 をいち早 く発 見 する目 的 でも研 究 されている。例 えば 、榊 ら [3]は、Twitter で流 れて いるツイートを常 にモニタリングすることで地 震 の発 生 をいち 早 く発 見 する手 法 を提 案 している。彼 らは、「地 震 」「揺 れた」 と い っ た 単 語 を 含 む ツ イ ー ト を 収 集 し 、 収 集 し た ツ イ ー ト を support vector machine(SVM)[8] に よ っ て positive 、 negative の 2 種 類 に分 類 した。この場 合 における negative と は 、 実 際 に そ の 瞬 間 に 地 震 を 体 験 し た 人 の ツ イ ー ト を 意 味 し 、 negative は そ う で な い 人 の ツ イ ー ト を 意 味 す る 。 positive に判 定 されたツイートの数 から地 震 が実 際 に発 生 し ている確 率 を算 出 し、閾 値 により地 震 の発 生 を検 出 している。 また、荒 巻 ら[4]は、Twitter をモニタリングすることでインフル エンザの流 行 を直 ちに発 見 する手 法 を提 案 している。彼 らも、 前 述 した榊 らの 研 究 と同 様 、「インフルエンザ」という 単 語 を 含 むツイートを SVM によって positive(実 際 にインフルエン ザにかかっているユーザ )と negative(インフルエンザにはか か って いな いユ ー ザ )に分 類 すること で 実 際 の イン フルエ ン ザ患 者 数 を割 り出 し、流 行 を検 知 している。 同 様 に、杉 谷 ら [5]は、ツイートに付 加 されている位 置 情 報 を利 用 してローカ ルイベントを発 見 する手 法 を提 案 している。彼 らは、ローカル イベントに 関 するツ イートは、 時 間 的 にも 位 置 的 にも 集 中 し ている場 合 が多 いという事 実 に着 目 し、時 間 と場 所 の 2 つの 要 素 でツイートのクラスタリングを行 うことでイベントを発 見 す るアプローチをとっている。

3. 提 案 手 法

本 手 法 では、ユーザが入 力 したクエリをもとに、システムが それに関 するツイートを発 信 しているユーザを集 めてレポー ト候 補 者 とし、その中 からレポータを選 別 して推 薦 する。ここ で、レポータとして推 薦 されるべきユーザは、以 下 のような特 徴 を持 っていることが望 ましい。  ユーザが入 力 したクエリに関 するツイートを継 続 的 、頻 繁 に発 していること  投 稿 するツイートの内 容 が有 益 であること また、ツイート単 位 でなくユーザ単 位 で選 出 を 行 う理 由 と して、処 理 時 間 コストの問 題 が挙 げられる。つまり、実 世 界 イ ベントに関 するツイート全 てに対 して有 益 性 の判 断 を行 う場 合 、膨 大 な処 理 時 間 を必 要 とするため現 実 的 でない。一 方 、 有 益 なイベント情 報 を頻 繁 に発 信 すると期 待 できるレポータ に対 してアドホックフォローネットワークを構 成 する手 法 では、 一 度 フォローネットワークを構 成 すれば以 後 はシス テムの処 理 を 要 することなく レポータか ら有 益 な 情 報 を 取 得 で きるた め、少 ない処 理 時 間 で済 みシステムへの負 担 も小 さい。

3.1 候 補 者 の 収 集

本 システムはユーザからクエリ(キーワード)を受 け取 ると、そ のクエリ に基 づいてレポータ候 補 者 を収 集 する。ここで対 象 となるレポータ候 補 者 とは、例 えばクエリがテレビ番 組 名 であ っ た 場 合 は 、 そ の テ レビ 番 組 の 視 聴 者 や 公 式 ア カ ウ ン ト 等 であり、クエリが街 で行 われているイベント名 であった場 合 、 イベントの参 加 者 等 がレポータ候 補 者 として考 えられる。 レポータ候 補 者 を収 集 するために、まずユーザから与 えら れたクエリを用 いてツイート検 索 を行 い、そのツイートを発 信 している Twitter ユーザを候 補 者 とみなす。例 として、2012 年 11 月 4 日 に行 われた日 本 対 オマーンのサッカーワールド カップの試 合 中 に、「オマーン」というクエリをシステムに与 え たしたときの事 例 を 説 明 する。この例 の場 合 、「オマーン」を

(3)

クエリとしてツイート検 索 を行 った結 果 、『前 半 日 本 がオマー ンに1点 リード!』といったツイートが検 索 結 果 として抽 出 で き る 。 こ の よ う に ク エ リ を 直 接 含 む ツ イ ー ト を 発 し た ユ ー ザ を 求 めることで、レポータ候 補 者 を収 集 できる。しかし、同 じ状 況 を 共 有 し て い る ( ここ で は、 同 じ サッ カ ー の 試 合 を 見 て い る)Twitter ユーザは他 にも存 在 すると考 えられる。例 えば、 『ワールドカップの最 終 予 選 、日 本 が1点 リード』というツイー トは「オマーン」という クエリは含 まれていな いが、 同 じ サッ カ ーの試 合 について発 しているツイート内 容 であると考 えられ る。こ のよ う に 、ユ ー ザ が 与 え た ク エリ を 直 接 含 む ツ イ ー ト を 投 稿 していな いユーザも レポ ータ候 補 者 にな る可 能 性 が あ る。 上 記 の問 題 を解 決 するため、関 連 語 を利 用 する。例 えば、 「オマーン」というクエリを含 むツイート検 索 結 果 の内 容 から、 「 ワ ー ル ド カ ッ プ」 や 「 予 選 」 と いっ た 単 語 が 関 連 語 で あ る と 推 定 することができれば、関 連 語 でツイート検 索 を行 うことに よって、上 のようなツイートも、とりこぼすことなく発 見 し、その 発 信 者 を候 補 者 に追 加 できる。

3.2 関 連 語 の発 見

はじめに、 関 連 語 となりうる候 補 を収 集 する。 本 研 究 では、 関 連 語 を 発 見 す る手 法 とし てトピック 分 類 による方 法 と コサ イ ン 距 離 を 利 用 し た 方 法 の そ れ ぞ れ に つ い て 検 証 を 試 み た。;

3.2.1LDA を用 いたトピック分 類 による手 法

文 書 のトピックを分 類 する手 法 の一 つとして、LDA(Latent Dirichlet Allo-cation)がある。LDA では、単 語 の潜 在 的 トピ ック を 推 定 す ること により 文 書 のト ピ ック 分 類 を 行 う 。また 、 1 つの文 書 が 1 つのトピックに属 するのではなく、文 書 内 に存 在 する各 単 語 がそれぞれのトピックに確 率 的 に属 するとみな すのが特 徴 である。実 際 に LDA は小 説 の著 者 分 類 やニュ ース記 事 のトピック分 類 に利 用 されている。図 3 に LDA の モデル図 を 示 す。図 中 に 示 されれるそれぞれの変 数 は、 デ ィリクレ事 前 分 布 Dir(α)および Dir(β)、トピック空 間 の多 項 分 布 Multinomial(θd) 。 単 語 空 間 の 多 項 分 布 Multinomial(ϕzi)、トピック数 T、文 書 数 D、各 文 書 の単 語 数 N をそれぞれ表 している。LDA の単 語 生 成 過 程 としては 以 下 の通 りとなる。 (1) 全トピック t においてディリクレ事 前 分布 Dir(β) から ϕt を抽 出 (2) すべての文書 d においてもディリクレ事 前 分布 Dir(α) から

θd

を抽 出 (3) 文 書 d 内 の i 番 目の単 語 wi において、抽 出した文 書 d の多 項 分 布 Multinomial(θd)からトピック zi を抽 出 (4) トピック zi の多 項 分布 Multinomial(ϕzi)から単語 wi を抽 出 図 3 LDA の モ デ ル 本 研 究 では、LDA のパラメタを推 定 する計 算 手 法 として ギブスサンプリングを用 いる。ギブスサンプリングでは、トピッ ク j の確 率 分 布 はそれ以 外 のトピックの確 率 分 布 によって計 算 され る。こ れ を 全 ト ピ ッ ク に つ いて 繰 り 返 し 計 算 を 行 う こ と により、最 適 な ϕ とθ の値 が推 定 される。ギブスサンプリン グの定 義 式 は以 下 で示 される。 …(1) ギブスサンプリングの結 果 求 められる ϕ とθ の値 は以 下 で示 される。 …(2) …(3) C^WTmj は単 語 m がトピック j に割 り当 てられた回 数 、 C^DTdj は文 書 d がトピック j に割 り当 てられた回 数 、V は 全 単 語 数 、T は全 トピック数 をそれぞれ表 している。 本 研 究 では、1 ツイートを 1 文 書 として扱 い、上 記 のギブス サンプリングの計 算 を行 うことでツイートのトピック分 類 を行 う 実 験 を試 みたが、ほとんどの場 合 適 切 なトピック分 類 を実 現 することができなかった。その理 由 として、Twitter の場 合 1 ツ イートが 140 字 以 内 という制 限 があることから、1 文 書 に含 ま れる単 語 数 がニュース記 事 や小 説 の文 書 における単 語 数 と 比 べて圧 倒 的 に少 ないからであると考 えられる。LDA のギブ スサンプリングでは、同 一 トピックでは共 通 の単 語 を含 みや すいという事 実 を前 提 としていることから、1 文 書 における単 語 数 が少 ないとトピック推 定 も困 難 となる。さらに、LDA のギ ブスサンプリングは処 理 コストが大 きいというデメリットも存 在

(4)

する。本 研 究 のシステムでは、Twitter の状 況 に応 じたリアル タイム性 の高 いレスポンスが要 求 される。そのため、処 理 時 間 の大 きいアルゴリズムを用 いることは適 切 ではない。

3.3.2 コサイン距 離 を用 いた手 法

次 に、クエリ単 語 とのコサイン距 離 を利 用 した関 連 語 発 見 手 法 について述 べる。本 手 法 ではまずコサイン距 離 の計 算 を行 う対 象 とするべき「関 連 語 の候 補 単 語 」を収 集 する。関 連 語 の候 補 単 語 として、クエリを含 むツイートを検 索 して得 られた検 索 結 果 のツイート内 における共 起 語 を利 用 する。 「オマーン」をクエリとしてツイートを検 索 した際 、検 索 結 果 の ツイート内 における共 起 語 をその出 現 数 順 でランキング化 すると、図 4 に示 す結 果 となった。 図 4 共 起 語 (オ マ ー ン を 含 む ツ イ ー ト 1264 件 中 ) 図 4 で示 されるような共 起 語 の出 現 数 を、その共 起 語 とク エリとの関 連 度 であると解 釈 するには不 適 切 な場 合 がある。 例 えば、図 4 の中 で、「後 半 」という語 と「人 」という語 は、同 程 度 の 頻 度 で 出 現 して いる 。しか し、「 人 」と いう 語 は、そ の 試 合 に 関 す る話 題 以 外 でも数 多 く 使 われていると考 えられ る。従 って、こうした語 はクエリである「オマーン」に対 する関 連 度 は低 いとみなすべきである。この問 題 を解 決 するために、 共 起 語 とクエリの 単 語 の コサイン 距 離 を 利 用 す る。 コサイ ン 距 離 は式 (4)で示 される。

Y X Y X Y X,   cos …(4) 式 (4)において、X,Y はそれぞれ図 5 に示 すように、クエリ の単 語 を含 むツイート集 合 X、および共 起 語 の1つを含 むツ イート集 合 Y を表 す。図 5 では、共 起 語 の1つの例 として 「後 半 」という語 を用 いている。 図 5 コ サ イ ン 距 離 の 概 念 図 コサイ ン 距 離 の 計 算 を そ れ ぞれ の 共 起 語 に 対 し て 適 用 し た結 果 のうち、上 位 9 件 を図 6 に示 す。縦 軸 はユーザがク エリとして与 えた単 語 とのコサイン距 離 を表 す。前 述 した「人 」 の よ う な 、 一 般 語 に 対 す る 値 は 下 が り 、 そ の 代 わり に サッ カ ーの試 合 における特 有 の 語 が高 い値 となっている。本 研 究 では、このコサイン距 離 の値 を、ユーザがクエリとして与 えた 単 語 とそれぞれの関 連 語 との関 連 度 とする。 コサイン距 離 を用 いた関 連 語 発 見 手 法 では、 LDA を用 い たトピック分 類 による手 法 と 比 べて処 理 コストも 少 なく、かつ 正 確 な 関 連 語 を 発 見 し や す い。 そ こ で 本 研 究 で は 関 連 語 発 見 手 法 と し て 、 こ の コサイ ン 距 離 を 用 いた 手 法 を 採 用 す る。 関 連 語 を抽 出 した後 、3.1 で述 べたように関 連 語 によるツイ ートの検 索 を行 い、それらのツイートを発 信 しているユーザも 候 補 者 に追 加 する。 図 6 コサイン距 離 の計 算 結 果

3. 3 レポータの選 出

次 に 、 得 られ た レ ポ ー タ 候 補 者 の 中 か らレ ポ ー タ を 選 出 する。レポータとして求 められる条 件 は、前 述 したように、 (1) そ の 状 況 に 関 す るツ イー トを 頻 繁 に 発 す る 見 込 み の あるユーザ (2) 投 稿 し た ツ イー トの 内 容 が、 高 い 情 報 量 を 持 ち 有 益 であるユーザ である。つまり、(1) はそのユーザが発 する状 況 関 連 ツイート の「量 」的 な側 面 を表 し、(2) はそのユーザが発 する状 況 関 連 ツ イ ー ト の 「 質 」 的 な 側 面 を 表 し て い る と い え る 。 以 下 に 「量 」および「質 」を評 価 する方 法 について述 べる

3.3.1

量 の評 価

本 研 究 では、量 の評 価 手 法 として 2 つの指 標 を検 討 した。 1 つめの指 標 は、それぞれのレポータ候 補 者 がクエリ入 力 時 点 から L 時 間 前 以 降 に投 稿 した関 連 ツイートの件 数 を求 め、 量 の評 価 の尺 度 とする方 法 である。本 研 究 では L=5 時 間 と 設 定 した。候 補 者 が過 去 5 時 間 以 内 に投 稿 したツイートの 中 で、3.2 で求 めた関 連 語 が 1 語 でも含 まれていれば、それ を 関 連 ツ イ ー ト と み な す 。 式 (5) に 本 手 法 に お け る 定 義 式 av(amount value) を 示 す 。 変 数 t は ツ イ ー ト を 表 し 、 変 数 T(u)は候 補 者 u が過 去 L 時 間 以 内 に発 信 したツイートの集 合 を表 す。 0 100 200 300 0 0.05 0.1 0.15 0.2 0.25

(5)

) (

)

(

)

(

u T t

t

u

av

…(5) …(6) 2 つ め の 量 の 評 価 手 法 は 、各 候 補 者 が 過 去 に ツ イ ー ト を 投 稿 し た 時 刻 を 考 慮 し た 方 法 で あ る 。 例 え ば 、 過 去 5 時 間 以 内 に 投 稿 し た ツ イ ー ト 数 が 同 じ 10 件 で あ る ユ ー ザ A と ユ ー ザ B が い た と き 、 ユ ー ザ A は 4 時 間 前 に 最 後 の ツ イ ー ト を 投 稿 し て お り 、ユ ー ザ B は 直 近 15 分 以 内 の ツ イ ー ト 数 が 多 か っ た 場 合 、 現 時 刻 の 直 後 に ツ イ ー ト を 投 稿 す る 確 率 が 高 い の は ユ ー ザ B の ほ う で あ る と 考 え ら れ る 。従 っ て 、過 去 L 時 間 以 内 の ツ イ ー ト 数 だ け で な く 、 各 ツ イ ー ト の 投 稿 時 刻 を 考 慮 し た 計 算 手 法 を 提 案 す る 。式 (7)に 本 手 法 の 定 義 式 を 示 す 。e^{-λ h(t)}は 、 ツ イ ー ト t を 投 稿 し た 時 刻 が よ り 過 去 で あ る ほ ど 小 さ く な っ て い き 、直 近 で あ る ほ ど 大 き く な る 。 こ れ に よ り 、 よ り 直 近 に ツ イ ー ト を 投 稿 し て い る ユ ー ザ に 対 し て 高 い 評 価 値 が つ く こ と と な る 。

  

) ( ) (

)

(

)

(

u T t t h

e

t

u

av

 …(7) ) ( ) (t 現時刻とツイートtを投稿した時刻の差単位は時 h

3.3.2

質 の評 価

レポータ候 補 者 が発 信 するそれぞれのツイートの質 を評 価 する基 準 について述 べる。 本 研 究 で は、 質 の 高 いツ イ ー ト を 情 報 量 の 多 いツ イ ー ト と 解 釈 す る た め、 ツ イ ー ト が 含 む 関 連 語 の 数 を 考 慮 す る 。 関 連 語 をより多 く含 んでいるツイートほど、クエリの話 題 に対 す る情 報 量 が多 いと考 えられるためである。従 って、ツイートに 含 ま れ て い る 関 連 語 と そ の 関 連 度 を 利 用 し て 、 個 々 の ツ イ ートの質 の評 価 の尺 度 とする。 例 えば、図 7 に示 す例 1のツイートの場 合 、含 まれる関 連 語 は「アジア」、「ワールドカップ」、「最 終 」、「予 選 」の 4 つで あり、その関 連 度 の合 計 値 は 0.35 である。従 って、このツイ ートの質 の評 価 値 は 0.35 と計 算 される。 図 7 質 の 評 価 この質 の評 価 を、量 の評 価 と同 様 にそれぞれの候 補 者 が過 去 5 時 間 以 内 に発 信 したツイート全 てに対 して行 い、ツイー ト 1 件 当 たりの質 の評 価 の平 均 値 をとる。クエリの話 題 に関 係 のないツイートや情 報 量 の少 ないツイートまでも頻 繁 につ ぶやいて いるユー ザは 、 量 の 評 価 では 高 く 評 価 される可 能 性 が高 いが、質 の評 価 においては 1 件 あたりの平 均 値 が下 がることにより著 しく低 く評 価 されるため、推 薦 されにくくする ことができる。 式 (8)に質 の評 価 値 の計 算 式 を示 す。 質 の評 価 値 を表 す 関 数 として、qv(quality value)を定 義 した。式 (5)と同 様 に、 変 数 u は各 候 補 者 、変 数 t はツイートを表 し、変 数 T は各 候 補 者 が過 去 L 時 間 以 内 に発 信 したツイートの集 合 を表 す。 変 数 w は関 連 語 を表 し、変 数 W は 4.2 章 で求 めた関 連 語 の集 合 を表 す。

T

w

w

t

u

qv

 

tT wW

)

(

)

,

(

)

(

…(8) …(9) 3.3.3

総 合 的 な評 価

レポータ候 補 者 に対 して計 算 した量 の評 価 値 と質 の評 価 値 の積 を、そのレポータ候 補 者 に対 する総 合 的 な評 価 値 と する。総 合 的 な 評 価 値 を 計 算 す る 関 数 と し て 、tv(total value)を 定 義 す る 。 式 (5)および式 (8)の評 価 基 準 により、 関 連 ツイートを過 去 L 時 間 以 内 に頻 繁 につぶやいているユ ーザ、かつ それら のツイ ー ト1 件 あたり の 情 報 量 が 高 いユ ー ザ ほ ど 、 上 位 に ラ ン キ ン グ さ れ る。 式(10)に 総 合 的 な 評 価 値 の 形 式 的 な 定 義 を 示 す 。

)

(

)

(

)

(

u

av

u

qv

u

tv

…(10)

4. 評 価

4.1 レポータとハッシュタグ検 索 の比 較

4.1.1 実 験 方 法 と結 果

本 システムが推 薦 するレポータについて定 量 的 に評 価 す るため、2013 年 5 月 26 日 に行 われたソフトバンク対 ヤクルト のプロ野 球 の試 合 を対 象 とした実 験 を行 った。システムに与 え る ク エ リ と し て ソ フ ト バ ン ク ホ ー ク ス の ハ ッ シ ュ タ グ で あ る 「#sbhawks」を用 いた。本 実 験 における量 の評 価 手 法 は、ツ イートの投 稿 時 刻 を考 慮 しない式 (5)の計 算 式 を用 いた。具 体 的 な実 験 手 順 を以 下 に示 す。 (1) 試 合 当 日 の午 後 8 時 55 分 に、システムに「#sbhawks」 をクエリとして入 力 し、推 薦 レポータ、上 位 5 名 をフォロ ーする。 (2) フォローを開 始 してから 30 分 間 で(1)の推 薦 レポータ 5 名 が発 信 したツイート全 41 件 を推 薦 レポータグループ の評 価 対 象 ツイートとする。

(6)

(3) (2)と同 じ時 間 範 囲 内 において、ハッシュタグ「#sbhawks」 が付 加 されたツイート全 157 件 を(2)のツイート数 と揃 え るめに等 間 隔 で間 引 いたツイート 41 件 を比 較 評 価 のベ ースラインとなるツイート集 合 とする。 (4) 上 記 で得 られた計 82 件 のツイートに関 して、被 験 者 5 名 にアンケートを実 施 した。 アンケートの内 容 は、「あな たがこの試 合 の状 況 をリアルタイムに知 りたい場 面 を想 定 し、それぞれ のツイートを 読 んだと きにそれが 試 合 状 況 の情 報 を十 分 伝 えているかを 5 段 階 で評 価 してくだ さい」というものである。評 価 基 準 は、 1 が『不 必 要 な情 報 、出 てこないほうが良 い』、3 が『どちらでもない。出 て きても出 てこなくも構 わない』、5 が『有 益 なツイート、試 合 状 況 に 関 する情 報 を 十 分 に伝 えている ツイート』とし た。また、それぞれのツイートが(2)のレポータによるもの か (3) のハッシ ュタグ 検 索 から 得 られ たも のかは 被 験 者 に知 らせないようにした。 アンケートによる評 価 実 験 の結 果 を表 1 に示 す。各 項 目 の 値 は 、 そ れ ぞ れ の 被 験 者 が 全 ツ イ ー ト に 対 し て 評 価 し た 値 の平 均 値 を示 している。ここで示 されるように、レポータが 発 信 したツイートへの評 価 値 はハッシュタグ検 索 で得 られた ツイートへの評 価 値 を上 回 っている。評 価 値 に対 して T 検 定 を行 ったところ、p=2.24*10^(-12)<0.05 となり有 意 差 があ ると判 断 された。 表 1 得 られたツイートに対 する評 価 レポータ ハッシュタグ 被 験 者 A 3.02 2.25 被 験 者 B 3.34 2.28 被 験 者 C 3.17 2.5 被 験 者 D 3.18 2.33 被 験 者 E 3.25 1.72 平 均 3.19 2.22 次 に、システムが行 なう質 的 評 価 の手 法 が適 切 であるかに ついて検 討 する。図 8 に、システムがレポータにつけた質 的 評 価 値 と、被 験 者 がレポータにつけた質 的 評 価 値 (候 補 者 のツイートの評 価 の平 均 値 )を比 較 した図 を示 す。 図 8 質 的 評 価 の 比 較 この図 において、正 の相 関 がとれれば理 想 であるが、実 際 の相 関 係 数 は-0.11 であり、システムはレポータのツイートの 質 を正 しく評 価 できていないと考 えられる。つまり、ツイートの 質 を評 価 する方 法 としてツイートに含 まれる関 連 語 の数 を計 るだけでは不 十 分 であると言 える。そこで、ツイートの文 字 数 と、被 験 者 がつけた評 価 値 に相 関 があるか調 べた。その結 果 を図 9 に示 す。このグラフでは、相 関 係 数 が 0.81 となっ ている。つまり、ツイートの文 字 数 が多 いものほど、被 験 者 は 質 の高 いツイートであると評 価 する可 能 性 が高 いことを示 す。 従 って、今 後 は本 システムにおける質 の評 価 基 準 としてツイ ート文 字 数 も考 慮 することを検 討 したい。 図 9 ツ イ ー ト 文 字 数 と 評 価 の 比 較

4.2 量 の評 価 手 法 の比 較

次 に 、量 の 評 価 手 法 に つ い て の 比 較 実 験 を 行 っ た 。対 象 と し た イ ベ ン ト は 2014 年 2 月 に 行 わ れ た オ リ ン ピ ッ ク 競 技「 ハ ー フ パ イ プ 」、及 び 同 月 に 起 き た 阪 急 京 都 の 運 行 ト ラ ブ ル で あ る 。 実 験 を 行 っ た 時 間 帯 は そ れ ぞ れ の イ ベ ン ト が 行 わ れ て い る (起 こ っ て い る )最 中 と し 、 シ ス テ ム に あ た え た ク エ リ は「 ハ ー フ パ イ プ 」、及 び「 阪 急 京 都 」で あ る 。実 験 の 主 な 手 順 は 4.1 と 同 じ で あ る 。 本 実 験 の 目 的 は 量 の 評 価 手 法 の 改 善 で あ り 、 す な わ ち よ り 多 く の ツ イ ー ト を す る 確 率 の 高 い ユ ー ザ を 推 定 す る こ と で あ る 。 従 っ て 、 フ ォ ロ ー 後 に 発 言 し た ツ イ ー ト 数 の み を 比 較 検 討 し た 。 図 10 に ツ イ ー ト 投 稿 時 刻 を 考 慮 し な い 量 の 評 価 値 (式 (5))と そ の レ ポ ー タ が 直 後 15 分 間 で 発 言 し た ツ イ ー ト 数 を 比 較 し た グ ラ フ を 示 す 。 こ の グ ラ フ に お い て 、 相 関 係 数 は 0.36 で あ っ た 。 次 に 、図 11 に ツ イ ー ト投 稿 時 刻 を 考 慮 し た 量 の 評 価 値 (式 (7))と そ の レ ポ ー タ が 直 後 15 分 間 で 発 言 し た ツ イ ー ト 数 を 示 す 。こ の グ ラ フ の 場 合 だ と 、相 関 係 数 は 0.57 と な り 、 図 10 の 相 関 係 数 よ り も 大 き く 向 上 し た 結 果 と な っ た 。 こ の こ と よ り 、 量 の 評 価 に お い て ツ イ ー ト 投 稿 時 刻 を 考 慮 し た 計 算 式 (7)の 方 が 、直 後 に ツ イ ー ト を す る 確 率 の 高 い ユ ー ザ を 推 定 で き る と 言 え る 。 0 1 2 3 4 5 0 0.1 0.2 0.3 0.4 0.5 被験者による評価値 システムによる評価値 0 1 2 3 4 5 6 0 50 100 150 評価 文字数

(7)

図 10 ツ イ ー ト 時 刻 を 考 慮 し な い 量 の 評 価 値 と レ ポ ー タ の ツ イ ー ト 数 図 11 ツ イ ー ト 時 刻 を 考 慮 す る 量 の 評 価 値 と レ ポ ー タ の ツ イ ー ト 数

4.3 考 察

今 回 の実 験 で、レポータが発 言 するツイートとハッシュタグ 検 索 で得 られるツイートをそれぞれ被 験 者 5 名 に評 価 しても らっ た 結 果 、 提 案 手 法 で あ る 前 者 の 方 が 有 益 な ツ イ ー ト を 多 く含 むという結 果 を得 ることができた。 一 方 で、システムが レポータを選 定 する基 準 の 1 つである質 の評 価 については 十 分 適 切 に行 われていないことがわかった。これに対 する改 善 策 として、候 補 者 のツイートの文 字 数 やリツイート数 、リプ ライ数 を新 たな尺 度 に 加 えることを検 討 している。さらに、ツ イート自 体 の評 価 だけでなく、候 補 者 自 身 のプロファイルで あるフォロー数 やフォロワー数 も評 価 基 準 として利 用 できると 考 えられる。これらの要 素 を新 たに加 えることにより、さらなる レポータ選 別 精 度 向 上 を検 討 したい。

5. 結 論

本 研 究 では、Twitter を利 用 して実 世 界 イベントに関 する 情 報 をリアルタイムに取 得 したいという要 求 を満 たすため、 イ ベン ト に 関 して 有 益 な 情 報 を 頻 繁 に 発 信 し て いるユ ー ザ を レポー タと して 発 見 す るこ と で、 ア ドホ ッ クな フォ ロー ネ ッ ト ワ ークを自 動 的 に構 成 するシステムを制 作 した。従 来 手 法 とし て、ハッシュタグを用 いることで実 世 界 イベント 情 報 をリアル タイムに取 得 する方 法 が存 在 する。しかし、ハッシュタグの付 加 はツイート発 信 者 の任 意 であるため、ハッシュタグが付 加 されたツイートの情 報 量 ・有 益 性 が 保 証 されていないといっ たことや、継 続 的 な情 報 取 得 を行 う場 合 、検 索 要 求 を何 度 も繰 り返 す必 要 があるといった欠 点 が挙 げられる。 評 価 実 験 では、このハッシュタグ検 索 で得 られるツイート と推 薦 レポー タ 5 名 の発 言 するツイート、それぞれの有 益 性 を被 験 者 に 評 価 してもらった結 果 、提 案 手 法 である後 者 のツイートの方 が有 益 なツイートを 多 く 含 む という結 果 が 得 られた。また、T 検 定 に よ っ て 評 価 の 平 均 値 に 有 意 差 が あ るこ と を 示 す こ と ができた。

文 献

[1] 若 宮 翔 子 , 李 龍 , 角 谷 和 俊 : Twitter-based TV Audience Behavior Estimation for Better TV Ratings, DEIM Forum (http://db -event.jpn.org/deim2011/), 2011

[2] Bernard J. Jansen, Mimi Zhang, Kate Sobel, Abdur Chowdury:Twitter Power - Tweets as ElectronicWord of Mouth, Journal of the American Society for Information Science and Technology, Vol.60, Pages 2169-2188, 2009

[3] Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo : Earthquake Shakes Twitter Users - Real-time Event Detection by Social Sensors, WWW '10 Proc. of the 19th international conference on WWW, Pages 851-860, 2010

[4] 荒 牧 英 治 , 増 川 佐 知 子 , 森 田 瑞 樹 : Twitter Catches The Flu - Detecting Influenza Epidemics using Twitter, EMNLP '11 Proc. of the Conference on Empirical Methods in Natural Language Processing, Pages 1568-1576, 2011

[5] 杉 谷 卓 哉 :Twitter における投 稿 メッセージの時 空 間 的 局 所 性 の 解 析 に よ る ロ ー カ ル イ ベ ン ト 検 出 手 法 , DICOMO2012(http://www.dicomo.org/), Pages 1704 – 1711, 2012

[6] Huberman, Bernardo A., Romero, Daniel M. and Wu, Fang, Social Networks that Matter: Twitter Under the Microscope (December 5, 2008). Available at SSRN: http://ssrn.com/abstract=1313405 or

http://dx.doi.org/10.2139/ssrn.1313405

[7] Danah boyd, Scott Golder, Gilad Lotan. Tweet, Tweet, Retweet: Conversational Aspects of Retweeting on Twitter. 43rd Hawaii International Conference on System Sciences (HICSS), 2010.

[8] T. Joachims. Text categorization with support vector machines. In Proc. ECML’98, pages 137–142, 1998. 0 2 4 6 8 10 0 100 200 300 0 2 4 6 8 10 0 20 40 60

図   10  ツ イ ー ト 時 刻 を 考 慮 し な い 量 の 評 価 値 と レ ポ ー タ の ツ イ ー ト 数 図   11  ツ イ ー ト 時 刻 を 考 慮 す る 量 の 評 価 値 と レ ポ ー タ の ツ イ ー ト 数 4.3 考 察   今 回 の実 験 で、レポータが発 言 するツイートとハッシュタグ 検 索 で得 られるツイートをそれぞれ被 験 者 5 名 に評 価 しても らっ た 結 果 、 提 案 手 法 で あ る 前 者 の 方 が 有 益 な ツ イ ー ト

参照

関連したドキュメント

究機関で関係者の予想を遙かに上回るスピー ドで各大学で評価が行われ,それなりの成果

る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity

攻撃者は安定して攻撃を成功させるためにメモリ空間 の固定領域に配置された ROPgadget コードを用いようとす る.2.4 節で示した ASLR が機能している場合は困難とな

また適切な音量で音が聞 こえる音響設備を常設設 備として備えている なお、常設設備の効果が適 切に得られない場合、クラ

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

えて リア 会を設 したのです そして、 リア で 会を開 して、そこに 者を 込 ような仕 けをしました そして 会を必 開 して、オブザーバーにも必 の けをし ます

AMS (代替管理システム): AMS を搭載した船舶は規則に適合しているため延長は 認められない。 AMS は船舶の適合期日から 5 年間使用することができる。

ASTM E2500-07 ISPE は、2005 年初頭、FDA から奨励され、設備や施設が意図された使用に適しているこ