• 検索結果がありません。

sig sai 2013 03 11 1 Recent site activity jsaisigsai

N/A
N/A
Protected

Academic year: 2018

シェア "sig sai 2013 03 11 1 Recent site activity jsaisigsai"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

マイクロブログにおけるデマの拡散過程の分類と

拡張 SIR モデルに基づく解析

SIR-Extended Information Diffusion Model of False Rumor

and its Prevention Strategy for Twitter

岡田 佳之

1∗

榊 剛史

2

鳥海 不二夫

2

篠田 孝祐

3

風間 一洋

4

野田 五十樹

5

沼尾 正行

6

栗原 聡

6

Okada Yoshiyuki

1

, Takeshi Sakaki

2

, Fujio Toriumi

2

, Kosuke Shinoda

3

,

Kazuhiro Kazama

4

, Itsuki Noda

5

, Masayuki Numao

6

and Satoshi Kurihara

6

1

大阪大学 工学部 応用自然科学科

1

Division of Applied Science, Gradate School of Engineering, Osaka University

2

東京大学

2

Tokyo University

3

理化学研究所

3

RIKEN

4

和歌山大学

4

Wakayama University

5

産業技術総合研究所

5

National Institute of Advanced Industrial Science and Technology

6

大阪大学 産業科学研究所

6

The Institute of Scientific and Industrial Research, Osaka University

Abstract: Twitter is a famous social networking service and has received attention recently. Twitter user have increased rapidly, and many users exchange information. When 2011 Tohoku earthquake and tsunami happened, people were able to obtain information from social networking service. Though Twitter played the important role, one of the problem of Twitter, a false rumor diffusion, was pointed out. In this research, we focus on a false rumor diffusion. We propose a information diffusion model based on SIR model, classify the way of diffusion in four categories, and reapper the real diffussion by using this new model.

1 はじめに

現在,インターネットの発展に伴い,Facebook1や Twitter2といったソーシャル・ネットワーキング・サー ビス(SNS)と呼ばれるサービスが話題を呼んでいる. これらは,一般の個人であっても簡単に情報を投稿や 収集ができることから,災害時など様々な形で活用さ れ,人々の暮らしに欠かせないものとなっている.[9].

しかしながら,SNS にはいくつかの問題点も挙げら れる.そのひとつが,デマ情報(本論文ではデマを「根

連絡先:大阪大学産業科学研究所沼尾研究室       〒567-0047 大阪府茨木市美穂ヶ丘 8-1       E-mail: okada@ai.sanken.osaka-u.ac.jp

1http://www.facebook.com/

2http://twitter.com/

拠が無く,後に誤りを指摘する内容の情報が発表され た情報」と定義する)の拡散である.実際に,東日本 大震災時に緊急の情報を発信する手段として活躍した Twitter であるが,大震災直後の混乱した状況とも相 まって,非常に多くのデマ情報が広がってしまうこと となった.

そこで,本研究では,東日本大震災時においてTwit- ter 上で実施に拡散した数例のデマに対し,拡散過程 の解析,デマ拡散のモデル化,そしてそのモデルの検 証を行った.拡散モデルの構築に際し,病気の感染モ デルとして有名なSIR モデルを拡張させた.解析の結 果からは,デマ拡散過程は4 つに分類できることが分 かった.そして今回分類した4 種類のデマ拡散過程の 中でも,デマならびにデマ訂正情報の拡散のピークが

(2)

それぞれ1 回のみの事例において,提案モデルによる, 現実の拡散過程の再現を試みた.その結果,提案モデ ルは現実のを拡散過程を高精度で再現することができ, その妥当性を確認することができた.

2 関連研究

近年,SNS,特に Twitter を対象とした研究が盛ん に行われるようになった.

Twitter を対象とした研究のひとつに,Twitter の ユーザーによって構築されるネットワークの特徴を分 析した研究がある.Huberman らはフォロワーとツイー ト投稿数の関係を調べるだけでなく,Twitter 上にて 2 回以上直接やり取りを行った相手ユーザーを知り合いで あるとみなし,知り合いの数とフォロワーの関係や,知 り合いの数とツイート投稿数の関係も調べており,ユー ザーのフォロワーの多さが知り合いの多さにつながる とは限らないと結論付けている[5].Akioka らは日本の Twitter ユーザーを対象に,フォロー数やフォロワー数 の分布を調べた[1].また,Akioka らはこれに加えて Twitter ユーザーの増加の原因と,Twitter のサービス の拡張や他メディアでのTwitter の露出との関連を調 べている.Kawk らは Twitter ネットワークとツイー ト,リツイートの関係について調べている[7].Kawak らは他メディアのネットワークと比較し,Twitter ネッ トワークが他の社会ネットワークとは異なる特徴を持 つことを示した.鳥海らは東日本大震災前後に投稿さ れたツイートから,直接やり取りを行ったユーザーの ネットワークを作成し,震災の前後でネットワークが どのように変化したかを調べた[10].

情報拡散に関する研究も行われている.Weng らは情 報拡散に寄与するTwitter ユーザーの識別方法として, 従来の重要度を測るアルゴリズムであるPageRank を 拡張した,Twitter ネットワークにてしばしば見られ る同類性を考慮したTwitterRank を提案している [12]. Balshy らは口コミなどの商業的観点から URL を含む ツイートの拡散に着目し,拡散の起点となったユーザー の特徴やツイートに含まれるURL のリンク先の内容 と,情報が拡散する範囲の関係などについて調べてい る[3].

Twitter 上を流れる情報の信頼性についても研究が 行われている.Castillo らは,投稿されたツイートの長 さや主題,ツイートを投稿した各種ユーザーの特徴か ら,ツイートの内容の信頼度を算出する手法を提案し ている[4].梅島らはデマツイートに見られる傾向を把 握するため,東日本大震災時に多くのユーザーにリツ イートされたツイートを分析し,デマツイートが持つ 特徴を調べている[11].

Marcelo らは,流れてきた情報に対する信頼度を図

るべく,チリ地震時のツイートを調べ,デマと真実で は伝播の仕方が異なることを発見した[14].

しかしながらデマツイートの拡散に着目すると,Castillo らや梅島らによれば完全にデマかどうかを判別するこ とができないことに加え,情報拡散の研究は行われて いるものの,情報の収束を対象とした研究は行われて いない.

3 デマ情報・訂正情報拡散モデル

3.1 SIR モデル

SIR モデルは Kermack らによって提案された,伝染 病拡散の数理モデルのひとつである[6][8].

SIR モデルではある集団に属する人を,健常者(S), 感染者(I),回復者(R)の3 種類に分類する.このモ デルでは,S の人は I の人と接触することにより,感

染率ρ(S→I)に従って病気に感染し,I に変化する.I

の人は治癒速度ρ(I→R)に従い,病気を治癒し免疫を獲 得し,R に変化する.時間 t における S の人数を S(t), I の人数を I(t),R の人数を R(t) とすると,時間の経 過によるS,I,R の人数の変化は式1 で表される.







 dS(t)

dt = −ρ(S→I)I(t)S(t) dI(t)

dt = ρ(S→I)I(t)S(t) − ρ(I→R)I(t)

dR(t)

dt = ρ(I→R)I(t)

(1)

集団の全人数N は,N = S(t) + I(t) + R(t) で一定で ある.

3.2 病気と情報の伝播の違い

SIR モデルを情報拡散に適用するにあたり,病気と 情報の伝播について以下の点が挙げられる.

R になる条件

病気の伝染の場合,病気は投薬や自己治癒力により 時間経過とともに収束する.一方でデマ情報の場合,訂 正情報を受け取ることで,ようやくデマとして認識され るため,時間経過のみによるI から R への変化は無い.

訂正情報の拡散

デマ情報だけでなく訂正情報もSIR モデルにおける 病気であるとみなすことができ,デマ情報と訂正情報 の両方が拡散する様子を記述する必要がある.

(3)

S,I,R 以外の状態

デマ情報を受け取った人は,必ずしもデマを拡散さ せるとは限らない.デマを見ても放置する人もいる.モ デルにはこの区別を反映させねばならない.これは後 に訂正情報が拡散した場合,デマ拡散の事実を知らな かった人(S),デマ拡散の事実を知っていたが拡散さ せなかった人(Igetとする),デマを拡散させた人(I) では,再びデマ情報を取得した場合や,新しく訂正情 報を得た場合の振る舞いが異なると考えられるためで ある.

3.2.1 デマ情報・訂正情報拡散モデルの構築 以上の違いを踏まえたうえで,SNS におけるデマ情 報・訂正情報の拡散のモデル化を行う.ユーザーのデ マに対する感染状態を,次のように定める.

• S:デマ情報,訂正情報の両方を見たことがない 状態.

• Iget:デマ情報のみを見たことがある状態.訂正 情報はまだ見ていない.

• I:デマ情報を投稿した状態.訂正情報はまだ見 ていない.

• Rget:訂正情報を見たことがある状態.

• R:訂正情報を投稿した状態.

RgetR のユーザーは,S,IgetI に変化すること は無いものとする.各感染状態における感染率をρ(S→I)

(S のユーザーがデマ情報を見たときに,I となる確率), ρ(Iget→I)ρ(S→R)ρ(Iget→R)ρ(I→R)ρ(Rget→R)

する.全ユーザー数をN ,全ユーザーの友人(フォロ ワー)の平均人数をF とする.また,ある時間 t におけ るS,IgetI,Rget,R の人数を S(t),Iget(t),I(t), Rget(t),R(t) とする.さらに,ユーザーが投稿した情 報を,全ての友人が見たと仮定する.SNS でのデマ拡 散の場合も,デマ情報の感染速度はSIR モデル同様 S の人数に比例する.しかしSNS では,あるユーザーが 投稿した文章は,基本的にそのユーザーの友人しか見 ることはない.このため,デマの感染速度は,各ユー ザーのI 以外の状態である友人の数に比例する.以上 から,訂正情報がまだ一度も投稿されていない状況で は,感染状態は式2 のように記述できる.























 dS(t)

dt = − F

NI(t)S(t) dIget(t)

dt = (1 − ρ(S→I)) F

NI(t)S(t)

−ρ(Iget→I)

F

NIget(t)I(t) dI(t)

dt = ρ(S→I) F

NI(t)S(t)(Iget→I)F

NIget(t)I(t)

(2)

同様に,デマ情報と訂正情報の両方が拡散している 場合,感染状態は式3 のように記述できる.

























































































 dS(t)

dt = − F

NI(t)S(t) − F

NR(t)S(t) dIget(t)

dt = (1 − ρ(S→I)) F

NI(t)S(t)

−ρ(Iget→I)

F

NIget(t)I(t)

− F

NIget(t)R(t) dI(t)

dt = ρ(S→I) F

NI(t)S(t)(Iget→I)F

NIget(t)I(t)

− F

NI(t)R(t) dRget(t)

dt = (1 − ρ(S→R)) F

NR(t)S(t) +(1 − ρ(Iget→R))

F

NIget(t)R(t) +(1 − ρ(I→R))

F

NI(t)R(t)

−ρ(Rget→R)

F

NRget(t)R(t) dR(t)

dt = ρ(S→R) F

NR(t)S(t)(Iget→R)

F

NIget(t)R(t)(I→R)F

NI(t)R(t)(Rget→R)

F

NRget(t)R(t)

(3)

4 ツイートの収集と分析

4.1 ツイート収集手順

本研究では,提案モデルによる現実の拡散状況の再 現性を図るべく,SNS のうち,特に拡散速度が速いと いわれているTwitter に焦点を当てた.鳥海らの東日 本大震災前後におけるTwitter ネットワークの変化に 関する研究[10] にて収集されたツイートのうち,2011 年3 月 11 日∼2011 年 3 月 24 日の間に投稿されたツ イートを対象とし,その中から,あるデマに言及して いるデマツイートおよび訂正ツイートを抽出し,分析 を行った.なお,ツイートだけでなく,2011 年 1 月 30 日におけるユーザーのフォローの状況(フォローネッ トワーク)も得た.

デマツイートおよび訂正ツイートの抽出は表1 に示 す手順で行った.以下に,本論文にて用いる単語の定 義を示す.

• 必須キーワード:ある特定のデマに必ず含まれて いるべきキーワード.

• ネガティブキーワード:ある特定のデマについて, デマツイートに含まれるキーワード.

(4)

表1: デマツイートおよび訂正ツイートの抽出手順 Step1:実際に拡散したデマをひとつ選択する. Step2:ツイートがそのデマに言及しているかどう

かを判別する基準として,デマの内容から 必須キーワードを設定する.

Step3:必須キーワードでツイートの検索を行い, デマに関する情報を含むと思われるツイー ト(候補ツイートデータ)を全て抽出する. Step4:候補ツイートデータから,RT 数が多いデ

マツイートと訂正ツイートを複数選択する. Step5:選択したデマツイート,訂正ツイートから,

ネガティブキーワード,ポジティブキーワ ードを設定する.

Step6:必須キーワード,ネガティブキーワード, ポジティブキーワード全てを用いて検索を 行い,候補ツイートデータから,デマ・訂 正ツイートデータを抽出する.

Step7:必須キーワード,ポジティブキーワードを 用いて検索を行い,デマ・訂正ツイートデ ータから,マツイートデータと訂正ツイー トデータを分離する.

• ポジティブキーワード:ある特定のデマについて, 訂正ツイートに含まれるキーワード.

• 候補ツイートデータ:全ツイートデータのうち, 必須キーワードを含むツイートの集合.

• デマ・訂正ツイートデータ:候補ツイートデータ のうち,ネガティブおよびポジティブキーワード を含むツイートの集合.

• デマツイートデータ:デマ・訂正ツイートデータ のうち,ポジティブキーワードを含まないツイー トの集合.

• 訂正ツイートデータ:デマ・訂正ツイートデータ のうち,ポジティブキーワード1 つ以上を含むツ イートの集合.

以下,第4.2∼4.8 節にて,今回対象としたデマ内容, 収集ツイート数,ツイート収集に用いたキーワード群, デマおよび訂正ツイート数の時間推移,そしてデマお よび訂正ツイートの全投稿者を対象とした,感染状態 別の人数の推移を順に掲載する.

4.2 コスモ石油に関するデマ

東日本大震災直後,千葉県市原市のコスモ石油の千 葉製油所にて火災が発生した.これに関連して「コス モ石油の爆発により有害物質が雲などに付着し,雨な どといっしょに降る」といった内容のチェーンメール が出回った.

表2: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(コスモ石油)

デマツイート数 9,652 訂正ツイート数 25,883

必須キーワード コスモ石油,有害物質 ネガティブキー

ワード

傘,カッパ,レインコート

ポジティブキー ワード

デマ,ガセ,嘘,誤,偽,否定,無害, チェーンメール,チェンメ,事実,ない, ありません

図1: コスモ石油に関するデマ:ツイート数の変化 (右) とユーザーの状態変化(左)

4.3 節電に関するデマ

福島第一原子力発電所の事故の影響により,東京電 力の管轄の地域において電力不足が懸念される事態と なった.この際に流れたのが,「関東地区に電力の融通 を行うため,他の地域でも節電をするのがよい」といっ た内容のデマであった.

表3: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(節電)

デマツイート 15,373 訂正ツイート 29,819 必須キーワード 関西,節電 ネガティブキー

ワード

友達,送電,提供,らしい,少し,お願

ポジティブキー ワード

デマ,注意,チェーンメール,チェンメ, 周波数,Hz,関西電力,関電,ウェブ, HP,ホームページ,意味,必要,ない

図2: 節電に関するデマ:ツイート数の変化 (右) とユー ザーの状態変化(左)

(5)

4.4 ヨウ素に関するデマ

福島第一原子力発電所の事故の影響により,放射性 物質が放出されることとなった.この事実に関連した デマが,「放射性ヨウ素の被害を防ぐため,うがい薬や とろろ昆布などに含まれるヨウ素が良い」というもの である.

表4: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(ヨウ素)

デマツイート 6,300 訂正ツイート 20,050 必須キーワード ヨウ素 ネガティブキー

ワード

とろろ,昆布,食,飲

ポジティブキー ワード

デマ,誤,いけません,根拠,ない

図 3: ヨウ素に関するデマ:ツイート数の変化 (右) と ユーザーの状態変化(左)

4.5 トルコに関するデマ

東日本大震災直後から,各国から哀悼の意が寄せら れ,義援金や救助隊派遣といったかたちで支援の動き が相次いでいた.その流れの中で,インターネット上 では「トルコが日本に100 億円寄付」という情報が出 回っていた.トルコ赤新月社(赤十字に相当)による 緊急救助隊の派遣や,同国外相による支援表明は事実 であるが,100 億円の寄付という事実は存在しない.

表5: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(トルコ)

デマツイート 1,174 訂正ツイート 1,579

必須キーワード トルコ,100 ネガティブキー

ワード

寄付,支援

ポジティブキー ワード

うそ,ウソ,嘘,デマ,ガセ,流言,飛

図 4: トルコに関するデマ:ツイート数の変化 (右) と ユーザーの状態変化(左)

4.6 台湾に関するデマ

東日本大震災直後から,各国から哀悼の意が寄せら れ,義援金や救助隊派遣といったかたちで支援の動き が相次いでいた.その流れの中で,Twitter 上では「日 本政府が台湾からの義援金を拒否した」という情報が 出回っていた.この情報にはソース元のURL が貼られ ていることが多く,信憑性が高まったことにより拡散 が助長された.

表6: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(台湾)

デマツイート 1,746 訂正ツイート 1,147 必須キーワード 政府,台湾 ネガティブキー

ワード

拒,断,援助,支援,義捐,億,金

ポジティブキー ワード

ガセ,でま,デマ,偽,ニセ,ソース, 公式,確,間違,まちが,不確,ほんと, 本当,ホント,?

図5: 台湾に関するデマ:ツイート数の変化 (右) とユー ザーの状態変化(左)

4.7 ポケモンに関するデマ

東日本大震災では多数の死者が出た.電話が通じな い中で,Twitter は安否情報の確認のために用いられ, 活躍したことが知られている.その中でも,著名な人 物に関わるものは広く一般の人々の興味を引いた.そ の代表例が「人気ゲームソフトであるポケットモンス ターのクリエイターが津波の犠牲になり,亡くなった.」 というものだ.

(6)

表7: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(ポケモン)

デマツイート 305 訂正ツイート 1,344 必須キーワード ポケモン ネガティブキー

ワード

津波,亡,死,犠牲,冥福

ポジティブキー ワード

ガセ,でま,デマ,偽,ニセ,ソース, 公式,確,間違,まちが,本当,流れて ない,死んでない,亡くなってない,勘 違い,伝言ゲーム,任天堂,否定,早と ちり,生存,生きて,元気

図 6: ポケモンに関するデマ:ツイート数の変化 (右) とユーザーの状態変化(左)

4.8 フジテレビに関するデマ

被災地の人々のために,マスコミをはじめ,様々な ところで募金活動が行われていた.その中で広まった デマが「フジテレビへ募金するとそのお金は日本ユニ セフへ向かう.」というものだ.この情報に関するソー スは存在せず,実際に震災直後のフジテレビのテレビ 番組にて行われた募金の案内表示でも他局と同じく日 本赤十字社が送金先となっている.

表8: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード(フジテレビ)

デマツイート 1,888 訂正ツイート 618 必須キーワー

フジテレビ,日本ユニセフ

ティブ キーワード

募金,金

ティブ キーワード

日赤,日本赤十字,うそ,ウソ,嘘,ガ セ,でま,デマ,偽,ソース,公式,確, 勘違い,早とちり

図7: フジテレビに関するデマ:ツイート数の変化 (右) とユーザーの状態変化(左)

5 デマおよびデマ訂正情報の拡散傾

向に基づく分類

第4 章で示した,各デマテーマにおけるデマツイー ト数およびデマ訂正ツイート数の時系列データのグラ フを基に,デマツイートおよびデマ訂正ツイートの,拡 散期間と拡散時期という2 つの観点から,それらのツ イートの拡散傾向を以下の4 つに大別した.

• 一発非同時型… コスモ石油 (図 4.2), トルコ (図 4.5), 台湾 (図 4.6)

• 一発同時型… ポケモン (図 4.7), フジテレビ (図 4.8)

• 複数非同時型… ヨウ素 (図 4.4)

• 複数同時型… 節電 (図 4.3) 今回行った分類を図8 に示す.

図 8: デマツイートおよびデマ訂正ツイートの拡散傾 向に基づく分類

6 シミュレーションによる検証

6.1 シミュレータ

本研究では,Twitter ネットワークにおけるデマツ イートおよびデマ訂正ツイートの拡散モデルの検証を 行うため,シミュレータを作成した.シミュレータの 主な仕様は以下の通りである.また,シミュレーショ ン1 ステップで実行される処理を表 9 に示す.

• ノードの設定

予め指定したノード数に従い,Twitter における ユーザーにあたる,ノードを生成する.各ノード にはそれぞれ,感染状態,リンク数の期待値,リ ンクされやすさのパラメータが与えられる.感染

(7)

状態の初期状態はS とする.リンク数の期待値, リンクされやすさの2 つのパラメータは,パレー ト分布に従う乱数により生成する.[12].

• リンクの設定

リンクはフォロー・フォロワーの関係に相当し, 有向である.ノードi がノード j をリンクするか どうかは,ノードi のリンク数の期待値と,ノー ドj のリンクされやすさによって決定される.

• ノードの感染状態と感染率

各ノードには,感染状態の状態遷移確率である,感 染率としてρ(S→I)ρ(I

get→I)ρ(S→R)ρ(Iget→R)

ρ(I→R)ρ(Rget→R)を設定する.

• 計算ステップ

シミュレーションでは,時間の単位としてシミュ レーション実行ステップ数t を用いる.

表 9: シミュレーション 1 ステップにおけるプロセス Process1:感染状態の状態遷移を行う.前ステップの

結果に従い,各ノードの状態を決定する. Process2:Process1 にて状態が I または R に変化し

たノードのフォロワーについては,各状態 における感染率に従い,次ステップ開始時 に遷移する感染状態を決定する.

6.2 シミュレーション環境の設定

今回シミュレーションにて用いたネットワークのパ ラメータは表10 の通りである.また,これらのパラ メータに従って生成したノードの,リンク数の分布を 図9 および図??に示す.なお,全てのシミュレーショ ンで同じネットワークを用いた.

表10: シミュレーション:ネットワークのパラメータ ノード数 50,000

リンク数の期待値 上 限 =30,00,下 限 =10,パ レート指数=0.5

リンクされやすさ 上 限 =15.0,下 限 =0.05,パ レート指数=0.5

本研究では第5 章で述べた四つの分類のうち,一発 非同時型と一発同時型の二つについてシミュレーショ ンを行う.この両一発型のシミュレーションを行うに あたり,簡単のため,各ノードの情報拡散の行動につ いて,以下の条件を設定する.

0 5000 10000 15000 20000 25000 30000 35000 40000

100 200

300 400

500 600

700 800

900 1000

1100 1200

1300 1400

1500 1600

1700 1800

1900 2000

2100 2200

2300 2400

2500 2600

2700 2800

2900 3000 リンク(フォロー)している数

図 9: 各ノードのフォロー数の分布

• 各ノードは,デマおよび訂正ツイートをそれぞれ 1 回ずつのみ投稿することができる.

• 各ノードは,デマツイートを始めて受け取った際 にそれを拡散させなかった場合(Iget),他のユー ザーから再びデマツイートを受け取ったとしても 拡散は行わない(I に変化しない).訂正ツイー トについても同様である.

一発型のデマの場合,第4 節にて示したようにデマツ イート,訂正ツイートともに1 度だけ拡散していること が確認できる.このような場合では複数のデマツイー トや訂正ツイートを見るということはまれであり,例 えばIget から I への変化はとても少ないと考えられる. 本検証の前にコスモ石油のケースについてデマ情報・訂 正情報拡散モデルを用いた予備実験のシミュレーショ ンを行ったが,予備実験では57.6%のノードがデマ情 報を受け取った回数が1 回以下であったことから,シ ミュレーションにおいても複数のデマ情報を見たノー ドは少ないといえる.さらにツイートのデータからは ツイートを見ただけのユーザーの数を正確に把握でき ないということもあり,今回は,IgetRget は考慮せ ずにシミュレーションを行うこととした.

6.3 シミュレーションと結果 (一発非同時型)

6.3.1 一発非同時型デマに対する情報拡散モデルの 検証

第3.2.1 項で述べた Twitter における情報拡散モデル の検証のため,一発非同時に拡散するデマケースに対 してシミュレーションを行う.具体的には,第5 章にて 拡散傾向が一発非同時型であると定義した,コスモ石 油,トルコ,台湾の関するデマケースに対して,シミュ レーションを行う.それぞれのデマケースについて第 3.2.1 項にて定義した拡散率についてのパラメータを設 定し,シミュレーションを表11 に示す手順で行った.

(8)

表11: シミュレーション手順

Step1:第 6.2 節で述べたネットワークを読み込む. Step2:シミュレーション実行ステップ t = 1 のとき,

無作為に1 つのノードを選択し,感染状態を I に変更する.

Step3:t = 11 のとき,無作為に 1 つのノードを選択 し,感染状態をR に変更する.

Step4:t = 20 のとき,シミュレーションを終了する. 6.3.2 感染率の設定

第4 節での結果を元に,今回選択した三例のデマに ついて各種感染率を表12 のように設定した.

12: 感染率の設定

コスモ石油 トルコ 台湾

ρ(S→I) 0.05 0.05 0.06

ρ(Iget→I ) 0 0 0

ρ(S→R) 0.1 0.0375 0.0072

ρ(Iget→R) 0.1 0.0375 0.0072

ρ(I→R) 0.147 0.016 0.026 ρ(Rget→R) 0 0 0

6.3.3 シミュレーション結果

表11 の手順に従って 100 回シミュレーションを行っ た.ノードの感染状態別の数を図6.3.3∼図 10 に示す. シミュレーションと実データとの比較のために,図6.3.3

∼図10 にはそれぞれ図 4.2∼図 4.6 の一部も併記する.

図10: 各ノードの感染状態の変化のシミュレーション: コスモ石油(左上),トルコ (右上),台湾 (下)

これら三つの一発非同時に拡散するデマケースに対 し,第3.2.1 章で述べた Twitter における情報拡散モデ ルを用いたシミュレーションでは,実データに近い結 果が得られた.この結果から,一発被同時に拡散する デマに対し今回提案したモデルは,デマツイートやデ マ訂正ツイートの実際の拡散の様子を説明するに足る と考えられる.

6.4 シミュレーションと結果 (一発同時型)

6.4.1 一発同時型デマに対する情報拡散モデルの検証 第3.2.1 項で述べた Twitter における情報拡散モデル の検証のため,一発非同時に拡散するデマケースに対 してシミュレーションを行う.具体的には,第5 章に て拡散傾向が一発非同時型であると定義した,コスモ 石油,トルコ,台湾の関するデマケースに対して,シ ミュレーションを行う.それぞれのデマケースについ て第3.2.1 項にて定義した拡散率についてのパラメー タを設定し,シミュレーションを表11 と同様の手順で 行った.ただし,一発同時型では,I と R が同時期に 発生するので,今回は表11 における Step3 にて R の 発生ステップをI の発生するステップである t = 1 と 設定している.

6.4.2 感染率の設定

第4 章での結果を元に,今回選択した二例のデマに ついて各種感染率を表13 のように設定した.

13: 感染率の設定 ポケモン フジテレビ

ρ(S→I) 0.21 0.05

ρ(Iget→I) 0 0 ρ(S→R) 0.357 0.034 ρ(Iget→R) 0.357 0.034

ρ(I→R) 0.088 0.032 ρ(Rget→R) 0 0

6.4.3 シミュレーション結果

第6.4.1 項にて述べた手順に従い,100 回シミュレー ションを行った.ノードの感染状態別の数を図6.4.3, 図6.4.3 に示す.シミュレーションと実データとの比較 のために,図6.4.3,図 6.4.3 にはそれぞれ図 4.7,図 4.8 の一部も併記する.

図11: 各ノードの感染状態の変化のシミュレーション: ポケモン(左),フジテレビ (右)

(9)

これら二つの一発同時に拡散するデマケースに対し, 今回提案した情報拡散モデルを用いたシミュレーショ ンでは,実データに近い結果が得られた.この結果か ら,一発同時に拡散するデマに対し今回提案したモデ ルは,デマツイートやデマ訂正ツイートの実際の拡散 の様子を説明するに足ると考えられる.

7 まとめ

Twitter でのデマ情報の拡散を,伝染病の拡散モデル としてよく知られているSIR モデルを基礎とし,その 拡張を行った.モデルの検証として,東日本大震災直 後に実際にTwitter ネットワーク上を拡散したツイー トを解析し,これから得たパラメータを設定してシミュ レーションを行った.デマツイートおよびデマ訂正ツ イートの拡散の様子から,デマテーマによって拡散傾 向に違いがあることが判明し,その拡散傾向を一発非 同時型,一発同時型,複数非同時型,複数同時型の四 つに大別し,それぞれのデマテーマを分類し,実際の ツイートの拡散の様子とシミュレーションの結果を比 較し,この情報拡散モデルが実際のツイート拡散を再 現できることを確かめた.

今後の課題としては,複数回デマ情報や訂正情報の 拡散が起こる場合の,拡散を重ね合わせたモデルを構 築していくことが挙げられる.さらに,Twitter 以外の SNS にて拡散した情報についても,拡散の様子を再現 できるかどうかを確かめていく予定である.

謝辞

本研究を遂行するに当たり,Twitter 検索のログデー タを提供して頂いたクックパッド株式会社の兼山元太 氏に感謝致します.また,本研究は,現在NTT ネット ワークサービスシステム研究所に所属する白井嵩士氏 と共同で行ったものであり,ここに白井氏に感謝致し ます.

参考文献

[1] Sayaka Akioka, Norikazu Kato, Yoichi Muraoka, Hayato YamanaCross-media Impact on Twitter in Japan, Proceedings of the 2nd international work- shop on Search and mining user-generated contents, pp.111-118, 2010.

[2] Yasuyoshi Aosaki, Taro Sugihara, Katsuhiro Umem- otoExamining the Trend toward a Service Economy in Information Media through Changes to Technol- ogy: Influence of Twitter on Media Companies, Pro- ceedings of Technology Management for Global Eco- nomic Growth (PICMET) ’10, pp.1-5, 2010.

[3] Eytan Bakshy, Jake M. Hofman, Winter A. Mason, Duncan J. WattsEveryone’s an Influencer: Quanti- fying Influence on Twitter, Proceedings of the fourth ACM international conference on Web search and data mining, pp.65-74, 2011.

[4] Carlos Castillo, Marcelo Mendoza, Barbara Poblete Information Credibility on Twitter, Proceedings of the 20th international conference on World wide web, pp.675-684. 2011.

[5] Bernardo A. Huberman, Daniel M. Romero, Fang WuSocial networks that matter: Twitter under the microscope, First Monday, Vol.14, No.1, 2009. [6] W. O. Kermack, A. G. McKendrickA Contribution

to the Mathematical Theory of Epidemics, Proceed- ings of the Royal Society 115A, pp.700-721, 1927. [7] Haewoon Kwak, Changhyun Lee, Hosung Park, Sue

MoonWhat is Twitter, a Social Network or a News Media?, Proceedings of the 19th international confer- ence on World wide web, pp.591-600, 2010.

[8] 増田直紀,今野紀雄:複雑ネットワークの科学,産業図 , 2005.

[9] 総務省平成23年度情報通信白書, http://www.soumu. go.jp/johotsusintokei/whitepaper/ja/h23/pdf/index. html, 2011.

[10] 鳥海不二夫,篠田孝祐,栗原聡,榊剛史,風間一洋,野田 五十樹:震災がもたらしたソーシャルメディアの変化, JWEIN11, pp.41-46, 2011.

[11] 梅島彩奈,宮部真衣,荒牧英治,灘本明代災害時Twitter におけるデマとデマ訂正RTの傾向,情報処理学会研究 報告, Vol.2011-IFAT-103, No.4, pp.1-6, 2011. [12] Jianshu Weng, Ee-Peng Lim, Jing Jiang, Qi HeTwit-

terRank: Finding Topic-sensitive Influential Twitter- ers, Proceedings of the third ACM international con- ference on Web search and data mining, pp.261-270, 2010.

[13] 吉田光男,松本明日香:ソーシャルメディアの政治的活 活用事例と分析事例から—,人工知能学会誌, 27 1, pp.35-42, 2012.

[14] Marcelo MendozaBarbara PobleteCarlos Castillo Twitter Under CrisisCan we trust what we RT ? 1st Workshop on Social Media Analytics (SOMA 10)2010

表 1: デマツイートおよび訂正ツイートの抽出手順 Step1:実際に拡散したデマをひとつ選択する. Step2:ツイートがそのデマに言及しているかどう かを判別する基準として,デマの内容から 必須キーワードを設定する. Step3:必須キーワードでツイートの検索を行い, デマに関する情報を含むと思われるツイー ト(候補ツイートデータ)を全て抽出する. Step4:候補ツイートデータから,RT 数が多いデ マツイートと訂正ツイートを複数選択する. Step5:選択したデマツイート,訂正ツイートから, ネガテ
表 7: 収集ツイート数とネガティブキーワードおよびポ ジティブキーワード (ポケモン) デマツイート 305 訂正ツイート 1,344 必須キーワード ポケモン ネガティブキー ワード 津波,亡,死,犠牲,冥福 ポジティブキー ワード ガセ,でま,デマ,偽,ニセ,ソース,公式,確,間違,まちが,本当,流れて ない,死んでない,亡くなってない,勘 違い,伝言ゲーム,任天堂,否定,早と ちり,生存,生きて,元気 図 6: ポケモンに関するデマ:ツイート数の変化 (右) とユーザーの状態変化 (左) 4.8 フ

参照

関連したドキュメント

The input specification of the process of generating db schema of one appli- cation system, supported by IIS*Case, is the union of sets of form types of a chosen application system

Eskandani, “Stability of a mixed additive and cubic functional equation in quasi- Banach spaces,” Journal of Mathematical Analysis and Applications, vol.. Eshaghi Gordji, “Stability

The angular velocity decreases with increasing the material parameter, the slip parameter, the buoyancy parameter, and the heat generation parameter, while it increases with

Let X be a smooth projective variety defined over an algebraically closed field k of positive characteristic.. By our assumption the image of f contains

She reviews the status of a number of interrelated problems on diameters of graphs, including: (i) degree/diameter problem, (ii) order/degree problem, (iii) given n, D, D 0 ,

In Section 7 two-sided estimates of the mixed moduli of smoothness in terms of the Fourier coefficients are given. It is well known that these results are closely connected to

In this article we study a free boundary problem modeling the tumor growth with drug application, the mathematical model which neglect the drug application was proposed by A..

It is an interesting problem to find out criteria for normality of a family of analytic or meromorphic functions.. In recent years this problem attracted the attention of a number