• 検索結果がありません。

ヒット現象の数理モデル

N/A
N/A
Protected

Academic year: 2021

シェア "ヒット現象の数理モデル"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

: 5-20 (2015) 5   特集/つながるデータとひろがる地平

ヒット現象の数理モデル

  石井 晃(鳥取大学大学院 工学研究科 教授)   キーワード 社会物理学,確率過程,ソーシャルメディア,STAP 細胞,AKB 選抜総選挙 筆者の研究室で,ソーシャルメディアの書込の 分析を用いて最近 2 年続けて AKB 選抜総選挙の 予測に成功したことが話題にされている.2013 年には首位争いは大島優子と指原莉乃に限定され て渡辺麻友には可能性が無いことの予測が朝日新 聞(2013)で,2014 年は渡辺麻友が首位になる ことを読売新聞(2014),東京新聞(2014)で, それぞれ予測として開票前に報道されている.研 究としては選挙結果が出た後ゆっくり解析する予 定だったが,2013 年の選抜総選挙の時,朝日新 聞記者が訪ねてきて,結果発表前に予測を出すよ う依頼されたのが予測をするようになったきっか けである. この予測は,別に AKB ファンとして各メンバ ーの魅力を分析したものではなく,また,ソーシ ャルメディアの書込を回帰分析などのよく社会科 学で用いられる手法で分析したものでもない.こ の 2 年間の解析で AKB 選抜総選挙の上位の順位 予測をある程度できるようになったその予測のキ ーは,ヒット現象の数理モデルという,社会物理 学の分野で筆者が主となって提案した数理モデル である.本稿では,Twitter や Facebook,ブロ グなどソーシャルメディアとして知られるインタ ーネット上のコミュニケーション手段をどのよう に利用して,このヒット現象の数理モデルで予測 ができるのかを解説する. Ⅰ. ソーシャルメディア ソーシャルメディアが普及してきたのは 21 世 紀に入ってからである.気軽にできるインターネ ット上の日記と言えるブログが日本で普及したの は 2005 年くらいからで,Twitter は 2011 年の東 日本大震災で役立ったことで爆発的に普及した. Facebook は 2004 年から始まっているが,日本 語 対 応 は 2008 年 か ら で あ る. ま た,LINE は 2011 年からの新しいソーシャルメディアである. ソーシャルメディアは,人々が気軽にコミュニ ケーションあるいは社会への情報提供手段として 使われている.特にブログや Twitter はそのログ ヒット現象の数理モデル(石井他 2012)を社会の中の人間 間相互作用の力学として紹介する.このモデルを社会的ニュー ス,映画興行,ドラマ視聴率,AKB 選抜総選挙に応用した.

(2)

を取得して解析可能であることから,その時その 時で社会の人々が何に関心を示しているのかを測 る絶好のツールとなっている.ただ,Facebook や LINE は公開目的の書込が非常に少ないことか ら,現時点ではそのログ解析は Facebook 社ある いは LINE 社自体でないと不可能なので,外部か らログ解析が可能なのは現時点ではブログと Twitter だけである.従って,本稿でもブログと Twitter をどう解析するのかを説明していく. Twitter で社会の人々の関心がどう表されるか の例が図 1 である.図 1 は世界的に有名になった テニス選手錦織圭について 2015 年 1 月〜 3 月の 間に Twitter に書かれた書込数を表したもので, 図でわかるように,各試合毎にピークがあり,特 に各試合が TV 中継された全豪オープンは高い関 心を集めていることがわかる. このように,Twitter 投稿数は,人々の関心の 高さを表していて,それを社会における人々の関 心を定量的に測る手段として利用することができ る.錦織圭については,ブログに書かれた記事数 もほぼ同じグラフとなることが確認できる.一 方,ブログと Twitter で書込の様子が違う場合も ある.図 2 に示したのは 2015 年のバレンタイン デー前後で「バレンタイン」という言葉を含んで 書かれた記事数のグラフである.バレンタインデ ーである 2 月 14 日に高いピークを示すことはブ ログと Twitter で同じであるが,ブログではバレ ンタインデーに向けてきれいな曲線で盛り上がっ ていっているのに対し,Twitter ではバレンタイ ンデー以前にいくつものピークが見られる.これ はバレンタインデーに関連したいろいろな TV 番 組や雑誌記事等への反応を示している.つまり, Twitter の方はその時の気分で気楽に書き込むの で,マスメディア情報に敏感に反応するのに対 し,ブログの方はマスメディア情報への気軽な反 応ではなく,自分なりに考えて書き込んでいる姿 勢が推測できる.このようにブログと Twitter は,書込数の推移の分析という意味ではよく似て いるが,必ずしも同じではない. このように,ブログや Twitter といったソーシ ャルメディアは,書かれる数がそのまま,その事 柄に関する社会の関心の強さを反映させているの で,これを社会の関心を定量的に測る手段に使え る.しかし,単なる書込数の総計以上の情報を書 込数の推移から引き出そうというのが,次に述べ る数理モデルである. 図 1 錦織圭について 2015 年 1 月〜 3 月に Twitter に書かれた記事数を 測定したもの 注:ホットリンク社クチコミ @ 係長調べで,1/10 サンプリングデータである. (件) 全豪オープン アビエルト・メキシコ・ テルセル・準優勝 デビスカップ ブリスベン国際 ダブルス準優勝 全米国際インドア メンフィス・優勝 14000 12000 10000 8000 6000 4000 2000 0 2014 12/27 20151/6 20151/16 20151/26 20152/5 20152/15 20152/25 20153/7 20153/17 20153/27

(3)

Ⅱ.数理モデル ヒット現象の数理モデルでは,人々の興味・意 欲という量を計算する.例えばある事に対するあ る人(i さん)の興味・意欲を Ii (t) とすると,図 3 のように休日に公園で新聞を読んでいた人が, おや ? と何かに興味を示したとして,図のよう なその差分を興味・意欲と定義する.抽象的では あるが,こう定義すれば,1 人 1 人の個性や背 景,履歴などは引き算で消え,興味・意欲だけを 取り出せる. この興味・意欲 Ii (t) の従う方程式をモデルと して示したのがヒット現象の数理モデルである (吉田・石井・新垣,2010;Ishii, Arakaki, Mat-suda, Matsumoto, Umemura, Urushidani, Ya-magata, & Yoshida, 2012). 図 4 に 示 し た よ う に,ヒット現象の数理モデルでは,何かへの関心 を駆り立てる要因は,(a)宣伝広告の影響,(b) 友人からの薦め,そして(c)街中でのもっぱらの 図 2 2015 年のバレンタインデー前後で「バレンタイン」という言葉を含んで書かれた,ブログと Twitter の記事数 注:いずれもクチコミ @ 係長調べで,Twitter の投稿数は 1/10 サンプリング. バレンタイン:ブログ 100000 90000 80000 70000 60000 50000 40000 30000 20000 10000 0 2014 12/2220151/6 20151/1620151/2620152/5 20152/1520152/2520153/7 20153/1720153/27 (件) バレンタイン:Twitter 300000 250000 200000 150000 100000 50000 0 2014 12/2220151/6 20151/16 20151/2620152/5 20152/1520152/2520153/7 20153/17 20153/27 (件) 図 3 1 人 1 人の興味・意欲 Ii (t) の定義

I

i

(t)

!

(4)

噂話からの影響の 3 つがあると考える.直接友人 から薦められることを「直接コミュニケーショ ン」と呼び,それに対して街中でのもっぱらの噂 であるとか,ネット検索で目にとまった掲示板や ブログ上のやりとりなどに影響されたものを「間 接コミュニケーション」と呼ぼう.それらについ て,購入意欲の時間的な変化を追う微分方程式を 立てるという方法で数理モデル化をしていく. ヒット現象の数理モデルによる社会の中の 1 人 の人の興味・意欲の方程式は次のようになる. =CA (t) + dt dIi (t) D ij Ij (t) + Pijk Ij (t) Ik (t)

j≠iN

∑∑

j k ⑴ 右辺の第一項が広告宣伝によって影響された消費 者が映画を観る項,第二項が友人からの薦めで興 味を持つ人の項(直接コミュニケーション),そ して第三項が噂話やブログなどに影響されて興味 を持つ項(間接コミュニケーション項)である. ヒット現象の数理モデルでは広告の強さ C,直 接コミュニケーションの係数 D と間接コミュニ ケーションの係数 P の 3 つに,さらに既に観た 観客とまだ観ていない観客を区別する.そして, 簡単化のために平均場近似を行う. I = N1

Ij (t) j ⑵ これは N 人の消費者がいずれもまったく同じ動 きをするということを意味し,社会を非常に単純 化したことになる.この平均場近似を用いて,方 程式は以下のように簡単化される. =CA (t) + DI (t) + PI 2 (t) dt dI (t) ⑶ 映画の場合なら一度映画を観た人は 2 回はほとん ど見ないので,その分単純に社会全体で意欲が減 っていく減衰がある.これを入れた以下の式を映 画・音楽配信のような場合の解析に用いる. = - (a-D) I (t) + PI 2 (t) + CA (t) dt dI (t) ⑷ この式を見ると,係数αによる減衰が,直接コミ ュニケーションの強さ D によって弱められるこ とがわかる. Ⅲ.数理モデルをどう実社会に対応させるか 数理モデルでは,人々の関心の大きさ I (t) の ように,理論的には定義できているようでも,実 社会に当てはめた場合にどう測定するのか,と思 える量がある.また,式⑶,⑷に出てくるパラメ ータ C,D,P はどう決めるのか,という疑問も あるだろう.あとの節で具体的な問題に数理モデ ルを応用する前に,これらの点について解説して おこう. まず,人々の関心の大きさ I (t) は,もちろん そのまま測定できる量ではない.しかし,社会の 人々の多くが,関心を持つ事柄について,ブログ や Twitter あるいは Facebook などに書き込むで 図 4 人の興味・意欲をかきたてる 3 要素 (a)      (b)       (c)

(5)

あろう.そこで,関心を持つ人々のうち一定の割 合の人々が必ずソーシャルメディアに書き込むと 仮定することができるであろう.つまり,書き込 む確率をαとして   αI (t)=(ソーシャルメディアに書き込まれ   る数(t)) と仮定する.ちなみに裁判員制度がスタートした 時,裁判員候補に選ばれた通知は全国で 29 万人 に送られたが,そのうちの 0.3% の人が通知が届 いたことをブログに書いていた(当時は Twitter は存在していない).この 0.3% に相当するのが, 上のαであると考えればよい.従って,数理モデ ルで計算した人々の関心の大きさ I (t) は,その 日その日のソーシャルメディアの書込数で測定す ることが可能と考えられる.当然ながら,ブログ と Twitter でαの値は違うはずである. 一方,⑴式で広告宣伝が与える影響は CA (t) であるが,ここで A (t) は日々の広告宣伝の量で ある.本来なら広告代理店を通して広告主から民 放テレビ局の支払われる広告出稿費の金額を用い るのが一番よいが,広告業界の内部の人間でない とその数値を入手するのは困難なので,ここでは その代わりとして,テレビでの露出の時間の合計 を用いる.それぞれの事柄がテレビの CM や番 組で登場する秒数の,各局の合計の総和を A (t) として用いることになる.この数値はエムデータ 社によって調べられていて,有料で提供されてい る.本研究ではこの TV 露出秒数を広告宣伝の量 として用いる. また,マスメディアでない広告宣伝として Web ニュースがある.これはその日その日の各 新聞社のサイト他,ニュースを掲載するサイトで のそれぞれの事柄についての掲載件数で,大手新 聞の記事の引用も少なくない.ソーシャルメディ アに書き込まれる投稿数には,同じインターネッ ト上に現れるこれら Web ニュースの影響も無視 できない.そこで,広告媒体の種類別に CA (t) =∑ξCξAξ (t) ⑸ と書いて,各媒体ごとに係数 C を決めて,そ の足し算で広告宣伝の影響とする. 式⑶,⑷に現れる係数 C,D,P は,数理モデ ルによる計算値がブログや Twitter 書込数の時間 的推移と一致するように決める.具体的な決め方 は乱数を用いてなるべく一致するように数値を決 める方法をとり,Ishii, Arakaki et al.(2012)に その詳細が書かれている.従って,係数 C,D, P は何かから直接計算して出す数値ではなく, それぞれの事柄の人々の関心の持ち方を最もよく 数理モデルで再現できる数値ということになる. その結果,実測のソーシャルメディアの書込数と よく一致するように選ばれた係数が,C はその事 柄についての広告の効果,その事柄に関する D は直接コミュニケーションの強さ,P はその事柄 に関する間接コミュニケーションの強さを示す数 値と解釈できる.つまり,数理モデルを通して係 数 C,D,P を観測値として得たことになる. Ⅳ.社会的関心事への応用 上記の数理モデルを,まず社会的関心事に応用 してみよう.図 1 の錦織圭選手についてのツィー ト数の増減でもわかるように,社会的関心事につ いては,ブログ投稿数やツィート数も増加し,ま た,その出来事が収束すると書込数も減少してい く.これはスポーツや映画等エンタテインメント 系の事柄で顕著ではあるが,しかし社会的に話題 になることならそれに限ることではない.ここで は 2014 年に世の中で話題になったことについ て,この書込数の増減を数理モデルで再現してみ る. 図 5 に示したのは,2014 年 1 月〜 4 月の佐村 河内氏のゴーストライター問題に関するブログ書 き込み数の日毎の変化と,それに対応する数理モ デル(Math Model)の計算結果.棒グラフは TV 露出秒数とネットニュース露出件数である. 式⑶に現れる係数 C,D,P は全期間(1 月〜 4 月)の全体のブログ書込数の推移に合うように乱 数を用いて決めている.TV 露出秒数とネットニ ュース露出件数に反応する強さの係数 C は別々 に決めている.

(6)

図 5 佐村河内氏のゴーストライター問題に関するブログ書込数の日毎の変化と,それに対 応する数理モデル(Math Model)の計算結果 注:棒グラフは TV 露出秒数とネットニュース露出件数. (件) 疑惑発覚 新垣さん会見 佐村河内氏会見 ネットニュース ブログ 数理モデル 7000 400 350 250 150 50 100 0 300 200 6000 5000 4000 3000 2000 1000 0 2014 12/2620142/2 20142/9 20142/16 20142/23 20143/2 20143/9 20143/16 20143/2320143/30 20144/6 書 込 数 (秒・件) TV メ デ ィ ア に 取 り 上 げ ら れ る 頻 度 図 6 2014 年 1 月 24 日〜 8 月 10 日の日毎のツィート数と TV 露出秒数・ネットニュース 露出件数 TV ネットニュース Twitter 700 ① ② ③ ④ ⑤ 600 500 400 300 200 100 0 50000 45000 40000 35000 30000 25000 15000 10000 5000 0 20000 2014 1/24 20142/24 20143/24 20144/24 20145/24 20146/24 20147/24 (件) (秒・件) ツ ィ ー ト 数 メ デ ィ ア に 取 り 上 げ ら れ る 頻 度 注:今回の分析での 5 つの期間を示す.

(7)

図 5 でわかるように,数理モデルは測定したブ ログ書込数をよく説明していることがわかる.こ のように,ヒット現象の数理モデルは社会現象の 評判についても充分に使えることが示唆される. そこで次に,2014 年を通して世を騒がせた STAP 細胞研究スキャンダルの話題に関するブ ロ グ や Twitter の 書 込 数 の 分 析 を 紹 介 し よ う (Ishii, Koyabu, Uchiyama, & Usui, 2015). 図 6

注:棒グラフは TV 露出秒数とネットニュース露出件数. 小保方(Blog) 小保方さん会見(4/9) 笹井さん会見(4/16) 笹井さん死去(8/5) 700 600 500 400 300 200 100 0 理研,最終報告発表(4/1) STAP細胞発表(1/28) 論文撤回 呼びかけ(3/10) ・実験ノート公開 ・再調査せず(5/10) 12000 10000 8000 6000 4000 2000 0 2014 1/24 ArticleFig.1iに 不適切な処理が見つかる(2/5) 2014 2/24 20143/24 20144/24 20145/24 20146/24 20147/24 TV ネットニュース ブログ 数理モデル (件) (回) メ デ ィ ア に 取 り 上 げ ら れ る 頻 度 書 込 数 図 7 1 月 24 日〜 8 月 10 日の日毎の「小保方」という単語を含むブログ書込数と それに合わせた数理モデル計算 図 8 1 月 24 日〜 8 月 10 日の日毎の「小保方」という単語を含む Twitter 書込数 とそれに合わせた数理モデル計算 注:棒グラフは TV 露出秒数とネットニュース露出件数. 小保方さんお誕生日(6/29) STAP細胞発表(1/28) 小保方(Twitter) 小保方さん会見(4/9) 笹井さん会見(4/16) 笹井さん死去(8/5) 理研,最終報告発表(4/1) 論文撤回 呼びかけ(3/10) ・実験ノート公開 ・再調査せず(5/10) ArticleFig.1iに 不適切な処理が見つかる(2/5) 2014 1/24 20142/24 20143/24 20144/24 20145/24 20146/24 20147/24 0 5000 10000 15000 20000 30000 40000 50000 45000 25000 35000 0 100 200 300 400 500 600 700 TV ネットニュース ブログ 数理モデル メ デ ィ ア に 取 り 上 げ ら れ る 頻 度 (件) (回) 書 込 数

(8)

に示したのは 2014 年 1 月 24 日〜 8 月 10 日の日 毎のツィート数と TV 露出秒数・ネットニュース 露出件数を示したものである.今回の分析にあた っては,この期間を 5 つの期間に分け,それぞれ の期間について数理モデル計算を実測のブログ書 込数・Twitter の書込数に合わせるように式⑶の 係数 C,D,P を乱数で決めている.その 5 つの 期間は,試行錯誤で最も測定値と計算が合うよう に決めたもので,以下の 5 期間である.最後の 8 月 10 日は笹井教授が亡くなった日の数日後であ る. ①:1/24 〜 1/27(STAP 細胞の最初の発表会 見以前) ②:1/28 〜 3/9(STAP 細胞発見〜) ③:3/10 〜 4/8(論文撤回呼びかけ〜) ④:4/9 〜 4/15(小保方さん会見〜) ⑤:4/16 〜 8/10(笹井さん会見〜) 期間分割と日毎のツィート数との関係は図 6 に 示した通りである.④と⑤を分けているのは,こ れを 1 つの期間とするよりこの形で分割した方が 数理モデル計算と実測との一致がいいからであ る. このように分割した 5 つの期間について別々に 式⑶の係数 C,D,P を乱数で決めた計算結果を 図 7,8 に示す.図で分かるように,数理モデル に よ る 計 算 は 実 測 と よ い 一 致 を 示 し, こ の STAP 細胞に関する世の中の関心は再現可能で あることがわかる. 数理モデルによる計算は日毎のブログ・Twit-ter 書込数に合うように計算するので,ある程度 直接ブログ 6.00E-01 5.00E-01 4.00E-01 3.00E-01 2.00E-01 1.00E-01 0.00E+00 直接Twitter 4.50E-01 4.00E-01 3.50E-01 3.00E-01 2.00E-01 2.50E-01 1.00E-01 5.00E-02 1.50E-01 0.00E+00 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見後 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見後 間接Twitter 2.00E-04 2.50E-04 1.00E-04 5.00E-05 1.50E-04 0.00E+00 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見 後 間接ブログ 3.00E-04 2.50E-04 2.00E-04 1.50E-04 1.00E-04 5.00E-05 0.00E+00 発見 前 発見∼論文撤回呼びかけ撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見 後 図 9 「小保方」という単語を含む日毎のブログと Twitter の書込数を②〜⑤の 4 期間について数理モデルで解析して得ら れた直接コミュニケーションの係数 D と間接コミュニケーションの係数 P の値 注:① 2014 年 1 月 24 日〜 27 日,② 1 月 28 日〜 3 月 9 日,③ 3 月 10 日〜 4 月 8 日,④ 4 月 9 日〜 15 日,⑤ 4 月 16 日〜 8 月 10 日.

(9)

合うのは当然と言える.むしろ合わせた時に得ら れた式⑶の係数 C,D,P からその意味を読み取 ることが重要である. 図 9 と図 10 に上の計算から得られた直接コミ ュニケーションの係数 D と間接コミュニケーシ ョンの係数 P を,4 期間について掲げる.計算は 5 期間であるが,①は STAP 細胞研究の発表前 なので,これについては省いた.図 9,10 でわか るように,時系列的に見ると間接コミュニケーシ ョンが先に強くなり,そのあとで直接コミュニケ ーションが強くなるという傾向があることがわか る.ヒット現象の数理モデルでは,間接コミュニ ケーションは狭いコミュニティを越えて噂として 拡がることで,直接コミュニケーションは友人同 士,知人同士という狭いコミュニティの中で話が 伝わっていくことで数理モデル化している.なの で,間接から直接に盛り上がりが移るということ は,最初はコミュニティからコミュニティに次々 に噂,情報が伝播していき,後段で各コミュニテ ィの中で議論が深まっていくという状況が考えら れるであろう.STAP 細胞研究スキャンダルに関 して言えば,前段では疑惑が疑惑を呼び,興味あ るけどよくわからないと,ネット上などでもいろ いろと情報を収集している段階,後段は小保方氏 の記者会見などで,ある意味こんな事件だったの かと自分の中で,あるいは自分の周囲の狭いコミ ュニティの中で納得した段階なのではないかと思 われる. 同様な解析は佐村河内氏の場合のブログ書込 数・Twitter 書込数でも可能だが,こちらは多く 図 10 「STAP」という単語を含む日毎のブログと Twitter の書込数を②〜⑤の 4 期間について数理モデルで解析して得 られた直接コミュニケーションの係数 D と間接コミュニケーションの係数 P の値 直接ブログ 6.00E-01 5.00E-01 4.00E-01 3.00E-01 2.00E-01 1.00E-01 0.00E+00 直接Twitter 3.00E-01 2.00E-01 2.50E-01 1.00E-01 5.00E-02 1.50E-01 0.00E+00 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見後 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見後 間接Twitter 1.60E-04 1.40E-04 1.20E-04 1.00E-04 8.00E-05 6.00E-05 4.00E-05 2.00E-05 0.00E+00 発見 前 発見∼論文撤回呼びか け 撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見 後 間接ブログ 3.00E-04 2.50E-04 2.00E-04 1.50E-04 1.00E-04 5.00E-05 0.00E+00 発見 前 発見∼論文撤回呼びかけ撤回呼びかけ∼小保方小保方会見∼笹井会見 笹井会見 後 注:②〜⑤の期間については図 9 に示した通りである.

(10)

の期間に区切れないので,直接・間接どちらも同 じ期間で大きな値を示すようになる. Ⅴ.映画興行予測 次に,映画の興行という代表的なエンタテイン メント系のヒットで,ヒット現象の数理モデルを 時間(日) 600 TV露出広告 Twitter(件) 数理モデル(件) 500 400 300 200 100 0 0 10 20 30 40 50 60 70 80 90 3000 2500 1500 1000 500 0 2000 T V 露 出 広 告 秒 数 (件) (秒) ツ ィ ー ト 数 図 11 映画「テルマエ・ロマエ」についての Twitter 書込数を ヒット現象の数理モデルで解析したもの

注:math model が数理モデルによる計算,Twitter が書込数の実測 で,棒グラフは TV 露出広告秒数である. 2011/7/30 2011/8/ 3 2011/8/ 7 2011/8/11 2011/8/15 2011/8/19 2011/8/23 2011/8/27 2011/8/31 2011/9/ 4 2011/9/ 8 2011/9/12 2011/9/16 2011/9/20 2011/9/24 2011/9/28 2011/10/2 2011/10/6 2011/10/10 2011/10/14 2011/10/18 2000 1800 1600 1400 1200 1000 800 600 400 200 0 ブログ 測定データから 係数を推測 数理モデル予測 数理モデル実測 (件) 書 込 数 図 12 映画「神様のカルテ」の興行を予測した例.封切り 4 日 後までのブログ書込数から封切り 5 日目以降を予測計算 したものと,封切り後 2 ヶ月のブログ書込数の実績から 計算した数理モデル計算の比較 注:計算に用いた TV 露出秒数はいずれも実績.

(11)

用いた予測がどれだけ可能であるかを解説しよ う.ヒット現象の数理モデルが映画興行の解析に 応用できることは我々の過去の研究(吉田・石 井・ 新 垣,2010;Ishii, Arakaki et al., 2012) で 示されているが,ここではより最新の映画の解析 例を示す.図 11 に示したのは映画「テルマエ・ ロマエ」の解析の例である. 図 11 から,ヒット現象の数理モデルの計算は Twitter 書込数の実測をよく説明していることが わかる.実測の書込数の揺らぎはランダムウォー ク的ノイズにも見えるが,実際は週末毎に書込数 は高い数値となるので,その分の変動を割り引い て解析する必要がある. 次に,ヒット現象の数理モデルを映画興行の予 測に使えるかどうかのテスト例を示す.図 12 に 示すのは,2011 年に封切られた映画「神様のカ ルテ」について,予測した図である. 封切り 4 日後までのブログ書込数から封切り 5 日目以降をヒット現象の数理モデルで予測計算し たものと,封切り後 2 ヶ月のブログ書込数の実績 から計算したものを比較しているが,図でわかる ようになかなかよい一致であり,公開 4 日目まで の情報だけでかなり精度のいい予測ができること がわかる.計算に用いた TV 露出秒数はいずれも 実績であるが,この予測計算を公開 4 日後の夜に 映画興行会社が行ったと考えると,興行 5 日目以 降に TV 広告をどのような配分で行えば最も高い 興行成績を上げるかをヒット現象の数理モデルで 計算できることになる.つまり,実際の映画興行 に使える数理モデルであると言うことができる. 同様な予測計算を 2014 年 12 月に封切られた映 画「アオハライド」と 2015 年 3 月に封切られた 映画「ストロボ・エッジ」で行った例を次に示 す.図 13 に示すのが映画「アオハライド」につ いての予測計算である.「神様のカルテ」と同様 に封切り 4 日後までのブログ書込数から封切り 5 日目以降をヒット現象の数理モデルで予測計算し たものと,封切り後 2 ヶ月間のブログ書込数の実 績から計算したものを比較しているが,図でわか るようにそこそこよい一致を示し,「神様のカル テ」と同様に公開 4 日目までの情報だけでかなり 精度のよい予測ができることがわかる.計算に用 いた TV 露出秒数はいずれも実績である. 映画「アオハライド」と「ストロボ・エッジ」 は原作が少女マンガであり,原作者は同じ咲坂伊 緒氏でファン層,関心を持つ層が似ているので, 2014 年 12 月に封切られた「アオハライド」の実 績を基に「ストロボ・エッジ」の興行成績予測が 可能である.図 14 に示すのは,映画「アオハラ イド」と「ストロボ・エッジ」の封切り前の盛り 図 13 映画「アオハライド」の興行を予測した例.封切り 4 日後ま でのブログ書込数から封切り 5 日目以降を予測計算したもの と,封切り後 2 ヶ月のブログ書込数の実績から計算した数理 モデル計算の比較 注:計算に用いた TV 露出秒数はいずれも実績. 2014/11/14 2014/11/18 2014/11/22 2014/11/26 2014/11/30 2014/12/4 2014/12/8 2014/12/12 2014/12/16 2014/12/20 2014/12/24 2014/12/28 2015/1/ 1 2015/1/ 5 2015/1/ 9 2015/1/13 2015/1/17 2015/1/21 2015/1/25 2015/1/29 2015/2/ 2 300 250 150 100 50 0 200 数理モデル予測ブログ 数理モデル実測 書 込 数 (件)

(12)

上がりをブログ書込数で測定して比較したもので ある. 図 14 でわかるように,「ストロボ・エッジ」の ブログ書込件数が,公開直前になって「アオハラ イド」の書込件数を抜いている.これを式⑷に即 して考えると,この公開直前の盛り上がりの急さ は 2 次の項の係数 P に関係しており,P が大き いほど公開直前で急激に盛り上がる.従って,こ の図 14 は「アオハライド」と比較して「ストロ ボ・エッジ」の方がより大きなヒットをすること を示唆している.この原稿を執筆している現在で 「ストロボ・エッジ」は興行中であるが,「アオハ ライド」の興行成績 19 億円に対し,我々の予測 計算では「ストロボ・エッジ」の興行成績を 23 億円からそれ以上となる.このような興行予測も ヒット現象の数理モデルで可能である. Ⅵ.ドラマ視聴率 テレビ番組の視聴率というのは,世間で話題に なるものである.ここではいろいろなテレビ番組 の中でも比較しやすいドラマ視聴率をヒット現象 の数理モデルでどこまで分析できるか,その最先 端をご紹介しよう(Ishii, Kitano, Usui, & Uchiya-ma,投稿中).各ドラマについての評判をブログ (あるいは Twitter)で取得し,これに対してヒ ット現象の数理モデルを用いて解析する.数理モ デルの計算に必要な TV 露出データはそれぞれの ドラマに関する各局の番組宣伝 CM スポットや 紹介番組,そのドラマ自体の放映時間以外に,㈱ 図 14 映画「アオハライド」と「ストロボ・エッジ」の封切り前の盛り上がりをブログ書込数で測定 -30 -29 -28-27-26-25-24 -23-22-21-20-19 -18-17-16-15 公開日からの日数 ストロボ・エッジ アオハライド -14 -13-12-11-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 300 250 200 150 100 50 0 (件) 書 込 数 図 15 ヒット現象の数理モデルを用いた TV ドラマ解析の例.2013 年秋 クール放映の TBS 系ドラマ「安堂ロイド」 2013/10/7 2013/10/11 2013/10/15 2013/10/19 2013/10/23 2013/10/27 2013/10/31 2013/11/4 2013/11/8 2013/11/12 2013/11/16 2013/11/20 2013/11/24 2013/11/28 2013/12/2 2013/12/6 2013/12/10 2013/12/14 0 200 400 600 800 1000 1200 1400 10000 9000 8000 7000 6000 5000 4000 3000 2000 1000 0 数理モデル TV ネットニュース 書 込 数 (件) メ デ ィ ア に 取 り 上 げ ら れ る 頻 度 ブログ Viewer

(13)

東芝に協力によるデジタルテレビで収集された視 聴情報・録画再生情報による録画再生分の露出日 時の修正も含めて TV 露出時間データとした. 図 15 にドラマをヒット現象の数理モデルで解 析した例を示す.我々の研究室では 2014 年 4 月 〜 6 月期を中心に 20 以上の TV ドラマを解析し た.各ドラマについて図 15 のようにヒット現象 の数理モデルで解析して,そこで得られた各係数 C,D,P を見てみると,噂の強さを表す間接コ ミュニケーションの強さがドラマ視聴率と相関を 持つことがわかった. 図 16 にはそれぞれのドラマについてのブログ 書込数と視聴率との相関を示す.視聴率はビデオ リサーチ社発表の数字を用いている.図 16 から 図 16 テレビドラマについてのブログ書込数と視聴率との相関 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 相関係数=0.27 平均視聴率 0.0 2.0 4.0 6.0 8.0 10.0 12.0 14.0 16.0 18.0 20.0 (%) (件) 書 込 数 1.40 1.30 1.20 1.10 0.90 0.80

2.00E-02 3.00E-02 4.00E-02 5.00E-02 6.00E-02 7.00E-02 8.00E-02 9.00E-02 1.00E-01 1.10E-01 1.20E-01

0.70 0.60 1.00 相関係数=0.78 ・アリスの棘 ・弱くても勝てます ・SMOKING GUN (理由) 録画視聴が多い 裏番組が好調  SMOKING GUNの  裏番組が花咲舞 平均視聴率/初回視聴率 P/Cadv_v 図 17 横軸をヒット現象の数理モデルで解析して各ドラマから得た間接コミュニケーションの値 P を 広告に影響される強さ C で割った値,縦軸をドラマ視聴率の初回からの伸びを取ってみた相関

(14)

わかるように,単なる書込数と視聴率は,ほぼ相 関は無いと言ってよい.次に図 17 では,横軸を ヒット現象の数理モデルで解析して各ドラマから 得た間接コミュニケーションの値 P を広告に影 響される強さ C で割った値,縦軸を各ドラマ視 聴率の平均視聴率を初回視聴率で割った数値とし た場合の相関である.縦軸は回を重ねるごとのド ラマ視聴率の伸びを意味する. 図 17 でわかるように,結果は 0.78 と高い相関 を示す.この研究はまだ始めたばかりであるが, テレビドラマの人気の解析にも,ヒット現象の数 理モデルは有用であり,視聴率では測りきれない 人気の深さなども解析できる可能性がある. Ⅶ.AKB 選抜総選挙 ヒット現象の数理モデルの応用として,2013 年(朝日新聞大阪本社版,2013;Ishii, Ota, Ko-guchi, & Uchiyama, 2013) と 2014 年( 東 京 新 聞,2014;石井・太田,2014)の 2 回にわたっ て,上位を予想し,ある程度順位等を当てること に成功した.元々は国政選挙予測のプロトタイプ として AKB 選抜総選挙を解析したわけである が,実際には国政選挙については各候補者に関す る書込数が非常に少なく,解析は AKB 選抜総選 挙が遙かに精度がよくてやりやすかった. AKB 総選挙をヒット現象の数理モデルで解析 する場合,各メンバーについてブログに書かれて いる書込数を分析するが,広告に対する反応 C や直接コミュニケーションの強さ D は上位メン バーについてはそれほど差が無い.大きく異なる のが間接コミュニケーションの値 P である.図 18 に示したのが,2014 年の AKB 選抜総選挙で の主なメンバーについて数理モデルの計算から得 た間接コミュニケーションの値である. 首位になった渡辺麻友は,間接コミュニケーシ ョンの値では 2 位の指原莉乃を大きく引き離して いる.これが渡辺が指原との接戦を制した理由と 思われる.また,松井玲奈・山本彩・島崎遥香と の争いを抜け出して大きく票を伸ばして 4 位とな った松井珠理奈の間接コミュニケーションも大き いことがわかる.宮脇咲良は大きく順位を上げた が,図 18 でも大きな間接コミュニケーションを 示している.また,森保まどかは前年の圏外から 図 18 2014 年の AKB 選抜総選挙での主なメンバーについて数理モデルの計算 から得た間接コミュニケーションの値

1.00E-03 2.00E-03 3.00E-03 4.00E-03 5.00E-03 6.00E-03 0.00E+00 渡辺麻友 指原莉乃 柏木由紀 松井珠理奈 松井玲奈 山本彩 島崎遥香 小嶋陽菜 高橋みなみ 須田亜香里 宮脇咲良 宮澤佐江 横山由依 生駒果奈 柴田阿弥 川栄李奈 森保まどか

(15)

いきなり 25 位に入って話題になったが,ヒット 現象の数理モデルによる計算ではこのような大き な間接コミュニケーションの値が彼女について出 ていた. このように,AKB 選抜総選挙の順位予想で は,ヒット現象の数理モデルによる間接コミュニ ケーションが,単なる書込総数では測れない人気 の強弱を示してくれているように思える.この点 はドラマ視聴率予測でやはり間接コミュニケーシ ョンが大きな役割を果たしていることに対応して いると思われる. Ⅷ.考察 ヒット現象の数理モデルは他にも主にエンタテ インメント系を対象に様々な応用が行われてい る.音楽コンサートの評判の解析(Kawahata,

Genda, & Ishii, 2014a;Kawahata, Genda, & Ishii, 2013a)は多くのステージに応用できる可 能性を示唆しているし,Facebook ページの閲覧 数の解析(Kawahata, Genda, & Ishii, 2014b)は なかなか入手しにくい Facebook ページの閲覧数 を解析し,これもヒット現象の数理モデルで解析 出来ることを示している.これは Facebook 上の 広告を行う場合に有用な結果であろう.さらに江 戸時代の歌舞伎役者の解析でさえ,当時の浮世絵 や川柳投句集を時系列的に解析することでヒット 現象の数理モデルによる人気の解析が可能である こ と が 報 告 さ れ て い る(Kawahata, Genda, &

Ishii, 2013b;Kawahata, Genda, Koguchi, Uchiya-ma, & Ishii, 2013;石井・川畑,2015).

これら多くの研究からヒット現象の数理モデル で重要な役割を果たす式⑶の係数 C,D,P の意 味が明らかになってきた.係数 C は広告への反 応の強さであり,ヒット現象の数理モデルの解析 から,どのメディアの広告が最もよく効いたかを 分析できる.係数 D は直接コミュニケーション の係数で,モデルとしては友人から得る情報に影 響される強さである.STAP 細胞評判の研究など では記者会見等の後で D は強くなる.また, AKB 選抜総選挙では上位は D にあまり差が無 い.これから D は既に得ている情報,既にファ ンとなっているアイドル等についてどれだけ熱心 に語るかを表していると言えるだろう.係数 P は STAP 細胞評判の研究では疑惑が拡がってい く過程で強く出ている.また,ドラマ視聴率分析 での視聴率の伸びや AKB 選抜総選挙での票の伸 びが P と関係しているので,P は様々なコミュ ニティにどれだけ拡がっていくかの強さを表して いると考えられる.川畑による最近の研究ではこ の P が Twitter では書込に対する返信やリツィ ートに対応することが報告されている(川畑, 2015). Ⅸ.まとめ 社会における人々が様々な事柄にどう関心を示 すかの心の動きを数理モデル化したヒット現象の 数理モデルで,STAP 細胞スキャンダルの評判や 映画・テレビドラマなどエンタテインメント系の 人気の解析,さらには AKB 選抜総選挙の上位予 測まで可能であることがわかった.さらに数理モ デルを精緻化・拡張をすることで,より多くの解 析がビッグデータを使って可能となると思われ る. 参考文献 朝日新聞大阪本社版(2013).2013 年 5 月 30 日.

Ishii, A., Arakaki, H., Matsuda, N., Matsumoto, T., Umemura, S., Urushidani, T., Yamagata , N., & Yoshida, N. (2012).The ’hit’ phenomenon: A mathematical model of human dynam-ics interctions as s stochastic process. New Journal of Physics, 14, 063018, 22.

石井晃・川畑泰子(2015).「ヒット現象の数理モデル」『人工知 能学会誌』30(1),97-103.

Ishii, A., Kitao, A., Usui, T., & Uchiyama, K. (2015). Mathemati-cal model for hit phenomena and its application to analyze popularity of weekly TV drama. Int. J. Mod. Phys. B 印刷 中 .

Ishii, A., Koyabu, T., Uchiyama, K., & Usui, T. (2015). Mathe-matical theory for social phenomena to analyze popularity of social incidents quantitatively using social networks. Proceedings of the 18th Asia Pacific Symposium on Intelli-gent and Evolutionary Systems-Volume 2; Proceedings in Adaptation, Learning and Optimization Volume 2, 389-402. 石井晃・太田奨(2015).「ヒット現象の数理 映画から AKB

(16)

Ishii, A., Ota, S., Koguchi, H., & Uchiyama, K. (2013). Quantita-tive analysis of social popularity of entertainments using mathematical model for hit phenomena for Japanese pop girl group AKB48. The proceedings of the 2013 Interna-tional Conference on Biometrics and Kansei Engineering, (ICBAKE2013) 143-147.

川畑泰子(2015).「Web 上の投稿にもとづくヒット現象解析に よるプロモーション活動への適用についての研究」博士論 文(九州大学芸術工学府).

Kawahata, Y., Genda, E., & Ishii, A. (2013a). Analysis music concerts adopting the mathematical model of hit phenome-na. Computer Science and Information Technology, 43-51. Kawahata, Y., Genda, E., & Ishii, A. (2013b). Possibility of

analy-sis of “Big Data” of Kabuki play in 19th century using the mathematical model of hit phenomena, the proceedings of ACE2013 in Springer LNCS series. Lecture Note in Com-puter Science, 8253, 656-659.

Kawahata, Y., Genda, E., & Ishii, A. (2014a). Analysis of local concerts using facebook adapting the mathematical model of hit phenomena. Advances in Intelligent Systems and Computing, 273, 53-59.

Kawahata, Y., Genda, E., & Ishii, A. (2014b). Predict facebook impressions adopting a mathematical model of the hit phe-nomenon. International Journal of Information Technology, Modeling and Computing, 2, 63-68.

Kawahata, Y., Genda, E., Koguchi, H., Uchiyama, K., & Ishii, A. (2014). Analysis of mathematical model of hit phenomena stage actors of Japan. International Journal of Affective Engineering, 13, 89-94.

東京新聞(2014).2014 年 6 月 1 日. 読売新聞(2014).2014 年 6 月 7 日.

吉田就彦・石井晃・垣久史(2010).『大ヒットの方程式』東京 : ディスカヴァートゥエンティワン.

図 5 佐村河内氏のゴーストライター問題に関するブログ書込数の日毎の変化と,それに対 応する数理モデル(Math Model)の計算結果 注:棒グラフは TV 露出秒数とネットニュース露出件数.(件)疑惑発覚新垣さん会見 佐村河内氏会見 ネットニュースブログ数理モデル70004003502501505010003002006000500040003000200010000201412/2620142/220142/920142/1620142/2320143/220143/920143/1620143/23
図 5 でわかるように,数理モデルは測定したブ ログ書込数をよく説明していることがわかる.こ のように,ヒット現象の数理モデルは社会現象の 評判についても充分に使えることが示唆される. そこで次に,2014 年を通して世を騒がせたSTAP 細胞研究スキャンダルの話題に関するブロ グ や Twitter の 書 込 数 の 分 析 を 紹 介 し よ う

参照

関連したドキュメント

め測定点の座標を決めてある展開図の応用が可能であ

関係委員会のお力で次第に盛り上がりを見せ ているが,その時だけのお祭りで終わらせて

バックスイングの小さい ことはミートの不安がある からで初心者の時には小さ い。その構えもスマッシュ

わからない その他 がん検診を受けても見落としがあると思っているから がん検診そのものを知らないから

えて リア 会を設 したのです そして、 リア で 会を開 して、そこに 者を 込 ような仕 けをしました そして 会を必 開 して、オブザーバーにも必 の けをし ます

はありますが、これまでの 40 人から 35

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o