第 6 章 Twitter データを用いた施策評価の実践
6.4. 分析手法
6.4.2.分析方法
①
ツイート数の時系列分析
イベントの反響を把握するため,1 日ごとにツイート数を集計し,ツイート数の日変化 から,イベント開催日と非開催日の比較を行う.また,1時間ごとにツイート数を集計し,
その時間変化をイベント開催日と非開催日で比較する.また,イベント開催地の上野公園 では毎週末にイベントが行われているため,他の週末との比較により,他のイベントとの 反響の違いも把握可能である.
②
ツイート内容の分析
Twitter ユーザの関心対象を把握するため,まず,ツイート内容を MeCab によって形態
素解析し,上野公園に関するツイートに頻出する単語のランキングを作成する.次に,単 語同士の関係性の強さを可視化した共起ネットワーク図を作成する.可視化方法としては 共起ネットワーク図の他にもいくつかの方法があるが,共起ネットワーク図では,単語の 出現数,単語間の関係の強さなどが視覚的に表現されるため,対象期間のツイートの特徴 を直感的に把握することが可能であるためこの方法を選択した.なお,共起ネットワーク 図の作成には,無料で使用可能な樋口(2004)が開発したKH Coderを使用した.KHcoder
では Jaccard 係数に従って共起ネットワークが作成される.出現した全ての単語間に線を
描画した場合,結果の解釈が困難になるため,本研究では,出現数上位20語を用いてJaccard 係数の高い上位 60 の単語間に線を描画した.Jaccard 係数に関しては 5.3.2 で詳述してい る.
また,上記の二つの分析は,ツイートの「投稿者」の関心対象を明らかにするものであ る.本研究では,ツイートの「閲覧者」の関心対象とその反響の大きさを定量的に把握す るため,ツイートの被リツイート数のランキングを作成する.ツイートの内容の示す対象 と被リツイート数を示すことで,イベント内のコンテンツへの反響を定量的に把握可能で あると考えられる.
③
ツイートのポジティブ・ネガティブ分類
投稿者の感情を明らかにするため,ツイートをポジティブツイートとネガティブツイー トに分類する.ツイートの分類に関する研究(Purver & Stuart 2012;関・猪 2015)では機
械学習によって自動分類が試みられている.しかし,今回の分析対象は,自動分類を行わ なければ不可能なほどの膨大なツイート数ではないと予測される.したがって,より高精 度な分類を行うため,3人の作業者により 1 件ずつ文章と添付された画像を確認して分類 した.なお,分類の際には,主に形容詞に着目し,記号や顔文字も分類のための参考情報 とした.例えば「(^O^)」や「♪」が含まれていればポジティブ,「( ́・_・`)」が含まれていれ ばネガティブのように分類した.