Tweet
で降雨情報をジオコーディング12D8104007G 荒井 晶弘
中央大学理工学部情報工学科 田口研究室2016
年3
月あらまし:Twitterの「ツイート」に潜んでいる位 置情報を可視化する。また特定の事象に対して「ツ イート」をする行為が地域毎に違うのか調べる。
キーワード:TwitterAPI,MeCab,ジオコーディ ング
1. 目的
人により身の回りの出来事に対しての反応は違 ってくる。それは「ツイート」にも言えることであ る。そこでそれぞれの反応の差を対象者の現在地 (「ツイート」を投稿した時の位置)の違いであると 仮定し、「ツイート」から位置情報を取得して反応 の差を調べる。
2. 研究対象
本研究では「雨」というワードを含む「ツイート」
を研究対象とした。「雨」は頻繁に様々な場所で起 こる事象であるので研究対象として十分な量のツ イートを取得できると考えたからである。また、実 際に「雨」がどこでいつ降ったのか詳細なデータを 気象庁が公開しているため取得結果と参照するこ とができる。
3. 使用システム 3. 1 ツイート取得
Twitterが公開しているREST APIを使いツイー
トを取得する。取得したデータの中から「ツイート 本文」,「投稿日時」,「GPS」,「ユーザープロフィー ルに記載された住所」の4つを取得対象項目とする。
3. 2 形態素解析 MeCab
MeCabは形態素解析ツールである。形態素解析
とは文字列を辞書や文法を元に形態素(言語として 意味を持つ最小単位の単語)に分ける技術である。
この技術を使用して「ツイート本文」等を形態素解 析することで地名のワードを取得する。
3. 3 ジオコーディング
地名に対応する緯度経度の値を取得する。そこで 国土交通省が公開している位置参照情報を利用す る。位置参照情報には住所名とその住所の代表点が 示す位置座標が記載されている。このデータを使い 地名に対応する位置座標を取得していく。
3. 4 位置情報の可視化
緯度経度を地図上に表示するウェブツールの
tree-mapsを使用してツイートを可視化する。
4. データ分析 4. 1 実行結果
「雨」のワードが含まれるツイートを2016年1 月13日15時から2016年1月14日15時を対象に
34070個取得した。取得したツイートのうち7718
個から位置情報を取得することができた。取得した データを1時間毎に地図上にプロットした一部を 以下に示す。
図4.1-1ツイートの可視化(2016/1/13 16:00)
図4.1-1では大阪周辺のツイート数が突出してい
ることがわかる。
4. 2 分析
得られた実行結果を分析するために新たに3つ のデータを取得してきた。
1. 都道府県別Twitterユーザー数 2. 天気図(降雨)
3. 日本の平均ツイート数
図4.2-1 都道府県別Twitterユーザー数
図4.2-2天気図(降雨)
図4.2-3 日本の平均ツイート数
1と2はそれぞれWEB上からデータを取得した。
3のデータは実験と同じようなやり方で「雨」等の ワードは指定せず日本人のみのツイート数を取得 した。これにより日本地域別の平均的なツイート数 を見て取れる。
以上3つのデータと図4.1-1のデータとを比較し て気になった地域等をピックアップして表にまと めた。結果は以下に示す。
表 4.2-4 データ比較表 都道府県 ユ ー ザ
ー数
平 均 ツ イ ー ト 数
「 雨 」 ツ イ ー ト数
降雨の 有無
東京都 488020 338 65 無
大阪府 179332 127 203 有
神奈川県 177072 114 11 無
愛知県 103673 76 5 無
埼玉県 96943 62 4 無
愛媛県 10190 18 10 有
青森県 9917 17 2 無
福井県 7317 6 9 有
5. 考察
ユーザー数と平均ツイート数は比例しているこ とがわかる。また雨が降っていない地域の「雨」ツ イート数もこれらに比例して多くなっている。特に、
東京都だけユーザー数と「雨」ツイート数の比率が 高い。雨が降っている地域の「雨」ツイート数は平 均ツイート数を大きく上回っている。しかし、愛媛 県の「雨」ツイート数は平均ツイート数の約半数で あった。
東京都は他県より雨を気にしており、愛媛は雨に 対して興味がないと思われる。
6. 結論
取得したツイートの約1/5から位置情報の取得に 成功し、地図上に可視化することができた。また、
様々なデータと比較することで「ツイート」を通し て地域毎に興味の差があることがみられた。
謝辞
本研究を進めるにあたり、丁寧に指導して下さっ た田口東教授に感謝します。
参考文献
[1]工藤 拓(2009), MeCab汎用日本語形態素解析エ ンジン,
http://www.jtpa.org/wp-content/uploads/2014/06/
MeCab.pdf
[2]TwitterDevelopers,https://dev.twitter.com/
[3]Twitter4J,http://twitter4j.org/ja/index.html