• 検索結果がありません。

Tweet で降雨情報をジオコーディング 12D8104007G

N/A
N/A
Protected

Academic year: 2021

シェア "Tweet で降雨情報をジオコーディング 12D8104007G"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

Tweet

で降雨情報をジオコーディング

12D8104007G 荒井 晶弘

中央大学理工学部情報工学科 田口研究室

2016

3

あらまし:Twitterの「ツイート」に潜んでいる位 置情報を可視化する。また特定の事象に対して「ツ イート」をする行為が地域毎に違うのか調べる。

キーワード:TwitterAPI,MeCab,ジオコーディ ング

1. 目的

人により身の回りの出来事に対しての反応は違 ってくる。それは「ツイート」にも言えることであ る。そこでそれぞれの反応の差を対象者の現在地 (「ツイート」を投稿した時の位置)の違いであると 仮定し、「ツイート」から位置情報を取得して反応 の差を調べる。

2. 研究対象

本研究では「雨」というワードを含む「ツイート」

を研究対象とした。「雨」は頻繁に様々な場所で起 こる事象であるので研究対象として十分な量のツ イートを取得できると考えたからである。また、実 際に「雨」がどこでいつ降ったのか詳細なデータを 気象庁が公開しているため取得結果と参照するこ とができる。

3. 使用システム 3. 1 ツイート取得

Twitterが公開しているREST APIを使いツイー

トを取得する。取得したデータの中から「ツイート 本文」,「投稿日時」,GPS」,「ユーザープロフィー ルに記載された住所」の4つを取得対象項目とする。

3. 2 形態素解析 MeCab

MeCabは形態素解析ツールである。形態素解析

とは文字列を辞書や文法を元に形態素(言語として 意味を持つ最小単位の単語)に分ける技術である。

この技術を使用して「ツイート本文」等を形態素解 析することで地名のワードを取得する。

3. 3 ジオコーディング

地名に対応する緯度経度の値を取得する。そこで 国土交通省が公開している位置参照情報を利用す る。位置参照情報には住所名とその住所の代表点が 示す位置座標が記載されている。このデータを使い 地名に対応する位置座標を取得していく。

3. 4 位置情報の可視化

緯度経度を地図上に表示するウェブツールの

tree-mapsを使用してツイートを可視化する。

4. データ分析 4. 1 実行結果

「雨」のワードが含まれるツイートを20161 1315時から201611415時を対象に

34070個取得した。取得したツイートのうち7718

個から位置情報を取得することができた。取得した データを1時間毎に地図上にプロットした一部を 以下に示す。

4.1-1ツイートの可視化(2016/1/13 16:00)

4.1-1では大阪周辺のツイート数が突出してい

ることがわかる。

4. 2 分析

得られた実行結果を分析するために新たに3 のデータを取得してきた。

1. 都道府県別Twitterユーザー数 2. 天気図(降雨)

3. 日本の平均ツイート数

(2)

4.2-1 都道府県別Twitterユーザー数

4.2-2天気図(降雨)

4.2-3 日本の平均ツイート数

1と2はそれぞれWEB上からデータを取得した。

3のデータは実験と同じようなやり方で「雨」等の ワードは指定せず日本人のみのツイート数を取得 した。これにより日本地域別の平均的なツイート数 を見て取れる。

以上3つのデータと図4.1-1のデータとを比較し て気になった地域等をピックアップして表にまと めた。結果は以下に示す。

表 4.2-4 データ比較表 都道府県 ユ ー ザ

ー数

平 均 ツ イ ー ト

「 雨 」 ツ イ ー ト数

降雨の 有無

東京都 488020 338 65

大阪府 179332 127 203

神奈川県 177072 114 11

愛知県 103673 76 5

埼玉県 96943 62 4

愛媛県 10190 18 10

青森県 9917 17 2

福井県 7317 6 9

5. 考察

ユーザー数と平均ツイート数は比例しているこ とがわかる。また雨が降っていない地域の「雨」ツ イート数もこれらに比例して多くなっている。特に、

東京都だけユーザー数と「雨」ツイート数の比率が 高い。雨が降っている地域の「雨」ツイート数は平 均ツイート数を大きく上回っている。しかし、愛媛 県の「雨」ツイート数は平均ツイート数の約半数で あった。

東京都は他県より雨を気にしており、愛媛は雨に 対して興味がないと思われる。

6. 結論

取得したツイートの約1/5から位置情報の取得に 成功し、地図上に可視化することができた。また、

様々なデータと比較することで「ツイート」を通し て地域毎に興味の差があることがみられた。

謝辞

本研究を進めるにあたり、丁寧に指導して下さっ た田口東教授に感謝します。

参考文献

[1]工藤 拓(2009), MeCab汎用日本語形態素解析エ ンジン,

http://www.jtpa.org/wp-content/uploads/2014/06/

MeCab.pdf

[2]TwitterDevelopers,https://dev.twitter.com/

[3]Twitter4J,http://twitter4j.org/ja/index.html

図 4.2-1  都道府県別 Twitter ユーザー数  図 4.2-2 天気図(降雨)  図 4.2-3  日本の平均ツイート数    1と2はそれぞれ WEB 上からデータを取得した。 3のデータは実験と同じようなやり方で「雨」等の ワードは指定せず日本人のみのツイート数を取得 した。これにより日本地域別の平均的なツイート数 を見て取れる。    以上3つのデータと図 4.1-1 のデータとを比較して気になった地域等をピックアップして表にまとめた。結果は以下に示す。 表  4.2-4 データ比較表 都

参照

関連したドキュメント

では,フランクファートを支持する論者は,以上の反論に対してどのように応答するこ

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

うのも、それは現物を直接に示すことによってしか説明できないタイプの概念である上に、その現物というのが、

大正デモクラシーの洗礼をうけた青年たち の,1920年代状況への対応を示して」おり,「そ

つの表が報告されているが︑その表題を示すと次のとおりである︒ 森秀雄 ︵北海道大学 ・当時︶によって発表されている ︒そこでは ︑五

大阪府では、これまで大切にしてきた、子ども一人ひとりが違いを認め合いそれぞれの力

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o

それに対して現行民法では︑要素の錯誤が発生した場合には錯誤による無効を承認している︒ここでいう要素の錯