ジオタグ付きツイートにおける ジオタグ付きツイートにおける ジオタグ付きツイートにおける ジオタグ付きツイートにおける 特徴的ハッシュタグの分析
特徴的ハッシュタグの分析 特徴的ハッシュタグの分析 特徴的ハッシュタグの分析
尾崎研究室所属 尾崎研究室所属 尾崎研究室所属 尾崎研究室所属 学籍番号
学籍番号 学籍番号
学籍番号 5410047 児玉翔太 児玉翔太 児玉翔太 児玉翔太
研究の背景
研究の背景
研究の背景
研究の背景
研究の背景
研究の背景
研究の背景
研究の背景
先行研究 先行研究 先行研究
先行研究 都道府県別タグクラウド
ジオタグ、ハッシュタグ付きツイート ジオタグ、ハッシュタグ付きツイートジオタグ、ハッシュタグ付きツイート ジオタグ、ハッシュタグ付きツイート
県 県県
県 県県県県 県県県県
データ収集期間:
データ収集期間:
データ収集期間:
データ収集期間:
2013/10--2014/09 (
約約約約1
年間年間年間年間) Twitter Sample Stream
から獲得から獲得から獲得から獲得GPS
情報 情報 情報 情報(
緯度,経度緯度,経度緯度,経度緯度,経度)
から都道府県を検出から都道府県を検出から都道府県を検出から都道府県を検出分析の手順
分析の手順
分析の手順
分析の手順
地域性 地域性 地域性 地域性
TF- IDF= TF × IDF
TF
繰り返し現れる 繰り返し現れる 繰り返し現れる 繰り返し現れる
IDF
その地域で その地域でその地域で その地域で
×
その地域
(だけ)で,どれだけ繰り替えし現れているか
文書=都道府県
文書内にいくつ出現?
出現率 いくつの文書に出現?
逆数を取る
2013/10
Drill Down :
「都道府県」から「都道府県」「都道府県」から「都道府県」「都道府県」から「都道府県」「都道府県」から「都道府県」x
「月」へ「月」へ「月」へ「月」へ2013/11
2013/12
2014/1
2014/2
2014/3
2014/4
2014/5
2014/6
2014/7
2014/8
2014/9
12 ヶ月分のデータでのクラスタリング結果ヶ月分のデータでのクラスタリング結果ヶ月分のデータでのクラスタリング結果ヶ月分のデータでのクラスタリング結果
12 次元時系列データの
ward 法による階層的クラスタリング
まとめ まとめ まとめ まとめ
・地域毎のハッシュタグによる大域的な傾向を示した
・地域毎のハッシュタグによる大域的な傾向を示した
・地域毎のハッシュタグによる大域的な傾向を示した
・地域毎のハッシュタグによる大域的な傾向を示した
.
・首都圏では地域性が高くなる傾向にある
・首都圏では地域性が高くなる傾向にある
・首都圏では地域性が高くなる傾向にある
・首都圏では地域性が高くなる傾向にある