ৼ൩ইज़টش قŵƵƚƵĂůك
4.2 分析 用 居住地推定手法
居住地推定手法 、 一部 付与
居住地 、 他 居住地 推定 。本章 、
、 、 間 関係 単純有向 。
居住地 付与 1 。
Spatial Label Propagation (SLP) [Jurgens 13] 用
第4章 上 距離 居住地 33
伝搬法 [Zhu 03] 居住地推定 応用 手法 。SLP 隣接
集合 居住地 推定 推定関数 繰 返 適用
伝搬 、多 居住地 推定 手法 。SLP 用
、隣接 持 推定 利用 、隣接
居住地 推定 。
SLP 推定関数 繰 返 回数 。我々 隣接 情報 用
居住地推定手法 推定関数 用 。本章 、推定関数 4.2.1節
4.2.4節 説明 4手法 用 。 u 推定関数 Select(u;Nu) 表 。推定
関数 、推定対象 u 隣接 集合Nu 、 利用 推定
。
推定関数 説明 次 変数 用 。L 学習 含 集合、Nu u 隣接 集合、A (居住地) 集合、lu u 正解
、dist(l1, l2) l1 l2 間 距離 。 間 距離
対応 居住地( ) 重心間 地理的 距離 式 計算
。
4.2.1 Probability Model
Probability Model [Backstrom 10] 、 間 地理的距離 友人
確率 作成 、隣接 持 中 最 尤度 高 選択
手法 。 間 地理的距離 d 、 間 存在 確
率p(d) 式 (4.1) 表 。 、a, b, c 定数 。元論文 [Backstrom 10]
使 a = 0.0019,b= 0.196, c=−1.05 本章 実験 用 。
u 予測 推定関数 式 (4.4) *1。
p(d) =a(d+b)c (4.1)
γl(l) = ∏
v∈L
[1−p(dist(l, lv))] (4.2)
γ(l, u) = ∏
v∈Nu∩L
p(dist(l, lv))
1−p(dist(l, lv))γl(l) (4.3) ProbabilityModel(u) = arg max
l∈{ln|n∈Nu∩L}γ(l, u) (4.4)
*1元論文 式 間違 考 、γ(l, u) 式 γl(l) 補 。
第4章 上 距離 居住地 34
4.2.2 Majority Vote
Majority Vote [Davis Jr. 11] 隣接 持 中 出現頻度 最 高
選択 手法 。 手法 推定対象 同 居住地 住
多数派 仮定 。元論文 無向 用 、本章
実験 用 有向 、 持 友人 有向
隣接 拡張 。 、最頻値 複数 処理 不明
、最頻値 複数 場合、本論文 学習 全体 出現頻度 高 順
選択 。
u 推定 推定関数 式(4.6) 表 。
Su = arg max∗
l∈{ln|n∈Nu∩L}|{v|v∈Nu ∩L, l=lv}| (4.5) MajorityVote(u) = arg max
l∈Su
|{n|n∈L, l=ln}| (4.6)
、arg max∗ 関数 最大 引数 集合 返 定義 。
Majority Vote 推定 隣接 数 範囲 、最低投票数 2
存在 。他 推定関数 推定対象 隣接 数 条件 設
、 推定関数 同様 (隣接 数 範囲 (0,inf) )。 、最低投 票数 0 。
4.2.3 Geometric Median
Geometric Median [Jurgens 13] 隣接 持 距離 総和 最小
選択 手法 。 u 推定 推定関数 式 (4.7)
。
GeometricMedian(u) = arg min
l∈{ln|n∈Nu∩L}
∑
x∈Nu∩L,n̸=x
dist(l, lx) (4.7)
4.2.4 Random Neighbor
Random Neighbor 隣接 持 居住地 中 選択 推定値
、 推定関数 。推定関数 式 (4.8) 表 。
RandomNeighbor(u) =lchoice(Nu∩L) (4.8)
、choice(S) 集合S 要素 1 返 関数 。
第4章 上 距離 居住地 35
4.3
Twitter 居住地 、 関係 構築
実験 用 。 作成方法 次節以降 述 。最終的 、
52,508 含 居住地 、8,003,858 40,453,444 含
用意 。
4.3.1 位置情報付 居住地
実験 用 居住地 、市区町村 表 。 、各
1 居住地 付与 。 主 居住地周辺 活動 考
、 位置情報付 投稿 主 場所 居住地
。
各 居住地 、各 投稿 位置情報付 次 方法 付与
。 、各位置情報付 付与 位置情報(coordinates) 含 市 区町村 照合 。 森國 [森國 15] 同様 方法 総務省 統計局 境界 作成 。次 、 投稿回数 最 多 求
、居住地 付与 。
Twitter Streaming API*2 用 、2014年 1年間 日本 包含 矩形*3 中 投稿 位置情報付 250,564,317件 集 。収集 、Bot
投稿 除外 。 、居住地 付与 際 、
最低 1 5回以上位置情報付 投稿 、位置情報付 投稿回数 365回以上 条件 設 、 絞 込 。 結
果、71,166 居住地 付与 。
4.3.2 関係
関係 構築 。 、居住地 付与
集合*4 、 集合*5 収集 。
、 、相互 関係 間 作
、 構築 。構築 無向単純
*2https://dev.twitter.com/streaming/reference/post/statuses/filter
*3北緯20度 50度、東経110度 160度 範囲。
*4https://dev.twitter.com/rest/reference/get/friends/ids
*5https://dev.twitter.com/rest/reference/get/followers/ids
第4章 上 距離 居住地 36
。
居住地 付与 71,166 周辺 関係 2015年7月 取得 。完
全 取得 52,508 。取得 構築
8,003,858 40,453,444 含 。 、
居住地 付与 52,508 。