• 検索結果がありません。

分析 用 居住地推定手法

ドキュメント内 居住地推定法 基 (ページ 40-44)

ৼ൩ইज़টش قŵƵƚƵĂůك

4.2 分析 用 居住地推定手法

居住地推定手法 、 一部 付与

居住地 、 他 居住地 推定 。本章 、

、 、 間 関係 単純有向 。

居住地 付与 1 。

Spatial Label Propagation (SLP) [Jurgens 13] 用

第4章 上 距離 居住地 33

伝搬法 [Zhu 03] 居住地推定 応用 手法 。SLP 隣接

集合 居住地 推定 推定関数 繰 返 適用

伝搬 、多 居住地 推定 手法 。SLP 用

、隣接 持 推定 利用 、隣接

居住地 推定 。

SLP 推定関数 繰 返 回数 。我々 隣接 情報 用

居住地推定手法 推定関数 用 。本章 、推定関数 4.2.1節

4.2.4節 説明 4手法 用 。 u 推定関数 Select(u;Nu) 表 。推定

関数 、推定対象 u 隣接 集合Nu 、 利用 推定

推定関数 説明 次 変数 用 。L 学習 含 集合、Nu u 隣接 集合、A (居住地) 集合、lu u 正解

、dist(l1, l2) l1 l2 間 距離 。 間 距離

対応 居住地( ) 重心間 地理的 距離 式 計算

4.2.1 Probability Model

Probability Model [Backstrom 10] 、 間 地理的距離 友人

確率 作成 、隣接 持 中 最 尤度 高 選択

手法 。 間 地理的距離 d 存在

p(d) 式 (4.1) 表 。 、a, b, c 定数 。元論文 [Backstrom 10]

使 a = 0.0019,b= 0.196, c=1.05 本章 実験 用 。

u 予測 推定関数 式 (4.4) *1

p(d) =a(d+b)c (4.1)

γl(l) = ∏

vL

[1−p(dist(l, lv))] (4.2)

γ(l, u) = ∏

vNuL

p(dist(l, lv))

1−p(dist(l, lv))γl(l) (4.3) ProbabilityModel(u) = arg max

l∈{ln|nNuL}γ(l, u) (4.4)

*1元論文 式 間違 γ(l, u) γl(l)

第4章 上 距離 居住地 34

4.2.2 Majority Vote

Majority Vote [Davis Jr. 11] 隣接 持 中 出現頻度 最 高

選択 手法 。 手法 推定対象 同 居住地 住

多数派 仮定 。元論文 無向 用 、本章

実験 用 有向 、 持 友人 有向

隣接 拡張 。 、最頻値 複数 処理 不明

、最頻値 複数 場合、本論文 学習 全体 出現頻度 高 順

選択 。

u 推定 推定関数 式(4.6) 表 。

Su = arg max

l∈{ln|nNuL}|{v|v∈Nu ∩L, l=lv}| (4.5) MajorityVote(u) = arg max

lSu

|{n|n∈L, l=ln}| (4.6)

、arg max 関数 最大 引数 集合 返 定義 。

Majority Vote 推定 隣接 数 範囲 、最低投票数 2

存在 。他 推定関数 推定対象 隣接 数 条件 設

、 推定関数 同様 (隣接 数 範囲 (0,inf) )。 、最低投 票数 0 。

4.2.3 Geometric Median

Geometric Median [Jurgens 13] 隣接 持 距離 総和 最小

選択 手法 。 u 推定 推定関数 式 (4.7)

GeometricMedian(u) = arg min

l∈{ln|nNuL}

xNuL,n̸=x

dist(l, lx) (4.7)

4.2.4 Random Neighbor

Random Neighbor 隣接 持 居住地 中 選択 推定値

、 推定関数 。推定関数 式 (4.8) 表 。

RandomNeighbor(u) =lchoice(NuL) (4.8)

、choice(S) 集合S 要素 1 返 関数 。

第4章 上 距離 居住地 35

4.3

Twitter 居住地 、 関係 構築

実験 用 。 作成方法 次節以降 述 。最終的 、

52,508 含 居住地 、8,003,858 40,453,444 含

用意 。

4.3.1 位置情報付 居住地

実験 用 居住地 、市区町村 表 。 、各

1 居住地 付与 。 主 居住地周辺 活動 考

、 位置情報付 投稿 主 場所 居住地

各 居住地 、各 投稿 位置情報付 次 方法 付与

。 、各位置情報付 付与 位置情報(coordinates) 含 市 区町村 照合 。 森國 [森國 15] 同様 方法 総務省 統計局 境界 作成 。次 、 投稿回数 最 多 求

、居住地 付与 。

Twitter Streaming API*2 2014 1年間 日本 包含 矩形*3 投稿 位置情報付 250,564,317件 集 。収集 、Bot

投稿 除外 。 、居住地 付与 際 、

最低 1 5回以上位置情報付 投稿 、位置情報付 投稿回数 365回以上 条件 設 、 絞 込 。 結

果、71,166 居住地 付与 。

4.3.2 関係

関係 構築 。 、居住地 付与

集合*4 、 集合*5 収集 。

、 、相互 関係 間 作

、 構築 。構築 無向単純

*2https://dev.twitter.com/streaming/reference/post/statuses/filter

*3北緯20 50度、東経110 160 範囲。

*4https://dev.twitter.com/rest/reference/get/friends/ids

*5https://dev.twitter.com/rest/reference/get/followers/ids

第4章 上 距離 居住地 36

居住地 付与 71,166 周辺 関係 2015年7月 取得 。完

全 取得 52,508 。取得 構築

8,003,858 40,453,444 含 。 、

居住地 付与 52,508 。

ドキュメント内 居住地推定法 基 (ページ 40-44)

関連したドキュメント