第 6 章 実世界への適用に向けた社会現象の分析
6.3 実験の概要
6.3.1 実験概要
実験では,近年発生した実世界の社会現象を対象として,行動や属性といったユーザ特 性ごとの特徴が抽出できるのかを明らかにする.本実験での属性は,職業(学生,社会人,
マイクロブログを用いたソーシャルセンシング技術に関する研究
マイクロブログのリアルタイムな特性を活用した基礎研究
① 行動推定に関する研究
【課題】
投稿内容に行動や位置に関する情報が含まれて いる割合が非常に少ないこと.
【目的】
位置情報に頼らずにユーザの行動を推定するこ と.
【開発技術の新規性】
投稿数の変化などユーザの投稿パターンを活用 してユーザの習慣行動を推定すること.
② 属性推定に関する研究
【課題】
マイクロブログ上の明示的な情報だけでは属性 を推定できないこと.同じ職業でも多様なライ フスタイルが存在すること.
【目的】
属性ごとの特徴的な単語だけに頼らずに属性を 推定すること.
【開発技術の新規性】
プロフィールなどの明示的な情報だけでなく,
暗黙的なユーザのライフスタイルの特徴を抽出 して,属性を推定すること.
③ 行動推定手法と属性推定手法の高精度化に関する研究
【課題】
行動推定の精度が投稿数や投稿記事の量に依存 すること.
④ 実世界の現象の分析に関する研究
【課題】
社会現象ごとに反応するユーザ の行動や属性に違いがあること を確認できていないこと.
【目的】
近年発生した社会現象の特徴 を分析することで,本提案手 法の有用性を確認すること.
【開発技術の新規性】
現象の特徴をユーザの行動や 属性などの特性を用いて分析 すること.
応用研究
【課題】
属性ごとの推定精度の違いを考慮せず一様に処 理すること.
拡張 拡張
【目的】
行動推定の精度を向上させること.
【開発技術の新規性】
ユーザ自身の行動特性だけでなく,同様のユー ザ属性を保持するものは,同様の習慣行動を執 るという考えを適用すること.
【目的】
属性推定の精度を向上させること.
【開発技術の新規性】
ソフトウェア工学における段階的詳細化の考え 方をユーザ属性の推定に適用すること.
3章
5章
4章
145
主婦とパート・アルバイト)を対象とする.また,行動は,「その他」の項目を「在宅」に 絞り,「睡眠中」,「出勤中」,「勤務中」,「帰宅中」,「食事中」と「在宅中」を対象とする.
6.3.2 実験データ
本実験では,2011年から2015年までの期間に収集した3,320ユーザの投稿群を対象とし て実験を行う.実験データを表 6.1に示す.
表 6.1 実験データ
ユーザ数 投稿件数
学生 830ユーザ 2,570,120
社会人 830ユーザ 2,318,564
主婦 830ユーザ 2,486,236
パート・
アルバイト 830ユーザ 2,568,940
合計 3,320ユーザ 9,943,860
6.3.3 分析対象の社会現象
分析対象の社会現象を表 6.2に示す.
146
表 6.2 分析対象の社会現象
NO ニュース名 期間・日付 比較期間
1 東日本大震災 2011年3月11日 2011年3月12~17日
2 台風4号 2012年6月19日 2012年6月16~18日
6月20日~22日
3 ロンドンオリンピック 2012年 7月27日~8月12日
2012年 1月1日~7月26日 8月13日~12月31日 4 サマータイム制度 2013年
8月1日~8月31日
2013年 1月1日~7月31日 9月1日~12月31日 5 楽天イーグルス日本一 2013年11月3日 2013年 11月1日,2日,4~7日
6 AKB総選挙 2011年6月9日 2011年6月6日~8日
6月10日~12日
7 夏休み 2011年~2015年 8月1日~8月31日
2011年~2015年 1月1日~7月31日 9月1日~12月31日
6.3.4 実験手順
実証実験は,夏休みといった長期的現象と東日本大震災といった短期的現象で手順を分 けて実施する.次の手順に則って進めるものとする.
(1) 長期的現象の実験手順(No.3,No.4とNo.7)
STEP 1 :社会現象の期間内に発信されている投稿群と期間外に発信されている投稿群を
入力とし,それぞれ投稿数ベクトルと生活習慣ベクトルを作成する.
STEP 1.1 :実験データのユーザを対象に属性ごとの投稿数ベクトルを作成する.
STEP 1.2 :属性と曜日・時間帯ごとに習慣行動に関する単語の出現数からなる生活習慣ベ クトルを作成し,正規化する.
STEP 2 :STEP1 で作成した期間内と期間外のベクトルをグラフ化し,社会現象ごとの特
徴を確認する.
(2) 短期的現象の実験手順(No.1,No.2,No.5とNo.6)
STEP 1 :社会現象が発生した日を含む 7 日間の投稿群を入力とし,それぞれ投稿数ベク
トルと生活習慣ベクトルを作成する.
STEP 1.1 :実験データのユーザを対象に属性ごとの投稿数ベクトルを作成する.
STEP 1.2 :属性と曜日・時間帯ごとに習慣行動に関する単語の出現数からなる生活習慣ベ
147 クトルを作成し,正規化する.
STEP 2 :STEP1 で作成した 7 日間分のベクトルをグラフ化し,社会現象ごとの特徴を確
認する.