• 検索結果がありません。

第 4 章 ユーザのライフスタイルを活用した職業属性の推定技術の提案

4.2 研究の概要

81

第 4 章 ユーザのライフスタイルを活用した職業属

82

図 4.1 本研究の位置付け

4.2.2 本研究における課題と対応方策

本研究では,投稿内容に加え,ライフスタイルを考慮したマイクロブログユーザの職業 属性の推定手法を提案する.本手法では,既存手法の課題である投稿内容,人間関係,プ ロフィールのような「マイクロブログ上の明示的な情報だけでは属性を推定できない問題」

マイクロブログを用いたソーシャルセンシング技術に関する研究

マイクロブログのリアルタイムな特性を活用した基礎研究

① 行動推定に関する研究

【課題】

投稿内容に行動や位置に関する情報が含まれて いる割合が非常に少ないこと.

【目的】

位置情報に頼らずにユーザの行動を推定するこ と.

【開発技術の新規性】

投稿数の変化などユーザの投稿パターンを活用 してユーザの習慣行動を推定すること.

② 属性推定に関する研究

【課題】

マイクロブログ上の明示的な情報だけでは属性 を推定できないこと.同じ職業でも多様なライ フスタイルが存在すること.

【目的】

属性ごとの特徴的な単語だけに頼らずに属性を 推定すること.

【開発技術の新規性】

プロフィールなどの明示的な情報だけでなく,

暗黙的なユーザのライフスタイルの特徴を抽出 して,属性を推定すること.

行動推定手法と属性推定手法の高精度化に関する研究

【課題】

行動推定の精度が投稿数や投稿記事の量に依存 すること.

実世界の現象の分析に関する研究

【課題】

社会現象ごとに反応するユーザ の行動や属性に違いがあること を確認できていないこと.

【目的】

近年発生した社会現象の特徴 を分析することで,本提案手 法の有用性を確認すること.

【開発技術の新規性】

現象の特徴をユーザの行動や 属性などの特性を用いて分析 すること.

応用研究

【課題】

属性ごとの推定精度の違いを考慮せず一様に処 理すること.

拡張 拡張

【目的】

行動推定の精度を向上させること.

【開発技術の新規性】

ユーザ自身の行動特性だけでなく,同様のユー ザ属性を保持するものは,同様の習慣行動を執 るという考えを適用すること.

【目的】

属性推定の精度を向上させること.

【開発技術の新規性】

ソフトウェア工学における段階的詳細化の考え 方をユーザ属性の推定に適用すること.

3章

5章

6章

83

と提案手法の検討にあたり課題となる「同じ職業でも多様なライフスタイルが存在する問 題」に対応する.

 「マイクロブログ上の明示的な情報だけでは属性を推定できない問題」への対応方法 本課題に対しては,「ライフスタイルに密着した単語が出現する曜日・時間帯ごとの 投稿数」を考慮することで対処する.「おはよう」や「おやすみ」などの生活時間に密 着した単語が出現する時間帯を考慮することで,ライフスタイルの特徴を抽出できる と考えられる.また,曜日・時間帯ごとの投稿数を考慮することで,週単位,曜日単 位のライフスタイルの特徴を抽出でき,職業ごとのライフスタイルの差異を強調する ことができると考えられる.

 「同じ職業でも多様なライフスタイルが存在する問題」への対応方法

本課題に対しては,同様の職業でもライフスタイルの異なるユーザを整理・分類し て判定することで対処する.職業はユーザのライフスタイルを規定する主な要因のひ とつであるが,業務内容や生活態度によって,大小の違いが生じることが想定される.

例えば,同じ大学生でも学業に熱心な学生とアルバイトに熱心な学生では,ライフス タイルには違いがある.このように,分類としては同じ職業であってもライフスタイ ルが異なる多種多様なユーザが存在し,これらの違いを考慮しなければ,正しくユー ザの職業を推定することは難しいと考えられる.そこで,「同じ職業のユーザをマイク ロブログへの投稿時間によりクラスタリング」することで,この課題に対応する.

以上のように,マイクロブログに暗黙的に含まれるライフスタイルを考慮することで既 存研究の問題点に対応し,マイクロブログユーザの職業属性の推定精度を向上させること を本研究の目的とする.

4.2.3 処理の流れ

本研究では,「生活習慣に関わる語句の時間帯ごとの投稿数」をまとめた生活習慣ベクト ルと「曜日・時間帯ごとの投稿数」をまとめた投稿時間帯ベクトルとを用いて,ユーザの ライフスタイルを表現する.提案手法は,属性推定モデル構築部と属性推定部の 2 つの処 理部により構成される.

84

(1) 属性推定モデル構築部

属性推定モデル構築部の処理フローを図 4.2に示す.

図 4.2 属性推定モデル構築部の処理フロー

属性推定モデル構築部は,クラスタリング機能,単語・生活習慣モデル構築機能と投稿 時間帯モデル構築機能で構成される.クラスタリング機能では,収集した各ユーザの投稿 履歴から,曜日(7曜日)・時間帯(24時間)ごとの投稿数を抽出し,これらの類似性に基 づきユーザ群をクラスタリングする.単語・生活習慣モデル構築機能では,各職業に特徴 的な単語の出現数を示す単語ベクトルと生活習慣ベクトルを各クラスタ単位に作成する.

そして,作成した単語ベクトルと生活習慣ベクトルを統合し,学習することで単語・生活 習慣モデルを構築する.投稿時間帯モデル構築機能では,クラスタリング機能により分類 された各クラスタの中心ベクトルを取得して関連付けることで,投稿時間帯モデルを構築 する.

(2) 属性推定部

属性推定部の処理フローを図 4.3に示す.

マイクロブログ 職業ごとにユーザの 投稿内容と投稿時間を収集 属性推定モデル構築部

単語・生活習慣モデル 構築機能 単語ベクトル作成処理

単語・生活習慣モデル 構築処理

投稿時間帯モデル 構築処理 投稿時間帯モデル

構築機能 クラスタリング機能

投稿時間帯による ユーザのクラスタリング処理

生活習慣ベクトル 作成処理

投稿時間帯ベクトル 作成処理

構築 構築

投稿時間帯 モデル 単語ベクトル

生活習慣ベクトル 作成 作成

作成

単語・生活 習慣モデル 投稿時間帯ベクトル

85

図 4.3 属性推定部の処理フロー

属性推定部では,属性推定機能を用いて推定対象ユーザの投稿内容と投稿時間を分析し,

それらを属性推定モデル構築部で構築した単語・生活習慣モデルや投稿時間帯モデルに適 用することでユーザの属性を推定する.