ドメイン別ユーザプロファイル

15  Download (0)

Full text

(1)

ドメイン別ユーザプロファイル 構築 情報推薦 への 応用

尾崎研究室

鈴木陽介

(2)

目次

はじめに、目的

提案手法

概要

ドメイン別ユーザプロファイルの構築

情報推薦への応用

評価実験

まとめ、今後の課題

(3)

協調フィルタリング

桜道家美味しかったー 桜道家美味しいねー

せい家おすすめー せい家を推薦

(4)

協調フィルタリング

5 4 1 4

4 5 2

2 1 5 2

ユーザ嗜好プロファイルによって「口コミ」を再現 類似

(5)

ドメイン別 の プロファイル

5 4 1 4

4 5 2

2 1 5 2

不要

(6)

Twitter 上 の 専門家ユーザ

ドメイン専門家

ドメイン特化した投稿多

一般的ユーザ

普段出来事感じたこと

(7)

提案手法の概要

ドメイン別

ユーザプロファイル

野球 メジャー

・・・

4 9 ・・・

野球 メジャー

・・・

4 9 ・・・

ドメイン専門家

ツイート 一般ツイート

ドメイン特有

単語群

ドメイン別 プロファイル

(8)

ドメイン別 プロファイル

ドメイン特有単語 の 抽出 : オッズ 比

ドメイン特有

単語群 ドメイン専門家

ツイート 一般ツイート ドメイン専門家

ツイート

野球

一般ツイート

どっち

呟かれやす い ??

オッズ比 = > > σ 1

寒い

(9)

ドメイン別辞書の 次元縮約

・・・

3 0 ・・・ 0

・・・

3 0 ・・・ 0 次元大きすぎ !!

プロファイルが疎に !!

共起回数

0 3 1

3 0 7

1 7 0

0 3 1

3 0 7

1 7 0

ケータイ スマホ

メール , line, 充 電

クラスタリング 共起する単語

類似

(10)

ユーザ推薦への応用

・・

3 0 1 2 0 0 3 ・・

, , , ・・

4 5 ・・

・・

3 0 1 2 0 0 3 ・・

・・

4 5 ・・

類似

推薦

非類似 非類似

類似

推薦

非類似

非類似

フレンド

手法 1 手法 2

(11)

評価実験 : データ準備

ドメイン専門家

ツイート 一般ツイート

ドメイン特有

単語群

ドメイン別 プロファイル

20139 月から 約 1 年間

800 万

ツイート

食事関連20

52000

ツイート

推薦対象ユーザ

専門家フォロワーから 約 4100 人

2000 ツイート /1 人 フレンドすべて

オッズ比最低値 σ : 5.0 最低出現回数 θ : 0.005 クラスタ数 単語数 × 0.1

(12)

適合率 (precision)

推薦したユーザ 正解セット

推薦したユーザ 正解セット 当たったやつ

最大値

0.1

最低値

0.0

平均

0.0

precision :

手法

1, 2

い 低

!!

Twitter

の 特徴のため

リアル

友達

つながりやすい

コミュニティ問題 リンク予測

(13)

多様性 : 凝集多様性 (Aggregate diversity)

全ユーザ集合

推薦された ユーザ集合

ここ

どれだけ 大きいか

クラスタリング

有 無

有 0.01 0.06

無 0.05 0.27

手法 1

クラスタリング

有 無

有 0.02 0.09

無 0.09 0.58

手法 1

(14)

多様性 : ユーザ間相違度 (Inter-user diversit y)

おすすめ おすすめ

類似度

クラスタリング

有 無

有 0.01 0.06

無 0.05 0.27

手法 1

クラスタリング

有 無

有 0.02 0.09

無 0.09 0.58

手法 1

(15)

まとめ、今後 の 課題

まとめ

高精度

推薦

向けた、ドメイン別

ユーザプロファイル構築

Twitter

における

ユーザ推薦

今後 課題

k-means クラスタリング

ではなく

LDA

利用

パラメタ値

自動設定

推薦リスト

偏り

改善

ドメイン別ユーザプロファイル

複合的利用

Figure

Updating...

References

Related subjects :