• 検索結果がありません。

sig sai 2013 03 11 3 Recent site activity jsaisigsai

N/A
N/A
Protected

Academic year: 2018

シェア "sig sai 2013 03 11 3 Recent site activity jsaisigsai"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

潜在クラス 説明モ ルと映画推薦へ 応用

Latent class estimation models and application to Movie Recommendation

河邉千尋

1

2

本村陽一

3,1

廣 薫

1

Chihiro Kawabe

1

, Makoto Yoshida

2

, Yoichi Motomura

3

, and Kaoru Hirota

1

1

東京工業大学

1

Tokyo Institute of Technology

2

東京都立産業技術高等専門学校

2

Tokyo Metropolitan College of Industrial Technology

3

産業技術総 研究所

3

National Institute of Advanced Industrial Science and Technology

Abstract: Models that estimate latent classes for movie recommendation based on PLSA and decision trees are proposed. Proposed model can explain the reason why such recommendation results are given. Using proposed model for so-called cold start problems in recommendation, we can handle the users who don’t have enough records. Instead of conventional PLSA for recommendation, we use decision tree models consist of some questions. So, instead of using user's records, we can recommend suitable movies using user's answers as input of decision trees. In an experiment of questionnaire survey, improvement of the satisfaction of the proposal is 45% in comparison with the previous method by showing the recommendation reason. Another experiment is implemented where the users who have less than 9 movie viewing are recommended more appropriate movies after answering 5 questionnaires.

1 じめに

適 提 供 推薦[1][2][3]

い 協調フ ン [4], 確率的潜在意味解

析(Probabilistic Latent Semantic Analysis PLSA)[5][6]

PLSA 類 潜

在 仮定 各潜在

所属 確率 用い あ 対

適 性 協調フ

PLSA 選択履歴

十 い い時 十 学習

い 推薦 実行 い 問

題 指摘 い [7] 従来 協調フ ン やPLSA 用い 推薦

推薦 理 明示 い 満足度

本研究 推薦理 示 い

満足度 問題 問題 解決

PLSA 抽出 潜在

潜在 説明 構築 推薦や理 提示 適用 方法 提案 ン

PLSA 潜在 推定結

わ 決定木 構築 各潜在 対

説明 提示

問題 新規 対 適

ン 設問 選択 回答

推薦 可能 嗜好

履歴 い 対 推薦 精度 保証 目指 本稿 提案手法 推薦結 満足度評価 従来 PLSA 推薦 精度比較 結 報告

2 確率的潜在意味解析 (PLSA)

確率的潜在意味解析(PLSA) 1 示 間 潜在 仮定 関係 直観的 表現 あ

協調フ ン 推薦エン ン 用い

[6]. 具体的 N M

i j 表 変

xi(i=1,2,,N) yj(j=1,2,,M)

潜在 数 K 仮定 変数 zk

(k=1,2,,K) 潜在

在 所 属 確 率

P(x|z),P(y|z) 各潜在 潜在

全体 対 割 P(z)

(2)

潜在 数 情報 基準[8] 決定

xi yj 潜在 zk 関係

時確率

)

| ( )

| ( ) ( ) , ,

(xi yj zk P zk P xi zk P yj zk

P (1)

xi

yj 共起 Nij 対数尤度



N

i M

j

k j i

ij P x y z

N

L log ( , , ) (2)

次 対数尤度 最大 う

P(z) P(x|z) P(y|z) EM [9]

後 求 用い

適 度



M

j K

k

k k j k i K

k

k k j k i i

j

z P z y P z x P

z P z y P z x P x

y P

) ( ) ( ) (

) ( ) ( ) ( )

( (3)

計算 適 度 高い 推

1 PLSA

PLSA 用い 推薦 通常 協調フ

様 選択履歴 十

い い時 十 推薦 実行 い 問題 あ [7] 推薦

理 わ い 推薦結 対

満足度 向 い

問題 解決 本研究 潜在 説

明 構築 推薦 推薦理 表

示 用い 方法 提案

3 潜在クラス説明モ

PLSA 抽出 潜在 決定木

用い 潜在 説明 2 構築

推薦や理 提示 適用 方法 提案 具体的 後 述 映画 対 各 ン

PLSA 所属

潜在 推定結 組 わ 決定木 構

築 各潜在 対 説明変数 決

. ,推薦時 潜在

所属 思わ 理 提示

潜在 説明 用い 次

う 問題 解決

.新規 各潜在 説明

決定木 含 ン 設問 提示 ,

答結 新規 所属 潜在 推定

,PLSA 結 決定木 潜在 推定結 映画 推薦 . 視聴履歴 い 対 推薦 精度 保証

期待

3 潜在 説明 作成

作成 4AIST映画

用い 前 PLSA P(z)

P(x|z) 算出 定理 P(z|x)

各潜在 所属確率 P(z|x)

大値 0,1 2値変換 行い 決定木

目的変数 ン 説明変数

候補 CART[10] 決定木 構築

潜在 説明 呼ぶ 結 選 変

数 潜在 説明

2 潜在 説明

決定木 学習時 0,1変換 当該潜在

説明 目的変数 他 潜在

所属 当該潜在 0

目的変数 1 0 ンプ 数 相対的 多く いう問題 あ 潜在 説明

学習 推定結 定

0,1 ンプ

(3)

う 具体的 目的変数 1 数 け ン 目的変数 0 ンプ 抽出

0,1 1 1

3 潜在 説明

4 潜在クラス説明モ 構築結果

4.1 AIST 映画 ータベース

使 用 産 業 技 術 総 研 究 所(National Institute of Advanced Industrial Science

and Technology AIST) 2009 映画

ン 視聴態度 関 ン 調査 以 AIST 用い 調査 優 映画 ン ン 知評価 構築 目的 行わ 調査 予備調査 本1次調査 本2次調査 3調査 成 う 本1次調査

用い 6483659 本 映画 対 視聴 有無 1,0 記述 視聴

属性 映画視聴状況属性 ン

ン 属性 い ン 成 本

1 次調査 対象 予備調査回答結 有料 映画 ン ン 視聴数435/ う 映画館 視聴1本以 人 設定 対象映 画 広いカ 様々 映画 ン ン

い 回答 得 う 選 決定木 使用 ン 計97質問 あ

7段階評価 質問全

価 け い 排除 7 段階評価 質問 対 最頻値 評価 70%

回答 い 回答 排除 . 視聴 い 閾値 設け

選別 映画659作品 対 総視聴映画本 数 10本以 使用 . 以 最 終的 使用 4313人 あ

4.2 潜在クラス説明モ 構築

決定木 作成 CART 用い

1 自 指定 剪定

可能 あ 作成 決定木 使 推薦 行う場 入力 目数 指定 う1

岐 あ 決定木 解釈 易い あ 剪定基準 Complexity Parameter(CP)

剪 定 行 う Min+1SE 法 決 定

Min+1SE 交差確

最小値 標準偏差 足 値 あ Min+1SE

内 最大 値 基準 CP 選択

良い い 以 方法 構築

潜在 2 説明 4

4 潜在 2 決定木結

4 潜在 説明 考察

1 変数X830 性別 a 男性 潜在 2 所属 傾向 あ

わ う 各変数 い 考察 X696 ン映画 あ 視 い い う い 7段階評価 1 7 非常 視 全く 視 い 5.5 未満 潜在

2 所属 傾向 X830

(4)

性別b 女性 X698 SF映画 あ 視 い X701 ン 映画 あ 視

い 所属 い わ 以

男性的 ン SF

映画 人 的 付け

様 構築 他 潜在 説明 結 表1

1 各潜在 説明

潜在 説明 妥当 う 各潜在 割 当 映画 考察 各潜在

PLSA 対応 P(y|z) P(y|z)

値 大 い映画10作品 表2

2 各潜在 所属映画 5作品

潜在 1 邦画 喜劇系 潜在 2 ン系 潜在 3 邦画 悲劇系 潜在

4 ンやSF 潜在 5

フ ン 系 映画 所属 い

わ 推薦 実行時 潜在 説明

推薦時 提示 満足度向

5 満足度と推薦精度 比較実験

5.1 潜 在 ク ラ ス 推 定 精 度 と 映 画 推 薦 精

度と 関係

提案 潜在 説明 各潜在

対 所属確率 推定値 求 あ 潜在 推定精度 高け 映画 推薦精度 高い 示 必要 あ 潜 在 推定精度 映画 推薦精度 関係 示

実験 行う

潜在 推定精度 映画 推薦精度 関係

性 明 各 最大P(z|x) 潜在

推定精度 最大 P(z|x) 所属 い

潜在 所属 い 潜在

映画 推薦精度 各 所属 潜在 所属 い 映画 推薦 場

推薦精度 各潜在 内 映画 P(y|z)

大 い 映画 並び替え 100

在 所属 い 映画 各 所

属 い 潜在 所属 い 映画

対 推薦 場 実際 視聴 一

度 見 一 度 潜在 所属 い 映画 う 実際 視聴 映画 一 数

各 総視聴本数 求 総

視聴本数 100作品以 対象 う 一 度 1 映画 観 あ

対象 0 対象 潜在

相関係数 表3

3 潜在 推定精度 映画 推薦精 度 均的 あ 程度 相関 あ わ

潜在 正 く推定

映画 推薦 言え 潜在

推定 提案手法 用い 適 映画 推薦 考え

3 各 相関係数

5.2 推 薦 理 由 提 示 に よ 満 足 度 向 上 実

視聴 推薦 い 推薦理 提示

有無 満足度 比較 ン 調査 確

視聴 PLSA 用い 映画 推薦 際 推薦時 推薦理 提示 い場

潜在ク 潜在ク 説明

1 女性向け 映画好き 監督重視型ク 2 男性的 S 映画ク

3 実話 映画ク

4 映画を く観 ン映画ク

5 子供 も安心映画ク

潜在

1

|A LWA YS 続 日|TH  有頂天

A TH   T  the Las t name|…

2

ン| ン 呪わ た海賊たち

賢者 石|

失わ ク | |…

3 A LWA YS  日|A LWA YS 続 日|TH 有頂天 |硫黄島か 手紙|…

4

ン| ン ワ エン

 ク 王国|硫黄島か

手紙 | ン3|…

5 動く城 |崖 |千 千尋 神隠し|

|…

位5 位映画

潜在ク 相関係数

1 0.569

2 0.772

3 0.671

4 0.567

5 0.784

平均 0.673

(5)

場 満足度 比較 ン 調査

推薦理 提示 各潜

在 所属確率 潜在 説明

得 各潜在 説明 あ

被験者 対 AIST 用い い 映画659作品 対 映画 視聴 有無 入力

う 嗜好 好 変 想定

過去 10 間 観 映画 いう条件

行う 視聴 入力 各被

験者 対 推薦 行う 際 推薦 映画

潜在 説明 潜在 所属確

率 時 提示 プ 推薦 映画 提示 プ け 満足度 差 調 満足度 1 大変 満足 ~7 大変満足

7段階 評価 被験者 独立

9 18

結 表4

4 満足度 ン 結

4 理 提示 有無 満足度 45%向 い わ 次 有意差 確

対応 T検定 行う

等 散性 確 F検定 行う 有意水

0.05 P0.321 帰無仮説 採択

等 散性 確 次 等 散 仮定

T検定 行う 有意水準0.05 P 0.016

帰無仮説 棄却 有意差 あ 確 推薦時 推薦理 提示 有意 満足度 向 確

次 実験後被験者 対 ン ビ 行 推薦理 提示 関わ 満足度

い 理 所属確率 大 い潜在

説明 納得 自 好 表

い 実際 推薦 映画 自

所属 い 潜在 所属 い 映画 推薦 い い う 思う 回答

原因 被験者 最 高い確率 所属 い 潜在 P(z)P(z) 比 小 考え P(z) 潜 在

全体 対 割 表 潜在

所属 い 他 比較

少数 あ 考え P(y|x) 求 時 他

多く推薦 可能性 あ

場 い 最大 所属 い 潜在 所属 い 映画 推薦 問題

解決 考え

推薦後 推薦理 提示 必要性 関 推薦理 提示 推薦 行 全9人中

8 必要 答え

5.3 コ ー ル ス タ ー 状 態 に お け 推 薦

精度 比較実験

AIST 用い 推薦精度比較実験 行う

定木 選 5 目 ン 回答

時 い PLSA 用い 推薦 場 比較 提案手法 方 高

い推薦精度 推薦 確

5.3.1 推薦比較実験

時 け 推薦精度比較実験 行う

学習 割

数 全体 1/10 学習 数

全体 9/10 視聴

十 い 仮定 時

対象 視聴 十 い状況

視聴本数l 9作品未満 状態 あ l

18 推薦精度

l=1,2,,8 視聴

5 変更

5 視聴 作成

視聴 う 1 入 い

部 ン l個選択 選

満足度 満足度

a 5 j 5

b 4 k 6

c 3 l 4

d 3 m 7

e 2 n 5

f 5 o 5

g 5 p 3

h 1 q 6

i 4 r 6

平均 3.56 平均 5.22

理由提示な し 理由提示あ

y1 y2 y3 y4 y5yM

1 0 1 1 0 … 1

y1 y2 y3 y4 y5yM

1 0 0 1 0 … 0

選択したl 視聴

(6)

l1以外 0 変更

視聴 視聴

変更 い い学習 視聴 加え

PLSA 入力

学習 割

次 映画 推薦 2 3 述 う PLSA 潜在 説明 学習

適 度 式(3) 計算

適 度 大 い 映画 並び替え

え う 視聴 1 0 変更

均 算出 推薦精度 結 6

6

6 横軸 映画 視聴本数

縦軸 推薦 実際 観 映画 何

来 い 均 均 あ 6

視聴本数 9本未満 場 PLSA 推薦 決定木 推薦 場 方 均 く 好 映画 推薦 い わ

以 結 決定木 選 5

ン 回答 視聴

十 い 対 推薦 可能 あ 示

次 精度 精度比較実験 行う 適 度 映画 対 推薦 け 後

映画 推薦 仮定 推薦精度

再現率 F尺度 求 10 推薦

仮定 結 620 推薦

仮定 結 7

7 10作品推薦結

8 20作品推薦結

7,8 視聴本数 1本や2 決定

木 推薦 わ PLSA 優 い 視聴本数 増加 PLSA 方 決

定木 優 精度や再現率 落

く 程度 推薦 い わ

5.3.2 推薦精度比較実験考察

推薦精度比較実験 時

PLSA 用い 推薦 比較 回答推薦

方 高い精度 推薦 確

視聴本数 多く PLSA 用い 推薦

け 精度 い 視聴本数

十 対 PLSA 用い 推薦 良い 時 ン 回答 推薦 十 視聴 得 時 PLSA

推薦 替え 必要 あ

5質問 回答 視聴映画

5 作品入力 違い 考察

今 見 あ 映画 複数個入力

場 映画 検索 映画

映画 選 わ け

い 後者 自 見 あ 映画 何作品

(7)

表示 複数個 映画 見 け 負担 大 い ン

確実 ン 回答

う け 推薦 行う 可能 あ い あ

6 おわ

満足度 向 問題 問題 解決

PLSA 決定木 用い 潜在

明 提案 推薦時 推薦理

提示 45%有意 満足度 向

ン 調査 確 視聴

映画本数 9本未満 対 ン

5 回答 視聴履歴 推薦

行う場 均評価法 34%高い精度 映画 推薦 確 精度 再現率

F尺度評価 変わ

結 推定精度 劣 く,

推薦理 提示 満足度向 問題 対 有効性 示

今回提案 各潜在 所属

特性 決定木 解釈出来 潜在 所属 映画

好 い 理解

類 マ ン 応

用 可能 あ 意味 マ ン

潜在 他 用い 再解釈

渡辺2001[12] あ 潜在

回帰 推定

あ 潜在 ン 用い

推定 説明 本研究 異 い

本研究 潜在 説明 決定木 作成 決定木 代わ

回帰 用い [11] 決定木 目 的変数 ンプ ン 方法 今回 ン

0 潜在 0 選択

方法 あ ンプ ン 方法 複数考え 本研究 発展 決定木 説明変数

ン 用い

特徴 用い 場 側

見 潜在 解釈 考え 本や

音楽 他 情報 推薦 応用 今後 課題 あ

参考文献

[ ] 神嶌敏弘 推薦 (1), 人工知

能学会 Vol.22,No6, pp826-837(2007)

[ ] 神嶌敏弘 推薦 (2), 人工知

能学会 Vol.23,No1, pp89-103(2008)

[ ] 神嶌敏弘 推薦 (3), 人工知

能学会 Vol.23,No2, pp248-263(2008)

[ ] Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., and Riedl, J.: GroupLens: An Open Architecture for Collaborative Filtering of Netnews, in Proc. of The Conf. on Computer Supported Cooperative Work, pp. 175186 (1994)

[ ] Hofmann, T.: Probabilistic Latent Semantic Analysis, in Uncertainty in Artificial Intelligence 15, pp. 289296 (1999)

[ ] Hofmann, T.: Latent Semantic Models for Collaborative Filtering, ACM Trans. on Information Systems, Vol. 22, No. 1,pp. 89115 (2004)

[ ] A. Schein, A. Popescul, L. Ungar, D. Pennock:Methods and metrics for cold-start recommendations, 25th Annual ACM SIGIR Conference , pp. 253-260(2002)

[ ] 小西貞則 川源次郎 情報 基準 ,朝倉書店,(2004)

[ ] Dempster, A. P., Laird, N. M., and Rubin, D. B.: Maximum Likelihood from Incomplete Data via The EM Algorithm, Journal of The Royal Statistical Society (B), Vol. 39, No. 1, pp. 138(1977)

[ ] Breiman, L, Friedman, J., Olshen. R., & Stone, C. :Classification and Regression Trees, Wadsworth (1984). Breiman, L. and Friedman, J. Estimating optimal transformations in multiple regression and correlation (with discussion), Journal of the American Statistical Association, 80, 580-619 (1985).

[ ] 本橋 確率 的潜在意味解析

回 帰 用 い 映 画 推薦 利 用 者異 質 性 工学的 学会第1回国 内大会(2013)

[ ] 渡辺美智子 関係 構造 把握

統計手法-潜在 析法- 岡太彬訓 木島正明

口剛 編著 数理 朝倉

書店 75-115(2001)

参照

関連したドキュメント

In recent years there has been much interest in the existence of positive solutions of nonlinear boundary value problems, with a positive nonlinearity f, where the boundary

T. In this paper we consider one-dimensional two-phase Stefan problems for a class of parabolic equations with nonlinear heat source terms and with nonlinear flux conditions on the

In Section 7 two-sided estimates of the mixed moduli of smoothness in terms of the Fourier coefficients are given. It is well known that these results are closely connected to

A., Some application of sample Analogue to the probability integral transformation and coverages property, American statiscien 30 (1976), 78–85.. Mendenhall W., Introduction

It is suggested by our method that most of the quadratic algebras for all St¨ ackel equivalence classes of 3D second order quantum superintegrable systems on conformally flat

A monotone iteration scheme for traveling waves based on ordered upper and lower solutions is derived for a class of nonlocal dispersal system with delay.. Such system can be used

There are many exciting results concerned with the exis- tence of positive solutions of boundary-value problems of second or higher order differential equations with or

Linares; A higher order nonlinear Schr¨ odinger equation with variable coeffi- cients, Differential Integral Equations, 16 (2003), pp.. Meyer; Au dela des