• 検索結果がありません。

PDFファイル 3H3OS24a オーガナイズドセッション「OS24 Deep Learning 」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 3H3OS24a オーガナイズドセッション「OS24 Deep Learning 」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

Deep Collaborative Filtering

Deep Learning

技術

推薦

応用

The application of Deep Learning in Recommender System

和也

*1

松尾

*2

Kazuya Kawakami Yutaka Matsuo

*1

東京大学工学部

創成学科

Program for Social Innovation, The Department of Engineering, The University of Tokyo

*2

東京大学工学系研究科

Department of Technology Management for Innovation, The University of Tokyo

Recently, the new machine learning algorithms called Deep Learning has attracted attention. However, they have not been applied to the tasks of Web, such as Recommender System. This is because difficulties in learning sparse data and handling of data which contain missing values. In this study, we propose a recommendation technique that can learn users’ preferences. The key idea of proposed method is to remove the effects of fluctuations in the preferences of each user/item before applying Deep Learning. This paper provides finding that it is necessary to centralize preference data when recommender system tries to learn from data that is sparse and contain missing values.

1.

じめ

近 , Deep Learning 呼 機械学習 注目

集 い . Deep Learning , 多 ワ

(DNN) 学習 高 表現 獲得

知 , 画像認識, 物体認識, 音声認識,

化 合 物 活 性 予 測 精 度 競 う数 々 ン ン 過 去

記 録 大 幅 塗 え い , 画 像 や 音 声 以 外 分

応用 研究課題 い .

Deep Learning 適用 進 い い分 1 情

報推薦 あ . 情報推薦 , 得

行 動 歴 や ビ 嗜 好 推 定

あ . 推薦 際 使用 嗜好 , カ

好 あ , 全体 好 いう う 階 的 構造

い 考え , ワ 状

段階的 特徴 抽出 う 階 的 表現

学習 期待 .

, Deep Learning 技術 推薦 適用 研究

行わ い い. 原因 , 情報推薦 用い 嗜

好 非常 疎 損値 含 あ , 全体

的 高い評点 や, 全体的 高い評価 う

評価値 ゆ や偏 含 あ い

嗜好 特有 問題 あ 考え .

本研究 Deep Learning 技術 用い 推薦手法 提案

目的 , 評価値 含 ゆ や偏 取 除

用 い 推 薦 特 有 前 処 理 あ 中 心 化 Deep

Learning 組 合わ 手法 提案 , Movie Lens 100K 呼

用 い 評 価 実 験 行 . 中 心 化 用 い

い手法 , 予測値 均 乗誤差 (RMSE) 1.9 程度 ,

学 習 進 対 , 中 心 化 施 後 Deep

Learning 入力 手法 RMSE = 0.98 , 協調

ン 法 回 性能 得 . , 中心化 行

単 ワ 行 予測 RMSE =

1.03 あ 対 , 2 DNN RMSE = 1.01, 3

DNN RMSE = 0.984 性能 向

い 確認 .

研 究 , 評 価 値 揺 対 情 報 推 薦 一 般 的

用 い 中 心 化 呼 前 処 理 有 効 あ わ

, , 1 ン Pre-Training 用い

, 嗜好 階 性 捉え 学習 行い, 性能

向 い いう知見 得 .

本 論 文 , 2 章 , 行 わ Deep

Learning 技術 び 基礎技術 情報推薦 応用 手法

い 述 . 3章 , 本研究 提案 中心化

施 Deep Learning 手 法 い 述 . 4 章 ,

Movie Lens 100K 対 提案手法 適用

評 価 実 験 結 果 示 , ン 協 調 ン

法 結 果 比 較 行 うえ , 提 案 手 法 有 効 性 考 察 .

2.

関連研究

2.1 Deep Learning 技術 応用研究

Deep Learning 研究 理論的 研究 ,

画像, 音声, 自然言語処理 分 応用 進 い

. 応用 際 , 特徴 あわ 入力 方法や,

掛 方 工夫 い い . 本節 ,

成 い 応用技術 い 簡単 .

(1) Convolutional Neural Network (CNN)

CNN [LeCun 1998] , 主 画像認識 分 用い 手

法 あ . 手法 , 画像 近接 画素 強い相関 持

いう特徴 用い . 従来 ワ 、入

力 隠 全結合 い , CNN 入力 近接 画

素 小 い領域 分割 , 小 い領域 隠

結合 う . , 畳 込 小 い一部分

Pooling . う , 画像 並行移動 対

知 い . 画像 同様 , 近接 類

連 絡先 :川 和 也, 東京 大 学 創 成 学科 知 能 社会

, 東 京都 文 京区 弥 生 , ,

w @we y

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

似 い う 現象 , 時系列 , 隣 合

時点 畳 込 Time-Delay Neural Network

提案 い [Waibel 1989].

(2) Conditional Restricted Boltzmann Machine (CRBM)

CRBM [Taylor 2009] 時系列 情報 表現 用い

手法 あ . 手法 , 過去 現在

影響 及 いう特徴 用い . CRBM , あ 時点

学 習 際, 過 去 依 存

あ , 動 作 認 識 や 音 声 認 識 適 用 い . 時 系 列

取 扱い 定 い い , う , 現在

過 去 依 存 い う 系 列 特 徴 い

工夫 い .

(3) Replicated Softmax (RSM)

RSM [Hinton 2009] 文書分類 分 用い 手法

あ . 文書分類 , 文書 ふ 単語 数 素性 入

力 多い , 文書 長 考慮 い

, 長い文章 短い文章 方 異

う. , 文書 含 単語 数 応 大

変化 あ . う , 含

い 情 報 異 う 特 徴 取 入 工 夫

い .

2.2 Deep Learning 技術 推薦シス ムへ 応用

Deep Learning 技術 情報推薦 応用 研究

, 著者 知 う 限 2 件 存在 い.

1 目 , ン ン ン 行う際 素性

Deep Learning 用い 行 あ . 研究 ,

音楽 い 予測 対 , Deep Learning

用い 抽出 音声 特徴 用い 手法 提案 , 既

存手法 大 回 性能 あ い [Van 2013]. ン ン

ン 場合 , 評価値 用い い , 評

価値 揺 や 損値 考慮 必要 , 音声認識

発展 形 推薦 . Deep Learning 技術

画 像 認 識 や 音 声 認 識 い 特 徴 学 習

知 , 画像や音声 , 既 Deep Learning 有効

性 確 認 い ン ン 対 象 ン ン

推薦 有用 あ 考え .

2 目 , ン ン 情報 使わ い協調 ン 法

応用 あ . , RBM 適用 手法 提案

い [Salakhutdinov 2007]. 用い 工夫 , 入力 離

散値 あ 利用 ,

異 間 特 徴 学 習 あ , 損 値 無 視

ン 良 い 性 能 得 示

い . , 研究 Deep Learning 発展 研究

, 単 ワ 階 的 場合

う 分 い い. , 入 力 連 続 値

取 扱う場合 い 研究 行わ い い 現状 あ

.

3.

提案手法

3.1 Deep Learning 技術 単純 適用

情報推薦 対 , 単純 Deep Learning 適

用 手法 , i 評価 j 評点rij 成分

- 行列R 各行ri DNN 入力 , 入

力=出力 う 学習 手法 あ 考え . ri 成分

値 , 1 5 連続値 あ , 連続値 学習

線形 入力 出力 い, 入力, 出力 元数 ,

数 同 . 具体的 入力 , ( 5, 0, 0 ... 3, 0 )

う . う ン 行う , 1 1

rij 対 自分自身 値 出力 う

ン , ン 行 う ' 他

情報 映 . ン 終了後, 各 ri

ワ 入力 , ワ ン

, 別 情 報 含 用 い 自 分 自 身 再 現

r~i 得 , 予測 . 評価指標 , 予測

値 正解 均 乗誤差 (RMSE) .

Deep Learning 様々 あ , 本実験 ,

連続値 柔軟 扱う Auto-Encoder

用い . , 効果 , 学習

方法 違い 性能 及 影響 知 , 以 う 手法

比較 . 各 概要 述 .

Auto-Encoder (AE)

AE , ワ い 入力=出力 う

恒等写像 学習 手法 あ . AE 入力 , 隠 , 出力

, 入力 隠 い 低 元表現 ン

行 い, 隠 出 力 , 入 力 再 構 成

(Reconstruction) う 学 習 . 線 形 3

AE 2乗 Reconstruction-Error 小化 学習 場

合 主成分分析 全 同一 , 隠 表現 主成分

当 , ワ 用い 非線

形変換 行う , 高 表現 獲得 考え

い . 具体的 , 入力 x Wvis 隠 z

ン , Whid 出力 y 場

合 y, z

z = σ( Wvis x+ bvis ) y = σ( Whid z+ bhid )

う 表 , 入力 出力 2 乗誤差 小化 う

ン あ . 本実験 , 活性化関数

関数 , 入力 出力 間 用い 1 隠 い ,

数 10, 100 2 ン 実験 行 .

Denoising Auto-Encoder (DAE)

Denoising Auto-Encoder , Auto-Encoder 汎化能力獲得方

法 1 あ . 隠 構成 い , Auto-Encoder 同

様 , 分 布 生 成 用 い

一 部 無 効 . 際 用 い 分 布

Corruption Rate (p) p = 0.3, 0.5 用い . Stacked Auto-Encoder (SAE)

SAE , AE 入力 近い 1 Pre-Training

全体 Fine-Tuning あ . 隠 数2

3 2 実験 行い, 各 含 数

100 .

Stacked Denoising Auto-Encoder (SDA)

SDA , SAE ン 際, DAE 行 う ,

一部 無効化 同時 行う あ . 構

成 SAE 同 100個 含 2 , 3 ン ,

Corruption Rate (p) DAE 同 p = 0.3, 0.5 .

調整 他 あ , 今回 記

変更 , 学習手法 確率的勾配降 法 (SGD) 用い, 学習

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 - 3.2 中心化を用いた提案手法

中 心 化 前 処 理 行 う 手 法 実 験 手 法 い 述 .

先 述 通 , DNN - 行列r ,

均 差 引い

rij' = rij - bj

入力 手法 実験 . 具体的 入力値 , あ i

j 対 評点 rij = 4 , j い 評点

均 bj = 1.2 場合, 入力値 rij' = 4 - 1.2 = 2.8 . 予

測値 い , ワ 出力 値 r

~ ij'

均 え

r~ij = r~ij' + bj

予測値 . 例え , 先 例 用い i j

対 評 点 均 引 い rij' 対 応 予 測 値

r~ij' = 2.2 あ , 値 対 あ 差 引

い い j い 評点 均bj =1.2 え r

~ ij =

2.2 + 1.2 = 3.4 . 入力以外 3.1 変更 え 実験

行い, 比較 効果 検証 . 各手法 設定

3.1 同様 .

4.

実験

(1) ータセッ

本研究 用い Movie Lens-100K , 映画 推薦 ビ

Movie Lens い 映画 5 段階評価 記録

集 あ , 情 報 推 薦 検 証

用い 標準的 あ . 概要 表1

. 実験 , 80% 訓練 , 残 20%

.

表1 Movie Lens 100K 概要

目 Movie Lens 100K

ン www.movielens.org

集期間 Sept. 20, 1997 – Apr. 22, 1998

種類 5段階評価

数 943

(映画)数 1682

評価数 100,000

度 93.5%

(2) ベースライン手法

本研究 ン , 各 対

評点rij 1 5 ン 値 方法 全評点

均 方 法(全 体 均), 予 測 対 象 評 点

均 方法( 均), 予測対象 評点

均 方法( 均), k-近傍法 用い 協調

ン 用い . 協調 ン 法(CF) ,

均, 均 用い , 近傍 用い

20, 30人 用い . ン手法 実験結果

表2 .

表2 ン手法 実験結果

手法 RMSE

ン 1.892

全体 均 1.124

均 1.073

均 1.063

CF ( 均, k=20) 1.061

CF ( 均, k=30) 1.055

CF ( 均, k=20) 1.051

CF ( 均, k=30) 1.053

(3) 結果

各 予 測 値 正 解 均 乗 誤 差(RMSE) 計

測 結果 表3, 4 .

表3 Deep Learning 単純 適用 場合 実験結果

実験手法 RMSE

AE(10) 1.942

AE(100) 1.940

DAE(10, p=0.3) 1.944

DAE(10, p=0.5) 1.942

DAE(100, p=0.3) 1.956

DAE(100, p=0.5) 1.909

SAE(100-100) 1.961

SAE(100-100-100) 1.953

SDA(100-100,p=0.3) 1.963

SDA(100-100,p=0.5) 1.960

SDA(100-100-100,p=0.3) 1.964 SDA(100-100-100,p=0.5) 1.953

表4 中心化 用い 提案手法 実験結果

実験手法 RMSE

AE(10) 1.033

AE(100) 1.031

DAE(10, p=0.3) 1.021

DAE(10, p=0.5) 1.020

DAE(100, p=0.3) 1.012

DAE(100, p=0.5) 1.017

SAE(100-100) 1.005

SAE(100-100-100) 0.984

SDA(100-100,p=0.3) 0.990

SDA(100-100,p=0.5) 0.944

SDA(100-100-100,p=0.3) 0.944 SDA(100-100-100,p=0.5) 1.001

(4) 考察

本研究 行 実験 結果, 嗜好 直接 DNN 学

習 , 予測値 均 乗誤差(RMSE) 小 い場

合 1.909 大 単純 ン 手法 性能 悪

. , 出力 値や 5 以 値

う , , 影響 大 , 学習

進 い 原因 あ 考え . 具体的 , 未評

価 値 0 い , 全体 評点 小

う 学習 進 あ 考え .

評価 い い値 0 う , 悪い評価 あ 1

悪い評価 . 一方, 中心化 行う , 評

価 い い 商 品 好 嫌 い い 中 間 評 価 取

扱う , 嗜好 特徴 手 学習

考え . , SAE(100-100-100) い 協調

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 4 -

, 隠 数 い 考察 . 増や

精度 向 い , 大 変化

得 い い わ . 原 因 , 隠

10 個 あ 程度 表現 い

考え .

多 効果 い 考察 . え いAE

多 , 性能 向 い

分 . 同様 , p = 0.3 場合 精度

向 , p = 0.5 場合 2 3 際 性能

落 い . 掛 方 ン 性

あ , 一概 いえ い , 入力 破壊

特徴 手 学習出来 考え .

5.

まとめ

本 研 究 , 情 報 推 薦 応 用 い

Deep Learning 技術 情報推薦 適用 手法 提案 ,

実験 性能 評価 行 .

映 画 対 評 点 予 測 対 象 , 生

直接学習 単純 適用 行い, 単純 適用 , 既存手法

一般的 協調 ン 法 回 性能 得 い

確認 . , 情報推薦特有 中心化 呼 前

処理 施 入力 学習 行う , 協調

ン 法 回 性能 得 確認 , 提案手法 有効

性 確認 .

, 評 点 大 異 情 報 推 薦

い , 特徴 取 除い 学習

行う 前処理 中心化 必要 あ 指摘 , 考察

え .

本 研 究 実 験 , ワ ン

際 , 数 汎化能力 獲得 入力

壊 際 Corruption Rate 用い , 他 誤差関数,

初 期 化 方 法, 学 習 計 画 設 定 性 能 影 響 与 え

考え 多 あ . 本研究 実験 , 協調

ン 法 回 性 能 得 確 認 , 今 後

他 い 細 設 定 ,

性能 向 見込 考え い .

, 今回 標準的 映画 対 5

段階評価 含 Movie Lens-100K 用い , 大規模

適用や, 5 段階 離散値 い, 閲覧数 連

続 値 与 え 場 合, ン キ 情 報 考 慮 場 合 適

用手法 関 検討 い い.

参考文献

[LeCun 1998] LeCun, Yann, et al. : "Gradient-based learning

applied to document recognition." Proceedings of the IEEE

86.11 ,1998

[Waibel1989] Waibel, Alex, et al. : "Phoneme recognition using

time-delay neural networks." Acoustics, Speech and Signal

Processing, IEEE Transactions on 37.3, 1989

[Taylor 2009] Taylor, Graham W., and Geoffrey E. Hinton.:

"Factored conditional restricted Boltzmann machines for

modeling motion style." Proceedings of the 26th annual

international conferenceon machine learning. ACM, 2009

[Hinton 2009]Hinton, Geoffrey E., and Ruslan Salakhutdinov.

"Replicated softmax: an undirected topic model." Advances in

neural information processing systems. 2009

[Van 2013]: Van den Oord, Aaron, Sander Dielemanand

BenjaminSchrauwen: "Deep content-based music

recommendation", Advances in Neural Information

Processing Systems, 2013

[Salakhutdinov 2007]Salakhutdinov, Ruslan and Andriy Mnih

and GeoffreyE.Hinton: "Restricted Boltzmann machines for

collaborative filtering", Proceedings of the 24th international

参照

関連したドキュメント

Using the T-accretive property of T q in L 2 (Ω) proved below and under additional assumptions on regularity of initial data, we obtain the following stabilization result for the

We shall see below how such Lyapunov functions are related to certain convex cones and how to exploit this relationship to derive results on common diagonal Lyapunov function (CDLF)

For a positive definite fundamental tensor all known examples of Osserman algebraic curvature tensors have a typical structure.. They can be produced from a metric tensor and a

7.1. Deconvolution in sequence spaces. Subsequently, we present some numerical results on the reconstruction of a function from convolution data. The example is taken from [38],

In this paper we study certain properties of Dobrushin’s ergod- icity coefficient for stochastic operators defined on noncommutative L 1 -spaces associated with semi-finite von

From this figure it is clear that the counter-propagation network is composed of three layers: an input layer that reads input patterns from the training set and forwards them to

It is known that quasi-continuity implies somewhat continuity but there exist somewhat continuous functions which are not quasi-continuous [4].. Thus from Theorem 1 it follows that

The aim of the present section is to prove that the Orthogonality Logic is complete (for all classes of morphisms) in all locally presentable categories iff the following