The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
Deep Collaborative Filtering
Deep Learning
技術
推薦
応用
The application of Deep Learning in Recommender System
川
和也
*1
松尾
豊
*2
Kazuya Kawakami Yutaka Matsuo
*1
東京大学工学部
創成学科
Program for Social Innovation, The Department of Engineering, The University of Tokyo
*2
東京大学工学系研究科
Department of Technology Management for Innovation, The University of Tokyo
Recently, the new machine learning algorithms called Deep Learning has attracted attention. However, they have not been applied to the tasks of Web, such as Recommender System. This is because difficulties in learning sparse data and handling of data which contain missing values. In this study, we propose a recommendation technique that can learn users’ preferences. The key idea of proposed method is to remove the effects of fluctuations in the preferences of each user/item before applying Deep Learning. This paper provides finding that it is necessary to centralize preference data when recommender system tries to learn from data that is sparse and contain missing values.
1.
じめ
近 , Deep Learning 呼 機械学習 注目
集 い . Deep Learning , 多 ワ
(DNN) 学習 高 表現 獲得
知 , 画像認識, 物体認識, 音声認識,
化 合 物 活 性 予 測 精 度 競 う数 々 ン ン 過 去
記 録 大 幅 塗 え い , 画 像 や 音 声 以 外 分
応用 研究課題 い .
Deep Learning 適用 進 い い分 1 情
報推薦 あ . 情報推薦 , 得
行 動 歴 や ビ 嗜 好 推 定
あ . 推薦 際 使用 嗜好 , カ
好 あ , 全体 好 いう う 階 的 構造
い 考え , ワ 状
段階的 特徴 抽出 う 階 的 表現
学習 期待 .
, Deep Learning 技術 推薦 適用 研究
行わ い い. 原因 , 情報推薦 用い 嗜
好 非常 疎 損値 含 あ , 全体
的 高い評点 や, 全体的 高い評価 う
評価値 ゆ や偏 含 あ い
嗜好 特有 問題 あ 考え .
本研究 Deep Learning 技術 用い 推薦手法 提案
目的 , 評価値 含 ゆ や偏 取 除
用 い 推 薦 特 有 前 処 理 あ 中 心 化 Deep
Learning 組 合わ 手法 提案 , Movie Lens 100K 呼
用 い 評 価 実 験 行 . 中 心 化 用 い
い手法 , 予測値 均 乗誤差 (RMSE) 1.9 程度 ,
学 習 進 対 , 中 心 化 施 後 Deep
Learning 入力 手法 RMSE = 0.98 , 協調
ン 法 回 性能 得 . , 中心化 行
単 ワ 行 予測 RMSE =
1.03 あ 対 , 2 DNN RMSE = 1.01, 3
DNN RMSE = 0.984 性能 向
い 確認 .
研 究 , 評 価 値 揺 対 情 報 推 薦 一 般 的
用 い 中 心 化 呼 前 処 理 有 効 あ わ
, , 1 ン Pre-Training 用い
, 嗜好 階 性 捉え 学習 行い, 性能
向 い いう知見 得 .
本 論 文 , 2 章 , 行 わ Deep
Learning 技術 び 基礎技術 情報推薦 応用 手法
い 述 . 3章 , 本研究 提案 中心化
施 Deep Learning 手 法 い 述 . 4 章 ,
Movie Lens 100K 対 提案手法 適用
評 価 実 験 結 果 示 , ン 協 調 ン
法 結 果 比 較 行 うえ , 提 案 手 法 有 効 性 考 察 .
2.
関連研究
2.1 Deep Learning 技術 応用研究
Deep Learning 研究 理論的 研究 ,
画像, 音声, 自然言語処理 分 応用 進 い
. 応用 際 , 特徴 あわ 入力 方法や,
掛 方 工夫 い い . 本節 ,
成 い 応用技術 い 簡単 .
(1) Convolutional Neural Network (CNN)
CNN [LeCun 1998] , 主 画像認識 分 用い 手
法 あ . 手法 , 画像 近接 画素 強い相関 持
いう特徴 用い . 従来 ワ 、入
力 隠 全結合 い , CNN 入力 近接 画
素 小 い領域 分割 , 小 い領域 隠
結合 う . , 畳 込 小 い一部分
Pooling . う , 画像 並行移動 対
知 い . 画像 同様 , 近接 類
連 絡先 :川 和 也, 東京 大 学 創 成 学科 知 能 社会
, 東 京都 文 京区 弥 生 , ,
w @we y
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
似 い う 現象 , 時系列 , 隣 合
時点 畳 込 Time-Delay Neural Network
提案 い [Waibel 1989].
(2) Conditional Restricted Boltzmann Machine (CRBM)
CRBM [Taylor 2009] 時系列 情報 表現 用い
手法 あ . 手法 , 過去 現在
影響 及 いう特徴 用い . CRBM , あ 時点
学 習 際, 過 去 依 存
あ , 動 作 認 識 や 音 声 認 識 適 用 い . 時 系 列
取 扱い 定 い い , う , 現在
過 去 依 存 い う 系 列 特 徴 い
工夫 い .
(3) Replicated Softmax (RSM)
RSM [Hinton 2009] 文書分類 分 用い 手法
あ . 文書分類 , 文書 ふ 単語 数 素性 入
力 多い , 文書 長 考慮 い
, 長い文章 短い文章 方 異
う. , 文書 含 単語 数 応 大
変化 あ . う , 含
い 情 報 異 う 特 徴 取 入 工 夫
い .
2.2 Deep Learning 技術 推薦シス ムへ 応用
Deep Learning 技術 情報推薦 応用 研究
, 著者 知 う 限 2 件 存在 い.
1 目 , ン ン ン 行う際 素性
Deep Learning 用い 行 あ . 研究 ,
音楽 い 予測 対 , Deep Learning
用い 抽出 音声 特徴 用い 手法 提案 , 既
存手法 大 回 性能 あ い [Van 2013]. ン ン
ン 場合 , 評価値 用い い , 評
価値 揺 や 損値 考慮 必要 , 音声認識
発展 形 推薦 . Deep Learning 技術
画 像 認 識 や 音 声 認 識 い 特 徴 学 習
知 , 画像や音声 , 既 Deep Learning 有効
性 確 認 い ン ン 対 象 ン ン
推薦 有用 あ 考え .
2 目 , ン ン 情報 使わ い協調 ン 法
応用 あ . , RBM 適用 手法 提案
い [Salakhutdinov 2007]. 用い 工夫 , 入力 離
散値 あ 利用 ,
異 間 特 徴 学 習 あ , 損 値 無 視
ン 良 い 性 能 得 示
い . , 研究 Deep Learning 発展 研究
, 単 ワ 階 的 場合
う 分 い い. , 入 力 連 続 値
取 扱う場合 い 研究 行わ い い 現状 あ
.
3.
提案手法
3.1 Deep Learning 技術 単純 適用
情報推薦 対 , 単純 Deep Learning 適
用 手法 , i 評価 j 評点rij 成分
- 行列R 各行ri DNN 入力 , 入
力=出力 う 学習 手法 あ 考え . ri 成分
値 , 1 5 連続値 あ , 連続値 学習
線形 入力 出力 い, 入力, 出力 元数 ,
数 同 . 具体的 入力 , ( 5, 0, 0 ... 3, 0 )
う . う ン 行う , 1 1
rij 対 自分自身 値 出力 う
ン , ン 行 う ' 他
情報 映 . ン 終了後, 各 ri
ワ 入力 , ワ ン
, 別 情 報 含 用 い 自 分 自 身 再 現
r~i 得 , 予測 . 評価指標 , 予測
値 正解 均 乗誤差 (RMSE) .
Deep Learning 様々 あ , 本実験 ,
連続値 柔軟 扱う Auto-Encoder
用い . , 効果 , 学習
方法 違い 性能 及 影響 知 , 以 う 手法
比較 . 各 概要 述 .
Auto-Encoder (AE)
AE , ワ い 入力=出力 う
恒等写像 学習 手法 あ . AE 入力 , 隠 , 出力
, 入力 隠 い 低 元表現 ン
行 い, 隠 出 力 , 入 力 再 構 成
(Reconstruction) う 学 習 . 線 形 3
AE 2乗 Reconstruction-Error 小化 学習 場
合 主成分分析 全 同一 , 隠 表現 主成分
当 , ワ 用い 非線
形変換 行う , 高 表現 獲得 考え
い . 具体的 , 入力 x Wvis 隠 z
ン , Whid 出力 y 場
合 y, z
z = σ( Wvis x+ bvis ) y = σ( Whid z+ bhid )
う 表 , 入力 出力 2 乗誤差 小化 う
ン あ . 本実験 , 活性化関数
関数 , 入力 出力 間 用い 1 隠 い ,
数 10, 100 2 ン 実験 行 .
Denoising Auto-Encoder (DAE)
Denoising Auto-Encoder , Auto-Encoder 汎化能力獲得方
法 1 あ . 隠 構成 い , Auto-Encoder 同
様 , 分 布 生 成 用 い
一 部 無 効 . 際 用 い 分 布
Corruption Rate (p) p = 0.3, 0.5 用い . Stacked Auto-Encoder (SAE)
SAE , AE 入力 近い 1 Pre-Training
全体 Fine-Tuning あ . 隠 数2
3 2 実験 行い, 各 含 数
100 .
Stacked Denoising Auto-Encoder (SDA)
SDA , SAE ン 際, DAE 行 う ,
一部 無効化 同時 行う あ . 構
成 SAE 同 100個 含 2 , 3 ン ,
Corruption Rate (p) DAE 同 p = 0.3, 0.5 .
調整 他 あ , 今回 記
変更 , 学習手法 確率的勾配降 法 (SGD) 用い, 学習
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 - 3.2 中心化を用いた提案手法
中 心 化 前 処 理 行 う 手 法 実 験 手 法 い 述 .
先 述 通 , DNN - 行列r ,
均 差 引い
rij' = rij - bj
入力 手法 実験 . 具体的 入力値 , あ i
j 対 評点 rij = 4 , j い 評点
均 bj = 1.2 場合, 入力値 rij' = 4 - 1.2 = 2.8 . 予
測値 い , ワ 出力 値 r
~ ij'
均 え
r~ij = r~ij' + bj
予測値 . 例え , 先 例 用い i j
対 評 点 均 引 い rij' 対 応 予 測 値
r~ij' = 2.2 あ , 値 対 あ 差 引
い い j い 評点 均bj =1.2 え r
~ ij =
2.2 + 1.2 = 3.4 . 入力以外 3.1 変更 え 実験
行い, 比較 効果 検証 . 各手法 設定
3.1 同様 .
4.
実験
(1) ータセッ
本研究 用い Movie Lens-100K , 映画 推薦 ビ
Movie Lens い 映画 5 段階評価 記録
集 あ , 情 報 推 薦 検 証
用い 標準的 あ . 概要 表1
. 実験 , 80% 訓練 , 残 20%
.
表1 Movie Lens 100K 概要
目 Movie Lens 100K
ン www.movielens.org
集期間 Sept. 20, 1997 – Apr. 22, 1998
種類 5段階評価
数 943
(映画)数 1682
評価数 100,000
度 93.5%
(2) ベースライン手法
本研究 ン , 各 対
評点rij 1 5 ン 値 方法 全評点
均 方 法(全 体 均), 予 測 対 象 評 点
均 方法( 均), 予測対象 評点
均 方法( 均), k-近傍法 用い 協調
ン 用い . 協調 ン 法(CF) ,
均, 均 用い , 近傍 用い
20, 30人 用い . ン手法 実験結果
表2 .
表2 ン手法 実験結果
手法 RMSE
ン 1.892
全体 均 1.124
均 1.073
均 1.063
CF ( 均, k=20) 1.061
CF ( 均, k=30) 1.055
CF ( 均, k=20) 1.051
CF ( 均, k=30) 1.053
(3) 結果
各 予 測 値 正 解 均 乗 誤 差(RMSE) 計
測 結果 表3, 4 .
表3 Deep Learning 単純 適用 場合 実験結果
実験手法 RMSE
AE(10) 1.942
AE(100) 1.940
DAE(10, p=0.3) 1.944
DAE(10, p=0.5) 1.942
DAE(100, p=0.3) 1.956
DAE(100, p=0.5) 1.909
SAE(100-100) 1.961
SAE(100-100-100) 1.953
SDA(100-100,p=0.3) 1.963
SDA(100-100,p=0.5) 1.960
SDA(100-100-100,p=0.3) 1.964 SDA(100-100-100,p=0.5) 1.953
表4 中心化 用い 提案手法 実験結果
実験手法 RMSE
AE(10) 1.033
AE(100) 1.031
DAE(10, p=0.3) 1.021
DAE(10, p=0.5) 1.020
DAE(100, p=0.3) 1.012
DAE(100, p=0.5) 1.017
SAE(100-100) 1.005
SAE(100-100-100) 0.984
SDA(100-100,p=0.3) 0.990
SDA(100-100,p=0.5) 0.944
SDA(100-100-100,p=0.3) 0.944 SDA(100-100-100,p=0.5) 1.001
(4) 考察
本研究 行 実験 結果, 嗜好 直接 DNN 学
習 , 予測値 均 乗誤差(RMSE) 小 い場
合 1.909 大 単純 ン 手法 性能 悪
. , 出力 値や 5 以 値
う , , 影響 大 , 学習
進 い 原因 あ 考え . 具体的 , 未評
価 値 0 い , 全体 評点 小
う 学習 進 あ 考え .
評価 い い値 0 う , 悪い評価 あ 1
悪い評価 . 一方, 中心化 行う , 評
価 い い 商 品 好 嫌 い い 中 間 評 価 取
扱う , 嗜好 特徴 手 学習
考え . , SAE(100-100-100) い 協調
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 -
, 隠 数 い 考察 . 増や
精度 向 い , 大 変化
得 い い わ . 原 因 , 隠
10 個 あ 程度 表現 い
考え .
多 効果 い 考察 . え いAE
多 , 性能 向 い
分 . 同様 , p = 0.3 場合 精度
向 , p = 0.5 場合 2 3 際 性能
落 い . 掛 方 ン 性
あ , 一概 いえ い , 入力 破壊
特徴 手 学習出来 考え .
5.
まとめ
本 研 究 , 情 報 推 薦 応 用 い
Deep Learning 技術 情報推薦 適用 手法 提案 ,
実験 性能 評価 行 .
映 画 対 評 点 予 測 対 象 , 生
直接学習 単純 適用 行い, 単純 適用 , 既存手法
一般的 協調 ン 法 回 性能 得 い
確認 . , 情報推薦特有 中心化 呼 前
処理 施 入力 学習 行う , 協調
ン 法 回 性能 得 確認 , 提案手法 有効
性 確認 .
, 評 点 大 異 情 報 推 薦
い , 特徴 取 除い 学習
行う 前処理 中心化 必要 あ 指摘 , 考察
え .
本 研 究 実 験 , ワ ン
際 , 数 汎化能力 獲得 入力
壊 際 Corruption Rate 用い , 他 誤差関数,
初 期 化 方 法, 学 習 計 画 設 定 性 能 影 響 与 え
考え 多 あ . 本研究 実験 , 協調
ン 法 回 性 能 得 確 認 , 今 後
他 い 細 設 定 ,
性能 向 見込 考え い .
, 今回 標準的 映画 対 5
段階評価 含 Movie Lens-100K 用い , 大規模
適用や, 5 段階 離散値 い, 閲覧数 連
続 値 与 え 場 合, ン キ 情 報 考 慮 場 合 適
用手法 関 検討 い い.
参考文献
[LeCun 1998] LeCun, Yann, et al. : "Gradient-based learning
applied to document recognition." Proceedings of the IEEE
86.11 ,1998
[Waibel1989] Waibel, Alex, et al. : "Phoneme recognition using
time-delay neural networks." Acoustics, Speech and Signal
Processing, IEEE Transactions on 37.3, 1989
[Taylor 2009] Taylor, Graham W., and Geoffrey E. Hinton.:
"Factored conditional restricted Boltzmann machines for
modeling motion style." Proceedings of the 26th annual
international conferenceon machine learning. ACM, 2009
[Hinton 2009]Hinton, Geoffrey E., and Ruslan Salakhutdinov.
"Replicated softmax: an undirected topic model." Advances in
neural information processing systems. 2009
[Van 2013]: Van den Oord, Aaron, Sander Dielemanand
BenjaminSchrauwen: "Deep content-based music
recommendation", Advances in Neural Information
Processing Systems, 2013
[Salakhutdinov 2007]Salakhutdinov, Ruslan and Andriy Mnih
and GeoffreyE.Hinton: "Restricted Boltzmann machines for
collaborative filtering", Proceedings of the 24th international