The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
WWW
楽曲情報 評判情報 獲得 基
く楽曲
ベ
作
成
Create the Music Database about Track Information and Reputation Information from World Wide
Web
中島
洋樹
*1岡
将吾
*1新
克己
*1 Hiroki NAKASHIMA Shogo OKADA Katsumi NITTA*1
東京工業大学大学院
総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
In this research, we build a database for recommendation system from text data related to music by World Wide Web (WWW). Our proposed database is composed of reputation information extracted from last.fm, and track information extracted from Wikipedia and has many kind of features which each music has. Reputation information has tag which annotation from last.fm user, and tag’s weight which represent how many used in the track. Track information has producer name, album category and artist category. To evaluate whether our database is effective for recommendation system, we perform preliminary experiment with Contents based filtering for each track feature. Experimental results shows that increase
1.
め
普及 ,高度情報化 情報 信 化 ,大量 常 生成 い ,情報検索 , 情報過多問題 大 課題 い . 問題 解決 手段 情報推薦技術 研究 い .情報推薦技術
主 協調 ン ,内容 基 く ン あ . 協調 ン 推薦要求者(以降, )
や, 評価値 他 比較 嗜好 似 い (以降, ) 決定 ,
高く評価
評価 い い 推薦 .協調 ン 利用 い 代表的 Amazon.com あ .Amazon.com
購入 歴 決定
購入 い い商品 推薦 .内容 基 く ン 推薦対象(以降, ) 士 要素 比較
類似度 測定 ,類似度 高い 推薦 .楽曲推薦 様 ,協調 ン 内容 基 く
ン 行わ い .楽曲推薦 主 音響情報
,楽曲 ンポや音階 解析 情報 楽曲 比 較 行い 間 類似度 測定 .
,音響情報 収集 音源 入手 ,人手 費用 掛 . ,廃盤 ,入手 困 あ .本研究 楽曲 内容 音響情報以外 ,作成
年代や, 特徴 楽曲 作成
情報 楽曲 特徴付け 要素 あ 考え, 存在 情報 ,楽曲情報 抽出 ,情報推薦用
ベ 作成 方法 提案 .本研究 年代 楽
曲情報 wikipedia , 楽曲 対 印象 評判情
報 last.fm , 抽出 楽曲 ベ 作成
, ベ 用い 場合 推薦 従来 手法 推薦 比較分析 ,提案手法 評価 行 .
2.
関連研究
2.1 代表的 楽曲推薦 ス ム
代 表 的 楽 曲 推 薦 iTunes や last.fm,
HORST[Stephan ‘10] 存在 .iTunes 主 協調
ン 専門 家 付け 推 薦 行 い .
last.fm 楽曲 ノ ン 用い
付け い や楽曲 推薦 .HORST
Freebase 用い 好 合 音楽
推薦 目的 い . 新 音楽 推
薦 目的 い .Freebase 2029 ャン 組織
階 構造 持 ベ あ ,HORST ベ
利用 共演や ャン 考慮
好 類似 選択
推薦 .
2.2 関連研究 問題点
iTunes 行わ い 専門家 付け 正確 あ ,
付け自体 手間や費用 .last.fm 自 付け ,楽曲 対 多様 評価 手 入 一方 , 様 評価 表 表記ゆ 存 在 場合 あ , 表記ゆ 改善 必要 あ .
,音楽自体 印象, ャン ,音楽 周辺情報 属性 複数存在 , ン 分類 必要 あ .単
類似度 け 推薦 行 場合,例えば楽曲 映 や
使わ 表 sound track 存在 ,
場合,現行 sound track 付
い 楽曲 推薦 う. 異 映 使わ い 場合 ,両者 関係性 薄い , 映 使わ い 場合 バ 収録 い
知 い 可能性 極 高い 有意義 推薦
い.HORST , ャン 年代 統合 行列
類似度 用い い ,楽曲 推薦 際 類似度 用い ,提案 楽曲 ば 問題 あ .
連絡先:中島 洋樹,東京工業大学 総合理工学研究科知能 専攻,横浜市 区長津 4259, 080-5414-9095,[email protected]
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
3.
獲得要素
関連研究 問題点 ふ え 本研究 ,last.fm 得 各 付与 多様性 持 情報 wikipedia
書 い 客観性 高い楽曲 関 情報 抽出
,多様 観点 楽曲 関 属性 備え ,楽曲推薦用 ベ 作成 .
本研究 獲得 楽曲情報 評判情報 多い 望 い ,英語 曲 選 . ,評判情報 獲得
last.fm 英語 与え い あ .今回,近代
ャ ャン 一 あ 対象
ベ 作成 .提案 ベ 作成方法
wikipedia, last.fm 情報 抽出出来 ャン あ ば適用
可能 あ , け 限 い.
3.1 楽曲情報
Wikipedia 得 楽曲情報 ,楽曲 , ,
, ,収録 い バ ,収録年, 年代 分類 獲得 .
(1) ー ス カ リ
関 要約 あ , 出身地や,誕生年,所属 い 会社や
情報 与え い .
(2) プロ ー
楽曲 作成過程全般 関わ 人物 ,流行 考慮 , 楽曲 方向性 決 い 考え .
(3) 年代ごと 分類
今回扱う 大 3 分類
,1970-1986年 old school hip hop,1987-1999年 golden age hip hop, 以降 new school hip hop .new
school 分類 楽曲 特 ,作成 地域 特徴,
特徴 多様性 あ , ャン 細分化 い
いう特徴 あ .
3.2 評判情報
楽曲 印象 得 ,last.fm 重 獲得
. , 詳細 deeply south
ャン 他 ,catchyや angry 音響 特徴 表 単
語 あ . , 使 度合い 示 重 与え い . 重 0 100 値 .
last.fm API 用い 録 様々 情報 獲得
.本研究 , 好 判 ,
視聴頻度 高い 楽曲 獲得 .
4.
作成 た ータベース
獲得 楽曲情報 評判情報 用い ベ 作成 .
4.1 楽曲情報と評判情報 ータベース
Wikipedia last.fm 得 属性 [Stephan ‘10] 抽出
属性 関係 図1 示 .図 1 示 属性 50
関 2230曲集 .本研究 ャン
あ 年代 分類 HORST 様 要素
考え .
図1: ベ 要素
4.2 ー 評価値行列
(1) ー と ー ス 評価値行列
獲得 1398 視聴頻度 高い
評価値行列 作成 .評価値 得 数(今回
50) 最大値 値 正規化 い .表1 例 示 .
表1: - 評価値行列(各 評価 い い 目 0 入力 )
2Pac Dr. Dre 50 Cent Eminem
User1 19 0 0 0
User2 50 0 1 4
User3 45 1 43 0
User4 38 0 0 2
User5 22 0 0 0
(2) ー と楽曲 評価値行列
視聴頻度 高い楽曲 , 気 入 録 楽 曲 評価値行列 作成 . , 気 入 録 楽 曲 士 優先 得 い ,評価値 0 1 2値
与え .
表2: -楽曲 2値 評価行列
Track1 Track2 Track3 Track4
User1 1 0 0 0
User2 0 1 0 1
User3 1 0 0 1
User4 0 1 1 1
User5 1 1 0 0
5.
予備実験
本研究 作成 ベ 属性 多様性 評価
,[Stephan ‘10] 用い 属性 比較分析 行 .本
実験 楽曲 前 入力 際 ,類似 楽曲 ベ ン ン 検索 , ン ン
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 -
図3:2001年 収録 Fabolous Can’t Deny It 類似度 高い 20曲
図2:楽曲 ベ 用い 推薦
楽曲 ベ 用い ,入力 他 要素 比較 類似度 高い 20件 表示 .以 各手法 用い 属性 概要 述 .
(属性 1). 年代と年代 分類 を考慮 ([Stephan ‘10])
[Stephan ‘10] 用い い 年代 年代 分類 属性
.
(属性 2). Wikipediaから抽出 た楽曲情報 を考慮
, バ 類似度
係数 用い . 係数 楽曲A 楽曲B 要素 集合 , ,類似度 以 式 与え .
�� , = | | + | | × | ∩ |
(属性 3).lastm.fmから抽出 たタグ情報 を考慮
重 比較要素 用い . ,類似度
重 Min/Max値 用い ン距 測定 .楽
曲A,B 重 集合 ,
A = { | � � = , , , . . , }, B = { | � � = , , , … , } ,
sim A, B =
∑
�∈� ∗�×
∗�√∑
�∈� ∗ 2�√∑
�∈� ∗ 2��
∗
=
�− ��
��
− ��
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 - (属性 4).楽曲情報と評判情報を考慮((属性2)+(属性3))
楽曲情報 類似度 評判情報 類似度 加え 類似度 測定 .
5.1 結果と考察
2001年 収録 Fabolous Can’t Deny It い う楽曲 類似度計算 行い(属性1)~(属性4) 属性 用い 場合 検索結果 比較 .表3 (属性1)~(属性4)
属性 用い 場合 20 (artist) 曲
(title) 年代(age) 類似度(similarity) 示 .
図3: (属性1) 用い 場合 100曲 出現回数
図4: (属性2) 用い 場合 100曲 出 現回数
図5: (属性3) 用い 場合 100曲 出 現回数
図6: (属性4) 用い 場合 100曲 出
現回数
図3 (属性1) 用い 場合 結果 示 .年代 年代 分
類 属性 ,年代 近い 検索
ン ン .図4 (属性2) 用い 場合 100曲
出現回数 用い 場合 100 曲
出現回数 示 .楽曲情報全体 用い 推薦
20曲 異 年代 推薦 い .
や バ 一致 考え . , 1100
曲 数 (属性1) 等 . バ
考え .実験(属性1) 様
楽曲 購入 際 バ 購入 推薦 楽 曲 既 視聴 あ 楽曲 あ 予想 . 図5 (属性3) 用い 場合 100曲
出現回数 示 .(属性3) 楽曲 用い , 100曲 数 20人 最 多い結果 .
要素 考慮 い い ,知 い
楽曲 推薦 期待 .図6 (属性 4) 用い
場合 100曲 出現回数 示 .(属性4) 結果
(属性3) 比 数 減
大部分 Fabolous 出身地 一 あ ,
曲 曲調 類似 う 楽曲 ン ン
,多様 尺度 類似 検索 い
分 .
6.
とめ
本研究 年代 楽曲情報 wikipedia ,
楽曲 い 印象 評判情報 last.fm , 抽出
楽曲 ベ 作成 , 評価 検索実験 評価
.今回,検索結果 満足度 評価 い い. ,
楽曲 評価値行列 疎 ,予備
実験 情報 用い .今後 情報 収集
,提案 ベ 備え 推薦 構築
検討 い .
参考文献
[Stephan 2010] Stephan Baumann: Towards a Storytelling Approach for Novel Artist Recommendations, Lecture Notes in Computer Science,2010.
[McVicar 2011] Matt McVicar: The Correlation between Lyrical and Audio Featuers and the Emergence of Mood,
ISMIR ,2011.
[ 中 2012] 中 克己,情報推薦 入門,共立出版,