The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
商品
用い
ン
支援
検討
Support system for present selection using product reviews
口
拓明
*1村
哲嗣
*速水
*Hiroaki Taguchi Satoshi Tamura Satoru Hayamizu
*1
岐阜大学
学部
Faculty of Engineering, Gifu University
There are many web sites to select presents. In these sites, attributes of the receiver are labeled for each item on sale and prospective senders can search new items as presents using the information. But not all the items are labeled. This paper proposes a classifier if the item is suitable for a present. The classifier is trained using the review articles with labeled items and their attributes. Using this classifier, attributes for the item without labels are estimated. Subjective evaluations are conducted for the labeled items using the proposed method.
1.
序論
日本 贈答文 いう独特 習慣 あ , 中元, 歳暮
,誕生日 ン 含 ,1 内 贈 物 機
会 頻 繁 あ . , 交 関 係 増 え , 親 し い 人 誕
生 日 祝 う時 ン 贈 , 会 社 司 歳暮 用 意
,相手 贈 物 用意 機会 増え .
近 , ン ネッ ッ ン 利用者 増加し続 中 ,
贈 答 文 , 昔 随 様 変 わ し い . 贈 物
取 扱 ン ネッ ン ン , 例 えば , 楽 天 市
場 く 市場 AEON ,Twitter mixi
等 提携 ウ 等 あ ,多数存在 .
,運営者 ン 適し 商品 選
い .し し, ン ネッ ッ ン 商品
くさ あ ,例えばAmazon 商品数 5000万点,楽天市場
あ ば1億5000万点 あ . 中 ン 適し 商
品 見 非常 手間 あ .
, 本 研 究 商 品 ン 適 し い 自 動
定し, ン 選び 支援 構築 .
2.
関連研究
[堀 2011] ,喜ば ン ,相手 趣味 嗜好 考
慮 し 推 薦 提 案し い . 相 手 趣 向 知 手
段 し ,独自 実装し SNS 行動 解析 し
ン 推薦し い .し し, 推薦手法 SNS
情報 ば商品 ン 適し い 推定
い.本研究 ン 推薦 ,商品
使用 し い , 多く 商品 し ン
適し い 推定 .
検索 び推薦 情報 用い 研究 いく 行わ
い .[倉敷 2007] , 比較 評 価 情 報 し 評 価 象 , 比
較 象 , 属 性, 評 価 抽 出 し, 象 優 劣 ン ン 可 視
し い . 象 映 画 し , 評 価 し 良 い 優
い いう比 較 方法 し い . 本研 究 ,商 品 べ
象 し い , 評 価 優劣 く, ン し 適
し い う 比較し い 点 異 .
3.
提案システム
本 構成図 図1 示 .本 ン
適し 商品 抽出 手法 ,以 2 部 .
図 構成図
(1) 商品 ビュ 収集 .次 各 ビュ
対 ,単語 TF-IDF特徴量 抽出 . ,
プ ゼン 適 い う 定 SVM(Support vector machine) 学習 .
(2) 学習 モ 使用 ,あ 商品 ビュ プ
ゼン 関係 内容 う 定 . , ビュ プ ゼン 関係 内容 商品 ,プ ゼ ン 適 い 商品 .
3.1 商品の ビュ の収集
商 品 , 楽天
取 得 . 様 々 商 品
扱 , 様 々 目 基 検索
.例えば, 使い ン 時 商品 検
連 絡 : 〒501-1193, 国 立大学 法 人岐 阜大 学 学部 速 水 村研究室
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
索 , 商品 .本 ,
使い ン 条 件 検索し,収 し 商 品
, ン し 用い 商品 し 使用
し . ,SVM 学習 作成用 ,商品
新着 取得し .
3.2 TF-IDF特徴量の抽出
ン し 用い 商品 , 新着 取得
し 商 品 形 態 素 解 析 し,TF-IDF 値 計
算 .本研究 ,形態素解析エン ンMeCab[Kudo 2004]
利 用 し, 詞 形 容詞 動詞 単 語 取得 . 詞
形容詞 動 詞 取得 し , 評 析 ,
く使 用さ 品 詞 あ .[白石 2012] , ン ネッ
口 い 粧品 評 析 際 ,
詞 形容詞 動詞 抽出し い . ,
形態素解析 ,MeCab 単語辞書
い未知 語 多 く出現 考え ,未 知語
策 し [黒 澤 2011] 手 法 参 考 MeCab 単 語 辞 書
392,126語 ,Wikipedia 単語 , ワ
単語 計1,449,225語 追加し .
ン し 用い 商品 TF-IDF値 計
算 ,IDF ,新着 取得し 商品 利用し .
ン し 用い 商品 内 単語
し,商品 全体 一般性 高い単語 TF-IDF値 減
少さ あ .
3.3 単語のフィ タ ング
商品 単語 TF-IDF値 ,値 0 多く存在
,SVM 学習 作成 使用 単語
ン 特 徴 的 単 語 限 定 . ン 特 徴 的 単
語 抽出 以 流 行う.
(1) プ ゼン 用い 商品 ビュ 取得 ,
全 文 章 結合 ,TF値 計 算 .こ TF値 ��� � �� .
(2) 新着順 複数件取得 商品 ビュ IDF値 計算
.IDF値 ������ .
(3) プ ゼン 用い 商品 ビュ 内 全
単語 対 ,(1),(2) 計算 ��� � ��値 ������ 値 掛け合わせ,� 求 .� 式(1) 算出 さ .
,� 上位 単語 抽出 .
3.4 SVMの学習
単語ベ SVM 学習 作成 .SVM 、
類 象 2種類 2値 類器 あ ,本研
究 SVM 商品 ン 関連し 内容
あ 定 . SVM 学習 ,正例 し
ン し 用い 商品 利用し,負例 し
新着 複数件取得し 商品 利用 .
3.5 プ ゼン に適した商品の判定
3.4 作成し SVM 学習 利用し,あ 商品
ン 適し い 定 . ,あ 商品 し,
取 得 し 形 態 素 解 析 し TF-IDF 値 算 出 . 次 ,
SVM 用い ン 関連し う 定 .
最後 , 定さ 商品 ン 適し い 商品 し 抽
出 .
4.
評価実験
本手法 有用性 確 実験 行 .
4.1 実験条件
本 実 験 ,3.3 述 べ (1)単 語 ン ,(2)学
習 数 , ン 適 商品 定 識 率
う 変 調査し .
SVM 学習 ,R keanlab *1 利用し .学習
作成 条件 表1 示 .
表1 実験条件
学習 ン し 扱わ 商品
新着 取得し 商品
形態素 詞 形容詞 動詞
特徴量 TF-IDF値
識 関数 SVM
ネ ウ ン ネ
評価 ン条件
評価尺度 適合率,再現率,F値
評 価 , 全 商 品 ン 半 数 抽 出 し
SVM 用い 学習し,抽出し い い半数 い 識
ン 条 件 行 . 評 価 尺 度 , 適 合 率 , 再 現
率,f値 採用し .
(1) 単語のフィ タ ング
単語 ン , ン し 用い 商品
10,000個 ,特徴的 単語 限定し .本実験 ,
限定し 単語数 変 さ ,SVM 識 率 う変
調査し .限定し 単語数 表 2 . ,特徴
的 単語 例 表3 示 .表3 ,単語 TF-IDF値 高い
15個示し あ . ,単語 側 ,
記 述 し . , 学 習 , ン し 扱 わ 商
品 新着 複数件取得し 商品 1000
個 利用し .
表2 ン し 単語数
商品 内
総単語数 割合(%)
20% 40% 60% 80% 100%
単語数(個) 2,354 4,707 7,061 9,414 11,767
表3 特徴単語 例
1 ン 6 く 11 達
2 喜 7 え 12 ッ ン
3 誕生 8 用 13 商品
4 購入 9 人 14 母
5 日 10 思い 15 祝い
� = ��� � �� ∙ ������ (1)
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 - (2) 学習 タ数
学習 数 2,000個 4,000個 6,000個 8,000個 10,000
個 変 さ SVM 学習 識 行 .
学習 数 , ン し 扱わ 商品 新着
取得し 商品 .全体 商品 半数
う 設計し . 学習 以外 実験条件 ,表 1
示し 条件 行 .
4.2 実験結果
(1)単語 フィ タ ング (2)学習 タ数 違い
実験結果 , 表4 表5 示 .ま ,学習 タ 数 違い 実験結果 折 線グ フ 表 図
2 示 .
表4 単語 ン 実験結果
ン し
単語 割合
適合率 再現率 f値
20% 0.809 0.950 0.874
40% 0.800 0.942 0.865
60% 0.800 0.935 0.865
80% 0.800 0.942 0.863
100% 0.798 0.950 0.867
表5 学習 数 変更し 実験結果
学習 数 適合率 再現率 f値
2,000 0.831 0.928 0.877
4,000 0.852 0.945 0.897
6,000 0.865 0.954 0.907
8,000 0.874 0.952 0.911
10,000 0.871 0.955 0.911
図2 学習 数 変更し 実験結果
4.3 考察
(1)単語 ン , ン し 単語 割合
20% 40% 60% 80% 100% 変更 さ , 適合 率 再現 率 f
値 あ 大 変 見 . ,本研究
ン し 単語 割合 減 ,SVM 学習
作 成 時 計 算 時 間 減 , ン 単
語 割合 20% し . (2)学習 タ数 変更
学習 タ 増加 ほ ,学習モ 識 精度 増 加 こ 確認 .ま ,図 2 見 学習 タ
数 2,000 4,000 6,000個 ,適合率 再現率 f値
大 変 化 あ ,6,000 8,000 10,000 個 , あ ま
変化 い ,こ 以上学習 タ数 大 く 識 精度 あま 変わ い 考え . ,
タ数10,000個 使用 適 い 推察 .
5.
被験者実験
本 ,被験者 し ン 適し 商品 提供
調査 ,被験者実験 行 .
5.1 実験条件
評価実験 男女 10 人 被験者 し ,Yahoo! ッ ン
商 品 用 い 行 . Yahoo! ッ ン 商
品 API 基 取得 ,例えば商品
ン 指定し 商品検索 行 う . ,検索し
い商 品 単 語 エ し , 商品検索 行 う .
本実験 ,6 商品 ン 4個 検索し い商品
単語 指定し .表 6,指定し ン 単語 示 .
ン 単語 検索さ 商品 , 1,000個
取得し,SVM ン 適し い 商品 し 抽出し
商品 A(商品数10個) ,商品 ン 抽出し 商品
B(商品数10個) 比較し .被験者 ,商品 A
B 並べ,以 2 質問 し .
商品 中 , ン 適 し 商品
多く含 い ?
商品 選び し ?
本研究 ,被験者 提案手法 抽出し 商品 A 選
割合 算出し,評価し .被験者 商品 A 選 数
,被験者 回答数 � し ,提案手法 抽出し 商
品 選 割合� 式(2) 計算さ .
,SVM 学習 表7 条件 行 .
表6 検索し 商品 ン 単語
商品 ン DIY, 具,文具 ン
楽器,趣味,学習 ン , 酒,家電,家
庭用品
検索単語 エ 熊
表7 実験条件
学習 ン し 扱 わ 商 品
(5,000個)
新 着 複 数 件 取 得 し 商 品
(5,000個)
形態素 詞 形容詞 動詞
特徴量 TF-IDF値
限定し 単語数 全体 20% (2,354単語)
識 関数 SVM
ネ ウ ン ネ
評価 ン条件
評価尺度 適合率,再現率,F値
� = � × (2)
0.760 0.780 0.800 0.820 0.840 0.860 0.880 0.900 0.920 0.940 0.960 0.980
2000 4000 6000 8000 10000
学習 タ数(個)
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 - 5.2 実験結果
実験結果 図3 示 .
図3 被験者実験 実験結果
6.
考察
本研究 提案手法 用い 選 商品 A 商品
ン 抽出し 商品 B 被験者 比較し
,商品 A ン 適し 商品 多く含 い
評価し 回答 均 83% あ . ,提案手法
商品 抽出 有用性 確 .
実験 結 果 ,DIY, 具 ,文具 ン 照 明器 具 エ
・熊 関連し 商品 し, 提案手法 抽出し 商品
選 割合 100% 高い値 あ .以 提案手法
抽出方法 利点 述べ .
DIY, 具,文具 , 商品群 中 ン
適 文具 抽出 い .
ン , ン 適 さ い 家 具 抽 出
,加湿器 ッ ッ ン 小物 抽出
い .
照 明 器 具 , 蛍 灯 日 常 的 使 用 商 品
抽 出 , し ン う く 抽 出
い .
エ , エ 飼育用品 く, エ
し 雑貨 抽出 い .
熊 , エ 様 ,雑貨 抽出 い .
一方,趣味,楽器.学習 関連し 商品
し, 提案 手法 抽出 し 商品 選 割合 50%
い値 あ .以 理 述べ
趣味,楽器, 学習 ,子供 向 商品 多 く抽出さ
.今 回 実験 ,贈 人 指定 , 万人 ン
し 適 し い , 万人 ン
贈 不適 さ .
, 趣 味 , 楽 器 , 学 習 様 , 子 供 向
商 品 多 , 万 人 ン 贈 不
適 さ .
実験結果 ,提案手法 商品抽出 ,小物 し
雑貨 抽出 , ン 適し 商品 選べ い
. ,今回 実験 ,贈 人 限定し ,
万 人 ン 贈 不 適 抽 出 さ い .
今 後 , ン 贈 相 手 季 節 考 慮 し , 商 品 選
ぶ 課題 あ .
7.
結論
本研究 ,商 品 ン 適 し い 自 動 定
構築 行 .
本 ,商品 ン 適し い 定
, ン し 扱わ 商品 情報 用い
. ン し 用い 商品 TF-IDF特徴
量 抽出し,SVM 作成し . SVM 用い ,あ 商品
ン 関係し 内容 定し, 定さ 商品
ン 適し い 商品 し 抽出し .評価実験 し ,
本手法 有用性 確 ,学習 識 精度 確
し . し , 提 案 手 法 , ン 適 し 商 品
定 い 調 べ , 被 験 者 評 価 実 験 行 .
評価実験 ,提案手法 商品 抽出 有用 性 確
.提案手法 商品 抽出 ,小物 し 雑貨
抽出 , ン 適 し 商品 選べ い
. ,今回 実験 ,贈 人 限定し ,万人
ン 贈 不適 抽出さ い .
本 利 用 , 商 品 中 ン
適し 商品 抽出 ,例えば エ 関連
ン 相 手 あ い時 , ン ネッ ッ ン
取 扱 い エ 関 連 商 品 中 ン 適 し
抽 出 , ン 選 ぶ 時 支 援 . ,
ン 適し 商品 選ぶ 商品 使用し
い , 様 々 ン ネッ ッ ン 商 品
あ 商品 中 , ン 適し 商品 取得 .
一方 ,本 ン 贈 象者 ン
ン 適し 商品 抽出 行 い い ,今後 課題
し 贈 相手 ン 考慮し 商品推薦 行 い い.
参考文献
[堀 2011] 堀瑛子, 中 一郎,高瀬 彬,杉浦 秀幸,陸
酉, 栄輔: 嗜好 基 く贈 物 ン
提案,第4回楽天研究開発 ン ウ ,2011.
[倉敷 2007] 倉敷健, 所克人,戸 浩之,内山 俊郎,片
岡 良治,奥 博: 比較評価情報 基 く ン ン 手法,
日 本 ベ 学 会 論 文 (DBSJ Letters) VoL 6,No. 1.pp. 5-8, 2007.
[黒澤 2011] 黒澤義明, 竹澤 幸: 返
信 行 動 着 目 し 投 稿 び 類 ,言 語 処 理学 会
第17 回 次大会発表論文 ,2011.
[Kudo 2004] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto: Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp.230-237, 2004.
[白石 2012] 白石 香利,橋本隆子,久保山哲 : ン
ネッ 口 粧 品 評 析 ,学 習 院
大学計算機 ン , Vol. 33, 2012.
100.0 100.0
50.0 90.0
70.0 70.0
100.0 100.0 100.0
50.0 83.0
0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0 100.0
提案手法
商品ス選
割合
(%
)