• 検索結果がありません。

PDFファイル 3M3 「情報推薦」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 3M3 「情報推薦」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

商品

用い

支援

検討

Support system for present selection using product reviews

拓明

*1

哲嗣

*

速水

*

Hiroaki Taguchi Satoshi Tamura Satoru Hayamizu

*1

岐阜大学

学部

Faculty of Engineering, Gifu University

There are many web sites to select presents. In these sites, attributes of the receiver are labeled for each item on sale and prospective senders can search new items as presents using the information. But not all the items are labeled. This paper proposes a classifier if the item is suitable for a present. The classifier is trained using the review articles with labeled items and their attributes. Using this classifier, attributes for the item without labels are estimated. Subjective evaluations are conducted for the labeled items using the proposed method.

1.

序論

日本 贈答文 いう独特 習慣 あ , 中元, 歳暮

,誕生日 ン 含 ,1 内 贈 物 機

会 頻 繁 あ . , 交 関 係 増 え , 親 し い 人 誕

生 日 祝 う時 ン 贈 , 会 社 司 歳暮 用 意

,相手 贈 物 用意 機会 増え .

近 , ン ネッ ッ ン 利用者 増加し続 中 ,

贈 答 文 , 昔 随 様 変 わ し い . 贈 物

取 扱 ン ネッ ン ン , 例 えば , 楽 天 市

場 く 市場 AEON ,Twitter mixi

等 提携 ウ 等 あ ,多数存在 .

,運営者 ン 適し 商品 選

い .し し, ン ネッ ッ ン 商品

くさ あ ,例えばAmazon 商品数 5000万点,楽天市場

あ ば1億5000万点 あ . 中 ン 適し 商

品 見 非常 手間 あ .

, 本 研 究 商 品 ン 適 し い 自 動

定し, ン 選び 支援 構築 .

2.

関連研究

[堀 2011] ,喜ば ン ,相手 趣味 嗜好 考

慮 し 推 薦 提 案し い . 相 手 趣 向 知 手

段 し ,独自 実装し SNS 行動 解析 し

ン 推薦し い .し し, 推薦手法 SNS

情報 ば商品 ン 適し い 推定

い.本研究 ン 推薦 ,商品

使用 し い , 多く 商品 し ン

適し い 推定 .

検索 び推薦 情報 用い 研究 いく 行わ

い .[倉敷 2007] , 比較 評 価 情 報 し 評 価 象 , 比

較 象 , 属 性, 評 価 抽 出 し, 象 優 劣 ン ン 可 視

し い . 象 映 画 し , 評 価 し 良 い 優

い いう比 較 方法 し い . 本研 究 ,商 品 べ

象 し い , 評 価 優劣 く, ン し 適

し い う 比較し い 点 異 .

3.

提案システム

本 構成図 図1 示 .本 ン

適し 商品 抽出 手法 ,以 2 部 .

図 構成図

(1) 商品 ビュ 収集 .次 各 ビュ

対 ,単語 TF-IDF特徴量 抽出 . ,

プ ゼン 適 い う 定 SVM(Support vector machine) 学習 .

(2) 学習 モ 使用 ,あ 商品 ビュ プ

ゼン 関係 内容 う 定 . , ビュ プ ゼン 関係 内容 商品 ,プ ゼ ン 適 い 商品 .

3.1 商品の ビュ の収集

商 品 , 楽天

取 得 . 様 々 商 品

扱 , 様 々 目 基 検索

.例えば, 使い ン 時 商品 検

連 絡 : 〒501-1193, 国 立大学 法 人岐 阜大 学 学部 速 水 村研究室

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

索 , 商品 .本 ,

使い ン 条 件 検索し,収 し 商 品

, ン し 用い 商品 し 使用

し . ,SVM 学習 作成用 ,商品

新着 取得し .

3.2 TF-IDF特徴量の抽出

ン し 用い 商品 , 新着 取得

し 商 品 形 態 素 解 析 し,TF-IDF 値 計

算 .本研究 ,形態素解析エン ンMeCab[Kudo 2004]

利 用 し, 詞 形 容詞 動詞 単 語 取得 . 詞

形容詞 動 詞 取得 し , 評 析 ,

く使 用さ 品 詞 あ .[白石 2012] , ン ネッ

口 い 粧品 評 析 際 ,

詞 形容詞 動詞 抽出し い . ,

形態素解析 ,MeCab 単語辞書

い未知 語 多 く出現 考え ,未 知語

策 し [黒 澤 2011] 手 法 参 考 MeCab 単 語 辞 書

392,126語 ,Wikipedia 単語 , ワ

単語 計1,449,225語 追加し .

ン し 用い 商品 TF-IDF値 計

算 ,IDF ,新着 取得し 商品 利用し .

ン し 用い 商品 内 単語

し,商品 全体 一般性 高い単語 TF-IDF値 減

少さ あ .

3.3 単語のフィ タ ング

商品 単語 TF-IDF値 ,値 0 多く存在

,SVM 学習 作成 使用 単語

ン 特 徴 的 単 語 限 定 . ン 特 徴 的 単

語 抽出 以 流 行う.

(1) プ ゼン 用い 商品 ビュ 取得 ,

全 文 章 結合 ,TF値 計 算 .こ TF値 ��� � �� .

(2) 新着順 複数件取得 商品 ビュ IDF値 計算

.IDF値 ������ .

(3) プ ゼン 用い 商品 ビュ 内 全

単語 対 ,(1),(2) 計算 ��� � ��値 ������ 値 掛け合わせ,� 求 .� 式(1) 算出 さ .

,� 上位 単語 抽出 .

3.4 SVMの学習

単語ベ SVM 学習 作成 .SVM 、

類 象 2種類 2値 類器 あ ,本研

究 SVM 商品 ン 関連し 内容

あ 定 . SVM 学習 ,正例 し

ン し 用い 商品 利用し,負例 し

新着 複数件取得し 商品 利用 .

3.5 プ ゼン に適した商品の判定

3.4 作成し SVM 学習 利用し,あ 商品

ン 適し い 定 . ,あ 商品 し,

取 得 し 形 態 素 解 析 し TF-IDF 値 算 出 . 次 ,

SVM 用い ン 関連し う 定 .

最後 , 定さ 商品 ン 適し い 商品 し 抽

出 .

4.

評価実験

本手法 有用性 確 実験 行 .

4.1 実験条件

本 実 験 ,3.3 述 べ (1)単 語 ン ,(2)学

習 数 , ン 適 商品 定 識 率

う 変 調査し .

SVM 学習 ,R keanlab *1 利用し .学習

作成 条件 表1 示 .

表1 実験条件

学習 ン し 扱わ 商品

新着 取得し 商品

形態素 詞 形容詞 動詞

特徴量 TF-IDF値

識 関数 SVM

ネ ウ ン ネ

評価 ン条件

評価尺度 適合率,再現率,F値

評 価 , 全 商 品 ン 半 数 抽 出 し

SVM 用い 学習し,抽出し い い半数 い 識

ン 条 件 行 . 評 価 尺 度 , 適 合 率 , 再 現

率,f値 採用し .

(1) 単語のフィ タ ング

単語 ン , ン し 用い 商品

10,000個 ,特徴的 単語 限定し .本実験 ,

限定し 単語数 変 さ ,SVM 識 率 う変

調査し .限定し 単語数 表 2 . ,特徴

的 単語 例 表3 示 .表3 ,単語 TF-IDF値 高い

15個示し あ . ,単語 側 ,

記 述 し . , 学 習 , ン し 扱 わ 商

品 新着 複数件取得し 商品 1000

個 利用し .

表2 ン し 単語数

商品 内

総単語数 割合(%)

20% 40% 60% 80% 100%

単語数(個) 2,354 4,707 7,061 9,414 11,767

表3 特徴単語 例

1 ン 6 く 11 達

2 喜 7 え 12 ッ ン

3 誕生 8 用 13 商品

4 購入 9 人 14 母

5 日 10 思い 15 祝い

� = ��� � �� ∙ ������ (1)

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 - (2) 学習 タ数

学習 数 2,000個 4,000個 6,000個 8,000個 10,000

個 変 さ SVM 学習 識 行 .

学習 数 , ン し 扱わ 商品 新着

取得し 商品 .全体 商品 半数

う 設計し . 学習 以外 実験条件 ,表 1

示し 条件 行 .

4.2 実験結果

(1)単語 フィ タ ング (2)学習 タ数 違い

実験結果 , 表4 表5 示 .ま ,学習 タ 数 違い 実験結果 折 線グ フ 表 図

2 示 .

表4 単語 ン 実験結果

ン し

単語 割合

適合率 再現率 f値

20% 0.809 0.950 0.874

40% 0.800 0.942 0.865

60% 0.800 0.935 0.865

80% 0.800 0.942 0.863

100% 0.798 0.950 0.867

表5 学習 数 変更し 実験結果

学習 数 適合率 再現率 f値

2,000 0.831 0.928 0.877

4,000 0.852 0.945 0.897

6,000 0.865 0.954 0.907

8,000 0.874 0.952 0.911

10,000 0.871 0.955 0.911

図2 学習 数 変更し 実験結果

4.3 考察

(1)単語 ン , ン し 単語 割合

20% 40% 60% 80% 100% 変更 さ , 適合 率 再現 率 f

値 あ 大 変 見 . ,本研究

ン し 単語 割合 減 ,SVM 学習

作 成 時 計 算 時 間 減 , ン 単

語 割合 20% し . (2)学習 タ数 変更

学習 タ 増加 ほ ,学習モ 識 精度 増 加 こ 確認 .ま ,図 2 見 学習 タ

数 2,000 4,000 6,000個 ,適合率 再現率 f値

大 変 化 あ ,6,000 8,000 10,000 個 , あ ま

変化 い ,こ 以上学習 タ数 大 く 識 精度 あま 変わ い 考え . ,

タ数10,000個 使用 適 い 推察 .

5.

被験者実験

本 ,被験者 し ン 適し 商品 提供

調査 ,被験者実験 行 .

5.1 実験条件

評価実験 男女 10 人 被験者 し ,Yahoo! ッ ン

商 品 用 い 行 . Yahoo! ッ ン 商

品 API 基 取得 ,例えば商品

ン 指定し 商品検索 行 う . ,検索し

い商 品 単 語 エ し , 商品検索 行 う .

本実験 ,6 商品 ン 4個 検索し い商品

単語 指定し .表 6,指定し ン 単語 示 .

ン 単語 検索さ 商品 , 1,000個

取得し,SVM ン 適し い 商品 し 抽出し

商品 A(商品数10個) ,商品 ン 抽出し 商品

B(商品数10個) 比較し .被験者 ,商品 A

B 並べ,以 2 質問 し .

 商品 中 , ン 適 し 商品

多く含 い ?

 商品 選び し ?

本研究 ,被験者 提案手法 抽出し 商品 A 選

割合 算出し,評価し .被験者 商品 A 選 数

,被験者 回答数 � し ,提案手法 抽出し 商

品 選 割合� 式(2) 計算さ .

,SVM 学習 表7 条件 行 .

表6 検索し 商品 ン 単語

商品 ン DIY, 具,文具 ン

楽器,趣味,学習 ン , 酒,家電,家

庭用品

検索単語 エ 熊

表7 実験条件

学習 ン し 扱 わ 商 品

(5,000個)

新 着 複 数 件 取 得 し 商 品

(5,000個)

形態素 詞 形容詞 動詞

特徴量 TF-IDF値

限定し 単語数 全体 20% (2,354単語)

識 関数 SVM

ネ ウ ン ネ

評価 ン条件

評価尺度 適合率,再現率,F値

= � × (2)

0.760 0.780 0.800 0.820 0.840 0.860 0.880 0.900 0.920 0.940 0.960 0.980

2000 4000 6000 8000 10000

学習 タ数(個)

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 4 - 5.2 実験結果

実験結果 図3 示 .

図3 被験者実験 実験結果

6.

考察

本研究 提案手法 用い 選 商品 A 商品

ン 抽出し 商品 B 被験者 比較し

,商品 A ン 適し 商品 多く含 い

評価し 回答 均 83% あ . ,提案手法

商品 抽出 有用性 確 .

実験 結 果 ,DIY, 具 ,文具 ン 照 明器 具 エ

・熊 関連し 商品 し, 提案手法 抽出し 商品

選 割合 100% 高い値 あ .以 提案手法

抽出方法 利点 述べ .

DIY, 具,文具 , 商品群 中 ン

適 文具 抽出 い .

ン , ン 適 さ い 家 具 抽 出

,加湿器 ッ ッ ン 小物 抽出

い .

照 明 器 具 , 蛍 灯 日 常 的 使 用 商 品

抽 出 , し ン う く 抽 出

い .

エ , エ 飼育用品 く, エ

し 雑貨 抽出 い .

熊 , エ 様 ,雑貨 抽出 い .

一方,趣味,楽器.学習 関連し 商品

し, 提案 手法 抽出 し 商品 選 割合 50%

い値 あ .以 理 述べ

趣味,楽器, 学習 ,子供 向 商品 多 く抽出さ

.今 回 実験 ,贈 人 指定 , 万人 ン

し 適 し い , 万人 ン

贈 不適 さ .

, 趣 味 , 楽 器 , 学 習 様 , 子 供 向

商 品 多 , 万 人 ン 贈 不

適 さ .

実験結果 ,提案手法 商品抽出 ,小物 し

雑貨 抽出 , ン 適し 商品 選べ い

. ,今回 実験 ,贈 人 限定し ,

万 人 ン 贈 不 適 抽 出 さ い .

今 後 , ン 贈 相 手 季 節 考 慮 し , 商 品 選

ぶ 課題 あ .

7.

結論

本研究 ,商 品 ン 適 し い 自 動 定

構築 行 .

本 ,商品 ン 適し い 定

, ン し 扱わ 商品 情報 用い

. ン し 用い 商品 TF-IDF特徴

量 抽出し,SVM 作成し . SVM 用い ,あ 商品

ン 関係し 内容 定し, 定さ 商品

ン 適し い 商品 し 抽出し .評価実験 し ,

本手法 有用性 確 ,学習 識 精度 確

し . し , 提 案 手 法 , ン 適 し 商 品

定 い 調 べ , 被 験 者 評 価 実 験 行 .

評価実験 ,提案手法 商品 抽出 有用 性 確

.提案手法 商品 抽出 ,小物 し 雑貨

抽出 , ン 適 し 商品 選べ い

. ,今回 実験 ,贈 人 限定し ,万人

ン 贈 不適 抽出さ い .

本 利 用 , 商 品 中 ン

適し 商品 抽出 ,例えば エ 関連

ン 相 手 あ い時 , ン ネッ ッ ン

取 扱 い エ 関 連 商 品 中 ン 適 し

抽 出 , ン 選 ぶ 時 支 援 . ,

ン 適し 商品 選ぶ 商品 使用し

い , 様 々 ン ネッ ッ ン 商 品

あ 商品 中 , ン 適し 商品 取得 .

一方 ,本 ン 贈 象者 ン

ン 適し 商品 抽出 行 い い ,今後 課題

し 贈 相手 ン 考慮し 商品推薦 行 い い.

参考文献

[堀 2011] 堀瑛子, 中 一郎,高瀬 彬,杉浦 秀幸,陸

酉, 栄輔: 嗜好 基 く贈 物 ン

提案,第4回楽天研究開発 ン ウ ,2011.

[倉敷 2007] 倉敷健, 所克人,戸 浩之,内山 俊郎,片

岡 良治,奥 博: 比較評価情報 基 く ン ン 手法,

日 本 ベ 学 会 論 文 (DBSJ Letters) VoL 6,No. 1.pp. 5-8, 2007.

[黒澤 2011] 黒澤義明, 竹澤 幸: 返

信 行 動 着 目 し 投 稿 び 類 ,言 語 処 理学 会

第17 回 次大会発表論文 ,2011.

[Kudo 2004] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto: Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp.230-237, 2004.

[白石 2012] 白石 香利,橋本隆子,久保山哲 : ン

ネッ 口 粧 品 評 析 ,学 習 院

大学計算機 ン , Vol. 33, 2012.

100.0 100.0

50.0 90.0

70.0 70.0

100.0 100.0 100.0

50.0 83.0

0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0 100.0

提案手法

商品ス選

割合

(%

)

参照

関連したドキュメント

The conditions of Theorem 10 are often satisfied in so-called Greechie logics when one takes for a and b atoms lying in different maximal Boolean sub- algebras.. (Greechie logics

After proving the existence of non-negative solutions for the system with Dirichlet and Neumann boundary conditions, we demonstrate the possible extinction in finite time and the

This paper presents an investigation into the mechanics of this specific problem and develops an analytical approach that accounts for the effects of geometrical and material data on

New reductions for the multicomponent modified Korteveg de Vries (MMKdV) equations on the symmetric spaces of DIII-type are derived using the approach based on the reduction

In addition, we prove a (quasi-compact) base change theorem for rigid etale cohomology and a comparison theorem comparing rigid and algebraic etale cohomology of algebraic

This problem becomes more interesting in the case of a fractional differential equation where it closely resembles a boundary value problem, in the sense that the initial value

based on variational methods established the existence of an unbounded sequence of weak solutions for a class of differential equations with p(x)-Laplacian and subject to

When relativistic quantum mechanics and field the- ory emerged, the half-integer internal angular momentum was interpreted in terms of the complex special linear group SL(2, C ) as