• 検索結果がありません。

目的指向推薦システム実現に向けた商品特徴とユーザー目的の関連づけ

N/A
N/A
Protected

Academic year: 2021

シェア "目的指向推薦システム実現に向けた商品特徴とユーザー目的の関連づけ"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2016 C8-2

目的指向推薦システム実現に向けた

商品特徴とユーザー目的の関連づけ

Sopheaktra YONG

浅野泰仁

吉川正俊

† 京都大学大学院情報学研究科 〒606-8501 京都市左京区吉田本町 36-1

E-mail: †{[email protected]., asano@, yoshikawa@}i.kyoto-u.ac.jp

あらまし 近年,消費者の購買行動のかなりの部分が実店舗からオンラインショッピングサイトに移行しつつある.そのよう なサイトでは,売り手側は商品の特徴や機能を表示しているが,良い点は記載しても悪い点は滅多に記載されないので,消費者 は自分の目的に合っている商品(例えば,鳥を撮るのに向いたデジタルカメラはどれかなど)を見極めるのに時間を費やすことが 多い.そのため,消費者はしばしば他のユーザーによるレビューを閲覧することになるが,複数の商品のレビューは何百もある ことが多く,非常に時間がかかってしまう.この問題を解決するために,本研究ではまず,「目的指向推薦システム」のアイデ ィアを提案する.これは,レビューを 解析してユーザーの目的に最も合致する商品を,その理由とともに推薦するものである. このシステムの実現には,商品の属性とユーザーの目的を関連づける知識が必要になる.例えば,デジタルカメラの連写機能は 鳥のように高速で移動する物体を撮影するのに有用であるという知識があれば,鳥を撮る目的のユーザーに連射の速いカメラを 推薦できるからである.この知識抽出のためのレビュー分析手法を提案し,Amazon.com のデジタルカメラのレビューデータに 適用した結果について考察する. キーワード 推薦システム, テキストマイニング, レビュー分析

1. は じ め に

ウ ェ ブ が 誕 生 し て 以 来 , オ ン ラ イ ン シ ョ ッ ピ ン グ は 急 激 に 普 及 し , 現 在 で は ご く 日 常 的 な も の と な っ て い る . 従 来 の 実 店 舗 型 の シ ョ ッ ピ ン グ と 比 較 し て , オ ン ラ イ ン シ ョ ッ ピ ン グ は 物 理 的 な 移 動 が 不 要 な た め 労 力 や 時 間 な ど の 面 で 有 利 で あ る こ と に 加 え て , 豊 富 な 商 品 の デ ー タ を 検 索 ・ 比 較 で き る こ と が 便 利 で あ る . さ ら に , オ ン ラ イ ン シ ョ ッ ピ ン グ サ イ ト で は , 購 買 決 定 を 支 援 す る た め の 仕 組 み を 複 数 用 意 し て い る こ と が 多 い . 例 え ば ,Amazon で は , 売 り 手 側 か ら 提 供 さ れ る 商 品 情 報 , 消 費 者 の 購 買 履 歴 に 基 づ い て 商 品 を 推 薦 す る シ ス テ ム , 商 品 の 購 買 者 に よ る オ ン ラ イ ン レ ビ ュ ー 等 が あ り , 消 費 者 は こ れ も 参 考 に す る こ と が で き る よ う に な っ て い る . 推 薦 シ ス テ ム に 使 わ れ て い る 技 術 と し て は , 消 費 者 が 注 目 し て い る 商 品 に 似 て い る 商 品 を 推 薦 す る 手 法 や , 注 目 し て い る 商 品 を 買 っ た 他 の 消 費 者 が 買 っ た 別 の 商 品 や , 購 買 履 歴 が 似 て い る 他 の 消 費 者 が 買 っ た 商 品 を 推 薦 す る 手 法 な ど が 一 般 的 で あ る . し か し , 同 じ よ う な 商 品 で 機 能 が 微 妙 に 異 な る も の も 世 の 中 に は 数 多 く 存 在 し ,そ の 中 で 最 も 自 分 の 使 用 目 的(価 格 の 安 さ や 旅 行 向 き の 軽 さ 等 も 含 む)に 向 い た 機 能 を 持 っ た 商 品 を 選 ぼ う と す る と , こ う い っ た 推 薦 シ ス テ ム で は 不 十 分 な こ と が 多 い . 機 能 を 重 視 し た 推 薦 技 術 と し て , レ ビ ュ ー か ら 商 品 の 機 能 を 自 動 的 に 抽 出 す る 手 法 や , 機 能 に 基 づ い て 自 動 的 に 商 品 を ラ ン キ ン グ す る 手 法 は い く つ か 提 案 さ れ て い る[2,3,9,10,].こ れ ら を 用 い る こ と で , 例 え ば デ ジ タ ル カ メ ラ な ら , 連 写 速 度 ・ 重 量 な ど の 各 機 能 に つ い て , 商 品 を ラ ン キ ン グ す る こ と が で き る . 商 品 の 機 能 と 自 身 の 使 用 目 的 の 関 係 を 熟 知 し て い る 消 費 者 で あ れ ば , 上 記 の よ う に 機 能 に 基 づ い た ラ ン キ ン グ を 用 い て 購 買 す べ き 商 品 を 決 定 す る こ と が お そ ら く は 可 能 で あ る . し か し な が ら , 使 用 目 的 に 必 要 な 機 能 に 関 す る 知 識 の な い 初 心 者 は , そ の よ う な ラ ン キ ン グ や シ ョ ッ ピ ン グ サ イ ト で 提 供 さ れ る 情 報 を 用 い て も 自 分 の 使 用 目 的 に 合 致 し た 商 品 を 選 ぶ の は 容 易 な こ と で は な い .こ れ が 顕 著 な の は ,PC や ス マ ホ の よ う に 本 質 的 に 多 く の 使 用 目 的 が あ る 商 品 で あ る が , カ メ ラ の よ う に 目 的 が 一 見 単 一(撮 影 )に 見 え る も の で あ っ て も , 実 際 は 必 要 と さ れ る 機 能 が 異 な る 数 多 く の 目 的 が あ る 商 品 も あ る .例 え ばCanon の デ ジ タ ル 一 眼 レ フ で あ れ ば , 鳥 な ど の 高 速 動 体 撮 影 に 向 く の は 連 写 速 度 と AF 性 能 に 優 れ る EOS 1DX, 1DX2 や EOS 7D2 で あ り , 細 部 が 重 要 な 風 景 の 撮 影 に は 高 解 像 度 の EOS 5Ds が , 幅 広 い 分 野 の 撮 影 に は 連 写 速 度・AF・解 像 度・高 感 度 ノ イ ズ の バ ラ ン ス に 優 れ た EOS 5D3 が 向 い て い る な ど で あ る . 他 の メ ー カ ー の カ メ ラ に つ い て も こ の よ う な 向 き 不 向 き が あ る .こ う い っ た 知 識 が な い 初 心 者 が ,

(2)

機 能 に 基 づ い た ラ ン キ ン グ を 与 え ら れ て も , 自 身 の 目 的 に 合 致 し た 商 品 を 選 択 す る の は 困 難 で あ る . 他 に 参 考 に な る 情 報 と し て は , 売 り 手 側 の 情 報 と オ ン ラ イ ン レ ビ ュ ー で あ る が , そ の 不 十 分 な 点 に つ い て 以 下 に 詳 し く 述 べ る . ま ず 売 り 手 側 の 情 報 は 機 能(特 徴 , 性 能 等 を 含 む )の 記 述 が 多 く , 使 用 目 的 に 関 し て は ユ ー ザ ー に よ る 違 い も あ る の で カ バ ー し き れ な い こ と や , 向 い て い な い 目 的 が あ え て 記 さ れ て い な い こ と も 多 い . カ メ ラ で 言 え ば 風 景(お よ び 夜 景 )・ ス ポ ー ツ ・ ポ ー ト レ ー ト な ど の 一 般 的 目 的 に 関 し て は メ ー カ ー の 記 述 が あ る こ と も 多 い が , 他 に も 暗 い 体 育 館 の 球 技 ・ 子 供 の 運 動 会 ・ カ ワ セ ミ ・ 昆 虫 ・ 花 ・ 天 体 ・ 建 造 物 ・ ド ッ グ ラ ン ・ カ ー レ ー ス ・ 航 空 機 等 々 の 数 多 く の 目 的 が 存 在 し , そ れ ら に 関 し て 必 要 な 機 能 は 微 妙 に 異 な っ て く る の だ が , そ れ ら 全 て に つ い て 記 述 し て い る メ ー カ ー は な い し , 機 能 か ら こ れ ら の 目 的 に 向 い て い る か ど う か を 判 断 す る こ と は 初 心 者 に は 至 難 の 業 で あ る . 次 に オ ン ラ イ ン レ ビ ュ ー で あ る が , こ れ は 購 買 意 思 決 定 に 非 常 に 重 要 で あ る こ と が 知 ら れ て い る . Dimensional Research の 調 査 [1]に よ れ ば , こ の よ う な サ イ ト に お け る 購 買 意 思 決 定 の90%が オ ン ラ イ ン レ ビ ュ ー に 影 響 さ れ て い る と の こ と で あ る . こ れ は , 売 り 手 側 の 提 供 す る 情 報 と 比 較 し て , オ ン ラ イ ン レ ビ ュ ー の 方 が 宣 伝 目 的 の 記 述 が 少 な く , 実 際 の 使 用 感 に 関 す る 情 報 が 豊 富 で あ る と 消 費 者 た ち が 考 え て い る と い う こ と で あ ろ う .確 か に ,上 記 の 例 に 挙 げ た カ メ ラ やPC の 様 々 な 目 的 に 関 し て も ,そ れ に 必 要 な 機 能 に つ い て , レ ビ ュ ー で 言 及 さ れ て い る こ と は 珍 し く な い . 一 方 で 消 費 者 が レ ビ ュ ー を 読 ん で 複 数 の 商 品 の 中 か ら 自 分 の 目 的 に 合 致 し た も の を 選 ぼ う と す る と , 読 む べ き レ ビ ュ ー の 数 は 非 常 に 多 く な り , 時 間 と 労 力 が か か っ て し ま う . こ の よ う な 理 由 か ら , 消 費 者 の 目 的 に 適 合 し た 商 品 を 自 動 的 に 選 ぶ , ま た は そ の 選 択 に 役 立 つ 推 薦 理 由 な ど の 情 報 を 発 見・整 理 し て く れ る よ う な ,「 目 的 指 向 推 薦 シ ス テ ム 」 が あ れ ば 消 費 者 の 利 便 性 を 大 い に 向 上 さ せ ら れ る と 考 え ら れ る が , そ の 実 現 は 自 明 で は な く , 現 在 で も 挑 戦 的 な 課 題 と な っ て い る . 本 研 究 で は , こ の 「 目 的 指 向 推 薦 シ ス テ ム 」 の 実 現 に 必 要 と 考 え ら れ る 技 術 と し て , オ ン ラ イ ン レ ビ ュ ー か ら 「 商 品 の 使 用 目 的 」 と 「 商 品 の 機 能 」 を 関 連 づ け る 知 識 を マ イ ニ ン グ す る 手 法 を 提 案 す る . 提 案 手 法 は , ま ず そ の 商 品 の 属 す る カ テ ゴ リ に 含 ま れ る 全 て の 商 品 の レ ビ ュ ー か ら , 機 能 に 関 す る 記 述 を 抽 出 す る . 次 に , 各 機 能 に つ い て , そ れ を 含 む 記 述 か ら 使 用 目 的 と 機 能 を 関 連 づ け て 説 明 し て い る 部 分 を 抽 出 す る . さ ら に , こ の 手 法 を Amazon の レ ビ ュ ー デ ー タ セ ッ ト[12]の デ ジ タ ル カ メ ラ に 関 す る 部 分 に 適 用 し , そ の 実 験 結 果 に つ い て 考 察 す る . 本 論 文 の 構 成 は 次 の よ う に な っ て い る .2 節 で は 関 連 研 究 に つ い て 述 べ る . 3 節 で は 目 指 す べ き「 目 的 指 向 推 薦 シ ス テ ム 」の 概 要 を 提 案 す る .「4 節 で は オ ン ラ イ ン レ ビ ュ ー か ら「 商 品 の 使 用 目 的 」と「 商 品 の 機 能 」 を 関 連 づ け る 知 識 を マ イ ニ ン グ す る 手 法 に つ い て 述 べ る .5 節 で は 実 験 と そ の 結 果 に 関 す る 考 察 を 行 い , 6 節 で 結 論 を 述 べ る .

2. 関 連 研 究

消 費 者 の 意 見 , 特 に レ ビ ュ ー か ら 有 用 な 潜 在 的 知 識 を 抽 出 す る こ と は 学 術 的 に も 産 業 的 に も 重 要 な 課 題 と な っ て き て い る 。 レ ビ ュ ー の 中 に は , ユ ー ザ ー の 商 品 使 用 経 験 が 書 か れ て い る こ と も あ る し , 商 品 の 特 定 の 特 徴(機 能 )が 良 か っ た の か 悪 か っ た の か が 書 か れ て い る こ と も あ る . こ う い っ た 知 識 を 抽 出 す る の が 特 徴 に 基 づ く セ ン チ メ ン ト 分 析 で あ る . こ れ は 特 徴 抽 出 , セ ン チ メ ン ト 予 測 , セ ン チ メ ン ト 分 類 , 要 約 作 成 等 を 含 む 研 究 分 野 で あ る [3].特 徴 抽 出 は 語 彙 統 語 (ま た は 文 体),あ る い は 統 語 と 話 法 に 基 づ い て レ ビ ュ ー の テ キ ス ト を 分 析 す る 手 法 が 多 い[4, 5]. そ の う ち , 教 師 あ り の 手 法 の 例 と し て は ,Wong と Lam [6,7]に よ る , 隠 れ マ ル コ フ モ デ ル とCRF(Conditional Random Fields)を 学 習 法 に 用 い て オ ー ク シ ョ ン サ イ ト の 文 章 か ら 特 徴 抽 出 を 行 う 手 法 が 挙 げ ら れ る . 教 師 な し の 手 法 と し て は , Hu と Liu [8] に よ る も の 等 が あ る . 彼 ら は , 商 品 の 特 徴 は 名 詞 か 名 詞 句 で あ る と 仮 定 し , ア ソ シ エ ー シ ョ ン ル ー ル マ イ ニ ン グ を 用 い て レ ビ ュ ー の 集 合 か ら 頻 出 す る ア イ テ ム 集 合 と し て 特 徴 を 抽 出 す る . そ し て , こ の 特 徴 を 表 す 名 詞 ま た は 名 詞 句 に 隣 接 す る 形 容 詞 が ユ ー ザ ー の 意 見 を 表 す も の と し て い る . さ ら に こ れ を 用 い て さ ほ ど 頻 出 し な い 特 徴 を 探 索 す る . 特 徴 に 基 づ く 要 約 生 成 手 法 と し て は ,Kangale ら [9] の , レ ビ ュ ー の テ キ ス ト か ら 各 特 徴 に 関 し て 正 ま た は 負 の レ ー テ ィ ン グ と レ ビ ュ ー の 要 約 を 生 成 す る 手 法 が あ る .ま た ,Kamal [10]は OSVS( Opinion Summarization and Visualization System)と 名 付 け ら れ た , 棒 グ ラ フ と 円 グ ラ フ に よ っ て 商 品 の 特 徴 に 関 す る 多 く の ユ ー ザ ー の セ ン チ メ ン ト の 要 約 を 一 目 で 見 て 取 る こ と が で き る シ ス テ ム を 提 案 し て い る . Filho ら [11]は , 各 特 徴 に 関 し て 異 な る 意 見 を 容 易 に 比 較 で き る グ ラ フ ィ カ ル ユ ー ザ イ ン タ フ ェ ー ス シ ス テ ム で あ るXOpin を 提 案 し て い る . 本 研 究 と 最 も 関 連 が あ る と 考 え ら れ る の は ,Zhang ら[2]に よ る ,各 特 徴 ご と に 推 薦 商 品 の ラ ン キ ン グ を 生 成 す る 手 法 で あ る . こ の 手 法 は , 特 徴 に 関 す る 語 を 含 む 各 文 の 中 か ら , あ ら か じ め 与 え た 構 文 パ タ ー ン(as

(3)

<word> as, the same as 等 )に よ っ て ,比 較 さ れ る 商 品 を 発 見 す る . 前 節 で 述 べ た よ う に , 本 研 究 は 彼 ら の も の と 以 下 の 点 で 異 な っ て い る .(1) 本 研 究 で 対 象 と し て い る の は , 商 品 の 特 徴(機 能 )に 関 し て あ ま り 知 識 の な い 初 心 者 で あ る . し た が っ て 彼 ら は ど の 特 徴 に 基 づ い て 商 品 を 選 択 す れ ば 良 い か わ か ら な い た め , 彼 ら の 手 法 だ け で は 商 品 を 選 択 で き な い と 考 え ら れ る .(2) 各 特 徴 や 商 品 全 体 の レ ビ ュ ー の 要 約 を 生 成 す る 代 わ り に , 特 徴(機 能 )が ユ ー ザ ー の 使 用 目 的 実 現 に ど う 役 立 っ て い る か に 着 目 す る .(3) こ の ,特 徴 (機 能 )と 使 用 目 的 の 関 連 づ け に 基 づ い て ,将 来 は「 目 的 指 向 推 薦 シ ス テ ム 」 を 構 築 し て い く 予 定 で あ る .

3. 目 的 指 向 推 薦 シ ス テ ム

前 述 の よ う に , 商 品 が 技 術 的 特 徴 や 機 能 を 数 多 く 備 え て い る と , 初 心 者 は 自 身 の 目 的 を 達 成 す る た め 買 う べ き 商 品 を 決 定 す る 際 に 困 難 に 直 面 す る .図 1 は ,我 々 が 将 来 に お い て 目 指 し て い る「 目 的 指 向 推 薦 シ ス テ ム 」 の フ ロ ー を 図 示 し た も の で あ る . 図1 「 目 的 指 向 推 薦 シ ス テ ム 」 の フ ロ ー シ ス テ ム は ま ず , 与 え ら れ た 商 品 の カ テ ゴ リ(例 :デ ジ タ ル カ メ ラ)に 対 し て ,可 能 な 目 的 の 候 補 の リ ス ト を 提 示 す る . ユ ー ザ ー は そ の 中 か ら 自 身 の 目 的 を い く つ か 選 択 す る(テ キ ス ト で 入 力 さ れ た 独 自 の 目 的 に 対 応 す る こ と も 別 の 実 現 目 標 と し て 考 え ら れ る).す る と シ ス テ ム が そ の 目 的 に 最 も 関 連 し た 特 徴 ・ 機 能 を 出 力 す る . こ こ で , そ れ ぞ れ の 特 徴 や 機 能 が , ど う し て 目 的 に 重 要 な の か ,そ の 理 由 と 程 度(最 低 限 必 要 な 値 や ,こ れ だ け あ れ ば 十 分 等)も 提 示 す る こ と が で き れ ば さ ら に 理 解 に 役 立 つ と 考 え ら れ る . 最 終 的 に , シ ス テ ム は こ れ ら の 特 徴・機 能 に 基 づ い て ,推 薦 す る 商 品 を 価 格・ 種 別(デ ジ タ ル カ メ ラ で あ れ ば 一 眼 レ フ ,ミ ラ ー レ ス 一 眼 ,レ ン ズ 一 体 式)等 で グ ル ー プ 分 け し て 表 示 す る .ま た , ユ ー ザ ー に 自 身 の カ テ ゴ リ を 入 力 し て も ら い , そ れ を グ ル ー プ 分 け に 役 立 て る と い う 方 法 も 考 え ら れ る . ユ ー ザ ー の カ テ ゴ リ と し て は , そ の 商 品 を 短 期 的 に 使 う の か ,あ る い は 長 期 的 に 使 う の か ,等 が 考 え ら れ る . 長 期 的 に 商 品 を 使 用 す る こ と を 考 え て い る ユ ー ザ ー は , 現 在 は そ の 商 品 カ テ ゴ リ に 関 し て 入 門 レ ベ ル で あ っ て も , 将 来 的 に は プ ロ レ ベ ル 等 に 達 す る ま で 経 験 を 積 み 重 ね た い と 考 え ら れ る . し た が っ て , そ の よ う な ユ ー ザ ー に は , 現 在 の 目 的 を 満 た す だ け で な く , そ の 先 の 発 展 ま で 考 慮 し た 商 品 を 勧 め た 方 が 良 い か も し れ な い . 例 え ば デ ジ タ ル カ メ ラ で あ れ ば , そ の よ う な ユ ー ザ ー に は , レ ン ズ 一 体 式 の カ メ ラ よ り も , 撮 影 そ の も の に 詳 し く な る た め に 必 要 な 各 種 の マ ニ ュ ア ル 撮 影 モ ー ド と , 拡 張 性 を 確 保 す る レ ン ズ 交 換 可 能 な マ ウ ン ト を 備 え た 一 眼 レ フ を 勧 め る 方 が 良 い と 考 え ら れ る . 一 方 で 短 期 的 使 用 で あ れ ば , そ の 目 的 を 達 成 す る の に 十 分 で あ れ ば , 安 価 な レ ン ズ 一 体 式 カ メ ラ を 勧 め た 方 が 良 い で あ ろ う . こ の シ ス テ ム の 肝 と な る 部 分 は , レ ビ ュ ー デ ー タ に 基 づ い て , 商 品 の 特 徴(機 能 )と ユ ー ザ ー の 目 的 を , 関 連 づ け る と こ ろ に あ る . 次 節 で は ,そ の 実 現 の た め に , 我 々 が 現 在 開 発 を 進 め て い る 手 法 を 説 明 す る .

4. 商 品 の 特 徴 と ユ ー ザ ー の 使 用 目 的 を 関 連 づ

け る ア ル ゴ リ ズ ム

4.1 商 品 の 特 徴 の 識 別

こ こ で 対 象 に す る 特 徴 と は , 商 品 に 機 能 を 与 え る 属 性 で あ る . 異 な る 商 品 特 徴 は 異 な る 機 能 を 持 ち , 異 な る 使 用 目 的 に 関 連 づ け ら れ る . 商 品 の 特 徴 を 抽 出 す る こ と 自 体 は 前 節 で 述 べ た 関 連 研 究 等 を 用 い れ ば あ る 程 度 可 能 な の で , こ れ ら の 手 法 な い し 手 動 で 商 品 の 特 徴 を 抽 出 す る こ と を 前 提 と す る .他 に も ,kakaku.com, cnet.com, dpreview.com, consumerreports.org 等 の よ う な デ ジ タ ル カ メ ラ の 機 能 を 紹 介 す る サ イ ト ま た は 商 品 の 特 徴 か ら 商 品 を 検 索 で き る サ イ ト の 情 報 を 用 い て ,自 動 的 に 特 徴 を 抽 出 す る こ と も 可 能 と 考 え ら れ る . 本 稿 の 実 験 で は ,Zhang ら [2]が 手 動 で 選 ん だ デ ジ タ ル カ メ ラ の 特 徴 を 用 い て い る . 表1 は ,そ の 特 徴 と 同 義 語 で あ る . 表1: デ ジ タ ル カ メ ラ の 特 徴 と 類 義 語

D i g i t a l C a m e r a

r e s o l u t i o n / p i x e l / m e g a p i x e l

l e n s / w i d e a n g l e / n o r m a l r a n g e

o p t i c a l / z o o m / o p t i c a l z o o m / d i g i t a l z o o m

m e m o r y / m e g a b y t e s / M B

b u r s t / c o n t i n u o u s / s h u t t e r /

r e c o v e r y / m o t i o n / s p o r t

b a t t e r y / b a t t e r i e s / p o w e r

f o c u s / e x p o s u r e / m a n u a l / i s o

L C D / s c r e e n

c o m p r e s s i o n / c o m p r e s s / j p e g

f l a s h / l i g h t

こ れ ら の 語 に は , 撮 影 に 重 要 な 要 素 で あ る 撮 像 素 子 の サ イ ズ , ダ イ ナ ミ ッ ク レ ン ジ , ロ ー パ ス フ ィ ル タ ー

(4)

の 有 無 , 手 ぶ れ 補 正 , レ ン ズ 交 換 式 の カ メ ラ を 考 慮 し た レ ン ズ の 各 種 性 能(レ ン ズ 自 身 の AF 速 度 や 解 像 度 に 加 え ,F 値 ・ ぼ け 味 や 歪 曲 ・ 周 辺 減 光 ・ 各 種 収 差 等 ), カ メ ラ が 搭 載 す る 現 像 ア ル ゴ リ ズ ム(超 解 像 技 術 ,HDR, 収 差 補 正 技 術)な ど を 含 ん で い な い が ,そ れ で も 今 回 の 手 法 の テ ス ト に は 十 分 な 種 類 の 特 徴 語 を 含 ん で い る と 考 え ら れ る .

4.2 使 用 目 的 に 関 係 す る 文 の 抽 出

今 回 使 用 し た レ ビ ュ ー の デ ー タ は 1,494,938 文 を 含 む が , そ の 約 80% が 上 記 の 特 徴 ま た は そ の 類 似 語 を1 個 以 上 含 ん で い た . こ れ ら の 文 か ら ,特 徴 と 使 用 目 的 を 両 方 含 ん で い る よ う な 文 を 抽 出 す る 手 法 を 提 案 す る . 手 法 を 上 記 の レ ビ ュ ー デ ー タ に 適 用 し た 結 果 と し て , 約 1,000 の 文 が 得 ら れ た . - ま ず , 各 レ ビ ュ ー は 複 数 の 文 が 含 ま れ て い る こ と が 多 い の で ,Punkt Sentence Tokenizer [15] を 用 い て レ ビ ュ ー を 文 に 分 割 す る . こ の う ち , 特 徴 を 含 む も の だ け を 残 す .

- 特 徴 を 含 む レ ビ ュ ー 文 は , し ば し ば そ の 特 徴 が 特 定 の 目 的 に と っ て 良 い か 悪 い か を 示 す 表 現 を 含 ん で い る . 実 際 に デ ー タ に 含 ま れ て い た 例 と し て は ,“The photo burst mode is also nice for catching action shots.” と い う 文 が あ る . こ こ で ,“Catching action shots” の 部 分 が , “burst” (連 射 )機 能 を 用 い る 目 的 と な っ て い る . こ の レ ビ ュ ー の 断 片 は , 高 速 で 移 動 す る 物 体 を 撮 影 す る た め の カ メ ラ を 購 入 す る こ と を 考 え て い る な ら , 連 射 速 度 の 速 い カ メ ラ を 選 ぶ べ き で あ る と い う こ と を 示 唆 し て い る . し た が っ て , 特 徴 を 含 む 文 か ら , そ の 特 徴 の 利 用 に 関 す る 表 現 を 含 む 文 を 抽 出 す る こ と が 次 の ス テ ッ プ と な る . そ の た め に , 商 品 の 特 徴 に つ い て 述 べ た 文 章 の 各 単 語 の part-of-speech (POS)を 解 析 す る こ と で ,こ れ を 実 現 す る .本 手 法 で は , あ ら か じ め 手 動 で 構 築 さ れ た 構 文 パ タ ー ン{Adjective Modifier (JJ, VBD, VBG, VBN) or Adverb Modifier (RB, RBR, RBS) + “for” + Gerund/Noun (VBG, NN)}を 含 む 文 を 抽 出 す る . POS タ グ を 各 単 語 に 割 り 当 て る た め に は , NLTK3.0 [14] を 用 い た . な お ,他 の パ タ ー ン も 検 討 し た が ,現 在 の と こ ろ は こ れ が 最 良 の 結 果 と な っ た . 将 来 的 に は , 手 動 で 構 築 さ れ た パ タ ー ン か ら ブ ー ト ス ト ラ ッ プ の よ う な 方 法 を 用 い て 自 動 的 に パ タ ー ン を 拡 張 し て ゆ く 方 法 や , 使 用 目 的 や 特 徴 の 活 用 法 を 暗 に 含 ん で い る よ う な 文 を 発 見 す る 方 法 も 検 討 す る 予 定 で あ る .

4.3 商 品 特 徴 と 使 用 目 的 の 関 連

上 記 で 得 ら れ た 文 に は , 様 々 な 使 用 目 的 が 含 ま れ て い る が , ユ ー ザ ー に よ る 表 記 の 違 い や , 上 記 の 構 文 パ タ ー ン に 当 て は ま ら な い 文 に 含 ま れ る 目 的 等 も あ る た め , か な り の 間 違 い を も 含 ん で し ま っ て い る こ と が わ か っ た . こ れ を 整 理 す る た め に , あ る 特 徴 を 他 の 特 徴 と 区 別 で き る よ う な 重 要 語 を 取 得 す る 方 法 を 提 案 す る . 例 え ば , “family” と “group” と い う 語 は “wide angle”(広 角 )と い う 特 徴 と 強 い 関 連 が あ る .こ れ は ,広 角 レ ン ズ が 家 族 写 真 や 集 合 写 真 の よ う に , 撮 影 対 象 が 数 多 い 場 合 に 適 し て い る か ら だ と 解 釈 で き る .そ こ で , 提 案 手 法 で は , 以 下 の よ う に Labeled LDA(Latent Dirichlet Allocation)お よ び Word2Vec を 利 用 す る こ と を 考 え た . - Labeled LDA(LLDA)に よ る 重 要 語 の 取 得 : 4.2 節 の 方 法 で 得 ら れ た 文 を LLDA に お け る 「 文 書 」, 各 特 徴 を 「 ラ ベ ル 」 と み な し て , ト ピ ッ ク モ デ リ ン グ を 行 う . こ れ に よ っ て , 各 特 徴 に つ い て 重 要 な 語 を 得 る こ と が で き る .LLDA の 実 装 と し て は ,Stanford Topic Modeling Toolbox [16, 17] を 用 い た . - Word2Vec に よ る ク リ ー ニ ン グ : 上 記 で 得 ら れ た 重 要 語 の 中 に は 雑 音 が 含 ま れ る こ と も あ る . こ れ ら の 雑 音 の 多 く が , 他 の 重 要 語 と は 関 連 の あ ま り な い 語 で あ っ た .そ こ で ,Tomas Mikolov ら に よ っ て 開 発 さ れ た ,単 語 を ベ ク ト ル 化 す る 手 法 で あ るWord2Vec [18, 19] を 利 用 し て , こ れ ら の 雑 音 を 除 去 す る 手 法 を 考 案 し た . 例 え ば LLDA の 結 果 で 得 ら れ た 単 語 集 合 が{breakfast cereal dinner lunch}で あ っ た と す る と ,Word2Vec を 使 っ て 互 い に 似 て い な い”cereal”を 除 く こ と が で き る か ら で あ る . モ デ ル の 訓 練 デ ー タ と し て は , レ ビ ュ ー デ ー タ セ ッ ト の テ キ ス ト か ら 一 般 的 す ぎ る 単 語 や ス ト ッ プ ワ ー ド を NLTK3.0 [14]を 用 い て 除 い た も の を 使 っ た .

5. 実 験 と 考 察

本 節 で は ,Amazon.com の 英 文 レ ビ ュ ー の う ち デ ジ タ ル カ メ ラ の み か ら な る デ ー タ セ ッ ト を 用 い た 実 験 結 果 と そ の ケ ー ス ス タ デ ィ に つ い て 述 べ る .表 2 は ,4.2 節 に 述 べ た 手 法 を 適 用 し て 得 ら れ た ,“burst(連 写 )” 機 能 と 使 用 目 的 の 対 を 含 む 文 に 関 す る も の29 個 の う ち , 一 部 を 表 し て い る .

(5)

2: "burst"機 能 の 使 用 に つ い て 消 費 者 が 何 を 述 べ て い る か

No. Functions or Purposes

1 also excellent for capturing that first baby smile 2 also nice for catching action shots

3 awesome for capturing goofy expressions 4 awesome for taking pano shots which I do a

frequently

. …

28 was great for taking pictures of our eight month old daughter

29 worked great for action

得 ら れ た 結 果 は , 連 写 機 能 が 重 要 に な っ て く る 使 用 目 的 を 表 し て い る も の が ほ と ん ど で あ っ た . し か し な が ら ,#1 と #28 の よ う に ,同 じ 目 的 (こ の 場 合 は 子 供 の 撮 影)に つ い て 異 な る 表 現 を 用 い て い る も の も い く つ か 存 在 し た . こ れ ら の 結 果 を 改 良 す る た め に ,4.3 節 で 述 べ た よ う に labeled LDA と word2vec を 用 い た 結 果 を 以 下 で 説 明 す る . - Labeled LDA 表 3 は , ”burst”ト ピ ッ ク を 構 成 す る 重 要 な 単 語 と そ の ス コ ア で あ る . 左 が 4.2 節 の 手 法 を 適 用 し た 結 果 得 ら れ た , 使 用 目 的 を 表 す 部 分 文 の 集 合 に , Labeled LDA を 適 用 し た 結 果 で あ り , 右 が そ れ 以 外 の 部 分 も 含 め た 文 全 体 に 対 す る 結 果 で あ る . こ の 結 果 を 見 る と , (1) Labeled LDA は , 文 の 一 部 分 の よ う に 短 い ド キ ュ メ ン ト に も う ま く 対 応 で き て い る (2) 4.2 節 の 手 法 を 適 用 し た 方 が ,良 い 結 果 が 得 ら れ て い る , と い う こ と が わ か っ た . 以 下 , そ の 詳 細 を 述 べ る . 表 3: Labeled LDA – 使 用 目 的 に 関 係 す る 文 と ,そ れ 以 外 も 含 め た す べ て の 文 に 対 す る 結 果 Features Purpose-related

sentences Whole sentence

Burst capturing 5.0 kids 3.0 catching 2.0 getting 1.0 recording 0.0 burst 14.0 feature 5.0 love 3.0 second 2.0 photo 1.0 batteries 0.0 Zhang ら [2] の 研 究 に よ れ ば , “burst”機 能 は 高 速 で 移 動 す る 物 体 を 撮 影 す る の に 使 わ れ る も の で あ る . 表 3 の 左 (使 用 目 的 に 関 係 す る 部 分 文 の 結 果 )で 得 ら れ て い る“kids”は ,実 際 に 高 速 で 移 動 す る 物 体 で あ る(走 る 動 き や ,移 り 変 わ る 表 情 等 ).し か し な が ら , 表 3 の 右 (使 用 目 的 に 関 係 す る 文 全 体 の 結 果 ) で は , そ の よ う に 高 速 移 動 物 体 に 関 す る 語 が 現 れ て い な い .し た が っ て ,上 記(1)(2)の 結 果 が 観 察 さ れ た と 言 え る . 一 方 , 表 3 の 左 に 出 現 す る “capturing”, “catching”, “getting” と い う 単 語 は ,そ れ ら 自 身 だ け で は , 何 を 意 味 す る の か が わ か り に く い と い う 問 題 が あ る . そ こ で ,4.3 節 で 述 べ た , Word2Vec に よ る ク リ ー ニ ン グ が 必 要 に な る と 考 え ら れ る . 以 下 で は , そ の 結 果 に つ い て 述 べ る . - Labeled LDA + Word2Vec

表4 は 先 ほ ど の Labeled LDA の 結 果 (左 列 )と ,そ の 結 果 か ら ,Word2Vec を 利 用 し て 外 れ 値 を 除 い た も の (右 列 )で あ る .

Table 4: LLDA LLDA+Word2Vecの 結 果

Features LLDA LLDA + W2V

burst capturing kids catching getting recording capturing kids catching こ の 手 法 で 得 ら れ た(除 か れ ず に 残 っ た )単 語 を 評 価 す る た め に , 表4 の 右 列 の 2 単 語 以 上 を 含 む 文 の 一 部 を 手 動 抽 出 し て ,ケ ー ス ス タ デ ィ を 行 う .表5 は “burst” 機 能 に つ い て 得 ら れ た 結 果 で あ る . 表5: “burst”機 能 に 関 し て 得 ら れ た 使 用 目 的 Features Terms combination Purposes

burst capturing, kids -fantastic for capturing my kids' sports activities -nice for capturing kids running wild kids, catching -great for catching

kids who change their expression quickly こ の よ う に , 上 記 の2 単 語 以 上 を 含 む 文 は , 使 用 目 的 を 良 く 説 明 し て い る こ と が 多 か っ た . こ の 結 果 を 熟 練 者 や プ ロ に 評 価 し て も ら う こ と も 検 討 し て い る .

6. む す び

本 論 文 で は ,使 用 目 的 に 必 要 な 機 能 に 関 す る 知 識 の な い 初 心 者 を 助 け る 「 目 的 指 向 推 薦 シ ス テ ム 」 の 必 要 性 に つ い て 述 べ た 後 , そ の 実 現 に 必 要 な 技 術 と し て , 商 品 の 特 徴 と 使 用 目 的 を 関 連 づ け る 知 識 を 抽 出 す る 手 法 を 提 案 し た . こ の 手 法 で は ,ま ず 商 品 の 特 徴 の 集 合 を 与 え , そ れ を 含 む レ ビ ュ ー か ら 使 用 目 的 に 関 係 す る 文 ま た は 文 の 一 部 を 抽 出 す る .提 案 手 法 をAmazon.com の デ ジ タ ル カ メ ラ の ユ ー ザ ー レ ビ ュ ー に 適 用 し , そ の 結 果 に 関 す る 考 察 を 行 っ た . 結 果 と し て , 初 心 者 の 購

(6)

入 決 定 に 役 立 つ よ う な 知 識 が 得 ら れ た .

将 来 的 に は ,商 品 の 特 徴 を 非 明 示 的 に 記 述 し て い る よ う な 文 章 か ら も 特 徴 と 目 的 を 自 動 的 に 抽 出 す る 手 法 を 提 案 し た い . 例 え ば

This camera is too small to store printable pictures. と い う 文 は , カ メ ラ の 記 憶 容 量 と い う 特 徴 に 関 す る 文 で あ る と 考 え ら れ る が ,”storage”や ”memory”と い う 明 示 的 な 単 語 は 出 現 し て い な い . こ れ ら の 特 徴 も 抽 出 で き れ ば , さ ら に 得 ら れ る 知 識 が 豊 か に な る と 考 え ら れ る . さ ら に 究 極 的 な 目 標 と し て は , 今 回 の 結 果 を さ ら に 発 展 さ せ て , 目 的 指 向 推 薦 シ ス テ ム を 実 際 に 構 築 す る こ と が 挙 げ ら れ る . 謝 辞 本 研 究 はJSPS 科 研 費 15K00423 お よ び 栢 森 情 報 科 学 振 興 財 団 の 助 成 を 受 け た も の で す.

参 考 文 献

[1] Marketing Land, April, 2014

http://marketingland.com/survey-customers-more-fru strated-by-how-long-it-takes-to-resolve-a-customer-s ervice-issue-than-the-resolution-38756 (visited on: Jan 6, 2016)

[2] K. Zhang, R. Narayanan, and A.N. Choudhary, "Voice of the customers: mining online customer reviews for product feature-based ranking." In Proceedings of the 3rd Conference on Online Social Networks, pp. 1-9. 2010.

[3] M. Hu and B. Liu, "Mining opinion features in customer reviews." In Proceedings of the Nineteenth National Conference on Artificial Intelligence, Sixteenth Conference on Innovative Applications of Artificial Intelligence , pp. 755-760. 2004.

[4] A. Das and S. Bandyopadhyay, "Topic-based Bengali opinion summarization." In Proceedings of the 23rd International Conference on Computational Linguistics: Posters, pp. 232-240. Association for Computational Linguistics, 2010.

[5] A. Abbasi, H. Chen and A. Salem, "Sentiment analysis in multiple languages: Feature selection for opinion classification in Web forums." ACM Transactions on Information Systems (TOIS) Vol. 26, No. 3, pp.12:1-12:34, 2008.

[6] T.L. Wong and W. Lam, "Hot item mining and summarization from multiple auction Web sites." In Proceedings of the 5th IEEE International Conference on Data Mining, pp. 797-800, 2005. [7] T.L. Wong and W. Lam, "Learning to extract and

summarize hot item features from multiple auction web sites." Knowledge and Information Systems 14, no. 2, pp.143-160, 2008.

[8] M. Hu and B. Liu, "Mining and summarizing customer reviews." In Proceedings of the tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 168-177, 2004. [9] A. Kangale, S.K. Kumar, M.A. Naeem, M. Williams

and M.K. Tiwari, "Mining consumer reviews to

generate ratings of different product attributes while producing feature-based review-summary. "International Journal of Systems Science (2015): 1-15.

[10] A. Kamal, "Review Mining for Feature Based Opinion Summarization and Visualization." arXiv preprint arXiv:1504.03068 (2015).

[11] C. Brun and G. Rondeau, "A graphical user interface for feature-based opinion mining." In Proceedings of the 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Demonstration Session, pp. 5-8. Association for Computational Linguistics, 2012.

[12] J. McAuley, R. Pandey and J. Leskovec, "Inferring networks of substitutable and complementary products." In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 785-794. ACM, 2015.

[13] C.P. Wei, Y.M. Chen, C.S. Yang and C.C. Yang, "Understanding what concerns consumers: a semantic approach to product feature extraction from consumer reviews." Information Systems and E-Business Management, Vol. 8, No. 2, pp. 149-167, 2010.

[14] Natural Language Toolkit, http://www.nltk.org/

[15] Punkt Sentence Toknenizer,

http://www.nltk.org/modules/nltk/tokenize/punkt.htm l

[16] Stanford Topic Modeling Toolbox,

http://nlp.stanford.edu/software/tmt/tmt-0.4/

[17] D. Ramage, D. Hall, R. Nallapati and C.D. Manning, "Labeled LDA: A supervised topic model for credit attribution in multi-labeled corpora." In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, pp. 248-256. Association for Computational Linguistics, 2009. [18] Gensim Word2Vec,

https://radimrehurek.com/gensim/models/word2vec.h tml

[19] T. Mikolov, K. Chen, G. Corrado and J. Dean, “Efficient Estimation of Word Representations in Vector Space”. In Proceedings of Workshop at International Conference on Learning

Representations (ICLR), 2013.

付 録

6: Part-Of-Speech タ グ と そ の 意 味

Tags Description

JJ Adjective

NN Noun, singular or mass

RB Adverb

RBR Adverb, comparative RBS Adverb, superlative VBD Verb, past tense

VBG Verb, gerund or present participle VBN Verb, past participle

表 4 は 先 ほ ど の Labeled LDA の 結 果 (左 列 )と ,そ の 結 果 か ら ,Word2Vec を 利 用 し て 外 れ 値 を 除 い た も の ( 右 列)で あ る .
表   6: Part-Of-Speech  タ グ と そ の 意 味

参照

関連したドキュメント

This paper summarizes recently developed methods and theories in the developing direction for applications of artificial intelligence in civil engineering, including

*課題関連的訓練(task-related training)は,目的志向的訓練(task-oriented

For X-valued vector functions the Dinculeanu integral with respect to a σ-additive scalar measure on P (see Note 1) is the same as the Bochner integral and hence the Dinculeanu

概要・目標 地域社会の発展や安全・安心の向上に取り組み、地域活性化 を目的としたプログラムの実施や緑化を推進していきます

Guasti, Maria Teresa, and Luigi Rizzi (1996) &#34;Null aux and the acquisition of residual V2,&#34; In Proceedings of the 20th annual Boston University Conference on Language

層の項目 MaaS 提供にあたっての目的 データ連携を行う上でのルール MaaS に関連するプレイヤー ビジネスとしての MaaS MaaS

[r]

[r]