• 検索結果がありません。

sig sai 2013 03 11 2 Recent site activity jsaisigsai

N/A
N/A
Protected

Academic year: 2018

シェア "sig sai 2013 03 11 2 Recent site activity jsaisigsai"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

大規模データ 潜在 ス構造化モデ ン を用いた

消費者行動理解技術

Consumer Understanding based on

Latent Class Structure Modeling using Big Data

本村陽一

12

柴等

1

竹中毅

1

島実

2

田島健蔵

2

1

産業技術総 研究所 工学研究 ン

東京工業大学大学院知能 科学専攻

Abstract: 現場 集積 大規模 IDPOS (購買履歴)を用い 消費者を理

解 ,需要を予測 消費者 価値 向 や経費 削減を 望 い .本研

究 ,確率的潜在意味解析(PLSA)を用い 顧客を潜在 類 後, 潜在 を説明 構

造化 を ン ッ 構築 潜在 構造化 をIDPOS 構築 .

. じめに

近 , ,

物 質 的 価 値 生 活 質(QoL)や 経 験 価 値

視 う 時代 い .

い , 工 学 期 待 役 割 , 従 来 物 質 的 価 値 や製品 機能を対象 技術開発 , を媒

,生活や い

を直接 対象 再現性 あ 組 作 や技術

開発 展開 いく 予想 .例え

生産や 売を最適化 場

面 あ , 対 購買行動や使用経験

いう 方を主眼 消費者 感 価

値自体 技術 要 .

,大規模 を活用 技術研究開発

,持 的 集を ,実際

現場 技術 入 必須

. ,初期 課 解決 健在化

利用者 理解 容易 技術 入 必要 あ .

本研究 消費者 価値を高

施策 を可能 ,購買行動 履歴 あ

2 ID-POS や約200店舗

を有 ッ ン 1 ,約15万人

大規模 を用い 消費者 来店購買行動を

場所や時間 状況依存性 含 化を行

い, 提供者 消費者行動を理解 , ン や施策,経営 を支援 技術 い 述 .

. サービス工学

特有 課 対 ,熟練者 経験

を脱却 , 現場 起 象を客観的

観測 , を 析 得 計算論的

基 い ,あ を最適化 , を現

場 適用 いう 最適設計 ,

を連 的 改良 工学 提案

い [1,2,3,4]. う 動 的

考え ,従来 ッ 物質的

価値 く,時 変化 動的 価

値 可能 . 提供

容者 知 容者 意識や行

動を変容 , 価値

顕在化 ,最適化を行う 利用者

知 評価 行動 入 不可 .

, 知 評価 行動 をい

現場 生 大規模 構築

, いう 技術的課 ,利用者 集団

を対象 来 不確実性や利用者 心理

的要因や状況依存性 基 く不確実性 対処 ン 技術 入 必要 .

. 大規模データ 行動モデ 構築

う 不確実性や大規模 を 扱う 一 方法 確率 や統計的学習 あ .日

常的 生 大規模 対 記述 ,

計算 点 ,扱う対象自体を本質的 確率的,

統計的 考え を得 い. 確率

(2)

を使 対象を 化 ,知 い変数 確率 布を推定 , え 各状態 確 率(確 信 度)を 評 価 確 率 的 枠 組 を 人 行 動

ン 適用 .不確実 対象を 確率変数

, く ン 問 領域 を明示化 ,

確率変数 布を 推定 ,

を大 統計 経験的 構

可 能 . 具 体 的 利 用 者

知 評価構造を ン ッ 化 ,情

報推薦や ン 応用 例や生活者 来

店 行 動 注 目 顧 客 ン ン

[5,6,7,8,9] 研究 .本稿

大規模 含 時間や場所 基 い 顧客

ン 化を確率的潜在意味解析 行い,

商品 択傾向 組 わ ン

ン を ン ッ [10] 構 造 的 化 消費者行動理解を支援 技術 い , 時間情報 空間情報を 入 例 い 述 (1)

1 確率的潜在意味解析 ン ッ

. ID-54S データと潜在 ス分析

工学 い ,顧客 異質性を考慮

必須 あ , 顧客 ン を求

現場 生 大規模 を

活用 自然 あ . 単 顧客 析

, 計算 顧客 ン を活

用 支援技術を開発 抽出 顧客

ン を様々 情報 活用 計算

集積 組 を考え 要 課

. ン や ン

顧客を ID 化 購買履歴を集積 大規模

ID-POS あ .従来

現場 利用 い 顧客 ン

ン 代表的 RFM 析 呼 ,直近 来店日,来店回数,購入金 数値指標 顧

客 特性を 化 あ , 直接

商品 真 生活者理解を行う

い. 顧客 商品 方 い ,有効 施 策 実施 可能 顧客 ン や商品 を, 大規模 利用者 商品 択行動 類似性 基 い 自動的 抽出 方法 必要 い .

得 基 い 購買状況や購買

ン 関係 顧客行動を推定 ,提供 商品や情報を適応的 変化 利用者や

提供者 望 い 最適化 可能

. 々 現 場 観 測

ID-POS 利用可能

動生 顧客行動 関 計算 構築技術

潜在 析 ン ッ を組 わ

顧客 化技術を開発 い . ,

潜 在 析 一 種 あ 確 率 的 潜 在 意 味 解 析 (pLSA) ,顧客毎 商品 買い方,商品

買わ 方 似 い を同一 併

操作を繰 返 IDPOS 顧客 商品を同時 類 生 を行う. 具体的 ,顧客xi 商品yj 共起行列を

作 ,共起 度をn(i,j) 表 . ,顧客 商品

所属 潜在 をzk (k=1,2,) 表 .

xi yj,潜在 zk 関係を 式,

P(xi, yj) = P(xi| zk)P(yj| zk)

k

P(zk) (1)

化 . 以 対数尤度を最大化

EM P(z)P(x|z)P(y|z)

を決定 .

L= n(i, j)log P(x

i, yj)

j

i

(2)

最適 数 前 決 い

,情報 規準(AIC) 基 い 最適 数

を 索 . ,数千

数万 膨大 数 顧客 商品を比較的少数 潜在

類 確率 P(x|z)P(y|z)

顧客を う ン 類 望

(3)

い う ン を う 目的

用い 依存 言う い.一般

的 提供者 利用者 対 何

施策を実施 際,顧客 異質性 基 い 提供価値を最大化 施策 択を行う.

ン い ン ,

ン ン, ン 知 い

基本戦略 あ . 時, う 施策を実

施 適 顧客 ン を決

あ う.施策 ,提供 商品を顧客 ン 毎 変更 あ ,商品 択傾向 異

ン 顧客を 類 あ . ,

あ 日 実施 施策を来店 顧客 変更

あ ,日 来店傾向 異 顧客

ン 類 ,各 ン 対 最

適 施策を決定 あ う. , ッ ン

内 複数店舗を買い回 消費者 行動を理

解 ,場所 応 案内広告や ンを行

う あ ,購買 場所 応 空間情報

い 顧客を 類 ン 対 最適

施策を考え 適 あ .

本研究 , う 現場 い

各種 施策を実行 利用価値 高い,時

間や場所 応 顧客 ン , 顧客 行

動理解 役立 消費者行動 構築を行う.

,確率的潜在意味解析 , ン い ,局所独立性を仮定 潜在

析 扱わ い 等価 あ .局所独立

性 仮定 現実的 い ,局所独立性を緩和

,潜在 間 依存関係を 構造 扱う方法 研究 い .本研究 ,以降 述

PLSA 抽出 潜在 を

ン ッ 構造化 ン を行う

,局所独立性 緩和を行う.

. 時間情報を用いた確率的潜在 ス構

造化モデ

購買履歴 あ ID-POS 対 ,PLSA を 入 場 ,従来 顧客xi 対 ,商品 を yj い い , 商 品 代 わ 来 店 時 間 や

曜日を用い ,来店行動 類似 顧客

ン 顧客 類 .あ 2

3981 18040381 ID-POS

店 曜日をyi (i=1,…,7) PLSAを実行

2AIC 結果 数 3 を 用 .

2 来店曜日 基 く潜在

3 潜在 来店 曜日

所属 い を示 確率を図3 示 .

図 曜日 各潜在 所属確率

土曜日 日曜日 来店 主 同一 類

2 ,水木曜日,火

金曜日を中心 類 い .

う 来店行動 基 い 類 ン

毎 来店人数予測を行う予備実験 ,あ

ン い ン けを い来店人数

予測 良い精度を達 い .

. 空間情報を用いた確率的潜在 ス構

造化モデ

PLSA yj 来店 店舗 ID

(4)

店舗 ID を用い ,空間情報を考慮 潜

在 析を行う.あ ッ ン 店

舗数約 200 15 万人 共通 ン

利用履歴 い 顧客 ID 利用 店舗 エ ID,店舗 ID 種類 共起行列を作 ,

PLSA を実行 AIC

値 数 7 用 .

店舗 ID 基 く ,来店者数 多い店

舗を含 特徴的 あ ,同一

所属 店舗 エ あ 多い.

一方,エ ID 基 く ,同一

所属 隣接 エ あ 多い

,来店者 行動 空間情報を 映

いう観点 ,エ ID 基 く 方

適 あ 断 .

エ 来店行動 潜在

(AG)毎 来 店 エ を ッ ン

ッ 表示 を図 示 .

図 各エ 所属 潜在 (AG)

PLSA 潜在 結果, 7

潜在 所属 エ 購買 正確

ン 利用行動 特徴 け 顧客

7

, 7 ン 類 顧客

う 顧客 あ を知 ,各潜在

を説明 構造化 を構築 .具体的 ,

所属 潜在 を顧客属性 値 顧客

を作 , を学習

ン ッ を構築 . う 作 エ

A 関 構造化 を図 示

図 潜在 [A] 属 顧客

ン ッ 確率推論を実行

, ン 顧客 持 特徴

ン 差 定 的 計算 .例え

,エ A 所属 顧客 30代女性, ッ ン関連店舗利用 多く, 均利用金 相対的 普通 あ 一方, ン利用 や

移 一 回 , 来 店 周 期 一 間(相 対 的 短 い)

い 特徴 対 傾向 あ .

う 特徴 ン 対

を店舗経営側 詳細 検討 可能 ,

ン 来店傾向や来店人数 わ

, エ 属 店舗 店員 業

や接客準備 役立

. わ に

機械学習技術 ,複雑 問 を大

解決 う , 高度 複雑

,学習 必要

増大 .十 を持 的 得

枠組 実 調査 研究を一体化

あ 調 査 研 究

(Research as a service) 提案 [11]

調査 化 段階 を用い 応

用を く,情報 を社会 中

実行 , 得 観測や評価 ン

(5)

,利用者 ッ 心理的調査 結果

を網羅的 集 あ . 古く

, 信 性工学 ン

PDCA(Plan Do Check, Action) を 実 問 を 通

, を常 改善 あ .実際

現場 け 人 行動 起因 不確実性

対 本質的 解決 対象を実

化 , を用い 制御

を 集 , いう を持 的 繰 返 有効 あ ()

図 現場参加型 工学 PDCA

ン ,社会心理学 祖 あ

K.Lewin 提 唱 理 論 研 究 現 実 適用を相互循環的 推 社会問

解決 あ 入研究 あ .本稿 実

際 中 入 得 利用者

行動履歴 消費者 行動予測 を構築 , 提供者 消費者を理解 を支援 技術 い 述 . 提供者や経営者 意志

決定 い 同様 大規模 基 く

化 支援 考え . う 現場

参加型 を ,現場 必要

応え 技術を 入 ,

新 を獲得 , 新 課 を解決

手法を開発 いう を繰 返

必要 あ . 後 う 研究開発 を通

,現場 自体 入 ,飛

躍的 を改善 例を確立

工学 有用性を示 要 あ .

参考文献

[1] 川 弘 之, “ 工 学 序 説を 理 論 的 扱 う 枠 組 ―,”

,Vol. 1, No. 2, pp. 111-122, 2008.

[2] 内 藤 耕, 工 学 入 門, 東 京 大 学 出 版 会, 2009.

[3] 経 済 産 業 省 工 学 技 術 策 定 委員会報告書, 2007.

[4] 本 村 陽 一, 西 田 佳 史, 持 丸 正 明, 赤 松 幹 之, 内 藤, 橋 田 浩 一, “

大 規 模 観 測 ン

設 計 適 用 ,”人 工 知 能 学 会 , vol.23, no.6, pp.736-742, 2008.

[5] 本村陽一, 竹中毅, 石垣司: 工学 技術, 東京電機大学出版局, 2012.

[6] 石垣司, 竹中毅, 本村陽一. 確率的潜在意味解析 を用い 大規模 ID-POS 顧客 ン 統 利 用 顧 客-商品の同時カテゴリ 類. 電 子 情 報 通 信 学 会 技 術 研 究 報 告. NC, ニューロコ ンピューティング, Vol. 109, No. 461, pp. 425–430, 2010.

[7] 石 垣 司, 竹 中 毅, 本 村 陽 一. 日常購買行動に関す る大規模データの融 顧 客 行 動 予 測

: 実サービス支援のためのカテゴリマ イニング技術. 人工知能学会論文 , Vol. 26, No. 6, pp. 670–681, 2011.

[8] T.Ishigaki, T.Takenaka, Y.Motomura: Category Mining by Heterogeneous Data Fusion Using PdLSI Model in a Retail Service, proc. On IEEE International Conference on Data Mining (ICDM), pp.857- 862, 2010. [9] 石垣司,竹中毅,本村陽一: ID POS

状 況 依 存 的 変 数 間 関 係 自 動 抽 出 法, , Vol. 56, No. 2, 2010.

[10] 本 村 陽 一, 岩 崎 弘 利: 技 術, 京電機大学出版局 2006.

[11] 本 村 陽 一: 大 規 模 日 常 生 活 行 動 予 測 ン , ン Vol.2, No.1, pp.1-11, 2009.

参照

関連したドキュメント

In 2003, Agiza and Elsadany 7 studied the duopoly game model based on heterogeneous expectations, that is, one player applied naive expectation rule and the other used

In section 3, we will compare firstly some results of Aulbach and Minh in [2], secondly those of Seifert in [15], with our results... The paper is organized as follows: in Section 2

R., Existence theorem of periodic positive solutions for the Rayleigh equation of retarded type, Portugaliae Math.. R., Existence of periodic solutions for second order

Let T be an additive category and F : T → T an automorphism (a stan- dard construction allows one to replace a category with autoequivalence by a category with automorphism)..

Using the T-accretive property of T q in L 2 (Ω) proved below and under additional assumptions on regularity of initial data, we obtain the following stabilization result for the

Abstract: The existence and uniqueness of local and global solutions for the Kirchhoff–Carrier nonlinear model for the vibrations of elastic strings in noncylindrical domains

のようにすべきだと考えていますか。 やっと開通します。長野、太田地区方面  

In [13], some topological properties of solutions set for (FOSPD) problem in the convex case are established, and in [15], the compactness of the solutions set is obtained in