大規模データ 潜在 ス構造化モデ ン を用いた
消費者行動理解技術
Consumer Understanding based on
Latent Class Structure Modeling using Big Data
本村陽一
12柴等
1竹中毅
1島実
2田島健蔵
21
産業技術総 研究所 工学研究 ン
東京工業大学大学院知能 科学専攻
Abstract: 現場 い 集積 い 大規模 ID付POS (購買履歴)を用い 消費者を理
解 ,需要を予測 消費者 価値 向 や経費 削減を 望 い .本研
究 ,確率的潜在意味解析(PLSA)を用い 顧客を潜在 類 後, 潜在 を説明 構
造化 を ン ッ 構築 潜在 構造化 をID付POS 構築 .
. じめに
近 , ,
物 質 的 価 値 生 活 質(QoL)や 経 験 価 値
視 う 時代 い .
い , 工 学 期 待 役 割 , 従 来 物 質 的 価 値 や製品 機能を対象 技術開発 , を媒
,生活や い
を直接 対象 再現性 あ 組 作 や技術
開発 展開 いく 予想 .例え
生産や 売を最適化 場
面 あ , 対 購買行動や使用経験
いう 方を主眼 消費者 感 価
値自体 技術 要 .
,大規模 を活用 技術研究開発
,持 的 集を ,実際
現場 技術 入 必須
. ,初期 課 解決 健在化
利用者 理解 容易 技術 入 必要 あ .
本研究 消費者 価値を高
施策 を可能 ,購買行動 履歴 あ
2 ID-POS や約200店舗
を有 ッ ン 1 ,約15万人
大規模 を用い 消費者 来店購買行動を
場所や時間 状況依存性 含 化を行
い, 提供者 消費者行動を理解 , ン や施策,経営 を支援 技術 い 述 .
. サービス工学
特有 課 対 ,熟練者 経験
を脱却 , 現場 起 象を客観的
観測 , を 析 得 計算論的
基 い ,あ を最適化 , を現
場 適用 いう 最適設計 ,
を連 的 改良 工学 提案
い [1,2,3,4]. う 動 的
考え ,従来 ッ 物質的
価値 く,時 変化 動的 価
値 可能 . 提供
容者 知 容者 意識や行
動を変容 , 価値
顕在化 ,最適化を行う 利用者
知 評価 行動 入 不可 .
, 知 評価 行動 をい
現場 生 大規模 構築
, いう 技術的課 ,利用者 集団
を対象 来 不確実性や利用者 心理
的要因や状況依存性 基 く不確実性 対処 ン 技術 入 必要 .
. 大規模データ 行動モデ 構築
う 不確実性や大規模 を 扱う 一 方法 確率 や統計的学習 あ .日
常的 生 大規模 対 記述 ,
計算 点 ,扱う対象自体を本質的 確率的,
統計的 考え を得 い. 確率
を使 対象を 化 ,知 い変数 確率 布を推定 , え 各状態 確 率(確 信 度)を 評 価 確 率 的 枠 組 を 人 行 動
ン 適用 .不確実 対象を 確率変数
, く ン 問 領域 を明示化 ,
確率変数 布を 推定 ,
を大 統計 経験的 構
可 能 . 具 体 的 利 用 者
知 評価構造を ン ッ 化 ,情
報推薦や ン 応用 例や生活者 来
店 行 動 注 目 顧 客 ン ン
[5,6,7,8,9] 研究 い .本稿 ,
大規模 含 時間や場所 基 い 顧客
ン 化を確率的潜在意味解析 行い,
商品 択傾向 組 わ ン
ン を ン ッ [10] 構 造 的 化 消費者行動理解を支援 技術 い , 時間情報 空間情報を 入 例 い 述 (図1).
図1 確率的潜在意味解析 ン ッ
. ID-54S データと潜在 ス分析
工学 い ,顧客 異質性を考慮
必須 あ , 顧客 ン を求
現場 生 大規模 を
活用 自然 あ . 単 顧客 析
, 計算 顧客 ン を活
用 支援技術を開発 抽出 顧客
ン を様々 情報 活用 計算
集積 組 を考え 要 課
. ン や ン
顧客を ID 化 購買履歴を集積 大規模
ッ ID-POS あ .従来
現場 利用 い 顧客 ン
ン 代表的 RFM 析 呼 ,直近 来店日,来店回数,購入金 数値指標 顧
客 特性を 化 あ , 直接
商品 真 生活者理解を行う
い. 顧客 商品 方 い ,有効 施 策 実施 可能 顧客 ン や商品 を, 大規模 利用者 商品 択行動 類似性 基 い 自動的 抽出 方法 必要 い .
得 基 い 購買状況や購買
ン 関係 顧客行動を推定 ,提供 商品や情報を適応的 変化 利用者や
提供者 望 い 最適化 可能
. 々 現 場 観 測
ID-POS 実 利用可能 自
動生 顧客行動 関 計算 構築技術
潜在 析 ン ッ を組 わ
顧客 化技術を開発 い . ,
潜 在 析 一 種 あ 確 率 的 潜 在 意 味 解 析 (pLSA) ,顧客毎 商品 買い方,商品 見
買わ 方 似 い を同一 併
操作を繰 返 ID付 POS 顧客 商品を同時 類 生 を行う. 具体的 ,顧客xi 商品yj 共起行列を
作 ,共起 度をn(i,j) 表 . ,顧客 商品
所属 潜在 をzk (k=1,2,…) 表 .
xi, yj,潜在 zk 関係を 式,
P(xi, yj) = P(xi| zk)P(yj| zk)
k
∑
P(zk) (1)化 . 以 対数尤度を最大化
EM ,P(z),P(x|z),P(y|z)
を決定 .
L= n(i, j)log P(x
i, yj)
j
∑
i
∑
(2)最適 数 前 決 い
,情報 規準(AIC) 基 い 最適 数
を 索 . ,数千
数万 膨大 数 顧客 商品を比較的少数 潜在
類 確率 P(x|z),P(y|z) 得
.
顧客を う ン 類 望
い う ン を う 目的
用い 依存 言う い.一般
的 提供者 利用者 対 何
施策を実施 際,顧客 異質性 基 い 提供価値を最大化 施策 択を行う.
ン い ン ,
ン ン, ン 知 い
基本戦略 あ . 時, う 施策を実
施 適 顧客 ン を決
あ う.施策 ,提供 商品を顧客 ン 毎 変更 あ ,商品 択傾向 異
ン 顧客を 類 あ . ,
あ 日 実施 施策を来店 顧客 変更
あ ,日 来店傾向 異 顧客
ン 類 ,各 ン 対 最
適 施策を決定 あ う. , ッ ン
内 複数店舗を買い回 消費者 行動を理
解 ,場所 応 案内広告や ンを行
う あ ,購買 場所 応 空間情報
い 顧客を 類 ン 対 最適
施策を考え 適 あ .
本研究 , う 現場 い
各種 施策を実行 利用価値 高い,時
間や場所 応 顧客 ン , 顧客 行
動理解 役立 消費者行動 構築を行う.
,確率的潜在意味解析 , ン い ,局所独立性を仮定 潜在
析 扱わ い 等価 あ .局所独立
性 仮定 現実的 い ,局所独立性を緩和
,潜在 間 依存関係を 構造 扱う方法 研究 い .本研究 ,以降 述
う PLSA 抽出 潜在 を
ン ッ 構造化 ン を行う
,局所独立性 緩和を行う.
. 時間情報を用いた確率的潜在 ス構
造化モデ
購買履歴 あ ID-POS 対 ,PLSA を 入 場 ,従来 顧客xi 対 ,商品 を yj い い , 商 品 代 わ 来 店 時 間 や
曜日を用い ,来店行動 類似 顧客
ン 顧客 類 .あ 2
3981人 18040381件 ID-POS 来
店 曜日をyi (i=1,…,7) PLSAを実行
図2 . AIC 結果 数 3 を 用 .
図2 来店曜日 基 く潜在
3 潜在 来店 曜日 う
所属 い を示 確率を図3 示 .
図 曜日 各潜在 所属確率
土曜日 日曜日 来店 主 同一 類
, 2 ,水木曜日,火
金曜日を中心 類 い .
う 来店行動 基 い 類 ン
毎 来店人数予測を行う予備実験 ,あ
ン い ン けを い来店人数
予測 良い精度を達 い .
. 空間情報を用いた確率的潜在 ス構
造化モデ
PLSA yj 来店 店舗 エ ID
店舗 ID を用い ,空間情報を考慮 潜
在 析を行う.あ ッ ン 店
舗数約 200 15 万人 共通 ン
利用履歴 い 顧客 ID 利用 店舗 エ ID,店舗 ID 種類 共起行列を作 ,
PLSA を実行 . 場 AIC
値 数 7 用 .
店舗 ID 基 く ,来店者数 多い店
舗を含 特徴的 あ ,同一
所属 店舗 エ あ 多い.
一方,エ ID 基 く ,同一
所属 隣接 エ あ 多い
,来店者 行動 空間情報を 映
いう観点 ,エ ID 基 く 方
適 あ 断 .
エ 来店行動 潜在
7 (A〜G)毎 来 店 エ を ッ ン
ッ 表示 を図 示 .
図 各エ 所属 潜在 (A〜G)
PLSA 潜在 析 結果, 7
潜在 所属 エ 購買 正確
ン 利用行動 特徴 け 顧客
7 ン 類 い .
, 7 ン 類 顧客
う 顧客 あ を知 ,各潜在
を説明 構造化 を構築 .具体的 ,
所属 潜在 を顧客属性 値 顧客
を作 , を学習
ン ッ を構築 . う 作 エ
ン A 関 構造化 を図 示
.
図 潜在 [エ A] 属 顧客
ン ッ 確率推論を実行
, ン 顧客 持 特徴
ン 差 定 的 計算 .例え
,エ A 所属 顧客 30代女性, ッ ン関連店舗利用 多く, 均利用金 相対的 普通 あ 一方, ン利用 や
移 一 回 , 来 店 周 期 一 間(相 対 的 短 い)
い 特徴 対 傾向 あ .
う 特徴 ン 対
を店舗経営側 詳細 検討 可能 ,
ン 来店傾向や来店人数 わ
, エ 属 店舗 店員 業
や接客準備 役立
.
. わ に
機械学習技術 ,複雑 問 を大
解決 う , 高度 複雑
,学習 必要
増大 .十 を持 的 得
枠組 実 調査 研究を一体化
あ 調 査 研 究
(Research as a service) 提案 い [11].
調査 化 段階 を用い 応
用を く,情報 を社会 中
実行 , 得 観測や評価 ン
,利用者 ッ 心理的調査 結果
を網羅的 集 あ . 古く
, 信 性工学 ン
知 PDCA(Plan, Do, Check, Action) を 実 問 を 通 回 け
, を常 改善 あ .実際
現場 け 人 行動 起因 不確実性
対 本質的 解決 対象を実
化 , を用い 制御
を 集 , いう を持 的 繰 返 有効 あ (図 ).
図 現場参加型 工学 PDCA
ン ,社会心理学 祖 あ
K.Lewin 提 唱 理 論 研 究 現 実 適用を相互循環的 推 社会問
解決 あ 入研究 あ .本稿 実
際 中 入 得 利用者
行動履歴 消費者 行動予測 を構築 , 提供者 消費者を理解 を支援 技術 い 述 . 提供者や経営者 意志
決定 い 同様 大規模 基 く
化 支援 考え . う 現場
参加型 を ,現場 必要
応え 技術を 入 ,
新 を獲得 , 新 課 を解決
手法を開発 いう を繰 返
必要 あ . 後 う 研究開発 を通
,現場 自体 入 ,飛
躍的 を改善 例を確立
工学 有用性を示 要 あ .
参考文献
[1] 川 弘 之, “ 工 学 序 説― を 理 論 的 扱 う 枠 組 ―,” ン
,Vol. 1, No. 2, pp. 111-122, 2008.
[2] 内 藤 耕, 工 学 入 門, 東 京 大 学 出 版 会, 2009.
[3] 経 済 産 業 省 工 学 技 術 ッ 策 定 委員会報告書, 2007.
[4] 本 村 陽 一, 西 田 佳 史, 持 丸 正 明, 赤 松 幹 之, 内 藤 耕, 橋 田 浩 一, “ ン
大 規 模 観 測 ン
設 計 適 用 ,”人 工 知 能 学 会 , vol.23, no.6, pp.736-742, 2008.
[5] 本村陽一, 竹中毅, 石垣司: 工学 技術, 東京電機大学出版局, 2012.
[6] 石垣司, 竹中毅, 本村陽一. 確率的潜在意味解析 を用い 大規模 ID-POS 顧客 ン 統 利 用 顧 客-商品の同時カテゴリ 類. 電 子 情 報 通 信 学 会 技 術 研 究 報 告. NC, ニューロコ ンピューティング, Vol. 109, No. 461, pp. 425–430, 2010.
[7] 石 垣 司, 竹 中 毅, 本 村 陽 一. 日常購買行動に関す る大規模データの融 顧 客 行 動 予 測
: 実サービス支援のためのカテゴリマ イニング技術. 人工知能学会論文 , Vol. 26, No. 6, pp. 670–681, 2011.
[8] T.Ishigaki, T.Takenaka, Y.Motomura: Category Mining by Heterogeneous Data Fusion Using PdLSI Model in a Retail Service, proc. On IEEE International Conference on Data Mining (ICDM), pp.857- 862, 2010. [9] 石垣司,竹中毅,本村陽一: 百 店ID付 POS
状 況 依 存 的 変 数 間 関 係 自 動 抽 出 法, ン , Vol. 56, No. 2, 2010.
[10] 本 村 陽 一, 岩 崎 弘 利: ン ッ 技 術, 東 京電機大学出版局 2006.
[11] 本 村 陽 一: 大 規 模 日 常 生 活 行 動 予 測 ン , ン Vol.2, No.1, pp.1-11, 2009.