食物市場に普及する高感度消費者特徴分析

(1)

食物市場に普及する高感度消費者特徴分析

05001136 東海大学 *松山芳生 MATSUYAMA Yoshio

01015460 東海大学朝日弓未 ASAHI Yumi

1. はじめに

現代において新商品を市場へ投下する際に市場調査の目的でテストマーケティングを行うことは珍しくない. しかし実際に投下するとなると多大な費用が必要となる.

本研究ではイノベーター理論[1]に着目する. 国内においてイノベーター理論を用いた研究は, 比較的商品の販売期間の長いものについて報告されている[2]が, 短いものについては報告されていない.

本研究では, 商品の先進性に興味を惹かれる点とトレンドに敏感で自ら常に新しい情報を収集し, 他の消費者層への影響力が大きい点からイノベーター理論におけるイノベーター層(Innovators)・アーリーアダプター層(Early

Adopters)（図1参照）を高感度層と呼称する.

本研究では特に比較的販売期間の短いものも開発できる食べ物を対象に, 高感度層に多くの共感を集めるものはイノベーター層とアーリーアダプター層に普及していると考えて, 多くの共感を集める高感度消費者の特徴を掴み, この高感度消費者に対して食べ物の新商品の反応を見ることにより, テストマーケティングの目的を果たすことができるのではないかと考える. 本研究では, ディープラーニングモデルで汎化モデルを作成し, 高感度消費者の特徴を報告する.

図.1 イノベーター理論におけるカテゴリ分類

2. ディープラーニングモデルの構築

2.1 使用データ

本研究では, 国立情報学研究所のIDRデータセット提供サービスにより株式会社インテージから提供を受けた「みんレポデータ」を使用した. 本研究では特にジャンルが「食べレポ」, タイプが「買った/もらった」のレポート6,367 件を学習用データとして使用した. みんレポというSNSには, “高感度な生活者から写真とコメントで商品をより魅力的に表現した、質の高い口コミ投稿が集まります。”, “リアルな生活実態データ”[3]とあるので, 高感度消費者のリアルな生活実態データが集まるSNSと言える. そんな高感度消費者のみんレポユーザーの投稿「レポート」には, 同じく高感度消費者のみんレポユーザーからの反応がつく.

2.2 ディープラーニングモデル概要

本研究では, 多層パーセプトロンというネットワーク構造を用いた2値カテゴリの分類モデルである. 目的変数として, レポートに対する反応で共感を表す「いいね」を用いる. レポートに対する「いいね」が10未満のレポートを

「非共感レポート」, 10以上のものを「共感レポート」と呼称する. この 2 値に対する分類モデルである. 説明変数には「添付された画像数」, 「レポートを投稿したときの

感情」, 「レポートを投稿した人の性別」, 「レポートを投

稿した人の年齢」の4変数である.

多重共線性については, Dropout による正則化を行っているため, 過学習と同時に防止されていると考える.

2.3 ハイパーパラメータの設定

ディープラーニングモデルの学習は, ミニバッチ学習を行い, 6,367件のレポートの内ランダムで8割を学習用に, 2 割を検証用に使用した. 多層パーセプトロンの構造としては隠れ層の数を2層に設定し, 線形判別だけで分類できないものにも対応した. 各隠れ層では出力次元数・活性化

2-G-5

日本オペレーションズ・リサーチ学会

2019年春季研究発表会

(2)

関数・Dropout Ratio を設定できるが, 混同行列における

Accuracyに対してベイズ最適化により設定した.

他のパラメータについては, データによって最適なものが変わる最適化関数を Adam, SimpleSGD, AdaDelta,

AdaGrad, RMSpropの5つで正解率の比較（表1）を行い,

本研究ではAdaDeltaを選択した. 学習率については, 最適

化関数に AdaDelta を選択したことにより, 初期値学習率

を設定する必要がなくなった. 事実, 学習率を大きく変えても正解率には変化が認められなかった（表2）. よって本研究ではデフォルト値の 0.0001 を設定した. ミニバッチサイズについてはメモリアクセス効率上2^𝑛個に分けることが好ましく, 小さくするほど正解率も上がるが過学習も起こりやすくなってしまう. 本研究ではデフォルト値の 64を基準に64から32よりも128から64の方が, 効果が高いため（表 3）64 を設定した. エポック数については

Early Stoppingという手法を用いて誤差の収束が始まった

100 に設定した. なお, 最終的なディープラーニングモデルの正解率は73.3%である.

3. 決定木分析

2章の設定を行ったディープラーニングモデルを構築

し, 構築に使用した説明変数を全てもつ教師なしデータについて, 特徴を見るために決定木分析を行った.

図2. 決定木分析の結果

4. 考察

図 2 の決定木分析の結果より, 投稿されたレポートは, 本研究で用いたみんレポSNSでは, 画像は4枚までしか添付できないため, この少ない範囲の中でも, 第一に画像が多いほど共感されやすいことが分かる. 添付画像数が 0, 1

枚のとき 92.7%が非共感に分類されていることから, 共感

レポートの第一条件として画像が2枚以上必要である. やはり視覚的な情報は単なるテキストよりも情報量が多く, 共感を得やすいことが分かる.

また, 画像が 2 枚以上添付されているレポートでは, 年齢を重ねている人のレポートほど共感されやすいことが分かる. しかし, 画像数が2枚以上でも40歳未満の非共感レポート率が高く, 共感レポートを書きやすいのは所謂アラフォーと言われる世代からと言える.

他にも, 説明変数には「感情」, 「性別」を入れていたが, 本研究で作成したモデルからはあまり重要でないことが分かる.

5. まとめ

食べ物の新商品を作る際は, イノベーター理論から高感度消費者の共感するものを気にする必要がある. また本研究の結果より, 高感度層の中でも画像を多く添付する, 年を重ねている人について反応を見ることが重要である.

6. 今後の課題

データにはテキストや画像が含まれていたが, 今回は高感度消費者の特徴（属性）を見たため, そちらを使用していない. 具体的に共感されやすい言葉をテキストマイニングしたり, AI などによって画像のタグ付けを行った後, テキストマイニングを行うことにより, どのような画像が共感されやすいのか, 分析したい.

参考文献

[1] E.M.Rogers: “Diffusion of innovations the third edition”, macmillan publishers (1962)

[2] 森尾昭文, “個性的な野菜新品種導入における企業の適正”, 中央農業総合研究センター研究報告誌(17), pp.39- 48 (2012)

[3] 株式会社インテージみんレポ SNS 分析 (最終閲覧日：2018/12/19)

最適化関数 Adam SimpleSGD AdaDelta AdaGrad RMSprop

正解率 0.72536 0.68 0.73263 0.64 0.72

学習率 0.001 0.0001 0.00001 正解率 0.73263 0.73263 0.73263

バッチサイズ 32 64 128 正解率 0.73380 0.73263 0.72556

表1. 最適化関数ごとの正解率

表2.学習率ごとの正解率

表3.ミニバッチごとの正解率

食物市場に普及する高感度消費者特徴分析