食物市場に普及する高感度消費者特徴分析
05001136 東海大学 *松山 芳生 MATSUYAMA Yoshio
01015460 東海大学 朝日弓未 ASAHI Yumi
1. はじめに
現代において新商品を市場へ投下する際に市場調査の 目的でテストマーケティングを行うことは珍しくない. し かし実際に投下するとなると多大な費用が必要となる.
本研究ではイノベーター理論[1]に着目する. 国内にお いてイノベーター理論を用いた研究は, 比較的商品の販売 期間の長いものについて報告されている[2]が, 短いもの については報告されていない.
本研究では, 商品の先進性に興味を惹かれる点とトレン ドに敏感で自ら常に新しい情報を収集し, 他の消費者層へ の影響力が大きい点からイノベーター理論におけるイノ ベ ー ター 層(Innovators)・ アー リ ーア ダ プタ ー層(Early
Adopters)(図1参照)を高感度層と呼称する.
本研究では特に比較的販売期間の短いものも開発でき る食べ物を対象に, 高感度層に多くの共感を集めるものは イノベーター層とアーリーアダプター層に普及している と考えて, 多くの共感を集める高感度消費者の特徴を掴み, この高感度消費者に対して食べ物の新商品の反応を見る ことにより, テストマーケティングの目的を果たすことが できるのではないかと考える. 本研究では, ディープラー ニングモデルで汎化モデルを作成し, 高感度消費者の特徴 を報告する.
図.1 イノベーター理論におけるカテゴリ分類
2. ディープラーニングモデルの構築
2.1 使用データ
本研究では, 国立情報学研究所のIDRデータセット提供 サービスにより株式会社インテージから提供を受けた「み んレポデータ」を使用した. 本研究では特にジャンルが「食 べレポ」, タイプが「買った/もらった」のレポート6,367 件を学習用データとして使用した. みんレポというSNSに は, “高感度な生活者から写真とコメントで商品をより魅力 的に表現した、質の高い口コミ投稿が集まります。”, “リア ルな生活実態データ”[3]とあるので, 高感度消費者のリア ルな生活実態データが集まるSNSと言える. そんな高感度 消費者のみんレポユーザーの投稿「レポート」には, 同じ く高感度消費者のみんレポユーザーからの反応がつく.
2.2 ディープラーニングモデル概要
本研究では, 多層パーセプトロンというネットワーク構 造を用いた2値カテゴリの分類モデルである. 目的変数と して, レポートに対する反応で共感を表す「いいね」を用 いる. レポートに対する「いいね」が10未満のレポートを
「非共感レポート」, 10以上のものを「共感レポート」と 呼称する. この 2 値に対する分類モデルである. 説明変数 には「添付された画像数」, 「レポートを投稿したときの
感情」, 「レポートを投稿した人の性別」, 「レポートを投
稿した人の年齢」の4変数である.
多重共線性については, Dropout による正則化を行って いるため, 過学習と同時に防止されていると考える.
2.3 ハイパーパラメータの設定
ディープラーニングモデルの学習は, ミニバッチ学習を 行い, 6,367件のレポートの内ランダムで8割を学習用に, 2 割を検証用に使用した. 多層パーセプトロンの構造とし ては隠れ層の数を2層に設定し, 線形判別だけで分類でき ないものにも対応した. 各隠れ層では出力次元数・活性化
2-G-5
日本オペレーションズ・リサーチ学会2019年 春季研究発表会
関数・Dropout Ratio を設定できるが, 混同行列における
Accuracyに対してベイズ最適化により設定した.
他のパラメータについては, データによって最適なもの が 変 わ る 最 適 化 関 数 を Adam, SimpleSGD, AdaDelta,
AdaGrad, RMSpropの5つで正解率の比較(表1)を行い,
本研究ではAdaDeltaを選択した. 学習率については, 最適
化関数に AdaDelta を選択したことにより, 初期値学習率
を設定する必要がなくなった. 事実, 学習率を大きく変え ても正解率には変化が認められなかった(表2). よって本 研究ではデフォルト値の 0.0001 を設定した. ミニバッチ サイズについてはメモリアクセス効率上2𝑛個に分けるこ とが好ましく, 小さくするほど正解率も上がるが過学習も 起こりやすくなってしまう. 本研究ではデフォルト値の 64を基準に64から32よりも128から64の方が, 効果が 高いため(表 3)64 を設定した. エポック数については
Early Stoppingという手法を用いて誤差の収束が始まった
100 に設定した. なお, 最終的なディープラーニングモデ ルの正解率は73.3%である.
3. 決定木分析
2章の設定を行ったディープラーニングモデルを構築
し, 構築に使用した説明変数を全てもつ教師なしデータに ついて, 特徴を見るために決定木分析を行った.
図2. 決定木分析の結果
4. 考察
図 2 の決定木分析の結果より, 投稿されたレポートは, 本研究で用いたみんレポSNSでは, 画像は4枚までしか添 付できないため, この少ない範囲の中でも, 第一に画像が 多いほど共感されやすいことが分かる. 添付画像数が 0, 1
枚のとき 92.7%が非共感に分類されていることから, 共感
レポートの第一条件として画像が2枚以上必要である. や はり視覚的な情報は単なるテキストよりも情報量が多く, 共感を得やすいことが分かる.
また, 画像が 2 枚以上添付されているレポートでは, 年 齢を重ねている人のレポートほど共感されやすいことが 分かる. しかし, 画像数が2枚以上でも40歳未満の非共感 レポート率が高く, 共感レポートを書きやすいのは所謂ア ラフォーと言われる世代からと言える.
他にも, 説明変数には「感情」, 「性別」を入れていたが, 本研究で作成したモデルからはあまり重要でないことが 分かる.
5. まとめ
食べ物の新商品を作る際は, イノベーター理論から高感 度消費者の共感するものを気にする必要がある. また本研 究の結果より, 高感度層の中でも画像を多く添付する, 年 を重ねている人について反応を見ることが重要である.
6. 今後の課題
データにはテキストや画像が含まれていたが, 今回は高 感度消費者の特徴(属性)を見たため, そちらを使用して いない. 具体的に共感されやすい言葉をテキストマイニン グしたり, AI などによって画像のタグ付けを行った後, テ キストマイニングを行うことにより, どのような画像が共 感されやすいのか, 分析したい.
参考文献
[1] E.M.Rogers: “Diffusion of innovations the third edition”, macmillan publishers (1962)
[2] 森尾昭文, “個性的な野菜新品種導入における企業の 適正”, 中央農業総合研究センター研究報告誌(17), pp.39- 48 (2012)
[3] 株式会社インテージ みんレポ SNS 分析 (最終閲覧 日:2018/12/19)
最適化関数 Adam SimpleSGD AdaDelta AdaGrad RMSprop
正解率 0.72536 0.68 0.73263 0.64 0.72
学習率 0.001 0.0001 0.00001 正解率 0.73263 0.73263 0.73263
バッチサイズ 32 64 128 正解率 0.73380 0.73263 0.72556
表1. 最適化関数ごとの正解率
表2.学習率ごとの正解率
表3.ミニバッチごとの正解率