• 検索結果がありません。

はじめに 目次 クラスター (cluster) とは 英語で 集団 群れ のことを指し クラスタリング (clustering) とは 類似したものが混じり合う集団を 似た性質をもつもの同士に分けることです この クラスタリング を行うことで 人 による恣意的なグループ分けではなく 客観的なグループ

N/A
N/A
Protected

Academic year: 2021

シェア "はじめに 目次 クラスター (cluster) とは 英語で 集団 群れ のことを指し クラスタリング (clustering) とは 類似したものが混じり合う集団を 似た性質をもつもの同士に分けることです この クラスタリング を行うことで 人 による恣意的なグループ分けではなく 客観的なグループ"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

クラスタリング

株式会社アイズファクトリー

“類似の集合を、特徴に応じて

グループに「分ける」“

(2)

目 次

1.クラスタリングとは

2.マーケティング領域における

クラスタリング活用例

3.分析の概要(1)

4.分析の概要(2)

5.クラスタリングのための

「デ―タの準備」

6.おわりに

はじめに

クラスター(cluster)とは、英語で「集団、群

れ」のことを指し、「クラスタリング

(clustering)」とは、類似したものが混じり合

う集団を、似た性質をもつもの同士に分けるこ

とです。

この「クラスタリング」を行うことで、「人」

による恣意的なグループ分けではなく、客観的

なグループ分けを行うことが可能になります。

本資料では、顧客セグメンテーションを例に、

クラスタリングの実施例をご紹介いたします。

(3)

第1章

クラスタリングとは

分類

グループ分けの手法の代表的なものはクラスター分析 である。 クラスター分析には、クラスターの数を段階的に増加 または減少させる階層的な方法と、クラスターの数を あらかじめ固定しておく非階層的な方法がある。デー タマイニングでは、大量サンプルを分類するために、 非階層的手法であるk―means 法などがよく使われる。 出典:日本ユニシス株式会社

(4)

第1章 クラスタリングとは

クラスタリングとは

クラスター(cluster)とは、英語で「集団、群れ」のことを 指し、「クラスタリング(clustering)」とは、類似したも のが混じり合う集団を、似た性質をもつもの同士に分けるこ とです。 データマイニング(BA)を行う上では、「分類」と「クラス タリング」の違いを理解しておく必要があります。 分類は、クラス分類とも言います。その言葉通りに、データ をクラスに“分ける”ことです。これとは別に、クラスタリン グと言う言葉があり、これもデータを“分ける”事を意味しま す。 この2つの言葉の違いは何でしょうか。

■ 混じり合う集団を、「分ける」

性質の類似したグループに分ける

(5)

第1章 クラスタリングとは

「分類」と「クラスタリング」の違い

英語にすると、まずその違いを感覚的に理解できます。 クラス分類の“クラス”は、“class”です。「部類、種類、組」 などを意味します。 そして、クラスタリングは“clustering”です。“cluster”は、 「集団、群れ」のことです。日本語(カタカナ)では同じ表 記でも、英語にすると違いが明らかです。ただ、もう少し詳 しい説明が必要ですね。 分類(クラス分類)は、事前に決められたクラスに、データ を分けることです。クラスタリングは、事前に決められたク ラスが無く、データの集まりから分類を見つけ出す手法のこ とで、 “似ている”データをグループ分けします。従って、ク ラスタリングによってグループ分けされた各グループ(クラ スター)に対しては、分けた後に何らかの識別名称をユー ザー自身が決める(付ける)ことになります。 データマイニングの専門的な用語説明としては、分類(クラ ス分類)は、「教師あり(事前に分けるための定義がある) 学習」で、クラスタリングは、「教師なし(事前に分けるた めの定義がない)学習」と言います。この2つの違いを理解 しておくことが必要です。

■ 「クラスタリング」

■ 「分類」

Aグループ Bグループ Cグループ

A

B

C

既存の分類軸 (クラス) 新たな分類軸を作成 分ける 分類する (判別) どの分類に あてはまる?

(6)

第2章

マーケティング領域における

クラスタリング活用例

データマイニングの“ゴール”は顧客のより良い理解を 通じてマーケティング、販売、顧客サポートを企業が 改善できるようにすることである。 出典:「データマイニング手法」 著者:Michael J..Berry and Gordon S.Linoff 出版社:海文堂

(7)

顧客のグループ分け –DM送付-

クラスタリングをマーケティング領域で活用した場合、

どんなことができるのでしょうか。

DM施策を行った場合で考えてみましょう。通常DMを受

け取った顧客は、そのDMの内容が顧客自身の関心のあ

ることであったり、価値を感じた場合に申込みや購入な

どのアクションを起こします。

逆に、自分にとって興味のない内容であれば、DMは不

要なものとして処分されてしまいます。

手間と予算をかけた施策で、反応率を最大限に高め、成

果を得るためにはどうしたらよいのでしょうか。

第2章 マーケティング領域におけるクラスタリング活用例

(8)

顧客のグループ分け –DM送付-

それぞれの顧客の興味や潜在ニーズに合ったDMを送る

ことができれば、この問題は解決されます。

顧客をなんらかの指標で分類することによって、施策や

クリエイティブの打ち分けが可能になります。

顧客分類の方法としては、それぞれの顧客の購買に関す

る各指標(購買頻度、購買金額など)から、ロイヤリ

ティの高い顧客に分類するRFM (※)分析があります。

しかし、この方法では、ある程度DMに反応しやすい顧

客は可視化できるかもしれませんが、それぞれの顧客の

興味・関心に対応することはできません。

※RFMとは、下記の3要素を指す。

「最終購買日(Recency)」

「購買頻度(Frequency)」

「累計購買金額(Monetary)」

F5

F4

F3

F2

F1

R5

R4

R3

R2

R1

■ RFM分析による、顧客の抽出

← 購買頻度大 ← 最 終 購 買 日

この層を、送付対象として抽出

どんなことに興味・関心のある

お客様なのか、わからない…

第2章 マーケティング領域におけるクラスタリング活用例

(9)

第2章 マーケティング領域におけるクラスタリング活用例 クラスタリングによって、興味/関心に応じて類似した顧客群にグループ分けすること(=セグメンテーション)が可能です。 自社の顧客を、興味関心/購買傾向などが類似した顧客群にグループ分けすることで、それぞれの顧客群の興味・関心に合わ せてクリエイティブの企画を行ったり、発送対象を選別できるようになります。

自社の顧客

旅行が趣味 ワインには こだわり有 お菓子作り が好き 旅行会社とのタイアップ企画 春の台湾女子旅プラン

キャンペーンDM

旅行好きアクティブ層

発送

お酒好きグルメ層 手作りインドア層

(10)

第3章

分析の概要(1)

出典:「データマイニング手法」 著者:Michael J..Berry and Gordon S.Linoff 顧客セグメンテーションは、定着した顧客に関する データマイニングの一般的な適用領域である。 セグメンテーションの目的は、それぞれのセグメント に対して、製品やサービス、マーケティングメッセー ジをしつらえることである。 顧客セグメントは、これまで市場調査に基づいて作ら れてきた。そこでは、「若者の単身セグメント」や 「ロイヤルセグメント」などといったようなものが得 られる。市場調査に基づくセグメントに付随する問題 は、調査対象とはされていない他のすべての顧客に対 して、それらのセグメントを適用する方法を知ること が難しいということである。

(11)

第3章 分析の概要(1)

■ グループ分け

A

■ クラスタリングの手順(マーケティング)

様々なお客様が存在。お客様の特徴は?

自社の顧客(A百貨店)

◆クラスタリング事例(マーケティング・ペルソナ構築) 自社にとってどのくらいポテンシャルのあるターゲットが、 どの程度のボリュームでマーケットに存在するのかが分かり、 ✓ 自社が強みを発揮できるターゲット ✓ 売上確保のために十分なボリュームをもつターゲット ✓ ターゲットに対する最適な訴求内容 ✓ 製品/サービスの改良点 などが明らかになるため、具体的なマーケティング施策につ なげることができるようになります。

特徴の似たグループに分ける

B D C 人数 特徴 A 2920人 - 細かな比較検討はしない 気に入れば消費型 B 311人 - 多少高くても品質重視 ブランド志向型 C 9011人 - 所得が平均より少なく、価格重視 低価格志向型 D 7622人 積極消費型 - 消費に積極的、主力商品をリピート

■ 各グループの特徴を可視化

(12)

第3章 分析の概要(1)

■ 「クラスタリング」の流れ

今回は、ある百貨店の顧客におけるペルソナ構築を行った場 合を例に、データやアウトプットをご紹介いたします。 【課題設定】 自社会員にひもづく様々なデータを使って、具体的にどんな 特徴をもつ顧客グループが存在するのかを定量的に把握し、 ターゲットやターゲットに適した施策を検討したい。

1.データの準備

◆データ例 マスターデータ: 年齢、性別、会員区分、結婚の有無、年収など POSデータ: 累計購入金額、累計購入回数、直近購入日 アクセスログ: 会員サイトログイン有無、直近のログイン日など ◆データ作成にあたって 今回は「顧客」毎の特徴を可視化したいので、「顧 客」にひもづく様々なデータを1レコードに加工した 上の表のような形式のデータを用意します。 通常、POSデータやアクセスログなどは、商取引や アクセスの度に蓄積される流動的なデータとなるた め、データマイニングを行う際にはそれぞれのデー タを「顧客」毎の単位にまとめるための「データの 加工」が必要となります。 I D 性別 生年月日 婚姻 年収 累計 金額 累計 回数 ス有無 アクセ 1 M /12/1 1945 独身 890 83000 12 有 … 2 F 1977 /3/2 既婚 500 58290 9 無 … 3 F /2/14 1889 独身 450 40223 4 有 … … … … …

■ データマイニングのためのデータ作成

(13)

第3章 分析の概要(1)

2.クラスタリング(教師なし)

作成したデータを、解析プラットフォーム 「bodais」にアップロードすることで、様々なアウ トプットをレポートとして得ることができます。 データは、CSV形式でアップロードします。 ※アップロードの際は、データを全て数値化します

各種アウトプットと、「人」による考察

CSVデータ

クラスタリングの各種アウトプット

(詳細は右の通り) CL グループ 1位 属性 2位 属性 3位 属性 4位 属性 5位 属性 CL1 20代 コスメ 購入多 独身 30回以上 購入回数 女性 CL2 5人家族 利用意向 高い 600~ 年収 40代 ログイン CL3 男性 年収 800万~ 購入回数 20~30回 30代 独身 … … … …

■ セグメントボリューム

■ 特徴属性リスト(各グループの特徴)

分析対象の顧客を、 データから「似通った グループ」にグループ 分けした際、今回は 「7つ」のグループ (=CL:クラスタ) に分かれた。 また、それぞれのグ ループの顧客数も可視 化された。 (人数) bodais:統計知識を要する、データマイニングのための「データの準備」の一部を自動化。 作成したデータセットをアップロードするだけで、自動で解析・レポーティングが行われる、自動解析プラットフォームです。

(14)

第3章 分析の概要(1)

各種アウトプットと、「人」による考察

CL グループ 顧客像 「人」による定義 特徴 CL1 コスメマニアの 20代独身OL Webで週2,3回の頻度で、コスメやファッションアイテムをチェック、 購入額も年間5万円以上と多め CL2 Web通販派の 主婦 買い物はWebで行う、小さい子供を含む 5人家族、食品中心に購入。 独自展開しているPB商品を支持。 CL3 ブランド志向の 独身貴族 年収は高めで毎月百貨店を利用する。 着るもの、持ち物にこだわり有り。 接客やサービスに魅力を感じている。 ◆アウトプットをもとにした、ペルソナ構築 「特徴属性リスト」から、各グループを特徴づけて いる特徴(=統計的にグループ分けの根拠となって いる、データ項目)を読み取り、マーケターのもつ 「ビジネスの理解」も鑑みて顧客像を明確にします。

■ 「人」によって検討されたペルソナ

■ バブルチャート

◆戦略への落し込み 「バブルチャート」では、各グループ同士が「どれ くらい似ているか」「どのくれいの規模のマーケッ トであるか」を視覚的に表しています。 近い程「似ている」グループであるといえます。 ペルソナとマーケットの状況から、自社のターゲ バブル(グループ)は近い程似ている。大きい程人数が多い。 CL6とCL7 は、比較的 似たグループ といえる。

(15)

第4章

グループに分ける、「クラスタリング(教師あり)」 を行うことによって、分類のための「分類モデル」が 作成できます。 このモデルを適用すること(=「クラスタリング(教 師あり)」)によって、分類が未知の新規顧客が、既 存のどの分類に当てはまるのかを予測できます。

分析の概要(2)

(16)

第4章 分析の概要(2)

3.クラスタリング(教師あり)

CSVデータ (新規顧客)

新規顧客の分類がわかる!

ID 性別 生年 月日 婚姻

分類

111 M /11/8 1985 独身 …

CL2

112 M /9/12 1967 既婚 …

CL5

113 F /8/24 1879 既婚 …

CL4

… … …

◆既存の分類軸を活用した、新規顧客の「分類」 「クラスタリング(教師あり)」によって、「分類 モデル」が作成できます。このモデルを適用するこ とで、分類が未知の新規顧客が、既存のどの分類に 当てはまるのかを予測することが出来ます。 クラスタリング (教師なし)の モデルを適用

■新規リストに、分類が付与される

◆予測結果活用 新規顧客の分類を予測できることで、自社のター ゲットであれば施策の対象としたり、その特徴に応 じた施策の適用が可能になります。 コスメマニアの 分類: 施策: 日本初上陸の話題の コスメ特集のDMを 送ろう! 新規顧客 Aさん 予測した分類が付与される 分類を知りたい新規顧客のリストを用意。 (グループ分けの際の投入データと同じヘッダのデータセット)

(17)

第5章

クラスタリングのための「デ―タの準備」

「データ分析業務は8割が前処理」と揶揄(やゆ)さ れることがあるほど、分析業務における前処理の比重 は大きい。また、前処理が終わらなければ機械学習な どの本格的な分析を始めることができないという構造 もあり、分析プロジェクトのボトルネックに、容易に なりうる。 出典:ZDNet Japan

(18)

分析を正しく行い、ビジネスに有効な分析結果を得る

には、「ビジネスの理解」を踏まえた「適切なデータ

の準備」が必要です。

データ作成の考え方

まずはじめに、分析の目的・期待するビジネス上の成

果を明確にし、 アクションにつながるビジネスの目標

を設定します。

例:自社顧客を類似したグループに分け、施策に活用したい ①何を対象にするか 全顧客を対象にする/関東地方の顧客のみを対象にす る…など、 データ解析を行う対象・単位を決定します。 ②どのデータ項目を使うか 顧客情報に加え購買履歴やアンケートデータなど、分 析に使用するデータを決定します。 ③適切な変換(カテゴリ化)の検討 生データではクラスタリングはできません。 男性→1・女性→2などのように数値データに変換し たり、購入金額を10万円刻みで カテゴリ分けするな どのデータ変換を行う必要があります。 アウトプットにも影響するため、適切なカテゴリ分け を検討します。 I D 性別 生年月日 婚姻 年収 累計 金額 累計 回数 分類 1 W 1951/02/13 独身 890 ¥18,350 5 … 2 M 1945/10/12 既婚 500 ¥2,824 2 … 3 M 1981/04/07 独身 450 ¥9,820 1 … … … … … 第5章 クラスタリングのための「デ―タの準備」

上記が、クラスタリング(教師なし)を行う際に bodaisにアップロードするデータセット例です。 ①~③のパーツそれぞれについて、目的に合ったデー タを検討し、準備します。

「目標の設定」

(19)

データの加工

◆データ作成のポイント 前項の、下記2点について決まったら、顧客マスター やPOSデータ、アンケートデータなどばらばらに管理 されているデータを分析のID(前項の①)毎にひもづ くように加工する必要があります。 ②どのデータ項目を使うか ③適切な変換(カテゴリ化)の検討 顧客のクラスタリング(教師なし)の場合は、「顧 客」毎の分析をしたいので、①のIDは「顧客」単位と し、「顧客」にひもづく様々なデータを1レコードに 加工した前項の表のような形式のデータを作成します。 通常、POSデータやアクセスログなどは、商取引やア クセスの度に蓄積される流動的なデータとなるため、 それぞれのデータを「顧客」毎の単位にまとめる必要 があります。 ◆データ作成の方針例 ①何を対象にするか →「顧客」毎の予測を実施する(該当顧客の抽出) ②どのデータ項目を使うか →顧客属性、購買履歴、アンケートデータ ③適切な変換(カテゴリ化)の検討 →生年月日は年代にカテゴリ化、直近注文日は1か月 刻みでカテゴリ化、などすべての属性について設定 具体的なデータ加工例は、次項をご覧ください。

データの加工にあたって

第5章 クラスタリングのための「デ―タの準備」

(20)

データ加工の概要

顧客属性(顧客マスター)、購買履歴(POSデータなど)を、顧客ID毎にひもづけます。 顧客ID 生年月日 性別 1 1951/02/13 W 2 1945/10/12 M 3 1981/04/07 M 4 1990/01/03 W 5 1975/03/06 W 顧客ID 購買回数 直近注文日 合計購買額 1 5 2014/11/15 ¥18,350 2 2 2014/06/24 ¥2,824 3 1 2014/11/12 ¥9,820 4 1 2014/08/03 ¥1,900 5 4 2014/07/01 ¥2,500 顧客マスター POSデータ

(各種アンケートデータなど)

顧客IDでひもづけ、ID毎に集計されたデータに加工 顧客ID 生年月日 性別 購買回数 直近注文日 合計購買額 正解 1 1951/02/13 W 5 2014/11/15 ¥18,350 0 2 1945/10/12 M 2 2014/06/24 ¥2,824 1 3 1981/04/07 M 1 2014/11/12 ¥9,820 0 4 1990/01/03 W 1 2014/08/03 ¥1,900 1 第5章 クラスタリングのための「デ―タの準備」

……

(21)

トランザクションデータの加工

POSデータなどのトランザクションデータは、商取引毎に生成されるそれぞれのレコードを、顧客IDにひもづく 「1人1レコード」のデータに加工します。

【手順】

1.顧客ID毎にレコード数のカウントを行い、購買回数を算出

2.複数の注文日から、直近の注文日を抽出

3.小計を合算し、合計購買額を算出

集計後のデータを、前項の通りIDでひもづけ分析用のデータセットを作成します。 作成されたデータセットについて、生年月日→年齢/年代、金額→5万円刻みでカテゴリ化、などの変換を行います。 トランザクション形式のデータ 行動毎に生成 されたレコード 顧客ID 注文日 注文ID 小計 1 2014/02/19 26441 ¥10,286 1 2014/04/07 30276 ¥5,400 1 2014/06/24 36735 ¥924 1 2014/07/05 43121 ¥1,200 1 2014/11/15 71322 ¥540 2 2014/02/17 25384 ¥1,900 2 2015/06/24 36732 ¥924 3 2014/11/12 44347 ¥9,820 顧客ID 購買回数 直近注文日 合計購買額 1 5 2014/11/15 ¥18,350 2 2 2014/06/24 ¥2,824 3 1 2014/11/12 ¥9,820 トランザクション集計後

集計

第5章 クラスタリングのための「デ―タの準備」

(22)

第6章

(23)

第6章 おわりに

BIの活用からBA(ビジネスアナリティクス)へ

と取り組みを広げ、新たに「クラスタリング」

を行う際には、利用しやすいツールの導入や

データの準備・加工が不可欠です。

アイズファクトリーでは、これらの取り組みを

ご検討される企業様のご相談に、ワンストップ

でご対応しています。

https://bodais.jp/

(24)

参照

関連したドキュメント

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

参加者は自分が HLAB で感じたことをアラムナイに ぶつけたり、アラムナイは自分の体験を参加者に語っ たりと、両者にとって自分の

い︑商人たる顧客の営業範囲に属する取引によるものについては︑それが利息の損失に限定されることになった︒商人たる顧客は

大村 その場合に、なぜ成り立たなくなったのか ということ、つまりあの図式でいうと基本的には S1 という 場

自分ではおかしいと思って も、「自分の体は汚れてい るのではないか」「ひどい ことを周りの人にしたので

これも、行政にしかできないようなことではあるかと思うのですが、公共インフラに