• 検索結果がありません。

データマイニングによる顧客スコアリング

N/A
N/A
Protected

Academic year: 2021

シェア "データマイニングによる顧客スコアリング"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

2002年日本オペレーションズ・リサーチ学会 春季研究発表会 2−A−2

データマイニングによる顧客スコアリング

(申請中)筑波大学 *後藤正輝 GOTOMasateru

筑波大学 村山和穂 MURAYAMAKazuho

筑波大学 門間公志 MONMAKoji

OllO5930 筑波大学 香田正人 KODAMasato

芸 ∴=訂し書∴、.′デ三言三デ。βご.やや措

乱乱 闘題のモデル化

顧客スコアリングは本質的には顧客を将来の

購入有無で分類するクラス判別問題であるが、

いかに巧妙な説明変数を用いても2クラスの判 別境界を定めることはできない。そのため予測 期間中の取引有無という離散値を教師信号とし

て、購入確率という連続値を出力する回帰モデ

ルを作成して頗客をランク付けする。 且 臆臨め仔這 データマイニングは大規模データベースか ら未知の有効な情報を抽出するプロセスであ

る。また顧客スコアリングとは過去の購買履歴

データを基にして、購入可能性の高い順に顧客

をランク付けするデータマイニングの一分野で ある。 本研究では企業から提供を受けた取引履歴 データに対して複数のデータマイニング手法を 適用し、顧客スコアリングモデルを作成した。 また作成したモデルを基にテストマーケティン グを行い、その有効性を換証した。

乱望劉備帽冴瞑卦臥諾盛

スコアリングモデルの作成には‡BMDB2Im−

telligentMiner払rDataV6.1を使用した。利用

したアルゴリズムはパックプロパゲーションネ ットワーク、ラジアルベーシス関数ネットワー

ク、回帰木(以下それぞれBPN,R8F,RT)の3

種である。ここに、RBFの基底関数の決定は

ニューラルクラスタリングにより行われ、RT

のノード分割規準はGiniインデックスによる。

望 剛用デロ珍

本研究で利用したデータはある衣料。雑費販

売会社の通信販売履歴データである。原データ

は取引‡Dをキーにもつ販売履歴データに、商

品属性。顧客屈性に関する情報を付加したもの

であるが、本研究の目的より顧客IDをキーに した分析用データを作成した。

分析用データは12,242名の顧客に対する

1998年10月から2001年5月までの取引履歴

であるが、カタログ発送スケジュ㌻ルに従い、

98年度秋冬期(以下9ぬw)から01年度春夏期

(以下0且ss)までの半年毎に顧客の勝男行動を捉 えてモデルの説明変数を作成した。テストマー ケティングでは01年度秋冬期の齢入着を予測 した。 凱認・蟄矛兆偲評価 本研究の目的は現突の業務への適用において 高い予測精度を発揮するモデルを選定すること である。したがって、00awの購冥有無をそれ

以前の購買行動から予測するモデルを訓練し、

それを入力期間を1期間ずらして01ssの予測

−144− © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(2)

に適用しテストする。以上を繰返し最も高い予 測精度をもつモデルを選択する。 予測全体の当てはまりを評価するためにリフ ト図を用いる。リフト図は顧客をランクに従い 降順l;ソートし、反応者数の累積値をプロット したものである。また、予測スコア上位ご%の 顧客群に対する精度の定量的な評価にはリフト 率を用いる。 表1:分析用データ key 【顧客ID】 inト4 期別購入回数 in5−8 期別購入金額 in9−12 期別購入商品数 in13 購入回数合計 in 購入金額合計 in15 購入商品数合計 in16 購入単価 in17 注文あたり商品数 in18 初回購入時期 Out 予測期間の購入有無 上位ご%の顧客の反応率 リフト率(ェ)= 全顧客についての反応率

4 結果

予測精度の評価は利用アルゴリズム、説明変

数の種類、説明変数の次元の3点について比較

を行った。その結果アルゴリズム別ではBPN

が、また説明変数については4期間の購入回

数のみを入力としたものが高い予測精度を示 した。 得られた最適モデルにしたがって、予測上位

1,000名の顧客を選定した。11月時点でのテス

トマーケティングの結果は実際に購入した顧

客が195名であり、反応率は19.5%であった。

全顧客についての反応率は5.2%であり、上位 1,000名についてのリフト率は3.74であるので、 テストマーケティングにおいてもモデル選択段

階とほぼ同等の予測精度を得ることができた。

最後になりますが、データ提供をいただいた

Ⅰ社に感謝いたします。 TostMa血od叩Rosu托 宕 葛 写 亨 完 ○

図1:リフト図。横軸はランクの高い順にソー

トされた顧客一覧、縦軸は累積購入者割合。

表2:利用アルゴリズムによる比較

BPN RBF RT リフト率 3.88 3.51 2.58

参考文献

【1】Bigus,Joseph■P・(1996):Dataminingwith neuralnetworks.McGraw−HillCompanies.

【2】Peter Cabena,Pablo Hadjinian,Rolf

Stadler,Jaap Verhees,Ales?andro ZanaSi

(1997):Discovering Data Mining−Ftom

ConcepttoImplementation.PrenticeHall 表3:説明変数の種類による比較 回数 金額 商品数 リフト率 3.88 3.51 2.96 表4:説明変数の次元による比較 4次元 6次元 18次元 リフト率 3.88 3.74 3.65 −145− © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

参照

関連したドキュメント

メトロ開発㈱  フェロー  藤木  育雄 東京地下鉄㈱  正会員  大塚    努 佐藤工業㈱ 正会員 ○守山   亨 早稲田大学理工学術院  正会員

医薬保健学域 College of Medical,Pharmaceutical and Health Sciences 薬学類 薬学類6年生が卒業研究を発表!.

また,文献 [7] ではGDPの70%を占めるサービス業に おけるIT化を重点的に支援することについて提言して

サービスブランド 内容 特長 顧客企業

SLCポンプによる注水 [津波AMG ③-2] MUWCによる注水 [津波AMG ③-1] D/DFPによる注水 [津波AMG ③-3]

今回、新たな制度ができることをきっかけに、ステークホルダー別に寄せられている声を分析

い︑商人たる顧客の営業範囲に属する取引によるものについては︑それが利息の損失に限定されることになった︒商人たる顧客は

社会学研究科は、社会学および社会心理学の先端的研究を推進するとともに、博士課