• 検索結果がありません。

キーワード:コーヒーショップ,回帰分析,アソシエーシ ョン分析,売り上げ

N/A
N/A
Protected

Academic year: 2021

シェア "キーワード:コーヒーショップ,回帰分析,アソシエーシ ョン分析,売り上げ "

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

コーヒーショップにおける売り上げデータの分析と最適な仕入れ戦略の構築 12D8101024E 佐々木菜摘

中央大学理工学部情報工学科 田口研究室 2016 年 3 月

あらまし:本研究では駅改札口に隣接する某コーヒーショ ップの売り上げデータを用い,メニューの各カテゴリーの 売り上げを分析し,買い合わせの傾向を導き出す.また,そ れらの結果を使い日別の気象条件に対する販売予測をし,

最適な仕入れ戦略を構築する.

キーワード:コーヒーショップ,回帰分析,アソシエーシ ョン分析,売り上げ

1 はじめに

アルバイト先の駅併設コーヒーショップでは日々売り 上げが変動しており,来客が少ないと食材などのロスが増 えてしまい,赤字に繋がることがある.どのような条件が そろったときにどの商品の売れ行きが伸びるかを推定す ることができれば,ロスの金額を減らすことができる.そ の結果同じ売り上げでもロスを減らして,高い利益を出す ことが可能になるはずである.本研究では,気象データを 用いて日々の売り上げを予測し,買い合わせの分析をする ことによってある商品が売れるときに共に売れやすい商 品を予測し,精度の向上を図る.また,ロスを最低限に抑え 品切れを起こさない最適な製造個数を予測する.

2 使用データ

2.1 コーヒーショップの概要

本研究では,東京都内の丸ノ内線本郷三丁目駅の改札口 に隣接する某コーヒーショップから提供していただいた 売り上げデータを用いる.

1.場所 丸ノ内線本郷三丁目駅改札横 2.営業時間 平日 7 時~22 時

土日祝日 8 時~21 時

3.席数 89 席(1F…禁煙 18 席, 2F…禁煙 62 席 喫煙 9 席)

4.レジ 1 つ(決済方法は現金・交通系電子マネー)

2.2 売り上げデータの概要

コーヒーショップの売り上げデータは以下の通りであ る.

1.対象期間 2015 年 9 月 1 日(火)から 2015 年 9 月 30 日 (水)の 30 日間

2.一日平均来客数 平日 660.26 人,休日 357 人 3.一日平均売上金額 平日 233,172.95 円

休日 145,584.18 円 4.客単価 平日 353 円,休日 407.8 円

5.データの内容 ・購入日時 ・購入商品

・合計金額 ・決済方法

本研究では,購入日時,購入商品のデータを使用する.ま た,ドリンク商品のサイズ(S,M,L),ドリンク・パン・

デザート・サンドイッチ・お菓子の種類は考慮しない.

2.3 気象データの概要

本研究では,気象庁ホームページに掲載されている過去 の気象データから 2015 年 9 月東京の日ごとの気温,降水 量,湿度の値を使用する.

3 回帰分析 3.1 回帰分析とは

回帰分析とは,ある変数 y をほかの n 個の変数 x

1

,x

2

,…,x

n

によって説明する関係式

y = f ( x

1

, x

2

,…, x

n

)

と,これだけでは説明できない項εを含めた y = f ( x

1

, x

2

,…, x

n

) +ε

を特定する方法論で,特に

f ( x

1

, x

2

,…, x

n

) = b + a

1

x

1

+ … + a

n

x

n

で表される場合に限 定したものを線形回帰という.説明される変数 y,説明する

変数が x1つだけの場合に単回帰と呼ばれ,複数の場合,

重回帰と呼ばれる.線形回帰の単回帰は y = b + ax という 関係式を仮定して,観測されている l 組の x と y のデータ から切片 b と傾き a を特定するというものである.

4 データマイニング 4.1 データマイニングとは

データマイニングとは,統計的手法を用いて蓄積される 顧客データや従業員データの中から各情報の相関や法則 性といった情報を探し出すための分析手法である.

4.2 アソシエーション分析

アソシエーション分析とは,アソシエーションルールと 呼ばれる事象間の繋がりの強さに関する規則を知識とし て発見する分析である.ある事象が発生した時に,別な事 象が発生する事後確率が高い事象の組み合わせを求める.

4.3 相関ルール

相関ルールとは,商品の組み合わせに頻出する何らかの 関連,あるいは規則のことを指す.データベースの中から 相関ルールを検出する際,評価指標が必要となる.多く用 いられている指標として支持度,信頼度,リフトがある.

信頼度…仮にルールの前提が起きたと仮定したときに,結 論が起きる確率.この数値が高いほど,ルールの前提と結 論の結びつきが高い.

サポート…ルールの前提と結論が同時に起きる確率,つま り「ルールそのものが起きる確率」.

リフト…前提または結論のどちらかのデータの中での出 現回数が非常に多い場合に前提と結論の間の結びつきの 強さを見ることができる.

5 気象データに注目した購買行動分析 5.1 メニューの各カテゴリーと平均気温の関係 メニューを次のように分類する.

・コールドドリンク ・ホットドリンク

・パン ・サンドイッチ ・デザート

各カテゴリーについて,対象期間の 2015 年 9 月 1 日~30 日間を平日に限定して平均気温との関係を調べる.

表 1 を使い,各カテゴリーを平均気温で説明する回帰分析 を行うと,コールドドリンクとホットドリンクについて,

平均気温との強い相関関係が見られた.そのときの近似式 は以下の通りである.

コールドドリンク:y = 28.982x − 161.7 ホットドリンク: y = −35.205x + 1178.2

表 1 平均気温と各カテゴリーの販売個数

日付 1 2 3 4 7 8 9 10 11

曜日 火 水 木 金 月 火 水 木 金

平均気温 23.7 26.9 25.7 24.7 23 20 22.4 21.8 23.9 コールドドリンク 537 586 607 607 420 403 470 433 594 ホットドリンク 369 297 284 238 399 564 508 470 283

パン 425 447 416 405 475 513 560 518 450

サンドイッチ 36 46 57 43 58 63 60 57 56

デザート 60 50 53 61 37 40 48 69 61

(2)

5.2 様々な気象条件と売り上げの関係

5.1 では平均気温に関して分析を行ったが,ここでは他 の気象条件の最高気温・湿度・降水量を使って分析を行う.

まず最高気温を用いて各カテゴリーで回帰分析を行うと,

コールドドリンクとホットドリンクについて,平均気温を 用いて行った回帰分析より良い結果が得られた.このとき の近似式は以下の通りである.

コールドドリンク:y = 20.344x − 41.95 ホットドリンク:y = −26.811x + 1086.7

しかし,他の気象条件および他のカテゴリーでは特に相関 関係は得られなかった.

また,客数を気象条件で説明する回帰分析を行うと,雨 が降った時間および降水量との相関関係が見られた.特に 降水量との相関が大きく,そのときの近似式は

y = 0.6264x + 645.36 である.

6 購買データの分析 6.1 買い合わせデータの集計

本章では,実際のレシートから買い合わせのデータを分 析し,気象条件を使って説明することの難しいパン,サン ドイッチ,デザートの販売個数をドリンクの販売個数から 推定することを試みる.採集できるデータには限りがある ため, 9 月の 30 日間の中で平均的な売り上げであった 17 日の朝 7 時からの 150 件およびランチタイムの 12 時から 14 時の 139 件,同じ曜日で 17 日よりも気温の高い 24 日 の 12 時から 14 時の 120 件のデータを使用する.このデー タをテキストファイルとして保存し,NTT データ数理シ ステムの Visual Mining Studio(VMS)というソフトを使 ってアソシエーション分析を行う.

6.2 ドリンクメニューとフードメニューの買い合わせ の傾向

6.1 で整理したデータを用いて,はじめに 17 日朝の 150 件のデータでアソシエーション分析を行う.この結果,朝 の時間帯ではドリンクを購入するという前提が存在する とき,約 4 割が食事と一緒に購入されていることがわかっ た.また,昼の時間帯では気温が低い日にはコールドドリ ンク・ホットドリンク共に約半数,気温が高い日にはコー ルドドリンクは約 4 割,ホットドリンクは約半数が食事と 一緒に購入されていることがわかった.

7 最適な仕入れ戦略の構築 7.1 各カテゴリーの販売個数予測

ここまでで得られた結果を用いてカテゴリーごとの販 売個数を予測する.

まず,サンドイッチとデザートに関しては特に気象条件 との相関や買い合わせの傾向が見られなかったため,サン ドイッチ・デザート共に各日の平均個数を出すと,サンド イッチは平均 55 個, デザートは平均 53 個であったため,

この数をそれぞれの 1 日の予測販売個数とする.

次に,パンの販売個数は 1 日平均 450 個であるといえ るが,一度に 450 個作ることは不可能であり各時間帯に 合わせて作り足すことが必要なため,時間を朝・昼・夜の 3 つに分割し,7 時~11 時を朝,11~16 時を昼,16 時~

22 時を夜とする.朝はドリンクの販売個数の約 4 割,昼は 気温が低い日にはドリンクの販売個数の約半数,気温が高 い日にはホットドリンクの販売個数の約半数とコールド ドリンクの販売個数の約 4 割が食事と一緒に購入されて いる.夜については買い合わせのデータが得られなかった

ため,ここではドリンクの販売個数の約 4 割が食事と一緒 に購入されていると仮定する.

まず 9 月の最高気温と降水量から 1 日の総来客数,コ ールドドリンク・ホットドリンクの販売個数を求める.次 に今求めた客数とドリンクの販売個数を朝・昼・夜の時間 帯に分け,そこからパンの販売個数を時間帯に分けて求め る.すると,表 2 のような結果が得られる.

表 2 予測販売個数

表 2 に得られた予測販売個数を実際の販売個数と比較す ると,客数・コールドドリンク・ホットドリンクに関して は当てはまりのいい結果が得られた.

7.2 仕入れ戦略の構築

7.1 までの結果でカテゴリーごとの販売個数を予測する ことができたので,すべての食材が発注を行った日の 2 日 後に納品されると仮定すると, 2 日分の予測使用量からそ の日残っている在庫の数を引けば,発注すべきものと個数 を決定できる.

8 おわりに 8.1 まとめ

気象条件とメニューの各カテゴリーの販売個数の相関 関係を調べたところ,コールドドリンク及びホットドリン クは最高気温で説明できることがわかった.

また, 1 日の総来客数は降水量を使って説明できること も分かった.買い合わせの傾向を調べると,気温によって ドリンクとパンの買い合わせに傾向が見られた.これらの 結果から各カテゴリーについて販売個数と来客数の予測 を立てると,回帰分析でいい結果が得られた来客数とドリ ンクの販売個数については実際の値に近い予測をするこ とができた.しかしパン・サンドイッチ・デザートについて はあまりいい予測は立てられなかった.仕入れ戦略の構築 に関しては,メニューごとの販売個数の予測を立てること ができれば,使用量から発注すべき量を予測できることが できるため可能である.

参考文献

[1] 藤澤克樹・後藤順哉・安井雄一郎, “Excel で学ぶ OR”,

オーム社,2011.

[2] 株式会社数理システム, “Visual Mining Studio チュ ートリアル” ,2012.

[3] 気象庁, “過去の気象データ検索” , (オンライン)入

手先 <www.data.jma.go.jp/obd/stats/etrn/index.php>

14 15 16 17 18 24 25 28 29 30

月 火 水 木 金 木 金 月 火 水

22.9 22.3 21.1 17.9 20.6 20.4 17.7 23.3 22.7 20.9 485 495 416 344 466 437 378 536 446 495 387 319 404 618 409 394 539 338 345 367 480 462 452 516 484 429 479 437 424 412

68 49 56 66 52 56 64 55 50 52

56 63 56 40 49 73 37 57 55 48

1 2 3 4 7 8 9 10

火 水 木 金 月 火 水 木

26.5 31.5 30.4 30.1 26.1 21 25.3 23.5 12 5.5 1.5 14 19 65.5 156.5 50 653 649 646 654 657 686 743 677 672 675 656 643 621 706 726 688 -19 -26 -10 11 36 -20 17 -11 497 599 577 570 489 385 473 436 376 242 272 280 387 524 408 457 朝 103 103 102 104 104 109 118 107 昼 182 181 181 183 184 192 208 189

夜 90 89 89 90 90 94 102 93

合計 376 373 372 376 378 395 428 389

55 55 55 55 55 55 55 55

53 53 53 53 53 53 53 53

ホットドリンク

サンドイッチ デザート パン

日付 曜日 最高気温

降水量 予測来客数

来客数 差異 コールドドリンク

11 14 15 16 17 18 24 25 28 29 30

金 月 火 水 木 金 木 金 月 火 水

29.3 27.3 27.5 25.2 18.9 23.9 23 19.5 27.8 26.6 25.8

0 0 0 4 74.5 5.5 1 43 0 0 0

645 645 645 648 692 649 646 672 645 645 645 663 667 631 626 711 655 627 672 645 608 653

-18 -22 14 22 -19 -6 19 0 0 37 -8

554 513 518 471 343 444 426 355 524 499 483 301 355 349 411 580 446 470 564 341 374 395 102 102 102 103 110 103 102 106 102 102 102 180 180 180 181 193 181 180 188 180 180 180

89 89 89 89 95 89 89 93 89 89 89

371 371 371 373 398 373 372 387 371 371 371

55 55 55 55 55 55 55 55 55 55 55

53 53 53 53 53 53 53 53 53 53 53

参照

関連したドキュメント

specicficationに回帰式を書 き(method はLS), options のタブをクリック Coefficient covarianceの covariance method

時の社長であった父親に頼み込んで作ったのが最初で、その後研究を重ね1987(昭和62)年か

年の 3 年間である.ただし,売上高と企業価値については変化率を計算する 必要があるため,収集するデータは 1999 年から 2003 年の 5 年間である.デー

 ID-POS データとは、顧客 ID 付きの POS(Point…Of…Sales)データのことを指す。POS

(3) 局所管理( local control ) :局所管理とは圃場をブロック( block

次元が高い (複雑な) モデルであるほど負の対数尤度が小さくなるが,それ にモデルの次元

次元が高い (複雑な) モデルであるほど負の対数尤度が小さくなるが,それ にモデルの次元

ただし,セット販売売価は,通常の販売売価に成立個数 を乗算した価格を超えることはないと仮定する.そのた め,次の制約式を用いる. x